Автор: Винберг Э.Б.  

Теги: алгебра   математика   геометрия  

ISBN: 978-5-94057-685-3

Год: 2011

Текст
                    Э. Б. Винберг
Курс алгебры

Э.Б.Винберг КУРС АЛГЕБРЫ Москва Издательство МЦНМО 2011
УДК 512 ББК 22.14 В48 Винберг Э. Б. В48 Курс алгебры. — Новое издание, перераб. и доп. — М.: МЦНМО, 2011. — 592 с.: ил. ISBN 978-5-94057-685-3 Книга представляет собой расширенный вариант курса алгебры, читае- мого в течение трех семестров на математических факультетах. В нее вклю- чены такие дополнительные разделы, как элементы коммутативной алгеб- ры (в связи с аффинной алгебраической геометрией), теории Галуа, теории конечномерных ассоциативных алгебр и теории групп Ли. Это позволяет использовать книгу не только как учебник по общему курсу алгебры, но и как пособие для тех, кто желает углубить свои познания в алгебре. Изло- жение иллюстрируется большим количеством примеров и сопровождается задачами, часто содержащими дополнительный материал. Книга предназначена для математиков и физиков — студентов, аспи- рантов, преподавателей и научных работников. Предыдущее издание книги вышло в 2002 году в издательстве «Факто- риал Пресс». ББК 22.14 ISBN 978-5-94057-685-3 © Винберг Э. Б., 2011. © МЦНМО, 2011.
Оглавление Предисловие........................................... 6 Предисловие ко второму изданию........................ 7 Предисловие к третьему изданию........................ 8 Предисловие к четвертому изданию...................... 8 Глава 1. Алгебраические структуры 9 §1. Введение...................................... 9 § 2. Абелевы группы............................... 12 § 3. Кольца и поля................................ 17 § 4. Поле комплексных чисел....................... 22 § 5. Кольца вычетов............................... 28 § 6. Векторные пространства....................... 34 § 7. Алгебры...................................... 38 § 8. Алгебра матриц............................... 41 Глава 2. Начала линейной алгебры 48 § 1. Системы линейных уравнений................... 48 § 2. Базис и размерность векторного пространства . 58 §3. Ранг матрицы................................. 68 § 4. Определители................................. 74 § 5. Некоторые приложения определителей........... 88 Глава 3. Начала алгебры многочленов 92 § 1. Построение и основные свойства алгебры многочленов 92 § 2. Общие свойства корней многочленов ........... 99 § 3. Основная теорема алгебры комплексных чисел...106 § 4. Корни многочленов с вещественными коэффициентами 110 § 5. Теория делимости в евклидовых кольцах........117 § 6. Многочлены с рациональными коэффициентами .... 123 § 7. Многочлены от нескольких переменных..........127 § 8. Симметрические многочлены....................132 §9. Кубические уравнения.........................140 § 10. Поле рациональных дробей....................147 Глава 4. Начала теории групп 154 § 1. Определение и примеры........................154
4 Оглавление § 2. Группы в геометрии и физике...................162 § 3. Циклические группы ...........................166 § 4. Системы порождающих...........................173 §5. Разбиение на смежные классы...................175 § 6. Гомоморфизмы..................................183 Глава 5. Векторные пространства 192 § 1. Подпространства...............................192 § 2. Линейные отображения..........................197 §3. Сопряженное пространство......................205 § 4. Билинейные и квадратичные функции.............209 §5. Евклидово пространство........................221 § 6. Эрмитовы пространства.........................230 Глава 6. Линейные операторы 234 § 1. Матрица линейного оператора..................234 § 2. Собственные векторы..........................240 § 3. Линейные операторы и билинейные функции в евкли- довом пространстве................................246 § 4. Жорданова форма..............................258 § 5. Функции от линейного оператора...............265 Глава 7. Аффинные и проективные пространства 277 § 1. Аффинные пространства.........................277 §2. Аффинные отображения..........................283 § 3. Выпуклые множества............................290 § 4. Евклидовы аффинные пространства ..............302 §5. Квадрики......................................309 § 6. Проективные пространства......................323 Глава 8. Тензорная алгебра 338 § 1. Тензорное произведение векторных пространств .... 338 § 2. Тензорная алгебра векторного пространства.....346 §3. Симметрическая алгебра........................353 § 4. Алгебра Грассмана.............................360 Глава 9. Коммутативная алгебра 372 § 1. Конечно порожденные абелевы группы............372 § 2. Идеалы и факторкольца ........................386 § 3. Модули над кольцами главных идеалов...........395
Оглавление 5 § 4. Нётеровы кольца..............................403 § 5. Алгебраические расширения....................407 § 6. Конечно порожденные алгебры и аффинные алгебраи- ческие многообразия...............................420 § 7. Разложение на простые множители..............431 Глава 10. Группы 441 § 1. Прямые и полупрямые произведения.............441 § 2. Коммутант....................................448 §3. Действия.....................................451 § 4. Теоремы Силова ..............................458 § 5. Простые группы...............................461 § 6. Расширения Галуа.............................465 § 7. Основная теорема теории Галуа................471 Глава 11. Линейные представления и ассоциативные алгебры 478 § 1. Инвариантные подпространства.................478 § 2. Полная приводимость линейных представлений конеч- ных и компактных групп............................491 §3. Конечномерные ассоциативные алгебры..........496 § 4. Линейные представления конечных групп .......504 § 5. Инварианты...................................516 § 6. Алгебры с делением...........................523 Глава 12. Группы Ли 537 § 1. Определение и простейшие свойства групп Ли ..537 §2. Экспоненциальное отображение.................545 §3. Касательная алгебра Ли и присоединенное представ- ление ............................................549 § 4. Линейные представления групп Ли..............555 Ответы к задачам.....................................563 Словарь сокращений английских слов, употребляемых в обозна- чениях ..............................................568 Список литературы....................................570 Указатель обозначений................................572 Предметный указатель.................................575
Предисловие Поводом для написания настоящего учебника1 послужил двухго- дичный курс алгебры, прочитанный мною в Математическом колле- дже Независимого московского университета (НМУ) в 1992—1994 гг. Энтузиазм слушателей и относительно малое их число позволили мне читать курс на более высоком уровне, чем это принято на меха- нико-математическом факультете МГУ (мехмате), и затронуть ряд тем, не входящих в курс алгебры мехмата. Однако при написании учебника я использовал свой опыт преподавания на мехмате, и его окончательный вариант имеет лишь отдаленное сходство с курсом, прочитанным в НМУ. По содержанию гл. 1—4 примерно соответствуют курсу алгеб- ры первого семестра мехмата, а гл. 5—7 и отчасти гл. 92—курсу линейной алгебры и геометрии второго семестра. Оставшиеся гла- вы значительно перекрывают курс алгебры третьего семестра. Они адресованы в первую очередь тем студентам, которые хотят стать алгебраистами. Глава 7 посвящена геометрии евклидовых, аффинных и проек- тивных пространств. Однако ее ни в коей мере нельзя считать пол- ноценным учебным пособием по геометрии; скорее это алгебраиче- ский взгляд на геометрию. В первых четырех главах я постарался сделать изложение на- столько подробным, насколько это может быть разумно, если иметь в виду такого читателя, как студент первого семестра мехмата. (Впрочем, язык множеств и отображений используется с самого начала без каких-либо объяснений.) Однако затем я начинаю поз- волять себе опускать некоторые легко восполнимые детали, считая, что читатель постепенно набирается математической культуры. В книге почти нет технически сложных доказательств. В соот- ветствии со своим взглядом на математику я стремился заменять выкладки и сложные рассуждения идеями. Кому-то это может пока- заться трудным, но усилия, потраченные на усвоение идей, окупят- ся возможностью самостоятельно решать задачи, не рассматривае- мые в учебнике. Первое издание вышло в 1999 году. 2В настоящем издании — глава 8.
Предисловие 7 Приведенный в конце книги список литературы на русском язы- ке, которая, на мой взгляд, может быть полезной читателю, без- условно, далеко не полон и даже до некоторой степени случаен. Я искренне благодарен всем бывшим и нынешним сотрудникам кафедры высшей алгебры мехмата, в общении с которыми сложи- лись мои представления о преподавании алгебры. Я благодарю редактора учебника Г. М. Цукерман, в результате тщательной работы которой было обнаружено большое количество неточностей и опечаток, а также главного редактора издательства «Факториал» Ю.Н.Торхова, чей энтузиазм и самоотверженность немало способствовали улучшению качества учебника. Несколько полезных замечаний сделал А. Д. Свердлов, внимательно прочитав- ший первые две главы. Рисунок на переплете, выполненный на компьютере Ф. Э.Вин- бергом, иллюстрирует гомоморфизм SU2—>SO3 (см. гл. 13г). О нумерации. Теоремы нумеруются в пределах параграфа. При ссылке на теорему другого параграфа той же главы первая цифра означает номер параграфа, при ссылке на теорему другой главы пер- вая цифра означает номер главы, вторая — номер параграфа. Так, теорема 2 — это теорема 2 того же параграфа, теорема 3.2 — это теорема 2 § 3 той же главы, а теорема 6.3.2 — это теорема 2 § 3 гл. 6. То же относится к параграфам, предложениям, примерам, задачам и замечаниям. Формулы и рисунки нумеруются в пределах главы. Э. Б. Винберг Предисловие ко второму изданию Настоящее издание довольно существенно отличается от преды- дущего. Основные сделанные изменения имели целью упростить из- ложение в техническом и идейном плане. В частности, с этой целью полностью переписана глава «Тензорная алгебра». Дано изложение теории абелевых групп, независимое от общей теории модулей над кольцами главных идеалов и подготавливающее читателя к воспри- ятию этой общей теории, если он захочет это сделать. В то же время сделано несколько небольших добавлений. Так, дано доказательство неприводимости многочлена деления круга на !В настоящем издании — глава 12.
8 Предисловие любое число частей; описано приложение теории абелевых групп к исследованию симметрии кристаллов; добавлены некоторые све- дения о (тензорных) произведениях и симметрических степенях ли- нейных представлений групп с примером, иллюстрирующим приме- нение этих понятий к физике. Наконец, исправлен ряд опечаток и мелких неточностей, в об- наружении которых мне помогли И. В. Аржанцев, А. П. Мишина и А. Д. Свердлов. Э. Б. Винберг 31 мая 2000 г. Предисловие к третьему изданию В настоящем издании упрощены или более подробно изложены некоторые доказательства, указаны возможные обобщения некото- рых теорем, добавлены задачи, содержащие существенную допол- нительную информацию о линейных представлениях групп, увели- чено число примеров групп Ли, а также исправлены оставшиеся опечатки и неточности. Э. Б. Винберг 27 марта 2002 г. Предисловие к четвертому изданию В этом издании произведены некоторые дальнейшие упрощения. С целью облегчить жизнь начинающему читателю аксиоматические определения поля комплексных чисел и определителей даны лишь после их конструктивных определений. Понятие линейного отобра- жения и весь относящийся к нему материал перенесены из гл. 2 в гл. 5. Дано более простое доказательство существования жордано- ва базиса для нильпотентного линейного оператора. Кроме того, сделан ряд мелких изменений, в частности, добав- лено несколько интересных задач. Исправлены все замеченные опе- чатки и неточности. Я благодарю всех людей, указавших мне на них, в особенности профессора Скипа Гарибальди из университета Эмори (США). Э. Б. Винберг 25 мая 2010 г.
Глава 1 Алгебраические структуры Когда вы знакомитесь с новыми людьми, вы прежде всего за- поминаете их имена и внешность. После этого, встречаясь с ними в разных ситуациях, вы постепенно узнаете их лучше и некоторые из них, может быть, становятся вашими друзьями. В первой главе состоится лишь внешнее знакомство читателя с многими из алгебраических структур, рассматриваемых в этой книге. Более глубокое их понимание будет приходить в процессе дальнейшего чтения книги и решения задач. § 1. Введение Если вообще можно четко определить предмет алгебры, то это изучение алгебраических структур — множеств с определенными в них операциями. Под операцией в множестве М понимается лю- бое отображение МхМ->М, т. е. правило, по которому из любых двух элементов множества М получается некоторый элемент этого же множества. Элементами множества М могут быть как числа, так и объекты другого рода. Хорошо известными и важными примерами алгебраических структур являются следующие числовые множества с операциями сложения и умножения: N — множество натуральных чисел, Z — множество всех целых чисел, Z+ = Nu{0} — множество неотрицательных целых чисел, Q — множество рациональных чисел, R— множество всех вещественных (= действительных) чисел, R+ — множество неотрицательных вещественных чисел. Подчеркнем, что операции сложения и умножения определены далеко не на всяком числовом множестве. Например, в множестве отрицательных чисел не определена операция умножения, так как
10 Глава 1. Алгебраические структуры произведение двух отрицательных чисел является положительным числом. В множестве иррациональных чисел не определены ни сло- жение, ни умножение, так как сумма и произведение двух иррацио- нальных чисел могут быть рациональными. Приведем примеры алгебраических структур, состоящих не из чисел. Пример 1. Пусть M,N,P — какие-то множества и — какие-то отображения. Произведением, или композицией, отобра- жений f и g называется отображение определяемое формулой (/g)(a)=/(g(a)) VaeP, т. е. результат последовательного выполнения сначала отображе- ния g, а потом /. (Обычно, если это не может привести к недора- зумению, произведение отображений записывают без какого-либо специального знака, т. е. пишут просто fg: ср. обозначение In sin х в анализе.) В частности, при M = N = Р мы получаем таким образом операцию на множестве всех отображений множества М в себя. Эта операция дает много важных примеров алгебраических структур, называемых группами. Так, например, согласно аксиоматике ев- клидовой геометрии, произведение двух движений плоскости есть также движение. Рассматривая в множестве всех движений плоско- сти операцию умножения, мы получаем алгебраическую структуру, называемую группой движений плоскости. Пример 2. Множество векторов пространства с операциями сло- жения и векторного умножения является примером алгебраической структуры с двумя операциями. Кстати, отметим, что скалярное умножение векторов не является операцией в определенном выше смысле, так как его результат не есть элемент того же множества. Подобные более общие операции также рассматриваются в алгебре, но мы пока не будем об этом думать. Все приведенные выше примеры являются естественными в том смысле, что они были открыты в результате изучения реального ми- ра и внутреннего развития математики. В принципе можно рассмат- ривать любые операции в любых множествах. Например, можно
§ 1. Введение 11 рассматривать операцию в множестве ставящую в соответствие любым двум числам число совпадающих цифр в их десятичной запи- си. Однако лишь немногие алгебраические структуры представляют реальный интерес. Следует уточнить, что алгебраиста интересуют только те свой- ства алгебраических структур и составляющих их элементов, кото- рые могут быть выражены в терминах заданных операций. Этот подход находит свое выражение в понятии изоморфизма. Определение 1. Пусть М — множество с операцией о, a N — множество с операцией *. Алгебраические структуры (М, о) и (N, *) называются изоморфными, если существует такое биективное отоб- ражение /: M-+N, что /(aob)=/(a)*/(b) для любых а, bеМ. В этом случае пишут (М, о) (N, *). Само отоб- ражение f называется изоморфизмом структур (М, о) и (N, *). Аналогичным образом определяется изоморфизм алгебраиче- ских структур с двумя или бблыпим числом операций. Пример 3. Отображение а^2а является изоморфизмом множества всех вещественных чисел с опе- рацией сложения и множества положительных чисел с операцией умножения, поскольку 2а+ь = 2а2ь. Вместо основания 2 можно было бы взять любое положительное основание, отличное от 1. Это показывает, что между изоморфными алгебраическими структурами может существовать много различ- ных изоморфизмов. Пример 4. Пусть V — множество векторов плоскости, а Т — мно- жество параллельных переносов. Для любого вектора а обозначим через ta параллельный перенос на вектор а. (Если а = 0, то ta — это тождественное преобразование.) Легко видеть, что ° ^а+Ь» где о обозначает умножение (композицию) параллельных перено- сов, а + обозначает сложение векторов (определяемое по прави-
12 Глава 1. Алгебраические структуры лу параллелограмма). Следовательно, отображение а—> ta является изоморфизмом алгебраических структур (V, +) и (Т, о). Ясно, что если две алгебраические структуры изоморфны, то лю- бое утверждение, формулируемое только в терминах заданных опе- раций, будет справедливым в одной из этих структур тогда и только тогда, когда оно справедливо в другой. Например, операция о в множестве М называется коммутатив- ной, если aob = boa для любых а,ЬеМ. Если структура (М, о) изоморфна структуре (N, *) и операция о в множестве М коммутативна, то и операция * в множестве N коммутативна. Таким образом, в принципе все равно, какую из изоморфных друг другу алгебраических структур изучать: все они являются раз- личными моделями одного и того же объекта. Однако выбор мо- дели может оказаться небезразличным для фактического решения какой-либо задачи. Определенная модель может представить для этого наибольшее удобство. Например, если какая-то модель имеет геометрический характер, то она позволяет применить геометриче- ские методы. § 2. Абелевы группы Сложение вещественных чисел обладает следующими свойст- вами: СС1) а + b = b + а (коммутативность); (С2) (а + Ь) + с = а + (Ь + с) (ассоциативность); (СЗ) а + О = а; (С4) а + (—а) = 0. Из этих свойств чисто логическим путем могут быть получены и другие свойства, например, наличие операции вычитания, обрат- ной к сложению. Это означает, что для любых а, b уравнение х + а = Ь имеет единственное решение. Докажем, что это так. Если с — реше- ние данного уравнения, т. е. с + а = Ь, то (с + а) + (—а) = Ь+ (-а).
§ 2. Абелевы группы 13 Пользуясь свойствами (С2)—(С4), получаем (с + а) + (-а) = с + (а + (-а)) = с + О = с. Таким образом, с = Ь + (-а). Это показывает, что если решение существует, то оно единственно и равно b -I- (-а). С другой стороны, подстановка х = Ь + (-а) в рас- сматриваемое уравнение показывает, что b + (-а) действительно является решением: (Ь + (-а)) + а = Ь + ((-а) + а) = Ь + (а + (-а)) = Ь + О = Ь. Умножение вещественных чисел обладает аналогичными свойст- вами: (У1) ab = ba (коммутативность); (У2) (ab)c = a(bc) (ассоциативность); (УЗ) а1 = а; (У4) аа-1 = 1 при а/0. Свойства (У1)—(У4) лишь формой записи отличаются от свойств (С1)—(С4), с единственной оговоркой, что в (У4) мы предполагаем, что а / 0, в то время как в (С4) никаких ограничений на а нет. Поэтому приведенный выше вывод из свойств (С1)—(С4) наличия операции вычитания, будучи переведен на язык умножения, даст вывод из свойств (У1)—(У4) наличия операции деления, обратной к умножению. Более точно, таким путем доказывается, что для лю- бого а / 0 и любого b уравнение ха = b имеет единственное реше- ние, равное Ьа-1. Все эти рассуждения приведены здесь не для того, чтобы чита- тель узнал что-либо новое о вещественных числах, а чтобы подвести его к важной для алгебры идее. Эта идея есть аксиоматический ме- тод в алгебре. Он состоит в одновременном изучении целых классов алгебраических структур, выделяемых теми или иными аксиомами, представляющими собой какие-то свойства операций в этих струк- турах. При этом совершенно не важно, как в каждом конкретном случае эти операции определяются. Коль скоро выполнены аксио- мы, справедлива и любая теорема, полученная логическим путем из этих аксиом. Конечно, лишь немногие системы аксиом действительно инте- ресны. Невозможно придумать «из головы» такую систему аксиом,
14 Глава 1. Алгебраические структуры которая привела бы к содержательной теории. Все системы акси- ом, рассматриваемые в современной алгебре, имеют длительную историю и являются результатом анализа алгебраических структур, возникших естественным путем. Таковы системы аксиом группы, кольца, поля, векторного пространства и другие, с которыми чита- тель познакомится в этом курсе. Свойства (С1)—(С4), а также (У1)—(У4) являются по сути дела системой аксиом абелевой группы. Перед тем как привести точные формулировки этих аксиом, скажем несколько слов о терминоло- гии. Названия и обозначения операций в алгебраических структу- рах не имеют принципиального значения, однако чаще всего они называются сложением или умножением и обозначаются соответ- ствующим образом. Это позволяет использовать разработанную тер- минологию и систему обозначений, относящиеся к операциям над вещественными числами, а также вызывает полезные ассоциации. Приведем вначале определение абелевой группы, использующее язык сложения. Определение 1. (Аддитивной) абелевой группой называют мно- жество А с операцией сложения, обладающей следующими свойст- вами: 1) а + b = b + а для любых a, b G А (коммутативность); 2) (а + Ь) + с = а + (Ь + с) для любых a, b, с G А (ассоциатив- ность); 3) в А существует такой элемент 0 (нуль), что а + 0 = а для любо- го a G А; 4) для любого элемента ае А существует такой элемент — a G А (противоположный элемент), что а + (-а) = 0. Выведем некоторые простейшие следствия из этих аксиом. 1) Нуль единствен. В самом деле, пусть и 02 —два нуля. Тогда 0} — 01 4- 02 = 02. 2) Противоположный элемент единствен. В самом деле, пусть (—a)i и (-а)2—два элемента, противоположных а. Тогда (-а) 1 = (—а)1 + (а + (~а)2) = ((-а) г + а) + (-а)2 = (-а)2. 3) Для любых а, b уравнение х + а = b имеет единственное реше- ние, равное Ь + (—а). Доказательство см. выше. Это решение назы- вается разностью элементов b и а и обозначается Ь —а.
§ 2. Абелевы группы 15 Из свойства ассоциативности нетрудно вывести (попробуйте сде- лать это), что сумма произвольного числа (а не только трех) эле- ментов не зависит от расстановки скобок. Пользуясь этим, скобки обычно вообще опускают. Пример 1. Числовые множества Z, Q, R являются абелевыми группами относительно обычной операции сложения. Пример 2. Множество векторов (плоскости или пространства) является абелевой группой относительно обычного сложения векто- ров. Пример 3. Последовательность из п чисел назовем строкой дли- ны п. Множество всех строк длины и, составленных из веществен- ных чисел, обозначим через Rn. Определим сложение строк по пра- вилу (а!,а2, ...,an) + (bi,b2, •••> Ьп) = (ai + ЬЬ а2 + Ь2, ...,ап + Ьп). Очевидно, что множество является абелевой группой относитель- но этой операции. Ее нулем служит нулевая строка 0 = (0, 0,..., 0). Пример 4. Множество всех функций, определенных на задан- ном подмножестве числовой прямой, является абелевой группой относительно обычного сложения функций. Приведем теперь определение абелевой группы, использующее язык умножения. Определение Iх. (Мультипликативной) абелевой группой назы- вают множество А с операцией умножения, обладающей следующи- ми свойствами: 1) ab = Ьа для любых а, b G А (коммутативность); 2) (ab)c = a(bc) для любых а, Ь, се А (ассоциативность); 3) в А существует такой элемент е (единица), что ае = а для лю- бого ае А; 4) для любого элемента a G А существует такой элемент а'1 е А (обратный элемент), что аа-1 =е. Единица мультипликативной абелевой группы иногда обознача- ется символом 1. Простейшие следствия аксиом абелевой группы, полученные вы- ше на аддитивном языке, на мультипликативном языке выглядят следующим образом. 1) Единица единственна.
16 Глава 1. Алгебраические структуры 2) Обратный элемент единствен. 3) Для любых а, b уравнение ха = b имеет единственное реше- ние, равное Ьа"1. Оно называется частным от деления b на а (или отношением элементов b и а) и обозначается - (или Ь/а). Пример 5. Числовые множества Q* = Q\ {0} и R* = R\ {0} явля- ются абелевыми группами относительно обычной операции умно- жения. В дальнейшем мы познакомимся с общим понятием группы (не обязательно абелевой), которое не включает требования коммута- тивности операции. Читатель, наверное, заметил, что некоторые из рассмотренных выше абелевых групп содержатся в других, причем операция в «ма- ленькой» группе определяется так же, как в «большой». Это приво- дит нас к понятию подгруппы. Вообще, пусть М — множество с операцией о и N — какое-либо его подмножество. Говорят, что N замкнуто относительно опера- ции о, если a,bGN => aobeN. В этом случае операция о определена в множестве N и превращает его в некоторую алгебраическую структуру. Если операция о в М обладает каким-то свойством, имеющим характер тождественного соотношения (например, свойством коммутативности или ассоциа- тивности), то она, очевидно, обладает этим свойством и в N. Одна- ко другие свойства операции о могут не наследоваться подмноже- ством N. Так, подмножество аддитивной абелевой группы, замкнутое относительно сложения, не обязано быть абелевой группой, так как оно может не содержать нуля или элемента, противополож- ного какому-либо его элементу. Например, подмножество за- мкнуто относительно сложения в абелевой группе Z, но не явля- ется абелевой группой (и вообще группой), так как не содержит противоположного элемента ни к одному своему элементу, кроме нуля. Определение 2. Подмножество В аддитивной абелевой груп- пы А называется подгруппой, если 1) В замкнуто относительно сложения; 2) аеВ => -аеВ; 3) 0GB.
§ 3. Кольца и поля 17 Замечание 1. Легко видеть, что если В непусто, то из первых двух условий вытекает третье. Поэтому третье условие может быть заменено условием непустоты. Очевидно, что всякая подгруппа аддитивной абелевой группы сама является абелевой группой относительно той же операции. Пример 6. В аддитивной группе R имеется следующая цепочка подгрупп: ZcQcR. Пример 7. В аддитивной группе векторов пространства множе- ство векторов, параллельных заданной плоскости или прямой, явля- ется подгруппой. В любой аддитивной абелевой группе имеются две «тривиаль- ные» подгруппы: вся группа и подгруппа, состоящая только из нуля. Задача 1. Доказать, что всякая подгруппа группы Z имеет вид nZ, где neZ+ (решение этой задачи можно найти в §4.3). Приведем мультипликативный вариант предыдущего опреде- ления. Определение 2. Подмножество В мультипликативной абелевой группы А называется подгруппой, если 1) В замкнуто относительно умножения; 2) аеВ => а"1 GB; 3) ееВ. Пример 8. В группе R* имеется следующая цепочка подгрупп: {±1}cQ*cR*. § 3. Кольца и поля В отличие от групп кольца и поля — это алгебраические структу- ры с двумя операциями, называемыми обычно сложением и умно- жением. Их аксиомы, как и аксиомы абелевой группы, подсказаны свойствами операций над вещественными числами. При этом ак- сиомы кольца — это разумный минимум требований относительно свойств операций, позволяющий охватить и другие важные приме- ры алгебраических структур, из которых мы пока можем привести только уже упоминавшееся множество векторов пространства с опе- рациями сложения и векторного умножения.
18 Глава 1. Алгебраические структуры Определение 1. Кольцом называется множество К с операци- ями сложения и умножения, обладающими следующими свойст- вами: 1) относительно сложения К есть абелева группа (называемая аддитивной группой кольца К)', 2) а(Ь + с) = ab + ас и (а + Ь)с = ас + Ьс для любых а, Ь, с е К (дистрибутивностьумножения относительно сложения). Выведем некоторые следствия аксиом кольца, не входящие в чис- ло следствий аксиом аддитивной абелевой группы, перечисленных в §2. 1) аО = Оа = О для любого a G К. В самом деле, пусть аО = Ь. Тогда b + b = аО + аО = а (0 + 0) = аО = Ь, откуда b = b-b = O. Аналогично доказывается, что Оа = 0. 2) a(-b) = (-a)b = -ab для любых a, be К. В самом деле, ab + a(—b) = a(b + (-b)) = а0 = 0 и, аналогично, ab + (-a)b = O. 3) a(b - с) — ab - ас и (а - Ь)с = ас -Ьс для любых a, b, с G К. В самом деле, а(Ь - с) + ас = а(Ь - с + с) = ab и, аналогично, (а — b)c + Ьс = ас. Кольцо К называется коммутативным, если умножение в нем коммутативно, т. е. ab = ba Уа,Ь, и ассоциативным, если умножение в нем ассоциативно, т. е. (ab)c = a(bc) Va, b, с. Элемент 1 кольца называется единицей, если al = la = a Va.
§ 3. Кольца и поля 19 Так же, как в случае мультипликативной абелевой группы, доказыва- ется, что в кольце не может быть двух различных единиц (но может не быть ни одной). Замечание 1. Если 1 = 0, то для любого а имеем а = а1 = а0 = 0, т. е. кольцо состоит из одного нуля. Таким образом, если кольцо содержит более одного элемента, то 1 / 0. Замечание 2. При наличии коммутативности из двух тождеств дистрибутивности, входящих в определение кольца, можно оста- вить лишь одно. Аналогичное замечание относится к определению единицы. Пример 1. Числовые множества Z, Q, R являются коммутатив- ными ассоциативными кольцами с единицей относительно обыч- ных операций сложения и умножения. Пример 2. Множество 2Z четных чисел является коммутатив- ным ассоциативным кольцом без единицы. Пример 3. Множество всех функций, определенных на задан- ном подмножестве числовой прямой, является коммутативным ас- социативным кольцом с единицей относительно обычных операций сложения и умножения функций. Пример 4. Множество векторов пространства с операциями сло- жения и векторного умножения является некоммутативным и неас- социативным кольцом. Однако в нем выполняются следующие тож- дества, которые в некотором смысле заменяют коммутативность и ассоциативность: a xb + b х а = 0 (антикоммутативность), (a xb) хс + (Ьхс) хаЧ-(сха) xb = 0 (тождество Якоби). Антикоммутативность очевидна в силу определения векторного ум- ножения. По поводу проверки тождества Якоби см. пример 7.5. Задача 1. Пусть X — какое-либо множество и 2х — множество всех его подмножеств. Доказать, что 2х — кольцо относительно опе- раций симметрической разности MAN = (M\N)U(N\M) и пересечения, взятых в качестве сложения и умножения соответ- ственно. Доказать, что это кольцо коммутативно, ассоциативно и об- ладает единицей.
20 Глава 1. Алгебраические структуры Элемент а 1 кольца с единицей называется обратным к элемен- ту а, если аа-1 =а“1а = 1. (В коммутативном кольце достаточно требовать, чтобы аа"1 = 1.) Так же, как в случае мультипликативной абелевой группы, доказы- вается, что в ассоциативном кольце с единицей никакой элемент не может иметь двух различных обратных элементов (но может не иметь ни одного). Элемент, имеющий обратный, называется обра- тимым. Определение 2. Полем называется коммутативное ассоциатив- ное кольцо с единицей, в котором всякий ненулевой элемент обра- тим. Замечание 3. Кольцо, состоящее из одного нуля, не считается полем. Примерами полей служат поле рациональных чисел Q и поле ве- щественных чисел R. Кольцо Z не является полем: в нем обратимы только ±1. Задача 2. Доказать, что существует поле, состоящее из двух эле- ментов. (Очевидно, что один из этих элементов должен быть нулем поля, а другой — его единицей.) Любое поле обладает следующим важным свойством: ab = 0 => а = 0илиЬ = 0. В самом деле, если а # 0, то, умножая обе части равенства ab = 0 на а-1, получаем Ь = 0. Существуют и другие кольца, обладающие этим свойством, на- пример, кольцо Z. Они называются кольцами без делителей нуля. В кольце без делителей нуля возможно сокращение: {ас = Ьс (или ca = cb) и с/0} => а = Ь. В самом деле, равенство ас = Ьс может быть переписано в виде (а-Ь)с = О, откуда при с/0 получаем а-Ь = О, т. е. а = Ь. Приведем пример коммутативного ассоциативного кольца с де- лителями нуля. Пример 5. В кольце функций на подмножестве X числовой пря- мой (см. пример 3) есть делители нуля, если только X содержит более одной точки. В самом деле, разобьем X на два непустых под-
§ 3. Кольца и поля 21 множества Х} и Х2 н положим при i = 1, 2 пРихех<> Jl (0 прих^Х,. Тогда /1, f2 / 0, но Л /2 = 0. Отсутствие делителей нуля в поле означает, что произведение любых двух ненулевых элементов также является ненулевым эле- ментом. Ненулевые элементы поля К образуют абелеву группу отно- сительно умножения. Она называется мультипликативной группой поля К и обозначается через К*. Аналогично понятию подгруппы абелевой группы вводится по- нятие подкольца. Определение 3. Подмножество L кольца К называется подколь- цом, если 1) L является подгруппой аддитивной группы кольца К; 2) L замкнуто относительно умножения. Очевидно, что всякое подкольцо само является кольцом относи- тельно тех же операций. При этом оно наследует такие свойства, как коммутативность и ассоциативность. Пример 6. Цепочка подгрупп аддитивной группы R, приведен- ная в примере 1, является в то же время цепочкой подколец. Пример 7. При любом п G множество nZ является подколь- цом кольца Z. (Ср. задачу 2.1.) Задача 3. Доказать, что все конечные подмножества множе- ства X образуют подкольцо кольца 2х из задачи 1. Определение 4. Подмножество L поля К называется подполем, если 1) L является подкольцом кольца К; 2) aGL,a^0 => a-1GL; 3) 1GL. Очевидно, что всякое подполе является полем относительно тех же операций. Пример 8. Поле Q является подполем поля R. Задача 4. Доказать, что подмножество L поля К является подпо- лем тогда и только тогда, когда 1)1 замкнуто относительно вычитания и деления; 2) 1э0,1. Задача 5. Доказать, что поле Q не имеет нетривиальных (т. е. отличных от него самого) подполей.
22 Глава 1. Алгебраические структуры § 4. Поле комплексных чисел Подобно тому как невозможность деления в кольце целых чисел приводит к необходимости расширить его до поля рациональных чи- сел, невозможность извлечения квадратных корней из отрицатель- ных чисел в поле вещественных чисел приводит к необходимости расширить его до большего поля, называемого полем комплексных чисел. Для того чтобы прийти к определению комплексных чисел есте- ственным путем, проведем вначале некоторый анализ. А именно, предположим, что уже имеется некоторое поле С, содержащее по- ле R вещественных чисел и некий элемент z, квадрат которого ра- вен —1, и посмотрим, как оно должно быть устроено. Наряду с элементом z поле С должно содержать элементы а + bz, где а и b — любые вещественные числа. Докажем, что все эти эле- менты различны. Пусть a1+b1i = a2 + b2i) Ьь а2, b2ER. Тогда -a2 = (b2-b1)i. Возводя это равенство в квадрат, получаем (Qi -a2)2 = -(b2-b1)2, откуда а1 “ а2 = ^2 — ^1 = т. е. =а2, Ьг = Ь2, что и требовалось доказать. Далее, из свойств операций в поле и соотношения z2 = -1 следу- ет, что (aJ + bji) + (а2 4- b2z) = (сц 4- а2) 4- (Ьг 4- b2)z, (1) fai 4- bji)(а2 4-b2i) = (а^ - bxb2) 4- (а;Ь2 4-b^aji. (2) Это показывает, что подмножество К = {а 4- bi: a, b е R} с С замкну- то относительно сложения и умножения. Из формулы (1) следует, что - (а 4- Ы) = (-а) 4- (- b) i е К, (3) а из формулы (2) — что (а 4- bi) (а - Ы) = а2 4- b2 G R
§ 4. Поле комплексных чисел 23 и, значит, + + приа2 + Ь2/0. (4) Следовательно, К — подполе поля С. Так как поле К уже содержит поле вещественных чисел и квадратный корень из -1 (а значит, и квадратный корень из любого отрицательного числа), то нам нет необходимости рассматривать какое-то большее поле, т. е. можно считать, что С = К. Предыдущее исследование подсказывает, как можно построить поле комплексных чисел. Рассмотрим множество С пар (а, Ь), где а, beR. Определим в нем сложение и умножение по формулам fai, bi) + (а2, Ь2) = (а 1 + а2, bi + b2>> (а1э bj)(d2, Ь2) = (а1а2 — ^1^2> а1^2 4" М2)> подсказанным формулами (1) и (2). Очевидно, что С является абеле- вой группой относительно сложения (ср. пример 2.3) и что умноже- ние дистрибутивно относительно сложения и коммутативно. Непо- средственной выкладкой проверяется ассоциативность умножения: (fai, bj(a2, b2))(a3, Ь3) = (0^2 - ЬТЬ2, агЬ2 + Ь1а2)(а3, Ь3) = = (а1а2а3—aib2b3—Ь^з^з-Ь1Ь2Пз, b1a2a34-aib2a3+a1a2b3 — Ьг b2b3) = = (cii, Ь])(а2а3 — b2b3, a2b3 + b2a3) = (а1? b1)((a2, Ь2)(а3, b3)). (О том, как можно избежать этих вычислений, см. пример 7.4.) Та- ким образом, С — коммутативное ассоциативное кольцо. Так как (а, Ь)(1,0) = (а, Ь), то элемент (1,0) —единица кольца С. Формула (4) подсказывает, как должен выглядеть элемент, обратный к (а, Ь) при а2 + Ь2 0. И действительно, непосредственная проверка показывает, что ^а’ b) ( а2 + ь2 ’ ~ a2 + b2 ) = С1’ °) • Следовательно, С — поле. Далее, (<21,0) 4- (а2, 0) = (Qi + а2,0), (а1,0)(а2,0) = (а1а2,0),
24 Глава 1. Алгебраические структуры т. е. операции над парами вида (а, 0) сводятся к соответствующим операциям над их первыми компонентами. Условимся отождеств- лять пару (а, 0) с вещественным числом а. Тогда мы можем сказать, что построенное поле С содержит поле R в качестве подполя. Положим i = (0,1); тогда i2 = (-1, 0) = —1, а + Ы = (а, Ь) при a, b е К. Таким образом, каждый элемент поля С однозначно представляется в виде а + bi, где a, b е R. Построенное поле С и называется полем комплексных чисел. Представление комплексного числа с е С в виде а 4- bi (a, b е R) называется его алгебраической формой; при этом число а называ- ется вещественной частью числа с и обозначается Re с, а число b называется мнимой частью числа с и обозначается Im с. Комплекс- ные числа, не являющиеся вещественными, называются мнимыми; числа вида bi, где beR, называются чисто мнимыми. Так как при выводе формул (1) и (2) мы использовали только то свойство элемента i, что i2 = —1, а элемент i' = —i также обладает этим свойством, то эти формулы остаются верными при замене i на i'. Это означает, что отображение с = а + Ы>-*с = а- Ы (а,Ье№), является изоморфизмом поля С на себя. Оно называется комплекс- ным сопряжением. Вообще, изоморфизм какой-либо алгебраиче- ской структуры на себя называется ее автоморфизмом. Таким образом, комплексное сопряжение с —> с есть автоморфизм поля комплексных чисел. Очевидно, что с = с. Вещественные числа характеризуются тем, что они совпадают со своими сопряженными. Отсюда следует, что для любого с е С числа с + с и сс вещественны. Более точно, если с = а + bi (a, bGR), то с + с = 2а, сс = а2 + Ь2. (5) Комплексные числа можно изображать точками или векторами на плоскости. А именно, число с = а + bi изображается точкой или вектором с декартовыми координатами (а, Ь) (рис. 1). Ино- гда удобнее представление комплексных чисел точками, иногда —
§ 4. Поле комплексных чисел 25 векторами. При векторном представлении сложению комплекс- ных чисел соответствует обычное сложение векторов по прави- лу параллелограмма (или эквивалентному ему правилу треуголь- ника). Отметим, что разность комплексных чисел с2 и с2 представляется вектором, соединяющим точки, изображающие и с2 (рис. 2). Вместо декартовых координат на плоскости иногда бывает удоб- но использовать полярные. Это приводит к следующим понятиям. Модулем комплексного числа с = а 4- Ы называется длина векто- ра, изображающего это число. Модуль числа с обозначается через |с|. Очевидно, что |с| = х/а2 + Ь2. Аргументом комплексного числа называется угол, образуемый соответствующим вектором с положительным направлением оси абсцисс. Аргумент определен с точностью до прибавления целого кратного 2л. Аргумент числа 0 не определен. Аргумент числа с обо- значается через arg с. Пусть г и —модуль и аргумент числа с (рис. 3). Очевидно, что a = rcosi/>, b = rsin(/>, откуда c = r(cos ip + i sin </?). Такое представление комплексного числа называется его тригоно- метрической формой. Так как тригонометрическая форма данного комплексного числа определена однозначно с точностью до прибав-
26 Глава 1. Алгебраические структуры ления к целого кратного 2л, то при гь г2 > О И (cos </?1 + isin<p1) = r2(cos ip2 + i sin <p2) *=* <=> {г! = г2, (/?1 = (/?2 + 2лк, keZ}. Тригонометрическая форма комплексных чисел хорошо приспо- соблена к таким операциям, как умножение, деление, возведение в степень и извлечение корня. А именно, из формул для косинуса и синуса суммы двух углов следует, что (cos 4- i sin • r2(cos </>2 4- i sin </>2) = = i\r2(cos(spi + </?2) 4- i sint^i 4- </>2)), т. e. при умножении комплексных чисел их модули перемножаются, а аргументы складываются. Отсюда вытекают следующие формулы для деления и возведения в степень: ^(cos 4-i sin rlr f . , . . , чч rfcos'cp '-i-isin^ •) = 7(cos(v’1" ^2) +1 Sin((/>1 - ¥>2)), 12 \\Uo y/2 ' I bill *2 [r(cos 4- i sin i/?)]n = rn(cos 4- i sin П(/?) (формула Муавра). Извлечение корня n-й степени из комплексного числа c=r (cos <р 4- 4-i sin (/?) есть решение уравнения zn = с. Пусть |z| = s, arg г = ф; тогда sn = г, пф = 4- 2лк (к G Z). Следовательно, $ = у/г (арифметическое значение корня), ф = Окончательно получаем п/-Г ^4-2лк . . у>4-2лк\ г = yr (^cos — --1-1 sin — J. Одинаковые значения z получаются по этой формуле тогда и только тогда, когда в ка- честве к берутся числа, сравнимые по моду- лю и. Отсюда следует, что при с # 0 уравнение zn = с имеет ровно п решений, получаемых, например, при к = 0,1,..., и — 1. В геометри- ческом изображении эти числа располагают- ся в вершинах правильного п-угольника с цен- тром в начале координат (см. рис. 4, где изоб- ражен случай и = 8).
§ 4. Поле комплексных чисел 27 Вместо того чтобы называть комплексным числом пару вещественных чисел, как мы делали выше, можно было бы назвать комплексным числом точку (или вектор) плоскости и соответствующим образом определить опе- рации сложения и умножения. Существуют и другие способы построения поля комплексных чисел: см., в частности, примеры 7.4 и 9.2.14. Как «при- мирить» все эти, казалось бы, различные определения? Для того чтобы лучше понять, что такое поле комплексных чисел, нужно прежде подумать над тем, что такое поле вещественных чисел. Строгое построение поля вещественных чисел обычно приводится в курсе анализа. Мы не будем входить в его детали. Однако заметим, что имеется несколь- ко определений вещественных чисел: как бесконечных десятичных дробей, как сечений Дедекинда множества рациональных чисел и т. д. Формально говоря, при этом получаются различные поля. Какое из них является «на- стоящим» полем вещественных чисел? Ответ на этот вопрос состоит в том, что все они изоморфны и их следует рассматривать просто как различные модели одного и того же объекта, называемого полем вещественных чисел. Наиболее удовлетворительным в подобной ситуации всегда является ак- сиоматический подход, при котором сначала формулируются в виде аксиом свойства, которыми должен обладать искомый объект, а затем доказывает- ся, что этими свойствами он определяется однозначно с точностью до изо- морфизма, и с помощью какой-либо конструкции доказывается его суще- ствование. В случае поля вещественных чисел такими аксиомами (помимо аксиом поля) могут быть аксиомы порядка, аксиома Архимеда и аксиома непрерывности. Замечание 1. Нетрудно доказать, что любые две модели поля вещест- венных чисел не просто изоморфны, но между ними имеется единственный изоморфизм. (Доказательство сводится к доказательству того, что всякий изоморфизм поля R на себя тождествен, и основано на соображении, что неотрицательные числа при любом изоморфизме должны переходить в неотрицательные, так как они и только они являются квадратами в поле R.) Это означает, что каждый элемент поля R имеет свою индивидуальность, т. е. в любой модели могут быть идентифицированы числа 10, л/2, я и т. д. Дадим теперь аксиоматическое определение поля комплексных чисел. Определение 1. Полем комплексных чисел называется всякое поле С, обладающее следующими свойствами: 1) оно содержит в качестве подполя поле R вещественных чисел; 2) оно содержит такой элемент i, что i2 = -1; 3) оно минимально среди полей с этими свойствами, т. е. если К с С — какое-либо подполе, содержащее R и i, то К = С. Замечание 2. Из равенства х2 +1 = (х - 0 (х + i) следует, что уравнение х2 = -1 имеет в С ровно 2 решения: i и -I. Если какое-либо подполе содер- жит одно из этих решений, то оно содержит и другое.
28 Глава 1. Алгебраические структуры Построенное выше поле С обладает этими свойствами. Если теперь С' —другое поле комплексных чисел и i' еС' — такой элемент, что (Г)2 = -1, то, поскольку формулы (1) и (2) остаются справедливыми при замене i на Г, отображение /:С->С', a + bi^a + bi' (a,bGR), является изоморфизмом поля С на поле С'. Таким образом, поле С, удовлетворяющее приведенным выше аксио- мам, существует и единственно с точностью до изоморфизма. § 5. Кольца вычетов Расширения кольца целых чисел приводят к цепочке колец ZcQcRcC, в которую, как мы позже увидим, можно вставить и другие звенья (в том числе и продолжить ее вправо). Кольца вычетов определяют- ся также на основе целых чисел, но идея их определения совершен- но иная. Это часто используемый в математике прием «склейки» — образования фактормножества по отношению эквивалентности. Пусть М — какое-либо множество. Всякое подмножество R с с М х М называется отношением на множестве М. Если (a, b) еR, то говорят, что элементы а и b находятся в отношении R, и пи- шут aRb. Приведем примеры отношений. Пример 1. М — множество людей; aRb, если а знает Ь. Пример 2. М то же самое; aRb, если а и b знакомы. Пример 3. М то же самое; aRb, если а и b живут в одном доме. Пример 4. М = R; aRb, если а Ь. Пример 5. М — множество окружностей на плоскости; aRb, ес- ли окружности а и b равны, т. е. переводятся одна в другую движе- нием. Отношение R называется отношением эквивалентности, если оно обладает следующими свойствами: 1) aRa (рефлексивность); 2) aRb => bRa (симметричность); 3) aRb и bRc => aRc (транзитивность). Из приведенных выше примеров отношений только третье и пя- тое являются отношениями эквивалентности: первое и четвертое не симметричны, а второе симметрично, но не транзитивно.
§ 5. Кольца вычетов 29 Отношение эквивалентности обычно записывается как а ~ b или просто а^Ь. Пусть R — отношение эквивалентности на множестве М. Для каждого а е М положим R(a) = {beM: a^b}. Из свойств отношений эквивалентности легко выводится, что a G GR(a) и R(a)nR(b)/0 => R(a)=R(b). Таким образом, подмножества R(a) образуют разбиение множества М, т. е. покрывают его и попарно не пересекаются. Они называются классами эквивалентности отношения R. Два элемента эквивалент- ны тогда и только тогда, когда они принадлежат одному классу. Множество, элементами которого являются классы эквивалент- ности отношения R, называется фактормножеством множества М по отношению эквивалентности R и обозначается через М/R. Отоб- ражение М—*M/R, a-*R(a), называется отображением факторизации. Так, в третьем из приведенных выше примеров классы эквива- лентности — это множества жильцов одного дома. Фактормноже- ство можно отождествить с множеством домов; тогда отображение факторизации — это отображение, ставящее в соответствие каждо- му человеку дом, в котором он живет. В пятом примере классы эквивалентности — это множества окружностей одного радиуса, фактормножество отождествляется с множеством положительных чисел, а отображение факторизации — это отображение, ставящее в соответствие каждой окружности ее радиус. Пусть в множестве М задана некоторая операция (х, у) —>х*у. Отношение эквивалентности R в множестве М называется согласо- ванным с операцией *, если a~az, b~b' => a*b~a,*b/. В этом случае на фактормножестве М/R также можно определить операцию * по правилу R(a)*R(b)=R(a*b). (6) В словесном выражении это определение выглядит так: чтобы произвести операцию над какими-либо двумя классами эквива-
30 Глава 1. Алгебраические структуры лентности, надо выбрать в них произвольных представителей, про- извести операцию над ними и взять тот класс, в котором будет лежать получившийся элемент. Тот факт, что этот класс не будет зависеть от выбора указанных представителей, как раз и обеспе- чивается согласованностью отношения эквивалентности с опера- цией. Очевидно, что все свойства операции в М, имеющие характер тождества, например коммутативность и ассоциативность, наследу- ются определенной таким образом операцией в М/R. То же самое можно сказать о наличии нуля (единицы) и противоположного (об- ратного) элемента. Более точно, если, скажем, операция в М называ- ется сложением и в М имеется нулевой элемент 0 относительно этой операции, то R(0) — нулевой элемент в М/R; если -а — элемент, противоположный элементу а в М, то Я(-а) — элемент, противопо- ложный элементу R(a) в M/R. Приступим теперь к построению колец вычетов. Пусть п — фик- сированное натуральное число. Рассмотрим в множестве Z целых чисел следующее отношение сравнимости по модулю п: а сравнимо с b по модулю п (обозначение: а = b (mod и)), если а — b делится на п или, что равносильно, если а и Ь дают одинаковые остатки при делении на и. Очевидно, что это отношение эквивалентности, причем классы эквивалентности могут быть занумерованы числами 0,1,..., п — 1 таким образом, что r-й класс состоит из всех целых чисел, дающих при делении на п остаток г. Класс эквивалентности, содержащий целое число а, называется вычетом числа а по модулю п и обозначается через [а]п или просто через [а], если ясно, какое п имеется в виду. Фактормножество множества Z по отношению сравнимости по модулю п обозначается через Zn. Мы можем написать, что Zn = {[0]n, [1]п,..., [п-!]„}, но следует понимать, что каждый элемент множества Zn можно обозначать по-разному. Так, элемент [1]п может быть с таким же успехом обозначен через [2п + 1]п, [-(п - 1)]п ит.д. Докажем теперь, что отношение сравнимости по модулю п согла- совано с операциями сложения и умножения в Z. Пусть а = а' (mod и), b = b' (mod и)
§ 5. Кольца вычетов 31 Тогда а + Ь = а' + Ь = а' + b' (mod и) и,аналогично, ab^a'b^a'b' (mod и). Таким образом, мы можем определить в множестве Zn операции сложения и умножения по формулам [a]n + [b]n = [a + b]n, [a]n[b]n = [ab]n (справедливым для любых a, beZ). Тем самым Zn превращается в коммутативное ассоциативное кольцо с единицей. Оно называет- ся кольцом вычетов по модулю п. Пример 6. Ниже приведены таблицы сложения и умножения в кольце Z5. При этом ради простоты квадратные скобки в обозна- чениях элементов этого кольца опущены. + 0 12 3 4 X 0 12 3 4 0 1 2 3 4 0 12 3 4 1 2 3 4 0 2 3 4 0 1 3 4 0 1 2 4 0 12 3 0 1 2 3 4 0 0 0 0 0 0 12 3 4 0 2 4 1 3 0 3 14 2 0 4 3 2 1 Мы видим, в частности, что элементы 2 и 3 взаимно обратны, а эле- мент 4 обратен сам себе. Пример 7. Вычислим [2]100 в кольце Z125: [2]7 = [128] = [3], [2]35 = ([2]7)5 = [З]5 = [243] = [-7], [2]50 = [2]35 ([2]7)2 [2] = [—7] [3]2 [2] = [-126] = [-1], [2]100 = ([2]50)2 = [1]. Полученный результат означает, что 2100 = 1 (mod 125). Учитывая, что 2100 делится на 8, получаем 2100 = 376 (mod 1000), т. е. десятичная запись числа 2100 оканчивается на 376.
32 Глава 1. Алгебраические структуры Кольцо Zn обладает всеми свойствами поля, кроме, быть может, обратимости ненулевых элементов. Очевидно, что Z2 — поле из двух элементов, о котором шла речь в задаче 3.2. Рассмотрение приведенной выше таблицы умножения в кольце Z5 показывает, что Z5 —также поле. С другой стороны, Z4 — не поле, так как элемент [2] в этом кольце необратим. Теорема 1. Кольцо Zn является полем тогда и только тогда, ко- гда п — простое число. Доказательство. 1) Пусть п составное, т. е. п = kl, где 1 < k, I < п. Тогда [к]п, [1]п/0, но [fc]„[Z]„ = [кПп = [п]п = 0. Таким образом, в кольце Zn имеются делители нуля и, значит, оно не является полем. 2) Пусть, напротив, п — простое число и [а]п 0, т. е. а не делит- ся на п. Будем искать элемент, обратный к [а]„, подбором, т. е. умно- жая [а]п по очереди на все элементы кольца. Получим элементы [0]п, [а]п, [2а],„ [(п-1)а]п. (7) Докажем, что все они различны. В самом деле, если [ka]n = [1а]п (О k < I п — 1), то [(! - к)а]п = 0, т. е. (I — к)а делится на п, что невозможно, так как ни I - к, ни а на п не делятся. (Здесь мы ис- пользовали то, что п простое.) Следовательно, в последовательно- сти элементов (7) встречаются все элементы кольца Zn, в том числе [1]а это и означает, что элемент [а]„ обратим. □ Задача 1. Доказать, что при любом п элемент [к]п обратим в кольце Zn тогда и только тогда, когда пик взаимно просты. В полях вычетов мы встречаемся с новым явлением, не имевшим места в числовых полях (подполях поля комплексных чисел). А имен- но, в поле Zn (п простое) выполняется равенство 1Ч-14-... 4-1 = 0. (8) п (Конечно, это верно и в кольце Zn при любом п.) Это приводит к некоторым особенностям алгебраических преобразований в этом поле, о которых мы скажем ниже. Пусть, вообще, К — произвольное поле. Наименьшее натураль- ное п, для которого в поле К выполняется равенство (8), называет- ся характеристикой этого поля; если такого п не существует, то
§ 5. Кольца вычетов 33 говорят, что К — поле нулевой характеристики. Таким образом, (п простое) — поле характеристики п, а числовые поля имеют нулевую характеристику. Характеристика поля К обозначается че- рез char К. Если char К = п, то для любого а е К а 4-а 4-... 4-а = (14-14-... 4-1)а = Оа = 0. п п Характеристика поля, если она положительна, всегда является простым числом. В самом деле, пусть char К = п = kl (1 < к, I < п). Тогда 1 + 14-... + ! = (! + !+ ... + !)(!+ 1 + ... + 1) = 0 п к I и, значит, либо 1 + 1 + ... + ! = О, либо 1 +14-... + 1 = 0, что противо- к i речит определению характеристики. Большинство формул элементарной алгебры справедливы в лю- бом поле, так как при их выводе используются только те свойства операций сложения и умножения, которые входят в число аксиом поля или являются их следствием. Особенность полей положитель- ной характеристики проявляется только в тех формулах, которые содержат умножение или деление на натуральные числа. Рассмотрим, например, формулу (a + b)2 = a2 + 2ab + b2. Она справедлива в любом поле, если понимать 2аЬ как ab + ab. Од- нако в поле характеристики 2 она принимает более простой вид (a + b)2 = a2 + b2. Более общо, в поле характеристики р справедливо тождество (a + b)p = ap + bp. В самом деле, по формуле бинома Ньютона р (a + b)p=£ckap-kbk. к=0 р Однако при 0 < к < р к _ р(р — 1)...(р - к +1) % к\
34 Глава 1. Алгебраические структуры (число сочетаний из р по к), очевидно, делится на р. Следовательно, все слагаемые формулы бинома Ньютона, кроме первого и послед- него, в рассматриваемом случае равны нулю. Задача 2. Вывести отсюда, что в поле Zp справедливо тождество ар =а. (Другое доказательство последнего факта, называемого ма- лой теоремой Ферма, будет дано в § 4.5.) Хуже обстоит дело, когда приходится делить на натуральное чис- ло, например, когда мы находим выражение для ab из выписанной выше формулы квадрата суммы. Для того чтобы придать смысл этому делению в любом поле, можно рассматривать умножение на натуральное число к как умножение на элемент 14-14-... 4-1 данно- к го поля; тогда деление на к можно понимать как деление на этот элемент. Однако если к делится на характеристику поля, то этот элемент равен нулю и деление невозможно. Так, формула для решения квадратного уравнения, содержащая деление на 2, применима в указанном смысле в любом поле харак- теристики / 2, но в поле характеристики 2 она не работает. Пример 8. Решим квадратное уравнение х2 + х-1 = 0 в поле Zu. По обычной формуле находим: _ [-1]± /[5] Х1-2- [2] Так как [5] = [16] = [4]2, то можно считать, что -/[5] = [4] (одно из значений квадратного корня). Следовательно, Y _ [-U-FE4] _ [3] _ [14] г 1 y _ [-1] - [4] _ [-5] _ [6] г - 1 [2] ” [2] [2] L/J’ 2 [2] [2] [2] LOJ> § 6. Векторные пространства Векторы, рассматриваемые в элементарной геометрии, можно не только складывать, но и умножать на числа. Анализ свойств этих двух операций приводит к понятию векторного пространства. Прежде чем мы дадим определение, необходимо отметить, что здесь мы выходим за рамки того понимания операции на множе- стве, которое принималось до сих пор. Умножение вектора на число
§ 6. Векторные пространства 35 не есть операция над двумя элементами одного и того же множе- ства. Это операция, которая каждой паре (число, вектор) ставит в соответствие вектор. В общем определении векторного простран- ства дело обстоит так же, однако вещественные числа заменяются элементами произвольного (но фиксированного) поля. Определение 1. Векторным (или линейным) пространством над полем К называется множество V с операциями сложения и умножения на элементы поля К, обладающими следующими свой- ствами: 1) относительно сложения V есть абелева группа; 2) Л(а + Ь) = Ла + ЛЬ для любых Ле К, а, beV; 3) (Л4-м)а = Ла4-ма для любых Л,/ieK, а eV; 4) (Л/2)а = Л(/2а) для любых Л,/хеК, aeV; 5) la = а для любого a eV. Элементы векторного пространства называются векторами. Эле- менты поля К, в отличие от векторов, мы будем иногда, допуская вольность речи, называть числами, даже если К не есть числовое поле. Векторы в смысле элементарной геометрии мы будем отныне называть геометрическими векторами. Операции над ними удовле- творяют всем аксиомам векторного пространства, что, собственно, и послужило основой для данного выше определения. Простран- ство геометрических векторов евклидовой плоскости (соответствен- но трехмерного евклидова пространства) мы будем обозначать че- рез Е2 (соответственно через Е3). Подчеркнем, что это векторное пространство над полем R. Приведем другие важные примеры век- торных пространств. Пример 1. Множество Кп строк длины п с элементами из поля К является векторным пространством над К относительно операций, определенных формулами (a!,a2, ...,ап) + (ЬъЬ2,...,Ьп) = (аг+ bna2+ b2, ...,an + bn), Л(аь а2,..., ап)= (Ла^, Ла2,..., Лап). Пример 2. Множество F(X, К) всех функций на множестве X со значениями в поле К является векторным пространством относи- тельно обычных операций над функциями: (f + g) (х) =fW+ g(x), (Л/) (х) = Л/(х).
36 Глава 1. Алгебраические структуры Пример 3. Пусть К — подполе поля L. Тогда L можно рассмат- ривать как векторное пространство над К, определив умножение элементов из L на элементы из К просто как умножение в L. В част- ности, поле С есть в этом смысле векторное пространство над R. Укажем некоторые следствия аксиом векторного пространства, не являющиеся следствиями только аксиом абелевой группы. Все они доказываются аналогично похожим на них следствиям аксиом кольца (см. §3). Символом 0 обозначается как нуль поля К, так и нулевой вектор, т. е. нуль аддитивной группы V; читатель увидит, что это не приводит к путанице. 1) АО = 0 для любого Л G К (здесь 0 — нулевой вектор). 2) Л(-а) = -Ла для любых Ле К, aeV. 3) Л(а - Ь) = Ла - ЛЬ для любых Л е К, а, b е V. 4) Оа = 0 для любого a G V (здесь 0 слева — число, справа — век- тор). 5) (-1)а = — а для любого а G V. 6) (Л - /л)а = Ла — ца для любых Л, р е К, а е V. Определение 2. Подмножество U векторного пространства V называется подпространством, если 1) U является подгруппой аддитивной группы V; 2) aeU => Ла eU для любого Ле К. Замечание 1. В определении подгруппы требуется, чтобы aeU => -ае[/. При наличии условия 2) это свойство выполняется автоматически, так как -а = (-1)а. Подпространство векторного пространства само является век- торным пространством относительно тех же операций. Пример 4. В пространстве Е3 множество векторов, параллель- ных заданной плоскости или прямой, является подпространством. Пример 5. В пространстве F(X, R) всех функций на заданном промежутке X числовой прямой множество непрерывных функций является подпространством. В каждом векторном пространстве V есть два «тривиальных» подпространства: само пространство V и нулевое подпространство (состоящее из одного нулевого вектора). Последнее мы будем обо- значать символом 0. Определение 3. Векторные пространства V и U над полем К называются изоморфными, если существует такое биективное отоб-
§ 6. Векторные пространства 37 ражение V — U, что 1) ip(a + b) = ц>(а) + ¥>(Ь) для любых a, be V; 2) <р (Ла) = Лу> (а) для любых Л е К, а е V. Само отображение <р называется при этом изоморфизмом прост- ранств V и U. Как мы увидим в § 2.2, описание векторных пространств с точ- ностью до изоморфизма весьма просто. В частности, все так назы- ваемые конечномерные векторные пространства, с которыми мы в основном и будем иметь дело в этом курсе, изоморфны простран- ствам Кп. Ключевым понятием этой теории является понятие ба- зиса. Всякое выражение вида Л^! 4- Л2а2 4-... 4- Лпап (Л1э Л2,Лп еК) называется линейной комбинацией векторов аьа2, ...,ап е V. Гово- рят, что вектор b линейно выражается через векторы а1эа2, ...,ап, если он равен некоторой их линейной комбинации. Определение 4. Система векторов {е1? е2,..., en} с V называется бази- сом векторного пространства V, если каждый вектор а € V единственным образом линейно выражается через е1? е2,..., еп. Коэффициенты этого вы- ражения называются координатами вектора а в базисе {е^ е2,..., еп}. Пример 6. Из геометрии известно, что любые два неколлинеар- ных вектора еь е2 составляют базис пространства Е2 (рис. 5). Анало- гично любые три некомпланарных вектора составляют базис прост- ранства Е3. Пример 7. Единичные строки ег = (1, 0, ...,0), е2 = (0,1, ...,0), еп = (0, 0,..., 1)
38 Глава 1. Алгебраические структуры составляют базис пространства Кп. Координатами строки а = (аь а2,..., ап) в этом базисе служат числа аь а2,ап. Конечно, в про- странстве Кп имеются и другие базисы. Пример 8. В качестве базиса поля С как векторного пространст- ва над R (см. пример 3) можно взять {!,£}. Координатами комплекс- ного числа в этом базисе служат его вещественная и мнимая части. Предложение 1. Всякое векторное пространство V над полем К, имеющее базис из п векторов, изоморфно пространству Кп. Доказательство. Пусть {е1? е2,..., еп}— базис пространства V. Рассмотрим отображение ср: V-*Kn, ставящее в соответствие каждому вектору строку из его координат в базисе {eb е2,..., еп}. Очевидно, что это биективное отображение. Далее, если а = а1е14-а2е2 + ...4-апеп, b = b1e1+b2e2 + ... + bnen, то а + b = (a! + bi)еj 4- (а2 4-Ь2)е2 4-... 4- (ап 4- Ьп)еп, Ла = (Ла)ег 4- (Аа2)е2 4-... 4- (Лап)еп. Отсюда следует, что — изоморфизм. □ Пример 9. Пространство Е2 (соответственно Е3) изоморфно R2 (соответственно R3). § 7. Алгебры Ввиду крайней простоты своего строения векторные пространст- ва не интересны сами по себе, но они служат необходимым фоном для многих алгебраических (и не только алгебраических) теорий. Так, комбинируя понятия векторного пространства и кольца, мы приходим к важному понятию алгебры. Определение 1. Алгеброй над полем К называется множество А с операциями сложения, умножения и умножения на элементы по- ля К, обладающими следующими свойствами: 1) относительно сложения и умножения на элементы поля А есть векторное пространство; 2) относительно сложения и умножения А есть кольцо; 3) (Aa)b = a(Ab) = A(ab) для любых А е К, a, be А.
§ 7. Алгебры 39 Замечание 1. Термин «алгебра», употреблявшийся нами до сих пор только как название одного из разделов математики, в этом определении имеет, естественно, другой смысл. Пример 1. Всякое поле L, содержащее К в качестве подполя, можно рассматривать как алгебру над К. В частности, поле С есть алгебра над R. Пример 2. Пространство Е3 есть алгебра относительно опера- ции векторного умножения. Пример 3. Множество F(X, К) функций на множестве X со зна- чениями в поле К (см. пример 6.2) является алгеброй над К относи- тельно обычных операций сложения и умножения функций и умно- жения функции на число. Эта алгебра коммутативна, ассоциативна и обладает единицей (каковой является функция, тождественно рав- ная единице). Задача 1. Доказать, что кольцо 2х из задачи 3.1 превращается в алгебру над полем Z2, если определить в нем умножение на эле- менты этого поля по правилам ОМ = 0, 1М = М VMG2X. Предположим, что алгебра А обладает базисом {e1? е2,...»еп} как векторное пространство над К, и пусть а = а1е1+а2е2 + ... + апеп = ^ сад, 1=1 b = bjCj + Ь2е2 +... + ьпеп = £ /ад (=1 — два произвольных элемента этой алгебры. Тогда из дистрибутив- ности умножения относительно сложения и свойства 3) в определе- нии алгебры следует, что П П z П х П ab = 2 а^е.Ь) = S ai( S Ь/е(еу) ) = £ afb/efep. i=l i=l \j=l ' i,j=l Это показывает, что умножение в алгебре А полностью определяет- ся произведениями базисных векторов. Если умножение базисных векторов коммутативно, т. е. ViJ,
40 Глава 1. Алгебраические структуры то и умножение в алгебре А в целом коммутативно. В самом деле, для любых а, b е А мы тогда в предыдущих обозначениях получаем ab = £ ciibj (е^) = £ (е^) = Ьа. ij i,j Аналогично доказывается, что если умножение базисных векто- ров ассоциативно, т. е. (eiej)ek = ei(ejek>) Vi, j,k, то и умножение в алгебре А в целом ассоциативно. С другой стороны, если V — какое-то векторное пространство с базисом {ej, е2,еп} и (j., j = 1,2, ...,п)— произвольные век- торы этого пространства, то мы можем определить операцию умно- жения в V по правилу ab = Xaibjeij ij и тем самым превратить V в алгебру. Иначе говоря, если мы не тре- буем, чтобы умножение обладало какими-нибудь дополнительными свойствами (например, было коммутативным), таблица умножения базисных векторов алгебры может быть совершенно произвольной. Пример 4. Поле С как алгебра над R задается следующей табли- цей умножения базисных векторов: X 1 i 1 i 1 z i -1 Это можно принять за определение поля С. Проверка коммутатив- ности и ассоциативности умножения сводится тогда к тривиальной проверке коммутативности и ассоциативности умножения элемен- тов 1 и I. Пример 5. В ортонормированном (т. е. состоящем из ортого- нальных единичных векторов) базисе {i,;, к} пространства Е3 таб- лица векторного умножения выглядит следующим образом: X i J к i 0 к -j j -k 0 i к j -i 0
§ 8. Алгебра матриц 41 Это умножение антикоммутативно и удовлетворяет тождеству Яко- би (см. пример 3.4). Последнее тождество достаточно проверить для базисных векторов, что не составляет труда (проделайте это!). Пример 6. Алгебра кватернионов Н задается базисом {1, i, j, k} со следующей таблицей умножения: X 1 i j k 1 1 i j k i i -1 k -J J j ~k -1 i k k j -i -1 Эта алгебра ассоциативна (проверьте это!), но не коммутативна. Она содержит в качестве подалгебры (см. определение ниже) ал- гебру комплексных чисел. Позже мы увидим, что в алгебре Н, как и в поле, всякий ненулевой элемент обратим. Таким образом, это «некоммутативное поле». Задача 2. Доказать, что двумерная алгебра над полем Z2 с бази- сом {1, а} и таблицей умножения X 1 a 1 a 1 a a 1 + a является полем (из 4 элементов). Подмножество алгебры называется подалгеброй, если оно одно- временно является подпространством и подкольцом. Отображение алгебр называется изоморфизмом, если оно одновременно является изоморфизмом векторных пространств и колец. § 8. Алгебра матриц Матрицей размера т х п над полем К называется прямоуголь- ная таблица из элементов поля К, имеющая т строк и п столбцов. В буквенной записи элементы матрицы обычно обозначаются од- ной и той же буквой с двумя индексами, первый из которых есть
42 Глава 1. Алгебраические структуры номер строки, а второй — номер столбца: <ав а12 ... ain^ д= а21 а22 ••• а2п k^nil ^ш2 ••• O-ninJ Иногда ради краткости мы будем писать просто А = (а^). Суммой матриц А = (а^) и В = (Д;) одинакового размера называ- ется матрица A + B = (aIy + bIj). Произведением матрицы А = (а^) на элемент AgK называется мат- рица ЛА = (Ла1}). Относительно этих двух операций все матрицы размера т х п обра- зуют векторное пространство, которое мы будем обозначать Кт*п. По сути дела оно не отличается от пространства строк Ктп. Специ- фика матриц проявляется при определении их умножения. Произведением матрицы А = ) размера т х п и матрицы В = = (Ьд) размера п х р называется матрица АВ — (clfc) размера т х р, элементы которой находятся по формулам cik ~ Zj aijbjk' J=1 Иными словами, если определить скалярное произведение строки длины п на столбец высоты п как сумму произведений их соответ- ственных элементов, то можно сказать, что cik есть скалярное произ- ведение i-й строки матрицы А на k-й столбец матрицы В. Подчерк- нем, что произведение двух матриц определено только тогда, когда их размеры согласованы, а именно, когда число столбцов первой матрицы равно числу строк второй. Это определение мотивируется следующим образом. Будем гово- рить, что переменные ylf ...,ут (принимающие значения в поле К) линейно выражаются через переменные х1?..., хп, если существуют такие а^ G К, что У| = Еа1Л (i = 1,2,т). 7 = 1
§ 8. Алгебра матриц 43 Предположим, что переменные ...,хп, в свою очередь, линейно выражаются через переменные zlf р Xj = Y.bjkzk 0 = 1,2, к=1 Тогда, подставив эти выражения в предыдущие, мы получим линей- ные выражения переменных ..., ут через ..., zp: р У1=’Е^к (i = l,2, п где cik = aijbjk> т-е- матрица С = (clfc) есть произведение матриц А = (ai}) и В = (bjk) в смысле данного выше определения. Пример 1. /2 — П 0 2Л ( f 1-2+0 0+21 1(-D+0-5+2-1 Л Г4 П VO -1 3J I * * l”V0-2+(-l)-0+3-l 0-(-1)-4-(—1)-54-3-1у“ 1^3 -27- Пример 2. fcosa — sin a\ fcos fl -^nfl\__ y^sina cosaj^sinfl cos fl J “ fees a cos fl - sin a sin fl -cos a sin fl - sin a cos /ЗЛ _ — y^sin a cos fl + cos a sin fl -sin a sin fl + cos a cos fl J ~~ _ fcos(a + fl) -sin(a + fl) \ — y^sinta + fl) cos(a 4- fl) J ’ Умножение матриц ассоциативно в том смысле, что (АВ)С = А(ВС), (9) если только размеры матриц А, В, С согласованы таким образом, что указанные произведения имеют смысл. В самом деле, пусть (АВ)С = (иД А(ВС) = (Ц/). Имеем тогда Uil S f S O-ijbjk ) ckl ~ S O-ijbjkckl> к К j 7 ),к Ц7 = S bjkckl^ ” S O-ijbjkckb так ЧТО 11ц = Va.
44 Глава 1. Алгебраические структуры Матрица размера п х п называется квадратной матрицей поряд- ка п. Квадратная матрица имеет две диагонали. Одна из них, веду- щая из левого верхнего угла в правый нижний, называется главной диагональю, или просто диагональю, а другая — побочной диагона- лью. Квадратная матрица называется диагональной, если все ее эле- менты, находящееся вне (главной) диагонали, равны нулю. Умноже- ние на диагональные матрицы выглядит особенно просто: ^01 0 ... О Л ЛЬц Ь12 ••• ь1р^ О а2 ... О b2i Ь22 ••• ь2р к О 0 ... aj V>ni bn2 ... b,ipJ a1^12 ••• a2^21 a2^22 ••• a2^2p \dnbHi anbn2 ••• anbnpj (каждая строка второй матрицы умножается на соответствующий диагональный элемент первой матрицы) и, аналогично, <ап а12 ... а1п а21 а22 ••• а2п \O-inl &ni2 ••• O-mnJ 0 ... 0 k Л а11Ь1 а12^2 ••• а1цЬп Л О Ь2 ... О _ а21Ь2 а22Ь2 ••• ci2nbn к 0 0 ... bnJ а ,n2b2 ••• ainnbnJ (каждый столбец первой матрицы умножается на соответствующий диагональный элемент второй матрицы). Диагональную матрицу (аг 0 ... 0 k О а2 ... О к О 0 ... aj мы будем обозначать diag(a1? а2,ап). Диагональная матрица вида П 0 ... Ок о 0 1 ... О Е = ко 0 ... 1J называется единичной матрицей. Из предыдущих формул следует, что для любой матрицы А размера т х п АЕ = А, ЕА = А, (10) где Е в первом случае обозначает единичную матрицу порядка п, а во втором — единичную матрицу порядка т.
§ 8. Алгебра матриц 45 Следующие очевидные свойства связывают операцию умноже- ния матриц с другими операциями: А(В + С) = АВ + АС, (А + В) С = АС + ВС, (11) (ЛА)В = А(ЛВ) = Л(АВ) VA е К. (12) (Как и в свойстве ассоциативности, здесь предполагается, что разме- ры матриц согласованы таким образом, что все указанные действия имеют смысл.) Сумма и произведение квадратных матриц одного и того же порядка п определены и также являются квадратными матрицами порядка и. Свойства (9)—(12) показывают, что все квадратные мат- рицы порядка п образуют ассоциативную алгебру с единицей. Мы будем обозначать ее Ln(JC)? Отметим некоторые «отрицательные» свойства алгебры Ln(K) при п 2. (Алгебра Ц (К) есть поле К.) 1) Алгебра Ln(K) не коммутативна. При и = 2 это можно проде- монстрировать на следующем примере: р оуо П (0 п р пр owo (Л Vo о J Vo Qj Vo oj’ Vo oJVo о; Vo о/ Аналогичные примеры можно привести и при п > 2. 2) Алгебра Ln(K) имеет делители нуля. Это показывает, напри- мер, второе из приведенных выше равенств. Более того, существуют такие ненулевые матрицы, квадрат которых равен нулю, например, ГО lV_fO 1W0 П_Г0 0> Vo о) ~Vo о J Vo oj-Vo o)- 3) He всякий ненулевой элемент алгебры L„(K) обратим. Это следует из наличия делителей нуля и того факта, что делитель нуля не может быть обратим (см. доказательство отсутствия делителей нуля в поле, данное в § 3). Так, например, матрицы Q и необратимы в Ь2(К). Задача 1. Матрица Е1р у которой на (i, j)-m месте стоит 1, а на остальных местах — нули, называется матричной единицей (не пу- тать с единичной матрицей!). Матричные единицы (i, j = 1,..., п) 1 Буква «L» в нашем обозначении — первая буква слова «linear»; это связано с тем, что матрицы можно интерпретировать как линейные отображения (см. § 5.2). Другое часто встречающееся обозначение для этой алгебры — Мп (X).
46 Глава 1. Алгебраические структуры образуют базис векторного пространства Ln(K). Выписать таблицу умножения алгебры Ln(K) в этом базисе. Задача 2. Матрицы вида ЛЕ (Л G К) называются скалярными. Очевидно, что всякая скалярная матрица перестановочна со всеми квадратными матрицами того же порядка. Доказать обратное: вся- кая квадратная матрица, перестановочная со всеми квадратными матрицами того же порядка, скалярна. Задача 3. Доказать, что в алгебре L2(R) матрицы вида образуют подалгебру, изоморфную алгебре комплексных чисел. Задача 4. Доказать, что в алгебре Ь2(С), рассматриваемой как алгебра над R, матрицы вида образуют подалгебру, изоморфную алгебре кватернионов (см. при- мер 7.6). Для каждой матрицы А = <ап а12 ... ainA а21 а22 ••• а2п k^znl ^m2 ••• 0-mnJ определим транспонированную матрицу <ац а21 ... а12 а22 аш2 kaln ^2п ••• O-mnJ строками которой служат столбцы матрицы А, а столбцами — стро- ки матрицы А. Если (i, ;)-й элемент транспонированной матрицы обозначить через аТ, то Очевидно, что (АТ)Т=А, (А + В)Т = АТ + ВТ, (ЛА)Т = ЛАТ УЛ<=К.
§ 8. Алгебра матриц 47 Докажем, что (АВ)Т = ВТАТ. В самом деле, пусть АВ = С = (clfc); тогда Cki = Cik = S = X ^kjajif j J откуда видно, что СТ = ВТАТ. Замечание 1. Читатель может проследить, что все построения послед- них трех параграфов проходят без изменений, если в качестве К взять произвольное коммутативное ассоциативное кольцо с единицей, например, кольцо целых чисел или кольцо вычетов. Единственное отличие является терминологическим: вместо термина «векторное пространство» в этой бо- лее общей ситуации употребляется термин «модуль». (См. § 9.3.)
Глава 2 Начала линейной алгебры § 1. Системы линейных уравнений Пусть К — произвольное (но фиксированное) поле. Допуская вольность речи, мы будем обычно называть его элементы числами. Если читателю трудно представить себе произвольное поле, он может считать, что К = JR, хотя объективно этот случай ничуть не проще общего. Линейным уравнением с неизвестными хъ х2,хп над полем К называется уравнение вида а1х1+а2х2 + ... + апхп = Ь) где коэффициенты аъа2, ...,ап и свободный член b суть элементы поля К. Линейное уравнение называется однородным, если Ь = 0. Система т линейных уравнений с п неизвестными в общем виде записывается следующим образом: ( anXi+ а12х2 + ...+ а1пхп = Ьъ a21Xi+ а22х2 + ...+ а2пхп = Ь2, V aml*l &т2х2 “Ь • • • + °-тпхп Ът • Матрица <ап а12 ... ащ> д= а21 а22 ••• а2п \Лп11 а/п2 ... атпу называется матрицей коэффициентов, а матрица ^а11 а12 ••• а1п а21 а22 ••• а2п ^2 ^ш2 ••• ^тп ^inJ —расширенной матрицей системы (1).
§ 1. Системы линейных уравнений 49 Система уравнений называется совместной, если она имеет хотя бы одно решение, и несовместной в противном случае. Совместная система может иметь одно или более решений. Решить систему уравнений — это значит найти все ее решения. Подчеркнем, что одно решение системы уравнений с п неизвест- ными — это упорядоченный набор из п чисел, т. е. элемент простран- ства Кп. Существует простой общий метод решения систем линейных уравнений, называемый методом Гаусса. Его идея состоит в при- ведении любой системы линейных уравнений с помощью некото- рых специальных преобразований, называемых элементарными, к эквивалентной системе некоторого простого вида, все решения которой легко найти. Напомним, что две системы уравнений назы- ваются эквивалентными, если множества их решений совпадают, т. е. если каждое решение первой из них является решением второй и наоборот. Определение 1. Элементарными преобразованиями системы ли- нейных уравнений называются преобразования следующих трех ти- пов: 1) прибавление к одному уравнению другого, умноженного на число; 2) перестановка двух уравнений; 3) умножение одного уравнения на число, отличное от нуля. Подчеркнем, что при элементарном преобразовании первого ти- па изменяется только одно уравнение — то, к которому прибавляет- ся другое, умноженное на число. Очевидно, что всякое решение исходной системы уравнений яв- ляется решением новой системы, полученной элементарным пре- образованием. С другой стороны, исходная система уравнений мо- жет быть получена из новой системы подходящим элементарным преобразованием того же типа. Так, если мы прибавим к первому уравнению второе, умноженное на с, то можно вернуться назад, прибавив к первому уравнению новой системы ее второе уравнение (оно такое же, как у исходной системы), умноженное на —с. Поэто- му при любом элементарном преобразовании мы получаем систему уравнений, эквивалентную исходной. Так как нам удобнее работать не с самими системами линейных уравнений, а с их (расширенными) матрицами, дадим соответству- ющее определение для матриц.
50 Глава 2. Начала линейной алгебры Определение V. Элементарными преобразованиями строк мат- рицы называются преобразования следующих трех типов: 1) прибавление к одной строке другой, умноженной на число; 2) перестановка двух строк; 3) умножение одной строки на число, отличное от нуля. Очевидно, что всякое элементарное преобразование системы ли- нейных уравнений приводит к соответствующему элементарному преобразованию ее матрицы коэффициентов и расширенной мат- рицы. Покажем теперь, что с помощью элементарных преобразований строк любую матрицу можно привести к достаточно простому виду. Назовем ведущим элементом ненулевой строки (аь а2)afl) е е Кп ее первый ненулевой элемент. Определение 2. Матрица называется ступенчатой, если 1) номера ведущих элементов ее ненулевых строк образуют стро- го возрастающую последовательность; 2) нулевые строки, если они есть, стоят в конце. Таким образом, ступенчатая матрица — это матрица вида ( |Д1„ ....................... А |%2 ................. 0 V 7 (2) в которой элементы а171, a2j2,аг^, находящиеся в углах ступенча- той линии, отличны от нуля, а все элементы, находящиеся слева от этой линии и ниже нее, равны нулю. При этом <jr- Теорема 1. Всякую матрицу путем элементарных преобразова- ний строк можно привести к ступенчатому виду. Доказательство. Если данная матрица нулевая, то она уже сту- пенчатая. Если она ненулевая, то пусть j\ — номер ее первого нену- левого столбца. Переставив, если нужно, строки, добьемся того, что- бы a1ji / 0. После этого прибавим к каждой строке, начиная со второй, первую строку, умноженную на подходящее число, с таким расчетом, чтобы все элементы ;гго столбца, кроме первого, стали
§ 1. Системы линейных уравнений 51 равными нулю. Мы получим матрицу вида Поступая таким же образом с матрицей мы в конце концов по- лучим матрицу вида (2). □ Замечание 1. В этом доказательстве мы обошлись без элемен- тарных преобразований третьего типа. Однако на практике они мо- гут быть полезны. Пример 1. Приведем к ступенчатому виду матрицу Л 2 1 О 2Л 13 2-1 4 2 1-1 3-2 <2 0 -2 3 1J Вычитая из 2-й, 3-й и 4-й строк 1-ю строку, умноженную на 1, 2 и 2 соответственно, получаем матрицу Л 2 1 0 2\ 011-12 0-3-3 3 -6 ’ <0 —4 —4 3-37 Далее, прибавляя к 3-й и 4-й строкам 2-ю строку, умноженную на 3 и 4 соответственно, получаем матрицу Л 2 1 0 2А 011-12 ООО 00* Ц) 0 0 -1 57 Наконец, переставляя 3-ю и 4-ю строки, получаем ступенчатую мат- рицу Л 2 1 0 2А 0 11-12 0 0 0 —1 5’ <о о о о о7 Замечание 2. Предыдущий пример специально подобран таким образом, чтобы jlf j2, ---tir не были просто первыми г членами на-
52 Глава 2. Начала линейной алгебры турального ряда. Такая ситуация является в определенном смысле исключительной. Например, # 1 только при условии, что первый столбец исходной матрицы нулевой. Как правило, Ь = 1, >2 = 2, }г = Г. В этом случае матрица (2) называется трапецеидальной. Применим доказанную теорему к решению систем линейных уравнений. Определение 3. Система линейных уравнений называется сту- пенчатой, если ее расширенная матрица ступенчатая. Из теоремы 1 следует, что всякую систему линейных уравнений с помощью элементарных преобразований можно привести к сту- пенчатому виду. Поэтому нам достаточно научиться решать ступен- чатые системы. Введем некоторую терминологию. Квадратная матрица А = (а,р называется {верхней) треугольной, если а^ = 0 при i > j, и строго треугольной, если, кроме того, ап # 0 при всех i. Система линейных уравнений называется {строго) треугольной, если ее матрица коэф- фициентов (строго) треугольна. Замечание 3. Квадратная матрица А = (а,;) называется нижней треугольной, если а^ = 0 при i < j. Рассмотрим теперь произвольную ступенчатую систему линей- ных уравнений. Пусть число ненулевых строк (число ступенек) ее матрицы коэффициентов равно г, а число ненулевых строк расши- ренной матрицы равно г. Очевидно, что г = г или г 4-1. Возможны следующие три принципиально разных случая. 1-й случай. г = г 4-1. В этом случае система содержит уравне- ние вида О*! 4- 0х2 4-... 4- 0хп = Ь, где b / 0, и, следовательно, несовместна. 2-й случай. г = г = п. В этом случае после отбрасывания нуле- вых уравнений получается строго треугольная система. Из ее по- следнего уравнения однозначно определяется хп, затем из предпо- следнего уравнения определяется хп_г и т.д. Следовательно, систе- ма имеет единственное решение. 3-й случай. г = г<п. Пусть в этом случае j19 j2,..., jr — номера ведущих коэффициентов ненулевых уравнений системы. Неизвест-
§ 1. Системы линейных уравнений 53 ные х.-, х,•,..., х,- назовем главными. а остальные — свободными. После отбрасывания нулевых уравнений и перенесения членов со свободными неизвестными в правую часть получается строго тре- угольная система относительно главных неизвестных. Решая ее, как в предыдущем случае, находим выражения главных неизвестных че- рез свободные. Эти выражения называют общим решением системы. Все решения системы получаются из общего решения подстановкой каких-то значений свободных неизвестных. Поскольку эти значения могут выбираться произвольно, система имеет, во всяком случае, более одного решения, а если поле К бесконечно, то бесконечно много решений. Совместная система линейных уравнений называется определен- ной, если она имеет единственное решение, и неопределенной, если она имеет более одного решения. В последнем случае, как следует из проведенного выше анализа, она имеет бесконечно много решений, если только поле К бесконечно. Ее общее решение с точностью до перенумерации неизвестных имеет вид ' Х1 = С11*г+1 + С12*г+2 + • • • + Чп-Л + х2~С21Хг+1 + С22Хг+2 + ••• +С2,п-г*п + ^2> (3) I xr = Crl*r+1 + Сг2*г+2 + • • • + Сг.п-Л + Пример 2. Решим систему уравнений Xj + 2х2 + х3 =2, Xi+3x2 + 2x3- х4 = 4, 2х3+ х2— х3 + Зх4 = -2, 2хг - 2х3 + Зх4 = 1, расширенной матрицей которой служит матрица из примера 1. Вы- числения, проведенные в примере 1, показывают, что данная систе- ма эквивалентна ступенчатой системе X! + 2x2 + x3 =2, х2 + х3- х4 = 2, -х4 = 5.
54 Глава 2. Начала линейной алгебры Считая неизвестные х}, х2, х4 главными, а неизвестное х3 — свобод- ным, перепишем систему в виде хг 4- 2х2 = -х3 4- 2, х2-х4 = -х3 + 2, -х4 = 5. Решая ее относительно хь х2, х4, находим общее решение Xj = х3 4- 8, х2 = -х3-3, х4= -5. Замечание 4. Для единообразия можно считать, что в случае определенной системы все неизвестные являются главными, а сво- бодные неизвестные отсутствуют. Общее решение есть тогда един- ственное решение системы. Строго треугольную матрицу можно путем элементарных пре- образований строк привести к единичной матрице. Для этого нуж- но сначала к каждой строке, кроме последней, прибавить послед- нюю строку с таким коэффициентом, чтобы элемент последнего столбца стал равным нулю, затем аналогичным образом, прибав- ляя предпоследнюю строку, сделать равными нулю все элементы предпоследнего столбца, кроме диагонального, и т.д. В результа- те мы получим диагональную матрицу. Умножая ее строки на под- ходящие числа, мы получим единичную матрицу. Пользуясь этим, можно при решении системы линейных уравнений не останавли- ваться на ступенчатом виде, а, продолжив преобразования, приве- сти матрицу коэффициентов при главных неизвестных к единич- ной матрице. Тогда общее решение просто считывается с получен- ной матрицы. Эта процедура называется обратным ходом метода Гаусса. Пример 3. Продолжим преобразование примера 1, предвари- тельно отбросив нулевую строку. Вычтя из 2-й строки 3-ю, получим матрицу /12 1 0 2\ 011 0 -3 . <000-1 5J
§ 1. Системы линейных уравнений 55 Вычтя из 1-й строки удвоенную 2-ю и умножив 3-ю строку на -1, получим матрицу 10-10 8Л 0 1 10-3. 00 01 -5/ Таким образом, система уравнений из примера 2 эквивалентна си- стеме Xj -х3 =8, х24-х3 = -3, х4 = -5. Перенося члены с х3 в правую часть, получаем уже найденное выше общее решение. Система однородных линейных уравнений всегда совместна, так как она имеет нулевое решение. Если она определенна, то она име- ет только нулевое решение, если неопределенна, то имеет хотя бы одно ненулевое решение (и даже бесконечно много таких решений, если поле К бесконечно). В предыдущих обозначениях, последний случай имеет место, если г < п. Пользуясь тем, что всегда г^т, мы приходим к следующей теореме, которая является важным теорети- ческим следствием метода Гаусса. Теорема 2. Всякая система однородных линейных уравнений, число уравнений которой меньше числа неизвестных, имеет нену- левое решение. Совокупность всех решений совместной системы линейных урав- нений с п неизвестными не может быть произвольным подмноже- ством пространства Кп. Читателю, вероятно, известно, что нетриви- альная совместная система линейных уравнений задает в Е2 точку или прямую, а в Е3 — точку, прямую или плоскость. Следующая теорема является алгебраической версией этих утверждений, спра- ведливой в любой размерности и для любого поля. Теорема 3. 1) Совокупность всех решений системы однородных линейных уравнений с п неизвестными является подпространством пространства Кп. 2) Совокупность всех решений произвольной совместной систе- мы линейных уравнений есть сумма какого-либо одного ее решения и подпространства решений системы однородных линейных уравне- ний с той же матрицей коэффициентов.
56 Глава 2. Начала линейной алгебры Доказательство. 1) Рассмотрим произвольную систему одно- родных линейных уравнений (апХ1+ (112*2 +•••+ ain*n = 0> а2гХ1+ а22х2 + ...+ а2пх„ = 0, (4) amixi + ат2х2 + • • • + атпхп = 0. Очевидно, что нулевая строка является ее решением и что произ- ведение любого решения на число также является решением. Дока- жем, что сумма решений (иъ ..., un) и (иъ ..., ип) является решением. Подставляя ее компоненты в i-e уравнение системы, получаем: (u j 4-) 4- ai2(и2 4- и2) 4-... + ain (ип + Цг) = = (atlUj 4- ai2u2 4-... 4- ainun) 4- (а^ 4- ai2v2 4-... 4- ainип) = 0 4- 0 = 0, что и требовалось доказать. 2) Пусть теперь и G Кп — какое-либо фиксированное решение системы (1). Аналогично предыдущему доказывается, что сумма ре- шения и и произвольного решения и системы (4) является решени- ем системы (1). Обратно, если и' — любое решение системы (1), то v = и' - и — решение системы (4); но и' = и 4- р, так что и' получает- ся из и добавлением решения системы (4). □ Неопределенные системы линейных уравнений могут иметь раз- ную «степень неопределенности», каковой естественно считать чис- ло свободных неизвестных в общем решении системы. Однако одна и та же система линейных уравнений может допускать различные общие решения, в которых разные неизвестные играют роль свобод- ных, и закономерен вопрос, будет ли число свободных неизвестных всегда одним и тем же. Положительный ответ на этот вопрос дается с помощью понятия размерности векторного пространства, которое будет введено в следующем параграфе. В оставшейся части этого параграфа мы интерпретируем метод Гаусса на языке умножения матриц. Прежде всего, если обозначить через X столбец неизвестных, а через В — столбец свободных членов, то систему (1) можно пере- писать в следующей матричной форме: АХ = В. (5)
§ 1. Системы линейных уравнений 57 Действительно, матрица АХ, согласно правилу умножения матриц, есть столбец высоты т, i-й элемент которого равен апХ1 +ai2x2 + ...+ainxn. Приравнивая этот элемент i-му элементу столбца В, мы получаем как раз i-e уравнение системы (1). Пусть U — какая-либо квадратная матрица порядка т. Умножая обе части уравнения (5) слева на U, мы получаем уравнение UAX = UB. (6) Очевидно, что всякое решение уравнения (5) удовлетворяет и урав- нению (6). Если же матрица U обратима, то умножение слева на осуществляет обратный переход от уравнения (6) к уравнению (5) и, следовательно, эти уравнения эквивалентны. Уравнению (6) соответствует система линейных уравнений с матрицей коэффициентов UA и столбцом свободных членов UB. Легко видеть, что расширенная матрица этой системы равна UA. Далее, непосредственно проверяется, что элементарные преоб- разования строк какой-либо матрицы А равносильны ее умноже- нию слева на так называемые элементарные матрицы следующих трех типов: = Е + сЕу, = Qi(c), где i 0 с 00, а все элементы этих матриц, не выписанные явно, такие же, как у единичной матрицы.
58 Глава 2. Начала линейной алгебры Так, например, умножение матрицы А слева на Е + сЕ^ (f # J) приводит к тому, что к i-й строке прибавляется j-я строка, умножен- ная на с (а прочие строки не изменяются). Все элементарные матрицы обратимы, причем обратные к ним матрицы суть элементарные матрицы, соответствующие обратным элементарным преобразованиям: (Е + сЕу)-1 =Е— сЕу, Р^=Рц, Qj(c)-1 = Ql(c-1). Метод Гаусса в матричной интерпретации состоит в последова- тельном умножении уравнения (5) слева на элементарные матрицы, имеющем целью приведение матрицы А (а также расширенной мат- рицы А) к ступенчатому виду. Используя вместо элементарных матриц какие-либо другие матрицы, можно получить другие методы решения систем линейных уравнений, кото- рые, быть может, не столь просты в теоретическом отношении, но, скажем, более надежны при приближенных вычислениях (в случае K = R). Таков, например, метод вращений, при котором в качестве U берутся матрицы вида i .........cos а------sin а j .....sin а cos а.... v = i ’’-J § 2. Базис и размерность векторного пространства Представление о размерности пространства есть одна из фунда- ментальных идей математики. В разных разделах математики оно (как и представление о самом пространстве) принимает разные формы. В этом параграфе мы дадим определение размерности век- торного пространства и исследуем связанные с этим понятием во- просы. В § 1.6 мы ввели понятие базиса векторного пространства и до- казали, что векторное пространство над полем К, имеющее базис из п векторов, изоморфно пространству строк К". Размерность век- торного пространства определяется как число векторов в его базисе. Однако перед тем как дать такое определение, необходимо ответить
§ 2. Базис и размерность векторного пространства 59 на два вопроса: какие векторные пространства обладают базисом и не может ли в векторном пространстве быть двух базисов, состоя- щих из разного числа векторов. Чтобы ответить на эти вопросы, нам понадобится ввести некото- рые понятия и доказать ряд утверждений, которые важны и сами по себе. Пусть V — векторное пространство над полем К. Линейная комбинация Aidj 4-А2а2 4-... 4-Anan (Аь А2,..., An GK) векторов а2, ...,aneV называется тривиальной, если Aj = А2 =... ... = Ап = 0, и нетривиальной в противном случае. Определение 1. Векторы а2, называются линейно зави- симыми, если существует их нетривиальная линейная комбинация, равная нулю, и линейно независимыми в противном случае. Подчеркнем, что понятие линейной зависимости (или независи- мости) относится не к отдельным векторам, а к их совокупностям или, как говорят, системам векторов. Замечание 1. Понятие системы векторов отличается от понятия множества векторов тем, что, во-первых, векторы системы пред- полагаются занумерованными и, во-вторых, среди них могут быть равные. Таким образом, система из п векторов — это, в сущности, отображение множества {1, 2,..., п} в пространство V. Заметим, од- нако, что свойство системы векторов быть линейно зависимой или независимой не зависит от нумерации векторов в ней. Замечание 2. Термин «линейная комбинация» на самом деле употребляется в двух смыслах: как указание действий, которые про- изводятся над данными векторами, что равносильно заданию коэф- фициентов Аъ А2,..., Ап, и как результат этих действий. В выраже- нии «нетривиальная линейная комбинация данных векторов равна нулю» нетривиальность понимается в первом смысле, а равенство нулю — во втором. Линейная независимость векторов а2,..., ап означает, иными словами, что равенство А^сц 4~ А2а2 4-... 4- Апап = О выполняется только при Аг = А2 =... = Ап = 0. Пример 1. Система, состоящая из одного вектора, линейно зави- сима тогда и только тогда, когда этот вектор нулевой.
60 Глава 2. Начала линейной алгебры Пример 2. Система, состоящая из двух векторов, линейно зави- сима тогда и только тогда, когда эти векторы пропорциональны. Пример 3. Три геометрических вектора линейно зависимы то- гда и только тогда, когда они компланарны (параллельны одной плоскости). Очевидно, что если система векторов содержит линейно зави- симую подсистему, то она сама линейно зависима. Так, например, всякая система векторов, содержащая пропорциональные векторы, линейно зависима. Лемма 1. Векторы аь а2,..., ап (п > 1) линейно зависимы тогда и только тогда, когда хотя бы один из них линейно выражается через остальные. Доказательство. 1) Пусть, например, =/22а24-... 4-р-пап- тогда ai-M2a2--"-Mnan = 0, что показывает линейную зависимость векторов а2,..., ап. 2) Обратно, пусть AjOj + Л2а2 +... + Anan = 0, где не все коэффициенты Аь А2,..., Ап равны нулю. Допустим для определенности, что Аг / 0. Тогда _ А2 А а'-~Т1а2~-~Т1ап’ т. е. а2 линейно выражается через а2,..., ап. □ Замечание 3. Неверно, что любой вектор линейно зависимой системы линейно выражается через остальные. Пусть, например, а — какой-нибудь ненулевой вектор. Система {а, 0} линейно зави- сима, так как 0а + 1-0 = 0, но вектор а, очевидно, не выражается через нулевой вектор. Лемма 2. Пусть векторы alta2, ...,ап линейно независимы. Век- тор b линейно выражается через а19 а2,..., ап тогда и только тогда, когда векторы а19 а2,..., an, Ь линейно зависимы.
§ 2. Базис и размерность векторного пространства 61 Доказательство. Если вектор b линейно выражается через а2,ап, то аь а2,ап, b линейно зависимы согласно предыдущей лемме. Обратно, пусть Лубц 4- А2а2 4-... 4- ^пап = причем не все коэффициенты Аъ А2,Ап, pt равны нулю. Можно утверждать, что р 00: в противном случае мы получили бы линей- ную зависимость векторов аь а2,..., ап, что противоречит условию. Но тогда Лемма 3. Пусть вектор b линейно выражается через векторы а1э а2,..., ап. Это выражение единственно тогда и только тогда, когда векторы аь а2, линейно независимы. Доказательство. 1) Пусть вектор b допускает два различных вы- ражения через аь а2,..., ап: Ь = А1а1 + А2а2 4-... 4-Апап = Л/1а1 4-А^ 4-... 4-А'а„. тогда (А* — А^сц 4- (А^ — А2)а2 4-... 4- (А^ — Ап)ап = 0 есть линейная зависимость между аь а2,..., ап. 2) Обратно, пусть Miai4-M2a2 + --- + MnOn = 0 есть линейная зависимость между аь а2,..., ап. Тогда если Ь = А1а1 4-А2а2 4-... 4-Anan, то также Ь = (Ах 4-Mi)ai + (^2 + Мг)а2 + ••• + + Мп)ап> что дает другое выражение b через аь а2,..., ап. □ Предложение 1 (основная лемма о линейной зависимости). Ес- ли векторы bi,b2, ...9Ьт линейно выражаются через векторы аъ а2,..., ап, причем т>п, то векторы Ь2,..., Ьт линейно зависимы.
62 Глава 2. Начала линейной алгебры Доказательство. Пусть Ь1= M11G1+ Mi2a2 + ---+Minan, Ь2 = M2iai + М22а2 + ••• + М2пап> Mmlal + Mm2a2 4" ... 4" Mmnan- Для любых Ль А2, ..., АтеК получаем Aibi + А2Ь2 +... + АГПЬП1 = (Aj^n + A2pt21 +... + + + CAi Mi2 + ^2M22 + • • • + ^mMm2)fl2 + -F CAjД£+ A2/22n 4"... 4" Am/2mn)cin. Рассмотрим систему и однородных линейных уравнений с т неиз- вестными Г М11*1 + М21*2 + • • • + Mml^i = О, М12*1 + М22*2 + • • • + = 0» М1пХ1 + М2п*2 + • • • + М;иА = 0- Если (Аь А2,..., А,п) — произвольное решение этой системы, то Ajbj 4- A2b2 4-... 4-Ambni = 0. С другой стороны, по теореме 1.2 эта система имеет ненулевое реше- ние. Следовательно, векторы Ьь Ь2,..., ЬП1 линейно зависимы. □ Пусть S с V — какое-то подмножество. Совокупность всевозмож- ных (конечных) линейных комбинаций векторов из S называется линейной оболочкой множества S и обозначается через (S). Это наи- меньшее подпространство пространства V, содержащее S (проверь- те это!). Говорят, что пространство V порождается множеством S, если (S) = V. Определение 2. Векторное пространство называется конечно- мерным, если оно порождается конечным числом векторов, и бес- конечномерным в противном случае. Ввиду леммы 3 определение 1.6.4 базиса векторного пространст- ва можно переформулировать следующим образом. Определение 3. Базисом векторного пространства V называет- ся всякая линейно независимая система векторов, порождающая пространство V.
§ 2. Базис и размерность векторного пространства 63 Теорема 1. Всякое конечномерное векторное пространство V об- ладает базисом. Более точно, из всякого конечного порождающего множества S с V можно выбрать базис пространства V. Доказательство. Если множество S линейно зависимо, то по лемме 1 в нем найдется вектор, линейно выражающийся через остальные. Выкидывая этот вектор, мы получаем порождающее множество из меньшего числа векторов. Продолжая так дальше, мы в конце концов получим линейно независимое порождающее множество, т. е. базис. □ Теорема 2. Все базисы конечномерного векторного пространст- ва V содержат одно и то же число векторов. Это число называется размерностью пространства V и обознача- ется dim V. Доказательство. Если бы в пространстве V существовали два базиса из разного числа векторов, то, согласно предложению 1, тот из них, в котором больше векторов, был бы линейно зависим, что противоречит определению базиса. □ Замечание 4. Нулевое векторное пространство (состоящее из одного нулевого вектора) считается обладающим «пустым бази- сом»; в соответствии с этим его размерность считается равной нулю. Пример 4. Пространство Е2 (соответственно Е3) имеет размер- ность 2 (соответственно 3). Пример 5. Ввиду примера 1.6.7 пространство Кп имеет размер- ность и. Пример 6. Поле комплексных чисел как векторное простран- ство над R имеет размерность 2, а алгебра кватернионов (см. при- мер 1.7.6) — размерность 4. Пример 7. Если X — конечное множество из п элементов, то век- торное пространство F(X, К) всех функций на X со значениями в К (см. пример 1.6.2) имеет размерность п. В самом деле, рассмотрим так называемые 5-функции 5а (абХ), определяемые формулами „ х (1, еслих = а, (О, если х# а. Очевидно, что любая функция GF(X, К) единственным образом выражается через 5-функции, а именно, <Р= L <₽(а)5а. аеХ
64 Глава 2. Начала линейной алгебры Следовательно, функции 5а, аеХ, составляют базис пространства F(X, X), причем координатами функции в этом базисе служат ее значения. Если множество X бесконечно, то для любого п в прост- ранстве F(X, К) имеется п линейно независимых векторов, напри- мер, 5ар ба2,..., 5ап, где а2) ...,апеХ различны, и, следовательно, пространство F(X, X) бесконечномерно. Пример 8. Поле R как векторное пространство над Q бесконечномерно. В самом деле, если бы оно было конечномерным, то вещественное число определялось бы конечным набором рациональных чисел — своих коорди- нат в некотором базисе этого пространства. Но тогда множество всех веще- ственных чисел было бы счетным, что неверно. Задача 1. Найти число векторов п-мерного векторного прост- ранства над конечным полем из q элементов. Задача 2. Доказать, что пространство всех непрерывных функ- ций на любом промежутке числовой прямой бесконечномерно. Из основной леммы о линейной зависимости (предложение 1) следует, что любые т > п векторов п-мерного векторного простран- ства V линейно зависимы и, значит, в любом (конечном или беско- нечном) множестве S с V имеется максимальное линейно независи- мое подмножество, т. е. такое линейно независимое подмножество, которое становится линейно зависимым при добавлении к нему любого из оставшихся векторов множества S. Более того, любое линейно независимое подмножество множества S можно дополнить до максимального линейно независимого подмножества. Предложение 2. Всякое максимальное линейно независимое под- множество {ет,..., ек} множества S является базисом линейной обо- лочки (S) этого множества. Доказательство. Нужно доказать, что каждый вектор из (S) ли- нейно выражается через е1э ...,efc. По определению линейной обо- лочки каждый вектор из (S) линейно выражается через векторы из S. Поэтому достаточно доказать, что каждый вектор а е S линей- но выражается через elf..., ek. Для a G {eb ..., ek} это очевидно. Для а£{еъ ...,ек} это следует из леммы 2. □ Применяя высказанные соображения к S = V, мы получаем сле- дующую теорему. Теорема 3. Всякую линейно независимую систему векторов ко- нечномерного векторного пространства V можно дополнить до ба- зиса.
§ 2. Базис и размерность векторного пространства 65 В частности, любой ненулевой вектор можно включить в базис, а любые п линейно независимых векторов п-мерного векторного пространства уже составляют базис. Задача 3. Найти число базисов n-мерного векторного простран- ства над полем из q элементов. Следующая теорема устанавливает свойство монотонности раз- мерности. Теорема 4. Всякое подпространство U конечномерного вектор- ного пространства V также конечномерно, причем dim U $ dim V. Более того, если U^V, то dim U < dim V. Доказательство. Пусть {е1э е2,..., ек} — максимальная линейно независимая система векторов подпространства U. Согласно пред- ложению 2, {е^ е2,..., ек} — базис этого подпространства. Следова- тельно, dim U = к. Линейно независимую систему {е1э е2,..., ек} мож- но дополнить до базиса всего пространства V. Следовательно, если L//V, то dim У> к. □ Задача 4. Найти число к-мерных подпространств n-мерного век- торного пространства над полем из q элементов. Следующая теорема дает исчерпывающее описание всех конеч- номерных векторных пространств. Теорема 5. Конечномерные векторные пространства над одним и тем же полем изоморфны тогда и только тогда, когда они имеют одинаковую размерность. Доказательство. Если f: V —♦ U — изоморфизм векторных про- странств и {ej, е2,..., еп} — базис пространства V, то {/(еД /(е2),... • ••> /(еп)} — базис пространства U, так что dim V = dim U. Обратно, согласно предложению 1.6.1, всякое n-мерное векторное простран- ство над полем К изоморфно Кп; следовательно, все такие простран- ства изоморфны между собой. □ Таким образом, в любом рассуждении мы вправе заменить про- извольное n-мерное векторное пространство над полем К простран- ством строк Кп. В пространстве Кп имеется «привилегированный» базис, состоящий из единичных строк (см. пример 1.6.7). С другой стороны, если в каком-либо п-мерном векторном пространстве V задан базис, то сопоставление каждому вектору строки его коор- динат (как в доказательстве предложения 1.6.1) определяет канони- ческий изоморфизм пространства V и пространства Кп, при кото- ром векторам заданного базиса соответствуют единичные строки. В этом смысле можно сказать, что пространство строк — это не что
66 Глава 2. Начала линейной алгебры иное, как конечномерное векторное пространство с выделенным базисом. Выясним, как связаны между собой координаты вектора в раз- ных базисах. Пусть {е2,..., еп} и {е*,..., е'} —два базиса векторного пространства V. Выразим векторы второго базиса через первый базис: e'=Seicij (j = l. (7) I Квадратная матрица С = (с,у) называется матрицей перехода от базиса {еь ..., еп} к базису {e'lfе'}. Согласно этому определению, j-й столбец матрицы С есть столбец координат вектора е< в базисе {еь ..., еп}. Если распространить правило умножения матриц на слу- чай, когда элементами одной из них являются векторы (что имеет смысл ввиду операций, определенных в векторном пространстве), то равенства (7) могут быть переписаны в следующей матричной форме: (е'1,...,<) = (е1,...,еп)С. (8) Пусть х G V — какой-либо вектор. Разложим его по базисам {е1,...,еп}и{е'1,...,е'п}: х = х1е1 + ... + хпел = х{е'1 + ... + х'пе,п. Положим Тогда х= (e'p ..., е')Х' = (eb ..., еп)СХ', откуда получается следующая формула преобразования координат при переходе от базиса {еь ..., еп} к базису {вр ..., е'}: Х = СХ' (9) или, более подробно, = (i = l, ...,п). (10) j Понятия базиса и размерности могут быть распространены на бесконечномерные векторные пространства. Чтобы это сделать, на- до определить, что такое линейная комбинация бесконечной систе-
§ 2. Базис и размерность векторного пространства 67 мы векторов. В чисто алгебраической ситуации нет иного выхо- да, кроме как ограничиться рассмотрением линейных комбинаций, в которых лишь конечное число коэффициентов отлично от нуля. Пусть {а;: iel}— система векторов, занумерованных элемента- ми бесконечного множества I. Линейной комбинацией векторов а,, i е/, называется выражение вида Afaf, в котором лишь конечное iel число коэффициентов А, отлично от нуля, так что сумма фактически является конечной и, таким образом, имеет смысл. На основе этого определения линейной комбинации точно так же, как в случае ко- нечных систем векторов, определяются понятия линейной выража- емости, линейной зависимости и базиса. Векторное пространство, обладающее счетным базисом, называ- ется счетномерным. Пример 9. Очевидно, что множество всех последовательностей (строк бесконечной длины) из элементов поля К является вектор- ным пространством относительно операций сложения и умножения на элементы поля К, определяемых так же, как для строк конеч- ной длины. Последовательность называется финитной, если лишь конечное число ее членов отлично от нуля. Финитные последова- тельности образуют подпространство в пространстве всех последо- вательностей. Обозначим его через К00. В качестве его базисных векторов можно взять последовательности вида е. = (0, ...,0,1,0,...) (i = 1,2,...) (единица стоит на i-м месте). Таким образом, пространство К00 счет- номерно. Так же, как предложение 1.6.1, доказывается тот факт, что всякое счетномерное векторное пространство над К изоморфно /С00. Задача 5. Доказать, что поле R как векторное пространство над Q не является счетномерным. Задача 6. Доказать, что из всякого счетного порождающего множества векторного пространства можно выбрать базис (конечный или счетный). Задача 7. Доказать, что любое несчетное множество векторов в счет- номерном векторном пространстве линейно зависимо (и, следовательно, любой базис счетен). Задача 8. Доказать, что всякую (конечную или счетную) линейно неза- висимую систему векторов счетномерного векторного пространства можно дополнить до базиса.
68 Глава 2. Начала линейной алгебры Задача 9. Доказать, что всякое подпространство счетномерного век- торного пространства не более чем счетномерно (т. е. счетномерно или конечномерно). Привести пример счетномерного подпространства счет- номерного векторного пространства, не совпадающего со всем простран- ством. Задачи 6—9 представляют собой аналоги теорем 1—4 для счетномер- ных векторных пространств. Аналогичные утверждения могут быть доказа- ны и для несчетномерных пространств, но для этого требуется привлечение аппарата канторовской теории множеств (трансфинитной индукции или леммы Цорна). С другой стороны, такой чисто алгебраический подход име- ет ограниченную сферу применения. Обычно несчетномерное векторное пространство снабжается топологией, которая позволяет придавать смысл бесконечным суммам векторов. § 3. Ранг матрицы На основе понятия размерности векторного пространства вво- дятся понятия ранга системы векторов и ранга матрицы. Определение 1. Рангом системы векторов называется размер- ность ее линейной оболочки. Рангом матрицы называется ранг си- стемы ее строк. Ранг матрицы А обозначается через rk А. Системы векторов {аь а2,...»ап} и {Ьь Ь2,..., Ьт} называются эк- вивалентными, если каждый из векторов Ь; линейно выражается через а2, -^,ап и, наоборот, каждый из векторов а, линейно выра- жается через blf b2,..., Ьт. Это, очевидно, равносильно совпадению линейных оболочек: (a1,a2,...,an) = (b1,b2,...,bm). Поэтому ранги эквивалентных систем векторов равны. Из определения элементарных преобразований следует, что стро- ки матрицы А', полученной из матрицы А каким-либо элементар- ным преобразованием, линейно выражаются через строки матри- цы А. Но так как матрица А может быть получена из А' обратным элементарным преобразованием, то и, наоборот, ее строки линей- но выражаются через строки матрицы А'. Таким образом, системы строк матриц А и А' эквивалентны и, следовательно, ранги этих матриц равны. Этим можно воспользоваться для вычисления ранга матрицы.
§ 3. Ранг матрицы 69 Предложение 1. Ранг матрицы равен числу ненулевых строк лю- бой ступенчатой матрицы, к которой она приводится элементар- ными преобразованиями строк. Доказательство. Так как ранг матрицы не меняется при эле- ментарных преобразованиях, то нам достаточно доказать, что ранг ступенчатой матрицы равен числу ее ненулевых строк. Для этого, в свою очередь, достаточно доказать, что ненулевые строки ступен- чатой матрицы линейно независимы. Предположим, что линейная комбинация ненулевых строк сту- пенчатой матрицы (2) с коэффициентами А1э А2,...» Аг равна нулю. Рассматривая )гю координату этой линейной комбинации, нахо- дим, что =0, откуда Aj =0. Рассматривая, далее, )2-ю коор- динату с учетом того, что Aj = 0, находим, что А2а2;-2 = 0, откуда А2 = 0. Продолжая так дальше, получаем, что все коэффициенты Аь А2,..., Аг равны нулю, что и требовалось доказать. □ В частности, какую бы последовательность элементарных пре- образований, приводящих заданную матрицу к ступенчатому виду, мы ни выбрали, число ненулевых строк полученной ступенчатой матрицы будет одним и тем же. С учетом предложения 1 результаты, полученные в § 1 при ана- лизе ступенчатых систем линейных уравнений, приводят к следую- щим теоремам. Теорема 1 (теорема Кронекера—Капелли). Система линейных уравнений совместна тогда и только тогда, когда ранг матрицы ее коэффициентов равен рангу расширенной матрицы. Теорема 2. Совместная система линейных уравнений является определенной тогда и только тогда, когда ранг матрицы ее коэф- фициентов равен числу неизвестных. Следующая теорема является ответом на вопрос о «степени неопределенности» системы линейных уравнений, поставленный в §1. Теорема 3. Размерность пространства решений системы одно- родных линейных уравнений с п неизвестными и матрицей коэффи- циентов А равна п — rk А. Доказательство. Рассмотрим систему уравнений (4). С помо- щью элементарных преобразований приведем ее к ступенчатому виду. В силу предложения 1 число ненулевых уравнений в этом сту- пенчатом виде будет равно r = rkA. Поэтому общее решение будет содержать г главных неизвестных и с точностью до перенумерации
70 Глава 2. Начала линейной алгебры неизвестных будет иметь вид (ср. (3)) Г *1 = СП*г+1 + С12*г+2 + • • • + с1,п-гХп, • »2 = с21хг„ + С2Л+2 + ...+С2.._а, I CriXr+i 4" СГ2-^г+2 4“... 4* cr>n_rxn. Придавая по очереди одному из свободных неизвестных хг+1, хг^_2, значение 1, а остальным — значения 0, мы получим сле- дующие решения системы (4): Uj = (сц, с21,сг1,1, 0,0), и2 = (с12> с22> • • сг2> • • •> 0)> ип-г ~~ (с1,п-г> с2,п-г» •••> сг,л-г> 0, 0, 1). Докажем, что они составляют базис пространства решений, откуда и будет следовать утверждение теоремы. Для любых Аь А2,An_r G/С линейная комбинация u = AjUj 4-А2п2 4-... 4- An_run_r является решением системы (4), в котором свободные неизвестные имеют значения Ль А2,..., Ап_г. Так как значения главных неизвест- ных однозначно определяются значениями свободных неизвестных (по формулам (11)), то любое решение системы (4) является линей- ной комбинацией решений иъ u2iun_r- С другой стороны, если п = 0, то = А2 =... = Ап_г = 0; следовательно, ult u2iun_r линей- но независимы. □ Всякий базис пространства решений системы однородных линей- ных уравнений называется фундаментальной системой решений. Предыдущее доказательство дает практический способ построения такой системы решений. Ранг матрицы был нами определен как ранг системы ее строк. Посмотрим, что можно сказать о ранге системы столбцов. Для этого заметим, что линейная зависимость с коэффициентами Аь..., Ап между столбцами матрицы А означает, что (Аь ..., Ап) — это реше- ние системы однородных линейных уравнений с матрицей А. Эле-
§ 3. Ранг матрицы 71 ментарные преобразования строк матрицы А соответствуют элемен- тарным преобразованиям этой системы, при которых ее решения не меняются. Отсюда получаем Предложение 2. Линейные зависимости между столбцами мат- рицы не меняются при элементарных преобразованиях строк. Следствие. При элементарных преобразованиях строк матри- цы ранг системы ее столбцов не меняется. Доказательство. Линейная зависимость между какими-то столб- цами матрицы может пониматься как линейная зависимость между всеми ее столбцами, в которую остальные столбцы входят с нуле- выми коэффициентами. Следовательно, если какие-то столбцы мат- рицы линейно зависимы, то они останутся линейно зависимыми после любых элементарных преобразований строк. Так как элемен- тарные преобразования обратимы, то и наоборот: если какие-то столбцы матрицы линейно независимы, то они и останутся линейно независимыми. Значит, если какие-то столбцы матрицы составляют максимальную линейно независимую систему ее столбцов, то по- сле любых элементарных преобразований строк столбцы с теми же номерами будут составлять максимальную линейно независимую систему столбцов полученной матрицы, и поэтому ранг матрицы не изменится. □ Так как элементарными преобразованиями строк любую матри- цу можно привести к ступенчатому виду, то для нахождения ранга системы столбцов достаточно научиться это делать для ступенчатых матриц. Предложение 3. Ранг системы столбцов ступенчатой матри- цы равен числу ее ненулевых строк. Доказательство. Пусть А — ступенчатая матрица, число ненуле- вых строк которой равно г. Ясно, что при выкидывании нулевых строк линейные зависимости между столбцами сохраняются и, зна- чит, ранг системы столбцов не меняется. Поэтому можно считать, что у матрицы А нет нулевых строк, т. е. имеется всего г строк. Но тогда ранг системы ее столбцов не превосходит г (размерности пространства всех столбцов высоты г). Покажем, что столбцы, про- ходящие через ведущие элементы строк (углы ступенек), линейно независимы. Для этого рассмотрим систему однородных линейных уравнений с матрицей коэффициентов А. Наличие нетривиальной линейной зависимости между указанными выше столбцами означа- ло бы, что эта система имеет ненулевое решение, в котором все сво-
72 Глава 2. Начала линейной алгебры бодные неизвестные равны нулю, что невозможно. Следовательно, ранг матрицы А равен г. □ Так как ранг системы строк ступенчатой матрицы также равен числу ее ненулевых строк, то из доказанных предложений вытекает Теорема 4. Ранг системы строк любой матрицы равен рангу си- стемы ее столбцов. Иными словами, ранг матрицы не меняется при транспониро- вании. Проведенные рассуждения одновременно дают удобный способ нахождения максимальной линейно независимой системы столб- цов. А именно, если путем элементарных преобразований строк матрица А приведена к ступенчатому виду, в котором ведущие эле- менты ненулевых строк имеют номера jlf..., jr, то столбцы (исход- ной!) матрицы А с номерами составляют максимальную линейно независимую систему ее столбцов. Заметим, что эта про- цедура не дает способа найти максимальную линейно независимую систему строк матрицы А. Дело в том, что, хотя ранг системы строк при элементарных преобразованиях строк не меняется, линейные зависимости между строками (в отличие от столбцов) не сохраня- ются. Замечание 1. Элементарные преобразования столбцов матрицы определяются аналогично элементарным преобразованиям строк. Они равносильны умножению на элементарные матрицы справа. Из доказанного выше следует, что ранг матрицы не меняется и при элементарных преобразованиях столбцов. Теорема 5. Ранг произведения матриц не превосходит ранга каждого из множителей. Доказательство. Пусть А = (а,,), В = (bjfc) и АВ = С = (с^). Соглас- но определению умножения матриц cik = Zj aijbjk- j Рассматривая эти равенства при фиксированном i, мы видим, что i-я строка матрицы С есть линейная комбинация строк матрицы В с коэффициентами из i-й строки матрицы А. Следовательно, линей- ная оболочка строк матрицы С содержится в линейной оболочке строк матрицы В и, значит, rk С rk В. Аналогично, рассматривая те же равенства при фиксирован- ном к, мы видим, что к-й столбец матрицы С есть линейная ком-
§ 3. Ранг матрицы 73 бинация столбцов матрицы А с коэффициентами из к-го столбца матрицы В. Следовательно, линейная оболочка столбцов матрицы С содержится в линейной оболочке столбцов матрицы А и, значит, rkC^rkA. □ Задача 1. Доказать, что ранг суммы матриц не превосходит сум- мы их рангов. Привести пример, когда имеет место равенство. Рассмотрим отдельно случай квадратных матриц. Определение 2. Квадратная матрица А порядка п называется невырожденной, если гкА = п. Иными словами, матрица А невырожденна, если ее строки ли- нейно независимы, или, что эквивалентно, если ее столбцы линей- но независимы. Теорема 6. Квадратная система линейных уравнений определен- на (гл. е. имеет единственное решение) тогда и только тогда, когда ее матрица коэффициентов невырожденна. Доказательство. В самом деле, квадратная система линейных уравнений с матрицей коэффициентов А определенна тогда и толь- ко тогда, когда элементарными преобразованиями строк матрица А приводится к строго треугольному виду, т. е. когда rk А = п. □ Согласно общему определению обратного элемента в кольце с единицей (см. §1.3) матрицей, обратной матрице А, называется такая матрица А"1, что АА-1 = А-1А = Е. Если обратная матрица существует, то она единственна. Теорема 7. Квадратная матрица обратима тогда и только то- гда, когда она невырожденна. Доказательство. Из теоремы 5 следует, что произведение двух квадратных матриц может быть невырожденным, только если оба множителя невырожденны. Очевидно, что единичная матрица Е невырожденна. Поэтому всякая обратимая матрица невырожденна. Обратно, пусть матрица А невырожденна. Будем искать обрат- ную матрицу как решение матричного уравнения АХ = Е. Для эле- ментов к-го столбца матрицы X это дает систему линейных урав- нений с матрицей коэффициентов А и столбцом свободных членов, равным k-му столбцу матрицы Е. В силу невырожденности матри- цы А каждая из этих систем и, тем самым, исходное матричное уравнение имеет единственное решение. Обозначим решение этого матричного уравнения через В. Аналогично, рассмотрим матричное уравнение YA = E. Оно рав- носильно уравнению АТУТ = Е и потому также имеет единственное
74 Глава 2. Начала линейной алгебры решение (так как матрица Ат также невырожденна). Обозначим это решение через С. Пользуясь ассоциативностью умножения матриц, получаем В = (СА)В = С(АВ) = С. Таким образом, В = С — матрица, обратная матрице А. □ Доказательство этой теоремы дает и практический способ нахож- дения обратной матрицы. А именно, матрица, обратная невырож- денной матрице А порядка п, может быть найдена как решение мат- ричного уравнения АХ = Е, которое сводится к решению п систем линейных уравнений с общей матрицей коэффициентов А, столбцы свободных членов которых составляют матрицу Е. Эти системы мо- гут решаться одновременно методом Гаусса. После приведения мат- рицы коэффициентов к единичной матрице (что возможно в силу ее невырожденности) преобразованные столбцы свободных членов составят искомую матрицу А"1. Пример 1. Найдем матрицу, обратную к матрице Для этого проделаем следующие элементарные преобразования: 12 1 .3 5 0 0Л П 0 1J АО 1 -5 3 Таким образом, Замечание 2. На самом деле приведенное доказательство тео- ремы 7 доказывает следующее более сильное утверждение: если матрица А вырожденна, то ни одно из уравнений АХ = Е и YA = E не имеет решения, а если она невырожденна, то каждое из этих уравнений имеет единственное решение и эти решения совпадают. (Априори можно было бы допустить возможность, что одно из этих уравнений имеет решение, а другое не имеет.) § 4. Определители Вопрос о невырожденности квадратной матрицы или, что рав- носильно, о линейной независимости п векторов п-мерного прост- ранства в каждом конкретном случае можно решить приведением
§ 4. Определители 75 матрицы к ступенчатому виду элементарными преобразованиями строк. Однако представляет интерес нахождение общего условия, которому должны удовлетворять элементы матрицы для того, чтобы она была невырожденной. Поясним идею получения такого условия на примере геометрических векторов. Пусть I — ориентированная прямая на плоскости. Для всякого вектора а обозначим через /(а) его проекцию на I (взятую с со- ответствующим знаком). Из определения операций над векторами следует, что f(a + b) =f(a) + /(b) для любых векторов а, Ь, /(Ла) = Л/(а) для любого вектора а и любого числа Л. Всякая функция векторного аргумента, обладающая этими свой- ствами, называется линейной. Пара неколлинеарных векторов аь а2 GE2 называется ориенти- рованной положительно, если поворот от ai к а2 (на угол, мень- ший я) происходит в положительном направлении. Для любых векторов аь а2 обозначим через агеа(аъ а2) ориентированную пло- щадь параллелограмма, натянутого на эти векторы, т. е. площадь, взятую со знаком плюс, если пара {аъа2} ориентирована положи- тельно, и со знаком минус в противном случае; если векторы а} и а2 коллинеарны, то положим агеа(аъ а2) = 0. Величина [area^, а2)| может служить мерой линейной независимости векторов ах и а2. Функция агеа(аъ а2) векторных аргументов а2 и а2 обладает сле- дующими свойствами: 1) она линейна по aj и по а2; 2) агеа(а2, ат) = — агеа(а1эа2); 3) если {ег,е2} — положительно ориентированный ортонорми- рованный базис, то area^, е2) = 1. Последние два свойства очевидны. Для доказательства первого представим площадь параллелограмма как произведение основа- ния на высоту. Мы получим тогда area(a1,a2) = |a1|h2, где |aj—длина вектора ab a h2 — проек- ция вектора а2 на прямую, ортогональную аг (рис. 1). В силу сказанного выше h2 есть ли- нейная функция от а2. Отсюда следует линей- Рис. 1
76 Глава 2. Начала линейной алгебры ность агеа(аъа2) по а2- Аналогично, взяв за основание а2, можно доказать линейность по аР Свойств 1)—3) достаточно для вычисления агеаСа^ а2). Выразим векторы а1э а2 через положительно ориентированный ортонормиро- ванный базис {еь е2}: а1 =а11е1 + а12е2> а2 = а21е1 + а22е2- Тогда агеа(аь а2) = агеаСацв! + а12е2, а21ет + а22е2) = = ana2i агеа(еъ ej + апа22 агеа(ег, е2) + а12а21 area(e2, ej + + ai2a22 агеа(е2, е2) = Пц^22 — а 12а21 • Выражение апа22 - а12а21 называется определителем матрицы А = (ау) порядка 2. Из предыдущего следует, что векторы аг и а2 линейно независимы тогда и только тогда, когда определитель мат- рицы, составленной из их координат, отличен от нуля. Аналогичным образом можно доказать, что ориентированный объем volfaj, а2, а3) параллелепипеда, натянутого на векторы а2, а3, обладает следующими свойствами: 1) он линеен по каждому из трех аргументов а2, а3; 2) он меняет знак при перестановке любых двух аргументов; 3) если {ebe2,e3} — положительно ориентированный ортонор- мированный базис, то vol(eb е2, е3) = 1. (Тройка {а^а^ а3} считается ориентированной положительно, если поворот от к а2 со стороны а3 происходит в положительном направлении.) Пользуясь этими свойствами, можно получить следующее выра- жение для volCaj, a2i а3) через координаты векторов а1э а2> аз в поло- жительно ориентированном ортонормированном базисе (проделай- те это!): VoKflj, а2, а3) = ПцП22аЗЗ + а12а23а31 + а13а21а32 ~ ~ аиа23а32 ~ а13а22а31 — а12а21а33- Выражение, стоящее в правой части этого равенства, называется определителем матрицы А = (а^) порядка 3. Таким образом, векто- ры а2, а3 линейно независимы тогда и только тогда, когда опре- делитель матрицы, составленной из их координат, отличен от нуля.
§4. Определители 77 Определитель матрицы А = (а^) порядка 3 представляет собой алгебраическую сумму всевозможных произведений трех элемен- тов матрицы, взятых по одному из каждой строки и из каждого столбца. На рис. 2 схематически изображено, какие из этих произ- ведений берутся со знаком плюс и какие — со знаком минус. Определитель матрицы А обозначается либо через det А, либо путем замены круглых скобок, заключающих в себе матрицу, вер- тикальными чертами. Пример 1. cos a -sin а sin a cos а = cos2 a + sin2 a = 1. Пример 2. 12 3 4 5 6 7 8 9 = 1 • 5 • 9 + 2 • 6-7 + 3-4-8 — 3 • 5 • 7 —2 • 4-9 — 1 • 6 • 8 = = 45 4-84 + 96-105-72-48 = 0. В случае произвольной размерности и произвольного поля, ко- гда мы не располагаем такими понятиями, как площадь или объем, естественно попытаться ввести определитель как функцию, облада- ющую свойствами, аналогичными свойствам 1)—3). Дадим необхо- димые для этого определения. Пусть V — векторное пространство над произвольным полем К и /(аь а2,..., am) — функция от т векторов пространства V, прини- мающая значения в К, Определение 1. Функция а2,...»am) называется полилиней- ной (или, точнее, т-линейной}, если она линейна по каждому аргу- менту.
78 Глава 2. Начала линейной алгебры Например, линейность по первому аргументу означает, что Ж +<> «2. •••. ат) = ж> а2> •••> а.п) +/(<> а2> •••> ат)> f(Xalt а2,.... am) = Xf(a1, а2,ат). Определение 2. Полилинейная функция а2)..., ат} назы- вается кососимметрической, если при перестановке любых двух аргументов она умножается на — 1. Важное свойство кососимметрической полилинейной функции состоит в том, что, если только char К / 2, она обращается в нуль всякий раз, когда какие-либо два аргумента принимают одинако- вые значения. В самом деле, при перестановке этих двух аргументов значение функции не изменится, но, с другой стороны, оно должно умножиться на -1; следовательно, оно равно нулю. Замечание 1. Если char К = 2, то последнее свойство следует принять за определение кососимметричности. Докажем, что из него, наоборот, вы- текает кососимметричность в определенном выше смысле. Поскольку при проверке кососимметричности по каким-либо двум аргументам значения остальных аргументов следует считать фиксированными (хотя и любыми), достаточно рассмотреть случай билинейной (т. е. 2-линейной) функции. Пусть f — билинейная функция, обращающаяся в нуль при одинаковых значениях аргументов. Тогда для любых a, b е V имеем 0 = /(а + Ь, а4-Ь) =/(а, а) + /(а, b) + f(b, a) + f(b, b)=f(a, b) + f(b, а), откуда /(b, а) = -/(а, b). Теперь введем понятия, необходимые для описания явного ана- литического выражения определителя матрицы порядка п, подобно- го тем, которые были получены при п = 2 и 3. Последовательность (kb к2> •••Ли) чисел 1, 2,..., п, расположен- ных в каком-либо порядке, называется перестановкой из п элемен- тов. Так как кг может принимать п различных значений, к2 при за- данном кх может принимать п - 1 значений, к3 при заданных кг и к2 может принимать п - 2 значений и т. д., то имеется всего п(п — 1)(п — 2) •• 2 • 1 = п! перестановок из п элементов. Перестановка (1, 2,..., п) называется тривиальной. Замечание 2. Слово «перестановка» в математической литера- туре (в частности, в этой книге) иногда употребляется в общечело-
§ 4. Определители 79 веческом смысле как изменение порядка каких-либо объектов (на- пример, перестановка слов в предложении). Говорят, что пара чисел образует инверсию в заданной переста- новке, если большее из них стоит левее меньшего. Перестановка на- зывается четной (соответственно нечетной), если число инверсий в ней четно (соответственного нечетно). Наряду с этим определя- ется знак перестановки, равный 1, если перестановка четна, и — 1, если она нечетна. Знак перестановки (kb к2,кп) обозначается через sgn(kbk2, ...,kn). Пример 3. При п = 3 четные перестановки — это (1, 2, 3) (нет инверсий), (2, 3,1) (две инверсии) и (3,1, 2) (две инверсии), нечет- ные— (1, 3, 2) (1 инверсия), (3,2,1) (3 инверсии) и (2,1, 3) (1 ин- версия). Пример 4. Тривиальная перестановка не имеет инверсий и по- этому четна. Напротив, в перестановке (п, п — 1,..., 2,1) любая пара чисел образует инверсию. Поэтому число инверсий в этой переста- новке равно (mod 2), Следовательно, sgnfri, п -1,2,1) = = (-1)[п/21. Перемена местами двух элементов в перестановке называется транспозицией этих элементов. Предложение 1. При любой транспозиции четность переста- новки меняется. Доказательство. При транспозиции соседних элементов меня- ется взаимное расположение только этих элементов, так что число инверсий изменяется (увеличивается или уменьшается) на 1; сле- довательно, четность меняется. Транспозиция элементов i и ;, раз- деленных s другими элементами, может быть осуществлена путем 2$ + 1 последовательных транспозиций соседних элементов: снача- ла переставляем i со всеми промежуточными элементами и с j, за- тем переставляем j со всеми промежуточными элементами. Каж- дый раз знак перестановки будет меняться по доказанному выше. Так как это произойдет нечетное число раз, то в результате знак перестановки изменится на противоположный. □ Следствие. При п > 1 число четных перестановок из п элемен- тов равно числу нечетных.
80 Глава 2. Начала линейной алгебры Доказательство. Выпишем все четные перестановки и в каждой из них произведем транспозицию первых двух элементов. Тогда мы получим, причем по одному разу, все нечетные перестановки. □ Теперь мы в состоянии дать определение определителя квадрат- ной матрицы любого порядка. Определение 3. Определителем квадратной матрицы А = (а0) порядка п называется число detA= 2 sgn(kbk2, ...,кП)а1ка2к2...апкп. (12) (к„к2.к„) При п = 2 и 3 мы получаем выражения, приведенные в начале этого параграфа. Теорема 1. 1) Определитель является кососимметрической по- лилинейной функцией строк матрицы. 2) Всякая функция f на множестве квадратных матриц по- рядка п, являющаяся кососимметрической полилинейной функцией строк матрицы, имеет вид f(A.') = f(E') det А. В частности, если f(E) = 1, то f = det (гп. е. /(А) = det А для любой матрицы А). Доказательство. Будем обозначать через а1)а2)...,ап строки матрицы А. Если f — какая-либо функция на множестве матриц, то, рассматривая ее как функцию строк матрицы, будем писать /(А) =/(аъ а2>ап). 1) Линейность определителя по каждой из строк матрицы выте- кает из того, что для любого i его можно представить в виде detA = 2ayUj> j где и19 и2, ••>,ип не зависят от элементов i-й строки матрицы. Для проверки кососимметричности посмотрим, что происходит при перестановке i-й и ;-й строк матрицы. Разобьем множество всех перестановок на пары перестановок, получаемых друг из дру- га транспозицией к, и к;. Согласно предложению 1, произведения aik}a2k2---ankn> соответствующие перестановкам из одной такой па- ры, входят в выражение (12) с противоположными знаками. При перестановке i-й и j-й строк они меняются ролями и, следовательно, все выражение умножается на -1.
§ 4. Определители 81 Замечание 3. Если char К = 2, то кососимметричность следует пони- мать в смысле замечания 1. Ее доказательство в этом случае состоит в том, что в случае равенства i-й и j-й строк матрицы А члены выражения (12), соответствующие перестановкам каждой из описанных выше пар, взаимно уничтожаются. 2) Предположим, что f — полилинейная кососимметрическая функция строк матрицы. Пусть е1,е2, ...,еп — единичные строки. Тогда /(А)=/(аъа2, ...,an)=/(Eaik/kI,Ea2k2ek2, •••> Е ank/kn) = Ч к2 к„ 7 = Е а1к}а2к2'"апкц/(ек}> ек2> •••> ki,k2, ...,к„ В силу кососимметричности функции /, если какие-то два из чи- сел къ к2, ...Ли равны, то f(ek}f ек2>..., eki) = 0. Если все они различ- ны, то Ж,’ •••> ekn) = sgn(k1) к2,.... kn)/(eb .... en). В самом деле, если это равенство верно для какой-то перестанов- ки (кь к2,..., kn), то оно верно и для любой перестановки, получа- емой из нее транспозицией, так как при транспозиции обе части равенства умножаются на -1. Очевидно, что оно верно для три- виальной перестановки. Так как любую перестановку можно полу- чить из тривиальной последовательными транспозициями, то дока- зываемое равенство верно для любой перестановки. Учитывая, что /(еь е2,..., en) =f (Е), мы получаем доказываемое утверждение. □ При п 4 вычисление определителя непосредственно по фор- муле (12) в общем случае весьма затруднительно. Существуют зна- чительно более простые способы вычисления определителей. Они основаны на свойствах определителей, доказываемых ниже. Предложение 2. Определитель матрицы не изменяется при эле- ментарном преобразовании строк первого типа. Доказательство. Пусть, скажем, к 1-й строке матрицы А прибав- ляется 2-я строка, умноженная на с. Полученную матрицу обозна- чим через А'. Имеем (в обозначениях доказательства теоремы 1): det А' = det(a} 4- са2> а2,..., ап) = = det(a1,a2,..., ап) +cdet(a2, а2,..., ап) = det А. □
82 Глава 2. Начала линейной алгебры При перестановке двух стррк определитель, как мы знаем, умно- жается на -1, а при умножении какой-либо строки на число он умножается на это число. Таким образом мы можем проследить за изменением определителя при любых элементарных преобразова- ниях строк матрицы. Так как любую матрицу с помощью элемен- тарных преобразований строк можно привести к ступенчатому ви- ду, а всякая ступенчатая квадратная матрица является треугольной (но, может быть, не строго треугольной), то нам остается научиться вычислять определитель треугольной матрицы. Предложение 3. Определитель треугольной матрицы равен произведению ее диагональных элементов. Доказательство. Произведение диагональных элементов вхо- дит в выражение (12) определителя любой матрицы со знаком плюс, так как соответствует тривиальной перестановке. В случае треугольной матрицы все остальные члены этого выражения равны нулю. В самом деле, если /°, то kj^l, k2^2, ..., kn^n; но так как kj + k2 “Ь • • • “Ь = 1 + 2 4-... + п, то это возможно только при k2 = 1, k2 = 2, ..., кп = п. □ Помимо того, что они дают практический способ вычисления определителей, предложения 2 и 3 позволяют нам ответить на во- прос, ради которого мы и ввели понятие определителя. Теорема 2. Квадратная матрица А невырожденна тогда и толь- ко тогда, когда det А 0 0. Доказательство. С помощью элементарных преобразований строк приведем матрицу А к ступенчатому виду. Если при этом ис- пользовались элементарные преобразования второго или третьего типов, то определитель может измениться, но, во всяком случае, его равенство нулю или отличие от нуля сохранится. Матрица А невырожденна тогда и только тогда, когда полученная ступенчатая матрица является строго треугольной; но это равносильно тому, что ее определитель отличен от нуля. □ Продолжим изучение свойств определителей.
§ 4. Определители 83 Лемма 1. Пусть и О’ь•••> Jn) — произвольные пе- рестановки. Произведение ai}j}ai2j2---ainjn входит в выражение (12) определителя матрицы А со знаком sgn(i1? i2,in) sgnCjj, j2, jn\ Доказательство. Для того чтобы выяснить, с каким знаком вхо- дит в det А рассматриваемое произведение, нужно расположить его сомножители по порядку номеров строк. Этого можно достичь, по- следовательно меняя местами два сомножителя. При каждой такой перемене в перестановках, образуемых номерами строк и столбцов, одновременно происходят транспозиции, так что произведение их знаков не меняется. Таким образом, если полученное в результате произведение будет иметь вид &1к а^ ...апк > то sgn(k1; k2,.... kn) = sgn(i1, i2,.... in) sgnOb j2,jn), а это и означает, что рассматриваемое произведение входит в det А с указанным знаком. □ Теорема 3. det Ат = det А. Доказательство. Определитель матрицы Ат, как и определи- тель матрицы А, есть алгебраическая сумма всевозможных произве- дений п элементов матрицы А, взятых по одному из каждой строки и из каждого столбца. Единственное, за чем надо проследить, — это то, что одинаковые произведения входят в det А и det Ат с одинако- выми знаками. При переходе от матрицы А к матрице Ат у каждого элемента номера строки и столбца меняются местами, и, соот- ветственно, у каждого произведения, входящего в определитель, меняются местами перестановки, составленные из номеров строк и столбцов. Предыдущая лемма показывает, что при этом знак, с которым входит данный член в определитель, не меняется. □ Из этой теоремы следует, что всякое свойство определителей остается справедливым, если заменить в нем строки столбцами, а столбцы — строками. В частности, мы таким образом получаем Следствие. Определитель есть кососимметрическая полилиней- ная функция столбцов матрицы. Теорема 4 (об определителе матрицы с углом нулей). Пусть матрица А имеет вид Мо ?) где В и С — квадратные матрицы. Тогда det А = det В-det С.
84 Глава 2. Начала линейной алгебры Доказательство. При фиксированных В и D определитель мат- рицы А является кососимметрической полилинейной функцией ее последних строк и, тем самым, кососимметрической полилинейной функцией строк матрицы С. Согласно теореме 1, получаем отсюда det А = det • det С. Первый множитель, в свою очередь, при фиксированной матрице D является кососимметрической полилинейной функцией столбцов матрицы В, откуда det (о е) det (о е) ‘ det 5 — det В (поскольку матрица I Q Е 1 треугольная с единицами на диагона- ли). Ввиду теоремы 3 аналогичная формула верна и для матриц с пра- вым верхним углом нулей. Пример 5. Вычислим так называемый определитель Вандер- монда 1 Xi *1 ... х" 1 1 Х2 X2 ••• Х2~1 V(xlfx2, ...,хп) = Вычитая из каждого столбца, начиная с последнего, предыдущий столбец, умноженный на хь и применяя теорему 4, получаем У(хъх2> ...,хп) = 10 0 ... 0 1 х2—х1 х2(х2-х!) ... х2"2(х2-х1) 1 Хп-Хг хДХи-Xj) ... х" 2(хп-х}) = (х2 — х1)...(хп — x1)V(x2, ...,хп). Продолжая так дальше, в конце концов получаем VCq, х2,..хп) = П (х, ~Xj). (13) Пусть А — произвольная (не обязательно квадратная) матрица. Всякая матрица, составленная из элементов матрицы А, находящих- ся на пересечении каких-то выбранных строк и каких-то выбранных
§ 4. Определители 85 столбцов, называется подматрицей матрицы А. Подчеркнем, что выбираемые строки и столбцы не обязаны идти подряд. Определитель квадратной подматрицы порядка к называется ми- нором порядка к матрицы А. Иногда, допуская вольность речи, са- му квадратную подматрицу также называют минором. В частности, если А — квадратная матрица порядка п, то минор порядка п - 1, получаемый вычеркиванием i-й строки и j-ro столбца, называется дополнительным минором элемента и обозначается через Число Ay = (-l)i+>M17 называется алгебраическим дополнением элемента а1Г Смысл алгеб- раического дополнения ясен из следующей леммы. Лемма 2. an .. av ... a m 0 .. .. a0 ... 0 ani .. anj ... &nn (В левой части стоит определитель матрицы, полученной из матри- цы А = (atJ) заменой нулями всех элементов i-й строки, кроме а,;.) Доказательство. Поменяем местами i-ю строку со всеми преды- дущими строками и j-й столбец со всеми предыдущими столбцами. При этом мы будем i - 1 раз менять местами строки и j — 1 раз столбцы, так что определитель умножится на В результате получится определитель вида atj 0 . .. 0 au an . •• a in anj • • ^nn где в правом нижнем углу стоит дополнительный минор элемен- та а,;. По теореме об определителе матрицы с углом нулей этот определитель равен а^М^. С учетом предыдущего знака отсюда и по- лучается доказываемое равенство. □ Теорема 5. Для любой квадратной матрицы А det А S вцАц* j i
86 Глава 2. Начала линейной алгебры Первая из этих формул называется формулой разложения опреде- лителя по i-й строке, вторая — формулой разложения определителя по j-му столбцу. Доказательство. Так как каждый член выражения (12) для det А содержит ровно один элемент из i-й строки, то предыдущая лемма означает, что сумма тех членов, которые содержат а[;, равна а^А^. Отсюда вытекает формула разложения по строке. Аналогично дока- зывается формула разложения по столбцу. □ Замечание 4. Знаки (~l)l4j чередуются в матрице в шахматном порядке, причем на главной диагонали стоят плюсы. Пример 6. Вычисление определителя Д из примера 2 разложе- нием по 2-й строке дает 1 3 7 9 2 3 Д = -4 8 * +5 -6 = -4-(-6) + 5-(-12)-6-(-6) = 0. Пример 7. Вычислим определитель порядка п вида 2 1 0 ... 0 0 1 2 1 ... 0 0 Л 0 1 2 ... 0 0 Дп = О 0 0 ... 2 1 О 0 0 ... 1 2 Разлагая его по 1-й строке и затем второй из полученных определи- телей по 1-му столбцу, получаем 1 1 ... 0 0 0 2 ... 0 0 ДП = 2ДП_1 — ~2ДП_1 — Дп_2, 0 0 ... 2 1 0 0 ... 1 2 откуда Дп- " Дп-1 = Ап-1 - " ^п-2- Это означает, что последовательность (Дь Д2, Дз> •••) есть арифме- тическая прогрессия. Так как Дх = 2, Д2 = 3, то ее разность равна 1 и Дп = п + 1. Теорема 6. Для любых квадратных матриц А и В (одного по- рядка) det АВ = det А • det В.
§ 4. Определители 87 Доказательство. Легко видеть, что строки сь ..., сп матрицы АВ получаются из строк аь ..., ап матрицы А умножением на В: (i = l, ...,п). Отсюда следует, что при фиксированной матрице В определитель det АВ есть кососимметрическая полилинейная функция строк мат- рицы А. В самом деле, пусть, например, = а* + а", где а',а" — какие-то строки; тогда detfajB, а2В,..., апВ) =det((a' +а")В, а2В,..., апВ) = = det(a'B4-а"В, а2В,..., апВ) = = det(a'B, а2В,..., апВ) + det(a/1/B, а2В,..., апВ). Остальные свойства проверяются анало- гично. После этого, применяя следствие теоремы 1, получаем: det АВ = det ЕВ • det А = det А • det В. □ Пример 8. Выразим неориентирован- ный объем V параллелепипеда, натянуто- го на векторы аь а2, а3 GB3, через длины laiL la2b 1аз1 его ребер и плоские углы (см. рис. 3) Рис. 3 а1“а2а3> а2~ аЗа1» а3 —а1а2- Пусть А = (а,;) — матрица, составленная из координат векторов а, в ортонормированном базисе. Мы знаем (см. начало параграфа), что V = ± det А. Поэтому V2 = (det А)2 = det А • det Ат = det ААТ. Из правила умножения матриц следует, что (i, ;)-й элемент матри- цы ААТ есть скалярное произведение (аь ар = |aj|a;-| cos
88 Глава 2. Начала линейной алгебры Таким образом, V2 = |oj2 |a2||a]|cos a3 |а3||аа| cosa2 |a1||a2| cos a3 laj^l c°s «2 |a2l2 |a2||a3|cosa1 |a3||a2| cos O] |a3|2 = |a1|2|a2|2|a3|2 1 cos a3 cos a3 1 cos a2 cos a! cos a2 cos a] 1 и, значит, V = | a г I |a211 a 31 y/14- 2 cos cos a2 cos a3 — cos2 сц — cos2 a2 — cos2 a3. Задача 1. Угловым минором порядка к квадратной матрицы А называется определитель подматрицы порядка к, расположенной в левом верхнем углу матрицы А. Доказать, что если все угловые миноры матрицы А отличны от нуля, то ее можно привести к тре- угольному виду, добавив к каждой строке линейную комбинацию предыдущих строк. Вывести отсюда, что матрица А единственным образом представляется в виде А = UB, где U — нижняя треугольная матрица с единицами на диагонали, а В — верхняя треугольная мат- рица. § 5. Некоторые приложения определителей Как мы видели в предыдущем параграфе (теорема 4.2), опреде- лители дают ответ на вопрос о невырожденности (и, тем самым, об обратимости) квадратной матрицы, который служил нам поводом для их введения. Вариации на эту тему приводят к многочислен- ным приложениям определителей в теории линейных уравнений и теории матриц. Первые из таких приложений будут рассмотрены в этом параграфе. Рассмотрим квадратную систему линейных уравнений a 11 *1 + 012*2 + • • • + 01n*n = Ь1, 021*1 +022*2 + + ^2пХп=Ь2, (14) ani*i + an2*2 + • • • + ann*n = bn.
§ 5. Некоторые приложения определителей 89 Обозначим через А ее матрицу коэффициентов и через А( (i = 1, 2,... ..., п) матрицу, полученную из А заменой ее i-го столбца столбцом свободных членов. Теорема 1. Если det А / 0, то система (14) имеет единственное решение, которое может быть найдено по формулам Эти формулы называются формулами Крамера. Доказательство. При любом элементарном преобразовании си- стемы (14) в матрицах А и A, (i = 1, 2,..., п) одновременно происхо- дит соответствующее элементарное преобразование строк и, следо- вательно, отношения, стоящие в правых частях формул Крамера, не изменяются. С помощью элементарных преобразований строк мат- рицу А можно привести к единичной матрице. Поэтому достаточно доказать теорему в том случае, когда А = Е. Если А = Е, то система имеет вид ГХ1 =ЬЪ х2 =Ь2, < I *л ^л • Она, очевидно, имеет единственное решение х, = b, (i = 1, 2,..., и). С другой стороны, det A = detE = l, det А, = 1 0 ... bl ... 0 0 0 1 ... ь2 ... 0 0 0 0 ... Ь, ... 0 0 0 0 ... ь„-> ... 1 0 0 0 ... Ь„ ... 0 1 = b, так что формулы Крамера в этом случае действительно верны. □ Если det А = 0, то ступенчатый вид матрицы А не будет строго треугольным и, следовательно, система (14) либо несовместна, либо неопределенна. Опасно в этом случае пытаться как-то трактовать формулы Крамера. Они просто не применимы (ведь они доказыва- лись в предположении, что detA/O), и надо действовать как-то иначе.
90 Глава 2. Начала линейной алгебры Задача 1. Доказать, что если det А = 0, но det А,- / 0 для како- го-либо I, то система (14) несовместна. Задача 2. Показать, что если det А = det А! =... = det Ап = 0, то система (14) может быть как несовместной, так и неопределен- ной. (Привести примеры, показывающие, что обе возможности реа- лизуются.) Отметим, что формулы Крамера — это далеко не лучший способ для практического решения систем линейных уравнений, за исклю- чением, быть может, случая п = 2. Они имеют в основном теорети- ческое значение. В частности, они позволяют получить следующие явные формулы для элементов обратной матрицы. Теорема 2. Пусть А = (ai;) — невырожденная квадратная мат- рица. Тогда f Ац А21 ••• д-1 = 1 ^12 ^22 ••• Л12 det А .............. \Ain А2п • •• AnnJ (Через Ау обозначается алгебраическое дополнение к элементу см. §4.) Доказательство. Матрица А"1 является решением матричного уравнения АХ = Е. (15) Это уравнение рассыпается на п уравнений относительно столбцов Xlt Х2,Хп матрицы X: AXj=Ej, где Ej — j-й столбец матрицы Е. В координатной записи уравнение (15) представляет собой систе- му п линейных уравнений относительно элементов х1;, x2j, столбца Xj. Матрицей коэффициентов этой системы служит мат- рица А, а столбцом свободных членов — столбец Ej. По формулам Крамера all • .. 0 .. _ 1 X‘i det А a)l • .. 1 .. fl/П • .. 0 .. • ^nn = Aji det А J что и требовалось доказать. □
§ 5. Некоторые приложения определителей 91 Пример 1. Для невырожденной матрицы порядка 2 получаем Л-=-Лг( " Л ad-bc\-c а) Эту простую формулу имеет смысл запомнить. Задача 3. Пусть А — невырожденная целочисленная (т. е. состо- ящая из целых чисел) квадратная матрица. Доказать, что матрица А-1 является целочисленной тогда и только тогда, когда det А = ±1. Наконец, нахождение ранга любой матрицы также может быть сведено к вычислению определителей. Теорема 3 (о ранге матрицы). Ранг матрицы равен наибольше- му порядку ее миноров, отличных от нуля. Доказательство. Пусть ранг матрицы А равен г, и пусть s>r. Тогда любые s строк матрицы А линейно зависимы и, тем более, ли- нейно зависимы строки любой квадратной подматрицы порядка $, представляющие собой части соответствующих строк матрицы А. Следовательно, любой минор порядка s равен нулю. Далее, рассмот- рим подматрицу, образованную какими-либо г линейно независи- мыми строками матрицы А. Ее ранг, очевидно, также равен г и, значит, среди ее столбцов найдется г линейно независимых. Минор порядка г, образованный этими столбцами, не равен нулю. □ Задача 4. Доказать теорему о ранге матрицы в следующей бо- лее сильной форме: если в матрице А имеется минор порядка г, отличный от нуля, а все миноры порядка г +1, получаемые припи- сыванием к нему одной строки и одного столбца (так называемые окаймляющие миноры), равны нулю, то rkA = r. Задача 5. Доказать, что в матрице ранга г любой минор поряд- ка г, образуемый пересечением г линейно независимых строк с г ли- нейно независимыми столбцами, отличен от нуля.
Глава 3 Начала алгебры многочленов § 1. Построение и основные свойства алгебры многочленов Функция вещественной переменной х называется многочленом, если она может быть представлена в виде /(х) = а0 + Qi* + а2х2 4-... 4- апхп, где а0, alfa2,...»ап — какие-то вещественные числа (некоторые из них или даже все могут равняться нулю). Можно доказать, и мы это сделаем ниже в более общей ситуации, что такое представление единственно с точностью до приписывания членов с нулевыми ко- эффициентами, т. е. если aQ + a1x + a2x2 + ... + anxn = bQ + b1x + b2x2 + ...+bnxn VxgR, то ak = bk прик = 0,1,2, ...,п. Очевидно, что сумма и произведение многочленов, а также про- изведение многочлена на любое число, также являются многочле- нами. Это означает, что многочлены образуют подалгебру в алгеб- ре всех функций вещественной переменной (см. пример 1.7.3). Эта подалгебра называется алгеброй многочленов над R и обозначается Щх]. Из предыдущего следует, что многочлены 1, х, х2,... образуют базис алгебры R[x]. Таблица умножения для этого базиса выглядит весьма просто: xkxl = xk+l. Если попытаться аналогичным образом трактовать многочлены над любым полем К, то возникает трудность, состоящая в том, что формально различные многочлены могут быть тождественно равны при всех значениях переменной. Например, многочлены х и х2 над полем Z2 оба принимают значение 0 при х = 0 и 1 при х = 1. В то же время хотелось бы рассматривать их как разные многочлены.
§ 1. Построение и основные свойства алгебры многочленов 93 Выход состоит в формальном определении, при котором многочлен фактически отождествляется с последовательностью его коэффици- ентов. Рассмотрим векторное пространство К00 финитных последова- тельностей элементов поля К (см. пример 2.2.9). Условимся ну- меровать члены последовательностей, начиная с нуля, и пусть ек (к = 0,1, 2,...) обозначает последовательность, к-й член которой равен 1, а все остальные члены равны 0. Последовательности е0, еь е2> ••• образуют базис пространства К00. Превратим пространство №° в алгебру, определив умножение базисных векторов по правилу еке1~ек+1- Из коммутативности и ассоциативности сложения целых чисел сле- дует, что умножение базисных векторов, а значит, и любых элемен- тов полученной алгебры, коммутативно и ассоциативно. Элемент е0 является ее единицей. Эта алгебра называется алгеброй многочле- нов над К и обозначается К[х] (вместо х может использоваться любая другая буква). Для того чтобы перейти к привычному представлению многочле- нов, условимся, во-первых, отождествлять элементы вида ае0 (а е К) алгебры К [х] с соответствующими элементами поля К и, во-вторых, элемент ех обозначим через х (здесь проявляется роль выбранной буквы х). Тогда в соответствии с определением операций в К[х] мы получаем, что ек —хк и (а0, а2,ап, 0,...) = аоео + <№ + <¥2 + ••• + anen = = а0 + ajx + а2х2 +... + а„хп. Числа a0,alfa2,... называются коэффициентами многочлена. Последний из ненулевых коэффициентов называется старшим ко- эффициентом, а его номер — степенью многочлена. Степень много- члена f обозначается через deg/. Степень нулевого многочлена не определена, однако иногда удобно считать, что она равна — оо. Легко видеть, что deg(/ + g) max{deg /, deg g}, deg/g = deg/ + degg. (1) (2)
94 Глава 3. Начала алгебры многочленов Докажем, например, последнее равенство. Пусть / = a0 + aix + ... + anxn (a„#0), g = b0 + b1x +... + bmxm (bm/0). Тогда при перемножении f ng получается только один член степени п + гл, а именно, апЬтхп+т, а членов большей степени не получается вообще. Так как в поле нет делителей нуля, то апЬт 0 0 и, стало быть, deg/g = n + m = deg/ + degg. Предыдущее рассуждение показывает, что в алгебре К[х] нет делителей нуля. Из него же следует, что обратимыми элемента- ми в этой алгебре являются только многочлены нулевой степени, т. е. ненулевые элементы поля К. Замечание 1. Многочлен можно обозначать /(х) или просто /, если из контекста ясно, какой буквой обозначается «переменная». Замечание 2. Часто бывает удобнее располагать многочлен не по возрастающим, а по убывающим степеням х: / = aoxn +a1xn-1 +... +an_1x + a„. Замечание 3. В качестве К можно взять любое коммутативное ассоциативное кольцо с единицей (ср. замечание 1.8.1). В этом слу- чае все предыдущее остается без изменений, за исключением по- следней части, связанной с формулой (2), где нужно дополнительно потребовать, чтобы в кольце К не было делителей нуля. Замечание 4. Произведение финитных последовательностей (a0, ар а2,...) и (b0, blf b2,...) в кольце К[х] есть последовательность (с0, сп с2,...), члены которой находятся по формулам к ск = ^ Qibk-i- 1=0 Эти формулы имеют смысл и для любых (не обязательно финитных) после- довательностей. Таким образом получается коммутативная ассоциативная алгебра с единицей, называемая алгеброй формальных: степенных рядов над К и обозначаемая К [[х]]. Ее элементы обычно записывают как формаль- ные бесконечные суммы вида a0 + a1x + a2*2 + ••• Алгебра К[[х]], как и К[х], не имеет делителей нуля, но доказывается это по-другому (попробуйте это сделать!).
§ 1. Построение и основные свойства алгебры многочленов 95 Каждый многочлен f = aQ + a1x + a2x2 + ... + апхп (3) определяет функцию на К со значениями в К, значение которой в точке с G К по определению равно fM = а0 + а1с + а2с2 + ... + апсп. Так как сумма и произведение многочленов, а также произведение многочлена на число приводятся к каноническому виду (3) преобра- зованиями, использующими только свойства операций вК[х], спра- ведливые и в поле К, то мы придем к одному и тому же результату, сделав подстановку х = с до или после этих преобразований. Это означает, что (/ + ^) Сс) = /(с) 4- ^(с), (/g)(c) =/(c)g(c), (Л/)(с) = Л/(с), т. е. операции над многочленами приводят к таким же операциям над соответствующими функциями. Как мы показали на примере в начале параграфа, разные много- члены могут определять одну и ту же функцию. Оказывается, одна- ко, что такое возможно, только если поле К конечно. Теорема 1. Если поле К бесконечно, то разные многочлены над К определяют разные функции. Доказательство. Пусть многочлены f,g€K[x] определяют од- ну и ту же функцию. Тогда их разность h = f - g определяет нуле- вую функцию, т.е. h(c) = О для всех се К. Предположим, что /1^0, и пусть h = a0 + a1x + a2x2 + ... + an_1xn-1 (an_j/O). Возьмем различные хъ х2,..., хп е К (здесь используется бесконеч- ность поля К). Совокупность верных равенств 1а0 + ajXj + a2x2 +... + a^x"-1 = 0, ao + aiX2 + a2x2 + ... + an_ix£_1 = 0, a0 + aj xn + a2x2 +... + = 0 будем рассматривать как (квадратную) систему однородных линей- ных уравнений относительно a0,ai,a2, Определитель мат-
96 Глава 3. Начала алгебры многочленов рицы коэффициентов этой системы есть определитель Вандермонда V(xlfx2, ...,хп) (см. пример 2.4.5) и потому отличен от нуля. Сле- довательно, система имеет только нулевое решение, что противоре- чит нашему предположению. □ Замечание 5. Даже если поле К конечно, то множество всех мно- гочленов над К бесконечно (но счетно). Однако множество всех функций на К со значениями в К в этом случае конечно, и поэтому обязательно должны существовать разные многочлены, определяю- щие одну и ту же функцию. Тем не менее теорема 1 и ее доказа- тельство остаются в силе для многочленов, степень которых меньше числа элементов поля К. Задача 1. Так называемая задача интерполяции состоит в нахож- дении многочлена степени < п, принимающего в заданных (раз- личных) точках хг, х2,..хп G К заданные значения уг, у2, • • •> Уп € К- (В частности, при п = 2 это называется линейной интерполяцией.) Доказать, что задача интерполяции имеет единственное решение при любых Хр х2,Хп И Ji, у2,.... уп. Деление одного многочлена на другой в обычном смысле слова в алгебре К[х], как правило, невозможно. Однако возможно так называемое деление с остатком, похожее на деление с остатком в кольце целых чисел. Теорема 2. Пусть f,g^ К[х], причем g 0. Тогда существу- ют такие многочлены q и г, что f = qg 4- г и либо г = 0, либо deg г < deg g. Многочлены q и г определены этими условиями одно- значно. Нахождение таких многочленов q и г и называется делением с остатком многочлена f на g. При этом q называется неполным частным, а г — остатком от деления f на g. Многочлен f делится на g в алгебре К[х] тогда и только тогда, когда г = 0. Доказательство. 1) Докажем возможность деления с остатком. Если deg f < deg g, то можно взять q = 0, г = /. Если deg f deg g, то q и г находятся обычной процедурой «деления уголком». А имен- но, пусть f = aQxn + a1xn~1 + ... + ап_1х + ап, g = boxm + b1xm~1 + ... + bm_-lx + bm, где а0, Ьо 0 0. Рассмотрим многочлен /i=/-?x—g. °0
§ 1. Построение и основные свойства алгебры многочленов 97 Его степень меньше, чем степень многочлена /. Если deg/x <degg, то мы можем взять q = ^xn-m, r=/v °0 В противном случае поступаем с многочленом так же, как с /. В конце концов мы получим такой многочлен q = сохп—т + cix"-"'-1 +... + сп_,п, что deg(/ — qg) < deg g. Это и будет неполное частное от деления f на g, а многочлен r = f — qg будет остатком. 2) Докажем, что многочлены q и г определены условиями теоре- мы однозначно. Пусть f = (hg + ri = q2g + r2, где deg < deg g и deg r2 < deg g. Тогда ri-r2 = (q2-qi)g и, если qi /q2, to degCrj - r2) = deg(q2 - q^ + deg g deg g, что, очевидно, неверно. Следовательно, qi = q2 и r2 = r2- □ Особое значение имеет деление с остатком на линейный дву- член х — с. В этом случае остаток имеет степень < 1, т. е. является элементом поля К, Таким образом, результат деления с остатком многочлена f нах —с имеет вид f (х) = (х - c)q (х) 4- г (г е К). Отсюда следует, что /Сс) = г, т. е. остаток равен значению многочлена / в точке с. Это утвержде- ние называется теоремой Безу. Деление с остатком на х — с осуществляется по замечательно простой схеме, называемой схемой Горнера. А именно, пусть аохп 4- ^х"-1 4-... 4- an-ix + ап = = (х - с)(ЬдХ0”1 + bi*"-2 4-... 4- Ьп_2х 4- Ьп_2) 4- г.
98 Глава 3. Начала алгебры многочленов Приравнивая коэффициенты при соответствующих степенях х, по- лучаем цепочку равенств ао = ^о> a1 = b1-cb0, а2 = ^2 “ с^1> an-i = bn_1-cbn_2, fln = r-cbn_1, откуда находим следующие рекуррентные формулы для Ьо, Ь3,... •••Л-i иг: Ьо = ао> bj = CZ1 4“ cbg, b2 = 0-2 cb^, Ьп-1 ~Gn-l + с^п-2> г = ап+Л-1- Исходные данные и результаты вычислений удобно расположить в виде таблицы: а0 <21 а2 ••• ап-1 ап С ьо Ьх Ь2 ~Ьн-х г Каждое число во второй строке этой таблицы, начиная с Ьь нахо- дится как сумма числа, стоящего над ним, и числа, стоящего слева, умноженного на с. В частности, это дает очень эффективный способ вычисления значений многочлена. Пример 1. Найдем значение многочлена / = 2х6 - Их4 - 19х3 - 7х2 + 8х + 5 в точке х = 3. По схеме Горнера получаем: 2 0 -11 -19 —7 8 5 3 2 6 7 2 -1 5 20 Таким образом, /(3) = 20.
§ 2. Общие свойства корней многочленов 99 § 2. Общие свойства корней многочленов Элемент с поля К называется корнелшногочлена f еК[х] (или соответствующего алгебраического уравнения /(х)=0), если /(с)=0. Из теоремы Безу (см. предыдущий параграф) следует Теорема 1. Элемент с поля К является корнем многочлена f G е/С[х] тогда и только тогда, когда f делится нах-с. Этим можно воспользоваться для доказательства следующей тео- ремы. Теорема 2. Число корней ненулевого многочлена не превосходит его степени. Доказательство. Пусть q —корень многочлена /. Тогда / = (х-с1)/1 (ЛеК[х]). Пусть с2 — корень многочлена j\. Тогда Л = (*-с2)/2 (ДсВД) и, значит, / = (х-с1)(х-с2)/2. Продолжая так дальше, мы в конце концов представим многочлен f в виде f = (х - q)(x - с2)...(х - cm)g, (4) где многочлен g G К[х] не имеет корней. Числа q, с2,..., ст — это все корни многочлена f. В самом деле, для любого с G К имеем /(с) = (с - q) (с - с2)... (с - cnl)g(c) и, так как g(c) 0 0, то /(с) = 0, только если с = ct для некоторого i. Таким образом, число корней многочлена f не превосходит т (оно может быть меньше т, поскольку не исключено, что среди чисел q, с2,..., ст есть одинаковые); но m = deg / - deg g $deg f. □ Замечание 1. Эта теорема фактически уже была нами доказана другим способом в процессе доказательства теоремы 1.1. С другой стороны, из нее можно получить доказательство теоремы 1.1, не использующее теории линейных уравнений. А именно, если различ- ные многочлены f и g над бесконечным полем К определяют одну
100 Глава 3. Начала алгебры многочленов и ту же функцию, то все элементы поля К являются корнями ненуле- вого многочлена h = f — g, что противоречит только что доказанной теореме. Доказательство предыдущей теоремы наводит на мысль, что некоторые корни правильнее было бы считать несколько раз. Этому можно придать точный смысл. Корень с многочлена / называется простым, если / не делится на (х — с)2, и кратным в противном случае. Кратностью корня с называется наибольшее из таких к, что / делится на (х - c)fc. Таким образом, простой корень — это корень кратности 1. Иногда удобно считать, что число, не являющееся корнем, — это корень кратно- сти 0. Очевидно, что с является корнем кратности к многочлена f тогда и только тогда, когда / = (x-c)*g, (5) где«(с)/0. Теперь мы докажем уточнение теоремы 2. Теорема 3. Число корней ненулевого многочлена с учетом их кратностей (т. е. если каждый корень считается столько раз, ка- кова его кратность) не превосходит степени многочлена, причем равенство имеет место тогда и только тогда, когда этот много- член разлагается на линейные множители. Доказательство. Перепишем равенство (4), объединив одинако- вые множители: f = (.x-c1)k'(.x-c2)k2...{x-cs)ksg (6) (ci,c2, ...,cs различны). Ясно, что c1,c2f >..tcs — это все корни мно- гочлена /. Далее, выделяя в (6) множитель (х — с,)^*, мы можем написать f = О - Ci'fihj, где /г, (с,) # 0. Следовательно, с, — корень кратности к,. Таким образом, число корней многочлена / с учетом их кратно- стей равно ki + k2 + --- + ks = deg/-deg g, откуда и вытекают все утверждения теоремы. □ Замечание 2. Условно считается, что многочлен нулевой степе- ни разлагается в произведение пустого множества линейных мно- жителей.
§ 2. Общие свойства корней многочленов 101 Если многочлен f = аохп 4- сцх'1-1 4-... 4- an-i* + ап разлагается на линейные множители, то это разложение может быть записано в виде f = а0(х-с1)(х-с2)...(х-сп), где сьс2, ...,сп — корни мно- гочлена f, причем каждый из них повторен столько раз, какова его кратность. Приравнивая коэффициенты при соответствующих степенях х в этих двух представлениях многочлена f, мы получаем следующие формулы Виета: а, с14-с24-...4-сп = --, ао а2 с1с24-с1с34-...4-сп_1сп = —, 0 C1C2...Cn = (-l)nJt. ао В левой части k-й формулы Виета стоит сумма всевозможных произ- ведений к корней многочлена f. С точностью до множителя (—1/ это коэффициент при хп~к в произведении (x-qXx-с2)...(х —сп). Пример 1. Комплексные корни 5-й степени из 1 ек = cos + i sin (к = 0,1,2,3,4) (рис. 1) суть корни многочлена х5 - 1. По первой из формул Виета их сумма равна нулю. Приравнивая нулю сумму их вещественных Рис. 1
102 Глава 3. Начала алгебры многочленов частей, получаем 2cos 5?+2cos ^ + 1 = 0. Пусть cos = х; тогда cos = 2х2 — 1, так что 4х2 + 2х —1 = 0, откуда „ 2л_ч/5-1 „ 4тг У5 + 1 C0ST-^~> COST =-----------“ Задача 1. Пусть п — простое число. Пользуясь задачей 1.5.2 и по- следней из формул Виета, доказать теорему Вильсона: (п-1)! = -1 (mod и). Многочлен f называется нормированным (или приведенным), ес- ли а0 = 1. Формулы Виета позволяют выразить коэффициенты нор- мированного многочлена через его корни (при условии, что число корней с учетом кратностей равно степени многочлена). Пример 2. Найдем нормированный многочлен 4-й степени f = х4 4- Qi x3 4- а2х2 4- а3х 4- а4, имеющий двукратный корень 1 и простые корни 2, 3. По формулам Виета —di = 14-14-24-3 = 7, а2 = 1-1 +1-24-1-34-1-24-1-34-2-3 = 17, -а3 = 1-1-24-1-1-34-1-2-34-1-2-3 = 17, а4 = 1-1-2-3 = 6. Таким образом, / = х4 —7х3 + 17х2 —17х + 6. Кратность корня многочлена может быть истолкована и другим способом, по крайней мере в случае char К = 0. Для этого нужно определить дифференцирование многочленов. Из правил дифференцирования функций вещественной перемен- ной следует, что производная многочлена есть также многочлен. Обозначим через D отображение алгебры Щх] в себя, ставящее в со-
§ 2. Общие свойства корней многочленов 103 ответствие каждому многочлену его производную. Отображение D обладает следующими свойствами: 1) оно линейно; 2) D(/g) = (D/)g4-/(Dg); 3) Dx = l. Эти наблюдения позволяют определить дифференцирование многочленов над любым полем К, когда определение производной, даваемое в анализе, не имеет смысла. Предложение 1. Отображение D: К[х] —>К[х], обладающее свой- ствами 1)—3), существует и единственно. Доказательство. Пусть D — такое отображение. Тогда DI =D(1 • 1) = (D1) • 1 +1 • (DI) = D14- DI, откуда DI = 0. Докажем по индукции, что Dxn = пхп-1. При п = 1 это верно по предположению, а переход от п - 1 к п делается выкладкой Dxn = D(xn~1x) = (Dxn”1)x4-xn-1(Dx) = (п - 1)хп”2-х 4-хп-1 = пхп"1. Тем самым отображение D однозначно определено на базисных век- торах 1, х, х2,..., а значит, и на всем пространстве К[х]. Обратно, построим линейное отображение D: К[х] —♦К[х], за- дав его на базисных векторах формулами Dl = 0, Dxn = nxn-1 (п = 1,2,...), и проверим, что оно обладает свойством 2). В силу линейности до- статочно проверить это свойство для базисных векторов. Имеем D (xmxn) = Dxm+n = (m + n)xzn+n"1, (Dxm)xn 4- xm (Dxn) = mxm~1xn 4- nxmxn-1 = (m 4- n)xm+n-1. □ Многочлен Df называется производной многочлена f и обозна- чается, как обычно, через f Сделав в многочлене f G К[х] замену х = с 4- у, где с G К, мы можем представить его в виде многочлена (той же степени) от у = х — с или, как говорят, разложить по степеням х - с: / = b0 + b1(x-c) + b2(x-c)2 + ... + bn(x-c)n. (7) Очевидно, что если с — корень многочлена /, то его кратность рав- на номеру первого отличного от нуля коэффициента этого разло- жения.
104 Глава 3. Начала алгебры многочленов Предложение 2. Если char К = 0, то коэффициенты разложения многочлена feK[x] по степеням х —смогут быть найдены по фор- мулам bk = ~kT- (Здесь /(к), как обычно, обозначает k-ю производную многочле- на/.) Доказательство. Продифференцируем равенство (7) к раз и под- ставим х = с. □ Таким образом, f=fM+m{x-c)+m{x-^+...+l^(x-cr. Эта формула называется формулой Тейлора для многочленов. Из формулы Тейлора и сделанного выше замечания следует Теорема 4. При условии, что char К = 0, кратность корня с мно- гочлена f^K[x] равна наименьшему порядку производной многочле- на /, не обращающейся в нуль в точке с. Следствие. При том же условии всякий k-кратный корень мно- гочлена f является (к - ^-кратным корнем его производной. Замечание 3. В случае char К > 0 кратность корня с может быть меньше указанного в теореме 4 числа. Более того, такого числа мо- жет вообще не существовать. Так, например, если п — простое чис- ло, то первая, а значит, и все последующие производные многочле- на хп eZn[x], имеющего п-кратный корень 0, являются нулевыми многочленами. В случае К = К теорема 4 позволяет истолковать кратность гео- метрически. А именно, если кратность корня с многочлена / G К[х] равна к, то вблизи точки с многочлен / ведет себя как b(x - с)к (Ь 0 0). Это означает, что его график в точке с при k = 1 просто пересекает ось х, а при k > 1 имеет с ней касание (к - 1)-го порядка. Кроме того, знак многочлена /(х) при прохождении точки с при нечетном к меняется, а при четном к не меняется (см. рис. 2). Коэффициенты разложения (7), а значит, и значения производ- ных многочлена / в точке с (в случае char К = 0) могут быть найде- ны последовательными делениями с остатком многочлена / на х - с. А именно, при первом делении получается остаток Ьо и неполное частное /1=b1+b2(x-c) + ... + bn(x-c)''-1; при делении Д на х — с получается остаток Ьг и т. д.
§ 2. Общие свойства корней многочленов 105 Рис. 2 Пример 3. Разложим указанным способом по степеням х - 2 многочлен f = x5- 5х4 + 7х3- 2х1 2 + 4х- 8ёЖ[х]. Последовательные деления с остатком на х - 2 будем проводить по схеме Горнера, используя строку результатов каждого деления как строку исходных данных для следующего деления: 2 1 -5 7-2 4 -8 1-31040 1 -1 -1 -2 0 1110 1 3 7 1 5 1 Таким образом, / = 7(х - 2)3 + 5(х - 2)4 + (х - 2)5.
106 Глава 3. Начала алгебры многочленов В частности, мы видим, что 2 — трехкратный корень многочлена f. Кроме того, /'"(2) == 3! • 7 = 42, /,v(2) = 4! • 5 = 120, /v(2) = 5! • 1 = 120. § 3. Основная теорема алгебры комплексных чисел Оценка сверху числа корней многочлена, полученная в предыду- щем параграфе, ничего не говорит о наличии хотя бы одного корня. И действительно, существуют многочлены положительной степени, не имеющие корней, например, многочлен х2 +1 над полем К ве- щественных чисел. Именно это обстоятельство послужило поводом для построения поля С комплексных чисел. Если бы и над полем С существовали многочлены положительной степени, не имеющие корней, это привело бы к необходимости его дальнейшего расшире- ния. Однако, к счастью, это не так. Это составляет содержание тео- ремы, которую называют основной теоремой алгебры комплексных чисел. Теорема 1. Всякий многочлен положительной степени над по- лем комплексных чисел имеет корень. Поле, над которым всякий многочлен положительной степени имеет хотя бы один корень, называется алгебраически замкнутым. Таким образом, теорема 1 означает, что поле С комплексных чисел алгебраически замкнуто. Существует несколько доказательств этой теоремы. Любое из них включает элементы анализа, так как оно должно как-то исполь- зовать определение поля вещественных чисел, которое не является чисто алгебраическим. Доказательство, приводимое ниже, является почти полностью аналитическим. Нам понадобится понятие предела последовательности ком- плексных чисел. Перед тем как дать соответствующее определение, напомним, что модуль |z| комплексного числа z есть длина вектора, изображающего это число. Отсюда следует, что |zj — z2| есть рассто- яние между точками, изображающими числа Zj и z2. Известные из геометрии неравенства показывают (см. рис. 3 и 4), что |Z1 +z2| $ |Zj| + |z2|, IlZil - |z2|| |Z1 -z2|. (Равенства могут иметь место, когда соответствующий треугольник вырождается в отрезок.)
§ 3. Основная теорема алгебры комплексных чисел 107 Определение 1. Последовательность комплексных чисел zk (k G GN) называется сходящейся к комплексному числу z (обозначение: zk —► z), если |zfc - z\ —► 0. Лемма 1. Пусть zk = xk + yki, z = x + yi (xk, yk) x, у G R). Тогда *к~*х <=> xk—*x и yk->y. Доказательство. Имеем (см. рис. 5) |zfc - z| = y|xk - x|2 + |yk - у I2, так что *к-** и ук-*у => zk-*z. Обратная импликация вытекает из неравенств lyk-yl^|zk-z|. □ Лемма2. zk-*z => |zfc|—»|z|. Доказательство следует из того, что l|Zk|-|z||^|zfc-z|. □ Лемма 3. zk —► z и tuk —> ш => zk + ivk z + w и zkivk —> zw. Доказательство такое же, как для последовательностей веще- ственных чисел: I(zk + wk) - (z + ip)| = |(zfc - z) + (wk - ip)| $ |zfc -z| + |u/k - ш| -► 0, |zfcwk - zw\ = |(zt - z)wk + z(wk - IP)| $ |zk - z||wfc| + |z||wk - w| -*0. □ Следствие. Пусть zk^> z и f G C[z] —любой многочлен. Тогда (Здесь мы допускаем вольность в обозначениях, обычную в ана- лизе, когда значение переменной обозначается так же, как сама переменная.)
108 Глава 3. Начала алгебры многочленов Определение 2. Последовательность комплексных чисел zk (k G GN) называется сходящейся к бесконечности (обозначение: zk —»сю), если -* 00 • Лемма 4. Из всякой последовательности комплексных чисел zk можно выбрать либо подпоследовательность, сходящуюся к некото- рому комплексному числу z0, либо подпоследовательность, сходящу- юся к бесконечности. Доказательство. Если последовательность модулей чисел zk неограниченна, то из нее можно выбрать подпоследовательность, сходящуюся к бесконечности; но тогда соответствующая подпосле- довательность самих чисел zk согласно определению будет стре- миться к бесконечности. Пусть теперь последовательность модулей ограниченна, т. е. су- ществует такое С > 0, что Vk. Представим zk в алгебраической форме: zk = xk + yki. Тогда \xk\^\zk\^C, \yk\Ш1^С. По теореме Больцано—Вейерштрасса из последовательности хк можно выбрать сходящуюся подпоследовательность. Перейдя к этой подпоследовательности и изменив обозначения, можно считать, что —*о- Аналогичным образом, перейдя еще раз к подпоследовательности, можно считать, что Ук~*Уо- Но тогда по лемме 1 zk^zo = xo + yoi. □ Лемма 5. Если zk <х> и f е C[z] —многочлен положительной степени, то f(zk} —> оо. Доказательство. Пусть / = aozn + ajz'1-1 +... + a„_jZ + ап (a0 / 0);
§ 3. Основная теорема алгебры комплексных чисел 109 тогда |/(Z)t)| = |Z(t|" a0 + ^ + ... + ^ + J. Zk Zk Zk Сумма, стоящая под знаком модуля, стремится к а0, так как все сла- гаемые, кроме а0, стремятся к 0. Так как |zfc|" оо, то и |/(zfc)| -* оо. □ Следующая лемма является ключевой для доказательства основ- ной теоремы. Лемма 6 (лемма Даламбера). Пусть f G C[z] —многочлен поло- жительной степени и f(zo)^O. Тогда сколь угодно близко к z0 мож- но найти такое z, что |f (z)| < |/(z0)|. Доказательство. Разложим f по степеням z - zQ и разделим на /(z0). Учитывая, что несколько первых коэффициентов разложения, следующих за свободным членом, могут оказаться равными нулю, запишем результат в виде = 1 + ср (z - г0)р + ср+1 (г - г0)р+1 +... + сп (г - г0)п (ср / 0). Нам нужно доказать существование такого z, что f(z) /Ы <1. Идея доказательства состоит в том, что, если выбирать z достаточно близким к z0, выполнение этого неравенства будет зависеть только от суммы первых двух членов предыду- щего разложения. Будем искать z в виде z = z0 4- tzx (см. рис. 6), где t G (0,1), a zT — ком- плексное число, удовлетворяющее усло- вию cpz? = — 1. Имеем тогда -^=i-tp+tp+im где <р — некоторый многочлен степени п - р - 1 (с комплексны- ми коэффициентами). Если С — максимум модулей коэффициентов многочлена (/?, то |(p(t)|$A=(n-p)C
no Глава 3. Начала алгебры многочленов и, следовательно, /(z) Ж) 1 - tp + Atp+1 = 1 - tp(l - АО < 1 npHtcl/A. □ Доказательство теоремы 1. Пусть f G С [и] — многочлен поло- жительной степени. Положим M = inf |/(z)|. z Из определения нижней грани следует, что существует такая после- довательность комплексных чисел zk, что 1/(ик)НМ. (8) Перейдя к подходящей подпоследовательности, мы можем со- гласно лемме 4 считать, что либо zk -* со, либо zk —> zQ G С. В первом случае в силу леммы 5 мы придем в противоречие с (8). Во втором случае /(zfc) —(и0) и по лемме 2 Если М > О, то лемма Даламбера приводит нас в противоречие с определением М. Следовательно, М = 0, т. е. /(z0) = 0. □ Следствие 1. В алгебре С[х] всякий ненулевой многочлен разла- гается на линейные множители. В самом деле, в силу доказанной теоремы многочлен g в разло- жении (4) должен иметь нулевую степень, т. е. быть просто числом. В силу теоремы 2.3 получаем отсюда Следствие 2. Всякий многочлен степени п над С имеет п корней (с учетом кратностей). § 4. Корни многочленов с вещественными коэффициентами Многочлен степени п с вещественными коэффициентами может иметь < п (в частности, вообще не иметь) вещественных корней, но, как и всякий многочлен с комплексными коэффициентами, он всегда имеет ровно п комплексных корней (с учетом кратностей). Мнимые корни многочлена с вещественными коэффициентами об- ладают специальным свойством.
§ 4. Корни многочленов с вещественными коэффициентами 111 Теорема 1. Если с — мнимый корень многочлена /е!К[х], то с также является корнем этого многочлена, причем той же кратно- сти, что и с. Доказательство. Пусть / = аохп + а1хп-1 + ... + а,1_1х + а„ (а0,а1; ...,a„eR). Если /(с) =0, то, поскольку комплексное сопряжение является авто- морфизмом поля С (см. § 1.4), f(c) = аосп Ч-а^Н"1 +... + ап_!с + ап = = аосп+а1Сп-1 + ... + ап_1с + ап=/(с) = б = О, т. е. с — также корень многочлена f. Аналогично доказывается, что fk\c) = Q <=> /(к)(с) = 0. Следовательно, кратности корней с и с одинаковы. □ Следствие. В алгебре R[x] всякий ненулевой многочлен разлага- ется на линейные множители и квадратичные множители с отри- цательным дискриминантом. Доказательство. Заметим, что если с — мнимое число, то квад- ратный трехчлен (х - с) (х - с) = х2 - (с + с)х + сс имеет вещественные коэффициенты; его дискриминант, очевидно, отрицателен. Пусть теперь с1> •••> Cs> •••> Cs+P С$+1> •••> — это все (различные) комплексные корни многочлена /ей[х], причем Если кратность корня с, равна kit то / = a0(x-c1)fc’...(x-cs)fc*x х [(х - cs+i) (х - cs+1)]fcjtl... [ (х - cs+t) (х - cJ+t)]fc>+‘, (где a0 — старший коэффициент многочлена /). Перемножая ли- нейные множители в квадратных скобках, получаем искомое разло- жение. □
112 Глава 3. Начала алгебры многочленов Пример 1. х5 - 1 = (х- 1)(х- (cos + i sin (х- (cos - i sin х = (х -1)(х2 — 2х cos +1) (х2 - 2х cos +1) = = (х-1)(х2-^х + 1)(х2 + ^х + 1) (см. пример 2.1). Пример 2. Для многочлена f из примера 2.3 разложение, о кото- ром идет речь, имеет вид / = (х-2)3(х2 + х+1). Из теоремы 1 также следует, что любой многочлен f е R[x] нечет- ной степени имеет хотя бы один вещественный корень. Впрочем, это легко доказать и по-другому. А именно, если старший коэффи- циент многочлена f положителен, то lim /(х) =+°о, lim У(х) = -о> ^-♦4-оо X-+-QO и, значит, многочлен f принимает как положительные, так и отри- цательные значения. По теореме о промежуточном значении непре- рывной функции отсюда следует, что в некоторой точке он обраща- ется в нуль. Понятно, что представляет интерес определение точного числа вещественных корней. Вычисляя значение многочлена в отдельных точках, мы можем обнаружить, что в каких-то точках а и b он при- нимает значения разных знаков. Отсюда следует, что в интервале (а, Ь) находится по меньшей мере один корень, а точнее — нечетное число корней (с учетом их кратностей). Таким образом мы можем оценить снизу число вещественных корней. Пример 3. Для многочлена f = х4 + х2 - 4х +1 находим у (0) = 1 > 0, /(1) = -1 < 0, /(2) = 13 > 0. Следовательно, f имеет корни в каждом из интервалов (0,1) и (1, 2). Нетрудно показать, что f (х) > 0 при х $ 0, а также при х 2. Следо- вательно, все вещественные корни многочлена f лежат в интервале
§ 4. Корни многочленов с вещественными коэффициентами 113 (О, 2). Однако точное их число остается неизвестным, так как в од- ном из интервалов (0,1) и (1, 2) может быть три корня. Существуют методы, которые в принципе позволяют определить как общее число вещественных корней любого многочлена с веще- ственными коэффициентами, так и число его корней в любом про- межутке числовой прямой. Однако их практическое применение связано с довольно большими вычислениями. Мы приведем здесь одну теорему, которая хотя и не всегда дает полный ответ, но зато не требует никаких вычислений. Она говорит не просто о числе всех вещественных корней, но о числе положительных (или отрица- тельных) корней и является обобщением следующего тривиального утверждения: если все коэффициенты многочлена неотрицательны, то он не имеет положительных корней. Для формулировки этой теоремы нам понадобится одно вспомо- гательное понятие. Пусть имеется конечная последовательность вещественных чисел aQ> <*1, <*2, •••, ап- Говорят, что на k-м месте в этой последовательности имеется пере- мена знака, если ак / 0 и знак числа ак противоположен знаку по- следнего из предшествующих ему ненулевых членов последователь- ности. (Если ак — первый из ненулевых членов последовательности, то на k-м месте перемены знака нет.) Теорема 2 (теорема Декарта). Число положительных корней (с учетом их кратностей) многочлена /€й[х] не превосходит числа перемен знака в последовательности его коэффициентов и сравнимо с ним по модулю 2; если же все (комплексные) корни многочлена f вещественны, то эти числа равны. Обозначим через N(f) число положительных корней многочле- на f и через L(f) число перемен знака в последовательности его коэффициентов. Очевидно, что эти числа не изменяются при умно- жении f на -1; поэтому всегда можно считать, что старший коэф- фициент многочлена f положителен. Кроме того, если 0 является k-кратным корнем многочлена /, то при делении f на хк эти числа также не изменяются; поэтому можно считать, что свободный член многочлена f отличен от нуля. Лемма 1. N(f) = L(f) (mod 2). Доказательство. Пусть f = aoxn + ayxn~'1 + ...+ап_-1х + а„ (а0 > 0, а„ /0).
114 Глава 3. Начала алгебры многочленов Тогда /(0) = ап и /(х) > 0 при достаточно больших х. Когда мы дви- гаемся вправо по числовой прямой, то при прохождении каждого простого корня /(х) меняет знак, а при прохождении к-кратного корня знак /(х) умножается на (—l)fc, т. е. как бы меняется к раз. Поэтому N(f) четно, если ап > 0, и нечетно, если ап < 0. То же самое можно сказать и об L(f). □ Лемма 2. N(/) N(/') +1. Доказательство. По теореме Ролля между любыми двумя корня- ми многочлена f лежит корень его производной. Кроме того, каж- дый к-кратный корень многочлена f является (к - 1)-кратным кор- нем его производной (следствие теоремы 2.4). Отсюда получаем, 4ToN(/')^N(/)-l. □ Лемма 3. L(/'KL(/). Доказательство очевидно. □ Число отрицательных корней многочлена f равно числу положи- тельных корней многочлена 7(х) = (-1)п/(-х). Лемма 4. L (/) + L (/) п = cfeg /. Доказательство. Коэффициенты многочлена f получаются из коэффициентов многочлена f попеременным умножением на ±1. Предположим вначале, что все коэффициенты aQ,a19 ...,ап много- члена f отличны от нуля. Тогда если на k-м месте в последовательно- сти а0, аь ..., ап имеется перемена знака, то на том же месте в после- довательности коэффициентов многочлена f перемены знака нет, и наоборот. Поэтому в этом случае £(/)+!(/) = и. В общем случае, когда среди коэффициентов а0>а19 ...,ап могут быть нули, при их замене произвольными числами, отличными от нуля, числа £(/) и L(J) могут только увеличиться. Так как после этого их сумма по доказанному станет равной п, то L(/) + £(/)$ и. □ Доказательство теоремы 2. Докажем неравенство N(/) ^L(/) индукцией по deg f. Если deg f = 0, то N(f) = L(f) = 0. Пусть deg f = = n > 0. Тогда deg f' = n - 1. Пользуясь леммами 2 и 3 и предположе- нием индукции, получаем N(f) N(/') +1 ^L(f) +1 ^К/) +1. Однако равенство N(/) = L(/) +1 невозможно ввиду леммы 1. Сле- довательно, N(f)
§ 4. Корни многочленов с вещественными коэффициентами 115 Пусть теперь известно, что все корни многочлена f веществен- ны. Мы можем считать, что 0 не является корнем. Имеем тогда в силу уже доказанного неравенства и леммы 4 n = N(/)+N(/)^L(/) + L(/)$n, откуда N (/) = £(/), □ Пример 4. Для многочлена f из примера 3 имеем L(/) = 2, так что 2. Но мы уже установили, что N(/) 2. Следовательно, Ш) = 2. Пример 5. Многочлен f = х2 - х + 1 не имеет положительных (и вообще вещественных) корней, но £(/) = 2, так что в этом случае N(/) <£(/). Применяя теорему Декарта к многочлену gM = /(c+rt=/w + ^+^ + ... + £^2< мы получаем информацию о числе корней многочлена f в проме- жутке (с, +оо). В частности, если все коэффициенты многочлена g неотрицательны, то он не имеет положительных корней (тривиаль- ный случай теоремы Декарта), а это означает, что все вещественные корни многочлена f не превосходят с. Пример 6. Найдем границы вещественных корней многочлена f = x5 - 5х3 - 10х2 + 2. Пользуясь схемой Горнера, вычислим /(3): 3 1 0 -5 -10 0 2 1 3 4 2 6 20 Мы видим, что У (3) = 20 > 0. Более того, все коэффициенты неполно- го частного оказались положительными. Поэтому все производные многочлена f при х = 3 также положительны (см. пример 2.3) и, значит, все его вещественные корни меньше 3. Рассмотрим теперь многочлен /(х) = -/(-х) = х5 - 5х3 + 10х2 - 2.
116 Глава 3. Начала алгебры многочленов Вычислим значения многочлена / и его производных при х = 1: 1 0 -5 10 0 —2 1 1 1 -4 6 6 4 1 2 -2 4 10 1 3 1 5 Мы видим, что /(1) = 4 > 0, /'(1) = 10 > О, /"(1) = 2 • 5 > 0. Значения следующих производных также положительны, поскольку последняя строка таблицы состоит только из положительных чисел. Следовательно, все вещественные корни многочлена f меньше 1, а это означает, что все вещественные корни многочлена f больше —1. Таким образом, все вещественные корни многочлена f лежат в интервале (—1, 3). Задача 1. Исследовав производную многочлена /, доказать, что многочлен f из предыдущего примера имеет только один отрица- тельный корень. Обратимся теперь к вопросу о приближенном вычислении кор- ней. Если известно, что многочлен /е К [х] имеет ровно один корень в каком-то интервале, то этот корень может быть в принципе най- ден с любой степенью точности с помощью вычисления значений многочлена в подходящим образом подобранных точках. Поясним это на следующем примере. Пример 7. Как мы показали (см. пример 4), многочлен f из при- мера 3 имеет ровно один корень в интервале (1,2). Найдем зна- чение этого корня с точностью до 0,01. Мы видели, что /(1) < 0. Вычисляя /(х) при х = 1,1; 1,2; 1,3, мы обнаруживаем, что /(1,2) < 0, /(1,3) >0. Следовательно, корень лежит в интервале (1,2; 1,3). Вычисляя /(х) при х = 1,21; 1,22; 1,23; 1,24; 1,25, находим, что /(1,24) < 0, /(1,25) >0. Следовательно, искомый корень лежит в интервале (1,24; 1,25). Конечно, существуют гораздо более совершенные методы при- ближенного вычисления корней. Они применимы к алгебраиче-
§ 5. Теория делимости в евклидовых кольцах 117 ским уравнениям любой степени, а некоторые из них — и к транс- цендентным уравнениям. Однако изложение этих методов выходит за рамки нашего курса: они относятся скорее к вычислительной математике, чем к алгебре. Замечание 1. Если многочлен имеет кратный корень, но его ко- эффициенты даны нам лишь приближенно, хотя бы и с любой сте- пенью точности, то мы в принципе не можем доказать наличие этого кратного корня, так как при сколь угодно малом изменении коэффициентов многочлена он может либо рассыпаться на простые корни, либо вообще перестать существовать. Так, в случае двукрат- ного корня мы никогда не сможем сделать выбор между ситуация- ми, изображенными на рис. 7, а), а в случае трехкратного — между ситуациями, изображенными на рис. 7, б). § 5. Теория делимости в евклидовых кольцах Разложение многочленов над С на линейные множители и мно- гочленов над R на линейные и квадратичные множители аналогич- но разложению целых чисел на простые множители. Для многочле- нов над произвольным полем также имеется подобное разложение, но его множители могут иметь любую степень. Задачу отыскания та- кого разложения можно рассматривать как обобщение задачи отыс- кания корней многочлена (которой она равносильна в случае много- членов над С). Она не имеет общего решения, пригодного для любо- го поля. В этом параграфе мы докажем единственность указанного разложения. Одновременно мы докажем единственность разложе- ния целого числа на простые множители — факт широко известный, но не доказываемый в средней школе. Для того чтобы охватить единым рассуждением оба случая, вве- дем некоторые общие понятия.
118 Глава 3. Начала алгебры многочленов Определение 1. Коммутативное ассоциативное кольцо с едини- цей и без делителей нуля называется целостным кольцом (или обла- стью целостности). Так, кольцо Z целых чисел и кольцо К [х] многочленов над лю- бым полем К являются целостными кольцами. Более того, кольцо многочленов над любым целостным кольцом также является целост- ным кольцом (см. замечание 1.3). Замечание 1. Кольцо, состоящее из одного нуля, не считается целостным. Пусть А — целостное кольцо. Говорят, что элемент a G А делится на элемент b G А (обозначение: а • Ь) или, иначе, что b делит а (обозначение: b | а), если существует такой элемент q G А, что а = qb. Элементы а и Ь называются ассоциированными (обозначение: а ~Ь), если выполняется любое из следующих эквивалентных условий: 1) Ь\а и а\Ь; 2) а = cb, где с — обратимый элемент. В следующем определении аксиоматизируется то общее, что есть у кольца многочленов над полем и кольца целых чисел, — возмож- ность деления с остатком. Определение 2. Целостное кольцо А, не являющееся полем, на- зывается евклидовым, если существует функция N: А\{0}— (называемая нормой), удовлетворяющая следующим условиям: 1) N(ab) N(a), причем равенство имеет место только тогда, когда элемент b обратим; 2) для любых а, b е А, где b 0 0, существуют такие q, г е А, что a = qb + r и либо г = 0, либо N(r) <N(b). Замечание 2. Условие 2) означает возможность «деления с остат- ком». Его единственности (т. е. однозначной определенности пары (q, г)) не требуется. Замечание 3. Вторая часть условия 1) на самом деле может быть выведена из остальных условий. В самом деле, пусть элемент b необ- ратим. Тогда а не делится на ab. Разделим а на ab с остатком: a = q(ab) + r. Так как г = а(1 -qb), то N(a)*SN(r)<N(ab).
§ 5. Теория делимости в евклидовых кольцах 119 Основными для нас примерами евклидовых колец являются коль- цо Z целых чисел и кольцо К[х] многочленов над полем К. В каче- стве нормы в первом случае можно взять модуль целого числа, а во втором — степень многочлена. Существуют и другие евклидовы кольца. Пример 1. Комплексные числа вида с = а + Ы, где a, b е Z, назы- ваются целыми гауссовыми числами. Они образуют подкольцо в С, обозначаемое через Z[i]. Кольцо Z[i] яв- ляется евклидовым относительно нормы W(c) = |c|2 = a2 + b2. В самом деле, очевидно, что N(cd) = = N(c)W(d) и, поскольку N(l) = 1, обра- тимые элементы кольца Z[i] —это эле- менты с нормой 1, т. е. ±1 и ±i. От- сюда следует, что выполнено условие 1) в определении евклидова кольца. Дока- жем возможность деления с остатком. Пусть с, d GZ[i], d 00. Рассмотрим целое гауссово число q, ближай- шее к j. Легко видеть, что | j - q| 1//2 (см. рис. 8). Положим r = c — qd. Тогда c = qd + r и N(r) = |c-qd|2=|^-q|2|d|4|N(d)<N(d). Задача 1. Доказать, что кольцо рациональных чисел вида 2~пт (гл G Z, п е Z+) является евклидовым. Определение 3. Наибольшим общим делителем элементов а и b целостного кольца называется их общий делитель, делящийся на все их общие делители. Он обозначается через (а, Ь) или НОД{а, Ь}. Наибольший общий делитель, если он существует, определен од- нозначно с точностью до ассоциированности. Однако его может не существовать. Например, элементы х5 и х6 в кольце многочленов без линейного члена не имеют наибольшего общего делителя. Теорема 1. В евклидовом кольце для любых элементов а, b суще- ствует наибольший общий делитель d, и он может быть представ- лен в виде d = au + Ъи, где и, и — какие-то элементы кольца. Доказательство. Если b = 0, Tod = a = a- l + b-0. Если а делится на Ь, то d = b = a- O + b- l. В противном случае разделим с остат- ком а на Ь, затем b на полученный остаток, затем первый остаток на
120 Глава 3. Начала алгебры многочленов второй остаток и т. д. Так как нормы остатков убывают, то в конце концов деление произойдет без остатка. Получим цепочку равенств: a = q1b + r1, b = q2ri+r2> Гп-2 = (1ПГп-1 + Гп, Гп-1=Чп+1Гп. Докажем, что последний ненулевой остаток гп и есть наибольший общий делитель элементов а и Ь. Двигаясь по выписанной цепочке равенств снизу вверх, получа- ем последовательно rn|rn-i, Гп|г„_2, .... ГП|Г1, гп|Ь, г„|а. Таким образом, гп —общий делитель элементов а и Ь. Двигаясь по той же цепочке равенств сверху вниз, получаем по- следовательно r1=au1 + bvl, r2 = au2 + bv2, r3 = au3 + bu3, rn = aun + bvn, где ub (i = 1,..., n) — какие-то элементы кольца (например, щ = 1, иг = —Qi). Таким образом, гп можно представить в виде аи + bv. Отсюда, в свою очередь, следует, что гп делится на любой общий делитель элементов а и Ь. □ Процедура нахождения наибольшего общего делителя, исполь- зованная в этом доказательстве, называется алгоритмом Евклида. Элементы a, b G А называются взаимно простыми, если (a, b) = 1. В этом случае, согласно доказанной теореме, существуют такие и, и G А, что аи + Ьи = 1. Перейдем теперь к вопросу о разложении на простые множи- тели.
§ 5. Теория делимости в евклидовых кольцах 121 Определение 4. Необратимый ненулевой элемент р целостного кольца называется простым, если он не может быть представлен в виде р = ab, где а и b — необратимые элементы. Иначе говоря, элемент р простой, если всякий его делитель ас- социирован либо с 1, либо с р. Простые элементы кольца Z в этом смысле — это числа вида ±р, где р — простое число. Простые элементы кольца К[х], где К — поле, по традиции на- зываются неприводимыми многочленами. Таким образом, неприво- димый многочлен — это такой многочлен положительной степени, который не может быть разложен в произведение двух многочленов положительной степени. Очевидно, что всякий многочлен первой степени неприводим. Из основной теоремы алгебры комплексных чисел вытекает, что неприводимые многочлены над С — это только многочлены первой степени, а из следствия теоремы 4.1 — что неприводимые многочле- ны над R — это многочлены первой степени и многочлены второй степени с отрицательным дискриминантом. В следующем парагра- фе мы обсудим вопрос о неприводимых многочленах над Q и, в част- ности, увидим, что они могут иметь любую степень. Пусть теперь А — любое евклидово кольцо. Лемма 1. Если простой элемент р кольца А делит произведение а1а2...ап, то он делит хотя бы один из сомножителей а19 а2,ап. Доказательство. Докажем это утверждение индукцией по п. При п = 2 предположим, что р не делит . Тогда (р, = 1 и, значит, существуют такие и, и G А, что ри = 1. Умножая это равенство на а2, получаем puaz + a^u^a^ откуда следует, что р делит а2. При п > 2 представим произведение а1а2...ап в виде а1(а2...ап). По доказанному р | или р | а2...ап. Во втором случае по предполо- жению индукции р | ait где i — один из индексов 2,..., п. □ Теорема 2. В евклидовом кольце всякий необратимый ненулевой элемент может быть разложен на простые множители, причем это разложение единственно с точностью до перестановки множи- телей и умножения их на обратимые элементы. Замечание 4. Говоря о разложении на простые множители, мы не исключаем разложения, состоящего только из одного множи- теля.
122 Глава 3. Начала алгебры многочленов Доказательство. Назовем необратимый ненулевой элемент а € € А хорошим, если он может быть разложен на простые множители. Предположим, что существуют плохие элементы. Выберем из них элемент с наименьшей нормой. Пусть это будет элемент а. Он не может быть простым. Следовательно, а = Ьс, где Ь и с — необрати- мые элементы. Имеем N(b) <N(a) и N(c) <N(a) и, значит, b и с — хорошие элементы; но тогда, очевидно, и а — хороший элемент, что противоречит нашему предположению. Таким образом, всякий необратимый ненулевой элемент кольца А может быть разложен на простые множители. Докажем теперь индукцией по и, что если а = Р1Р2--Рп = Ч1Ч2---Чт> (9) где Pi, q}- — простые элементы, то т = п и, после подходящей перену- мерации множителей, pt~q, при i = 1,2,..., п. Прип=1 это утверждение очевидно. Прип>1 имеем Pi\qiq2---<lm и по лемме 1 существует такой номер i, что рг | qr Тогда рг ~ qt. Можно считать, что i = 1 и pj =qP Сокращая равенство (9) на рь получаем Р2---Рл =Q2---Qm- По предположению индукции отсюда следует, что т = п и, после подходящей перенумерации, pt- ~ qL при i = 2,..., п. Тем самым утвер- ждение доказано. □ Следствие. Пусть а = р*1 ...pss — разложение элемента аеА на простые множители, причем р( pj при i И j. Тогда всякий дели- тель d элемента а имеет вид d = cp'1‘...p^ где 0 $ lj $ kj (i = 1,..., s), ас — обратимый элемент. Доказательство. Пусть a = qd. Разложим q и d на простые мно- жители. Перемножив эти разложения, мы получим разложение а на простые множители. Сравнив его с данным разложением, получим требуемый результат. □ Задача 2. Доказать, что в евклидовом кольце а) Ь | а, с | а и (Ь, с) = 1 => Ьс | а; б) с | ab и (Ь, с) = 1 => с | а. Задача 3. Наименьшим общим кратным элементов а и b целост- ного кольца называется их общее кратное (т. е. элемент, делящийся на а и на Ь), делящее все их общие кратные. Оно обозначается
§ 6. Многочлены с рациональными коэффициентами 123 через [а, Ь] или НОК{а, Ь}). Доказать, что в евклидовом кольце для любых элементов а, b существует наименьшее общее кратное [а, Ь], причем (а, Ь)[а, Ь] ~аЬ. Задача 4. В кольце Z[i] (см. пример 1) разложить на простые множители числа 2, 3 и 5 и подумать, в чем принципиальная раз- ница между этими тремя случаями. Известно, что простых чисел бесконечно много. Напомним рас- суждение, которое это доказывает. Предположим, что рь р2, •••, рп — это все простые числа. Тогда число PiP2---pn + 1 не делится ни на од- но из них, что, очевидно, невозможно. Точно такое же рассуждение показывает бесконечность числа нормированных неприводимых многочленов над любым полем К. Если поле К бесконечно, то этот результат не представляет интереса, так как в этом случае имеется бесконечно много нормированных многочленов первой степени. Однако если поле К конечно, то этот результат означает, что име- ются неприводимые многочлены сколь угодно высокой степени. На самом деле в этом случае имеются неприводимые многочлены любой степени. Задача 5. Перечислить неприводимые многочлены степеней 4 над полем Z2 и доказать, что существует ровно 6 неприводимых многочленов степени 5. § 6. Многочлены с рациональными коэффициентами Из однозначности разложения целого числа на простые множи- тели вытекает Теорема 1. Если многочлен f = aQxn 4- ajx”"1 4-... 4-ап_гх 4- ап € Z[x] имеет рациональный корень где u,veZ, (и, и) = 1, то и | ап, и | а0. Доказательство. Имеем 0 = уП/(“) =аоип +а1ип~'и 4-... 4-an_1uvn"1 + апип. Все слагаемые в правой части, кроме последнего, делятся на и. Сле- довательно, и последнее слагаемое должно делиться на и. Но так как и и и взаимно просты, то ап делится на и (см. задачу 5.2, б)). Аналогично доказывается, что а0 делится на и. □
124 Глава 3. Начала алгебры многочленов Следствие. Если нормированный многочлен с целыми коэффици- ентами имеет рациональный корень, то этот корень целый. Очевидно, что всякий многочлен с рациональными коэффициен- тами пропорционален многочлену с целыми коэффициентами. По- этому теорема 1 позволяет путем конечного числа испытаний най- ти все рациональные корни любого многочлена с рациональными коэффициентами. Конечно, таких корней, как правило, нет. Приво- димый ниже специально подобранный пример относится к разряду тех исключений, которые подтверждают правило. Пример 1. Рациональными корнями многочлена f = 2x4 - 7х3 + 4х2 - 2х - 3 согласно теореме 1 могут быть только ±|, ±1, ±|, ±3. Испытания дают 2 корня: Xi = 3, х2 ~ ~~ 2 * Следующая теорема может рассматриваться как обобщение тео- ремы 1. Теорема 2 (лемма Гаусса). Если многочлен с целыми коэффици- ентами разлагается в произведение двух многочленов с рациональ- ными коэффициентами, то он разлагается в произведение двух про- порциональных им многочленов с целыми коэффициентами. Иначе говоря, если f G Z[x] и f = gh, где g, h G Q[x], то существу- ет такое AgQ*, что Ag, A“1hGZ[x]. Перед тем, как доказывать эту теорему, введем некоторые вспо- могательные понятия. Многочлен f G Z[x] называется примитивным, если его коэф- фициенты взаимно просты в совокупности, т. е. не имеют общего простого делителя. Если такой делитель есть, то его можно вынести за скобки. Поэтому всякий ненулевой многочлен с целыми коэффи- циентами, а значит, и всякий ненулевой многочлен с рациональны- ми коэффициентами, пропорционален некоторому примитивному многочлену (определенному однозначно с точностью до умножения на ±1). Пусть р — какое-нибудь простое число. Определим редукцию по модулю р многочлена f = aQxn 4- с^х”"14-... 4-ап_^х + ап G Z[x]
§ 6. Многочлены с рациональными коэффициентами 125 как многочлен [/]₽ = [а0]рл:п + [ajpx'’-1 +... + [a,i-i]px+ [an]peZp [х], коэффициенты которого суть вычеты по модулю р коэффициентов многочлена /. Из определения операций над вычетами следует, что [/+g]p = [/]p + [g]p, [/.?]₽ = [/]₽[£]₽ для любых многочленов /, g G Z[x]. Доказательство теоремы 2. Пусть f G Z[x] и f = gh, где g, h € €Q[x]. Согласно предыдущему, многочлены g и h пропорциональ- ны каким-то примитивным многочленам gj и Имеем / = Mgihi, geQ. Пусть где и, v е Z, (u, v) = 1. Докажем, что и = ±1, откуда будет следовать утверждение теоремы. Если это не так, то пусть р — какой-нибудь простой делитель числа v. В равенстве p/ = ugihi сделаем редукцию по модулю р. Мы получим 0=[u]p[g1]p[h1]p. Однако [ы]р /0, так как ин и по предположению взаимно просты. В то же время [gj]p 0 0 и [hT]р / 0, так как gj и /ц — примитивные многочлены и, следовательно, все их коэффициенты не могут де- литься на р. Это противоречит отсутствию делителей нуля в кольце Zp[x]. □ Следствие. Если многочлен feZfx] допускает разложение в про- изведение двух многочленов положительной степени в кольце Q[x], то он допускает такое разложение и в кольце Z[x]. Это существенно облегчает доказательство неприводимости многочленов над Q. Пример 2. Пусть р — простое число. Докажем неприводимость над Q «многочлена деления круга на р частей» / = хр-1+хр_2 + ...4-х + 1 = ^^. J х-1 (Комплексными корнями этого многочлена являются все нетриви- альные корни р-й степени из 1, которые вместе с 1 делят окруж-
126 Глава 3. Начала алгебры многочленов ность |z| = 1 на р равных частей.) Как следует из формулы бинома Ньютона (см. §1.5), в кольце Zp[x] имеет место равенство хр-1 = (х-1)р, так что [/]р = (х-1)р-1. Если / = gh, где g,heZ[x] — многочлены положительной степени, то [/]р = [g]p[h]p и, значит, [g]p = (x-l)fc, [h]p = (x-l)' (kJ>O,k + /=p-l). Следовательно, [g(l)]p = [g]p(D = 0, [hCl)]p = [h]p CD = 0, t. e. g(l) и h(l) делятся на p. Но тогда /(1) = g(l)h(l) делится на p2, что не соответствует действительности, ибо J(l) = р. Имеется способ, принадлежащий Кронекеру, который в принципе поз- воляет для любого многочлена с целыми коэффициентами определить, при- водим он или неприводим над Q. Он основывается на следующих соображе- ниях. Пусть f е Z[x] — многочлен степени и, не имеющий целых корней. Предположим, что он разлагается bZ[x] в произведение двух многочленов положительной степени: f=gh. Тогда степень одного из них, скажем, g, не превосходит т = [^] • Будем придавать переменной х различные целые значения х0, хь ..., хП1. Из равенств /(x,)=g(xl)h(xl) следует, что g(x,) |/(х,) при 1 = 0,1,..., т. Многочлен g однозначно опреде- ляется своими значениями в точках х0, хь ...,хпг Выбирая всевозможные наборы делителей d0, dlt..., dm целых чисел /(х0), /(хД ..., /(хш) и находя для каждого из них интерполяционный многочлен степени гп, принима- ющий в точках х0, хь ..., хП| значения dQidlf ...,dm, можно найти всех кан- дидатов на роль g (их будет конечное число). Те из них, которые имеют дробные коэффициенты, следует сразу отбросить. Испытав оставшиеся мно- гочлены, можно определить, имеются ли среди них делители многочлена /, в зависимости от чего и будет решен вопрос о приводимости последнего.
§ 7. Многочлены от нескольких переменных 127 § 7. Многочлены от нескольких переменных Функция вещественных переменных х1}х2, ...,хп называется многочленом, если она может быть представлена в виде /(Х1,Х2, ...,Xn) = S С10) к},к2,...,кц где суммирование в правой части происходит по конечному числу наборов (kb k2,kn) неотрицательных целых чисел. (Формально можно считать, что суммирование происходит по всем таким набо- рам, но лишь конечное число коэффициентов ак к2...кп отлично от нуля.) Многочлены образуют подалгебру в алгебре всех функций от х2,..., хп, Она называется алгеброй многочленов от х2,..., хп над R и обозначается R[xb х2,..., хп]. Можно показать (см. теорему 1 ниже), что представление много- члена над R в виде (10) однозначно, т. е. коэффициенты многочлена определяются его значениями. При определении алгебры многочленов от п переменных над любым полем К возникает такая же трудность, как и в случае одной переменной. Это приводит к необходимости формального определе- ния, которое может быть дано, например, следующим образом. Рассмотрим бесконечномерную алгебру над К с базисом {ek]k2...kn • ^1» ^2» •••» kn G. Z+} и таблицей умножения Очевидно, что эта алгебра коммутативна и ассоциативна и что эле- мент е00 0 является ее единицей. Она называется алгеброй много- членов над К и обозначается через х2,..., хп]. Условимся отождествлять элементы вида ае00 0 (а е К) с соответ- ствующими элементами поля К и введем обозначения е10...0 = х1> е01...0 = х2» е00...1 — хп‘ Тогда _________________________________________ к] к2 к ек1к2...к„=х1 ‘х2 2...х*"
128 Глава 3. Начала алгебры многочленов и любой элемент S akik2...knek}k2...k„ к},к2,...,кп записывается в обычном виде (10). Многочлен (10) называется однородным степени d, если %к2...1с„=0 при kj 4-k2 + ... + kn/d. Однородные многочлены заданной степени d образуют конечномер- ное подпространство, так как имеется лишь конечное число набо- ров (кь к2,кп) целых неотрицательных чисел, удовлетворяющих условию ki + к2 +... + кп = d. Задача 1. Доказать, что размерность пространства однородных многочленов степени d от п переменных равна rrd_ n(n + l)...(n + d-l) (число сочетаний с повторениями из п по d). Любой многочлен однозначно представляется в виде суммы од- нородных многочленов степеней 0,1,2,..., называемых его одно- родными компонентами. (Лишь конечное число из них отлично от нуля.) Степенью (по совокупности переменных) ненулевого многочле- на называется максимальная из степеней его ненулевых членов или, что то же самое, максимальная из степеней его ненулевых одно- родных компонент. Степень многочлена f обозначается через deg f. Справедливы следующие соотношения: deg(/ + g)^max{deg/,degg}, (11) deg(/g) = deg/ + degg. (12) Первое из них очевидно, второе мы докажем чуть позже. С другой стороны, каждый многочлен f е К[х1} х2,..., хп] одно- значно представляется в виде /(X1,X2) ...,Xn)= S Л(*2> •••.Xn)xf. (13) k=0
§ 7. Многочлены от нескольких переменных 129 где /0, /i, f2,... —какие-то многочлены от х2,...»хп, лишь конечное число которых отлично от нуля. Наибольший из номеров многочле- нов Д, отличных от нуля, называется степенью многочлена f по х} и обозначается через degX] /. Пользуясь представлением (13), можно рассматривать кольцо К[х1? х2, ...,хп] как кольцо многочленов от х2 с коэффициентами изК[х2, ...,хп]: К[хъх2, ...,хп]=К[х2,...,xn][xj. (14) Замечание 1. Мы говорим о кольцах, а не об алгебрах, так как по опре- делению К [хь х2, ...,х„] есть алгебра надК, вто время какК[х2,..., х„] [xj есть алгебра над К[х2, ...,хп]. Однако если рассматривать К[х2,..., xn][Xj] как алгебру над К (пользуясь тем, что К[х2,хп] ЭК), то можно говорить о равенстве алгебр. Предложение 1. Алгебра К[хъ х2,..., хп] не имеет делителей нуля. Доказательство. В §1 было фактически доказано (см. замеча- ние 1.3), что кольцо многочленов от одной переменной над целост- ным кольцом также является целостным кольцом (в частности, не имеет делителей нуля). Поэтому равенство (14) позволяет доказать наше утверждение индуктивным путем, начиная с поля К. □ Теперь мы в состоянии доказать соотношение (12). Разложим многочлены f и g на однородные компоненты: / = /o + /i + -+/d (deg fk = k, fd/0), £=£o+gi + •••+& (deggfc = k,ge#O). Ясно, что при их перемножении не появится членов степени > d + е, а сумма всех членов степени d + e будет равна fdge. По доказанному fdge / 0. Следовательно, deg/g = d + e = deg/ + degg. Как и в случае п = 1, всякий многочлен от п переменных над полем К определяет функцию на Кп со значениями в К. Теорема 1. Если поле К бесконечно, то разные многочлены от п переменных над К определяют разные функции. Доказательство. Как и в случае многочленов от одной перемен- ной (см. доказательство теоремы 1.1), достаточно доказать, что нену- левой многочлен определяет ненулевую функцию. Докажем это ин- дукцией по п.
130 Глава 3. Начала алгебры многочленов При п = 1 это составляет содержание теоремы 1.1. Предположим теперь, что многочлен f GK[xb х2,..., хп] (и > 1) определяет нуле- вую функцию. Представим его в виде (13) и придадим какие-то значения переменным х2, • Мы получим многочлен от одной переменной Xj с коэффициентами из К, обращающийся в нуль при любом значении хР По теореме 1.1 все его коэффициенты равны нулю. Таким образом, каждый из многочленов fk еК[х2) ..., х„] об- ращается в нуль при любых значениях х2,..., хп, т. е. определяет ну- левую функцию. По предположению индукции отсюда следует, что Д = 0 при любом к; но тогда и f = 0. □ Иногда бывает полезно следующее более сильное утверждение, которое легко выводится из доказанной теоремы. Следствие. Пусть поле К бесконечно и heK[xlf х2, ...,xj — ка- кой-либо ненулевой многочлен. Еслимногочлены/, g<EK[x}, х2,..., хп] принимают одинаковые значения при всех значениях переменных хг, х2,..., хп, при которых многочлен h не обращается в нуль, то они равны. Доказательство. При указанных условиях многочлены fh и gh принимают одинаковые значения вообще при всех значениях пе- ременных и, значит, fh = gh. Так как в алгебре многочленов нет делителей нуля (предложение 1), то отсюда следует, что f — g^ □ Замечание 2. Если поле К конечно, то теорема и ее доказатель- ство тем не менее остаются в силе для многочленов, степень кото- рых по каждому из переменных меньше числа элементов поля К (см. замечание 1.5). Задача 2. Доказать, что если поле К содержит q элементов, то функции, определяемые одночленами х*1...х*п с kb ...,kn<q, состав- ляют базис в пространстве всех функций на Кп со значениями в К. При и > 1 члены многочлена от п переменных нельзя, вообще говоря, однозначно упорядочить по их степеням, поскольку может быть несколько членов одинаковой степени. Между тем какое-то упорядочение иногда бывает полезно. В этих случаях обычно ис- пользуют лексикографическое (т. е. подобное упорядочению слов в словаре) упорядочение, при котором вначале сравниваются по- казатели при х15 затем, если они равны, показатели при х2 и т.д. Если одночлен и лексикографически старше одночлена и, то мы будем писать и >- и. Согласно определению, это означает, что первая из переменных, которая входит в и и и с разными показателями, входит вис большим показателем, чем в и.
§ 7. Многочлены от нескольких переменных 131 Предложение 2. Отношение лексикографического упорядочения одночленов обладает следующими свойствами: 1) если u^vuv^w, то и (транзитивность)} 2) если u^v, то иш>- vw для любого одночлена ш\ 3) если u1'^v1 ии2>- иъ то и1и2 >- и^. Первое из этих свойств, собственно, и дает основание называть отношение «^» упорядочением. Доказательство. 1) Пусть первая переменная, которая не вхо- дит во все одночлены и, и, ш с одним и тем же показателем, входит в них с показателями k, Z, т соответственно. Тогда k I гл, причем хотя бы в одном из двух случаев имеет место строгое нера- венство. Следовательно, к > т, а это и означает, что и >- ш. 2) При умножении на ш к показателям, с которыми каждая из переменных входит в и и и, добавляется одно и то же число, и знак неравенства (или равенства) между этими показателями не меня- ется, а только эти неравенства и имеют значение при сравнении одночленов. 3) Пользуясь предыдущим свойством, получаем иги2 '^v1u2'^v1 и2. □ Пример 1. Следующий многочлен расположен по лексикографи- ческому убыванию членов: х^х2 + х^Хз + 2x^2 + х2х% - х2х% + 3. Обратите внимание на то, что член хгх1х3 лексикографически млад- ше х^х2, хотя его степень больше. Среди ненулевых членов любого ненулевого многочлена f G G/С[хъх2, ...,хп] имеется единственный, который лексикографи- чески старше всех остальных. Он называется старшим членом многочлена /. Предложение 3. Старший член произведения ненулевых много- членов равен произведению их старших членов. Доказательство. Достаточно доказать это утверждение для двух многочленов. Пусть /ь/2— ненулевые многочлены, и2 — их старшие члены и Pj, v2 — какие-то их члены. Если / Uj или и2 / и2, то в силу предложения 2
132 Глава 3. Начала алгебры многочленов Следовательно, после приведения подобных членов в произведении /1/2 произведение щи2 сохранится в качестве ненулевого члена, ко- торый старше всех остальных. □ § 8. Симметрические многочлены Определение 1. Многочлен f eK[xlt х2,х„] называется сим- метрическим, если он не изменяется ни при каких перестановках переменных. Так как любая перестановка может быть осуществлена путем последовательных перестановок двух элементов, то многочлен яв- ляется симметрическим, если он не изменяется при перестановке любых двух переменных. Очевидно, что каждая однородная компонента симметрического многочлена также является симметрическим многочленом. Пример 1. Степенные суммы = + *2+ (k = l, 2,...), очевидно, являются симметрическими многочленами. Пример 2. Следующие симметрические многочлены называют- ся элементарными симметрическими многочленами: сг1=х1+х2 + --- + ^л, (Т2 = XjX2 + XjX3 + ... + Xn_iXn, °k= L оп=х1х2...хп. Пример 3. Определитель Вандермонда V(x1,x2) ...,х„) = П(х| -хР i>j (см. пример 2.4.5), представляющий собой произведение разностей всевозможных пар переменных, при перестановках переменных мо- жет только умножиться на ±1 за счет того, что в некоторых случаях уменьшаемое и вычитаемое поменяются ролями. Число таких слу-
§ 8. Симметрические многочлены 133 чаев равно числу инверсий в соответствующей перестановке. Сле- довательно, V(xki, хк2, = sgn(k1; k2,kJVCxj, x2).... xn). Таким образом, сам определитель Вандермонда не является симмет- рическим многочленом, но таковым является его квадрат У(хъх2>..хп)2 = П(х, - х})2. i>J Пример 4. При любых перестановках переменных хь х2, х3, х4 многочлены hi = XiX2 4- х3х4, h2 = XjX3 4- х2х4, h3 = хгх4 4- х2х3 переставляются между собой. Поэтому любой симметрический мно- гочлен от них будет симметрическим многочленом от хъ х2, х3, х4. В частности, таковым является их произведение hih2h3 = (XjX2 4- х3х4) (Х!Х3 + х2х4) (хтх4 4- х2х3). Задача 1. Доказать, что многочлен (Xi 4- х2 — х3 — х4) (Xj - х2 4- х3 - х4) (хг - х2 - х3 4- х4) является симметрическим. Симметрические многочлены находят применение в исследова- нии алгебраических уравнений с одним неизвестным благодаря формулам Виета (см. § 2), которые выражают элементарные симмет- рические многочлены от корней алгебраического уравнения через его коэффициенты (при условии, что число корней уравнения в рас- сматриваемом поле равно его степени). Ясно, что только симметри- ческие многочлены от корней уравнения однозначно определены: значение любого другого многочлена, вообще говоря, зависит от нумерации корней. С другой стороны, мы покажем, что любой симметрический многочлен от корней алгебраического уравнения может быть выражен через коэффициенты этого уравнения. Пример 5. Многочлен $2 = х* 4-х^ 4-... 4-х^ является симметри- ческим. Легко видеть, что s2 = cr2 -2сг2. (15) Поэтому сумма квадратов корней алгебраического уравнения хп 4- сцх'1”14- а2хп~2 4-... 4- ап_гх 4- ап = О равна а2-2а2.
134 Глава 3. Начала алгебры многочленов Очевидно, что сумма и произведение симметрических многочле- нов, а также произведение симметрического многочлена на число являются симметрическими многочленами. Иными словами, сим- метрические многочлены образуют подалгебру в алгебре всех мно- гочленов. Следовательно, если F € К[ХЬ Х2,Хт] — произвольный мно- гочлен от т переменных и Д, f2,..., fm € К [хь х2,..., х„] — какие-то симметрические многочлены, то F(flt /2,..., fm) —также симметри- ческий многочлен от хъ х2,..., хп. Естественно поставить вопрос, нельзя ли найти такие симметрические многочлены f2,..., fm> чтобы всякий симметрический многочлен можно было выразить через них указанным способом. Оказывается, что в качестве таких многочленов можно взять элементарные симметрические многочле- ны сгъ а2,..., сгп. Теорема 1. Всякий симметрический многочлен единственным об- разом представляется в виде многочлена от элементарных симмет- рических многочленов. Доказательству теоремы предпошлем две леммы. Лемма 1. Пусть и = ах^х^-.-Хп1 — старший член симметриче- ского многочлена f. Тогда k^k2^ ...^кп. (16) Доказательство. Предположим, что < ki+1 для некоторого i. Наряду с членом и многочлен f должен содержать член / к\ к'+1 к; к и =ax11...xi'+1xi;1...x^’, получающийся из и перестановкой х, и х1+1. Легко видеть, что и' >- и. Это противоречит тому, что и — старший член многочлена /. □ Лемма 2. Для любого одночлена и = х^х!^..^", показатели которого удовлетворяют неравенствам (16), существуют такие неотрицательные целые числа llf 12,..., lni что старший член много- члена совпадает с и. Числа 12,..., 1П определены этим условием однозначно. Доказательство. Старший член многочлена ак равен ххх2...хк. В силу предложения 7.3 старший член многочлена aj1 сг^2.. равен х'1 (XjXz)'2 • • • (*1Х2.. .хп)'" = х'1 +'2+-+1пх%+• • +'".. .x'j.
§ 8. Симметрические многочлены 135 Приравнивая его одночлену и, получаем систему линейных урав- нений Z14-Z24-...4-Zn = k1, Z2 + ... + /n = k2, In kn, которая, очевидно, имеет единственное решение i^k-k^i (i = 1,2,..., п — 1), Zn = kn. (17) Из условия леммы следует, что определенные таким образом числа 11, /2, • • •> 1п неотрицательны. □ Замечание 1. Уравнение l1+Z2 + ... + Zn = k1 показывает, что сте- пень одночлена X* Х^.-.Хп по совокупности переменных равна сте- пени одночлена и по хР Доказательство теоремы 1. Пусть f е К[х1,х2, ...,хп] — сим- метрический многочлен. Нам нужно найти такой многочлен F е eK[XlfX2i ...,Хп],что F(cr1Jcr2,...>CTn)=/. Если f = 0, то можно взять F = 0. В противном случае пусть = = ах^*22 ••••*£" —старший член многочлена /. По лемме 1 выполня- ются неравенства (16). По лемме 2 существует такой одночлен Ft е G Х[ХЪ Х2,..., Хп], что старший член многочлена F^dp сг2,..., сгп) равен Пр Рассмотрим симметрический многочлен f1=f-F1(ava2,...,(Tn). Если j\ = 0, то можно взять F = Fp В противном случае пусть и2 — старший член многочлена /р Ясно, что он младше, чем Up Существу- ет такой одночлен F2 еХ[Хр Х2,..., Хп], что старший член многочле- на F2(cTp сг2,..., сгп) равен и2. Рассмотрим симметрический много- член Л = /1-^2(Сг1.Ог2> Если f2 = 0, то можно взять F = F1+F2.B противном случае, продол- жая процесс, получаем последовательность симметрических много- членов /, /р /2,..., старшие члены которых удовлетворяют неравен- ствам
136 Глава 3. Начала алгебры многочленов По лемме 1 показатель при любой переменной в любом из одно- членов ит не превосходит показателя при jq в этом одночлене, а он, в свою очередь, не превосходит кР Поэтому для наборов показа- телей одночленов ит имеется лишь конечное число возможностей, так что описанный выше процесс должен оборваться. Это означа- ет, что fM = 0 для некоторого М. В качестве F можно тогда взять + F2 + ...+FM. Докажем теперь, что многочлен F определен однозначно. Пред- положим, что F и G — такие многочлены, что К(СГ1Э сг2,сгп) = G(cr1, сг2, Рассмотрим их разность Н = F - G. Тогда Жстьсгг, ...,сгп) = О. Нам нужно доказать, что Н = 0. Предположим, что это не так, и пусть НЪН2, — все ненулевые члены многочлена Н. Обо- значим через wt (i = 1, 2,..., $) старший член многочлена Н^сгъа2>„.,(jn)eK[xbx2, ...,хп]. В силу леммы 2 среди одночленов w2,ws нет пропорцио- нальных. Выберем из них старший. Пусть это будет и\. По по- строению одночлен и?! старше всех остальных членов многочле- на сг2,..., ап) и всех членов многочленов Hi(alJo‘2, (i = 2,Поэтому после приведения подобных членов в сумме сг2,<тп) + ЛгСо"!, ог2> •••> &п) + ••• + сг2,..., сгп) = = Н(сг1,сг2, ...,стп) член и\ сохранится, так что эта сумма не будет равна нулю, что противоречит нашему предположению. □ Замечание 2. Согласно замечанию 1, для любого т deg= degX)um $ degX) Uj = degXj /(= kJ. Следовательно, degF = degX)/. (18) Следуя доказательству этой теоремы, можно в принципе найти выражение любого конкретного симметрического многочлена че- рез (J11 сг2,..., (Jn.
§ 8. Симметрические многочлены 137 Пример 6. Выразим через <72,..., сгп многочлен / = $з = хЗ + хз+ . +х3 Представим вычисления в виде таблицы. т СГ2, ...» СГ„) f,n 1 О'3 = 52 *,3 + 3 52 xfxj + +6 S xixixk i<j<k -з52х2х,-б 52 x,xixk i<j<k 2 -3X1*2 -3<T1<72 = -3 52x,2Xj- -9 Xkxixixk з 52 x<xixk i<j<k 3 3X]X2x3 3<т3 = 3 S xixjxk i<j<k 0 Таким образом, $3 = CTj - + Зсг3 (19) На практике для однородных симметрических многочленов удоб- нее применять другой способ, который мы поясним на следующем примере. Пример 7. Выразим через cr1)a2ia3> сг4 многочлен / = 01*2 + *3*4) <*1*3 + *2*4) <*1*4 + *2*з) из примера 4. В обозначениях доказательства теоремы 1 имеем щ = = *2хз*4• Не производя вычислений, можно найти с точностью до коэффициентов возможных кандидатов на роль одночленов и2, и3,... Во-первых, их показатели должны удовлетворять неравен- ствам леммы 1. Во-вторых, поскольку f — однородный многочлен степени 6, сумма их показателей должна равняться 6. В-третьих, они должны быть младше uv Выпишем в таблицу все наборы по- казателей одночленов, удовлетворяющих этим условиям, в поряд- ке лексикографического убывания, начиная с набора показателей одночлена и1} а справа выпишем соответствующие произведения элементарных симметрических многочленов, найденные по форму- лам (17): _____________________ 3 111 2 2 2 0 2 2 11 b n b b к о о
138 Глава 3. Начала алгебры многочленов Итак, мы можем утверждать, что f = af а4 + асг^ + Ьсг2сг4. Для того чтобы найти коэффициенты а и Ь, будем придавать в этом равенстве переменным х1,х2,х3,х4 какие-нибудь выбранные зна- чения. Представим вычисления в виде таблицы, в правом столбце которой будем выписывать получаемые уравнения: *1 *2 *3 х4 СГ1 сг2 ст3 °4 f 1 1 1 0 3 3 1 0 1 а — 1 1 1 -1 -1 0 -2 0 1 8 —2Ь = 8 Таким образом, а = 1 и b = -4, так что / = afa4 + <72 -4а2а4. В случае неоднородного симметрического многочлена этот спо- соб можно применить к каждой его однородной компоненте и полу- ченные выражения сложить. Замечание 3. Изложенная теория без всяких изменений перено- сится на более общий случай, когда К — произвольное коммутатив- ное ассоциативное кольцо с единицей. Так, в случае К = Z получа- ется следующий результат: всякий симметрический многочлен с це- лыми коэффициентами представляется в виде многочлена с целыми коэффициентами от элементарных симметрических многочленов. Доказанная теорема в сочетании с формулами Виета позволя- ет найти любой симметрический многочлен от корней заданного алгебраического уравнения. А именно, пусть f G К[хъ х2,..., хп] — симметрический многочлен и F еК[Х1,Х2, ...,ХП] —такой много- член, что / = F(cr1> сг2>сгп). Пусть, далее, с2,..., сп — корни алгебраического уравнения аохп + а1хп~1 + ...+ап_1х + ап = 0 (а0 / 0). Тогда (20) ч uq a.Q а0 у Замечание 4. Пусть degXj f = к. Тогда degF = к (см. замеча- ние 2) и, домножив равенство (20) на aj, мы получим в правой части однородный многочлен степени к от а0, а1? а2,..., ап.
§ 8. Симметрические многочлены 139 Пример 8. Пусть сь с2, с3, с4 — корни уравнения х4 4- рх2 4- qx + г = 0. (21) Найдем уравнение 3-й степени, корнями которого являются числа ^1 =С1С2 ”^С3С4> ^2 = С1С3 + С2С4> ^3 = С1С4 + С2С3* Запишем его в виде у3 + а1у2 + а2у + а3 = 0. Согласно формулам Виета = ""(di 4-d2 4-d3), а2 = djd2 + ^1^3 + й2^з, g3 = — did2d3. Имеем di = h, (с1? с2, с3, с4), где hlt h2, h3 — многочлены из примера 4. Находим: hi + h2 + h3 = a2, h}h2 + h1h3 + h2h3 = £ xfxjxk=a1a3 -4cr4, j<k hih2h3 = a2a4 4- a2 - 4a2a4. (Последнее равенство есть результат примера 7.) По формулам Виета О’ 1 (сь с2» сз> сл)= ^2^1» с2> С3> С4^ =Р> Оз(сЪ С2, с3> с4) = “Ч» ОГ4(С1,С2>С3>С4) = Г- Следовательно, а3 = -р, a2 = -4r, a3 = 4pr-q2, т. е. искомое уравнение имеет вид y3-py2-4ry + (4pr-q2) = 0. (22) Задача 2. В обозначениях предыдущего примера доказать, что (с1 + с2-с3-с4)2 = 4(<11-р), (с1-с2 + с3-с4)2 = 4(d2 - Р), (сг - с2 - с3 + с4)2 = 4(d3 - р)
140 Глава 3. Начала алгебры многочленов и, кроме того, (Cj + с2 - с3 - с4)(q - с2 + с3 - с4) (q - с2 - с3 + с4) = —8q (23) (см. задачу 1). Пользуясь результатами этой задачи, можно свести решение уравнения (21) к решению уравнения (22) (при условии что char К 5^2). А именно, складывая с подходящими знаками равенства С1 + с2 + с3 + с4 - °, С1 + с2 - с3 - с4 = 2 x/dj-p, Ci - С2 + «3 - с4 = 2 yJd2~P> Cj — с2 — с3 + с4 = 2у53 — р, получаем 4,2,3,4 = | (±\Л*1-Р ± У<*2-Р ± ТЧз-р) . где число минусов должно быть четно. Исходные значения квадрат- ных корней здесь следует выбирать таким образом, чтобы их произ- ведение равнялось -q (см. формулу (23)). Уравнение (22) называется кубической резольвентой уравнения (21). § 9. Кубические уравнения При решении квадратных уравнений ключевую роль играет дис- криминант. По его обращению в нуль можно судить о наличии крат- ного корня, а по его знаку (в случае поля вещественных чисел) — о числе вещественных корней. Выясним смысл дискриминанта D((/?) квадратного трехчлена = aQx2 + аТх 4- а2 е С [х]. Пусть съ с2 — корни этого трехчлена. Тогда D(</)=a*-4aoa2 = a*[(^)2-^] = = a^[(ci+c2)2-4c1c2]=a2(ci -с2)2. В случае когда а0, аъ a2GR, полученная формула хорошо объяс- няет ту связь между дискриминантом и свойствами корней, о кото-
§ 9. Кубические уравнения 141 рой говорилось выше. А именно, имеются следующие три возмож- ности: 1) сь с2 G R, Cj / с2; тогда Cj — с2 — отличное от нуля веществен- ное число и > 0; 2) q = с2 G R; тогда q - с2 = 0 и = 0; 3) Cj = с2 R; тогда сх — с2 — отличное от нуля чисто мнимое число и <0. Что еще более важно, эта формула подсказывает, как можно определить дискриминант любого многочлена Ч> = аохп + ajx"-1 +... + an_jx + ап еВД (а0 / 0). Предположим вначале, что многочлен имеет п корней сь с2,... ..., спеК. Определим тогда его дискриминант по формуле 0(¥>)=а§"-2П(с<-с,)2. (24) i>j (Показатель при а0 не так важен; почему мы выбрали его именно таким, будет ясно из дальнейшего.) Иными словами, есть умноженное на а^п~2 значение сим- метрического многочлена (см. пример 8.3) /=П(^-^)2 i>j от корней многочлена (/?. Описанная в §8 процедура позволяет вы- разить D((/>) через коэффициенты многочлена (/?. Так как degX1/ = 2n-2, то в силу замечания 8.4 это выражение будет представлять собой некоторый однородный многочлен А степени 2п - 2 от а0, аг,ап: D(^) = A(a0,a1, ...,an). (25) Для нахождения многочлена А нет необходимости знать, что многочлен имеет п корней в К, Это позволяет определить дискри- минант любого многочлена по формуле (25). Замечание 1. Так как f имеет целые коэффициенты, то и А имеет це- лые коэффициенты (см. замечание 8.3). Замечание 2. Можно доказать (см. теорему 9.5.6), что для любого мно- гочлена (/? еВД степени п существует расширение L поля К, в котором имеет п корней. (Например, если K = R, то можно взять L = C.) Так как
142 Глава 3. Начала алгебры многочленов описанная выше процедура вычисления дискриминанта не зависит от того, над каким полем рассматривается многочлен <р (лишь бы его коэффициен- ты лежали в этом поле), то для £>((/?) будет справедлива формула (24), если в качестве сь с2,..., сп взять корни многочлена в поле L. Из определения (24) дискриминанта ясно, что многочлен G GC[x] имеет кратные корни тогда и только тогда, когда D(^) = 0. Это показывает, что наличие кратных корней является исключи- тельным обстоятельством: если выбирать коэффициенты многочле- на наудачу, то вероятность того, что он будет иметь кратные корни, равна нулю. Пусть теперь ip —кубический многочлен с вещественными коэф- фициентами и сь с2, с3 — его комплексные корни. Тогда О((/>) = а£(С1 - с2)2(cj - с3)2(с2 - с3)2. Имеются следующие три возможности (с точностью до перенумера- ции корней): 1) сь с2, с3 —различные вещественные числа; тогда D(c/?) > 0; 2) q,c2,c3€R, с2 = с3; тогда D((/?) = 0; 3) Cj G R, c2 = c3 R; тогда =Qq[(c! - c2)(Ci -c2)]2(c2 - c2)2 = OqIcj - c2|4(c2 - c2)2 < 0. Таким образом, мы приходим к тому же выводу, что и в случае квадратного трехчлена: все корни многочлена вещественны тогда и только тогда, когда D((/0 0. Задача 1. Доказать, что если — многочлен любой степени с ве- щественными коэффициентами, не имеющий кратных комплекс- ных корней, то sgnD(^) = (-l)f, где с — число пар комплексно-сопряженных мнимых корней много- члена (/?. Мы найдем теперь явное выражение дискриминанта кубическо- го многочлена через его коэффициенты, но перед этим сделаем некоторые общие замечания, позволяющие упростить вычисления. Любой многочлен можно нормировать, разделив на старший ко- эффициент, что не изменит его корней. Далее, любой нормирован- ный многочлен = хп 4- ajx”"14-а2хп~2 +... + an_Tx + ап
§ 9. Кубические уравнения 143 над полем нулевой характеристики (или, более общо, над полем, характеристика которого не делит п) с помощью замены приводится к многочлену Ф = у" + b2yn~2 + ... + bn_1y + bn, в котором коэффициент при уп-1 равен нулю. Многочлен такого ви- да называется неполным. При п = 2 именно таким способом получа- ется формула решения квадратного уравнения. При п > 2 эта замена не решает дела, но, во всяком случае, может упростить задачу. Найдем дискриминант неполного кубического многочлена 4>=x3 + px + q. (26) Следуя способу, изложенному в примере 8.7, будем искать выра- жение симметрического многочлена / = (*!- Х2)2(*1 ~ Х3)2(Х2 - Х3)2 через элементарные симметрические многочлены сг2, сг3. Много- член f является однородным степени 6, и его старший член равен х^х^. Выпишем наборы показателей старших членов симметриче- ских многочленов, которые могут встретиться в процессе, описан- ном в доказательстве теоремы 8.1, и соответствующие им произве- дения элементарных симметрических многочленов: 4 2 0 4 1 1 3 3 0 3 2 1 2 2 2 ^2 О'? о-з Мы видим, что f = ст* 0*2 + acr3 сг3 + bcr3 + со^о^Оз + da3. (27) Для вычисления D(</>) мы должны будем сделать в выраже- нии (27) подстановку о*1 = 0, <т2 = р, о-3 = -q. Поэтому коэффициенты а и с не будут влиять на окончательный результат, и мы можем их не находить.
144 Глава 3. Начала алгебры многочленов Для нахождения b и d будем в равенстве (27) придавать перемен- ным хь х2) х3 значения, указанные в следующей таблице, в правом столбце которой выписаны получаемые при этом уравнения: *1 *2 *3 О'] о2 ^3 / 1 -1 0 0 -1 0 4 —Ь = 4 2 -1 -1 0 -3 2 0 -27b + 4d = 0 Таким образом, b = —4, d = —27 и D(y>) = —4р3 —27q2. (28) Пример 1. Найдем число вещественных корней многочлена 4> = х3- О,3х2 - 4,3х + 3,9. С помощью замены у = х-0,1 приводим его к неполному многочлену (коэффициенты которого могут быть найдены по схеме Горнера, как в примере 2.3) i/>=y3 — 4,33у+ 3,468. Теперь D(<p) = = 4 • 4,333 - 27 • 3.4682 = 0,0013 > 0. Следовательно, многочлен у имеет 3 различных вещественных кор- ня. Замечание 3. Дискриминант кубического многочлена общего вида = aQx3 + агх2 + а2х + а3 равен D(y?) = a2a^ - 4а3а3 - 4а0а3 + 18а0а1а2аз ~ 27аоаз* Изложим теперь способ решения кубического уравнения. Предположим, что основное поле К содержит нетривиальный (т. е. отличный от 1) кубический корень из единицы, скажем, со. То- гда 1, со, со"1 —это все кубические корни из единицы, и по формуле Виета получаем со + со’^-1. (29)
§ 9. Кубические уравнения 145 Рассмотрим линейные многочлены hi + а>х2 + ^>-'1*з> ^2 = xi + о>“1х2 + ^>*з- При перестановке х2 и х3 они меняются местами, а при перестанов- ке и х2 многочлен переходит в a>h2, a h2 — в Отсюда следует, что многочлены / = h2 + h2, g = hih2 являются симметрическими. Выражая их через элементарные сим- метрические многочлены, получаем f = 2<Т1 — 9<т1сг2 + 27стз, £ = ст2-Зсг2. Пусть теперь сь с2, с3 — корни многочлена (26). Положим dj =Cj +сос2 + ы~1с3, d2 = Cj 4-co“1c2-i-a)c3. Из предыдущего следует, что d3 + dz = -27q, djd2 = -Зр и, значит, d3d3 = —27р3. Таким образом, d3 и d3 — это корни квадратного уравнения x2 + 27qx —27р3 = 0. Решая его, находим d?=27H + /i+?)- (30> d3=27(-|-/S+?)' (31) Заметим, что выражение, стоящее под знаком радикала, лишь мно- жителем — отличается от дискриминанта многочлена (26). Складывая равенства Ci + с2 + с3 = О, CiH- а>с2 + а>“1с3 = d1, c1d-a>“1c2d- coc3 = d2,
146 Глава 3. Начала алгебры многочленов с учетом соотношения (29) получаем С1 ~ з Wi Поскольку нумерация корней может быть произвольной, эта форму- ла на самом деле дает все три корня, если в качестве d} и d2 выби- рать всевозможные значения кубических корней из выражений (30) и (31), связанные полученным выше соотношением d1d2 = --3p. (32) Таким образом, мы приходим к следующей окончательной формуле с1,2,з у 2^7 27' 4' у 2 V 27 ' 4 ’ называемой формулой Кардано. Замечание 4. Формула Кардано имеет смысл, если извлекаются входящие в нее квадратные и кубические корни. В частности, если мы решаем по этой формуле кубическое уравнение с веществен- ными коэффициентами, то нам, вообще говоря, придется работать с комплексными числами, даже если нас интересуют только веще- ственные корни. Именно так обстоит дело в случае положительного дискриминанта, когда все три корня вещественны: в этом случае число, стоящее под знаком квадратного радикала, отрицательно. Пример 2. Найдем корни многочлена ф из примера 1. Имеем ё + Т="ife W) * -0,0000120, так что под знаком одного из кубических радикалов в формуле Кар- дано будет стоять число ~2+УХ7 + ^* ~1,734 + °>00347i * s* 1,73400[соз(л - 0,00200) + i sin(rc - 0,00200)]. Под знаком другого кубического радикала будет стоять комплекс- но-сопряженное число. Условие (32) означает в данном случае, что при извлечении кубических корней следует комбинировать их комплексно-сопряженные значения. При сложении комплексно-со- пряженных чисел получается их удвоенная вещественная часть.
§ 10. Поле рациональных дробей 147 Таким образом, q * 2 V1,73400 cos 7Г~0’°0200 * 1,20278, с2 % 2 ^/1,73400 cos -я—^0-2-°° 1,20001, с3 % -2 ^1,73400 cos 0,0°200 % -2,40277. § 10. Поле рациональных дробей Таким же образом, как кольцо целых чисел расширяется до поля рациональных чисел, любое целостное кольцо можно расширить до поля. Пусть А — целостное кольцо. Рассмотрим множество пар (а, Ь), где a, b G А, b # 0, и определим в нем отношение эквивалентности по правилу Ь1) ~ (а2, ^2) а1^2 = а2^1 • Рефлексивность и симметричность этого отношения очевидны; до- кажем его транзитивность. Если (аь bj ~ (а2, Ь2) и (а2, Ь2) ~ (а3, Ь3), то ^1Ь2Ь3 =а2^1^3 =^3^1^2> откуда после сокращения на Ь2 получаем <21Ь3 = а3Ь1? т.е. (a1,b1)~(a3,b3). Из данного определения следует, что (а, Ь) - (ас, Ьс) (33) для любого с 0 0. С другой стороны, как показывает следующая ниже цепочка эквивалентностей, любая эквивалентность (аъ Ь}) ~ ~ (^2, Ь2) является следствием эквивалентностей типа (33): (Qi> bj) ~ (ajb2, bjb2)= (q2^i> bjb2) ~ (а2, Ь2). (Мы сначала умножили оба члена пары (а1? Ьт) на Ь2, а затем сокра- тили оба члена получившейся пары на ЬР) Определим теперь сложение и умножение пар по правилам (аъ bj) + (а2, Ь2) = (атЬ2 + а2Ьь ЬХЬ2), (а1> Ьт)(а2, Ь2) = (ата2, ЬуЬ2).
148 Глава 3. Начала алгебры многочленов Докажем, что определенное выше отношение эквивалентности со- гласовано с этими операциями. В силу предыдущего достаточно показать, что при умножении обоих членов одной из пар (а1}Ьу) и (а2, Ь2) на элемент с / 0 сумма и произведение этих пар заменятся эквивалентными им парами; но очевидно, что при такой операции оба члена суммы и произведения умножатся на тот же элемент с. Класс эквивалентности, содержащий пару (а, Ь), условимся запи- сывать как «дробь» | или а/b (пока это просто символ, не подразуме- вающий фактического деления). Ввиду доказанного выше операции сложения и умножения пар определяют операции сложения и умно- жения дробей, осуществляемые по обычным правилам: ^1^2 ^2^1 bjb2 Qi . Q2 _ ь,ъ2 CZj CL2 bj Ь2 ^1^2 Докажем, что относительно этих операций дроби образуют поле. Любое конечное множество дробей можно привести к общему знаменателю, а сложение дробей с одинаковыми знаменателями сводится к сложению их числителей. Поэтому сложение дробей ком- мутативно и ассоциативно. Дробь у (= | при любом b / 0) служит нулем для операции сложения дробей, а дробь — - противоположна дроби Таким образом, дроби образуют абелеву группу относи- тельно сложения. Коммутативность и ассоциативность умножения очевидны. Сле- дующая цепочка равенств доказывает дистрибутивность умноже- ния дробей относительно сложения: f а1 1 °2 аз — (Q1 + а2)а3 _ а1а3 +а2а3 _ а3 а2 а3 V ъ ъ J Ъ3~ bb3 ” bb3 ~ b b3 b Ь3' Дробь | служит единицей для операции умножения дробей, а при а / 0 дробь | обратна дроби Построенное поле называется полем отношений (или полем дро- бей) кольца А и обозначается через Quot А. Сложение и умножение дробей вида у сводятся к соответству- J а b ющим операциям над их числителями. Кроме того, у = у только при а = Ь. Следовательно, дроби такого вида образуют подкольцо, изоморфное А. Условившись отождествлять дробь вида у с элемен- том а кольца А, мы получим вложение кольца А в поле Quot А. Далее,
§ 10. Поле рациональных дробей 149 поскольку ab _ а b 1 ~ Г дробь | равна отношению элементов а и b кольца А в поле Quot А. Таким образом, обозначение | можно теперь понимать содержа- тельным образом. В силу (33) дробь не изменится, если ее числитель и знаменатель умножить или разделить (если это возможно) на один и тот же эле- мент кольца А. Если А — евклидово кольцо, то путем сокращения числителя и знаменателя на их наибольший общий делитель любая дробь приводится к виду где (a, b) = 1. Такой вид дроби назы- вается несократимым. (Допуская вольность речи, обычно говорят просто о несократимой дроби.) Предложение 1. Любой вид дроби над евклидовым кольцом по- лучается из любого ее несократимого вида умножением числителя и знаменателя на один и тот же элемент. Доказательство. Пусть г = причем (а0, b0) = 1- Из равенства О Uq ab0 = а0Ь следует, что Ьо | а0Ь и, значит, Ьо | Ь. Пусть b = cb0; ясно, что тогдаа = са0. □ Следствие. Несократимый вид дроби над евклидовым кольцом определен однозначно с точностью до умножения числителя и зна- менателя на один и тот же обратимый элемент. Поле отношений кольца Z целых чисел есть поле Q рациональ- ных чисел. Поле отношений кольца К[х] многочленов над полем К называется полем рациональных дробей (или рациональных функ- ций) над полем К и обозначается через К(х). Каждая рациональная дробь определяет функцию на К со зна- чениями в К, определенную там, где ее знаменатель (в несократи- мой записи) не обращается в нуль. А именно, значением дроби - /(С) & (/, gGK[x]) в точке сеК называется число Легко видеть, что операции сложения и умножения дробей соответствуют таким же операциям над определяемыми ими функциями в их общей области определения. f f Задача 1. Доказать, что если рациональные дроби — и — над бесконечным полем К определяют функции, совпадающие в их об- щей области определения, то — = —.
150 Глава 3. Начала алгебры многочленов Рациональная дробь ~ называется правильной, если deg f <deg g. Очевидно, что сумма и произведение правильных дробей являются правильными дробями. Предложение 2. Всякая рациональная дробь единственным об- разом разлагается в сумму многочлена и правильной дроби. Доказательство. Пусть f, g е К[х], g / 0. Разделим f на g с остат- ком в кольце К[х]: f = qg + r (q,reK[x], degr<degg). (34) Тогда 7=q + ;> (35) g g причем — правильная дробь. Пусть теперь f _п , П g 1 gi — какое-нибудь другое разложение дроби - в сумму многочлена и правильной дроби. Тогда S и мы приходим к противоречию, так как ненулевой многочлен не может равняться правильной дроби. □ Многочлен q из равенства (35) называется целой частью дро- би -. g Предложение 3. Всякая правильная рациональная дробь вида f glg2--*gs ’ где gi> g2> • ••> g$ попарно взаимно просты, разлагается в сумму пра- вильных дробей со знаменателями g1} g2,..., gs. Доказательство. Докажем это утверждение индукцией по s. При s = 2, согласно теореме 5.1, существуют такие многочлены Hi и и2, что g1u1 +g2u2 = f- Разделив это равенство на g, получим L = 0* + g gi g2 *
§ 10. Поле рациональных дробей 151 гт. f „ „ и2 щ Так как дробь - правильная, то сумма целых частей дробей - и ~ & £1 #2 должна быть равна нулю. Выделив их, мы получим разложение дро- би в сумму правильных дробей со знаменателями и g2. При s > 2 заметим, что многочлены и g2...gs взаимно просты, и по доказанному дробь - разлагается в сумму правильных дробей со знаменателями gj и g2...gs. В свою очередь, вторая из этих дро- бей по предположению индукции разлагается в сумму правильных дробей со знаменателями g2,..., gs. □ Задача 2. Доказать, что разложение, о котором идет речь в пред- ложении 3, единственно. Изложим теперь теорию, используемую в математическом ана- лизе при интегрировании рациональных функций. Определение 1. Рациональная дробь ~ над полем К называется простейшей, если g = рк, где р еК[х] — неприводимый многочлен, и deg/<degp. В частности, всякая дробь вида а (х - с)к (а, СЕК) является простейшей. В случае К = С дробями такого вида исчерпы- ваются все простейшие дроби. В случае К = R имеются еще простей- шие дроби вида , 2lx+b^ ,к (a,b,p,qen, (x2 + px + q)fc где р2 - 4q < 0. Теорема 1. Всякая правильная рациональная дробь - разлагает- 8 ся в сумму простейших дробей. Более точно, если g = р^р^.-.р** — разложение многочлена g на неприводимые множители, то дробь разлагается в сумму простейших дробей со знаменателями Ръ РЬ -,p\',P2>Pv ->Р2> ->Ps>P2s> • • •> Pss• Доказательство. Ввиду предложения 3 дробь J- разлагается в сумму правильных дробей со знаменателями р*1, р£,..., р*\ Поэто- му нам достаточно доказать теорему в случае, когда g = рк, где р —
152 Глава 3. Начала алгебры многочленов неприводимый многочлен. В этом случае, разделив f на р с остат- ком, мы получим = + degr<degp. рк рК 1 р\ Второе из слагаемых является простейшей дробью, а первое являет- ся правильной дробью как разность правильных дробей. Продолжая эту процедуру, мы в конце концов разложим дробь в сумму про- стейших дробей со знаменателями р, р2,..., р*. р □ Замечание 1. В силу задачи 2 разложение, о котором идет речь в теореме, единственно. Пример 1. Предположим, что g=(x-c1)(x-c2)...(x-cn), где с1} с2,..., сп различны. Тогда / _ Q1 । а2 । । ап g x-Ci х-с2 х-сп’ где аь а2,..., ап е К. Для нахождения а, умножим обе части преды- дущего равенства на g и положим х = с,. Мы получим тогда /(с.) = af (с, - Cj)... (с( - c.-i) (с( - ci+1)... (с, - cn) = a,g'(с,), откуда Итак, / ^ у /(с.) g g'(C()(x-Cf) (36) (при условии, что deg / < degg). Интересно отметить, что, умножив обе части этого равенства на g, мы получим интерполяционную формулу Лагранжа у ь (х-С1)...(х-с,_1)(х-с,+1)...(х-сп) ,=1 ' (с< -q)-(q — с,-!)(с( -с,?+1)-..(сх -c„)’ которая задает многочлен / степени < и, принимающий в точках q, с2> ••> сп значения blt b2,..., Ьп.
§ 10. Поле рациональных дробей 153 Задача 3. Доказать равенство I _ 1 "у 6, Хп — 1 П X - Ei ' где £0, £n_j —комплексные корни п-й степени из единицы. Задача 4. Разложить в сумму простейших дробей над полем Zp (р простое) дробь — . Пример 2. Метод неопределенных коэффициентов, использо- ванный в предыдущем примере, разумно применять и в более об- щей ситуации. Разложим, например, в сумму простейших дробей над К рациональную дробь ___________________________х______ (х + 1)(х2 + 1)2’ Имеем, согласно теореме 1, _____х______ а . bx + c . dx + e (х + 1)(х2 + 1)2 “х + 1 х2 + 1 (х2 + 1)2’ где а, Ь, с, d, е — какие-то вещественные числа. Для их нахождения умножим предыдущее равенство на (х +1) (х2 +1)2: x = a(x2 + l)2 + (bx + c)(x + l)(x2 + l) + (dx + e)(x + l). Положив в этом равенстве последовательно х = -1 и x = i, получим -1 = 4а, i = (di + е) (i +1) = (е - d) + (d + e)i, откуда —i Далее, сравнив свободные члены и коэффициенты при х4, получим 0 = а + с + е, 0 = а + Ь, откуда Таким образом, ______х________ _ 1 . х-1 . х +1 (х +1)(х2 +1)2 ” 4(х + 1) 4(х2 + 1) 2(х2 + 1)2‘
Глава 4 Начала теории групп § 1. Определение и примеры В первой главе читатель познакомился с понятием абелевой группы. Абелевыми группами являются, в частности, аддитивная группа любого кольца, мультипликативная группа любого поля и ад- дитивная группа любого векторного пространства. Важнейшие при- меры неабелевых групп появляются как группы преобразований. Назовем преобразованием множества X всякое его отображение в себя. Определение 1. Группой преобразований множества X называет- ся всякая совокупность G его биективных преобразований, удовле- творяющая следующим условиям: 1) если (/?, гр € G, то ргр € G; 2) если р € G, то р~г е G; 3) id€G. (Здесь ргр обозначает произведение (композицию) преобразова- ний р и гр, a id — тождественное преобразование.) Пример 1. Совокупность S(X) всех биективных преобразова- ний множества X является группой преобразований. Если множе- ство X бесконечно, эта группа слишком велика, чтобы быть интерес- ной. Если X конечно, то можно считать, что X = {1, 2,..., и}; в этом случае группа S(X) называется группой подстановок или симмет- рической группой степени п и обозначается через Sn. Подстановка creSn может быть записана в виде таблицы в первой строке которой выписаны в каком-то порядке числа 1,2,... ..., п, а во второй строке — их образы, т. е. jk = cr(ifc). Фиксируя рас- положение чисел в первой строке (например, располагая их в по- рядке возрастания), мы видим, что число подстановок равно числу перестановок (см. §2.4), т. е. п!. При этом каждая подстановка мо- жет быть записана п! способами. Приведем пример на умножение
§ 1. Определение и примеры 155 подстановок: р 2 3 4W1 2 3 4А (4 3 2 ПЛ 2 3 4) (1 2 3 4А <3 4 1 2Д4 3 2 1J “ <2 1 4 зД4 3 2 1) ~ <2 1 4 3/ (Здесь мы сначала для удобства переписали первую подстановку таким образом, чтобы первая строка в ее записи совпала со второй строкой в записи второй подстановки.) Пример 2. Движения евклидовой плоскости Е2 (соответственно евклидова пространства Е3) образуют группу преобразований, обо- значаемую через IsomE2 (соответственно IsomE3). Замечание 1. В предыдущих главах мы обозначали через Е2 (соответственно Е3) множество векторов евклидовой плоскости (соответственно пространства). Здесь же символ Е2 (соответствен- но Е3) использован для обозначения самой евклидовой плоскости (соответственно пространства). Впрочем, если в плоскости (соответ- ственно в пространстве) фиксирована некоторая точка о (которую мы будем в дальнейшем называть началом отсчета), то можно договориться отождествлять точки с их радиусами-векторами от- носительно точки о. Это соглашение часто будет подразумеваться в дальнейшем. Замечание 2. В той версии аксиоматики евклидовой геометрии, кото- рая берет за основу понятие расстояния между точками, движение опре- деляется как преобразование, сохраняющее расстояния, и сформулирован- ное в примере 2 свойство является очевидной теоремой. В другой версии, в которой понятие движения является одним из неопределяемых понятий, это свойство является аксиомой, а утверждение о том, что всякое преоб- разование, сохраняющее расстояния, есть движение, является (несложной) теоремой. Пример 3. Пусть А = (</) — квадратная матрица порядка п с эле- ментами из поля К. Отображение Ч>а- Кп-^Кп, x=(xi,...,xn)--»y=(y1,...,yn), У. = Ёаих; = и), j=i называется линейным преобразованием пространства Кп. В матрич- ной форме, если представлять х и у как столбцы, можно запи- сать это определение как у = Ах. Если А и В—две матрицы, то (АВ)х = А(Вх), то есть ^дв — Т^д^в-
156 Глава 4. Начала теории групп Очевидно, что ipE — это тождественное преобразование. Поэтому, если матрица А невырожденна, преобразование </>a-j обратно преоб- разованию у>А (откуда, в частности, следует, что <рА биективно). Ли- нейное преобразование, определяемое невырожденной матрицей, называется невырожденным. Из вышесказанного следует, что невы- рожденные линейные преобразования образуют группу преобразо- ваний пространства Кп. Отметим, что всякое линейное преобразо- вание = <рА обладает следующими очевидными свойствами: Ч> (х' + х") = (х') 4- у) (х"), у (Ах) = Аср (х) (ср. определение линейной функции векторного аргумента в § 2.4). Замечание 3. Легко показать (см. §5.2), что эти свойства можно при- нять за определение линейного преобразования, т. е. всякое преобразова- ние пространства К", обладающее этими свойствами, имеет вид ipA для некоторой матрицы А. Пример 4. Назовем параллельным переносом векторного прост- ранства V на вектор а е V преобразование ta: х—>х + а. Легко видеть, что tatb = ta+b> id = t0- С1) Эти формулы показывают, что совокупность Trans (V) всех парал- лельных переносов пространства V является группой преобразо- ваний. Задача 1. Доказать, что совокупность всех возрастающих не- прерывных функций на отрезке [0,1], удовлетворяющих условиям /(0) = 0, /(1) = 1, является группой преобразований отрезка [0,1]. Анализируя свойства операции умножения в группах преобразо- ваний, мы приходим к следующему понятию группы, которое отли- чается от понятия абелевой группы отсутствием требования комму- тативности. Определение 2. Группой называется множество G с операцией умножения, обладающей следующими свойствами: 1) (ab)c = a(bc) для любых a, b, ceG (ассоциативность)-, 2) существует такой элемент е е G (единица), что ае = еа = а для любого a eG; 3) для всякого элемента а е G существует такой элемент а"1 G G (обратный элемент), что аа”1 =а-1а = е.
§ 1. Определение и примеры 157 Группа называется абелевой или коммутативной, если ab = ba Va,beG. Данное определение группы использует мультипликативную тер- минологию. Аддитивная терминология обычно используется только для абелевых групп (хотя в принципе операция в группе может на- зываться и обозначаться как угодно). Аналогично тому, как это было сделано для абелевых групп, до- казывается единственность единицы и обратного элемента в любой группе. Что касается деления, то в неабелевой группе следует разли- чать левое и правое деления. А именно, для любых a, b е G уравне- ние ах = Ь имеет единственное решение, равное а-1Ь, а уравнение ха = Ь имеет единственное решение, равное Ьа-1. В любой группе (ab)”1 = Ь“1а"1. В самом деле, (ab)(b-1a-1) = а(ЬЬ"1)а"’1 =аа"1 = е. Всякая группа преобразований является группой относительно операции умножения преобразований. Действительно, ассоциатив- ность этой операции известна, единицей служит тождественное преобразование, а обратным элементом — обратное преобразо- вание. Пример 5. Невырожденные квадратные матрицы порядка п над полем К образуют группу по умножению, обозначаемую GLn(K). Поскольку имеется взаимно однозначное соответствие между невы- рожденными квадратными матрицами порядка п и невырожденны- ми линейными преобразованиями пространства Кп, причем умно- жению матриц соответствует умножение линейных преобразова- ний, группа GLn(K) изоморфна группе невырожденных линейных преобразований пространства Кп. В дальнейшем мы будем иногда, говоря о группе GLn(K), рассматривать ее именно как группу линей- ных преобразований. Группа GLn(K) есть группа обратимых элементов кольца Ln(K) всех матриц. Если А — любое ассоциативное кольцо с единицей, то множество его обратимых элементов также является группой по умножению. Мы будем обозначать эту группу через А*. Част- ным случаем является мультипликативная группа К* поля К (состо-
158 Глава 4. Начала теории групп ящая из всех ненулевых элементов этого поля). Заметим, что К* = = GLi(K). Пример 6. Как показывают формулы (1), группа Trans (V) изо- морфна аддитивной группе пространства V. Пример 7. Конечная группа может быть задана своей таблицей умножения. Так, множество G = {е, а, Ь, с} с таблицей умножения е а Ь с е а Ь с е а Ь с а е с b Ь с е а с b а е является абелевой группой. В самом деле, элемент е служит ее еди- ницей и каждый элемент обратен сам себе. Далее, легко видеть, что любая перестановка элементов а, Ь, с является автоморфизмом мно- жества G с указанной операцией. Поэтому, если исключить триви- альные случаи с участием единицы и принять во внимание комму- тативность, доказательство ассоциативности сводится к проверке следующих соотношений: a2b = a (ab) = b, (ab)c = а (Ьс) = е. Задача 2. Доказать, что множество G = {А, Б, В, Г, Д, Е} с опера- цией, заданной таблицей А Б В Г Д Е А Б В Г д Е Е Д Г В Б А В Г Д Е А Б Б А Е Д Г В Д Е А Б В Г Г В Б А Е Д А Б В Г Д Е является группой, изоморфной S3. Задача 3. Доказать, что если в множестве G с ассоциативной операцией существует такой элемент е (правая единица), что ае = а для любого a G G, и для любого a G G существует такой элемент а”1 (правый обратный элемент), что аа-1 = е, то G — группа.
§ 1. Определение и примеры 159 Определение 3. Подгруппой группы G называется всякое под- множество Н с G, удовлетворяющее следующим условиям: 1) если a, b € Н, то ab G Я; 2) если а € Я, то а"1 е Я; 3) ееН. Замечание 4. Так как аа”1 = е, условие 3) можно заменить тре- бованием непустоты подмножества Н. Очевидно, что всякая подгруппа сама является группой относи- тельно той же операции. Сравнивая определения 1 и 3, мы видим, что группа преобразо- ваний множества X — это не что иное, как подгруппа группы S(X). Пример 8. Пусть f — какой-либо многочлен от п переменных. Тогда Symf = {creS„:f(xam,xam,...,xaM') = f(xbx2, ...,х„)} есть подгруппа группы Sn. В самом деле, пусть ст, т е Symf. Поло- жим ха(1) = у,-; тогда /(*<7т(1).*<7т(2). •••> *<тт(п))=/(Ут(1)> Ут(2)> •••.Уг(П))=/(У1,У2, •••>Уп) = = /(*<7(1). *а(2)> •••> *<7(П)) = /(*1> *2, Остальные две аксиомы подгруппы выполнены очевидным образом. В частности, многочлен f является симметрическим тогда и толь- ко тогда, когда Sym f = Sn. В качестве примера многочлена с ме- нее богатой, но не тривиальной симметрией рассмотрим много- член f = хтх2 + х3х4 (от 4 переменных). Легко видеть, что группа Sym/ состоит из 8 подстановок, сохраняющих разбиение множе- ства {1, 2, 3,4} на два подмножества {1, 2} и {3, 4}. (Допускается пе- рестановка этих подмножеств и перестановка элементов в каждом из них; см. по этому поводу также пример 5.11). Пример 9. Аналогично, невырожденные линейные преобразо- вания пространства Кп, сохраняющие какой-либо заданный много- член от п переменных, образуют подгруппу группы GLn(X). Невы- рожденные линейные преобразования пространства Rn, сохраня- ющие многочлен *1 + *2 + ••• + хп, называются ортогональными преобразованиями; они образуют подгруппу группы GLn(R), кото- рая называется ортогональной группой и обозначается через Оп. Так как в декартовых координатах пространства Е2 (соответственно Е3) многочлен х2 + у2 (соответственно х2 + у2 + z2) выражает квадрат
160 Глава 4. Начала теории групп длины вектора, то преобразования из группы О2 (соответствен- но О3) могут пониматься как линейные преобразования, сохраня- ющие длину вектора. Дадим явное описание группы О2. Условие ^=(с d)e°2 означает, что (ах + by)2 4- (сх + dy )2 = х2 + у2, т. е. a2 + c2 = b2 + d2 = l, ab + cd = O. (2) Из уравнения а2 + с2 = 1 следует, что существует такой угол а, что а = cos а, с = sin а. Оставшиеся два уравнения показывают, что b = ±sina, d = =Fcosa. Таким образом, (cos a -sin а Л sin a cos a J или (cos a sinaA V’=(sina -cosa)' (4) Геометрический смысл этих преобразований становится ясным, ес- ли ввести комплексную координату z = x + yi. Тогда в случае (3) пре- образование ip есть просто умножение z на cos а 4- i sin а, т. е. при- бавление к аргументу z числа а, что геометрически описывается как поворот на угол а. В случае (4) преобразование есть компози- ция поворота на угол а и зеркального отражения относительно ве- щественной оси (комплексного сопряжения), что, как легко видеть, есть отражение относительно прямой, составляющей с веществен- ной осью угол а/2. Отметим, что в первом случае преобразование ip сохраняет ориентацию плоскости, а во втором — меняет ее. Пример 10. Движения евклидовой плоскости, оставляющие на месте начало отсчета о, образуют подгруппу группы Isom Е2. Обозна- чим ее через Н. Пусть ej и е2— координатные векторы. Из аксиом евклидовой геометрии следует, что для любых перпендикулярных единичных векторов и f2 существует единственное движение
§ 1. Определение и примеры 161 оставляющее точку о на месте и переводящее векторы elf е2 в векто- ры /ьЛ соответственно. Если пара {fi,f2} ориентирована положи- тельно (т. е. /2 получается из поворотом на л/2 против часовой стрелки), то есть поворот вокруг точки о на некоторый угол а; в противном случае есть отражение относительно некоторой пря- мой I, проходящей через точку о (см. рис. 1). Но, как мы показали в предыдущем примере, это есть в точности ортогональные преобра- зования. Таким образом, Н = О2. Пример 11. Пусть F — какая-либо фигура на евклидовой плоско- сти. Тогда Sym F = {(/?€ Isom Е2: ip(F) = F} есть подгруппа группы Isom Е2; она называется группой симметрии фигуры F. Так, группа симметрии окружности с центром в начале отсчета о есть группа О2. Группа симметрии правильного п-уголь- ника с центром в точке о есть подгруппа группы О2, состоящая из поворотов вокруг точки о на углы, кратные 2л/п, и отражений относительно прямых, проходящих через о и одну из вершин или середину одной из сторон. Таким образом, эта группа содержит 2п элементов (п поворотов и п отражений); она называется группой диэдра и обозначается через Dn. Пример 12. В силу формулы умножения определителей матри- цы с определителем 1 образуют подгруппу в группе GLn(K). Эта подгруппа называется унимодулярной группой и обозначается через SLn(K).
162 Глава 4. Начала теории групп Пример 13. Целочисленные матрицы с определителем 1 образу- ют подгруппу в группе SLn (R), обозначаемую через SLn (Z) (см. зада- чу 2.5.3). Пример 14. Множество невырожденных диагональных матриц порядка п является абелевой подгруппой группы GLn(K). Задача 4. Доказать, что множество строго треугольных квадрат- ных матриц порядка п является подгруппой группы GLn(K). § 2. Группы в геометрии и физике Цель этого параграфа—дать общее представление о роли групп в геометрии и физике. В XIX в. математики осознали, что евклидова геометрия не явля- ется единственной мыслимой геометрией. Даже если принять, что «пространство, в котором мы живем», подчиняется законам евкли- довой геометрии (что на самом деле верно лишь в первом прибли- жении), имеет смысл изучать геометрию и других пространств, ко- торые возникают в результате математических построений. В свя- зи с этим возникает вопрос, что же в таком случае следует пони- мать под геометрией. Обобщая различные понятия, рассматривае- мые в евклидовой геометрии, можно сформулировать различные ответы на этот вопрос. В частности, обобщая понятие группы движений евклидовой гео- метрии, немецкий математик Клейн в своей лекции 1872 г., полу- чившей известность под названием «Эрлангенская программа», дал определение геометрии как науки, изучающей свойства фигур, ин- вариантные относительно заданной группы преобразований. Более подробно, пусть задано некоторое множество X и некото- рая группа G его преобразований. Фигуру F1 с X будем считать эк- вивалентной (или равной, как говорят в элементарной геометрии) фигуре F2 с X относительно группы G и писать Fx ~ F2, если суще- ствует такое преобразование G G, что F2 = (F2). Проверим, что это действительно отношение эквивалентности: 1) F~F, так как F = id(F) и idGG; 2) если F1~F2, т. е. F2 = (/?(F1), где (/?GG, то F2~Fj, так как F1 = (/?"1(F2) и с/?-1 gG; 3) если Fj ~F2 и F2~F3, т.е. F2 = c/?(F1) hF3 = ^(F2), где (/?, 'ipeG, то Fj ~F3, так как F3 = '0</?(F1) и 'ipipeG.
§ 2. Группы в геометрии и физике 163 Мы видим, таким образом, что три аксиомы отношения эквива- лентности в точности соответствуют трем аксиомам группы преоб- разований. Одной из задач геометрии является нахождение необходимых и достаточных условий эквивалентности фигур (вспомните призна- ки равенства треугольников в евклидовой геометрии). Этой цели служат величины, инвариантные относительно преобразований из группы G (такие, как расстояние между точками или мера угла в ев- клидовой геометрии). Соотношения между этими инвариантами суть геометрические теоремы (например, теорема Пифагора или теорема о том, что медианы треугольника пересекаются в одной точке). Конечно, далеко не любая группа преобразований приводит к интересной и важной для приложений геометрии. Все такие гео- метрии связаны с достаточно богатыми группами преобразований, которых не так много. Минимальным требованием здесь является транзитивность. Определение 1. Группа G преобразований множества X назы- вается транзитивной, если для любых х, у G. X существует такое преобразование G G, что у = </?(х). (Это означает, что в соответствующей геометрии все точки эк- вивалентны в смысле данного выше определения эквивалентности фигур.) Пример 1. Группа Trans(Кп) параллельных переносов простран- ства Кп (см. пример 1.4) транзитивна. В самом деле, для любых х, у G Кп имеем Однако группа Trans(Кп) все еще слишком мала, чтобы опреде- лять интересную геометрию. В качестве примера интересной гео- метрии, отличной от евклидовой, приведем аффинную геометрию. Пусть G GLn(K) и a G Кп. Тогда ¥>taV_1 = tV(a). (5) В самом деле, для любого хеКп имеем: ((/>ta^-1)(x) = + а) = х + у>(а) = t^x. Предложение 1. Для любой подгруппы G с GLn(K) множество Trans(Kn)*G = {taip: аеКП, </>gG} является транзитивной группой преобразований пространства Кп.
164 Глава 4. Начала теории групп Доказательство. При a, be Кп, е GLn(K) имеем, согласно формулам (1) и (5), = ta+9>(W е Trans (Kn) • G. Отсюда следует, что (с.,?)"1 = t-v-'toV’-1 е Trans (К") • G. Таким образом, Trans(Kn) • G — группа преобразований. Она транзи- тивна, поскольку уже ее подгруппа Trans(Кп) транзитивна. □ В частности, мы можем взять G = GLn(K). Полученная группа GAn (К) = Trans(Kn) • GLn(К) (6) называется полной аффинной группой пространства Кп, а ее эле- менты— (биективными) аффинными преобразованиями. Связанная с ней геометрия называется аффинной геометрией. В случае К = R, п = 2 мы получаем аффинную геометрию евкли- довой плоскости. Предложение 2. Группа движений евклидовой плоскости есть подгруппа группы GA2®), равная Trans (К2) -О2. Доказательство. Прежде всего, заметим, что все параллельные переносы и все ортогональные преобразования являются движени- ями (см. пример 1.10). Пусть теперь /—какое-либо движение. Поло- жим а = /(о). Тогда движение = С”1/ оставляет на месте точку о и, значит, принадлежит группе О2 . Таким образом, / = taip eTransQR2) О2. □ Аналогичным образом описывается группа движений евклидова пространства. Следствие. Если фигуры F1? F2 с Е2 равны в евклидовой геомет- рии, то они равны и в аффинной геометрии. Группа GA2(R) не совпадает с группой движений. Примером аф- финного преобразования, не являющегося движением, может слу- жить гомотетия (с коэффициентом 0±1) или растяжение вдоль ка- кой-либо оси. Таким образом, группа GA2(R) богаче группы движе- ний, и фигуры, не равные в евклидовой геометрии, могут оказаться равными в аффинной геометрии. Так, в аффинной геометрии все окружности равны. Задача 1. Доказать, что в аффинной геометрии все треугольни- ки равны.
§ 2. Группы в геометрии и физике 165 В аффинной геометрии отсутствует понятие расстояния между точками. Однако, как показывает следующая задача, имеется инва- риант трех точек, лежащих на одной прямой. Задача 2. Доказать, что при аффинных преобразованиях сохра- няется отношение, в котором точка делит отрезок. В рамках группового подхода могут быть построены также проек- тивная и конформная геометрии, геометрия Лобачевского и другие геометрии, используемые в математике и ее приложениях. Группы преобразований в физике описывают симметрию физи- ческих законов, в частности симметрию пространства-времени. Точка пространства-времени задается тремя пространственны- ми координатами х, у, z и временной координатой г, так что про- странство-время с фиксированной системой отсчета может быть отождествлено с R4. Переход к другой системе отсчета означает некоторое преобразование пространства R4. Как в классической, так и в релятивистской механике (точнее, в специальной теории относительности) существует понятие инерциальных систем отсче- та, в которых все законы механики имеют одинаковый вид. Пере- ходы от одной инерциальной системы отсчета к другим составля- ют некоторую группу преобразований пространства R4. Эта группа однозначно определяет законы механики. Отличие релятивистской механики от классической обусловлено тем, что она берет за основу другую группу преобразований. Группа симметрии пространства-времени в классической меха- нике есть группа Галилея, описываемая следующим образом: G=Trans (R4) -Н-Оз, где О3 — группа ортогональных преобразований пространственных координат, а Н — группа преобразований вида (х, у, z, t) —> (х + at, y + bt,z + ct, t), соответствующих переходу к новой системе отсчета, равномерно и прямолинейно движущейся относительно старой. Из этого опи- сания группы Галилея видно, что в классической механике время абсолютно в том смысле, что разность временных координат двух событий одинакова во всех инерциальных системах отсчета. Согласно представлению релятивистской механики, группа сим- метрии пространства-времени есть группа Пуанкаре G = Trans (R4) -О3д,
166 Глава 4. Начала теории групп где О3> j — группа линейных преобразований, сохраняющих много- член x2 + y2 + z2-Г2 (в системе единиц, в которой скорость света равна 1). Группа О3л содержит группу О3, не затрагивающую временной координаты. Нетривиальным примером преобразований из О3>1 могут служить преобразования Лоренца (х, у, z, с) *-► (х, у, z ch а +1 sh a, z sh а +1 ch a), перемешивающие пространственные и временные координаты. Вид этих преобразований показывает, что в релятивистской меха- нике время не абсолютно. Группа Пуанкаре была описана в работах Лоренца и Пуанкаре как группа симметрии законов электродинамики (уравнений Макс- велла). Заслуга Эйнштейна состояла в том, что он имел смелость сделать вывод, что и законы механики должны иметь ту же группу симметрии. Группы преобразований лежат также в основе кристаллографии и теории элементарных частиц. Так, в кристаллографии они описы- вают симметрию кристаллических структур и, тем самым, физиче- ских свойств кристаллов. (См. рис. 2, где изображены кристалличе- ские структуры поваренной соли, алмаза и графита.) § 3. Циклические группы Так же как в группе R*, в любой группе G могут быть определены степени элемента g€G с целыми показателями: если к > О, к е, если к = О, g”1g~1...g~1, если к <0. i -к Имеет место свойство gkgl=gk+l (7)
§ 3. Циклические группы 167 Рис. 2
168 Глава 4. Начала теории групп Это очевидно, если к, I > 0. Рассмотрим случай, когда к > 0, I < 0, к +1 > 0. Тогда gkgl =gg- •£ • • g~\=gg- -g =gk+l- к -I k+l Аналогично рассматриваются остальные случаи. Из (7) следует, что (gky~1=g~k- Кроме того, е = g° по определению. Таким образом, степени элемен- та g образуют подгруппу в группе G. Она называется циклической, подгруппой, порожденной элементом g, и обозначается через (g). Возможны два принципиально разных случая: либо все степени элемента g различны, либо нет. В первом случае подгруппа (g) бес- конечна. Рассмотрим более подробно второй случай. Пусть gfc = g*, k > I; тогда gk~l = e. Наименьшее из натуральных чисел т, для которых gm = е, называется в этом случае порядком элемента g и обозначается через ord g. Предложение 1. Если ord g = п, то 1) gm = e <=> п | гл; 2) gk=gl <=> k = l (mod n). Доказательство. 1) Разделим т на п с остатком: m = qn + r, О^гсп. Тогда в силу определения порядка gm = (.gn)q-gr = gr = e <=> г = 0. 2) В силу предыдущего g/c = g/ <=> gk”/ = e <=> п | (к -/) <=> k = l (mod n). □ Следствие. Если ord g = и, то подгруппа (g) содержит п элемен- тов. Доказательство. Действительно, {g} = {e,g,g2, ;gn~1}, (8) причем все перечисленные элементы различны. □ В том случае, когда не существует такого натурального т, что gm—e (т.е. имеет место первый из описанных выше случаев), пола- гают ord g = оо. Отметим, что ord е = 1; порядки же всех остальных элементов группы больше 1.
§ 3. Циклические группы 169 В аддитивной группе говорят не о степенях элемента g, а о его кратных, которые обозначают через kg. В соответствии с этим по- рядок элемента g аддитивной группы G — это наименьшее из нату- ральных чисел т (если такие существуют), для которых mg g + g + ... + g = 0. т Пример 1. Характеристика поля (см. § 1.5) есть порядок любого ненулевого элемента в его аддитивной группе. Пример 2. Очевидно, что в конечной группе порядок любого элемента конечен. Покажем, как вычисляются порядки элемен- тов группы Sn. Подстановка т е$п называется циклом длины р и обозначается через (ц12..лр), если она циклически переставляет h, ^2» •••> ip, т.е. т(ц) = i2, r(i2) = 13, •••> TGP) = a все остальные числа оставляет на месте. Очевидно, что порядок цикла длины р равен р. Циклы и т2 называются независимыми, если среди фактически переставляемых ими чисел нет общих; в этом случае т1т2 = т2тр Всякая подстановка однозначно разлагается в произве- дение независимых циклов. Например, 'Ms 6 7 4 I 3 2 !} = (2637)(1S8), что наглядно показано на рис. 3, где действие подстановки сг изоб- ражено стрелками. Если подстановка а разлагается в произведение независимых циклов длин р15 р2,..., pS) то ordcr = HOK{p1,p2, ...,ps}. Например, для подстановки сг, изображенной на рис. 3, ord сг = 12. Рис. з Задача 1. Доказать, что порядок любого элемента группы Sn не превос- ходит числа е"/с*1,44п.
170 Глава 4. Начала теории групп Пример 3. Порядок комплексного числа с в группе С* конечен тогда и только тогда, когда это число есть корень некоторой степени из единицы, что, в свою очередь, имеет место тогда и только тогда, когда |с| = 1, a arg с соизмерим с л, т. е. е Q. з Задача 2. Доказать, что arctg несоизмерим с л. Пример 4. Найдем элементы конечного порядка в группе Isom Е2 движений плоскости. Пусть G IsomE2, = id. Для любой точки р G Е2 точки <Р2Р,ч>п-'р циклически переставляются движением (/?, так что их центр тяже- сти о неподвижен относительно (/?. Следовательно, —либо пово- рот на угол вида -jj- вокруг точки о, либо отражение относительно некоторой прямой, проходящей через о. Пример 5. Найдем порядок матрицы Ч? '!) как элемента группы GL2(R). Имеем откуда а4=-а, а5=-а2, а6=-а3=е, так что ord А = 6. Конечно, этот пример специально подобран: веро- ятность того, что порядок наудачу выбранной матрицы A G GL2(R) будет конечен, равна нулю. Предложение 2. Если ord g = n, то ord^=(A)- (9) Доказательство. Пусть (n,k) = d, n = n1d, k = k1d, так что (Hi, kj) = 1. Имеем (gk)m_e фф riilkjm <=> ni|m. Следовательно, ord gk = пг. □
§ 3. Циклические группы 171 Определение 1. Группа G называется циклической, если суще- ствует такой элемент g G G, что G = (g). Всякий такой элемент на- зывается порождающим элементом группы G. Пример 6. Аддитивная группа Z целых чисел является цикличе- ской, так как порождается элементом 1. Пример 7. Аддитивная группа Zn вычетов по модулю п является циклической, так как порождается элементом [1]. Пример 8. Мультипликативная группа Сп комплексных корней п-й степени из 1 является циклической. В самом деле, эти корни суть числа Ek = cos +i sin (k = 0,1,..., п - 1). к п п ’ ’ Ясно, что Ek = ef. Следовательно, группа Сп порождается элемен- том ер Задача 3. Доказать, что группа Z* обратимых элементов коль- ца Zn (см. задачу 1.5.1) является циклической при п $ 7 и п = 9 и не является циклической при п = 8. Легко видеть, что в бесконечной циклической группе G = (g) по- рождающими элементами являются только g и g-1. Так, в группе Z порождающими элементами являются только 1 и -1. Число элементов конечной группы G называется ее порядком и обозначается через |G|. Порядок конечной циклической группы ра- вен порядку ее порождающего элемента. Поэтому из предложения 2 следует Предложение 3. Элемент gk циклической группы G = (g) поряд- ка п является порождающим тогда и только тогда, когда (и, k) = 1. Пример 9. Порождающие элементы группы Сп (см. пример 8) называются первообразными корнями п-й степени из 1. Это корни вида ек, где (п, k) = 1. Например, первообразные корни 12-й степе- ни из 1 — это е5, е7, en. Циклические группы — это наиболее простые группы, которые можно себе представить. (В частности, они абелевы.) Следующая теорема дает их полное описание. Теорема 1. Всякая бесконечная циклическая группа изоморфна группе Z. Всякая конечная циклическая группа порядка п изоморфна группе Zn. Доказательство. Если G = (g) — бесконечная циклическая груп- па, то в силу формулы (7) отображение f: Z -* G, к —> gk, есть изо- морфизм.
172 Глава 4. Начала теории групп Пусть G = (g) —конечная циклическая группа порядка п. Рас- смотрим отображение /:Zn-»G, [k]-gk (keZ). Так как [k] = [Z] <=> k = l (mod п) <=» gk = g‘, отображение f корректно определено и биективно. Свойство /(k + !)=/(k)/(O вытекает из той же формулы (7). Таким образом, f — изомор- физм. □ Для понимания строения какой-либо группы важную роль игра- ет знание ее подгрупп. Все подгруппы циклической группы могут быть легко описаны. Теорема 2. 1) Всякая подгруппа циклической группы является циклической. 2) В циклической группе порядка п порядок любой подгруппы де- лит п и для любого делителя q числа п существует ровно одна подгруппа порядка q. Доказательство. 1) Пусть G = (g) — циклическая группа и Н — ее подгруппа, отличная от {е}. (Единичная подгруппа, очевидно, яв- ляется циклической.) Заметим, что если g“m G Н для какого-либо гп G N, то и gm G Н. Пусть гп — наименьшее из натуральных чисел, для которыхgmeH. Докажем, что Н = (gm}. Пусть gkeH. Разделим к на гп с остатком: k = qm + r, О$г<гп. Имеем gr=gk(gnTqeH, откуда в силу определения числа гп следует, что г = 0 и, значит, gk = = (gm)q. 2) Если | G | = п, то предыдущее рассуждение, примененное к к = п (в этом случае gk = е G Н), показывает, что п = qm. При этом H = {e,gm,g2m,...,g(^1)m}, (10) и Н является единственной подгруппой порядка q в группе G. Обрат- но, если q —любой делитель числа п и n = qrn, то подмножество Н, определяемое равенством (10), является подгруппой порядка q. □
§ 4. Системы порождающих 173 Следствие. В циклической группе простого порядка любая нееди- ничная подгруппа совпадает со всей группой. Пример 10. В группе Z всякая подгруппа имеет вид mZ, где т^О. Пример 11. В группе Сп корней п-й степени из 1 любая подгруп- па есть группа Cq корней q-й степени из 1, где q | п. § 4. Системы порождающих Пусть S — какое-либо подмножество группы G. Обозначим через (S) совокупность всевозможных произведений вида Si'g2--Sk (gi,g2,-;gk^S;elte2,...,ek = ±l). (11) Это наименьшая подгруппа группы G, содержащая S. В самом де- ле, если какая-либо подгруппа содержит S, то она содержит и все указанные произведения. С другой стороны, само множество (S) является подгруппой, как показывают следующие равенства: (г/1 Ч ( ~£к+1 **+2 ?k+l Ч Ъ Ск+1 <51 52 '^&к+1&к+2'"&к+1' *1 *2 Говорят, что (S) — подгруппа, порожденная подмножеством S. В частности, если S состоит из одного элемента g, то (S) = (g) есть циклическая подгруппа, порожденная элементом g в том смысле, как это было определено в предыдущем параграфе. Замечание 1. Удобно считать, что в число произведений (11) вхо- дит пустое произведение (к = 0), которое по определению равно е. Определение 1. Говорят, что группа G порождается своим под- множеством S или что S — система порождающих (элементов) груп- пы G, если G = (S). Конечно, любая группа G порождается подмножеством S = G, од- нако представляет интерес найти возможно меньшую систему по- рождающих. Пример 1. Группа диэдра Dn (см. пример 1.11) порождается по- 2л воротом на угол — и (любым) отражением ip GDn. В самом деле, порождает циклическую подгруппу Сп всех поворотов, содержа- щихся в группе Dn; умножая элементы этой подгруппы на ф, мы получим все отражения, входящие в группу Dn.
174 Глава 4. Начала теории групп Два важных примера систем порождающих содержатся в приво- димых ниже теоремах. Подстановка, являющаяся циклом длины 2 (см. пример 3.2), на- зывается транспозицией. Теорема 1. Группа Sn порождается транспозициями. Доказательство. Отметим, что каждая транспозиция обратна сама себе. Поэтому утверждение теоремы означает, что любая под- становка разлагается в произведение транспозиций. Умножение подстановки слева на транспозицию (у) вызывает перестановку i и j в нижней строке. Такая операция также называется транспозицией. Очевид- но, что путем последовательных транспозиций любую перестановку (кь к2)кп) можно привести к тривиальной: сначала, если кг #1, меняем местами кТ и 1, ставя тем самым 1 на первое место, затем ставим 2 на второе место и т. д. Таким образом, существуют такие транспозиции т2,..., т5, что Ts...T2T1cr = id и, значит, cr = T1T2...Ts. □ Задача 1. Доказать, что группа Sn порождается смежными транс- позициями (12), (23),..., (и—1 и), причем минимальное число смеж- ных транспозиций, в произведение которых может быть разложена подстановка сг eSn, равно числу инверсий в нижней строке ее стан- дартной записи (12). Теорема 2. Группа GLn(K) порождается элементарными матри- цами. (Определение элементарных матриц см. в § 2.1.) Доказательство. Отметим, что матрица, обратная к элементар- ной, также элементарна (см. §2.1). Поэтому утверждение теоремы означает, что любая невырожденная матрица разлагается в произ- ведение элементарных матриц. Умножение матрицы А е GLn (К) слева на элементарную матрицу вызывает соответствующее элементарное преобразование ее строк. Мы знаем, что с помощью элементарных преобразований строк любую невырожденную матрицу можно привести к единичной
§ 5. Разбиение на смежные классы 175 матрице. Таким образом, существуют такие элементарные матрицы UlfU2,..„US) что Us...U2l/1A = E и, значит, Задача 2. Доказать, что группа SL2(Z) (см. пример 1.13) порож- дается матрицами Задача 3. Доказать, что группа движений плоскости порождает- ся отражениями относительно прямых. (Указание: доказать внача- ле, что каждый поворот и каждый параллельный перенос являются произведениями двух отражений.) § 5. Разбиение на смежные классы Пусть G — группа и Н — ее подгруппа. Будем говорить, что эле- менты gi, g2 е G сравнимы по модулю Н, и писать £1 =£2 (mod Н), если g?g2eH, (13) т.е. где heH. Это определение обобщает определение сравнимости целых чисел по модулю п, которое получается в случае G = Z, Н = п%. Докажем, что определенное таким образом отношение сравни- мости по модулю Н является отношением эквивалентности: 1) £ = £(mod Н), так как £-1£ = eGH; 2) если £! =£2 (mod И), т.е. g~'g2 еН, то £2 = £i (mod Н), так как g218i = (8i1S2)~leH; 3) если gj = g2 (mod Н) и g2 = g3 (mod Н), т.е. g^g2, g^g3eH, то £j =£3 (mod Н), так как = (§Г^2)(§2 ^з) еН.
176 Глава 4. Начала теории групп Классы этой эквивалентности называются (левыми) смежными классами группы G по подгруппе Н. Ясно, что смежный класс, со- держащий элемент g, имеет вид gtf = {gh:heH}. Одним из смежных классов является сама подгруппа Н. Поскольку умножение в группе не обязано быть коммутативным, мы получим, вообще говоря, другое отношение эквивалентности, взяв вместо условия (13) аналогичное ему условие gzgf’eH. (14) Классы этой эквивалентности называются правыми смежными клас- сами группы G по подгруппе Н, Они имеют вид Hg = {hg:hGH}. Заметим, что инверсия g—>g-1 устанавливает взаимно однознач- ное соответствие между множествами левых и правых смежных классов. А именно, Пример 1. Смежные классы аддитивной группы С по подгруп- пе К изображаются на комплексной плоскости прямыми, параллель- ными вещественной оси (рис. 4, а). Пример 2. Смежные классы мультипликативной группы С* по подгруппе R$. положительных чисел — это лучи, исходящие из нача- ла координат (рис. 4, б). Пример 3. Смежные классы группы С* по подгруппе T = {zGC*: |и| = 1} — это окружности с центром в начале координат (рис. 4, в).
§ 5. Разбиение на смежные классы 177 Пример 4. В случае G = GLn(K), H = SLn(K) (см. пример 1.12) условие (13), равно как и (14), означает, что detgj = detg2. Поэтому левые смежные классы в данном случае совпадают с правыми (хо- тя группа GLn(K) не абелева); каждый из них представляет собой совокупность всех матриц с определителем, равным какому-либо фиксированному числу. Пример 5. В группе G = Sn рассмотрим подгруппу Н, состоя- щую из подстановок, оставляющих на месте число п. Подстановки о-!, сг2 е Sn принадлежат одному левому смежному классу по Н, если <г1-1сг2(п) = и, т.е- если сг1(п)=сг2(п). Следовательно, имеется п левых смежных классов Рь Р2,..., Рп, где Pk = {aeSni сг(п) = к}. В то же время подстановки crltcr2^Sn принадлежат одному правому смежному классу, если a2af г(п) = п, т. е. если а1"1(п) = сг21(п). Следовательно, имеется п правых смежных классов QbQ2,..., Qn, где Qk = {creSn: cr(k) = n}. Мы видим, что при п > 2 правые смежные классы отличны от левых, за исключением класса Qn =РП =Н. Множество левых смежных классов группы G по подгруппе Н обозначается через G/Н. Число смежных классов группы G по Н (левых или правых, безразлично), если оно конечно, называется индексом подгруппы Н и обозначается через |G: Н|. Теорема 1 (теорема Лагранжа). Если G — конечная группа и Н — любая ее подгруппа, то |G| = |G:H||H|. Доказательство. Все смежные классы gH содержат одно и то же число элементов, равное |Н|. Поскольку они образуют разбиение группы G (как классы эквивалентности), порядок группы G равен произведению их числа на \Н\. □ Следствие 1. Порядок любой подгруппы конечной группы делит порядок группы. Мы уже видели это в случае циклических групп (теорема 3.2).
178 Глава 4. Начала теории групп Следствие 2. Порядок любого элемента конечной группы делит порядок группы. Доказательство. Это вытекает из следствия 1 и того, что поря- док элемента равен порядку порождаемой им циклической подгруп- пы. □ Следствие 3. Всякая конечная группа простого порядка являет- ся циклической. Доказательство. В силу следствия 1 такая группа должна совпа- дать с циклической подгруппой, порожденной любым элементом, отличным от единицы. □ Следствие 4. Если |G| = п, то gn = е для любого g е G. Доказательство. Пусть ord g = т. В силу следствия 2 имеем т | п. Значит, gn = e. □ Пример 6. Если р — простое число, то мультипликативная груп- па Z* поля Zp есть (абелева) группа порядка р - 1. Следовательно, gp-1 = 1 для любого элемента geZ*. Это означает, что ар“1 = 1 (mod р) для любого целого числа а, не делящегося на р. Последнее утвержде- ние есть так называемая малая теорема Ферма. (Другой способ ее доказательства см. в задаче 1.5.2.) Для любого п порядок группы Z* обратимых элементов коль- ца Zn, равный количеству чисел в ряде 1, 2,..., п, взаимно простых с п (см. задачу 1.5.1), обозначается через <р(п). Функция ср, опреде- ленная таким образом на множестве натуральных чисел, называет- ся функцией Эйлера. Применение следствия 4 к группе Z* дает а^(п) = 1 (mod и) для любого целого числа а, взаимно простого с и. Это обобщение малой теоремы Ферма называется теоремой Эйлера. Например, легко видеть, что (р(125) = 125 - 25 = 100. Отсюда следует, что 2100 = 1 (mod 125) — результат, полученный нами в при- мере 1.5.7 прямым вычислением. Разбиение на смежные классы естественно возникает при изуче- нии групп преобразований. Пусть G — группа преобразований множества X. Будем говорить, что точки х, у G X эквивалентны относительно G, и писать х ~ у, если существует такой элемент g G G, что у = gx. Это частный случай
§ 5. Разбиение на смежные классы 179 эквивалентности фигур, определенной в § 2, и, следовательно, — отношение эквивалентности. Класс эквивалентности точки х G X на- зывается ее орбитой. Иначе говоря, орбита точки х есть множество Gx = {gx: gGG}. В частности, транзитивные группы преобразований (см. определе- ние 2.1) —это группы преобразований, имеющие единственную ор- биту. Подгруппа Gx = {gGG: gx = x} называется стабилизатором точки х. Пример 7. Группа движений евклидовой плоскости транзитив- на. Стабилизатором начала отсчета является ортогональная груп- па О2 (см. пример 1.10). Пример 8. Орбиты группы О2 суть окружности с центром в нача- ле отсчета о и сама точка о. Стабилизатор точки р / о состоит из тож- дественного преобразования и отражения относительно прямой ор, а стабилизатор точки о — это вся группа О2. Пример 9. Группа Sn транзитивна на множестве {1, 2,..., п}. Стабилизатор числа п есть подгруппа Н 5П_Ъ рассмотренная в при- мере 5. Следующая теорема является обобщением (первой части) при- мера 5. Теорема 2. Имеется взаимно однозначное соответствие между орбитой Gx и множеством смежных классов G/Gx, при котором точке y = gxeGx соответствует смежный класс gGx. Доказательство. При gb g2 е G имеем gl=g2 (mod Gx) <=> Si'&GGx <=> «Г1?2Х = Х <=> Sl* = g2x- Таким образом, элементы одного смежного класса группы G по Gx характеризуются тем, что они переводят точку х в одну и ту же точку. Более точно, все элементы смежного класса gGx, и только они, переводят точку х в точку у = gx. Тем самым и установлено искомое соответствие. □ Число элементов орбиты Gx, если оно конечно, называется ее длиной и обозначается через |Gx|. Следствие. Если G — конечная группа, то |G| = |Gx||Gx|. (15)
180 Глава 4. Начала теории групп Из этой формулы следует, что порядки стабилизаторов всех то- чек орбиты одинаковы. На самом деле имеется точная связь между стабилизаторами точек одной орбиты, не зависящая от конечности группы G. Мы сформулируем ее в виде задачи. Задача 1. Доказать, что Ggx = SGxg~1. Пример 10. Пусть К с Е3 — куб. Рассмотрим группу его симмет- рии G = SymK = {</?€lsomE3: ^(К) = К}. Очевидно, что это конечная группа. Более того, симметрия куба полностью определяется тем, как она переставляет его вершины. Поэтому мы можем рассматривать группу G как группу преобразо- ваний множества V вершин куба К. Ввиду того что куб является пра- вильным многогранником, любую вершину куба можно перевести в любую другую с помощью преобразования из группы G. Иначе Рис. 5 говоря, группа G транзитивна на множе- стве V. Следовательно, |G| = 8|GJ, где и — какая-либо вершина. Аналогичным образом, рассматривая группу Gv как груп- пу преобразований множества ребер, выхо- дящих из у, можно показать, что |Gu| = 3|Gu>e|, где Gv е — стабилизатор в группе Gv како- го-либо ребра е, выходящего из v. Группа Gv е состоит из тождествен- ного преобразования и отражения относительно плоскости, прохо- дящей через центр куба и ребро е (см. рис. 5). Таким образом, |SymK| = 8-3-2 = 48. Задача 2. Получить тот же результат еще двумя способами, рас- смотрев группу Sym К как группу преобразований множества гра- ней и множества ребер куба соответственно. Аналогичным образом можно найти порядки групп симметрии других правильных многогранников (см. рис. 6). (По поводу опре- деления правильных многогранников см. § 7.4.)
§ 5. Разбиение на смежные классы 181 Рис. 6 Пример 11. Пусть G — группа преобразований алгебры много- членов K[*i,x2, х3, х4], состоящая из всевозможных перестановок переменных х2, х3, х4. Группа G изоморфна S4 и, следовательно, IG| = 4! = 24. Рассмотрим многочлен f = хгх2 4- х3х4. Перестановка- ми переменных из него можно получить 3 многочлена *1*2 4- х3х4, х2х3 4- х2х4, *i*4 4- х2х3. Это означает, что \Gf\ = 3. По формуле (15) находим Заметим, что, если отождествить группу G с группой S4, то Gf будет не чем иным, как подгруппой, обозначенной в примере 1.8 через Sym/. Отношение сравнимости по модулю п в аддитивной группе це- лых чисел согласовано с операцией сложения, что позволяет опре- делить операцию сложения в фактормножестве. Аналогичным об- разом можно определить операцию в множестве смежных классов группы по подгруппе и в других случаях, но не всегда. Определение 1. Подгруппа Н группы G называется нормальной, если gH = Hg VgeG (16) или, что эквивалентно, gHg~1=H VgeG. (17) В этом случае пишут Н < G (или G > Н).
182 Глава 4. Начала теории групп Для того чтобы подгруппа Н была нормальной, достаточно (но не необходимо), чтобы каждый элемент группы G был перестано- вочен с каждым элементом из Н. В частности, в абелевой группе любая подгруппа нормальна. Теорема 3. Отношение сравнимости по модулю подгруппы Н со- гласовано с операцией умножения в группе G тогда и только тогда, когда подгруппа Н нормальна. Доказательство. Согласованность отношения сравнимости по модулю Н с операцией умножения означает следующее: g!=g' (mod Н), g2=g'(mod Н) => (mod Н) или, что эквивалентно, для любых gl, g2 е G и h2 6 Н (gl^l)(g2^2)=«lg2 (mod Н). Последнее условие, согласно определению, переписывается в виде Так как g2 может быть любым элементом группы G, a hx —любым элементом подгруппы Н, то это равносильно условию нормально- сти (17). □ Задача 3. Доказать, что всякое отношение эквивалентности в группе, согласованное с операцией, есть отношение сравнимости по модулю некоторой (нормальной) подгруппы. Таким образом, если Н< G, то операция умножения в группе G определяет операцию умножения в множестве G/Н по правилу (giH)(g2H)=glg2H. Эта операция наследует ассоциативность операции в группе G. Для нее имеется единица — смежный класс еН. Каждый смежный класс gH имеет обратный, а именно g~xH. Следовательно, G/H — группа. Эта группа называется факторгруппой группы Guo Н. Очевидно, что если группа абелева, то любая ее факторгруппа также абелева. Пример 12. Факторгруппа Z/nZ есть группа вычетов Zn. Пример 13. Смежные классы группы С по R (см. пример 1) суть прямые La = {z: Im z = a} (a e R). Операция сложения в C/R задает- ся формулой La + Lb = La+b, так что факторгруппа С/R изоморфна группе R.
§ 6. Гомоморфизмы 183 Пример 14. Смежные классы группы С* по Т (см. пример 3) суть окружности Cr = {z G С*: |z| = г} (г > 0). Операция умножения в С*/Т задается формулой CrCs = Crs, так что факторгруппа С*/Т изоморфна группе 1&+. Пример 15. Как мы видели выше (см. пример 4), левые смежные классы группы GLn(K) по SLn(K) совпадают с правыми и имеют вид Ма = {A G GLn(К): det А = а} (а 6 Г). Следовательно, SLn(K) — нормальная подгруппа. Операция умноже- ния в факторгруппе задается формулой МаМь = МаЬ, так что фактор- группа GLn(K)/SLn(K) изоморфна К*. Пример 16. Подгруппа Н (изоморфная Sn_i) группы Sn, рассмот- ренная в примере 5, не является нормальной при п 3. Задача 4. Доказать, что всякая факторгруппа циклической груп- пы является циклической. Задача 5. Доказать, что группа диагональных матриц не являет- ся нормальной подгруппой группы GLn(K) при п 2 и |К| 3. § 6. Гомоморфизмы В любой алгебраической теории наряду с изоморфизмами рас- сматривают более общие отображения, называемые гомоморфизма- ми. Они отличаются от изоморфизмов тем, что не обязаны быть биективными. Тем не менее они позволяют установить полезные связи между алгебраическими структурами одного типа. Дадим точное определение гомоморфизма групп. Определение 1. Гомоморфизмом группы G в группу Н называет- ся отображение f: G —► Н, удовлетворяющее условию /(ab)=/(a)/(b) Va,bGG. Установим некоторые общие свойства гомоморфизмов групп. 1) /(е) = е. В самом деле, пусть /(е) = h GН; тогда h2 = /(e)2 = /(e2) = /(e) = h, откуда h = e. 2) /(а-1) =/(а)-1, ибо /(а)/(а-1) =/(аа-1) =/(е) = е.
184 Глава 4. Начала теории групп 3) Im/ = {/(а): а е G} есть подгруппа группы Н (называемая об- разом гомоморфизма /). Это следует из определения гомоморфизма и предыдущих свойств. 4) Ker / = {a G G: /(а) = е} есть нормальная подгруппа группы G (называемая ядром гомоморфизма /). Действительно, a, b EKerf => /(ab) = /(a)/(b) = е2 = е => ab EKerf, aEKerf => /(а"1) = /(а)“1 =е-1 =е => а“1€Кег/, е Е Кег /, aEKerf,gEG => => /(gag"1)=/(g)/(a)/(g)"1 = /(g)e/(g)“1=/(g)/(g)"1 = e => => gag-1 е Ker/. 5) /(&i) = <=* £1 = 82 (mod Ker/); в частности, гомомор- физм f инъективен тогда и только тогда, когда Ker f = {е}. Действи- тельно, /(gi) = /(g2) <=> /(gr1«2) = e <=> <=> g1“1g2GKer/ <=> gj=g2 (mod Ker/). Таким образом, гомоморфизм f:G-+H является изоморфизмом (т. е. биективен) тогда и только тогда, когда Im f = Н и Ker f = {е}. В этом случае иногда пишут /: G^H. Если группы G и Н изоморф- ны (т.е. существует изоморфизм f: GН), то пишут G^H. Гомоморфизм группы в себя называется ее эндоморфизмом. Изо- морфизм группы на себя называется ее автоморфизмом. Пример 1. Пусть К — произвольное кольцо. Свойство дистрибу- тивности а(Ь 4-с) = ab 4- ас означает, что отображение х>->ах (умно- жение слева на а) является эндоморфизмом аддитивной группы кольца К. (Аналогичное утверждение справедливо и для умножения справа.) Пример 2. Пусть G — произвольная аддитивная (соответствен- но мультипликативная) абелева группа. Тогда для любого п Е Z отоб- ражение х—>пх (соответственно х—>хп) является эндоморфизмом группы G. (Для неабелевой группы это, вообще говоря, неверно.) В случае G = С* ядром этого гомоморфизма является группа Сп кор- ней п-й степени из 1. Пример 3. Согласно основному свойству экспоненты, отображе- ние х ех является гомоморфизмом аддитивной группы R в мульти-
§ 6. Гомоморфизмы 185 пликативную группу R*. Его образ — это подгруппа R?J. положитель- ных чисел, а ядро тривиально. Пример 4. Отображение х cos х -I- i sin х является гомоморфиз- мом группы R в группу С*. Его образ есть Т, а ядро — Пример 5. Формула умножения определителей означает, что отображение det: GL„ (К) -> К*, А —> det А, является гомоморфизмом. Его ядро — это унимодулярная группа SLn(K). Пример 6. Назовем знаком подстановки a G Sn и обозначим че- рез sgn а произведение знаков верхней и нижней перестановки в ее записи (см. пример 1.1): sgn (7 '2 " i" )=sgn(i1,i2>...)in)-sgn(j1J2,.... j„). Это произведение не зависит от способа записи подстановки ст, так как от любого способа записи можно перейти к любому другому последовательными транспозициями столбиков, а при каждой та- кой транспозиции одновременно меняются знаки верхней и ниж- ней перестановок, так что их произведение сохраняется. Основное свойство знака состоит в том, что отображение sgn: Sn-»С2 = {±1}, ст->Sgn ст, является гомоморфизмом. В самом деле, перемножая подстановки (тит, мы можем считать, что верхняя перестановка в записи а совпадает с нижней перестановкой в записи т: Ч t::: & Ч 1И- Тогда Ч Й ::: Й- так что sgn <7Т = sgn(t1, i2,in) • sgn(kb k2>kn) = = [sgn(ib i2,i„) sgnQb j2,jn)] x x [sgn (я, j2,j„) sgn(kv k2,k,,)] = = sgn т • sgn a = sgn a sgn t.
186 Глава 4. Начала теории групп Ядро гомоморфизма sgn называется знакопеременной группой и обозначается через Ап. Употребляется также следующая терми- нология: подстановки сг, для которых sgn ст = 1 (соответственно sgncr = -l), называются четными (соответственно нечетными). Таким образом, Ап — это подгруппа четных подстановок. Задача 1. Вывести следующую формулу для знака циклической подстановки: sgn(i1i2...ip) = (-l)₽-1. Используя это, доказать, что знак любой подстановки равен (-l)m-s, где т — число фактически переставляемых ею (т. е. не оставляемых на месте) символов, as — число независимых циклов, в произведе- ние которых она разлагается. Теорема 1 (о гомоморфизме групп). Пусть f: G-^H — гомомор- физм групп. Тогда Im/^G/Ker/. Более точно, имеется изоморфизм ip: Im/^G/Ker/, ставящий в соответствие каждому элементу h = f(g) G Im f смеж- ный класс g Ker/. Доказательство. Доказательство этой теоремы аналогично до- казательству теоремы 5.2. Из доказанного выше свойства 5) следует, что все элементы смежного класса g Ker f, и только они, переходят при гомоморфизме f в элемент h = /(g) G Im/. Тем самым показано, что отображение ip, о котором идет речь в теореме, корректно опре- делено и биективно. Остается проверить, что ip — гомоморфизм. Пусть gi,g2GG, /(gi) = hi, /(g2) = h2. Тогда/(g}g2) = h1h2 и V (W = S1S2 Ker f = (£1 Ker /) (g2 Ker f) = ip (hjiptj^), что и требовалось доказать. □ Следствие. Если группа G конечна, то |G| = |Im/||Ker/|. (Интересно сравнить эту формулу с формулой (15).) Пример 7. Рассмотрим гомоморфизм /: С->R, 2b->Imz.
§ 6. Гомоморфизмы 187 Имеем Im f = R, Ker f = R, так что C/R^R — результат, уже полученный нами в примере 5.13. Пример 8. Рассмотрим гомоморфизм /:C*-»R;, z —|z|. Имеем Im f=R^, Ker f = T = {z e C*: |z| — 1}, так что c‘/t^r; — результат, уже полученный нами в примере 5.14. Пример 9. Отображение /:С^Т, z~A также является гомоморфизмом, причем Imf = Т, Ker f = R^. Следо- вательно, C*/R^T. (Соответствующее разбиение на смежные классы было описано в примере 5.2.) Пример 10. Рассмотрим гомоморфизм f: R -* Т, х —> cos 2пх 4- i sin 2 лх (ср. пример 4). Так как Ker/ = Z, то мы получаем, что R/Z^T. Пример 11. Аналогичным образом рассмотрение гомоморфиз- ма det из примера 5 приводит к тому, что GLn(K)/SLn(K)^K* — результат, уже полученный в примере 5.15. Пример 12. Рассмотрение гомоморфизма sgn из примера 6 при- водит к тому, что при и > 1 SnMn — ^2’ В частности, отсюда следует, что Ип| = |п!.
188 Глава 4. Начала теории групп Пример 13. Согласно определению (см. §2), всякое аффинное преобразование f есть произведение параллельного переноса и ли- нейного преобразования <р. Последнее называется линейной ча- стью или дифференциалом преобразования f и обозначается че- рез df. Формула ^<p)(tbV0 = ta+9,(b)W’> полученная при доказательстве предложения 2.1, показывает, что отображение d: GAn(K)—»GLn(K), f^df, является гомоморфизмом. Очевидно, что Im d = GLn (К), Ker d = Trans (К”), так что GAn(K)/Trans(Kn) ^GLn(K). Пример 14. Пусть А = А1А2А3— правильный треугольник. Со- поставив каждому движению е Sym Д подстановку cr е S3 по пра- вилу ^(А/) Аащ, мы получим гомоморфизм /: Sym A-»S3. Так как всякое движение плоскости, оставляющее на месте 3 точки, не лежащие на одной прямой, тождественно, то Кег/ = {id}. До- кажем, что Im/ = S3. Так как 1т/ — подгруппа группы S3 и груп- па S3 порождается транспозициями, то достаточно проверить, что любая транспозиция принадлежит 1т/, т. е. может быть осуществ- лена некоторым движением <р G Sym Д. Но д3 это действительно так: например, транспози- А ция (12) осуществляется отражением относи- / [ \ тельно прямой I, показанной на рис. 7. Таким / ] \ образом, / ] \ SymA^S3. £-----------н--Аналогично доказывается, что группа симмет- 1 • 2 рии правильного тетраэдра изоморфна S4 (про- Рис. 7 делайте это!).
§ 6. Гомоморфизмы 189 Пример 15. При перестановках переменных х2, х3, х4 много- члены Х]Х2 + *3*4> *1*з + х2х4> *1*4 +*2*3 (18) переставляются между собой. Занумеровав их каким-либо образом, мы получим гомоморфизм /:S4-S3. Докажем, что Im f = S3. Для этого достаточно проверить, что любая транспозиция многочленов (18) может быть осуществлена некото- рой перестановкой переменных х2, х3, х4. Но это действитель- но так: например, транспозиция первых двух многочленов (18) мо- жет быть осуществлена транспозицией переменных х2 и х3. Далее, Ker f — это так называемая четверная группа Клейна У4 = {е, (12)(34), (13)(24), (14)(23)}. По теореме о гомоморфизме V4 <S4 и S4/V4 ~S3. Легко видеть, что группа V4 изоморфна группе из примера 1.7. Задача 2. Доказать, что для любого п G N имеет место следую- щий «парадоксальный» изоморфизм: с*/сл-с*. Задача 3. Пусть р — простое число. Найти порядки групп GL2(Zp) и SL2(Zp). Очевидно, что композиция гомоморфизмов F -+ G и G —♦ Н есть гомоморфизм F-+H. Пример 16. Рассмотрим композицию гомоморфизмов det: GLn(R)R* и sgn: R*—>C2 = {±1}, где sgn обозначает знак вещественного числа. Мы получим таким образом гомоморфизм £ • GLn(R) —> С2. При п = 2 он имеет следующий геометрический смысл: если е(А) = 1 (соответственно е(А) = -1), то линейное преобразование простран- ства Е2, определяемое матрицей А, сохраняет (соответственно ме- няет) ориентацию в том смысле, что любой положительно ориенти- рованный базис оно переводит в положительно (соответственно от- рицательно) ориентированный базис. Аналогичная интерпретация возможна и при п = 3.
190 Глава 4. Начала теории групп Пример 17. Композиция гомоморфизмов d: GAn (R) -> GLn (R) и е : GLn (R) С2 есть гомоморфизм GAn(R)—>С2. (19) При п = 2 и 3 это позволяет распространить на аффинные преобра- зования евклидовой плоскости и евклидова пространства понятие сохранения или изменения ориентации. А именно, аффинное пре- образование сохраняет (соответственно меняет) ориентацию, если его дифференциал сохраняет (соответственно меняет) ориентацию. В частности, можно говорить о движениях, сохраняющих или меня- ющих ориентацию (что мы уже делали раньше, не давая точного определения). Пример 18. Пусть G С Isom Еп (п = 2 или 3) — какая-либо под- группа, содержащая движения, меняющие ориентацию. Рассматри- вая ограничение на G гомоморфизма (19), мы приходим к выводу, что подмножество движений из G, сохраняющих ориентацию, есть подгруппа индекса 2. Будем обозначать эту подгруппу через G+. Пример 19. В частности, подгруппу Sym+ К с Sym К будем на- зывать группой вращений куба К. Так как |SymK| = 48 (см. при- мер 5.10), a Sym+ К есть подгруппа индекса 2, то |Sym+K| = 24. Докажем, что Sym+K~S4. Для этого занумеруем каким-либо образом 4 диагонали куба К и по- ставим в соответствие каждому движению G Sym+ К подстановку, осуществляемую им на множестве диагоналей. Мы получим гомо- морфизм /: Sym.,. К—>S4. Докажем, что Im f = S4, откуда уже будет следовать, что f — изомор- физм, поскольку iSym^Kl = |S4|. Для этого достаточно проверить, что любая транспозиция принадлежит 1т/. Но это действительно так: например, транспозиция (12) осуществляется поворотом на п вокруг прямой I, изображенной на рис. 8. Задача 4. Доказать, что группа D4 (группа симметрии квадрата) изоморфна группе SymCqA^ + ^A^) (см. примеры 1.8 и 5.11).
§6. Гомоморфизмы 191 Задача 5. Доказать, что SL2(Z2) ^S3. Согласно определению операции в факторгруппе G/N, отобра- жение a:G->G/N, g-*gN, является гомоморфизмом. Оно называется каноническим гомомор- физмом группы G на факторгруппу G/N. Его ядром, очевидно, явля- ется подгруппа N. Пусть f: G Н — любой сюръективный гомоморфизм. Поло- жим Ker f = N. Согласно теореме 1, Н G/N и, если отождествить Н с G/N при помощи указанного там изоморфизма, гомоморфизм f совпадет с каноническим гомоморфизмом группы G на G/ЛЛ По- этому теорему 1 можно понимать таким образом, что никаких сюръективных гомоморфизмов групп, кроме канонических гомо- морфизмов на факторгруппы, в сущности, не существует.
Глава 5 Векторные пространства Эта и последующие две главы будут посвящены линейной ал- гебре, начала которой были изложены в гл. 2, и связанной с ней геометрии. Линейная алгебра является наиболее прикладным раз- делом алгебры. Ее аппарат так же необходим любому математику, как аппарат математического анализа. Следует, однако, предостеречь читателя от взгляда на линейную алгебру как на манипулирование с матрицами — взгляда, игнориру- ющего ее идеологию, в частности геометрические образы, скрываю- щиеся за ее понятиями. Читатель, пошедший по этому легкому пути, много потеряет. Он будет испещрять формулами десятки страниц или перегружать компьютер в ситуациях, очевидных для того, кто действительно владеет линейной алгеброй. За исключением общих определений, некоторых примеров и тех случаев, когда будет оговорено противное, все векторные простран- ства в главах, относящихся к линейной алгебре, предполагаются конечномерными. Основное поле, если это не есть какое-то конкрет- ное поле, обозначается буквой К, § 1. Подпространства Всякий базис подпространства U векторного пространства V можно дополнить до базиса всего пространства. Таким образом мы получим базис, в котором данное подпространство U выглядит весьма просто, а именно, натянуто на несколько первых базисных векторов. Определение 1. Базис пространства V называется согласован- ным с подпространством U, если U является линейной оболочкой какой-то части базисных векторов (т. е. одним из «координатных подпространств» относительно этого базиса). Так, на рис. 1, а) базис {еь е2} согласован с подпространством I/, а на рис. 1, б) — нет.
§ 1. Подпространства 193 Согласно сказанному выше для всякого подпространства суще- ствует согласованный с ним базис. Пусть теперь имеются два подпространства U, W с V. Очевидно, что их пересечение U П IV также является подпространством. Это наибольшее подпространство, содержащееся как в U, так и в IV. Определение 2. Суммой U + W подпространств U и IV называет- ся совокупность векторов вида и + w, где и е U, tv е IV. Это наименьшее подпространство, содержащее как U, так и IV. Иными словами, это линейная оболочка объединения U и IV. Теорема 1. Для всякой пары подпространств Uf IV С V существу- ет базис пространства V, согласованный с каждым из подпрост- ранств U, IV. Доказательство. Пусть {еь ..., ер} — базис подпространства U п АIV. Дополним его какими-то векторами ер+1,..., ек до базиса под- пространства U и, с другой стороны, векторами ek+1, ...,ек+[_р — до базиса подпространства IV. (Здесь р = dim U АIV, k = dim U, I = = dim IV.) Докажем, что векторы elt..., ек+1_р линейно независимы. Дополнив их затем до базиса подпространства V, мы и получим базис, согласованный как с U, так и с IV. Предположим, что к+/-р S А,е,. = О. 1=1 Рассмотрим вектор к к+1—р х = S ^iei = ~ S ^iei- i=l i=k+l Из первого представления вектора х следует, что он лежит в U, а из второго — что он лежит в IV. Таким образом, х е U АIV и, значит, р к+1-р х=Т.^е1 = - S А<ег i=l i=k+l
194 Глава 5. Векторные пространства Так как векторы еьер, efc+1,..., ek+i_p линейно независимы, то отсюда следует, что х = 0 и Л, = О при i = k + 1, ...,к + 1- р. Далее, так как векторы elfек линейно независимы, то из равенства к £Л(е,=О 1=1 следует, что Л( = 0 при i = 1,..., к. □ Рисунок 2 иллюстрирует это доказательство в случае р = 1, к = =J = 2. Следствие. dim([/ + IV) = dim U + dim IV - dim([/ ПIV). Доказательство. В обозначениях доказательства теоремы 1 век- торы еь ek+i-p составляют базис подпространства U + IV, так что dim«J + IV) = k + Z-p. □ Для трех подпространств теорема, аналогичная теореме 1, невер- на. Задача 1. Привести пример, подтверждающий это высказыва- ние. Теорема 1 описывает взаимное расположение пары подпрост- ранств. Взаимное расположение произвольного (конечного) числа подпространств описать, вообще говоря, сложно (и в некотором смысле даже невозможно). Однако нас будет в первую очередь
§ 1. Подпространства 195 интересовать один важный частный случай, когда это сделать просто. Определение 3. Подпространства 1^,..., U* называются линей- но независимыми, если из равенства 4-... 4- = 0 (u, G Ц) следует, что u1 = ... = uk = 0. Для двух подпространств U, W линейная независимость равно- сильна тому, что U п IV = 0. Напрашивающееся обобщение для лю- бого числа подпространств неверно. Задача 2. Привести пример трех линейно зависимых подпрост- ранств, все попарные пересечения которых равны нулю. Определение 4. Суммой 14 + ...4-14 подпространств U19..., Ukc с V называется совокупность векторов вида u j 4-... 4- ик, где u, G . Это наименьшее подпространство, содержащее все подпростран- ства U19..., ик. Предложение 1. Следующие свойства системы подпространств ..., Uk с V равносильны: 1) U19..., Uk линейно независимы; 2) объединение базисов подпространств Ult ...,Uk линейно неза- висимо; 3) dimCt/i 4-... 4- (4) = dim Щ 4-... 4- dim Uk. Доказательство. 1) <=» 2). Пусть {еп,..., е1П.} — базис подпрост- ранства Ui (i = 1, ...,k). Предположим, что между векторами ei} (i = 1,..., к, j = 1,..., nJ имеется нетривиальная линейная зависи- мость: =0. Тогда сумма векторов Xi = SVvel/i (i = l,...,k) J равна нулю, причем не все они равны нулю. Следовательно, подпро- странства Ulf..., Uk линейно зависимы. Обратно, если подпространства Ulf ...,Uk линейно зависимы, то существуют векторы х( GLT, (i = 1,..., к), не все равные нулю, сумма которых равна нулю. Разложив каждый из них по базису своего под- пространства, мы получим нетривиальную линейную зависимость между векторами е^. 2) <=> 3). Так как объединение базисов подпространств UlfUk порождает сумму иг 4-... 4- Uk, то каждое из свойств 2) и 3) рав- носильно тому, что это объединение является базисом пространст- ва L4 4-... 4- Uk. Следовательно, эти свойства равносильны между собой. □
196 Глава 5. Векторные пространства Определение 5. Говорят, что векторное пространство V разлага- ется в прямую сумму подпространств Ulf..., Uk, если 1) подпространства Ult ...,Uk линейно независимы; 2) иг + ... + U^V. В этом случае пишут V = LJ1®...©[Jk. Каждый вектор и G V однозначно представляется в виде и = tq +... ... + ик, где щ G Up, вектор и, называется проекцией вектора и на подпространство Подчеркнем, что проекция вектора на подпро- странство U( зависит не только от этого подпространства, но и от остальных слагаемых разложения. Пример 1. Квадратная матрица А называется симметричной, если Ат = А, и кососимметричной, если Ат = —А. Симметричные (соответственно кососимметричные) матрицы образуют подпро- странство L+(K) (соответственно L~(K)) в пространстве Ln(K) всех матриц. При условии, что char К 0 2, всякая матрица А может быть представлена в виде суммы симметричной и кососимметричной матриц: А=|(А + АТ) + |(А-АТ). С другой стороны, при том же условии очевидно, что матрица, симметричная и кососимметричная одновременно, равна нулю. Это означает, что ljk) = l+(K)©l;(K). Пример 2. Аналогично доказывается, что пространство всех функций на вещественной прямой является прямой суммой подпро- странств четных и нечетных функций. (В этом примере векторное пространство и оба подпространства бесконечномерны.) Пример 3. Пусть {е}, ...,еп} — базис векторного пространства V. Тогда У = (е1)ф...ф(еп). Проекция вектора хе V на (е^ равна х&, где х, есть i-я координата вектора х в базисе {еь ...,еп}, и зависит не только от ef, но и от остальных векторов базиса. Определения 3, 4 и 5 могут быть распространены на бесконеч- ное число подпространств, если рассматривать только такие суммы
§ 2. Линейные отображения 197 векторов, в которых лишь конечное число слагаемых отлично от нуля. Пример 4. Пусть А = К[хь ..., хп] — алгебра многочленов от п переменных. Обозначим через Ad подпространство однородных многочленов степени d. Так как всякий многочлен однозначно представляется в виде суммы однородных многочленов различных степеней, то м А = А0ФА1ФА2Ф...= ФАр При этом d=0 ^d+e* (1) Разложение какой-либо алгебры А в прямую сумму подпрост- ранств Ad (d GZ), удовлетворяющее условию (1), называется ее гра- дуировкой. Алгебра, снабженная градуировкой, называется градуи- рованной алгеброй. (Некоторые из подпространств Ad могут быть нулевыми. Так, в приведенном выше примере Ad = 0 при d < 0.) Задача 3. Пусть А = Ln (К) — алгебра матриц. Обозначим че- рез Ad линейную оболочку матричных единиц Еу с j -i = d. Дока- зать, что подпространства Ad задают градуировку алгебры А. (Здесь Ad= 0 при |d| п.) § 2. Линейные отображения Подобно гомоморфизмам групп естественно рассматривать го- моморфизмы векторных пространств. Их принято называть линей- ными отображениями. Определение 1. Пусть V и U — векторные пространства над по- лем К. Отображение (/?: V-+U называется линейным, если 1) (p(a + b) = (p(a) + (/?(b) для любых a, be V; 2) (Aa) = А<р (а) для любых A G К, а G V. Это определение отличается от определения изоморфизма век- торных пространств тем, что в нем не требуется биективности. Усло- вие 1) означает, что отображение ср должно быть гомоморфизмом аддитивных групп. Из общих свойств гомоморфизмов групп следует, что ср(О) = О, </?(-a) = -^(a), (/?(a-b) = (p(a)-(/?(b).
198 Глава 5. Векторные пространства Пример 1. Поворот есть линейное отображение (и даже изомор- физм) пространства Е2 в себя (рис. 3). у?(а+Ь)= а Ла Рис. 3 Пример 2. Ортогональное проектирование на плоскость опреде- ляет линейное отображение (но не изоморфизм) пространства Е3 в пространство геометрических векторов этой плоскости. Пример 3. Дифференцирование является линейным отображе- нием пространства непрерывно дифференцируемых функций на за- данном промежутке числовой прямой в пространство непрерывных функций на этом промежутке. Линейное отображение ср: V —► U однозначно определяется об- разами базисных векторов пространства V. В самом деле, пусть {ef: iel} — базис пространства V; тогда для любого вектора х = = ^х1е1 имеем i С другой стороны, если G U (ieV) — произвольные векторы, то отображение (p:V—*U, определяемое по формуле i как легко видеть, является линейным и = щ. Эти соображения позволяют получить аналитическое описание линейных отображений. Пусть ср: V —» U —линейное отображение конечномерных векторных пространств. Выберем в пространствах V и U какие-нибудь базисы {ег,..., еп} и {Д,..., fm}. Применим отоб- ражение к векторам elf...,en и разложим полученные векторы
§ 2. Линейные отображения 199 пространства U по базису {/ь ..., fm}: + a2jf2 +... + amjfm = £ a.jfi- i Числа ay (i = 1, 2,..., m, j = 1,2,п) образуют матрицу А размера гп x п, которая называется матрицей линейного отображения ср в выбранных базисах пространств V и U. Согласно этому определе- нию в j-м столбце матрицы А стоят координаты образа j-го базис- ного вектора пространства V в выбранном базисе пространства U. В матричных обозначениях это можно записать следующим обра- зом: ((p(e1),...)^(en)) = (/1,...>/m)A (ср. формулу (8) перехода к другому базису в § 2.2). Найдем теперь выражение координат у19..., ут образа у = </?(х) вектора хе V через координаты х1}..., хп вектора х. В силу линейно- сти отображения ip имеем У = Ч> (s V;) = S XjipCej) = S aijXjfi, j j i,j * = £ aijxj = ...,m). j=i откуда (2) Если обозначить через X и Y столбцы координат векторов х и у соответственно, то равенства (2) можно переписать в следующей матричной форме: У = АХ. (Ср. формулу (9) преобразования координат в § 2.2.) Пример 4. В пространстве Е2 * * выберем ортонормированный ба- зис {elfe2}. Пусть ip— поворот на угол а. Тогда (см. рис. 4) ^р(е1) = Cj cos а + е2 sin а, ip (е2) = — Cj sin а + е2 cos а. Это означает, что матрица отображения ср есть cos a -sin а sin a cos а (4)
200 Глава 5. Векторные пространства Заметим, что в данном случае V = U и мы использовали один и тот же базис {еь е2} в двух качествах: как базис пространства V и как ба- зис пространства U, хотя, согласно определению, не обязаны были это делать. Пример 5. Найдем матрицу проектирования из примера 2. В плоскости проектирования выберем любой базис {е},е2} и допол- ним его ортогональным вектором е3 до базиса пространства. Так как при проектировании векторы Ci и е2 переходят сами в себя, а вектор е3 — в нуль, то искомая матрица (относительно выбранных базисов) имеет вид 1 0 ОА 0 1 0/ Как и для любого гомоморфизма групп, для линейного отображе- ния ср: V —► U определяются его образ Im ср = {(/?(а): a е V} с U, и ядро Кегср = {аеУ: <p(a) = 0}cV. Они являются не только подгруппами, но и подпространствами со- ответствующих векторных пространств, т. е. замкнуты относитель- но умножений на любые числа. Покажем, например, что Ker р — подпространство в V. Если a е Кег р, т. е. ср (а) = 0, то для любого ЛеК р (Ла) = Хр (а) = Л0 = 0, т.е. ЛаеКегр. Пример 6. Ядром отображения проектирования из примера 2 является совокупность векторов, ортогональных плоскости проек- тирования. Пример 7. Ядром отображения дифференцирования из приме- ра 3 является совокупность постоянных функций, а образом — про- странство всех непрерывных функций. Последнее следует из суще- ствования первообразной у каждой непрерывной функции, доказы- ваемого в анализе. Согласно общим свойствам гомоморфизмов групп, установлен- ным в § 4.6, линейное отображение р: V U инъективно тогда и только тогда, когда Кег р = 0, а в общем случае полный прооб- раз любого вектора b = р(а) е Im р есть смежный класс а + Кег р.
§ 2. Линейные отображения 201 Последнее утверждение есть «бескоординатная» форма утвержде- ния 2) теоремы 2.1.3 (а утверждение о том, что Кег — подпростран- ство, есть бескоординатная форма утверждения 1) этой теоремы). Что можно сказать о размерностях образа и ядра линейного отоб- ражения конечномерных векторных пространств? Теорема 1. Если в каких-то базисах пространств V uU линейное отображение V -+U имеет матрицу А, то dim Im ср = rk А. Доказательство. Очевидно, что Im ср есть линейная оболочка образов базисных векторов е1,...,еп пространства V и, значит, dim Im ip есть ранг системы векторов (рСеД ..., <р(еп). Но в столб- цах матрицы А как раз и записаны координаты этих векторов в каком-то базисе пространства U. Следовательно, ранг этой системы векторов равен рангу матрицы А. □ Теорема 2. dim Im (р + dim Ker = dim V. Доказательство. Выберем базис пространства V специальным образом: сначала возьмем базис {е1? ...,ек} подпространства Кег ср, а затем дополним его какими-то векторами ед.+1, ...,еп до базиса пространства V. Так как по построению =... = = 0, то Докажем, что векторы (р(ек+1),..., ср (еп) линейно независимы, отку- да и будет следовать утверждение теоремы. Пусть *1 (efc+i) + •. + А„-к¥> (е,,) = 0. Рассмотрим вектор a = A]efc+i + ... + An_fcen. Предыдущее равенство означает, что ср (а) = 0, т. е. аеКег(р = (е1, ...,ек). Так как е1?..., ек, ек+1, ...,еп линейно независимы, то это возможно только при А} =... = An_k = 0, что и требовалось доказать. □ Записывая отображение ср в координатах, мы можем из теорем 1 и 2 вывести теорему 2.3.3 о размерности пространства решений системы однородных линейных уравнений. Таким образом, понятие линейного отображения позволяет получить более простое доказа- тельство теоремы 2.3.3.
202 Глава 5. Векторные пространства Пример 8. Пусть X — множество ребер тетраэдра и У — множе- ство его граней. Каждой функции f на X со значениями в поле К по- ставим в соответствие функцию g на У, определяемую следующим образом: g(y)= L fM, хс.у т. е. значение функции g на какой-либо грани равно сумме значений функции f на сторонах этой грани. Этим определяется линейное отображение <p:F(X, К) — F(y, К) (см. пример 1.6.2). Докажем, что если char К 02, то оно сюръектив- но. Для этого достаточно показать, что Im ср содержит 5-функции всех граней (см. пример 2.2.7). Функция /, для которой (р(/) есть 5-функция нижней грани, изображена на рис. 5, а) (ее значения на непомеченных ребрах равны нулю). Так как dim F (X, X) = 6, dim F (У, X) = 4, то по теореме 2 dim Кег (р = 6-4 = 2. Функции, составляющие базис подпространства Кег <р, изображены на рис. 5, б). Задача 1. Для отображения <р из предыдущего примера найти dim Кег <р в случае, когда char К = 2. Обратимся теперь к операциям над линейными отображениями. Линейные отображения V -♦ U можно складывать и умножать на числа, как обычные функции: ((р + 'ф)(а) = (р(а) + 'ф(а), (Лср)(а) = Л(р(а).
§ 2. Линейные отображения 203 Относительно этих операций они образуют векторное простран- ство. Далее, если 4>:V-*U, Tp:W-*V —линейные отображения, то их произведение (композиция) W->U есть также линейное отображение. В самом деле, (<^)(а + Ь) = </>(!/; (а + Ь)) = </>(i/)(a) +ч/>(Ь)) = = <p(i/>(a)) + = (</>^)(а) + (</”/’)№), (</’’/’) (Ла) = </> (i/> (Ла)) = у (Лт/Ча)) = Л(/?(ч/) (а)) = Л (<р-ф) (а). Умножение линейных отображений связано с линейными опера- циями свойствами </?(1/> + о)) = </я^ + <ро), (<р +1/>) <«> = </? со+ (Л<^)1/> = <^(Л1/>) = Л(^) УЛбК. Докажем, например, первое из свойств дистрибутивности. Пусть xp:W—*V, a>:W-+V —линейные отображения. Для любого а е IV имеем (</> (i/> + со)) (a) = ((i/> + со) (а)) = </> (i/> (а) + со (а)) = = (со(а)) = (</?i/>)(a) + (</?со)(а) = (<pi/> + </>со)(а). Умножение линейных отображений ассоциативно, как и вообще умножение любых отображений. В самом деле, пусть M,N,P,Q. — какие-то множества и 4>:N-*M, ip:P-+N, oj:Q->P — какие-то отображения. Тогда для любого a G Q имеем ((</>V>)co)(a) = (</>i/>)(co(a)) = </>(i/>(co(a))), (</>(’/’ co))(a) = </?((i^to)(a)) = <^(i/>(a)(a))), откуда (</?V’)co = </>('t/’to).
204 Глава 5. Векторные пространства Операции над линейными отображениями соответствуют таким же операциям над их матрицами. Для линейных операций это оче- видно. Докажем это для умножения. Пусть — линейные отображения с матрицами А = (а^) и В = (bjk) в бази- сах {е1? ...,en}, {flf {gi, ...,gp} пространств V, U, W соответ- ственно. Тогда = </>(№)) = ¥» (S bjkej) = E bjk</>(ej) = £ а0Ь}к//, j j ij Следовательно, матрица отображения угр есть С = (cik), где cik == S j Это означает, что С = АВ, что и требовалось доказать. Пример 9. Матричное равенство, доказанное в примере 1.8.2, на языке линейных отображений означает, что произведение пово- ротов плоскости на углы а и Р есть поворот на угол а + р (см. при- мер 4). Поскольку последнее утверждение геометрически очевидно, это дает доказательство формул для косинуса и синуса суммы двух углов. Свойства операций над матрицами, полученные нами в § 1.8 пря- мыми вычислениями, могут быть теперь выведены из соответствую- щих свойств операций над линейными отображениями. Очевидно, что тождественное отображение id: V — V линейно. Матрица тождественного отображения id: V -* V в двух одинаковых базисах пространства V есть единичная матрица Е. По- этому свойства единичной матрицы (см. формулу (10) §1.8) есть просто перевод на матричный язык очевидных равенств <p-id = (p, id •(/? = (/?, где ср: V -♦ V — линейное отображение, задаваемое матрицей A, a id в первом случае обозначает тождественное отображение простран- ства V, а во втором — тождественное отображение пространства U- Напомним, что отображение множеств обратимо тогда и только тогда, когда оно биективно. Если : V —* U — биективное линейное
§ 3. Сопряженное пространство 205 отображение, то обратное отображение с/?"1: U —► V также линейно. В самом деле, для любых a, b G U пусть с, d G V — такие векторы, что ip(с) = а, <р(d) = b; тогда <р(с + d) = а + b и, следовательно, (£-1(a + b) = c + d = (^“1(a) Аналогично проверяется и второе свойство линейности. Очевидно, что линейное отображение ip: V —► U биективно тогда и только тогда, когда Im ip = U и Ker ip = 0. В этом случае оно явля- ется изоморфизмом, а матрицей обратного отображения (в тех же базисах) служит матрица, обратная матрице <р. Задача 2. Используя линейные отображения, доказать, что ранг произведения двух матриц (не обязательно квадратных) не превос- ходит ранга каждой из них (теорема 2.3.5), а если одна из этих матриц невырожденна, то ранг произведения равен рангу другой матрицы. § 3. Сопряженное пространство Векторные пространства представляют мир, в котором живут персонажи линейной алгебры. Простейшими из них, помимо векто- ров, являются линейные функции, которые, как мы увидим, в неко- тором смысле двойственны векторам. Напомним определение линейной функции, введенное нами в §2.4. Определение 1. Линейной функцией (или линейной формой) на векторном пространстве V называется всякая функция а: V К, обладающая свойствами 1) а(х + у) = а(х) + а(у); 2) а(Лх) = Ла(х). Иными словами, линейная функция — это линейное отображе- ние пространства V в поле К, рассматриваемое как (одномерное) векторное пространство. Пример 1. Как доказывается в курсе элементарной геометрии, функция а(х) = (а, х) (а GE3) является линейной функцией на про- странстве Е3. Пример 2. Функция a(f) = /(х0) (х0 £ X) является линейной функцией на пространстве F(X, К) функций на множестве X со значениями в К (см. пример 1.6.2).
206 Глава 5. Векторные пространства Пример 3. Функция а(/) = /'(*о) (*о е является линейной функцией на пространстве С1®) дифференцируемых функций на вещественной прямой. ь Пример 4. Функция а(/) = j f(x) dx является линейной функ- цией на пространстве С [а, Ъ] непрерывных функций на отрезке [а, Ы. Пример 5. Следом квадратной матрицы называется сумма ее диагональных элементов. След матрицы X обозначается через trX. Функция а(Х) = trX является линейной функцией на пространстве Ln(K) квадратных матриц. Если хь ..., хп —координаты вектора х в базисе {е1?..., еп}, то а(х) = +... + апхп, (5) где а, = аСе,). Таким образом, линейная функция однозначно опре- деляется своими значениями на базисных векторах, называемыми ее коэффициентами в данном базисе. Коэффициенты могут быть произвольными: для любых аь ..., ап еК функция а, определяемая формулой (5), является линейной. Линейные функции образуют подпространство в пространстве F(V, К) всех функций на V со значениями в К. Определение 2. Пространство линейных функций на V называ- ется сопряженным пространством по отношению к V и обозначает- ся через V*. Пусть {еь ..., еп}— базис пространства V. Линейные функции ..., еп G V*, определяемые равенствами e,(x) = х1? называются ко- ординатными функциями относительно базиса {е1? ...,еп}. Они со- ставляют базис пространства V*, который называется сопряженным базисом по отношению к {е1?..., еп}. Из его определения следует, что для любого вектора х G V x = Ylei(x')ei. (6) Сопряженный базис может быть также определен условиями &i (Cj) бу 1 при/= 7, 0 при/0; (символ Кронекера). Из предыдущего следует, что dim V* = dim V, так что пространства V и V* изоморфны, хотя между ними и не существует никакого есте- ственного (выделенного) изоморфизма. Однако второе сопряжен-
§ 3. Сопряженное пространство 207 ное пространство V** = (V*)* оказывается естественно изоморфным пространству V. Из определения операций в пространстве V* следует, что для любого вектора хе V функция fx на V*, определенная по формуле /Х(а) = а(х), является линейной. Теорема 1. Отображение x*-+fx является изоморфизмом прост- ранства V на пространство V**. Доказательство. Из определения линейных функций следует, что fx+y = fx + fy и /л* = Л/х. Остается проверить, что отображе- ние х —>/х биективно. Пусть {elf...,en}— базис пространства V и {q,..., еп} — сопряженный базис пространства V*. Тогда /е, &ij> так что {fe},fen} — базис пространства V**, сопряженный базису {^1,..., еп}. Отображение х —► Д переводит вектор с координатами хь ..., хп в базисе {е1э..., еп} пространства V в вектор с такими же координатами в базисе {Д ,Д} пространства V**. Следователь- но, оно биективно. □ В дальнейшем мы будем отождествлять пространства V и V** посредством указанного изоморфизма, т. е. рассматривать каждый вектор х G V одновременно и как линейную функцию на V* (и пи- сать х(а) вместо fx(а)). При таком соглашении пространства V и V* будут играть совершенно симметричную роль. Следствие. Всякий базис пространства V* сопряжен некоторо- му базису пространства V. Задача!. Показать, что линейные функции elf...,en (где п = = dim V) составляют базис пространства V* тогда и только тогда, ко- гда не существует ненулевого вектора х G V, для которого (х) =... ... = еп(х) = 0. Задача 2. Пусть V — пространство многочленов степени $ п над полем К. Показать, что линейные функции е0, elfеп> определяе- мые равенствами М/)=ЛХ(), где х0,хь ...,хп —различные элементы поля К, составляют базис пространства V*, и найти сопряженный базис пространства V. По- казать, что формула (6) в этом случае превращается в интерполяци- онную формулу Лагранжа.
208 Глава 5. Векторные пространства Задача 3. Пусть V то же, что и в задаче 2, причем char К = 0. Показать, что линейные функции е0, ..., еп> определяемые равен- ствами где х0 G К, составляют базис пространства V*, и найти сопряженный базис пространства V. Показать, что формула (6) в этом случае пре- вращается в формулу Тейлора. Замечание 1. Теорема 1 неверна для бесконечномерных пространств. Если пространство V бесконечномерно, то пространство V* и, тем более, V** имеют большую размерность. Например, пусть V = K°° — пространство финитных последовательностей (см. пример 2.2.9). Это пространство счет- номерно. Линейные функции на нем имеют вид a(xj,x2, ...) = а1х1+а2х2 + ... (ввиду финитности последовательности (хьх2,...) сумма фактически ко- нечна). Здесь аь а2,... могут быть произвольными элементами поля К. По- этому пространство V* изоморфно пространству всех последовательно- стей, которое, как можно показать (попробуйте это сделать!), несчетно- мерно. Имеется естественное взаимно однозначное соответствие меж- ду подпространствами пространств V и V*, при котором каждому k-мерному подпространству пространства V соответствует (и - к)- мерное подпространство пространства V* (где n = dim V). Определение 3. Аннулятором подпространства U с V называет- ся подпространство U° = {aGV*: a(x) = 0 VxGl7}. Теорема 2. dim UQ = dim V - dim U. Доказательство. Пусть — такой базис пространства V, что U = (еь ..., ек), и {еъ ..., еп} — сопряженный базис простран- ства V*. Тогда U° = (ек+1, □ В соответствии с нашим отождествлением пространств V** и V мы можем говорить об аннуляторе подпространства W с V* как о подпространстве пространства V. По определению W° = {xGV: a(x) = 0 VaGW}. Теорема 3. (17°)° = U для любого подпространства U с V.
§ 4. Билинейные и квадратичные функции 209 Доказательство. В обозначениях доказательства теоремы 2, яс- но, что ((J0)° = (e1, ...,ek) = U. □ Следствие. Любое подпространство в V является аннулятором некоторого подпространства в V*. Пусть имеется система однородных линейных уравнений S 0,^ = 0 (i = l, (7) j=i Будем интерпретировать ..., хп как координаты вектора х п-мер- ного векторного пространства V в некотором базисе {еь ...»еп}. То- гда система (7) может быть записана в виде «i(x) = 0 (i = l, ...,m), где аъ ат G V* —линейные функции, стоящие в левых частях уравнений (7). Множество решений этой системы представляет со- бой аннулятор подпространства (аь ..., ат) С V*. Заметим, что раз- мерность этого подпространства равна рангу матрицы коэффициен- тов системы (7). Поэтому теорема 2.3.3 о размерности пространства решений системы однородных линейных уравнений является непо- средственным следствием теоремы 2. Следствие теоремы 3 в этом контексте может быть сформулиро- вано так: Теорема 4. Всякое подпространство является множеством ре- шений некоторой системы однородных линейных уравнений. § 4. Билинейные и квадратичные функции Аксиоматика векторного пространства не охватывает еще всей элементарной геометрии векторов евклидова пространства, по- скольку в этой аксиоматике отсутствуют такие понятия, как дли- на вектора и угол между векторами. Длина и угол могут быть выражены через скалярное произведение векторов. Одним из ос- новных свойств скалярного умножения геометрических векторов является его линейность по каждому множителю. В этом параграфе мы рассмотрим функции двух векторных аргументов, являющиеся обобщением скалярного умножения. Определение 1. Билинейной функцией (или билинейной фор- мой) на векторном пространстве V называется функция а: V х V —> -*К, линейная по каждому аргументу.
210 Глава 5. Векторные пространства Пример 1. Как доказывается в курсе элементарной геометрии, скалярное умножение геометрических векторов является билиней- ной функцией на пространстве Е3. Пример 2. Функция Гь “(/>?) = /(x)g(x)dx Ja является билинейной функцией на пространстве С [а, Ъ]. Пример 3. Функция а(Х, У) = 1гХУ является билинейной функцией на пространстве Ln(X). Пример 4. Определитель матрицы второго порядка как функ- ция ее строк есть билинейная функция на пространстве К2. Пусть {еь ..., еп} — базис пространства V. Тогда для векторов х = = S xieb У = S yjej получаем < j а(х, У) = L где aij = (8) i>j Матрица А = (а^) называется матрицей билинейной функции а в ба- зисе {elf...,en}. Как видно из предыдущей формулы, билинейная функция однозначно определяется своей матрицей. Формула (8) может быть переписана в матричных обозначениях: а(х,у) = ХтАУ, (9) где X и У — столбцы координат векторов х и у соответственно. При переходе к другому базису (е/1,...,е/п) = (е1,...,еп)С координаты векторов х и у преобразуются по формулам Х = СХ', Y = CY'. Подставляя эти выражения в (9), получаем а(х, у) = (Х')ТСТАСУ', откуда следует, что в базисе {e'v ...,е'п} матрица функции а равна А' = СТАС. (10)
§ 4. Билинейные и квадратичные функции 211 Основная задача теории билинейных функций — это приведе- ние матрицы билинейной функции к возможно более простому ви- ду за счет выбора подходящего базиса. В связи с этим важно знать свойства матрицы билинейной функции, которые не зависят от вы- бора базиса. Определение 2. Ядром билинейной функции а называется под- пространство Кег а = {у G V: а(х, у) = 0 Vx G V}. Функция а называется невырожденной, если Кег а = 0. Все билинейные функции, рассмотренные в примерах 1—4, невырожденны. Так, невырожденность скалярного умножения сле- дует из того, что (у, у) > 0 при у 0 0. Аналогично доказывается невырожденность билинейной функции в примере 2. Задача 1. Доказать невырожденность билинейных функций в примерах 3 и 4. Очевидно, что если {еь ..., еп} — базис пространства V, то Кег а = {у GV: a(eh у) = 0, i = l,..., и}. Записывая эти условия в координатах, получаем систему однород- ных линейных уравнений, матрицей коэффициентов которой слу- жит матрица А функции а. Следовательно, dim Ker а = п - rk А. (11) В частности, Кег а = 0 тогда и только тогда, когда rk А = п, т. е. когда матрица А невырожденна. Из формулы (11) следует, что ранг матрицы билинейной функ- ции а не зависит от базиса. Он называется рангом билинейной функ- ции а и обозначается через rk а. Определение 3. Билинейная функция а называется симметри- ческой (соответственно кососимметрической), если а(х, у) = а (у, х) (соответственно а(х, у) = — а(у, х)) для любых х, у G V. Так, билинейные функции в примерах 1 и 2 симметричны. Билинейная функция в примере 3 также симметрична. В самом деле, если X = (Ху), Y = (уу), то tr XY = £ ХцУц = S УцХц = £ УцХц = tr YX. i,j iJ i,j
212 Глава 5. Векторные пространства Билинейная функция в примере 4 кососимметрична. Но, конечно, существуют билинейные функции, которые не являются ни симмет- рическими, ни кососимметрическими. Билинейная функция является симметрической (соответственно кососимметрической) тогда и только тогда, когда ее матрица А сим- метрична (соответственно кососимметрична), т. е. АТ = А (соответ- ственно Ат = — А). Определение 4. Пусть а — симметрическая билинейная функ- ция над полем К характеристики /2. Функция q: V ->К, определяе- мая по формуле q(x) = a(x,x), называется квадратичной функцией (или квадратичной формой), ассоциированной с функцией а. В координатах квадратичная функция записывается в виде qM = Yiaijxixj) (12) i,j т. е. является однородным многочленом второй степени. Симметрическая билинейная функция а может быть восстанов- лена по соответствующей квадратичной функции q по формуле a(x,y) = i[q(x + y)-q(x)-q(y)]. (13) Билинейная функция а называется поляризацией квадратичной функции q. Таким образом, имеется взаимно однозначное соответствие меж- ду симметрическими билинейными и квадратичными функциями. Имея в виду это соответствие, все понятия, относящиеся к сим- метрическим билинейным функциям (матрица, ранг, невырожден- ность и т.д.), переносят на квадратичные функции. В дальнейшем изложении мы будем из соображений удобства иногда говорить о симметрических билинейных, иногда — о квадратичных функциях. Геометрические ассоциации, связанные со скалярным умноже- нием векторов, могут быть полезны при изучении произвольных билинейных функций. Этим объясняется вводимая ниже термино- логия. Пусть а — симметрическая или кососимметрическая билиней- ная функция над полем К характеристики /2. Векторы х,у eV называются ортогональными (относительно а), если а(х, у) = 0;
§ 4. Билинейные и квадратичные функции 213 в этом случае пишут х ±у. Ясно, что это отношение симметрично: если х ±у, то и у ±х. Отметим, что в случае кососимметрической функции а каждый вектор ортогонален самому себе. Определение 5. Ортогональным дополнением к подпростран- ству U (относительно а) называется подпространство U1 = {yeV: а(х,у) = 0 Vxel/}. В частности, У1 = Кег а. Предложение 1. Если функция а невырожденна, то dim U1 = dim V - dim U и (U^y^U. Доказательство. Пусть {е1?..., ек} — базис в U. Тогда U1 = {у е V: а(е(., у) = 0, i = 1,..., к}. (14) Записывая эти условия в координатах, мы получаем систему одно- родных линейных уравнений. Эти уравнения линейно независимы, так как для любых ..., Лк, не равных нулю одновременно, линей- ная функция k z к х £Л,а(е(,у) = а( i=l М=1 J в силу невырожденности функции а не является нулевой. Следова- тельно, dim U1 = n-k, где n = dim V. По той же формуле dimtU1)1 = п-(п-к) = к = dim U. Однако ясно, что ((У1)1 О, Следовательно, ((У1)1 = U. □ Определение 6. Подпространство U называется невырожден- ным относительно билинейной функции а, если ее ограничение на U невырожденно. Предложение 2. V = U Ф (У1 тогда и только тогда, когда под- пространство U невырожденно. Доказательство. Из (14) ясно, что в любом случае dim U1 dim V — dim U. С другой стороны, U П СУ1 = Кег а|а,
214 Глава 5. Векторные пространства так что если U П U1 = 0, то подпространство U невырожденно. Об- ратно, если подпространство U невырожденно, то U П U1 = 0 и dim(C7 + U1) = dim U + dim U1 dim V, откуда следует, что U + U1 = V. □ Пусть а — симметрическая билинейная функция. Базис {е1?..., еп} пространства V называется ортогональным (от- носительно а), если его векторы попарно ортогональны. В орто- гональном базисе матрица функции а диагональна, а сама функ- ция а и соответствующая ей квадратичная функция q записываются в виде a(x,y) = aiX1y1 + ...+anxnyn, (15) q(x) = aix2 + ... + anx2. (16) Теорема 1. Для любой симметрической билинейной функции су- ществует ортогональный базис. Доказательство. Докажем это утверждение индукцией по п = = dim V. При п = 1 доказывать нечего. Пусть п > 1. Если а = 0, то доказывать опять-таки нечего. Если а 0, то в силу формулы (13) q £ 0, т. е. существует такой вектор еь что a(e1,e1) = q(e1)0O. Согласно предложению 2, У = (е1)ф(е1)±. По предположению индукции существует ортогональный базис {е2, ...,еп} пространства (ej)1. Добавляя к нему вектор еь мы по- лучаем ортогональный базис {е1? е2,..., еп} пространства V. □ Следующая теорема дает более явный способ построения орто- гонального базиса (при ограничениях, указанных в ее формулиров- ке). Пусть {еь ...,еп}— некоторый базис пространства V и А — мат- рица функции а в этом базисе. Обозначим через Ак матрицу огра- ничения функции а на подпространство Vk = (еь ...,ек) в базисе {е1? ...,efc} этого подпространства, т.е. левый верхний угол поряд- ка к матрицы А. Число 5к = det Ак будем называть угловым минором порядка к матрицы А. Положим также Уо = 0, 50 = 1. Теорема 2. Если все угловые миноры 5lf..., 5п матрицы А от- личны от нуля, то существует единственный ортогональный базис
§ 4. Билинейные и квадратичные функции 215 {/i,..., fn} пространства V, удовлетворяющий условиям fkZek + Vk-г (к = 1,и). (17) При этом q(fk^^fk,fk) = ^- (k = l,...,n). (18) °k-l Доказательство. Докажем теорему индукцией по п. При и = 1 имеем Л=е„ ?(Л> = 5,(=^)- При и > 1 применим предположение индукции к базису {е1?..en_i} пространства УП_Р Пусть {Д, — ортогональный базис про- странства Уп_ь удовлетворяющий условиям теоремы. Будем искать вектор fn в виде п-1 fn ^ifi + Vn_i. i=l Заметим, что q(Z) = ^y#o при1=1,...,п-1, и поэтому условия ортогональности о = a(/n, fi) = а(еп, Л) + (/f) (i = 1,.... и - 1) удовлетворяются при подходящем выборе чисел при- чем эти числа определяются однозначно. Так как fn ф Уп_1? то {/1, •••> /п) — базис пространства V. Остается проверить равенство (18) при к = п. Так как матрица пе- рехода от базиса {еь..., еп} к базису {f19..., fn} является (верхней) унитреугольной (т. е. треугольной с единицами на диагонали), то ее определитель равен 1 и формула (10) показывает, что определитель матрицы функции а не меняется при переходе к базису {j\,..., fn}. Однако в этом базисе матрица функции а диагональна, причем ее диагональные элементы равны q(/i),...,q(/n-i),q(/n). Следовательно, 5n = q(/i)-q(/n-i)q(/n)-
216 Глава 5. Векторные пространства Такое же рассуждение, примененное к ограничению функции а на подпространство (или, если угодно, предположение индукции), показывает, что Отсюда следует, что Процесс построения ортогонального базиса, описанный в дока- зательстве теоремы, называется процессом ортогонализации Гра- ма—Шмидта. Рисунок 6 иллюстрирует его в случае, когда а — скалярное умножение в Е3. Пусть {еь — базис пространства V, ортогональный отно- сительно функции а. За счет нормировки векторов et числа а, = q (ef) можно умножать на квадраты любых ненулевых элементов поля К. Кроме того, переставляя базисные векторы, можно переставлять и эти числа. Однако, как видно из доказательства теоремы 1, в выбо- ре ортогонального базиса имеется гораздо больший произвол. Как можно изменять числа а,, пользуясь этим произволом? Ответ на этот вопрос существенно зависит от поля К. Пусть К = С. Тогда путем нормировки базисных векторов чис- ла at могут быть сделаны равными 1 или 0, и после подходящей перестановки базисных векторов функция q приводится к так назы- ваемому нормальному виду: qM=xl + ... + x^. Число г является инвариантом, так как r = rkq.
§4. Билинейные и квадратичные функции 217 Пусть теперь К = К. Тогда путем нормировки базисных векторов числа а, могут быть сделаны равными ±1 или 0, и после подходящей перестановки базисных векторов функция q приводится к нормаль- ному виду: q(x) = xf +... + х2 - х2+1 - ... - х2+(. (19) Сумма к +1 = rk q является инвариантом, но являются ли инвариан- тами к и I по отдельности? Для ответа на этот вопрос введем одно важное понятие. Определение 7. Вещественная квадратичная функция q называ- ется положительно определенной, если q(x) > О при х / 0. Веще- ственная симметрическая билинейная функция называется положи- тельно определенной, если соответствующая ей квадратичная функ- ция положительно определенна. Так, скалярное умножение геометрических векторов является положительно определенной симметрической билинейной функ- цией. Очевидно, что нормальный вид положительно определенной ква- дратичной функции есть х* + ... + х?, т.е. в некотором базисе ее матрица единичная и, в частности, имеет определитель 1. Из форму- лы (10) следует, что при переходе к другому базису определитель ее матрицы умножается на квадрат определителя матрицы перехода и, значит, остается положительным. Таким образом, определитель мат- рицы положительно определенной квадратичной функции в любом базисе положителен. Теорема 3. Число к в нормальном виде (19) произвольной веще- ственной квадратичной функции q есть максимальная размерность подпространства, на котором функция q положительно опреде- ленна. Доказательство. Очевидно, что функция q положительно опре- деленна на k-мерном подпространстве (еь ..., ек). Пусть теперь U — произвольное подпространство, на котором функция q положитель- но определенна, и W = (ek+1, ...,еп). Так как q(x) 0 при хе W, то U П W = 0. Отсюда следует, что dim U к. □ Аналогично определяются отрицательно определенные квадра- тичные и симметрические билинейные функции. Так же, как и вы- ше, доказывается, что число I в нормальном виде квадратичной функции q есть максимальная размерность подпространства, на ко- тором функция q отрицательно определенна. Впрочем, это и пря-
218 Глава 5. Векторные пространства мо следует из теоремы 3, если ее применить к квадратичной функ- ции -q. Следствие (закон инерции). Числа к и I в нормальном виде (19) вещественной квадратичной функции q не зависят от выбора бази- са, в котором эта функция имеет нормальный вид. Эти числа называются соответственно положительным и отри- цательным индексами инерции квадратичной функции q (а также соответствующей симметрической билинейной функции а). Пара (к, /) называется сигнатурой функции q (или функции а). Пример 5. Квадратичная функция q(x) = XjX2 путем (невырож- денного) преобразования координат x^xj+x', x2=xj-x' приводится к виду q(x) = х'2 - х'22. Поэтому ее сигнатура равна (1,1). Задача 2. Найти сигнатуру симметрической билинейной функ- ции из примера 3 (в случае К = Ю. Теорема 2 позволяет (при указанных в ней ограничениях) опре- делить индексы инерции вещественной квадратичной функции по угловым минорам 5Ь 5П ее матрицы в каком-либо базисе. Теорема 4 (метод Якоби). Если все угловые миноры 5к матрицы вещественной квадратичной функции q отличны от нуля, то от- рицательный индекс инерции функции q равен числу перемен знака в последовательности l^S,,...^. (20) (Определение числа перемен знаков в последовательности веще- ственных чисел см. в § 3.4.) Доказательство непосредственно следует из теоремы 2. □ Заметим, что в условиях теоремы функция q невырожденна, так что сумма ее индексов инерции равна п. Следствие (критерий Сильвестра). Вещественная квадратич- ная функция является положительно определенной тогда и только тогда, когда все угловые миноры ее матрицы положительны. Доказательство. Если все угловые миноры положительны, то, в частности, они отличны от нуля, и применение метода Якоби до- казывает, что функция является положительно определенной. Об- ратно, если функция положительно определенна, то ее ограничение
§ 4. Билинейные и квадратичные функции 219 на любое подпространство Vk (в обозначениях теоремы 2) также по- ложительно определенно и, согласно замечанию перед теоремой 3, определитель 5к его матрицы положителен. □ Замечание 1. Модифицируя процесс ортогонализации, можно показать (попробуйте это сделать), что метод Якоби годится и в том случае, когда некоторые из угловых миноров равны нулю, лишь бы в последовательности 6^62,...,5п не было двух нулей подряд (в частности, может быть 5П = 0, но тогда должно быть 5n-i / 0). При этом если 5к = 0 при каком-то к < п, то автоматически <0. Как мы видели, в случаях К = С или R никакие изменения диаго- нального вида матрицы квадратичной функции, кроме тех, которые достигаются уже путем перестановки базисных векторов и их умно- жения на числа, невозможны, но так обстоит дело не всегда. Пусть К = — поле вычетов по простому модулю р / 2. Известно (см. теорему 9.1.7), что %* — циклическая группа. Следовательно, (Z*)2 = = {а2: aeZ*} — подгруппа индекса 2. Ее элементы называются квадратич- ными вычетами, а элементы второго смежного класса — квадратичными невычетами. Пусть е G Z* — фиксированный квадратичный невычет. Теорема 5. Всякая невырожденная квадратичная функция над полем Zp (р # 2) может быть приведена к одному из двух видов x^...+х^+х2, Х12 + ...+Хп2_1+£Хп2 в зависимости от того, является определитель ее матрицы квадратич- ным вычетом или невычетом. Лемма 1. Всякая невырожденная квадратичная функция q в векторном пространстве размерности п 2 над полем Zp представляет единицу, т. е. уравнение q(x) = 1 имеет решение. Доказательство. Достаточно рассмотреть случай п = 2. Можно считать, что qM=a1xf + а2х2, где аь а2 /0. Уравнение q(x) = 1 может быть представлено в виде 01^=1-02^2- Когда Xi пробегает поле Zp, левая часть последнего уравнения принимает различных значений. Аналогично, когда х2 пробегает поле Zp, правая
220 Глава 5. Векторные пространства Р 4" 1 w гр часть этого уравнения принимает различных значении. Так как то существуют такие и х2, при которых левая и правая части принимают одно и то же значение. □ Доказательство теоремы 5. Следуя доказательству теоремы 1, при п > 1 будем выбирать вектор е1 так, чтобы qCeJ = 1, что возможно в силу предыдущей леммы. Так как при переходе к другому базису определитель матрицы квадратичной функции умножается на квадрат определителя матрицы перехода, то q(en) будет квадратичным вычетом или невычетом одновременно с определителем матрицы функции q в любом базисе. □ Задача 3. Доказать, что произвольная (не обязательно невырожден- ная) квадратичная функция q над Zp может быть приведена ровно к одному из двух видов Xl + ...+Xr-j+Х*, Xj + .^+x^j+ex^, где r = rkq. Рассмотрим теперь кососимметрические билинейные функции. Здесь нас ожидает приятный сюрприз: строение этих функций ока- зывается не зависящим от поля К. Пусть а — кососимметрическая билинейная функция в п-мер- ном векторном пространстве V. Базис {еь ...,еп} пространства V называется симплектическим (относительно а), если a(e2k-l> e2k) = —а(е2к> e2k-l) = 1 При k = 1, a(eh €j) = 0 во всех остальных случаях. Иначе говоря, матрица функции а в этом базисе имеет вид
§ 5. Евклидово пространство 221 где число диагональных клеток равно т. Очевидно, что при этом rka = 2m. Теорема 6. Для любой кососимметрической билинейной функ- ции существует симплектический базис. Доказательство. Докажем это утверждение индукцией по п. При п = 1 доказывать нечего. Пусть п > 1. Если а = 0, то доказывать опять-таки нечего. Если а^О, то существуют такие векторы е2 и е2, что а(е1э е2) # 0. Домножив один из этих векторов на подходящее число, можно добиться того, чтобы а(е1,е2) = -а(е2,е1) = 1. Матрица ограничения функции а на (еъе2) в базисе {еъе2} име- ( 0 П ет вид I- j 0 1 и, в частности, невырожденна. Согласно предложе- нию 2, V = (e1)e2)®(ei,e2)±. По предположению индукции в пространстве (е1,е2)1 существует симплектический базис {е3, е4,..., еп}. Добавляя к нему векторы е} и е2, мы получаем симплектический базис {еь е2, е3, е4,..., еп} пространства V. □ Следствие. Ранг кососимметрической билинейной функции все- гда является четным числом. § 5. Евклидово пространство Свойства операций над геометрическими векторами, включая скалярное умножение, находят наиболее полное отражение в поня- тии евклидова векторного пространства. Определение 1. Евклидовым (векторным) пространством на- зывается вещественное векторное пространство с фиксированной положительно определенной симметрической билинейной функ- цией. Обычно эта фиксированная билинейная функция называется скалярным умножением и обозначается (,). Пример 1. Пространство геометрических векторов с обычным скалярным умножением. Пример 2. Пространство со скалярным умножением (х,у) = х1у1 + ... + х„уп, гдех = (х1; ...,хп),у = (уъ...,у„).
222 Глава 5. Векторные пространства Пример 3. Пространство С2 [0,1] непрерывных функций на от- резке [0,1] со скалярным умножением Г1 (f,g) = fMgWdx. (21) Jo В евклидовом пространстве определяются длина вектора и угол между векторами таким образом, что в случае геометрических век- торов они совпадают с обычной длиной и обычным углом. А имен- но, длина |х | вектора х определяется по формуле |х| = У(х,х). Для определения угла необходимо сначала доказать Предложение 1. Для любых векторов х, у евклидова простран- ства |(х,у)|$|х||у|, (22) причем равенство имеет место тогда и только тогда, когда векто- ры х и у пропорциональны. Неравенство (22) называется неравенством Коши—Буняковс- кого. Доказательство. Если у = Лх, то |(х,у)| = |Л||(х,х)| = |Л||х|2 = |х||у|. Если векторы х и у не пропорциональны, то они составляют базис двумерного подпространства. Матрица скалярного умножения на этом подпространстве в базисе {х, у} имеет вид f(x,x) (х,уП 1(х,у) (y,y)J‘ Ввиду положительной определенности скалярного умножения ее определитель должен быть положителен; но это и означает, что |(х,у)|<|х||у|. □ Пример 4. Для евклидова пространства С2[0,1] из примера 3 неравенство Коши—Буняковского означает, что /(x)g(x)dx^ < (J (/(x))2dx^ (J (g(x))2dx^ (23)
§ 5. Евклидово пространство 223 для любых непропорциональных непрерывных функций f и g на отрезке [0,1]. В частности, при g = 1 мы получаем, что G1 \2 Г1 /(x)dx < (f(x))2dx (24) о J Jo для любой непостоянной непрерывной функции f. Угол лу между ненулевыми векторами х и у евклидова простран- ства определяется по формуле — (х, у) COS ху= . J И1у| В частности, угол ху равен 0 или л тогда и только тогда, когда век- торы х и у пропорциональны; ху = л/2 тогда и только тогда, когда векторы х и у ортогональны. Неравенство Коши—Буняковского является частным случаем бо- лее общего неравенства, относящегося к произвольной конечной системе векторов {аь ..., ак} евклидова пространства. Определение 2. Матрица называется матрицей Грама системы векторов {а1?..., ак}. Теорема 1. Для любых векторов а}, ..., ак евклидова пространст- ва справедливо неравенство detG(ab ..., ak) ^0, причем равенство имеет место тогда и только тогда, когда векто- ры а1}ак линейно зависимы. Доказательство. Если 2 = 0, то Л, (а,, а;)=0 при всех j, а i i это означает, что линейная комбинация строк матрицы G(a1?..., ак) с коэффициентами Лг,...,Хк равна нулю. Поэтому если векторы аь ...,ак линейно зависимы, то det G(alt..., ак) = 0. Если же они линейно независимы, то так же, как в случае к = 2, доказывается, что detG(a1? ...,afc) >0. □ Задача 1. Получить соотношение между двугранными углами тетраэдра, рассмотрев матрицу Грама системы единичных векторов,
224 Глава 5. Векторные пространства ортогональных его граням. С помощью этого соотношения найти двугранный угол правильного тетраэдра. Определение 3. Базис евклидова пространства, в котором ска- лярное умножение имеет нормальный вид (см. §4), называется ор- тонормированным. Ортонормированность базиса {е1? ...,еп} означает, что матрица скалярного умножения в этом базисе (т. е. матрица G(eb еп)) является единичной матрицей или, иными словами, что базисные векторы попарно ортогональны и имеют длину 1. Согласно общей теории, в любом конечномерном евклидовом пространстве существует ортонормированный базис. Такой базис, конечно, не единствен. Дадим описание всех ортонормированных базисов, исходя из какого-либо одного ортонормированного базиса {в},..., еп}. Пусть (вр ..., еп) (вр ..., еп)С. Тогда матрица скалярного умножения в базисе {е',..., е'п} имеет вид СТЕС = СТС. (см. формулу (10)). Следовательно, базис {е'р ...,е'} является орто- нормированным тогда и только тогда, когда СТС = Е, (25) т. е. когда матрица Ст обратна матрице С. Определение 4. Матрица С, для которой С-1 = Ст, называется ортогональной. Равенство (25) означает следующие соотношения между элемен- тами матрицы С: Sch% = 50 при всех i.j. к Условие ортогональности также может быть записано в виде ССТ = Е, (26) что означает следующие соотношения между матричными элемен- тами: Цс1ксА = 5у при всех i,j. к Заметим, что из равенства (25) следует соотношение det С = ±1 (но не наоборот!).
§ 5. Евклидово пространство 225 Ограничение скалярного умножения на любое подпростран- ство U евклидова пространства V также является положительно определенной и потому невырожденной симметрической билиней- ной функцией, и предложение 4.2 показывает, что у=и®и1. Это означает, что для каждого вектора х G V имеется единственное представление в виде x = y + z, уе[/, zgLT1. (27) Вектор у называется (ортогональной) проекцией вектора х на подпространство U и обозначается через рг^ х; вектор z называется ортогональной составляющей вектора х относительно подпростран- ства U и обозначается через ortu х. Если {вх,...,е^}— ортонормированный базис подпространст- ва U, то проекция рга х может быть найдена по формуле k Pryx=S(x)ei)ei. (28) 1=1 Более общо, если {e1? ...,efc}— ортогональный (но не обязательно ортонормированный) базис подпространства U, то (29) Для построения ортогонального базиса евклидова пространст- ва V может быть применен процесс ортогонализации, описанный в доказательстве теоремы 4.2. В предыдущих обозначениях, если {е1? ...,еп}— какой-либо базис пространства V, то базис {j\, ...,/п}, получаемый в результате ортогонализации, задается формулами fk = ortyki ek (k = 1,...»п). (30) Пользуясь тем, что {f19..., fk-i} — ортогональный базис пространст- ва Vk_lt проекцию prVfc ек и, тем самым, вектор fk можно найти по формуле (29). Пример 5. Пусть V — пространство многочленов степени 3 со скалярным умножением (21). Применим процесс ортогонализации к базису вх = 1, е2 = х, е3 = х2, е4 = х3.
Глава 5. Векторные пространства 226 Заметим, что (е.«, е.) = т—4—Имеем A=ei = i, = /2 = е2-ЦиНЛ=Х4’ (/2,/2) = (/2,е2) = ^. =вз ~ (Х/г)^2 ~ =*2 _Х+ 6’ ™ = ^3’ «з) = 180> f-Р (е4>/з), (е4,/2) (e4,/i)f_ 3 3 2,3 1 Л 4 (/з>/зГ3 (Л./гГ2 (/1./1)71 2* + 5* 20’ (/4» /4) = (А> е4) = 2800’ Задача 2. Применяя процесс ортогонализации к столбцам мат- рицы, доказать, что каждая матрица AeGLn(lR) может быть един- ственным образом представлена в виде А = ОВ, где О — ортогональ- ная матрица, а В — треугольная матрица с положительными элемен- тами на диагонали. Определим расстояние р между векторами евклидова простран- ства по формуле р(х,у) = |х-у|. Это расстояние удовлетворяет аксиомам метрического пространст- ва, в частности аксиоме треугольника p(x,z)^p(x,y) + p(y,z). (31) Неравенство (31) следует из неравенства |х + у| |х| + lyl, (32) которое, в свою очередь, легко выводится из неравенства Коши— Буняковского (проделайте это!) Расстояние между подмножествами X и Y метрического прост- ранства определяется по формуле р(Х,У)= inf р(х,у). Теорема 2. Расстояние от вектора х евклидова пространства V до подпространства U с V равно |orta х|, причем единственным бли- жайшим к х вектором подпространства U является рга х.
§ 5. Евклидово пространство 227 Доказательство. См. рис. 7, где у = pry х, z = ortu х. любого у' е U, у' / у, имеем: р(х, у'} = |z'| = ^/|z|2 + |u|2 > \z\=p(x, у). □ Пример 6. В силу вычислений, проделанных в предыдущем при- мере, квадратным трехчленом, ближайшим к х3 в смысле метрики пространства С2[0,1], является |х2 - |х + причем расстояние от х3 до этого трехчлена равно ^~=. Следующая теорема дает явную формулу для расстояния от век- тора х до подпространства U, заданного произвольным базисом Теорема 3. (рСх, И)! = detg(e[.. Доказательство. Если х е U, то р (х, 17) = 0 и det G (е,,..., ек, х) = = 0, так что доказываемая формула верна. Пусть х$ U и z = orty х- Применяя теорему 4.2 к базису {е^,... .... ек, х} пространства UФ (х), получаем Izl2 = fz z) - ^±1 = detG(ei>-»ebX) 11 1 ’ } 5k 4е1С(е1,...,е0 ’ что и требовалось доказать. □ Полученная формула может быть применена к вычислению объ- ема параллелепипеда в евклидовом пространстве. Параллелепипедом, натянутым на векторы аь евклидова пространства, называется множество P(ai. ...,a„) = {Sxiai: O^Xi^l}. Основанием этого п-мерного параллелепипеда называют (и — 1)- мерный параллелепипед Р(аъ ..., an-i), а его высотой — длину век- тора ort(fl]>_>a j an. При п = 2, 3 это согласуется с терминологией
228 Глава 5. Векторные пространства элементарной геометрии. Руководствуясь известными формулами для площади параллелограмма и объема трехмерного параллелепи- педа, примем следующее индуктивное Определение 5. Объемом п-мерного (п>1) параллелепипеда на- зывается произведение объема его основания на высоту. Объемом одномерного параллелепипеда Р(а) называется длина вектора а. Объем параллелепипеда Р обозначается через volP. Теорема 4. (volP(aj, ...,an))2 = detG(a1, ...,an). Доказательство. Докажем эту формулу индукцией по п. При п = 1 она верна по определению. При п > 1 имеем, согласно опре- делению, volPCax, ...,an)=volP(a1, -h, где h — длина вектора ort(aj>_>a j an, т. е. расстояние от вектора ап до подпространства {alf ...,0,^). Используя предположение индук- ции и теорему 3, получаем = det G(alf..., an). □ В частности, мы видим, что, хотя основание параллелепипеда и зависит от того, какой из заданных векторов мы считаем «послед- ним», объем параллелепипеда в смысле данного выше определения зависит лишь от самого параллелепипеда. Наряду с формулами для площади параллелограмма и объема трехмерного параллелепипеда все это служит неплохим обоснованием приведенного определения, однако по-настоящему убедительное обоснование может быть полу- чено лишь в рамках теории меры, объясняющей, что вообще следу- ет называть объемом множества. Пусть векторы а19 ...,ап выражаются через векторы какого-ни- будь ортонормированного базиса {еь при помощи матри- цы А: (аь ...,ап) = (е1, ...,еп)А. Теорема 5. уо1Р(а1; ...,an) = |detA|. Доказательство следует из того, что G(a1,...,an) = ATEA = ATA и, значит, detGfai, ...,an) = (det А)2. □
§ 5. Евклидово пространство 229 Доказанное равенство можно понимать как «геометрический смысл» числа |det А|. Что касается знака числа det А, то он может быть истолкован как ориентация системы векторов {аь ап} (по отношению к базису {е1эеп}). Напомним, что при введении определителей порядка п в § 2.4 мы как раз руководствовались тем, что определители порядков 2 и 3 задают ориентированную площадь параллелограмма и ориентированный объем параллелепипеда соот- ветственно. В §2.2 было показано, что строение векторного пространства (над данным полем) зависит лишь от его размерности. Верно ли то же самое для евклидовых векторных пространств? Для того чтобы ответить на этот вопрос, надо прежде всего понять, какие евкли- довы пространства следует считать «одинаково устроенными» или, точнее, изоморфными. Естественно принять следующее Определение 6. Евклидовы векторные пространства V и U на- зываются изоморфными, если существует биективное отображение f: V —> U, являющееся изоморфизмом векторных пространств и удо- влетворяющее условию (/(a),/(b)) = (a,b) Va,bGV. Само отображение f называется при этом изоморфизмом прост- ранств V и U. Ясно, что изоморфными могут быть только евклидовы простран- ства одинаковой размерности. Оказывается, верно и обратное. Теорема 6. Любые два евклидовых векторных пространства оди- наковой (конечной) размерности изоморфны. Доказательство. Пусть V и U — какие-то n-мерные евклидовы пространства. Выберем в них ортонормированные базисы {^,..., уп} и {иь ..., ип} соответственно, и пусть f: V —► U — изоморфизм век- торных пространств, переводящий ц в u, (i = 1,..., п). Тогда (/(ц), /(^)) = (и,-, uj) = = (ц, у;), откуда по линейности вытекает, что (/(а),/(Ь)) = (а,Ь) для любых a, b GV. □ В частности, любое двумерное (соответственно трехмерное) ев- клидово пространство устроено совершенно так же, как Е2 (соот- ветственно Е3). Пользуясь этим, в тех случаях, когда рассматрива-
230 Глава 5. Векторные пространства емые векторы лежат в двумерном или трехмерном подпростран- стве, для доказательства каких-либо утверждений о них можно при- влекать теоремы элементарной геометрии. Например, таким спосо- бом можно доказать неравенство Коши—Буняковского (22), нера- венство треугольника (31) и теорему 2. § 6. Эрмитовы пространства При желании ввести метрику в комплексном векторном прост- ранстве подобно тому, как это делается в вещественном простран- стве, мы наталкиваемся на ту трудность, что в комплексном прост- ранстве не существует положительно определенных квадратичных функций. Эту трудность можно обойти, введя в рассмотрение так на- зываемые полуторалинейные функции (не очень удачный термин, но лучшего не придумано). Определение 1. Пусть V — комплексное векторное простран- ство. Функция а: V х V —>С называется полуторалинейной, если она линейна по второму аргументу и антилинейна по первому. Последнее означает, что а(х! + х2, у) = а(хь у) + а(х2, у), а(Ах,у) = Аа(х,у). Замечание 1. Иногда требуют, чтобы полуторалинейная функ- ция была, наоборот, линейна по первому аргументу и антилинейна по второму. Теория полуторалинейных функций аналогична теории били- нейных функций. Поэтому мы изложим ее кратко, останавливаясь более подробно лишь в тех местах, где имеется существенное раз- личие. Пусть {en ...,еп}— базис пространства V. Полуторалинейная функция а определяется числами = a(ef, е;). А именно, а(х, У)=S aijXtyj (33) ij Матрица А = (ац) называется матрицей функции а в базисе {еь ... ..., еп}. При переходе к другому базису (ер ..., еп) = (е^,..., еп)С
§ 6. Эрмитовы пространства 231 она преобразуется по правилу А' = С*АС, (34) где С* = Ст. (Черта обозначает комплексное сопряжение, применен- ное ко всем элементам матрицы С.) Функция а называется невырож- денной, если Кег а = {у G V: а(х, у) = 0 Vx G V} = 0. Это равносильно невырожденности матрицы А. Полуторалинейная функция а называется эрмитовой (соответ- ственно косоэрмитовой), если а(у,х) = а(х,у) (соответственно «(У, *) = -а(х, у)). При умножении эрмитовой функции на i полу- чается косоэрмитова функция, и наоборот. Функция а является эрмитовой (соответственно косоэрмито- вой) тогда и только тогда, когда ее матрица А удовлетворяет усло- вию А* = А (соответственно А* = - А). Такие матрицы называются эрмитовыми (соответственно косоэрмитовыми). Заметим, что диа- гональные элементы эрмитовой матрицы вещественны, а косоэрми- товой — чисто мнимы. Каждой эрмитовой полуторалинейной функции а соответствует эрмитова квадратичная функция q(x) = a(x, х). Легко видеть, что все ее значения вещественны. Соотношения q (х + у) = q (х) + q (у) + а (х, у) + а (у, х), q(x + iy) = q (х) + q (у) + ia(x, у) - i а (у, х) позволяют восстановить а по q. В частности, если q = 0, то и а = 0. Пусть а — эрмитова полуторалинейная функция. Так же, как в случае симметрических билинейных функций, определяется орто- гональность векторов и ортогональное дополнение к подпростран- ству относительно а. Имеет место аналог предложения 4.2. С его помощью доказывается, что всякая эрмитова полуторалинейная функция и одновременно соответствующая ей квадратичная функ- ция приводятся к нормальному виду а(х, у) = х^ +... + xkyk - xMyk+1 -... - xk+lyk+l, q(x) = |xj2 +... + |xk|2 - |xk+112 - ... - |xfc+z|2.
232 Глава 5. Векторные пространства Эрмитова квадратичная функция q (и соответствующая ей эрми- това полуторалинейная функция) называется положительно опреде- ленной, если q М > 0 при х # 0. Это имеет место тогда и только тогда, когда в нормальном виде (35) к = и, I = 0. В общем случае имеет место закон инерции, утверждающий, что числа к и I определены однозначно. Они называются положитель- ным и отрицательным индексами инерции функции q. Так как для всякой комплексной матрицы det А* = det А, то определитель эрмитовой матрицы всегда веществен. Если все угловые миноры матрицы эрмитовой полуторалинейной функции отличны от нуля, то можно так же, как в случае билинейной функ- ции, провести ортогонализацию базисных векторов и получить от- сюда метод Якоби для определения индексов инерции по знакам уг- ловых миноров. В частности, имеет место аналог критерия Сильве- стра: эрмитова квадратичная функция положительно определенна тогда и только тогда, когда все угловые миноры ее матрицы поло- жительны. Комплексным аналогом евклидовых пространств являются эр- митовы пространства. Эрмитовым пространством называется ком- плексное векторное пространство, в котором фиксирована некото- рая положительно определенная эрмитова полуторалинейная функ- ция, называемая скалярным умножением и обозначаемая (,). Пример 1. Пространство Сп со скалярным умножением (Х,у)=Х1У1 + ...+Хпуп. Пример 2. Пространство непрерывных комплекснозначных фун- кций на отрезке [0,1] со скалярным умножением Г1 (/,g) = fWgWdx. Jo В эрмитовом пространстве определяется длина вектора по фор- муле И = у/(х, х). В нем выполняются неравенство Коши—Буняковского |(х, у)| $ |х||у|
§ 6. Эрмитовы пространства 233 и неравенство треугольника |х + у|^|х| + |у| (докажите их). Базис {еь ..., еп} эрмитова пространства называется ортонорми- рованным, если в этом базисе скалярное умножение имеет нормаль- ный вид, т. е. если (ei> £j) — 5ij. Матрица перехода от одного ортонормированного базиса к другому удовлетворяет условию С* = С-1. Такие комплексные матрицы назы- ваются унитарными. Задача 1. Записать условие унитарности матрицы через матрич- ные элементы двумя способами. Заметим, что определитель унитарной матрицы С по модулю равен 1. В самом деле, беря определитель от обеих частей равенства С*С = Е, получаем det С • det С = 1, а это и означает, что | det С| = 1. Так же, как и в случае евклидова пространства, для любого под- пространства U эрмитова пространства V получаем разложение v=u®u1. Если {е1? ...,ек}— ортогональный базис подпространства U, то ор- тогональная проекция вектора х G V на U может быть найдена по формуле к 1=1 (е,-> х) (Обратите внимание на отличие этой формулы от формулы (29).) В эрмитовом пространстве также справедливы аналоги тео- рем 5.2 и 5.3. С математической точки зрения эрмитовы пространства полез- ны по той же причине, что и комплексные числа. Это станет ясным в следующей главе. С физической точки зрения эрмитовы прост- ранства необходимы для построения адекватной квантово-механи- ческой картины мира.
Глава 6 Линейные операторы Теория линейных операторов — это ядро линейной алгебры и главный источник ее многочисленных приложений. Как и били- нейная функция, линейный оператор в конечномерном векторном пространстве задается квадратной матрицей, так что в каком-то смысле это объекты одинаковой сложности (но, конечно, симмет- рическая или кососимметрическая билинейная функция проще, чем произвольный линейный оператор). Мы сохраняем соглашения, принятые во введении к предыдущей главе. § 1. Матрица линейного оператора Определение 1. Линейным оператором (или линейным преобра- зованием) в векторном пространстве V называется линейное отоб- ражение пространства V в себя. Более подробно, линейный оператор — это отображение зУ: V —► -♦ V, удовлетворяющее условиям: 1) зУ(х + у) = зУх + а/у для любых х, yGV; 2) а/(Ах) = АзУх для любых х G V, A G К. (Мы обычно будем обозначать линейные операторы рукописны- ми буквами.) Если в пространстве V выбран базис {е1? ...,еп}, то линейный оператор может быть задан матрицей. Определение 2. Матрицей линейного оператора л/ в базисе {е1?..., еп} называется матрица А = (а^), определяемая из равенств ^ej=Sayei- U) i Иначе говоря, в j-м столбце матрицы А стоят координаты векто- ра в базисе {е1?..., еп}. (Обратите внимание, что, в отличие от определения матрицы линейного отображения, в этом определении фигурирует только один базис!)
§ 1. Матрица линейного оператора 235 Равенства (1) можно переписать в следующей матричной форме: (а/еъ j/en) = (ei, ...,en)A (2) (Ср. определение матрицы перехода в § 2.2, формула (8).) Очевидно, что для любых векторов/1, ...,/пеУ существует един- ственный линейный оператор а/, переводящий базисные векторы еъ..., еп в /j,..., fn соответственно. Это оператор, переводящий каж- дый вектор х = 2 xieiв вектор 2 xifi- Следовательно, линейный опе- ратор однозначно определяется своей матрицей, и любая квадрат- ная матрица порядка п является матрицей некоторого линейного оператора (в данном базисе). Найдем явное выражение координат образа у = six вектора х. При х = 2 х;е? имеем j У = S Xjsltj = £ ацх^ = £ У.е,-, J ij * где y.=L<W (3) J Если обозначить через X и Y столбцы координат векторов х и у соответственно, то равенства (3) можно переписать в следующей матричной форме: Г = АХ. (4) (Ср. формулу (9) преобразования координат в § 2.2.) Замечание. Как видно из этих формул, линейные преобразова- ния пространства Кп, определенные в примере 4.1.3, — это то же, что линейные преобразования в смысле определения 1. При этом матрица, определяющая линейное преобразование пространства Кп в смысле примера 4.1.3, — это его матрица в базисе из единичных строк в смысле определения 2. Выясним, как преобразуется матрица линейного оператора при переходе к другому базису (е'1,...,е'п) = (е1,...,ел)С. В силу линейности оператора j/ имеем (sle'v ...,^e'n) = (sle1,..., ^en)C=(e1, ...,en)AC=(e'p.... е^СГ'АС.
236 Глава 6. Линейные операторы Таким образом, если обозначить через А' матрицу оператора зУ в базисе {ер ..., е'п}, то А'= С~1АС. (5) Перейдя к другому базису, матрицу линейного оператора часто можно привести к более простому виду. В частности, такая возмож- ность открывается, если известно какое-либо инвариантное подпро- странство. Определение 3. Подпространство U с V называется инвариант- ным относительно оператора j?/, если аУНси (т. е. jtfu G U для любого и G U), Ограничение линейного оператора зУ на инвариантное под- пространство U является линейным оператором в U. Если базис {ех,..., еп} пространства V выбран таким образом, что U = (в!,..., ек) (а это всегда можно сделать), то матрица опера- тора аУ в этом базисе имеет вид ?)> гдеВ— матрица оператора ^\и вбазисе {еь ..., ек}, С — квадратная матрица порядка и - к и D — какая-то матрица размера к х (и - к). Обратно, если матрица оператора аУ в базисе {е19...,еп} имеет вид (6), где В — квадратная матрица порядка к, то U = (еь ..., ек) — инвариантное подпространство. Еще лучше обстоит дело, когда пространство V удается разло- жить в прямую сумму двух инвариантных подпространств U nW: V = U®W. Если {е1? ...,ек}— базис подпространства U, а {ек+1, ...,еп}— базис подпространства W, то {е1? ...,еп} — базис пространства V и в этом базисе матрица оператора зУ имеет вид А = (о ?)• <7’ где В — матрица оператора зУ|и в базисе {еь ..., ек}> а С — матрица оператора в базисе {ек+1,..., еп}. Более общо, если пространство V разложено в прямую сумму к инвариантных подпространств Ц, У2, •••, то в базисе пространст-
§ 1. Матрица линейного оператора 237 ва V, составленном из базисов этих подпространств, матрица опера- тора аУ имеет вид fAl а2 0 А = . , (8) где Ai — матрица оператора зУ |Vj. Пример 1. Поворот на угол а является линейным оператором в Е2 (см. пример 5.2.1). В примере 5.2.4 мы доказали, что его мат- рица в ортонормированном базисе {elt е2} есть матрица Л fcosa -sinaA n(a)=Gina cosaj' (9) В частности, поворот на имеет в та- ком базисе матрицу -;)• Найдем его матрицу А' в базисе е'=2е2, е'2 = ег-е2. (10) Как видно из рис. 1, = —Ci — 2е2, ^е2 = е1~»~ е2* Это означает, что Матрица Д' может быть, конечно, найдена и по формуле (5). Из формулы (10) получаем Следовательно, о -1W0 Г|_ 1у-2 П-f-l П 1 0Д2 оД 0 1J V-2 1J' Пример 2. Аналогично, поворот вокруг какой-либо оси на угол а является линейным оператором в Е3. В ортонормированном базисе {ei,e2, е3}, при условии, что вектор е3 направлен по оси поворота,
238 Глава 6. Линейные операторы матрица этого оператора имеет вид /cos a -sin а 04 А = sin a cos а 0 = I n I. к 0 0 17 7 Этот вид согласуется с разложением пространства Е3 в прямую сум- му двух инвариантных подпространств: Е3 = (е1)е2)Ф(е3). (11) Пример 3. В примере 5.2.2 мы рассматривали ортогональное проектирование на плоскость как линейное отображение прост- ранства Е3 в пространство векторов этой плоскости. Однако его можно рассматривать и как линейный оператор в пространстве Е3. В ортонормированном базисе, первые два вектора которого лежат в плоскости проектирования, его матрица имеет вид Z1 0 0\ А= 0 1 0 . ко о о7 Разложение (11) и в этом случае является разложением в прямую сумму инвариантных подпространств. Пример 4. Дифференцирование — линейный оператор в прост- ранстве многочленов. Это пространство бесконечномерно, но оно является объединением конечномерных инвариантных подпрост- ранств, состоящих из многочленов не выше заданной степени. В ба- зисе {1, х, х2,..., хп} пространства многочленов степени не выше п оператор дифференцирования имеет матрицу (0 1 0 .. .. 0 ок 0 0 2 ., ,. 0 0 А — 0 0 0 .. .. 0 0 0 0 0 ., .. 0 п <0 0 0 . .. 0 о) В базисе {1, матрицу Х^ 1 — J этот же оператор имеет более простую /0 1 0 ... 0 (Л 0 0 1 ... 0 0 0 0 0 ... 0 0 (12) 0 0 0 ... 0 1 ко о о ... о о7
§ 1. Матрица линейного оператора 239 Пример 5. Пусть — какое-либо биективное преобразование множества X. Тогда отображение определяемое формулой W)(x) = /(</> Л*)), (13) является линейным оператором в пространстве F(X, К) функций на X со значениями в К. (Можно было бы действовать на аргумент функции самим преобразованием </>, а не его обратным, но послед- нее удобнее по причине, которая будет объяснена в гл. 10.) Напри- мер, пусть X = R, K = R, + a (aGR). Тогда (^/)(х)=/(х-а). (График функции у?*/ получается из графика функции f сдвигом вправо на а.) Так как cos(x - а) = cos а • cos х 4- sin а • sin х, sin(x - а) = -sin а • cos х + cos а • sin х, то подпространство (cos х, sin х) инвариантно относительно при- чем матрица ограничения преобразования на это подпростран- ство в базисе {cos х, sin х} имеет вид fcosa -sinaA Л Una cosaj:=ri(a)- Пример 6. В любой алгебре преобразование La:x—>ax (aGA), называемое левым умножением на элемент а, является линейным оператором. Рассмотрим, например, поле С как алгебру над R. Ра- венства (а 4- bi) • 1 = a 4- bi, (а 4- bi) • i = -b 4- ai показывают, что матрица оператора La+bi в базисе {1, i} есть fa -ЬЛ \Ь ay Задача 1. Найти матрицу левого умножения на А = Q в ал- гебре L/K) в базисе, составленном из матричных единиц. Доказать инвариантность подпространств (ЕП,Е21) и (^12» ^22)-
240 Глава 6. Линейные операторы Линейные операторы в одном векторном пространстве можно складывать, умножать друг на друга и умножать на числа. Эти опе- рации определяются так же, как для общих линейных отображений (см. §5.2). Им соответствуют такие же операции над матрицами, т. е., например, матрица произведения двух линейных операторов в каком-либо базисе равна произведению их матриц в том же ба- зисе. Из свойств операций над линейными отображениями, доказан- ных в § 5.2, следует что совокупность всех линейных операторов в векторном пространстве V является ассоциативной алгеброй. Мы будем обозначать эту алгебру через L(V). Отметим, что если dim V = = и, то dim L(V) = dim Ln (К) = n2. Алгебра L(V) обладает единицей. Ею является тождественный оператор, который мы будем обозначать буквой &. Матрица опера- тора <£ в любом базисе есть единичная матрица Е. Линейный оператор а/ G L(V) обратим тогда и только тогда, ко- гда Кег аУ = 0 и Im аУ = V. Из теоремы 5.2.2 следует, что в конечно- мерном случае, если Кег аУ = 0, то автоматически Im аУ = V, и обрат- но. С другой стороны, ясно, что линейный оператор обратим тогда и только тогда, когда его матрица обратима, т. е. невырожденна. Невырожденные линейные операторы в пространстве V обра- зуют группу, обозначаемую GL(V) и называемую полной линейной группой пространства V. В общем случае размерность подпространства Im аУ называется рангом линейного оператора аУ и обозначается через rk аУ. В силу теоремы 5.2.1 она равна рангу матрицы оператора аУ (в любом ба- зисе). Из формулы (5) следует, что определитель матрицы оператора аУ не зависит от выбора базиса. Он называется определителем линей- ного оператора si и обозначается через det аУ. § 2. Собственные векторы Основная задача теории линейных операторов состоит в приве- дении матрицы линейного оператора к возможно более простому виду за счет выбора подходящего базиса. Как мы уже отмечали, для этого полезно знать инвариантные подпространства. Особую роль играют одномерные инвариантные
§ 2. Собственные векторы 241 подпространства. Их рассмотрение приводит к понятию собствен- ного вектора. Определение 1. Ненулевой вектор е е V называется собствен- ным вектором оператора аУ, если аУе = Ле. Число Ле К называется при этом собственным значением оператора jtf, отвечающим соб- ственному вектору е. Очевидно, что ненулевой вектор е является собственным тогда и только тогда, когда одномерное подпространство (е) инвариантно. В базисе, составленном из собственных векторов (если таковой су- ществует), матрица оператора диагональна, что является пределом мечтаний. Пример 1. Для оператора дифференцирования в пространстве многочленов единственным с точностью до пропорциональности собственным вектором является многочлен 1 (причем соответству- ющее собственное значение равно 0). Таким образом, в этом случае из собственных векторов нельзя составить базиса. Пример 2. Собственные векторы поворота на угол а / ктг в трех- мерном пространстве — это векторы, лежащие на оси поворота, причем соответствующее им собственное значение равно 1. При а = ктг собственными (с собственным значением (—1)к) являются также векторы, ортогональные оси поворота. Таким образом, базис из собственных векторов в этом примере существует только тогда, когда а = 0 или я (если считать, что 0 $ а < 2тг). Для существования собственного вектора с собственным значе- нием Л необходимо и достаточно, чтобы оператор а/ - Л^ был вы- рожден, т. е. чтобы det(ay - Л£) = 0. Если А = (а[}) — матрица опера- тора аУ в каком-либо базисе, то all-f а12 ••• а1п det(ay-t<?)= °21 °22 f anl ап2 ^пп откуда видно, что det(a?/ -представляет собой многочлен степе- ни п от L Определение 2. Многочлен (О = (-1)" det(a/ -t<£) = det (t <Г - аУ) называется характеристическим многочленом оператора аУ. Легко видеть, что коэффициент при tn многочлена Лу (О равен 1, а коэффициент при f7”1 равен —trA, где trA— след матрицы А
242 Глава 6. Линейные операторы (сумма ее диагональных элементов). Свободный член многочлена ЛДО равен /ДО) = (-1)" det А. Задача 1. Доказать, что коэффициент при tn~k многочлена (О равен (—l)fc х (сумма главных миноров порядка к матрицы А). (Главным минором квадратной матрицы называется определитель ее подматрицы, расположенной симметрично относительно глав- ной диагонали.) Отметим, что характеристический многочлен линейного опера- тора в силу своего определения не зависит от выбора базиса. Отсю- да, в частности, вытекает, что след матрицы линейного оператора не зависит от базиса. Выше была фактически доказана Теорема 1. Собственные значения линейного оператора — этсг в точности корни его характеристического многочлена. Следствие. Любой линейный оператор в комплексном вектор- ном пространстве имеет собственный вектор. Линейный оператор в вещественном векторном пространстве может не иметь собственных векторов, как показывает пример по- ворота плоскости на угол а 00, и. Однако использование комплекс- ных чисел позволяет получить полезную информацию и о линейных операторах над полем вещественных чисел. Это достигается с помо- щью так называемой комплексификации. Пусть V — вещественное векторное пространство. Построим из него комплексное векторное пространство V(C) аналогично тому, как из поля R строится поле С. А именно, элементами пространства V(C) будем считать пары (х,у), где х,у eV. Определим сложение таких пар и умножение на комплексные числа по правилам (*1> У1) + (х2> Уг) = (*1 + *2, У1 +у2)> (А + ig) (х, у) = (Ах - цу, gx + Ay). Легко проверить, что при этом получится векторное пространство над С. Согласно данному определению, сложение пар вида (х, 0) и их умножение на вещественные числа сводится к соответствую- щим операциям над их первыми компонентами. Отождествим каж- дую пару вида (х, 0) с вектором х е V; тогда пространство V окажет- ся вложенным в V(C) в виде вещественного подпространства. При этом окажется, что (x,y)=x + iy.
§ 2. Собственные векторы 243 Любой базис пространства V (над R) является в то же время базисом пространства У(С) (над С). Однако в пространстве У(С) существуют и другие базисы. Любой линейный оператор лУ в пространстве V однозначно продолжается до линейного оператора аУс в пространстве У(С). При этом в базисе, составленном из вещественных векторов, опе- ратор j^c имеет такую же матрицу, как и оператор аУ. Оператор может иметь мнимые собственные значения и со- ответствующие им мнимые собственные векторы. Какой смысл они имеют в вещественных терминах? Предложение 1. Вектор x + iy (х, у G V) является собственным вектором оператора с мнимым собственным значением Л + ip (A, g G R, 0) тогда и только тогда, когда U = (х, у) с V — дву- мерное инвариантное подпространство для оператора d, причем jrfx = Xx — id,y, / (14) аУу =/ix +Ay. Доказательство проводится непосредственным вычислением. Ра- венства (14) означают, что в базисе {х, у} пространства U оператор аУ ly имеет матрицу Из них также следует, что вектор х — iy является собственным век- тором оператора а^с с собственным значением А - ig. Пример 3. Оператор аУ поворота евклидовой плоскости на угол а в ортонормированном базисе {elfe2} имеет матрицу П(а) (см. (9)). Следовательно, вектор в! 4- ie2 является собственным вектором оператора аУс с собственным значением cos а - i sin а, а вектор ег — ie2 — собственным вектором с собственным значением cos а + i sin а. Таким образом, матрица поворота может быть приве- дена к диагональному виду в комплексном пространстве. В качестве следствия предыдущего предложения получается важ- ная Теорема 2. Для любого линейного оператора над полем веще- ственных чисел существует одномерное или двумерное инвариант- ное подпространство. При заданном собственном значении А собственные векторы на- ходятся из системы однородных линейных уравнений (А-АЕ)Х = 0,
244 Глава 6. Линейные операторы где X обозначает столбец координат неизвестного вектора. Вместе с нулевым вектором они составляют подпространство Ул(лУ) = Кег(лУ-А£), называемое собственным, подпространством оператора аУ, отвеча- ющим собственному значению А. Размерность этого подпространст- ва равна п — гк(лУ - А<£), где п = dim V. Теорема 3. Собственные подпространства, отвечающие различ- ным собственным значениям Аь ..., Afc оператора линейно неза- висимы. Доказательство. Докажем утверждение теоремы индукцией по к. При к = 1 доказывать нечего. Пусть к > 1 и ej +... 4-efc_j + ек = 0 (ef G УА( (зУ)). Применяя оператор аУ, получаем AjCj + ... + Afc_1efc_1 + Лкек = 0. Вычитая отсюда исходное равенство, умноженное на Аь получаем (Al - Afc)ei +... + (Afc_x - Afc)efc_i = 0, откуда в силу предположения индукции следует, что =... = ек_1 = 0. Но тогда и ек = 0. □ Следствие. Если характеристический многочлен имеет п различных корней, то существует базис из собственных векторов оператора jtf. Указанное условие не является необходимым для существования базиса из собственных векторов. Так, для тождественного операто- ра 8 все векторы являются собственными, и, стало быть, любой базис состоит из собственных векторов, однако его характеристиче- ский многочлен /ДО = (t - 1)п имеет единственный (но п-кратный) корень 1. Рассмотрим два более интересных (и важных) примера. Пример 4. Пусть V = U Ф W. Линейный оператор &, определяе- мый формулой (у + z) = У (у G U, z G W), называется проектором на U параллельно W. Очевидно, что и = У2(0>), W = Vo(0>).
§ 2. Собственные векторы 245 В базисе пространства V, составленном из базисов подпространств U и W, оператор & записывается диагональной матрицей с числа- ми 1 и 0 по диагонали. Задача 2. Доказать, что линейный оператор 9 является проек- тором (для каких-то U и W) тогда и только тогда, когда & 2 . Пример 5. В тех же обозначениях линейный оператор над полем характеристики / 2, определяемый формулой (у 4- z) = у - z называется отражением относительно U параллельно W. Очевидно, что l/ = V1(^), W = V_1(^). В базисе пространства V, составленном из базисов U и W, опера- тор записывается диагональной матрицей с числами 1 и -1 по диагонали. Задача 3. Доказать, что линейный оператор является отраже- нием (для каких-то U и W) тогда и только тогда, когда Ж2, = £. Для получения необходимого и достаточного условия существо- вания базиса из собственных векторов докажем сначала Предложение 2. Характеристический многочлен ограничения линейного оператора на инвариантное подпространство делит характеристический многочлен самого оператора. Доказательство. Пусть 38 — ограничение оператора аУ на инва- риантное подпространство U с V. В базисе пространства V, первые векторы которого составляют базис подпространства U, матрица А оператора аУ имеет вид (6), где В — матрица оператора . Следова- тельно, Л/ (О = /я (0 ’ det(tE - С). □ (16) Следствие. Размерность собственного подпространства линей- ного оператора не превосходит кратности соответствующего кор- ня характеристического многочлена. Доказательство. Пусть сНшУЛ(аУ) = к. Тогда характеристиче- ский многочлен ограничения оператора аУ на УЛ(зг?) равен (t - A)fc. Применяя предложение 2 к подпространству УЛ(аУ), мы получаем, что (t — A)fc делит характеристический многочлен оператора аУ. □ Пример 6. Рассмотрим оператор дифференцирования в прост- ранстве многочленов степени не выше п. Из вида его матрицы, най- денной в примере 1.4, следует, что его характеристический много-
246 Глава 6. Линейные операторы член равен tn+1. Он имеет корень 0 кратности и + 1, однако раз- мерность соответствующего собственного подпространства равна 1 (см. пример 1). Этот пример показывает, что размерность собствен- ного подпространства может быть строго меньше кратности соот- ветствующего корня характеристического многочлена. Теорема 4. Для существования базиса из собственных векторов линейного оператора j# необходимо и достаточно, чтобы выполня- лись следующие условия: 1) характеристический многочлен разлагается на линей- ные множители; 2) размерность каждого собственного подпространства равна кратности соответствующего корня многочлена Доказательство. Пусть Аь ..., As — все корни многочлена и к1?...,к5— их кратности. Собственное подпространство, отвеча- ющее Ар обозначим через VJ. Согласно следствию предложения 2, dim Ц $ kf и, значит, SdimVJ<Sk,<n. (17) I I Однако единственный способ получить базис из собственных векто- ров— это взять объединение базисов собственных подпространств. Для того чтобы при этом действительно получился базис простран- ства V, необходимо и достаточно, чтобы J^dim Vi = n. i Ввиду (17) это равносильно тому, что ^kt = n и dim = к, для всех I. i Первое из этих условий означает, что (t) разлагается на линей- ные множители, а второе — это как раз условие 2) теоремы. □ § 3. Линейные операторы и билинейные функции в евклидовом пространстве Пусть V — евклидово пространство и {е1(еп} — его ортонор- мированный базис. Каждому вектору a G V соответствует линейная функция (ра(х) = (х,а). (18)
§ 3. Линейные операторы в евклидовом пространстве 247 При этом коэффициенты ^а(е^ = (ef, а) линейной функции <ра в ба- зисе {е1э..., еп} равны координатам вектора а в этом базисе. Отсюда следует, что отображение а —* ipa есть изоморфизм пространства V на пространство V*. Отметим, что определение этого изоморфизма не зависит от выбора базиса. Таким образом, в случае конечномер- ного евклидова пространства как бы исчезает разница между прост- ранством и его сопряженным. Часто говорят «отождествим при по- мощи канонического изоморфизма евклидово пространство V с его сопряженным пространством», имея в виду указанный выше изо- морфизм. Аналогично, каждому линейному оператору в пространстве V соответствует билинейная функция <^(*,У) = (*,^У)- ДО) При этом матрица билинейной функции ^(х, у) в базисе {eltеп} совпадает с матрицей оператора в этом базисе. В самом деле, ^(е,, ej) = (вр аУер есть не что иное, как i-я координата вектора аУе;. Отсюда следует, что отображение аУ —► есть изоморфизм пространства линейных операторов на пространство билинейных функций в пространстве V. Определение этого изоморфизма не зависит от выбора базиса. Однако в неортонормированном базисе матрица функции не обязана совпадать с матрицей операто- ра аУ. Для каждой билинейной функции можно определить «транспо- нированную» функцию ¥>т(х,у) = </?(у,х), матрицей которой в любом базисе является транспонированная матрица функции <р. Линейный оператор аУ*, соответствующий функции называется сопряженным оператором по отношению к аУ. Иначе говоря, сопряженный оператор определяется тожде- ством (Л,7) = (х,аУу). (20) Матрицей оператора аУ* в ортонормированном базисе является транспонированная матрица оператора аУ. Симметрическим (соответственно кососимметрическим) били- нейным функциям соответствуют так называемые симметрические (соответственно кососимметрические) линейные операторы. Они
248 Глава 6. Линейные операторы характеризуются тем, что зУ* = d (соответственно зУ* = — зУ), а в матричных терминах — тем, что их матрица в ортонормированном базисе симметрична (соответственно кососимметрична). Симмет- рические операторы называют также сомосопряженньшп. Пример 1. Ортогональный проектор на подпространство явля- ется симметрическим оператором (проверьте это). Линейные операторы, для которых зУ* = а/-1, называются орто- гональными. Иначе говоря, оператор d ортогонален, если (зУх,зУу) = (х,у), (21) т. е. если зУ сохраняет скалярное произведение векторов. Из тожде- ства (х, у) = | (|х+у|2 - |х|2 - |у I2) следует, что оператор зУ ортогонален тогда и только тогда, когда он сохраняет длины векторов. Замечание. Мы видим, таким образом, что ортогональные ли- нейные преобразования пространства Rn, определенные в приме- ре 4.1.9, — это то же, что ортогональные операторы в смысле данно- го выше определения, если считать, что скалярное умножение в R" определено как в примере 5.5.2. Пример 2. Линейный оператор, индуцированный в пространст- ве геометрических векторов любым движением, ортогонален. Пример 3. Ортогональное отражение относительно подпрост- ранства (т.е. отражение параллельно ортогональному подпростран- ству) является ортогональным оператором. В матричных терминах ортогональные операторы характеризу- ются тем, что их матрица в ортонормированном базисе ортогональ- на (см. определение 5.5.4). Предложение 1. Линейный оператор любого из рассмотренных выше трех типов, т. е. симметрический, кососимметрический или ортогональный, обладает следующим свойством: если подпростран- ство U инвариантно, то и его ортогональное дополнение U1 инва- риантно. Доказательство. Рассмотрим наиболее сложный случай ортого- нального оператора зУ. Заметим, прежде всего, что оператор jzf\v также ортогонален и, следовательно, невырожден. Поэтому для лю-
§ 3. Линейные операторы в евклидовом пространстве 249 бого вектора х G U найдется такой вектор z G U, что х = dz. Возь- мем теперь любой вектор у G LT1. Тогда, используя предыдущие обо- значения, получаем для любого х 6 U (х, jtfy) = (аУг, аУу) = (z, у) = О, откуда следует, что аз/у G U1. □ С помощью этого предложения и теоремы 2.2 мы можем, рас- суждая индукцией по размерности, получить канонический вид для матриц линейных операторов рассматриваемых трех типов. Теорема 1. Для любого симметрического оператора d суще- ствует ортонормированный базис из собственных векторов. Доказательство. Достаточно доказать существование хотя бы одного собственного вектора. В силу теоремы 2.2 достаточно сде- лать это для двумерного пространства. Матрица симметрического оператора в ортонормированном базисе в этом случае имеет вид М Ц \ Ь с г и хаРактеРистическии многочлен равен Ъ (О = t2 - (а + с) t + (ас - Ь2). Дискриминант этого квадратного трехчлена D = (а + с)2 - 4(ас - Ь2) = (а - с)2 4- 4Ь2 всегда неотрицателен, так что (t) имеет вещественные корни и, значит, j# имеет собственные векторы. □ Следствие 1. Характеристический многочлен симметрического оператора разлагается на линейные множители (над R); размер- ность каждого собственного подпространства равна кратности со- ответствующего корня; собственные подпространства, отвечаю- щие различным корням, ортогональны друг другу Доказательство. Для доказательства последнего утверждения надо заметить, что если {е1? ...,еп}— базис из собственных векто- ров оператора аУ, причем аУе1 = А1е1, то УА(аУ) есть линейная обо- лочка тех ef, для которых Л, = Л. Впрочем, его легко можно доказать и непосредственно. В самом деле, пусть хе УА(аУ), у еУДаУ), Л/pt. Тогда Л(х, у) = (аУх, у) = (х, аУу) = р(х, у), откуда (х, у) = 0. □
250 Глава 6. Линейные операторы Используя описанное выше соответствие между симметрически- ми операторами и симметрическими билинейными функциями, по- лучаем Следствие 2. Для любой квадратичной функции q в евклидовом пространстве существует ортонормированный базис, в котором ее матрица диагоналъна, т. е. q(x) = X1xl + ... + Xnx^. (22) Нужно понимать, что в формулировке этого следствия речь идет об ортонормированности в смысле скалярного умножения, а не в смысле симметрической билинейной функции ip, соответствую- щей q. Однако, поскольку матрица функции в указанном базисе диагональна, этот базис является также ортогональным (но, вообще говоря, не ортонормированным) в смысле функции </?. Отметим, что числа Аь ..., Лп —это собственные значения соот- ветствующего симметрического оператора и, следовательно, опре- делены однозначно с точностью до перестановки. Выражение (22) называют каноническим видом квадратичной функции q, а нахождение ортонормированного базиса, в котором функция q имеет такой вид, часто называют приведением к главным осям. Используя соответствие между симметрическими операторами и квадратичными функциями в евклидовом пространстве в обрат- ном направлении, можно получить другое доказательство существо- вания собственного вектора у симметрического оператора. А именно, пусть q — квадратичная функция, соответствующая данному симметрическому оператору аУ, т. е. q(x) = (a^x, х). Заметим, что функция q, будучи непрерывной, должна иметь макси- мум на единичной сфере S пространства V, задаваемой уравнением (х, х) = 1. Предложение 2. Всякая точка максимума функции q на сфере S является собственным вектором оператора jtf, а сам максимум ра- вен соответствующему собственному значению. Доказательство. Касательное пространство сферы S в точке х задается уравнением (х, dx) = 0,
§ 3. Линейные операторы в евклидовом пространстве 251 т. е. представляет собой ортогональное дополнение к подпростран- ству (х). С другой стороны, дифференциал функции q равен dq(х) = (jtfdx, х) + (jtfx, dx) = 2( аУх, dx). Если функция q достигает максимума в какой-то точке е е S, то ее дифференциал обращается в нуль на касательном пространстве сфе- ры S в этой точке. В силу предыдущего это означает, что вектор jtfe ортогонален всем векторам, ортогональным е, откуда ^Уе = Ае. При этом q(е) = (jtfe, е) = А(е, е) = А. □ В этом доказательстве мы использовали только необходимое условие максимума, которое выполнено в любой критической точке функции q на S, в частности в любой точке минимума. Ясно, что собственный вектор е е S действительно является точкой максиму- ма, только если А — максимальное собственное значение операто- ра зУ. Симметрический оператор называется положительно определен- ным, если соответствующая ему квадратичная функция положитель- но определенна или, что равносильно, если все его собственные значения положительны. Перейдем теперь к линейным операторам других типов. Теорема 2. Для любого кососимметрического линейного опера- тора d существует ортонормированный базис, в котором его матрица имеет вид г НС^) о к О 7 гдеН(а) = ^а "J). Доказательство очевидно, поскольку Н(а) — это общий вид матрицы кососимметрического оператора в ортонормированном базисе в двумерном евклидовом пространстве. □
252 Глава 6. Линейные операторы Теорема 3. Для любого ортогонального оператора d существу- ет ортонормированный базис, в котором его матрица имеет вид Maj гт' ч fcosa —sinaA гдеП(а) = ^па cosaJ. Заметим, что, используя матрицы П(я) = ( 0 J и П(0) = fl 0\ ' к } . = I о ! ), можно при желании оставить не более одного свободного диагонального элемента, равного -1, и не более одного, равного 1. Доказательство. Достаточно рассмотреть ортогональные опера- торы в одномерном и двумерном пространствах. В одномерном про- странстве ортогональный оператор — это умножение на ±1. В двумерном пространстве всякий ортогональный оператор лУ, как мы показали в примере 4.1.9, есть либо поворот на некоторый угол а, либо отражение относительно некоторой прямой. В первом случае матрица оператора d в (любом) ортонормированном бази- се имеет вид П(а). Во втором случае существует ортонормирован- ныи базис, в котором матрица оператора d имеет вид I 0 I. □ В частности, в трехмерном евклидовом пространстве матрица любого ортогонального оператора а/ в подходящем ортонормиро- ванном базисе имеет один из следующих двух видов: ГП(а) ОА ГП(а) ОА V О 1J’ О -1/ В первом случае оператор d представляет собой поворот на угол a вокруг некоторой оси, во втором—зеркальный поворот, т. е. пово- рот, совмещенный с отражением относительно плоскости, ортого- нальной оси поворота. Ясно, что зеркальный поворот не может быть результатом непре- рывного движения, так как он изменяет ориентацию пространства.
§ 3. Линейные операторы в евклидовом пространстве 253 Следовательно, конечный результат сколь угодно сложного реально- го движения твердого тела с закрепленной точкой — такой же, как при простом повороте вокруг подходящей оси на подходящий угол. Эта совершенно не тривиальная теорема называется теоремой Эй- лера. Ортогональные операторы в евклидовом пространстве V обра- зуют подгруппу группы GL(V), называемую ортогональной группой и обозначаемую O(V). Соответственно этому ортогональные мат- рицы образуют подгруппу группы GLn(R), обозначаемую Оп (это согласуется с обозначением, введенным в примере 4.1.9). Как мы уже заметили в § 5.5, определитель ортогональной матри- цы равен ±1. Ортогональные матрицы с определителем 1 образуют подгруппу индекса 2 в Оп, обозначаемую SOn. Соответственно этому ортогональные операторы с определителем 1 образуют подгруппу индекса 2 в О(У), называемую специальной ортогональной группой и обозначаемую SO(V). Операторы из SO(V) геометрически истол- ковываются как ортогональные операторы, сохраняющие ориента- цию пространства (см. пример 4.6.16). Пример 4. Группа О2 = О(Е2) состоит из поворотов, составляю- щих подгруппу SO2 = SO(£2), и отражений относительно прямых. Обозначим через sa поворот на угол а и через га — отражение от- носительно прямой, образующей угол а с какой-либо фиксирован- ной прямой I. Ясно, что sasp =sa+p. Далее, произведение поворота и отражения меняет ориентацию и, следовательно, является отраже- нием. Проследив за какой-нибудь одной точкой (см. рис. 2, а), б)), легко установить, что 5аГр=Гр + ^ Гр5а=Гр_а2. Наконец, произведение двух отражений сохраняет ориентацию и, следовательно, является поворотом. Проследив за одной точкой Рис. 2, б) Рис. 2, а)
254 Глава 6. Линейные операторы \ / (рис. 3), легко установить, что Га Г/3 = 52(а-Д)> \ / т. е. произведение двух отражений есть \ LaSn поворот на удвоенный угол между их -------Уп осями. В частности, отсюда следует, / /\ 1 что группа О2 порождается отраже- / \ ниями. рис> з Задача 1. Доказать, что группа О(У) порождается отражениями относитель- но (п — 1)-мерных подпространств (где п = dim V). Всякий линейный оператор в евклидовом пространстве един- ственным образом представляется в виде суммы симметрическо- го и кососимметрического операторов (ср. пример 5.1.1). Имеется мультипликативный аналог этого разложения, в котором кососим- метрический оператор заменяется ортогональным (почему так про- исходит, станет ясно в гл. 12). Теорема 4. Всякий невырожденный линейный оператор в евкли- довом пространстве единственным образом представляется в виде произведения положительно определенного симметрического и ор- тогонального операторов. Такое представление линейного оператора называется его поляр- ным разложением. Перед тем как доказывать эту теорему, докажем следующее Предложение 3. Всякий положительно определенный симмет- рический оператор 38 единственным образом представляется в ви- де 38= Ч>2, где — также положительно определенный симметри- ческий оператор. Доказательство. Пусть A1,...,AS — (различные) собственные значения оператора и Уь ..., Vs — соответствующие собственные подпространства. По условию Af положительны. Положим /2, = /А~ (арифметическое значение корня). Тогда линейный оператор действующий в Vt как умножение на gf, удовлетворяет условиям предложения. (В частности, он симметричен, поскольку его мат- рица в ортонормированном базисе, составленном из собственных векторов оператора 38, диагональна.) Обратно, пусть оператор удовлетворяет условиям предложе- ния. Пусть pLlf...i[is — его (различные) собственные значения и W1}..., Ws — соответствующие собственные подпространства. Тогда
§ 3. Линейные операторы в евклидовом пространстве 255 оператор Ч?2 — & действует на WJ как умножение на g?. Следова- тельно, при подходящей нумерации g? = Af и WJ= VJ. Это показыва- ет, что оператор определен однозначно. □ Доказательство теоремы 4. Пусть — невырожденный линей- ный оператор. Предположим, что d = 4>б, где — положительно определенный симметрический, а б — ортогональный операторы. Тогда Ввиду предложения 3 этим однозначно определяется оператор , а тем самым и б. Обратно, из равенства (х,аУаУ*у) = (лУ*х, зУ*у) и невырожденности оператора d (и, значит, зУ*) следует, что зУзУ* — положительно определенный симметрический оператор. Пользуясь предложением 3, найдем такой положительно опреде- ленный симметрический оператор <#, что зУзУ* = и положим ^ = <^“1зУ. Тогда зУ = и зУзУ* = ^^^*^ = ^2, откуда после сокращения на получаем, что б б* = <£, т. е. б — ортогональный оператор. □ Пример 5. Всякую деформацию твердого тела с закрепленной точкой в первом приближении можно рассматривать как невырож- денный линейный оператор. Пусть зУ = б — полярное разложе- ние этого оператора. Тогда б — это поворот вокруг некоторой оси, который не является истинной деформацией в том смысле, что он не приводит к возникновению каких-либо напряжений в теле. С дру- гой стороны, оператор по теореме 1 есть комбинация растяже- ний (или сжатий) в трех взаимно перпендикулярных направлениях и тем самым представляет собой «чистую деформацию». Именно этот оператор, называемый тензором деформации, участвует в фор- мулировке закона Гука. Задача 2. Доказать, что всякую матрицу А G GLn (R) можно пред- ставить в виде А = О^Оз, где ОЪО2 — ортогональные матрицы, a D — диагональная матрица с положительными элементами. На- сколько однозначно такое представление? Аналогичная теория имеется для линейных операторов в эрми- товом пространстве, причем она даже проще, так как в эрмитовом пространстве всякий линейный оператор имеет собственный век-
256 Глава 6. Линейные операторы тор. Изложим ее вкратце, опуская доказательства, аналогичные при- веденным выше в евклидовом случае. Для любого линейного оператора d в эрмитовом пространстве определяется сопряженньш оператор по формуле (20). Если опе- ратор аУ в некотором ортонормированием базисе имеет матрицу А, то оператор лУ* в том же базисе имеет матрицу Л*. (Напомним, что А* = АТ.) Линейный оператор а/ называется эрмитовым (соответственно косоэрмитовым, унитарным), если = d (соответственно аУ* = = }). Это эквивалентно тому, что его матрица в ор- тонормированием базисе эрмитова (соответственно косоэрмитова, унитарна). Эрмитовы операторы называют также самосопряжен- ными. Для любого из этих типов линейных операторов доказывается су- ществование ортонормированного базиса из собственных векторов. При этом собственные значения эрмитова оператора вещественны, косоэрмитова — чисто мнимы, а унитарного — по модулю равны единице. Докажем, например, что собственные значения эрмитова опера- тора d вещественны. Пусть е — собственный вектор оператора d с собственным значением А. Тогда А(е, е) = {de, е) = (е, jtfe) = А(е, е), откуда А = А. Формула (19) устанавливает биекцию между множествами эрми- товых операторов и эрмитовых полуторалинейных функций. При этом в любом ортонормированном базисе матрицы эрмитова опе- ратора и соответствующей ему эрмитовой функции совпадают. Применяя теорему о существовании ортонормированного бази- са из собственных векторов эрмитова оператора, мы получаем, что для любой эрмитовой квадратичной функции q в эрмитовом прост- ранстве существует ортонормированный базис, в котором ее матри- ца диагональна, т. е. q(x) = A1|x1|2 + ... + An|xn|2. (23) Числа Аь ..., Ап определены однозначно с точностью до перестанов- ки, так как это собственные значения соответствующего эрмитова оператора. Выражение (23) называют каноническим видом эрмито- вой квадратичной функции q.
§ 3. Линейные операторы в евклидовом пространстве 257 Эрмитов оператор называется положительно определенным, ес- ли соответствующая ему эрмитова квадратичная функция положи- тельно определенна или, что равносильно, если все его собственные значения положительны. Унитарные операторы в эрмитовом пространстве V образуют подгруппу группы GL(V), называемую унитарной группой и обозна- чаемую U(V). Соответственно этому унитарные матрицы образуют подгруппу группы GLn(C), обозначаемую Un. Унитарные операторы (соответственно матрицы) с определите- лем 1 образуют подгруппу в U(V) (соответственно в Un), называе- мую специальной унитарной группой и обозначаемую SU(V) (соот- ветственно SUn). Всякий невырожденный линейный оператор в эрмитовом про- странстве единственным образом представляется в виде произве- дения положительно определенного эрмитова и унитарного опера- торов. Такое представление линейного оператора называется его полярным разложением. В одномерном случае линейный оператор есть просто комплексное число, а его полярное разложение — триго- нометрическая форма этого числа. Поскольку тригонометрическая форма комплексного числа связана с полярными координатами на плоскости, это объясняет термин «полярное разложение» в общем случае. Комплексификация У(С) евклидова пространства V канониче- ским образом превращается в эрмитово пространство, если опреде- лить скалярное умножение по формуле (*i + *Уь х2 + (Уг) = *2) + СУъ У2)] + iСCati, у2) - (уъ х2)]. При этом комплексное продолжение аУс симметрического (соответ- ственно кососимметрического, ортогонального) оператора аУ бу- дет эрмитовым (соответственно косоэрмитовым, унитарным) опе- ратором. Используя эти соображения, можно дать еще одно доказатель- ство существования собственного вектора у симметрического опе- ратора аУ в евклидовом пространстве V. А именно, пусть х -F iy (х, у G V) — какой-либо собственный вектор оператора аУс. Так как оператор аУс эрмитов, то соответствующее собственное значение А вещественно и, значит, а/х = Ах, аУу = Ау.
258 Глава 6. Линейные операторы Хотя бы один из векторов х, у отличен от нуля; он и будет собствен- ным вектором оператора j?/. § 4. Жорданова форма Для некоторых специальных типов линейных операторов, как, например, симметрических, эрмитовых и унитарных, рассмотрен- ных в предыдущем параграфе, удается доказать возможность приве- дения их матрицы к диагональному виду. В общем случае для этого имеются препятствия, указанные в теореме 2.4. Первое из них состоит в том, что характеристический многочлен может не разлагаться на линейные множители, т. е. иметь менее чем п корней. Его не существует для линейных операторов над по- лем комплексных чисел. В случае линейного оператора над полем вещественных чисел можно работать с его комплексификацией, что в какой-то мере снимает проблему: выбор удачного базиса из ком- плексных векторов позволяет понять и действие исходного операто- ра в вещественном пространстве. Так, в § 2 мы видели, что всякому мнимому собственному вектору отвечает двумерное инвариантное подпространство в вещественном пространстве. Как будет показа- но в § 9.5, аналогичное расширение основного поля возможно и в общем случае. Второе препятствие состоит в том, что размерность какого-ли- бо собственного подпространства может оказаться меньше кратно- сти соответствующего корня характеристического многочлена. То- гда приходится расстаться с мечтой привести матрицу оператора к диагональной форме, но, если характеристический многочлен раз- лагается на линейные множители, ее можно привести к так называ- емой жордановой форме, минимально отличающейся от диагональ- ной. Этому и посвящен настоящий параграф. Коль скоро собственных векторов может оказаться недостаточ- но, естественно рассмотреть какие-то более общие векторы. Определение 1. Вектор е G V называется корневым вектором ли- нейного оператора а?/, отвечающим числу A G К, если (ааГ-Л<?)те = О для некоторого meZ+. Наименьшее из таких т называется высо- той корневого вектора е.
§ 4. Жорданова форма 259 В частности, собственные векторы — это корневые векторы вы- соты 1. Удобно считать нулевой вектор корневым вектором высо- ты 0 (отвечающим любому Л). Пример 1. Для оператора дифференцирования в пространстве C°°(IR) бесконечно дифференцируемых функций собственные век- торы, отвечающие числу Л — это функции, пропорциональные е**, а корневые векторы — это функции вида р(х)еХх, где р(х)— мно- гочлен; при этом высота такого корневого вектора равна deg р 4-1. В частности, корневые векторы, отвечающие числу 0, — это много- члены. Если е — корневой вектор высоты т > 0, то вектор собственный с собственным значением Л. Следовательно, Л — ко- рень характеристического многочлена. Легко видеть, что корневые векторы, отвечающие корню Л, об- разуют подпространство. Оно называется корневым подпростран- ством и обозначается Vх (а/). Ясно, что Если е — корневой вектор высоты т > 0, то (лУ - А<£)е — кор- невой вектор высоты т — 1. Отсюда следует, что корневое подпро- странство Vх (аУ) инвариантно относительно з& — а значит, и от- носительно лУ. Множество корневых векторов высоты т — это не что иное, как ядро оператора (а/ - А<£)т. Таким образом, корневое подпро- странство Vх (зг?)—это объединение возрастающей цепочки под- пространств Кег(аУ - А£) С Кег(а/ - А£)2 с ... В конечномерной ситуации эта цепочка, начиная с некоторого ме- ста, стабилизируется, и, значит, Vх (зг?) = Кег(л/ — А<£)т для некото- рого т. В базисе пространства согласованном с этой цепоч- кой подпространств, оператор л/ - А<£ записывается нильтреуголь- ной матрицей (т.е. треугольной матрицей с нулями на диагонали), а оператор зг/ соответственно этому — треугольной матрицей с чис- лом А на диагонали. Отсюда мы получаем два следствия: 1) характеристический многочлен ограничения оператора зг/ на Vх(зг/) равен (Г —А)\ где k = dim Vх (зг/); 2) при g / А оператор з# невырожден на Vх (згГ).
260 Глава 6. Линейные операторы Задача 1. Доказать, что высота любого корневого вектора, отве- чающего корню А, не превосходит dim Ул(аУ). Докажем теперь ключевое утверждение, оправдывающее поня- тие корневого вектора. Предложение 1. Размерность корневого подпространства рав- на кратности соответствующего корня характеристического мно- гочлена. Доказательство. В базисе {еь..., еп} пространства V, первые к векторов которого составляют базис подпространства Vх (аУ), матрица А оператора j/ имеет вид (6), где В — матрица оператора = ^|уА(0<). Следовательно, Л/ W = (Г) • det(tE - С) = (t - Л/ det «Е -С). Пусть —линейный оператор в пространстве W = {ек+1,..., еп), за- даваемый матрицей С. Нам нужно доказать, что Л не является кор- нем многочлена det(tE — С), т.е. собственным значением операто- ра , Предположим противное. Тогда существует такой ненулевой век- тор е € W, что 4>е = Ле. Это означает, что j/e = Ae + u, ugV;(j/), и, следовательно, («хУ - Л<£)е = и — корневой вектор, но тогда и е — корневой вектор, что противоречит определению Vх (лУ). □ Предложение 2. Корневые подпространства, отвечающие раз- личным корням Ль ..., Лк, линейно независимы. Доказательство. Доказательство аналогично доказательству теоремы 2.3 о линейной независимости собственных подпрост- ранств. Пусть е j -+-... + e^-i + = 0 (et G (лУ)). Применим к этому равенству оператор — Лк<£)т, где т — высота вектора ек, Мы получим (аУ - Л^)гпе1 +... + (л/ - Л^)^.! =0. Если доказывать предложение индукцией по к, то предположение индукции даст (лУ - Afc<g,)me1 =... = (лУ - Л^)тек_! = 0.
§ 4. Жорданова форма 261 Так как оператор аУ — Afc<£ невырожден на каждом из подпрост- ранств УЛ1 (аУ),У**-1 (аУ), то отсюда следует, что ej =... = efc_! = 0; но тогда и ек = 0. □ Предложения 1 и 2 в совокупности позволяют сделать следую- щий вывод. Теорема 1. Если характеристический многочлен (t) разлага- ется на линейные множители, то 1=1 где А1?..., As— (различные) корни многочлена f^(t). Исследуем теперь более подробно действие оператора а/ на каж- дом из корневых подпространств. Определение 2. Линейный оператор *Ж называют нильпотент- ным, если существует такое т € Z+, что Ж™ = 0. Наименьшее из таких т называют высотой нильпотентного оператора с#. Пример 2. Оператор дифференцирования в пространстве мно- гочленов степени не выше п является нильпотентным оператором высоты п + 1. Так как Ул(а/) = Кег(а/ — A<S*)ni для некоторого т, то оператор «Ж = (d — А<£)|уЛ( нильпотентен. Поэтому наша задача сводится к исследованию ниль- потентных операторов. Пусть с# — нильпотентный оператор в векторном пространст- ве V. Высотой вектора е G V относительно Л называется наимень- шее т, для которого сЖте = 0, т. е. высота вектора е как корневого вектора оператора Л (отвечающего корню 0). Очевидно, что вы- сота любого вектора не превосходит высоты самого оператора Ж, причем существуют векторы, высота которых равна высоте опера- тора сЖ. Мы будем обозначать высоту вектора е через ht е. Предложение 3. Если е G V — вектор высоты т, то векторы е, Ле, Л2е,..., Лт~хе линейно независимы. Более точно, всякая нетривиальная линейная комбинация и = Аое 4- Alt#e -I- А2Ж2е -I-... -I- ХТп_1ЛТп~1е
262 Глава 6. Линейные операторы является ненулевым вектором высоты т — к, где к — номер первого ненулевого коэффициента. В частности, если Ао / О, то и — вектор высоты т. Доказательство. Так как 0 0, но Лте = 0, то = Лт~ки = 0. □ Определение 3. Подпространство (е, J/t, c#'n-1e) (т = = ht е) называется циклическим подпространством нильпотентного оператора <#, порожденным вектором е. Очевидно, что циклическое подпространство инвариантно от- носительно с#. Ограничение оператора Л на циклическое под- пространство (е, <#е, с#2е, ...,Лт~хе} имеет высоту т и в базисе {t#m-1e, <#т”2е,с#е, е} задается матрицей Л0) = го 1 0 .. .. 0 ОА 0 0 1 ., .. 0 0 0 0 0 ., .. 0 0 0 0 0 .. 0 1 \0 0 0 . .. 0 oj называемой нильпотентной жордановой клеткой (порядка гл) (ср. пример 1.4). Предложение 4. Пусть е G V — вектор максимальной высоты т (равной высоте оператора <#) и U = {e, Ле, Л2е, ...,Лт~хе) — порожденное им циклическое подпространство. Тогда существу- ет инвариантное подпространство W с V, дополнительное к U (т. е. такое, что V = UQW). Доказательство. Нам нужно доказать существование такого ин- вариантного подпространства W с V, что Ur\W = 0nU + W = V. За- ведомо существуют инвариантные подпространства, обладающие первым из этих свойств: таковым является, например, нулевое под- пространство. Выберем из них максимальное (т. е. такое, которое нельзя увеличить с сохранением указанного свойства). Обозначим его через W и докажем, что U + W = V. Предположим, что это не так, и пусть v фи + W. Так как Лти = О, то существует такое к, что Л^и фи + W, но Лки eU+W. Заме-
§4. Жорданова форма 263 нив v на 1v, мы можем считать, что Лиеи + W. Пусть Л^и + w (ugU, u/gW). Из равенства и = 0 получаем j^m~1u 4-с#т“1ш = О, откуда t#m”1u = 0. (Напомним, что подпространства U и W инвари- антны и линейно независимы.) Это означает, что ht и < т. Согласно предложению 3, отсюда следует, что и содержится в подпростран- стве <#[/ = С#е, с#2е,..., <Лт-1е). Пусть и = (u' G U). Тогда c#(v - и') g W. Заменив и на и - и', мы можем считать, что JfveW. Рассмотрим теперь подпространство W' = W + (v) Из нашего условия следует, что оно инвариантно. Докажем, что unw'=o. Предположим противное. Пусть у G U П W' — ненулевой вектор. Так как l7nlV = 0, тоу = г + Xv, и Л # 0. Разделив у на Л, можно считать, что Л = 1, т.е. у = z4-и. Но тогда v = y — zeU + W, что противоречит нашему выбору вектора и. Таким образом, U П W' = 0, что противоречит нашему выбору подпространства W. Следовательно, U 4- W = V, что и требовалось доказать. □ Предложения 3 и 4 позволяют доказать следующую теорему. Теорема 2. Пространство V может быть разложено в прямую сумму циклических подпространств оператора Jf. Количество сла- гаемых в таком разложении равно dim Кег Доказательство. Будем доказывать теорему индукцией по п = = dim V. При п = 1 утверждение теоремы очевидно. При п > 1 пусть U с V — циклическое подпространство, порожденное каким-либо вектором максимальной высоты. Согласно предложению 4, суще- ствует такое инвариантное подпространство W с V, что V = U Ф W. По предположению индукции пространство W может быть разложе- но в прямую сумму циклических подпространств. Вместе с подпро- странством U это дает нужное разложение всего пространства V.
264 Глава 6. Линейные операторы Докажем второе утверждение теоремы. Пусть 7 = 71Ф...Ф7к — разложение пространства 7 в прямую сумму циклических подпро- странств оператора с#. Очевидно, что Кег Я = Кег Л\V] Ф... ® Кег Л\Vk. Так как dim КеГс#|ц = 1 при любом i, то dim Кег = к. □ Возвращаясь к произвольному линейному оператору аУ, заме- тим, что в циклическом подпространстве нильпотентного операто- ра с#= (аУ - А<^) | оператор аУ задается матрицей вида М 1 0 ... О (Л О Л 1 ... О О О О Л ... О О J(A)=J(O) + AE = О 0 0 ... Л 1 V) о о ... о х] Такая матрица называется жордановой клеткой с собственным зна- чением Л. Определение 4. Жордановой матрицей называется клеточно- диагональная матрица в которой Jb J2>Jk — какие-то жордановы клетки. Комбинируя теоремы 1 и 2, мы приходим к следующему резуль- тату. Теорема 3. Если характеристический многочлен разлага- ется на линейные множители, то существует базис, в котором матрица оператора жорданова. Следствие. Матрица любого линейного оператора над полем комплексных чисел приводится к жордановой форме. Базис, в котором оператор лУ имеет жорданову матрицу, назы- вается жордановым. Как видно из доказательства теоремы 2, в его
§ 5. Функции от линейного оператора 265 выборе, вообще говоря, имеется большой произвол. Однако сама жорданова форма матрицы линейного оператора определена одно- значно с точностью до перестановки клеток. Это будет доказано в §9.3. Очевидно, что в жордановой форме матрицы оператора зУ сум- ма порядков жордановых клеток с собственным значением Л равна dim УЛ(зУ), т. е. кратности Л как корня характеристического много- члена. Из второй части теоремы 2 следует, что число жордановых клеток с собственным значением Л равно dim Задача 2. Доказать, что максимальный порядок жордановых клеток с собственным значением Л в жордановой форме матри- цы оператора зУ равен высоте нильпотентного оператора = = (зУ — Л(?) |уЛ(^). Матрицы А и В называются подобными, если существует такая невырожденная матрица С, что В = С-1 АС. Подобные матрицы мож- но рассматривать как матрицы одного линейного оператора в раз- ных базисах. Следствие теоремы 3 можно сформулировать таким образом, что всякая комплексная матрица подобна жордановой. Задача 3. Доказать, что всякая комплексная матрица подобна своей транспонированной матрице. § 5. Функции от линейного оператора Пусть зУ — линейный оператор в п-мерном векторном простран- стве V над полем К. Для любого многочлена у(0 = aotm + +... + ani-it + ат еК[с] можно определить его значение от оператора зУ по формуле /(зУ) = aQj^m + +... Ч-а^зУ + ат£. Ясно, что (/ + g) (^У) = f С*У) + g (аУ ), (/g) (зУ) = /(зУ)я(зУ). (24) Аналогичным образом можно определить многочлен от матрицы. При этом, если оператор зУ имеет в некотором базисе матрицу А, то оператор f (зУ) будет иметь в том же базисе матрицу f (А).
266 Глава 6. Линейные операторы Так как пространство всех линейных операторов конечномерно (при нашем молчаливом предположении, что пространство V конеч- номерно), то среди степеней оператора аг/ может быть лишь конеч- ное число линейно независимых. Следовательно, существуют такие ненулевые многочлены /, что /(аУ) = 0. Они называются аннулиру- ющими многочленами оператора аг/. Аннулирующий многочлен наи- меньшей степени называется минимальным ^аннулирующим) мно- гочленом оператора аг/. Мы будем обозначать его через т^. Всякий аннулирующий многочлен f делится на минимальный. В самом деле, если остаток от деления f на т^ отличен от ну- ля, то он является аннулирующим многочленом меньшей степени, чем т^, что противоречит определению минимального многочле- на. Отсюда, кстати, следует, что минимальный многочлен опреде- лен однозначно с точностью до постоянного множителя. Для того чтобы определить его вполне однозначно, будем считать, что его старший коэффициент равен единице. Задача 1. Найти минимальные многочлены нулевого и тожде- ственного операторов. Аналогично определяются аннулирующие и минимальный мно- гочлены матрицы. Минимальный многочлен линейного оператора равен минимальному многочлену его матрицы в любом базисе. Если пространство V разложено в прямую сумму инвариантных подпространств оператора аг/, то минимальный многочлен операто- ра аг/ равен наименьшему общему кратному минимальных много- членов его ограничений на эти подпространства. Пользуясь этим, легко найти минимальный многочлен линейного оператора по жор- дановой форме его матрицы (если, конечно, она приводится к жор- дановой форме). Для этого надо прежде всего найти минимальный многочлен жордановой клетки. Лемма 1. Минимальный многочлен жордановой клетки поряд- ка тс собственным значением А равен (t — A)m. Доказательство. Пусть аг/ — линейный оператор, задаваемый такой жордановой клеткой. Тогда = аг/ - А<£ — нильпотентный оператор высоты т, т. е. Это означает, что (t - A)m — аннулирующий многочлен, но ника- кой его собственный делитель не является аннулирующим много- членом. Следовательно, (t - — минимальный многочлен. □
§ 5. Функции от линейного оператора 267 Пусть теперь j/ — произвольный линейный оператор, характе- ристический многочлен которого разлагается на линейные мно- жители. Пусть As — все (различные) корни многочлена f^. Из леммы 1 и предшествующего ей замечания следует Теорема 1. Минимальный многочлен оператора si равен = П(г -Л,)"1', 1=1 где —максимальный порядок жордановых клеток с собственным значением в жордановой форме матрицы оператора si. Следствие 1. Жорданова форма матрицы оператора si диаго- нально тогда и только тогда, когда его минимальный многочлен не имеет кратных корней. Пример 1. Пусть si — линейный оператор в комплексном век- торном пространстве, удовлетворяющий условию sim = € для неко- торого натурального гп. Тогда многочлен tm — 1 является аннулиру- ющим для оператора si. Так как он не имеет кратных корней, то минимальный многочлен оператора si тем более не имеет кратных корней. Следовательно, жорданова форма матрицы оператора st диагональна. Ясно, что ее диагональные элементы (собственные значения оператора si) суть какие-то корни гп-й степени из 1. Пример 2. Найдем все линейные операторы st, удовлетворяю- щие условию st3 = si2. Это условие означает, что t3 — t2 является ан- нулирующим многочленом оператора si или, что равносильно, ми- нимальный многочлен оператора si делит t3 -12 = t2(t - 1). Ввиду теоремы 1 оно выполняется тогда и только тогда, когда жорданова форма матрицы оператора st состоит только из клеток вида с;). Число клеток каждого вида может быть произвольным (в том числе равным нулю), лишь бы сумма их порядков равнялась п. Следствие 2. Если жорданова форма оператора si диагональна, то и жорданова форма его ограничения st\v на любое инвариантное подпространство U с V диагональна. Доказательство. Очевидно, что минимальный многочлен т оператора st является, во всяком случае, аннулирующим многочле- ном для оператора si\v. Следовательно, минимальный многочлен оператора st\v делит многочлен т^, и если последний из этих
268 Глава 6. Линейные операторы многочленов не имеет кратных корней, то и первый обладает этим свойством. □ Следствие 3 (теорема Гамильтона—Кэли). /^(аУ) = 0. В частности, для линейного оператора зУ в двумерном вектор- ном пространстве получаем: J/2 - (tr jyw + (det = 0. Конечно, это легко проверить и прямым вычислением (проделайте это!). Замечание 1. Теорема Гамильтона—Кэли верна и без предположения о том, что характеристический многочлен разлагается на линейные множители. Это можно доказать следующим образом. Как будет показано в § 9.5, существует расширение L поля К, в котором разлагается на линей- ные множители. Рассматривая матрицу А оператора зУ как матрицу с эле- ментами из L, мы можем утверждать в силу предыдущего следствия, что она аннулируется своим характеристическим многочленом; но очевидно, что характеристический многочлен матрицы А не зависит от того, рассматри- ваем мы ее как матрицу с элементами из К или как матрицу с элементами из L. Этим же способом доказывается, что если минимальный многочлен оператора зУ разлагается на линейные множители над К, то и его характе- ристический многочлен разлагается на линейные множители над К. Пользуясь теоремой Гамильтона—Кэли, можно свести вычисле- ние любого многочлена f от линейного оператора зУ к вычислению многочлена степени < п от этого оператора. А именно, разделим f на с остатком: , / = Ч/.^+Р> degp<n. (25) Тогда /(зУ)=р(зУ). Предположим, что К = R или С и многочлен разлагается на линейные множители (что всегда имеет место, если К = С). Пусть Аь ..., As — все его (различные) корни и кь..., ks — их кратности, так что кт 4-... 4-ks = и. (26) Тогда из (25) следует, что /O)(Xi)=pO)(A1.) при i = 1,s; j = 0,1,к, — 1. (27)
§ 5. Функции от линейного оператора 269 (Мы считаем здесь, что /(0) = f для любой функции /.) Равен- ства (27) однозначно определяют многочлен р, как показывает следующее Предложение 1. Пусть Л1?AsеК —различные числа и ... ..., ks — натуральные числа, удовлетворяющие условию (26). Обозна- чим через Рп пространство многочленов степени < п. Тогда отобра- жение 7?: Рп —> Кп, ставящее в соответствие каждому многочлену реРп набор чисел (p(>)(A1):i = l,...,s;J = O) 1, 1), является изоморфизмом векторных пространств. Доказательство. Очевидно, что — линейное отображение. Так как dim Рп = dim Кп = п, то достаточно доказать, что Кег <р = 0. Но Кег ср состоит из многочленов, для которых каждое из чисел Л, является корнем кратности а ненулевой многочлен степени < п не может иметь так много корней (с учетом кратностей). □ Задача нахождения многочлена р степени < п, для которого чис- ла p(j)(At) (i = 1,..., s; j = 0,1,..., ki — 1) равны каким-то заданным числам, называется задачей интерполяции (с кратными узлами). В случае простых узлов, т. е. когда кх =... = к5 = 1, ответ может быть дан в виде интерполяционной формулы Лагранжа. Пример 3. Вычислим Ат, где ( 1 0 А = 1-1-6 к-1 2 5J Имеем t-1 0 3 -1 t+1 6 = t3-5t2 + 8t-4=(t-l)(t-2)2 1 -2 t —5 Интерполяционный многочлен p(t) =at2 + bt + c определяется условиями p(l) = a + b + c = l, р(2) = 4а4-2Ь4-с = 2т, p'(2) = 4a + b = m-2ni"1,
270 Глава 6. Линейные операторы откуда a = (m-2)-2m-1 + l, b = -(3rn-8)-2m-1-4, c=(2m-6)-2'n-1 + 4. Следовательно, Ат = 2m-! [(m - 2)А2 - (3m - 8)А + (2m - 6)Е] + А2 - 4А + 4Е = 73m-6 -6m+ 12 -9m + 12\ 74 -6 -6\ = 2m"1 [3m-4 -6m+ 8 -9m + 6 I + I 2 -3 -3 1. k -m 2m 3m + 2 J \0 0 oj Изложенная теория может быть обобщена с многочленов на про- извольные аналитические функции, но для этого мы должны иссле- довать топологические свойства алгебры линейных операторов. Пусть V — векторное пространство над полем К = R или С. Определение 1. Нормой в пространстве V называется всякая функция || • ||: V—>R, обладающая свойствами 1) ||х|| >0 при х/0; 2) ||Ах|| = |Л|||х||; 3) ||х + уК1|х|| + ||у||. Приведем примеры норм в Кп. Пример 4. ||x|| = max|Xi|. Пример 5. Евклидова (эрмитова) норма ||х|| = .|xj2. Примерб. ||х|| = £ |х,|. ’< Определение 2. Последовательность векторов хт называется сходящейся по норме к вектору х G V, если lim 11хт — х11 = 0. т—»» Легко видеть, что сходимость по любой из приведенных выше норм означает просто покоординатную сходимость. На самом деле это справедливо вообще для всех норм в конечномерном простран- стве, как показывает следующее Предложение 2. Для любых двух норм || • ||х и || • ||2 в конечномер- ном векторном пространстве V существуют такие положитель- ные константы aub, что а трф b при всех х G V, х / 0. V х
§ 5. Функции от линейного оператора 271 Доказательство. Достаточно сравнить произвольную норму с какой-либо фиксированной. Пусть Цх^ = 2 1*Л где -">хп — координаты вектора х в базисе {еь еп}. Тогда i где b = max ||е£||2. Неравенства i |||х +Дх||2-||х||2| ||Дх||2^Ь||Дх||1 показывают, что || • ||2 — непрерывная функция в топологии покоор- динатной сходимости. Пусть а — ее минимум на «единичной сфе- ре» ||х||j = 1 в смысле первой нормы. Тогда ||х||2 a||x||i при всех xeV. □ Замечание 2. В бесконечномерном пространстве различные нормы, во- обще говоря, определяют различные топологии. Проверьте это, например, для норм f1 11/111= \fto\dx, ||/||2=max|/(x)| Jo 0<xC1 в пространстве непрерывных функций на отрезке [0,1]. Пусть V — конечномерное векторное пространство с фиксиро- ванной нормой || • ||. 00 Определение 3. Ряд 2 xm (хт е У) называется абсолютно схо- т=1 00 дящимся, если ЧИСЛОВОЙ ряд 2 ll*m II СХОДИТСЯ. т=1 Точно так же, как для числовых рядов, доказываются следующие утверждения. ж Предложение 3. Всякий абсолютно сходящийся ряд 2 хт (хт е е V) сходится, причем m=1 L хт L ||хт||. т=1 т=1 Предложение 4. Сумма абсолютно сходящегося ряда не изменя- ется ни при какой перестановке его членов. Определим теперь норму в пространстве линейных операторов на V.
272 Глава 6. Линейные операторы Определение 4. Нормой линейного оператора d называется число ||^|| = max ||jyx|| = max ||х||=1 х#0 ||х|| Предложение 5. Определенная таким образом функция в про- странстве линейных операторов действительно является нормой. Кроме того, она обладает свойством 11^11 им Доказательство. Имеем ||j?/ + ^|| = max ||(j/+^)x|| = max ||аУх + ^х||^ M=i м=1 max(||j/x|| +1|^х||) max ||аг/х|| + max ||^х|| = ||jz/|| +1|^||. М=1 М=1 ||х||=1 Остальные свойства нормы очевидны. Далее, 1^3|1=тах«4«л!! = тах!!^!!.!й£!!4 х#0 М ||#х|| ||х|| . ||j/^x|| ||<Вх|| . 11^011 ||^х|| II _/|1 II/э»|| г-1 max -.у-- - max --трутах V^-max V-~= • D ll^xll ях/о ||x|| y/o llyll x#o IMI Задача 2. Найти явный вид нормы линейного оператора для каждой из трех приведенных выше норм в пространстве Кп. Очевидно, что норма линейного оператора не меньше, чем мо- дуль любого его собственного значения. 00 Теорема 2. Пусть ряд f(,t) = 2 amtm (ат сходится при т=0 |t| <R. Тогда ряд М)=£ат4т (28) m=0 абсолютно сходится для любого линейного оператора d, удовлетво- ряющего условию ||j/||<R. Доказательство. Как известно, из сходимости степенного ряда /(О при |t| <R следует его абсолютная сходимость в том же интер- вале (круге). Так как ||ama/m||^|am|||a/||m, то ряд У(j/) абсолютно сходится при || j/|| < R. □
§ 5. Функции от линейного оператора 273 Равенство (28) считается определением функции f от линейного оператора При этом сохраняются свойства (24). Аналогичным образом определяется функция от матрицы. Как и в случае много- членов, если А — матрица оператора аУ в каком-либо базисе, то /(А) — матрица оператора в том же базисе. Предположим теперь, как и выше, что характеристический многочлен имеет корни Ль ...,AS кратностей kb ...,ks, причем кг 4-... + ks = п. Если ||лУ|| <R, то |AJ <R при i = 1,..., s. Теорема 3. В условиях теоремы 2 найдем многочлен р степени < п, удовлетворяющий условиям (27). Тогда /СяГ) = рС*Г). Доказательство. Для любого т положим т fmW=T.aktk к=0 и обозначим через рт многочлен степени < п, удовлетворяющий условиям (27) для многочлена fm вместо /. Согласно предыдущему, /щ(^) = Из предложения 1 следует, что lim pm = р. Имеем т—»°о теперь /(Х)= lim /т(Х)= lim рт(зУ) = р(лУ). □ /и—»оо т—»°° Согласно сформулированному выше общему принципу, для лю- бого линейного оператора можно определить его экспоненту е ^ (= exp j/) по формуле е^ = |?+^ + ^ + ^ + ... (29) Как и для чисел, путем перемножения рядов с использованием предложения 4 устанавливается Теорема 4. е^+® =е^е® при — (При это свойство, как правило, не имеет места, и можно сказать, что лишь благодаря этому обстоятельству суще- ствует теория групп Ли.) При фиксированном j/ положим ^(t)=ef^ (teK). (30) Очевидно, что ^(0) = 8. Из теоремы 4 следует, что ^(c + s) = ^(c)^(s), tf(-t) = ^(t)-1. Таким образом, операторы ^(t) образуют группу. Она называется однопараметрической группой, порожденной оператором j/.
274 Глава 6. Линейные операторы Пример 7. Пусть Q — оператор дифференцирования в простран- стве многочленов степени $ п. Тогда (er®/)(x)=/(x) + ^t + ^lt2 + ...=/(x + t). гт л fG о) /'cost -sint\ , ч Пример 8. е = , (проверьте). \ Olli L wo 1 J Для операторной функции вещественной или комплексной пе- ременной можно обычным образом определить производную. При этом очевидно, что дифференцирование операторной функции сво- дится к дифференцированию матричных элементов. Теорема 5. #'(0 = = аУ^(Г). Доказательство. Так как 4- ДО = (Дс) = ^(Д0^(0, то и доказательство, как и в случае числовой экспоненты, сводится к выводу «замечательного предела» lim = (31) t-o t Имеем Ряд, заключенный в круглые скобки, при 111 < 1 мажорируется сходя- щимся числовым рядом ll^ll I ll^ll2 I IMI3 2! "Г 3! "Г 4! и потому абсолютно сходится, причем его сумма по норме не превос- ходит суммы указанного числового ряда. Отсюда и следует (31). □ Теорема 5 позволяет найти в общем виде решение системы од- нородных линейных дифференциальных уравнений с постоянными коэффициентами = (i = l,и). (32) J=1
§ 5. Функции от линейного оператора 275 (Здесь ^(t),xn(t)—неизвестные функции переменной t.) Со- гласно общей теории, система (32) имеет единственное решение, удовлетворяющее начальным условиям вида x/(O)=xio (i = l, ...,п). (33) Перепишем систему (32) в векторной форме: x'(t)=Ax(t), (34) где x(t) — вектор-столбец с координатами xf(t), а А — матрица с эле- ментами . Начальное условие (33) можно записать в форме х(О)=хо, (35) где х0 — вектор-столбец с координатами xl0. Тогда решением будет x(t) = eb4x0. (36) Доказательство этого получается непосредственной проверкой с по- мощью теоремы 5. Пример 9. Найдем решение системы дифференциальных урав- нений {Xi(t) = x1(t)-3x3(t), X^Ct) = Xj (t) — х2(с) — 6x3(t), x3(t) = -Xi (t) + 2x2(t) + 5x3(t), удовлетворяющее начальным условиям Х!(0) = 1, х2(0) = 1, x3(0) = 0. Матрица А этой системы совпадает с матрицей примера 3. Мы долж- ны вычислить /(А), где /(u) = efu (здесь t выступает как констан- та). Интерполяционный многочлен р(и) = аи2 + Ьи + с определяется условиями p(l) = a + b + c = ef, p(2) = 4a + 2b + c = e2t, p'(2) = 4a + b = te2t, откуда a = (t — l)e2t + e£, b = —(3t —4)e2t —4е£, c=(2t-3)e2t + 4ef.
276 Глава 6. Линейные операторы Следовательно, ем = е2с [(t - 1)А2 - (3t - 4)А 4- (2t - 3)Е] + е1 (А2 - 4А + 4Е) = <3t-3 -6t + 6 —9t + 6> М -6 -6\ = e2tI 3t —2 —6t + 4 -9t + 3 +ef 2 -3 -3 V -t 2t 3t +1 J kO 0 0 J Решение, удовлетворяющее заданным начальным условиям, полу- чается умножением матрицы на столбец находим Таким образом X1(t) = (-3t + 3)e2f-2ef, х2(С) = (-Зс + 2)е2г-е', x3(t) = te2f.
Глава 7 Аффинные и проективные пространства § 1. Аффинные пространства В элементарной геометрии мы имеем дело не только с вектора- ми, но и с точками (и даже главным образом с точками). Подобно тому как аксиоматика векторного пространства отражает в обоб- щенном виде свойства векторов элементарной геометрии, аксиома- тика аффинного пространства отражает свойства точек и векторов элементарной геометрии в их взаимосвязи. В «обычном» евклидовом пространстве элементарной геометрии можно определить операцию сложения точки и вектора. А именно, суммой точки р и вектора х называется точка, являющаяся концом вектора, равного х, отложенного от точки р. Свойства этой опера- ции и лежат в основе следующего определения. Пусть V — векторное пространство над полем К. Определение 1. Аффинным пространством, ассоциированным с векторным пространством V, называется множество S вместе с операцией сложения S х V —* S, удовлетворяющей следующим условиям: 1) р + (х + у) = (р + х)+у (pGS, x,yGV); 2) р + 0 = р (р G S, О — нулевой вектор); 3) для любых р, q gS существует единственный вектор х, такой, что р + x = q. Элементы множества S называются точками. Вектор х из усло- вия 3) называется вектором, соединяющим точки р и q, и обознача- ется через pq. Из условия 1) следует, что pq+qr = pr Vp,q,rGS. Всякое векторное пространство V можно рассматривать как аф- финное, считая, что точки — это те же векторы, и определив опера- цию сложения точки и вектора как сложение векторов. При этом вектор pq будет разностью векторов q и р. С другой стороны, если в аффинном пространстве S фиксиро- вать некоторую точку о — «начало отсчета», то можно отождествить
278 Глава 7. Аффинные и проективные пространства каждую точку р с ее радиус-вектором ор, При этом сложение точ- ки и вектора превратится просто в сложение векторов. Такое отож- дествление точек с векторами называется векторизацией аффинно- го пространства. (Конечно, оно зависит от начала отсчета.) Размерностью аффинного пространства по определению счита- ется размерность соответствующего векторного пространства. Точка о (начало отсчета) вместе с базисом {е2,..., еп} простран- ства V называется репером аффинного пространства S. С каждым репером связана аффинная система координат в пространстве S. А именно, каждой точке р е S приписываются координаты, равные координатам вектора ор в базисе {еь ..., еп}. Легко видеть, что 1) координаты точки р+х равны суммам соответствующих ко- ординат точки р и вектора х; 2) координаты вектора pq равны разностям соответствующих координат точек q и р. Основными объектами элементарной геометрии являются пря- мые и плоскости. Следующее определение вводит соответствующие понятия в геометрию аффинных пространств. Определение 2. Плоскостью в аффинном пространстве S назы- вается подмножество вида P = Po + U, (1) где pQ — некоторая точка, a U — подпространство пространства V. Подпространство U однозначно определяется как совокупность всех векторов, соединяющих точки плоскости Р, и называется на- правляющим подпространством плоскости Р. Сумма точки из Р и вектора из U принадлежит Р. Относительно этой операции плос- кость Р является аффинным пространством, ассоциированным с векторным пространством U, По определению dim Р = dim U. Нульмерная плоскость есть точ- ка. Одномерная плоскость называется прямой. Плоскость размерно- сти п - 1 называется гиперплоскостью, В качестве точки р0 в равенстве (1), определяющем плоскость Р, может быть взята любая точка этой плоскости. Очевидно, что пересечение плоскостей, если оно не пусто, также является плоскостью. Для любого подмножества М с S и любой точки pQeM плоскость Ро + (РоР: реМ)
§ 1. Аффинные пространства 279 является наименьшей плоскостью, содержащей М. Эта плоскость называется аффинной оболочкой множества М и обозначается через affM. Теорема 1. Через любые к 4-1 точек аффинного пространства проходит плоскость размерности $ к; при этом, если эти точки не содержатся в плоскости размерности < к, через них проходит единственная плоскость размерности к. Доказательство. Пусть р0, рь ..., рк е S. Тогда Р = Ро + {РоР1,--,РоРк} есть плоскость размерности $ к, проходящая через р0, р19..., рк. Если dimP = k, то векторы рор1?pQpk линейно независимы и Р является единственной k-мерной плоскостью, проходящей через Ро,Р1,-,Рк- п Точки pQ, р1}рк е S называются аффинно зависимыми, если они лежат в плоскости размерности < к, и аффинно независимыми в противном случае. Из доказательства теоремы 1 видно, что точки р0, Pi, •••> Рк аффинно зависимы тогда и только тогда, когда векторы PoPi, • • •> РоРк линейно зависимы. В то же время из определения ясно, что свойство точек быть аффинно зависимыми или независимыми не зависит от их нумерации (в частности, от того, какую из них мы возьмем за р0). Другая точка зрения на плоскости состоит в том, что это множе- ства решений систем линейных уравнений. Пусть дана система линейных уравнений £аох,=Ь( (i = l, (2) i=i Будем интерпретировать ...,хп как координаты точек п-мерно- го аффинного пространства S относительно некоторого репера (о; еь ..., еп). Тогда решения системы (2) можно понимать как точки пространства S. Предположим, что эта система совместна и р0 G $ — одно из ее решений. Тогда, согласно теореме 2.1.3, множество всех решений системы (2) имеет вид р0 + U, где U с V — подпростран- ство решений соответствующей системы однородных линейных уравнений, и, стало быть, является плоскостью пространства S. Обратно, пусть Р = р0 + U — некоторая плоскость. Согласно тео- реме 5.3.4, подпространство U может быть задано системой одно- родных линейных уравнений. Заменив свободные члены этих урав-
280 Глава 7. Аффинные и проективные пространства нений значениями, принимаемыми левыми частями в точке р0, мы получим систему линейных уравнений, задающую плоскость Р, Тем самым доказана Теорема 2. Всякая плоскость есть множество решений, некото- рой системы линейных уравнений. Обсудим взаимное расположение двух плоскостей Pl=Pl + l/l, P2 = p2 + U2- Очевидно, что если они пересекаются и р0 — °Дна из точек пересе- чения, то Pi ПР2 = Ро + (^1 Теорема 3. Плоскости Рх и Р2 пересекаются тогда и только то- гда, когда Р1Р2€^1 + ^2- Доказательство. Плоскости Рг и Р2 пересекаются тогда и только тогда, когда существуют такие векторы иг G Ulf и2 е U2, что Р1 + ^1=Р2 + ^2- Это равенство может быть переписано в виде pTpI=u1-u2- Поэтому существование таких векторов щ,и2 как раз и означает, что Р1Р2^^1 + ^2- □ Плоскости Pj и Р2 называются параллельными, если с U2 или U2 с Ui, и скрещивающимися, если Рг ПР2 = 0 и Щ nU2 = 0. Задача 1. Какова наименьшая размерность пространства, в ко- тором существуют скрещивающиеся двумерные плоскости? Задача 2. Определить dim aff UP2). Линейные комбинации точек аффинного пространства, вооб- ще говоря, не определены. Однако некоторым из них можно при- дать смысл. А именно, назовем барицентрической линейной ком- бинацией точек plf..., pke S линейную комбинацию вида ^А^р,, где А, = 1, и будем считать ее равной точке р, определяемой i равенством op = SA<op?>
§ 1. Аффинные пространства 281 где о е S. Благодаря условию £ Af = 1 это определение не зависит i от выбора точки о. Действительно, пусть о' — любая другая точка. Тогда о'р = о'о + ор = ^-i (.o'о + орд = Л, о'pt. i i В частности, центр тяжести системы точек {рь ...,рк} можно определить как center(p1,...,pk) = |(p1 + ... + pfc). Задача 3. Показать, что на обычной евклидовой плоскости а) центр тяжести точек р есть середина отрезка pq; б) центр тяжести множества вершин треугольника есть точка пересечения его медиан. Барицентрическая комбинация Ар 4- pq двух точек р и q есть точка г, лежащая на прямой pq и обладающая тем свойством, что pr=yrq (3) л (если А = 0, р = 1, то г = q). В самом деле, приняв точку г за точку о в данном выше определении барицентрической линейной комбина- ции, мы получаем: 0 = Arp4-prq, откуда и следует (3). В случае обычной евклидовой плоскости точка г = Ар 4- pq делит отрезок pq в отношении р: А (она лежит на самом отрезке, если А, р 0, и на его продолжении, если А < 0 или р < 0). Допуская вольность речи, мы будем употреблять это выражение и в общем случае, когда понятие отрезка не имеет смысла. Задача 4. Аффинная оболочка множества М с S есть совокуп- ность всех барицентрических линейных комбинаций точек из М. Предположим, что поле К содержит более двух элементов. Теорема 4. Непустое подмножество PC.S является плоскостью тогда и только тогда, когда вместе с любыми двумя различными точками оно содержит проходящую через них прямую. Доказательство. Утверждение «только тогда» очевидно. Пусть теперь Р с S — непустое подмножество, обладающее указанным свойством. Фик- сируем произвольную точку роеР и рассмотрим подмножество U = {иеV: P04-ugP}cV. Нам нужно доказать, что U — подпространство. Ясно, что
282 Глава 7. Аффинные и проективные пространства оно содержит 0. Далее, если и G U —любой ненулевой вектор и Л G К, то точка pQ + Ли лежит на прямой, проходящей через р0 и р0 4- и и, следователь- но, Ли G U. Докажем, наконец, что если u:, и2 в U — непропорциональные векторы, то Uj + u2 G U. Пусть Л—любой элемент поля К, отличный от 0 и 1. Легко видеть, что точка р = р0 4- иг 4- и2 лежит на прямой, проходящей через точки Pi = р0 4- Хщ G Р и р2 = Pq 4- —-г u2 G Р, а именно Л 1 п- 1„ хА-1п p-XPl + ~P2’ Следовательно, р G Р, □ Замечание 1. Если поле К состоит из двух элементов, то любая прямая пространства S состоит всего из двух точек и, таким образом, любое непу- стое подмножество Р с S удовлетворяет условию теоремы (но не любое непустое подмножество является плоскостью). Пусть Ро>Р1>--->Рп—такие точки п-мерного аффинного прост- ранства S, что векторы роръ ..., рорп линейно независимы. Тогда каждая точка р G S единственным образом представляется в виде P = Z>iPi> W £х, = 1. i=0 i=0 В самом деле, это равенство можно переписать в виде РоР = S xiPoPb 1=1 откуда следует, что в качестве ..., хп можно (и должно) взять ко- ординаты вектора рор в базисе {роръ ..., рорп}; после этого х0 опре- п деляется равенством х0 = 1 “ X хг i=l Числа х0, ..., хп называются барицентрическими координата- ми точки р относительно р0, рь..., рп. Пример 1. Пусть точки u, и, w, лежащие на сторонах qr, гр, pq треугольника pqr (см. рис. 1), делят эти стороны в отношениях Л : 1, р : 1, v : 1 соответственно. Докажем теорему Чевы\ прямые pu, qv, rw пересекаются в одной точке тогда и только тогда, когда Л/iv = 1. Для этого рассмотрим барицентрические координаты относительно точек р, q, г. Барицентрические координаты точек и, v, w суть
§ 2. Аффинные отображения 283 Рис. 1 Рис. 2 соответственно. Точки прямой ри являются барицентрическими комбинациями точек р и и. Их барицентрические координаты х, у, z характеризуются тем, что z : у = Л. Аналогично, барицен- трические координаты точек прямой qv характеризуются тем, что х: z = g, а барицентрические координаты точек прямой rw — тем, что у: х = v. Точка, барицентрические координаты которой удовле- творяют всем этим трем условиям, существует тогда и только тогда, когда Agv = 1. Задача 5. Точки р0, ръ ..., рк аффинно независимы тогда и толь- ко тогда, когда ранг матрицы, составленной из их барицентриче- ских координат, равен к +1. Задача 6. Пусть точки и, v,w, лежащие на сторонах qr, rp,pq треугольника pqr или их продолжениях (см. рис. 2), делят эти сторо- ны в отношениях Л: 1, g: 1, v : 1 соответственно. Используя преды- дущую задачу, доказать теорему Менелая: точки и, и, w лежат на одной прямой тогда и только тогда, когда Agv = -1. § 2. Аффинные отображения Пусть S и S' — аффинные пространства, ассоциированные с век- торными пространствами V и V' соответственно (над одним и тем же полем). Определение 1. Аффинным отображением пространства S в пространство S' называется всякое отображение f: S —► S', обладаю- щее свойством Др + х) = Л₽) + Лх) (р е S, х е V), (4) где <р — некоторое линейное отображение пространства V в про- странство V'.
284 Глава 7. Аффинные и проективные пространства Из (4) вытекает, что Cp,qeS). (5) Тем самым линейное отображение однозначно определяется по /. Оно называется дифференциалом отображения f и обозначается че- рез df. Векторизуем пространства S и S', приняв за начала отсчета ка- кие-то точки о и о' соответственно. Полагая в (4) р = о, мы получаем следующее представление аффинного отображения f в векторизо- ванной форме: /(х) = <р(х) + Ь (ЬеГ), (6) где b = о'/(о). Отсюда, в свою очередь, получается запись отображе- ния f в координатах: = S aijxj + bi (i = 1> • • , rn), (7) j=i где Xj,...»xn — координаты точки x, а уг,..., ym — координаты точки y=fW. Обратно, как легко проверить, для любого линейного отображе- ния ip: V —► V' и любого вектора b е V' отображение, определяемое формулой (6), аффинно и его дифференциал равен Пусть S" — еще одно аффинное пространство и g: S' —► S" — аф- финное отображение. Предложение 1. Отображение gf:S^>S" является аффинным, причем d(gf) = dg-df. (8) Доказательство. При р G S, х G V имеем = g(/(p)) + dg(d/(x)) = (g/)(p) + (dg- d/)(x). □ При К = R дифференциал аффинного отображения есть частный случай дифференциала произвольного гладкого отображения, рас- сматриваемого в анализе, а формула (8) есть частный случай фор- мулы для дифференциала произведения гладких отображений (или «сложной функции»). Предложение 2. Аффинное отображение биективно тогда и только тогда, когда его дифференциал биективен.
§ 2. Аффинные отображения 285 Доказательство. Выберем начала отсчета о и о' в простран- ствах S и S' таким образом, чтобы /(о) = о'. Тогда отображение f в векторизованной форме будет совпадать со своим дифференциа- лом, откуда и следует доказываемое утверждение. □ Биективное аффинное отображение называется изоморфизмом аффинных пространств. Аффинные пространства называются изо- морфными, если между ними существует изоморфизм. Следствие. Конечномерные аффинные пространства (над одним и тем же полем) изоморфны тогда и только тогда, когда они име- ют одинаковую размерность. Очевидно, что при аффинном отображении f:S—>S' всякая плос- кость Р = р 4- U пространства S переходит в плоскость /(Р) = /(р) 4- 4- df(U) пространства Sz. Если f биективно, то dim /(Р) = dim Р. Предложение 3. Пусть f:S^S/ — аффинное отображение. То- гда ffaipi^llwpd 4 i i для любой барицентрической линейной комбинации ^iPi точек Рь •••, Рк- Доказательство. Векторизуем пространство S. Тогда f запишет- ся в виде (6), и мы получим f (S *.Р.) = «Р (S А.Р,) + ь = S Л,(<р(р() + b) = S Л,/(р,). □ В частности, центр тяжести системы точек при аффинном отоб- ражении переходит в центр тяжести системы их образов. Частным случаем аффинных отображений являются аффинно- линейные функции. Определение 2. Аффинно-линейной функцией на аффинном про- странстве S называется всякая функция f:S-+K, обладающая свой- ством ftp + х) = ftp) + а(х) (р е S, х G V), (9) где а — некоторая линейная функция на векторном пространстве V, называемая дифференциалом функции f и обозначаемая через df. Иначе говоря, аффинно-линейная функция — это аффинное отображение пространства S в поле К, рассматриваемое как аффин- ная прямая.
286 Глава 7. Аффинные и проективные пространства В векторизованной форме с началом в точке о аффинно-линей- ная функция f записывается в виде /(x) = a(x) + b (be К), (10) где b = /(о). Отсюда, в свою очередь, получается запись функции f в координатах: /(x) = Sa,xi + b. (11) i Частным случаем аффинно-линейных функций являются посто- янные функции. Они характеризуются тем, что их дифференциал равен нулю. Если f — непостоянная аффинно-линейная функция, то ее многообразия уровня f(p) = c суть параллельные гиперплоско- сти с направляющим подпространством, задаваемым уравнением df(x)=0. Аффинно-линейные функции образуют (п + 1)-мерное подпро- странство (где n = dimS) в пространстве всех функций на S. Это ясно хотя бы из их координатной записи (11). Докажем одно утверждение, которое нам понадобится в следую- щем параграфе. Предложение 4. Барицентрические координаты суть аффинно- линейные функции. Доказательство. Пусть х0, хь ...,хп— барицентрические коор- динаты относительно точек р0, Pi, •••, Рп- Если векторизовать про- странство S, приняв точку pQ за начало отсчета, то х1?...,хп бу- дут обычными координатами относительно базиса (рор1э..., рорп). Следовательно, х1э ...,хп— аффинно-линейные функции. Так как п xQ = 1 - 2 xi, то *о — также аффинно-линейная функция. (Это мож- i=l но было бы также доказать, приняв за начало отсчета какую-нибудь другую из точек р( .) □ Аффинное отображение аффинного пространства S в себя назы- вается аффинным преобразованием. Биективные аффинные преоб- разования образуют группу, называемую полной аффинной группой пространства S и обозначаемую через GA(S). (Это согласуется с тем определением, которое было дано в § 4.2 в векторной форме.) В силу предложения 1 отображение d: GA(S)->GL(V)
§ 2. Аффинные отображения 287 является гомоморфизмом групп. Его ядро есть группа параллельных переносов ta:p<-»p + a (aeV). Обозначим ее через Trans (S). Предложение 5. Для любых f € GA(S) и а е V имеем РаГ1^^- (12) Доказательство. Применяя преобразование /га/-1 к точке q = = /(р), получаем ftaf'1 (<?) = Л»(Р)=/(р + а) =7(Р) + df (а) = q + d/(a). □ Тот факт, что преобразование Д,/”1 является параллельным пе- реносом, можно было бы доказать, вычислив его дифференциал при помощи предложения 1. Если фиксировано начало отсчета о G S и тем самым аффинное пространство S отождествлено с векторным пространством V, то группа GL(V) становится подгруппой группы GA(S). Это не что иное, как стабилизатор точки о в группе GA(S). Из записи аффинных преобразований в векторизованной форме (6) следует, что всякое аффинное преобразование / € GA(S) единственным образом пред- ставляется в виде / = tb¥> (ср GGL(V), bG V). (13) Ясно, что = df не зависит от выбора начала отсчета, но вектор Ь = о/(о) от этого, вообще говоря, зависит. Задача 1. Доказать, что при переходе к началу отсчета oz = о 4- а (a G V) вектор b заменяется на вектор b' = b + <p(a)-a. (14) Пример 1. Согласно предложению 4.2.2, всякое движение евкли- довой плоскости Е2 является (биективным) аффинным преобразова- нием. То же верно для евклидова пространства Е3. Пример 2. Гомотетия с центром в точке о и коэффициентом А есть аффинное преобразование, задаваемое формулой /(о + х) = о +Ах. Ясно, что df = А<£. Докажем, что всякое аффинное преобразование /, для которого d/ = А<? (А 01), есть гомотетия с центром в некоторой
288 Глава 7. Аффинные и проективные пространства точке. Для этого достаточно доказать, что f имеет неподвижную точку. Запишем f в векторизованной форме: /(х) = Лх + Ь (ЬеУ). Уравнение /(х) = х приводится к виду (1 - Л)х = b и, следовательно, имеет (единственное) решение. Гомотетия с коэффициентом -1 называется центральной сим- метрией. Задача 2. Доказать, что произведение гомотетий с центрами в разных точках с коэффициентами А и g при Лр, /1 есть гомотетия, а при Лр = 1 — нетривиальный параллельный перенос. Группа аффинных преобразований определяет аффинную гео- метрию в том смысле, что задачей аффинной геометрии является изучение свойств фигур, инвариантных при (биективных) аффин- ных преобразованиях. Так как при таких преобразованиях любая плоскость переходит в плоскость той же размерности, а любая бари- центрическая линейная комбинация точек — в барицентрическую линейную комбинацию их образов с теми же коэффициентами, то понятия плоскости и барицентрической комбинации точек, а сле- довательно, понятия параллельных прямых, параллелограмма, от- резка, середины отрезка, центра тяжести системы точек, выпуклого множества, симплекса и т. д. относятся к числу понятий аффинной геометрии. Но, например, понятия квадрата и окружности к числу таковых не относятся, так как при аффинном преобразовании квад- рат может перейти в параллелограмм, не являющийся квадратом, а окружность — в эллипс, не являющийся окружностью. Следующая теорема показывает, что в аффинной геометрии все симплексы равны (например, на аффинной плоскости все треуголь- ники равны). Теорема 1. Пусть {р0, р1}..., рп} и {q0, qlf..., qn}— две системы аффинно независимых точек в п-мерном аффинном пространстве S. Тогда существует единственное аффинное преобразование f, перево- дящее pi в qt при i = О,1,..., п. Доказательство. Существует единственное линейное преобра- зование пространства V, переводящее базис {роръ ..., РоРп} в ба- зис {ЧоЧТ, •••> ЯоЯпУ Векторизуем пространство S, приняв за начало отсчета точку р0. Тогда искомое аффинное преобразование f запи- сывается в виде f(x) = <p(x) + p^fo. □
§ 2. Аффинные отображения 289 Задача 3. Доказать, что в вещественной аффинной геометрии все параллелепипеды равны. Задача 4. Пусть Р2, Р{, Р2С$ — плоскости с направляющими подпространствами U2, U'v U2 соответственно. Предположим, что dim Pj = dim Р', dim Р2 = dim Р2, dim Щ П U2 = dim U' П U2 и пере- сечения Р} ПР2 и Pj ПР2 пусты или непусты одновременно. Доказать, что тогда существует преобразование f G GA(S), переводящее Pj в Р' и Р2 в Р^. В аффинной геометрии не существует понятия расстояния меж- ду точками, так как любую пару различных точек с помощью аффин- ного преобразования можно перевести в любую другую такую пару. Однако при аффинных преобразованиях сохраняется так называе- мое отношение тройки точек, лежащих на одной прямой. Пусть точки рь р2, р3 лежат на одной прямой I. Тогда если р2 / р3, то Р1Рз = сРзРг (с в К). Число с и называется (простым) отноше- нием тройки точек Pi,p2, Рз и обозначается через (Р1,Р2,Рз)- Ес- ли pi / р2 = Рз, то полагают (ръ р2, р3) = <». Если = р2 = р3, то (Pi, р2, р3) не определено. Если с = -, то говорят также, что точка р3 М делит отрезок pjp2 в отношении Л: р (хотя само понятие отрезка определено только в вещественной геометрии). При Л 4- м = 1 это означает, что РЗ = МР1+^Р2- Ясно, что отношение точек рь р2, р3 сохраняется при любом аффин- ном преобразовании, не стягивающем прямую I в точку (в частно- сти, при любом биективном аффинном преоб- разовании). Задача 5. Выяснить, как изменяется отно- /\ шение тройки точек при перестановках этих / точек. Какое наибольшее и какое наименьшее и / 'к число различных значений оно может прини- 7 \ мать? Z-----•-------А Л „ D W Q Задача 6. Построить треугольник pqr по г точкам и, и, ш на его сторонах qr, гр, pq (или Рис. з их продолжениях), делящих их в отношениях Л: 1, р : 1, v : 1 соответственно (рис. 3). (Указание: рассмотреть произведение гомотетий с центрами в точках и, v, w, переводящих г в q, р в г, q в р соответственно.)
290 Глава 7. Аффинные и проективные пространства § 3. Выпуклые множества Пусть S — аффинное пространство, ассоциированное с вектор- ным пространством V над полем вещественных чисел. Определение 1. Отрезком, соединяющим точки р, q е S, называ- ется множество pq = {Ap + (l-A)q: 0^A$l}cS. Определение 2. Множество М с S называется выпуклым, если вместе с любыми двумя точками оно содержит соединяющий их отрезок. Очевидно, что пересечение выпуклых множеств выпукло. Любая плоскость является выпуклым множеством. Определение 3. Выпуклой линейной комбинацией точек прост- ранства S называется их барицентрическая линейная комбинация с неотрицательными коэффициентами. Предложение 1. Выпуклое множество М с S вместе с любыми точками р0, plf..., pfc содержит любую их выпуклую линейную ком- бинацию р = ^iPi- Доказательство. Докажем, что р G М, индукцией по числу I ко- эффициентов Ао, ..., отличных от нуля. При I = 1 точка р совпадает с одной из точек р0, рь ..., рк, так что доказывать нечего. Пусть I > 1. Будем считать для определенности, что / 0. Заметим, что /1, так как иначе все остальные коэффициенты были бы равны нулю. Имеем: А-i А А Р = Е jT^Pi )+Л<сРЪ М=0 k J т. е. р лежит на отрезке p'pfc, где По предположению индукции р' GМ. Следовательно, и р GМ. □ Предложение 2. Д,ля любого множества MaS множество convM всевозможных выпуклых линейных комбинаций точек из М являет- ся выпуклым множеством.
§ 3. Выпуклые множества 291 Доказательство. Пусть р = £ ^tPi и q = £ — выпуклые ли- нейные комбинации точек из М. Тогда при 0 $ Л $ 1 Лр + (1 - A)q = £ AA,p, + £(1 - Л)ptfqf i i есть также выпуклая линейная комбинация точек из М. □ Множество convM является наименьшим выпуклым множе- ством, содержащим М; оно называется выпуклой оболочкой множе- ства М. Выпуклая оболочка системы {р0, Pi, • ••, РпУ аффинно независи- мых точек п-мерного пространства называется п-мерным симплек- сом с вершинами в точках р0, рь рп. Иными словами, симплекс состоит из точек, барицентрические координаты которых относи- тельно Ро,Р1,---,Рп неотрицательны. Нульмерный симплекс — это точка, одномерный симплекс — отрезок, двумерный — треугольник, трехмерный — тетраэдр (треугольная пирамида). Точка множества М с S называется внутренней, если некоторая ее окрестность целиком содержится в М, и граничной в против- ном случае. Очевидно, что точки симплекса, барицентрические ко- ординаты которых относительно вершин симплекса положительны (и только они), являются внутренними. Предложение 3. Выпуклое множество М содержит внутренние точки тогда и только тогда, когда aff М = S. Доказательство. Если aff М = S, то М содержит систему из п 4-1 аффинно независимых точек. Но тогда М содержит симплекс с вер- шинами в этих точках и, значит, содержит внутренние точки. Обрат- ное очевидно. □ Задача 1. Доказать, что замыкание выпуклого множества выпук- ло, причем всякая его внутренняя точка является внутренней точ- кой самого множества. Выпуклое множество, содержащее внутренние точки, называет- ся выпуклым телом. Предложение 4. Пусть р — внутренняя точка выпуклого те- ла М и q —любая его точка. Тогда все точки отрезка pq, за исклю- чением, быть может, точки q, являются внутренними точками тела М. Доказательство. Рассмотрим точку r = Ap + (l-A)q (0 < Л 1).
292 Глава 7. Аффинные и проективные пространства Имеем P = |r + ^q. Если точка г' достаточно близка к г, то точка Р/ = Хг/ + ^Гч близка к точке р и, следовательно, лежит в М (см. рис. 4). Так как r' = Ap' + (l-A)q, то отсюда следует, что г'ЕМ. □ Следствие 1. Внутренние точки выпуклого тела образуют вы- пуклое множество. Следствие 2. Всякая точка выпуклого тела является пределом его внутренних точек. Множество внутренних точек выпуклого тела М обозначим че- рез М°. Это открытое выпуклое тело. Согласно предложению 3, всякое выпуклое множество М с S яв- ляется выпуклым телом в aff М. Допуская вольность речи, часто го- ворят о внутренних точках произвольного выпуклого множества М, имея в виду его внутренние точки в пространстве aff М. Для любой непостоянной аффинно-линейной функции f на про- странстве S (см. § 2) положим Hy = {pGS:f(p) = 0}, H+ = {peS:/(p)^0}, H; = {peS:/(p)^0}(=H^). Множество Hf является гиперплоскостью. Множества и на- зываются (замкнутыми) полупространствами, ограничиваемыми гиперплоскостью Ну. Из предложения 2.3, примененного к аффин- но-линейной функции /, следует, что всякое полупространство яв-
§ 3. Выпуклые множества 293 ляется выпуклым множеством. С другой стороны, всякий отрезок, соединяющий точку из Hf с точкой из HJ, пересекает гиперплос- кость Hf. Определение 4. Гиперплоскость Hf называется опорной гипер- плоскостью замкнутого выпуклого тела М, если МсН^ и Hf содер- жит некоторую (граничную) точку тела М. Полупространство Hf называется при этом опорным полупространством тела М. Предложение 5. Гиперплоскость Н, проходящая через гранич- ную точку замкнутого выпуклого тела М, является опорной тогда и только тогда, когда Н П М° = 0. Доказательство. Если Н П М° 0 0, то точки множества М° (и тем самым точки тела М) имеются по обе стороны от Н. Обратно, если точки тела М имеются по обе стороны от Н, то, поскольку каждая точка тела М является пределом точек множества М°, по обе стороны от Н имеются даже точки этого множества. Отрезок, соединяющий две такие точки, целиком лежит в М° и пересекает Н, так что НРМ°/0. □ Ключевой теоремой теории выпуклых множеств является следу- ющая теорема отделимости. Теорема 1. Через любую граничную точку замкнутого выпукло- го тела проходит опорная гиперплоскость. Доказательство. Пусть р — граничная точка замкнутого выпук- лого тела М в п-мерном аффинном пространстве. Докажем индукци- ей по к, что при k п — 1 через точку р проходит k-мерная плоскость, не пересекающая М°. При к = 0 такой плоскостью является сама точка р. Предположим, что уже удалось найти (к — 1)-мерную плоскость Р с нужными свой- ствами. Выберем любую (к + 1)-мерную плос- / М \ кость S', содержащую Р и какую-нибудь внут- [ . ; . ] реннюю точку р0 тела М, и попытаемся найти \ J нужную нам k-мерную плоскость среди плоско- X. стей, содержащих Р и содержащихся в S'. Рассмотрим выпуклое тело М' = М П S' в про- Рис-5 странстве S'. Ясно, что М° nS' с (М')°. Обратно, всякая точка г G (М')° является внутренней точкой отрезка, соединя- ющего точку р0 с некоторой точкой q ЕМ'сМ (см. рис. 5), и потому принадлежит М°. Таким образом, (М')° = М°П5'.
294 Глава 7. Аффинные и проективные пространства В частности, отсюда следует, что Р П (М')° = 0, и нам достаточно до- казать, что в S' существует опорная гиперплоскость тела М', содер- жащая Р. Изменив обозначения, будем считать, что S' = S, М' = М и k +1 — и. Итак, пусть Р — это (п - 2)-мерная плоскость, проходящая через точку р и не пересекающая М°. Докажем, что существует опорная гиперплоскость тела М, содержащая Р. Каждая гиперплоскость Н, содержащая плоскость Р, разбивается ею на две полуплоскости (или полугиперплоскости, если угодно), скажем, Н+ и Н~ (не путать с предыдущими обозначениями полу- пространств). Если ни одна из полуплоскостей Н+ и Н~ не пере- секает М°, то все доказано. Если они обе пересекают М°, то и Р пересекает М°, так что этот случай невозможен. Пусть теперь Н+ пересекает М°, а Н~ не пересекает. Начнем поворачивать гиперплоскость Н вокруг Р, условно говоря, по часо- вой стрелке. Ясно, что при небольшом повороте полуплоскость Н+ по-прежнему будет пересекать М°. Однако при повороте на я она перейдет в полуплоскость которая М° не пересекает. Поэтому существует некий минимальный поворот, при котором Н+ переста- ет пересекать М°. Повернутую таким образом гиперплоскость Н обозначим через Но. Согласно построению, полуплоскость не пересекает множе- ство М°, но при малейшем повороте против часовой стрелки начи- нает его пересекать (см. рис. 6). С другой стороны, если бы полу- плоскость Н~ пересекала М°, то она сохранила бы это пересечение Рис. 6
§ 3. Выпуклые множества 295 при любом небольшом повороте. Но, как мы уже отмечали, обе половины гиперплоскости, содержащей Р, не могут пересекать М°. Следовательно, Hq не пересекает М° и, значит, Но — опорная гипер- плоскость. □ Замечание 1. Фактически мы доказали более сильное утвержде- ние, а именно, что любая плоскость, проходящая через точку р и не пересекающая М °, содержится в некоторой опорной гиперплос- кости. Замечание 2. Через данную граничную точку р тела М может проходить либо единственная опорная гиперплоскость, как на рис. 6, либо бесконечно много таких гиперплоскостей, как на рис. 7. Опорная гиперплоскость может содержать и другие точки тела М, кроме точки р, как на рис. 8. Теорема 2. Всякое замкнутое выпуклое множество М является пересечением некоторого (быть может, бесконечного} числа полу- пространств. Доказательство. Заметим, что всякая гиперплоскость Hf явля- ется пересечением полупространств и HJ, Отсюда следует, что и плоскость любой размерности является пересечением полупро- странств. Поэтому доказательство теоремы сводится к случаю, ко- гда М— тело. Докажем, что замкнутое выпуклое тело М является пересечени- ем своих опорных полупространств. Пусть q М и р — какая-либо внутренняя точка тела М. Отрезок pq пересекает границу тела М в некоторой точке r^q. Проведем через эту точку опорную гипер-
296 Глава 7. Аффинные и проективные пространства плоскость Hf (см. рис. 9). Так как /(р) > 0, а /(г) = 0, то /(q) < О, т.е. q$H+. □ Определение 5. Пересечение конечного числа полупространств называется выпуклым многогранником. Выпуклый многогранник, являющийся телом, называется телесным. Иными словами, выпуклый многогранник есть множество реше- ний конечной системы линейных неравенств. Отметим, что выпук- лый многогранник не обязан быть ограниченным. Так, например, все пространство S является выпуклым многогранником (пересече- ние пустого множества полупространств). Выпуклый многогранник не обязан быть телесным (хотя иногда это и требуют). Очевидно, что пересечение конечного числа выпуклых много- гранников является выпуклым многогранником. Любая плоскость является выпуклым многогранником. Пример 1. Симплекс с вершинами р0, Pi, •••, Рп является выпук- лым многогранником, так как он может быть задан линейными неравенствами xL 0 (i = 0,1,..., и), где х0, ..., хп — барицентри- ческие координаты относительно р0, Pi, Рп- Пример 2. Выпуклый многогранник, задаваемый линейными неравенствами 0 $ х, $ 1 (i = 1,..., и), где хь ...,хп — аффинные координаты относительно некоторого репера, называется п-мерным параллелепипедом. Определение 6. Точка р выпуклого множества М называется крайней, если она не является внутренней точкой никакого отрезка, целиком лежащего в М.
§ 3. Выпуклые множества 297 Теорема 3. Всякое ограниченное замкнутое выпуклое множе- ство М является выпуклой оболочкой множества Е(М) своих край- них точек. Доказательство. Положим М = conv Е (М). Очевидно, что М с М. Докажем индукцией по dim S, что М с М. При dim S = 0 доказывать нечего. Пусть dim S > 0 и р GМ. Докажем, что реМ. Будем считать, что М — тело, так как иначе можно применить предположение ин- дукции. Рассмотрим два случая. 1-й случай. Пусть р — граничная точка. Проведем через р опорную гиперплоскость Н. Тогда М ГУН — ограниченное замкну- тое выпуклое множество, и всякая его крайняя точка является в то же время крайней точкой множества М. По предположению индукции М ГУН является выпуклой оболочкой множества своих крайних точек. Следовательно, р еМ. 2-й случай. Пусть р — внутренняя точка. Проведем через р лю- бую прямую. В силу ограниченности множества М она пересекает его по некоторому отрезку qr, содержащему точку р. Точки q и г являются граничными точками тела М и по доказанному принадле- жат М. Следовательно, р G М. □ Теорема 4 (теорема Минковского—Вейля). Следующие свойст- ва ограниченного множества М aS равносильны: 1) М — выпуклый многогранник-, 2) М — выпуклая оболочка конечного числа точек. Доказательство. 1) Пусть т М=Г\Н+ (15) 1=1 — выпуклый многогранник. Докажем, что всякая его крайняя точ- ка есть единственная точка пересечения некоторых из гиперплос- костей Hf}, Отсюда будет следовать, что М имеет лишь ко- нечное число крайних точек. С другой стороны, по теореме 3 он является их выпуклой оболочкой. Пусть реМ — крайняя точка. Положим J = U:/;(p) = 0}c{l,...,m}, P = {xeS: fjM = Q при j g J}. Так как /(p) > 0 при i J, то р является внутренней точкой выпук- лого многогранника МГУР в пространстве Р. Но р — крайняя точка
298 Глава 7. Аффинные и проективные пространства множества М и, следовательно, — крайняя точка множества МПР. Это означает, что dim Р = 0, т. е. Р = {р}. 2) Пусть M = conv{pb ..., рк}. Будем считать, что aff M = S, и рас- смотрим выпуклый многогранник ( к 1 М* = {f: f (р,) 0 при i = 1,..к, £ /Cpf) = 1 f V 1=1 J в пространстве аффинно-линейных функций на S. Так как аффин- но-линейная функция на S однозначно определяется своими значе- ниями в точках рь..., рк, а для функций из М* эти значения при- надлежат отрезку [0,1], то М* — ограниченный многогранник. По доказанному он является выпуклой оболочкой конечного числа то- чек, скажем, f19..., fm. По теореме 2 множество М (очевидно, что оно замкнуто) может быть задано линейными неравенствами. Следовательно, M = {pGS:f(p)^0 V/GM*} = {pGS:/f(p) 0 при i = l, ...,m}. Таким образом, М — выпуклый многогранник. □ Определение 7. Гранью выпуклого многогранника М называет- ся всякое непустое пересечение этого многогранника с некоторым числом его опорных гиперплоскостей. (Сам многогранник М так- же считается своей гранью как пересечение с пустым множеством опорных гиперплоскостей.) Нульмерная грань называется вершиной, одномерная — ребром, (и - 1)-мерная (где и = dim aff М) — гипергранью. Пусть многогран- ник М задан формулой (15). Следующая теорема показывает, что для нахождения его граней можно ограничиться рассмотрением ги- перплоскостей Hf . Теорема 5. Всякая грань Г многогранника М имеет вид г=мп(Г|нД (16) где 7с{1, Доказательство. Пусть Г' — грань многогранника М. Положим 7 = {;:Г'сНЛ}С{1,...,гп}. Для каждого i ф J существует такая точка р, G Г', что fi(Pi) > 0. Пусть р — центр тяжести системы этих точек. Тогда /;(р)>0 при всех Определим теперь грань Г по формуле (16) и докажем, что Г' = Г. Ясно, что Г с Г и что точка р является внутренней точкой гра-
§ 3. Выпуклые множества 299 ни Г. Следовательно, всякая опорная гиперплоскость, проходящая через р, содержит Г. Значит, Г' = Г. □ Таким образом, если выпуклый многогранник задан системой линейных неравенств, то его грани получаются заменой части этих неравенств равенствами (но так, чтобы при этом получилось непу- стое множество). Нужно, однако, иметь в виду, что на определенной таким образом грани некоторые другие неравенства могут автома- тически обращаться в равенства. Пример 3. Грани п-мерного параллелепипеда, задаваемого нера- венствами 0 : $ 1 (i = 1,..., п), выделяются тем, что некоторые координаты равны 0 или 1. В частности, вершины — это точки, все координаты которых равны 0 или 1. Задача 2. Найти грани сечения п-мерного параллелепипеда 0 $ (£ = 1, ...,п) гиперплоскостью + ... + хп = п/2. Задача 3. Найти грани п-мерного симплекса. Задача 4. Доказать, что все грани многогранника сопу{рь ..., рк} являются выпуклыми оболочками некоторых из точек plf..., рк. Изучение комбинаторного строения выпуклых многогранников — это увлекательная и важная область математики. Вот два примера результатов из этой области. 1. Назовем /-вектором п-мерного ограниченного выпуклого многогран- ника последовательность (а0, а1?..., an_i), где ак — число /с-мерных граней этого многогранника. Каковы необходимые и достаточные условия для то- го, чтобы данная последовательность п натуральных чисел была /-векто- ром некоторого п-мерного многогранника? При п = 3 это следующие усло- вия (теорема Штейница): 2а 1 а0-а1+а2 = 2, 4^а0,а2^ “у- В общем случае ответ неизвестен. 2. Назовем вершины р и q выпуклого многогранника смежными, если отрезок pq является ребром этого многогранника. Легко видеть, что един- ственным трехмерным выпуклым многогранником, у которого любые две вершины смежны, является тетраэдр. Совершенно иная ситуация в 4-мер- ном пространстве. Как показал Д. Гейл, там существуют выпуклые много- гранники с любым числом вершин, у которых любые две вершины смеж- ные. Например, пусть М — выпуклая оболочка точек pi = (tl.t12(t13,t14), i = l, где tj,..., tN — различные вещественные числа. Тогда 1) каждая из точек р, является вершиной многогранника М (и это все его вершины: см. задачу 4);
300 Глава 7. Аффинные и проективные пространства 2) каждый из отрезков р(р; (i#J) является ребром многогранника М. Докажите это самостоятельно. Предложение 6. Крайние точки выпуклого многогранника М — это в точности его вершины. Доказательство. Если точка р является внутренней точкой от- резка, целиком лежащего в М, то любая опорная гиперплоскость, проходящая через р, содержит этот отрезок и, следовательно, р не может быть вершиной. Обратно, если точка р не является верши- ной, то она является внутренней точкой некоторой грани положи- тельной размерности и, значит, не может быть крайней точкой. □ Важнейшие применения выпуклых многогранников вне матема- тики связаны с линейным программированием. Основная задача ли- нейного программирования формулируется таким образом: найти максимум (минимум) заданной аффинно-линейной функции на за- данном выпуклом многограннике. Очевидно, что задача о миниму- ме функции f равносильна задаче о максимуме функции поэто- му можно говорить только об одной из этих задач. В основе линейного программирования лежит следующая Теорема 6. Максимум аффинно-линейной функции f на ограни- ченном выпуклом многограннике М достигается в одной из его вер- шин. Доказательство. Согласно теореме 3 и предложению 6, каждая точка р многогранника М представляется в виде выпуклой линей- ной комбинации его вершин ръ ..., pk: к к 1=1 i=l В силу предложения 2.3 к /(р) = L ^/(р,) max f(pi), 1=1 1 откуда и следует утверждение теоремы. □ Приведем два примера ситуаций, в которых возникает задача линейного программирования. Пример 4 (задача о получении максимальной прибыли). Неко- торое предприятие располагает ресурсами Рь ...,Рт в количестве blt..., bm соответственно и планирует произвести продукцию типов
§ 3. Выпуклые множества 301 Пь..., Пп в количестве хь ..., хп соответственно. Пусть — количе- ство ресурса Рн нужное для производства единицы продукции П;, и Cj — цена единицы продукции П;. Очевидно, что должны выпол- няться неравенства = 0 = 1,п). J=i Они задают некоторый выпуклый многогранник М в п-мерном про- странстве с координатами ...,хп. Для получения максимальной прибыли нужно выбрать точку (хъ xn) GM, в которой линейная п функция CjXj (цена произведенной продукции) максимальна. j=i Пример 5 (транспортная задача). Имеются поставщики Аь... ...,Ат, располагающие неким продуктом в количестве а1,...,ат соответственно, и потребители В1,...,Вп, которые должны полу- чить этот продукт в количестве b19...,bn соответственно, причем т п bj. Пусть Ху—количество продукта, которое предпола- i=i j=i гается доставить от А, к Bj, и — стоимость доставки единицы продукта от Aj к Bj. Должны выполняться усло- вия S хц = а1> Е *ц = bj, Xij Z 0. j=l i=l Они задают некоторый выпуклый мно- гогранник в гип-мерном пространстве с координатами х^ (i = 1, ...,т, j = = 1,..., и). Задача состоит в минимиза- ции линейной функции ^2 (общей ij стоимости перевозки) на этом много- граннике. Основной метод решения задачи линейного программирования, называемый симплекс-методом, состоит в движении по ребрам мно- гогранника М в направлении возрастания функции f до тех пор, пока это возможно. Движение заканчивается в одной из вершин, в которых достигается максимум функции f (см. рис. 10).
302 Глава 7. Аффинные и проективные пространства § 4. Евклидовы аффинные пространства Объединяя аксиоматику евклидова векторного пространства с аксиоматикой аффинного пространства, мы можем теперь ввести понятие, охватывающее всю элементарную геометрию. Определение 1. Аффинное пространство S, ассоциированное с евклидовым векторным пространством V, называется евклидовым аффинным пространством (или просто евклидовым пространст- вом, если ясно, о чем идет речь). Среди всех аффинных систем координат в евклидовом простран- стве выделяются системы координат, определяемые ортонормиро- ванными реперами. Они называются прямоугольными системами координат. Расстояние р между точками евклидова пространства определя- ется по формуле p(p,q) = lpql- Оно удовлетворяет аксиомам метрического пространства. В частно- сти, неравенство треугольника следует из неравенства (32) § 5.5 для длины суммы векторов. Нахождение расстояния от точки р е S до плоскости Р = р0 + U с помощью векторизации сводится к нахождению расстояния от вектора х = рор е V до подпространства U. А именно, пусть х = у + z, где у G U, z е I/1. Приняв точку р0 за начало отсчета, мы получаем по теореме 5.5.2: р(р,Р) = р(х, U) = |z|. Точка q = р0 + у является «основанием перпендикуляра, опущенно- го из точки р на плоскость Р». Задача 1. Доказать, что расстояние между плоскостями Pi = Pi + + иТ и Р2 = р2 + U2 евклидова пространства может быть найдено по формуле р(Л> Рг) = I°rtu,+(J2 PTPal- Определение 2. Движением евклидова аффинного пространст- ва S называется всякое его аффинное преобразование, дифферен- циал которого является ортогональным оператором. (В частности, отсюда следует, что всякое движение биективно.) Очевидно, что движение сохраняет расстояние между точками и, обратно, всякое аффинное преобразование, сохраняющее рассто- яние между точками, является движением.
§ 4. Евклидовы аффинные пространства 303 Замечание 1. На самом деле можно показать, что всякое биективное преобразование пространства S, сохраняющее расстояние между точками, автоматически является аффинным преобразованием и, следовательно, — движением. Движения евклидова пространства S образуют группу, обозна- чаемую IsomS. Движение называется собственным (или сохраняю- щим ориентацию), если его дифференциал принадлежит SO(V), и несобственным (или меняющим ориентацию) в противном случае. Собственные движения образуют подгруппу индекса 2 в Isom S, обо- значаемую Isom+ S (ср. пример 4.6.18). Пример 1. Важным примером несобственного движения являет- ся (ортогональное) отражение гн относительно гиперплоскости Н, Пусть е — единичный вектор, ортогональный Н. Всякую точку р G S можно единственным образом представить в виде p = q + Ae (qGH). По определению rHp = q —Ле (см. рис. 11). Дифференциал отражения гн есть (ортогональное) от- ражение относительно направляющего подпространства гиперплос- кости Н в пространстве V. Пусть НТ и Н2 — две гиперплоскости. Если они параллельны, то drH} —drH2 и, следовательно, d(rH/H2) = drH1-drH2 = <?.
304 Глава 7. Аффинные и проективные пространства В этом случае rH] гНг — параллельный перенос на удвоенный общий перпендикуляр гиперплоскостей Нг и Н2 (см. рис. 12). Если же Нг и Н2 пересекаются по (и-2)-мерной плоскости Р, то гН}гН2 — пово- рот вокруг Р на удвоенный угол между и Н2, т. е. движение, остав- ляющее на месте все точки плоскости Р и осуществляющее поворот на указанный угол в любой двумерной плоскости, ортогональной Р (ср. пример 6.3.4). Задача 2. Доказать, что группа Isom S порождается отражения- ми относительно гиперплоскостей. Если в пространстве S выбрано начало отсчета, то всякое движе- ние однозначно представляется в виде (13), где ipGO(V). Однако вектор Ь, вообще говоря, зависит от начала отсчета. Следующая теорема даст некое каноническое представление любого движения. Теорема 1. Для всякого движения f существует однозначно опре- деленная плоскость P = pQ + U со следующими свойствами: 1) плоскость Р инвариантна относительно f, причем f\P — па- раллельный перенос на некоторый вектор beU (быть может, нуле- вой); 2) оператор d = df не имеет ненулевых неподвижных векторов в U1. Доказательство. Если искомая плоскость Р существует, то опе- ратор л/ действует на ее направляющем подпространстве U тожде- ственно и, значит, U совпадает с подпространством неподвижных векторов этого оператора. Пусть, далее, q — любая точка. Предста- вим ее в виде q = р + с, где р еР, а се U1. Имеем: f (<?) = f (р) + = p + b + de = q + b + (de - с).
§ 4. Евклидовы аффинные пространства 305 Так как b G U, а л/с - с € [У1, то вектор лУс - с совпадает с ортого- нальной составляющей вектора q/(q) относительно подпространст- ва U. С другой стороны, так как оператор - € невырожден на СУ1, то вектор с однозначно определяется по вектору - с = (аУ — <£)с. Но, зная вектор с, мы можем найти точку р = q — с плоскости Р. Таким образом, если искомая плоскость существует, то она един- ственна. Проведенный анализ также показывает, как построить нужную плоскость. А именно, в качестве ее направляющего подпростран- ства возьмем подпространство U неподвижных векторов операто- ра а?/. Тогда будет выполнено условие 2). Далее, возьмем любую точ- ку q и рассмотрим вектор а = qf (q). Пусть а = b + d, где b G СУ, d G СУ1. Найдем такой вектор с е СУ1, что аУс - с = d. Положим р = q - с и рассмотрим плоскость Р = р 4- U. Проверим, что для нее выполнено условие 1). Имеем: /(р) = /(q) - = q 4- а - а/с = p4-c4-b4-d - аУс = р 4- b G Р и для любого и G U f(p + u) = f(p) 4- jzfu = p + b + u = (p + u) + b, что и требовалось доказать. □ Задача 3. Доказать, что плоскость Р есть совокупность точек, ко- торые при движении f перемещаются на наименьшее расстояние (равное длине вектора Ь). Плоскость Р называется осью движения f. Движение f определя- ется своей осью P = pQ + U, вектором b G U и ортогональным преоб- разованием 9$ = пространства I/1, не имеющим неподвижных векторов. Как следует из описания ортогональных преобразований, для собственных движений размерность dim СУ1 четна, а для несоб- ственных — нечетна. Пользуясь этой теоремой, опишем движения евклидовой пря- мой, плоскости и трехмерного пространства в терминах элементар- ной геометрии. Через Р будем обозначать ось движения /. Пусть f —движение евклидовой прямой. Возможны 2 случая. 1) dim Р = 1. В этом случае f — параллельный перенос. 2) dim Р = 0, т. е. Р — точка. В этом случае 9& = — € и f — отраже- ние (симметрия) относительно точки Р.
306 Глава 7. Аффинные и проективные пространства Пусть f — движение евклидовой плоскости. Возможны 3 случая. 1) dim Р = 2. В этом случае f — параллельный перенос. 2) dim? = 1, т.е. Р — прямая. В этом случае = -<£ и f — отражение относительно прямой Р или скользящее отражение, т. е. композиция отражения относительно Р и параллельного пере- носа вдоль Р. 3) dim Р = 0, т. е. Р — точка. В этом случае f — (нетривиальный) поворот вокруг точки Р. Пусть, наконец, f — движение трехмерного евклидова простран- ства. Возможны 4 случая. 1) dim Р = 3. В этом случае f — параллельный перенос. 2) dim Р = 2. В этом случае f — отражение относительно плоско- сти Р или скользящее отражение, т. е. композиция отражения отно- сительно Р и параллельного переноса на вектор, параллельный Р. 3) dimP = 1. В этом случае f — (нетривиальный) поворот во- круг прямой Р или винтовое движение, т. е. композиция поворота вокруг Р и параллельного переноса вдоль Р. 4) dim Р = 0. В этом случае f — зеркальный поворот, т. е. компо- зиция (нетривиального) поворота вокруг некоторой прямой и от- ражения относительно плоскости, перпендикулярной этой прямой; при этом указанные прямая и плоскость пересекаются в точке Р. Пример 2. Обозначим через sp a поворот в евклидовой плоско- сти на угол а вокруг точки р. Его дифференциал есть, очевидно, поворот на тот же угол в соответствующем векторном простран- стве. Рассмотрим произведение sp asq p поворотов вокруг разных точек. Вычисляя его дифференциал, мы находим, что оно представ- ляет собой поворот на угол а + /3 вокруг некоторой третьей точки, если только этот угол не кратен 2я (и параллельный перенос — в противном случае). Для того чтобы найти центр поворота, можно воспользоваться следующим предложением. Предложение 1. Пусть pqr — треугольник с углами а, /3, у (см. рис. 13). Тогда Sp,2a sq,2fi sr,2у = Доказательство. Обозначим через I, т, п прямые, содержащие стороны qr, гр, pq треугольника, и через rb гт, гп — отражения отно- сительно этих прямых. Тогда (см. пример 6.3.4) $р,2а~гтгп> sq,2fi~rnrb 5r,2y ’~~ откуда перемножением получается доказываемое равенство. □
§ 4. Евклидовы аффинные пространства 307 Задача 4. Пользуясь доказанным предложением, указать способ построения центра поворота sp a sqp из примера 2. Для любой фигуры М евклидова пространства S можно опреде- лить ее группу симметрии SymM = {/GIsomS: /(М) = М}. Таким образом возникают, например, кристаллографические груп- пы как группы симметрии кристаллических структур. Отметим, что если группа Sym М содержит несобственные дви- жения, то группа Sym+ М = {/ G Isom+ S: /(М) = М} является ее подгруппой индекса 2 как ядро гомоморфизма SymM->{±l}, f •-> det df. Если M — ограниченный выпуклый многогранник, то группа Sym М конечна, так как движение, отображающее многогранник М на себя, однозначно определяется тем, как оно переставляет его вершины, а таких перестановок может быть лишь конечное число. Кроме того, группа SymM сохраняет центр тяжести множества вершин многогранника М и потому фактически представляет собой подгруппу ортогональной группы. Наиболее симметричны так называемые правильные многогран- ники. Пусть М — телесный выпуклый многогранник в п-мерном евкли- довом пространстве. Назовем флагом многогранника М набор его граней {F0,Flf ..^F^}, где dimFfc = k и Foс ... cFn_P
308 Глава 7. Аффинные и проективные пространства Определение 3. Выпуклый многогранник М называется пра- вильным, если для любых двух его флагов существует движение /GSym М, переводящее первый из этих флагов во второй. Так как движение f е Sym М, очевидно, определяется тем, куда оно переводит какой-нибудь один флаг, то порядок группы симмет- рии правильного многогранника равен числу его флагов. Двумерные правильные многогранники — это обычные правиль- ные многоугольники. Их группы симметрии были описаны в приме- ре 4.1.11. Трехмерные правильные многогранники — это платоновы тела, т. е. правильный тетраэдр Т, куб К, октаэдр О, додекаэдр D и икоса- эдр I. (См. рис. 6 §4.5.) Куб и октаэдр, а также додекаэдр и икоса- эдр — это так называемые двойственные правильные многогранни- ки, имеющие одинаковые группы симметрии, так как центры гра- ней одного из двойственных многогранников являются вершинами другого. (Тетраэдр двойствен сам себе.) Согласно предыдущему, порядок группы симметрии Sym Р трех- мерного правильного многогранника Р равен числу его флагов, т. е. |Sym Р| = (число вершин) х х (число ребер, выходящих из каждой вершины) х 2. Следовательно, |Sym Т\ = 24, |Sym К\ = |Sym О| = 48, |Sym D\ = |Sym I\ = 120. Группа Sym+ P имеет вдвое меньший порядок. Она состоит из поворотов вокруг прямых, проходящих через центр многогранни- ка Р и через его граничную точку, которая является либо вершиной, либо серединой ребра, либо центром грани. Задача 5. Перечислить все элементы группы симметрии куба. В рамках группового подхода аналогично евклидовой геометрии столь же просто определяется псевдоевклидова геометрия. Вещественное векторное пространство, в котором фиксирована симметрическая билинейная функция а сигнатуры (k, I), где k, I > 0, к + I = п = dim V, называется псевдоевклидовым векторным прост- ранством сигнатуры (к, /)• Группа линейных преобразований прост- ранства V, сохраняющих функцию а, называется псевдоортогональ- ной группой и обозначается О(У, а). Соответствующая ей группа матриц в базисе, в котором а имеет нормальный вид, обозначает- ся okil.
§ 5. Квадрики 309 Аффинное пространство S, ассоциированное с псевдоевклидо- вым векторным пространством V, называется псевдоевклидовым аффинным пространством соответствующей сигнатуры, а группа Isom S = d"1(O(V, а)) — группой его движений. Геометрия, опреде- ляемая этой группой, и есть псевдоевклидова геометрия. Пространство-время специальной теории относительности — это псевдоевклидово аффинное пространство сигнатуры (3,1). Оно называется пространством Минковского, а группа его движений — группой Пуанкаре. (Соответствующая группа псевдоортогональных преобразований называется группой Лоренца.) Задача 6. Описать группу О1Р (Указание: использовать систему координат, в которой соответствующая квадратичная функция име- ет вид q(x)=xTx2.) Задача 7. Сформулировать и доказать «третий признак равен- ства треугольников» на псевдоевклидовой плоскости. § 5. Квадрики Простейшими объектами аффинной и евклидовой геометрий яв- ляются плоскости, которые, как мы знаем, задаются системами ли- нейных уравнений. Естественным обобщением плоскостей (назы- ваемых также линейными многообразиями) являются так называе- мые алгебраические многообразия — подмножества аффинного про- странства, задаваемые произвольными системами алгебраических уравнений. Их изучением занимается алгебраическая геометрия. Это обширный раздел математики, который не может быть пред- ставлен в настоящем курсе. Мы лишь слегка коснемся некоторых об- щих вопросов алгебраической геометрии в гл. 9, а в этом параграфе рассмотрим простейший после плоскостей тип алгебраических мно- гообразий — квадрики, задаваемые одним алгебраическим уравне- нием второй степени. К их числу относятся такие объекты элемен- тарной геометрии, как окружности и сферы. Будем считать, что char К / 2. Определение 1. Аффинно-квадратичной функцией на аффин- ном пространстве S называется всякая функция Q: S —> К, имеющая в векторизованной форме вид Q(x)=q(x)+!(x)+c, (17)
310 Глава 7. Аффинные и проективные пространства где q — квадратичная функция, I — линейная функция, ас — кон- станта. Пусть q— поляризация квадратичной функции q, т. е. соответ- ствующая ей симметрическая билинейная функция. Лемма 1. При переносе начала отсчета о в точку о' = о + а (a G V) слагаемые выражения (17) преобразуются следующим обра- зом: q'M=q (х), V (х) = 2q (а, х) +1 (х), с! = q (а) +1 (а) + с. (18) Доказательство. Имеем Q(o' + x) = Q(o + a + x) = q(a + x) + !(a + x) + с = = q(a) + 2q(a, х)+q(x)+Z(a)+ I(x)+ с = = q (x) + (2q (a, x) +1 (x)) + (q (a) 4-1 (a) 4- c). □ В частности, квадратичная функция q не зависит от выбора на- чала отсчета. В координатах выражение (17) принимает вид Q(x) = Sao^+Ebixi + c (ау = ар). i>j i Коэффициентам bt и с можно придать следующий смысл: c = Q(o), b, = §(o). (20) Линейная функция !(x) = Sbi*i i называется дифференциалом функции Q в точке о и обозначается d0Q. В случае К = R это согласуется с обычным определением диф- ференциала. Определение 2. Точка о называется центром аффинно-квадра- тичной функции Q, если Q(o4-x) = Q(o-x) VxgV. (21) Ясно, что это имеет место тогда и только тогда, когда d0Q = 0. Поэтому множество всех центров функции Q задается системой ли- нейных уравнений
§ 5. Квадрики 311 Оно либо является плоскостью некоторого числа измерений, либо пусто. Легко видеть, что матрица коэффициентов системы (22) — это удвоенная матрица (а^) квадратичной функции q. Следователь- но, если q невырожденна, то Q имеет единственный центр. Положим X(Q) = {peS:Q(p) = 0}. Определение 3. Множество вида X(Q), где Q — аффинно-квад- ратичная функция, если только оно не пусто и не является плоско- стью, называется квадрикой или гиперповерхностью второго поряд- ка. Квадрика на плоскости называется коникой или кривой второго порядка. Квадрика в трехмерном пространстве называется также поверхностью второго порядка. Определение 4. Точка о называется центром квадрики, если эта квадрика симметрична относительно о, т.е. вместе со всякой точкой о + х (х G V) содержит точку о - х. Центр квадрики, лежащий на ней самой, называется ее вершиной. Квадрика называется центральной, если она имеет (хотя бы один) центр. Очевидно, что всякий центр аффинно-квадратичной функции Q является центром квадрики X(Q). Как будет показано ниже, верно и обратное. Докажем некоторые простые геометрические свойства квадрик. Предложение 1. Любая прямая либо целиком лежит на квадри- ке, либо пересекается с ней не более чем в двух точках. Доказательство. Так как начало отсчета о может быть выбра- но в любой точке, то без ограничения общности можно считать, что прямая проходит через о. Пусть функция Q в векторизован- ной форме имеет вид (17). Тогда пересечение прямой L = о + (х) = = {о + tx: t G К} (х G V) с квадрикой X(Q) определяется условием Q (tx) = t2q (х) + tl (х) + с = 0, (23) представляющим собой квадратное уравнение относительно t. Если все коэффициенты этого уравнения равны нулю, то L с X(Q); в про- тивном случае оно имеет не более двух корней, а это означает, что пересечение L А X (Q) содержит не более двух точек. □ Предложение 2. Если о — вершина квадрики X, то вместе с лю- бой точкой р^о квадрика X содержит всю прямую ор.
312 Глава 7. АффиннМе и проективные пространства Доказательство. Пусть р = о + х (х е V); тогда X содержит три различные точки о, о + х, о - х прямой ор и, следовательно, — всю прямую. □ Всякое подмножество аффинного пространства, содержащее точ- ку о и вместе с любой точкой р^о всю прямую ор, называется ко- нусом с вершиной в точке о. Квадрика называется конической, если она имеет (хотя бы одну) вершину. Предложение 3. Всякая квадрика содержит точку, не являющу- юся ее вершиной. Доказательство. Если бы все точки квадрики были ее верши- нами, то в силу предложения 2 вместе с любыми двумя точками она содержала бы проходящую через них прямую и, согласно тео- реме 1.3, была бы плоскостью, а это противоречит определению квадрики. □ Очевидно, что пропорциональные аффинно-квадратичные функ- ции определяют одну и ту же квадрику. Обратное утверждение не столь очевидно; оно составляет содержание следующей теоремы. Теорема 1. Пусть X — квадрика в аффинном пространстве над бесконечным полем К. Если X = X(Q1) = X(Q2) для каких-то аффин- но-квадратичных функций Q1? Q2, то эти функции пропорциональ- ны. Доказательство. Возьмем в качестве начала отсчета какую-ни- будь точку о квадрики X, не являющуюся ее вершиной. Тогда в век- торизованной форме Qi (х) = qi(x) + ^(х), Q2(x) = q2 (х) +12 (х), где 11г 12 / 0. Точки пересечения прямой {о + tx: t е К} с квадри- кой X определяются любым из уравнений t2qi (х) + г/г(х) = 0, t2q2(x) + Н2(х) = 0. Так как эти уравнения должны иметь одинаковые решения (относи- тельно г), то при 1г (х), 12(х) # 0 мы получаем 41 (х) _ Q2M li(x) 12(х)’ откуда q i (х) l2 (х) = q2(x) Ц (х). (24) Применяя следствие теоремы 3.7.1, получаем, что это равенство вер- но при всех х.
§ 5. Квадрики 313 Предположим, что линейные функции и 12 не пропорциональ- ны. Тогда в подходящем базисе (х) = хь 12М = х2 и равенство (24) записывается в виде q1(x)x2 = q2(x)x1. Рассматривая члены в левой и правой частях этого равенства, мы видим, что должно быть q2 (х) = I (х)хъ q2(x) = I (х)х2, где Z (х) — какая-то линейная функция, и, значит, Qi(x) = (/(х) + 1)хь Q2(x) = (Z (х) + 1)х2. Так как X = X(Qi), то X содержит гиперплоскость Xj = 0. Так как в то же время X = X(Q2), то функция Q2 должна тождественно обращать- ся в нуль на этой гиперплоскости. Однако ни один из ее множителей Z(x) +1 и х2 не обращается на ней тождественно в нуль (первый из них не обращается в нуль уже в точке о). Поскольку в алгебре многочленов нет делителей нуля, мы тем самым приходим к проти- воречию. Итак, 12 = Л/1 (ЛеХ*). Из (24) получаем тогда, что и q2 = Лд2, и, значит, Q2 = AQp □ Следствие 1. Всякий центр квадрики X(Q) является также цен- тром функции Q. Доказательство. Если о — центр квадрики X (Q), то X (Q)=X (Q), где Q(o + x) = Q(o-x). Следовательно, Q = AQ (ЛеХ*). Сравнивая члены второй степени в выражениях Q и Q, мы видим, что должно быть Л = 1, т. е. Q = Q, а это и означает, что о — центр функции Q. □ Следствие 2. Если квадрика X(Q) инвариантна относительно некоторого параллельного переноса, то и функция Q инвариантна относительно этого переноса. Доказательство. Если квадрика X(Q) переходит в себя при па- раллельном переносе на вектор а, то X(Q) = X(Q), где Q(p) = Q(p + a). Далее рассуждаем так же, как в доказательстве следствия 1. □
314 Глава 7. Аффинные и проективные пространства Замечание 1. Анализ приведенного выше доказательства теоремы 1 с учетом замечания 3.7.2 показывает, что она верна и для конечных полей, исключая только поле Z3. (Напомним, что мы считаем, что char К /2.) Над полем Z3 можно привести следующий контрпример: уравнения + 1 = 0их2 + *1х2 + 1 = 0 задают одну и ту же конику в Z^, состоящую из точек (1,1)и(—1,-1). Однако оба следствия теоремы верны и для поля Z3. Пусть аффинно-квадратичная функция Q представлена в векто- ризованной форме выражением (17). Положим KerQ = KerqnKer! (25) (где Kerq = Kerq). Предложение 4. Функция Q инвариантна относительно па- раллельного переноса на вектор а тогда и только тогда, когда a G Ker Q. В частности, отсюда следует, что Ker q П Ker I не зависит от выбо- ра начала отсчета. Доказательство. Инвариантность функции Q относительно па- раллельного переноса на вектор а равносильна тому, что она со- храняет свой вид при переносе начала отсчета из точки о в точку о' = о + а. Ввиду леммы 1 это происходит тогда и только тогда, когда aeKerQ. □ Таким образом, если U = Ker Q / 0, то квадрика X = X (Q) вместе с каждой точкой р содержит целую плоскость р + U. Такая квадрика называется цилиндрической с направляющим подпространством U. Выберем базис пространства V таким образом, чтобы последние d его векторов составляли базис подпространства U. Тогда выраже- ние Q не будет содержать последних d координат. Пусть So с S — любая плоскость, направляющее подпространство которой натяну- то на первые п - d базисных векторов, и Хо — квадрика, задава- емая в So уравнением Q = 0 (т. е. Хо = X П So). Тогда X = Хо + U (см. рис. 14). Квадрика, не являющаяся цилиндрической, называется невырож- денной. Ввиду сказанного выше описание всех квадрик сводится к описанию невырожденных квадрик. Предложение 5. Невырожденная квадрика имеет не более одно- го центра. Доказательство. Пусть о и о' — два центра квадрики X. Обо- значим через s и s' центральные симметрии относительно оно' соответственно. Тогда sX = s'X = Х и, следовательно, ss'X = X. Так
§ 5. Квадрики 315 Рис. 14 как d(ss/) = ds-ds/=(-<?)2 = <§’) то $$' — (нетривиальный) параллельный перенос и, значит, квадри- ка X цилиндрическая. □ Нецилиндрические квадрики можно разбить на три типа. I. Неконические центральные квадрики. Выбрав начало отсчета в центре квадрики и умножив ее уравнение на подходящее число, мы приведем его к виду q(x1} ...,хп) = 1, (26) где q — невырожденная квадратичная функция. II. Конические квадрики. Выбрав начало отсчета в вершине квадрики, мы приведем ее уравнение к виду q(x1,...,xn) = 0, (27) где q — невырожденная квадратичная функция. При этом у нас еще остается возможность умножить уравнение на любое число Л 0. III. Нецентральные квадрики. Так как Kerq Г) Кег/= 0, но Ker q И 0 (иначе квадрика была бы центральной), то dim Ker q = 1 и V = Кег /ф Kerq. (28) Выбрав начало отсчета на квадрике и базис пространства V, согла- сованный с разложением (28), мы приведем уравнение квадрики
316 Глава 7. Аффинные и проективные пространства к виду u(xb ...,хп_1)=хп, (29) где и = q 1кег z — невырожденная квадратичная функция от п - 1 пе- ременных. При этом остается возможность умножить уравнение на любое число Л 0 0, одновременно разделив на Л последний базис- ный вектор. Возможности дальнейшего упрощения уравнения квадрики за счет выбора подходящего базиса в пространстве V зависят от поля К (см. §5.4). При К = С или R мы можем привести квадратичную функцию q к нормальному виду. Рассмотрим более подробно случай К = R. В этом случае урав- нение невырожденной квадрики может быть приведено к одному и только одному из следующих видов: I. Неконические центральные квадрики: х* + ... + х£-х£+1-...-х2 = 1 (0<к$п). (30) II. Конические квадрики: x2 + ... + x2-x2+1-...-x2 = 0 (|ck<n). (31) (Неравенство к достигается за счет возможного умножения уравнения на -1.) III. Нецентральные квадрики: х2 + ... + х2-х2+1-...-х2_1 = хп (^sSk<n). (32) Полученный результат можно интерпретировать как классифи- кацию вещественных квадрик с точностью до аффинных преобра- зований. В самом деле, если квадрики Х} и Х2 задаются одним и тем же уравнением в аффинных системах координат, связанных с реперами {о;еъ ...,еп} и {о';вр ...,е^} соответственно, то Хг пе- реводится в Х2 аффинным преобразованием, переводящим репер {о;еъ ...,еп} в репер {o';e'p ...,е'п}. Обратно, если квадрика Xi пе- реводится в квадрику Х2 аффинным преобразованием /, то Хг и Х2 задаются одним и тем же уравнением в аффинных системах коор- динат, связанных с реперами {о; еь..., еп} и {/(о); dftej,..., d/(en)} соответственно.
§ 5. Квадрики 317 Пара пересекающихся прямых Рис. 15 В частности, при и = 2 и 3 получаются хорошо известные классы вещественных кривых и поверхностей второго порядка, перечислен- ные в табл. 1 и представленные на рис. 15 и 16 соответственно. Таблица 1 п Тип к Название 2 I 2 эллипс 1 гипербола II 1 пара пересекающихся прямых III 1 парабола 3 I 3 эллипсоид 2 однополостный гиперболоид 1 двуполостный гиперболоид II 2 квадратичный конус III 2 эллиптический параболоид 1 гиперболический параболоид
318 Глава 7. Аффинные и проективные пространства Однополостный гиперболоид Конус Гиперболический параболоид Двуполостный гиперболоид Рис. 16
§ 5. Квадрики 319 В произвольной размерности квадрики типа I при к = п назы- ваются эллипсоидами, а при к < п — гиперболоидами; квадрики типа II называются квадратичными конусами; квадрики типа III при k = п — 1 называются эллиптическими параболоидами, а при k < п — 1 — гиперболическими параболоидами. Вещественная квадрика X является гладкой гиперповерхностью (см. определение в § 12.1) в окрестности точки р G X тогда и толь- ко тогда, когда dpQ/O, т.е. когда р не является вершиной; при этом уравнение dpQ(x — р) = 0 задает касательную гиперплоскость квадрики X в точке р. В частности, неконические квадрики гладки всюду. Замечательным свойством вещественных (и комплексных) квад- рик, которым, вообще говоря, не обладают гиперповерхности боль- ших порядков, является высокая степень их аффинной симметрии. Пусть X — вещественная квадрика. Обозначим через G(X) груп- пу всех аффинных преобразований, отображающих X на себя. Теорема 2. Если X — неконическая квадрика, то группа G(X) транзитивно действует на X; если X — коническая квадрика, то группа G(X) транзитивно действует на дополнении к множеству вершин в X. Доказательство. Если X — цилиндрическая квадрика с направ- ляющим подпространством U, то группа G(X) содержит группу параллельных переносов на векторы из U, которая транзитивно действует на любой плоскости вида р + U. Поэтому доказательство теоремы в этом случае сводится к ее доказательству для невырож- денной квадрики Хо в пространстве меньшей размерности (см. обо- значение выше). Пусть X — эллипсоид, задаваемый в векторизованной форме уравнением q(x) = 1, где q — положительно определенная квадра- тичная функция. Превратим пространство V в евклидово, приняв за скалярное умножение поляризацию квадратичной функции q. Тогда X будет единичной сферой в этом пространстве, а группа G(X) будет, во всяком случае, содержать ортогональную группу O(V). (На самом деле она будет с ней совпадать, но нам это не нужно.) Пусть х, х' —любые векторы из X; тогда V = {х} Ф (х)1 = {х') Ф (х')1. Рассмотрим линейное преобразование е GL(V), переводящее х в х' и отображающее подпространство (х)1 на (х')1 таким образом,
320 Глава 7. Аффинные и проективные пространства чтобы это был изоморфизм евклидовых пространств. Очевидно, что (/? gO(V), и по построению ip(x)=x'. Случай, когда X — гиперболоид, разбирается аналогично, с той разницей, что, взяв за скалярное умножение поляризацию квадра- тичной функции q, мы превратим V не в евклидово, а в псевдо- евклидово пространство некоторой сигнатуры (k, I) (где к +1 = и). Подпространства (х)1 и (х')1 в этом случае будут псевдоевклидо- выми пространствами сигнатуры (к — 1,1) и, следовательно, будут изоморфны. Пусть теперь X — квадратичный конус, задаваемый в вектори- зованной форме уравнением q(x) = 0, где q — квадратичная функ- ция сигнатуры (kJ) (где к + 1 = п). Превратим, как и выше, про- странство V в псевдоевклидово. Для любого ненулевого вектора х G X существует такой вектор у G V, что (х, у) 0 0. Нормировав вектор у, можно считать, что (х, у) = 1. Далее, не нарушая этого равенства, можно заменить у на у - (у, у)х и тем самым добиться, чтобы (у, у) = 0. Тогда в двумерном подпространстве (х, у) скаляр- ное умножение будет иметь матрицу К 0 I и, значит, будет невы- рожденным сигнатуры (1,1). Отсюда следует, что V = (^,У>Ф(х,у)1, где (х, у)1— псевдоевклидово (или евклидово) пространство сиг- натуры (k — 1J — 1). Проделав такие же построения для другого ненулевого вектора х' G X, мы получим аналогичное разложение У = (х', у')Ф(х', у')1. Рассмотрим линейное преобразование G GL(V), переводящее х в х', у в у1 и отображающее подпространство (х, у)1 на (х', у')1 таким образом, чтобы это был изоморфизм псевдоевклидовых про- странств. Тогда G O(V, q) С G(X), и по построению </?(х) =х'. Пусть, наконец, X — параболоид, задаваемый в векторизован- ной форме уравнением (29). Всякий вектор xg V будем представ- лять в виде х = у + te, где у G Ker Z, t G R, а е — базисный вектор под- пространства Ker q, так что х G X тогда и только тогда, когда и (у) = Г. Для любого a G Ker I рассмотрим аффинное преобразование fa- y + te^y + a + (t + 2u(a,y) + u(a))e.
§ 5. Квадрики 321 Если u(y) = Г, то и (у + а) = t + 2п(а, у) 4- и(а), и обратно. Это означает, что fa gG(X). Очевидно, что преобразо- вания fa (aGKer?) образуют группу, транзитивно действующую на X. □ Задача 1. Доказать, что если X — параболоид, задаваемый урав- нением (29), то группа G(X) транзитивно действует в области u(Xj, Хп_j) < хп. С каждым параболоидом X = X(Q) каноническим образом связа- но одномерное подпространство Ker q С V, называемое особым, на- правлением параболоида X, Так как Ker q Ker I при любом выборе начала отсчета, то при х е Ker q уравнение (23) имеет ровно одно решение. Следовательно, любая прямая особого направления пере- секает параболоид ровно в одной точке; бо- лее того, это пересечение по той же при- чине трансверсально (см. рис. 17). Задача 2. Доказать, что для любого неособого направления параболоида X су- ществует прямая этого направления, кото- рая не пересекает X. Посмотрим теперь, к какому виду мож- но привести уравнение квадрики в ев- клидовом пространстве, если ог- раничиться прямоугольными системами ко- ординат. Как и в аффинной геометрии, задача сводится к случаю невырожденных квадрик. Рассмотрим, как и выше, три типа таких квадрик. I. Неконические центральные квадрики. Из теоремы о приведении квадратичной функции к главным осям (следствие 2 теоремы 6.3.1) следует, что уравнение такой квадрики в прямоуголь- ной системе координат может быть приведено к виду ^ + ... + ^ = 1 (Ai,...,An/0). (33) Числа Аь ...,АП определены однозначно с точностью до переста- новки. II. Конические квадрики. Уравнение такой квадрики в пря- моугольной системе координат может быть приведено к виду A^J+ ... + Апх„=О (Аг,...,Ап/О). (34)
322 Глава 7. Аффинные и проективные пространства Числа А1?..., Ап определены однозначно с точностью до перестанов- ки и одновременного умножения на число А / 0. III. Нецентральные квадрики (параболоиды). Выбрав на- чало отсчета произвольно и приведя квадратичную функцию q к главным осям, мы получим прямоугольную систему координат, в которой уравнение параболоида будет иметь вид A1x* + ... + An_1x2_1+b1x1 + ... + bn_iXn_i + bnxn + c = 0 (Aj, An_j, bn / 0). За счет переноса начала отсчета по координатам х1?..., хп_х можно убрать линейные члены, содержащие эти координаты. (При этом, вообще говоря, изменится свободный член.) После этого за счет переноса начала отсчета по координате хп можно убрать свободный член. Наконец, умножив уравнение на подходящее число, можно привести его к виду AjX^ +... + An_jX^_j = хп (Aj,An_j/O). (35) Покажем, что начало отсчета, при котором уравнение парабо- лоида приводится к виду (35), определено однозначно. Для этого охарактеризуем его в инвариантных терминах. Пусть {о; е1г..., еп} — репер, в котором уравнение параболоида имеет вид (35). Тогда особое направление этого параболоида есть (еп), а его касательная гиперплоскость в точке о задается уравне- нием хп = 0. Следовательно, если базис {е1э..., еп} ортонормирован- ный, то касательная гиперплоскость параболоида в точке о орто- гональна особому направлению. Такая точка называется вершиной параболоида (хотя это и не согласуется с определением 4), а прохо- дящая через нее прямая особого направления — осью параболоида. Подчеркнем, что эти определения имеют смысл лишь применитель- но к параболоидам в евклидовом пространстве. Предложение 6. Всякий параболоид в евклидовом пространстве имеет единственную вершину. (См. рис. 17, где вершиной изображенной там параболы является точка о.) Доказательство. Пусть р — точка параболоида с координатами х1?..., хп. Дифференцируя уравнение (35), находим, что координаты нормального вектора параболоида в точке р суть 2А1х1,..., 2An_1xn_1, —1.
§ 6. Проективные пространства 323 Для того чтобы точка р была вершиной параболоида, необходимо и достаточно, чтобы этот вектор был пропорционален еп, а это име- ет место тогда и только тогда, когда =... = хп-1 = 0, т. е. р = о. □ Следствие. Коэффициенты в уравнении (35) опреде- лены однозначно с точностью до перестановки и одновременного умножения на -1. Доказательство. Как мы показали, начало отсчета, при котором уравнение параболоида приводится к виду (35), определено одно- значно. Вектор еп как единичный вектор особого направления опре- делен однозначно с точностью до умножения на -1, приводящего к умножению на —1 левой части уравнения (35). Если вектор еп фик- сирован, то мы уже не можем умножить уравнение на число Л 01, не изменив его правой части; но тогда числа Л1?..., An_j определе- ны однозначно с точностью до перестановки как собственные значе- ния симметрического оператора, соответствующего квадратичной функции q. □ Аналогично тому, как это было сделано выше применительно к аффинной классификации квадрик, полученные результаты мож- но интерпретировать как классификацию квадрик в евклидовом пространстве с точностью до движений. § 6. Проективные пространства На фотографическом снимке или (реалистическом) рисунке плоской местности изображения параллельных прямых, вообще го- воря, пересекаются, а изображения равных отрезков одной прямой, вообще говоря, не равны (см. рис. 18 на следующей странице). Это говорит о том, что отображение местности на плоскость снимка или рисунка не является аффинным. То же самое можно сказать и об изображении на сетчатке нашего глаза. Во всех этих случаях мы имеем дело с центральным проектированием. Еще одним житейским примером центрального проектирования может служить световое пятно на полу от лампы с круглым абажу- ром. Когда абажур направлен вертикально вниз, то граница этого пятна имеет форму окружности, как и край самого абажура. Но когда мы начинаем поворачивать абажур вокруг горизонтальной оси, эта окружность превращается в эллипс, который, вытягиваясь все больше и больше, в какой-то момент, когда его дальний край
324 Глава 7. Аффинные и проективные пространства Рис. 18. Гравюра Летнего сада А. Зубова. (Воспроизводится по книге: Вергунов А. П., Горохов В. А. Русские сады и парки. М.: Наука, 1988.) уходит в бесконечность, превращается в параболу. Когда мы продол- жаем поворачивать абажур, парабола «раскрывается», превращаясь в ветвь гиперболы, и если бы мы приставили точно такой же абажур с противоположной стороны лампы, мы увидели бы другую ветвь этой гиперболы. Таким образом, край абажура проектируется на пол то в виде эллипса, то в виде параболы, то в виде гиперболы. Отметим еще одно обстоятельство. На рисунке плоской местно- сти изображения параллельных прямых пересекаются в точке, ко- торая не имеет прообраза на местности (иначе прямые не были бы параллельны). С другой стороны, в тот момент, когда граница светового пятна от лампы с абажуром превращается в параболу, изображение самой высокой точки края абажура исчезает, уходя в бесконечность. Таким образом, мало того, что центральное проек- тирование не является аффинным отображением, оно вдобавок не сюръективно и не всюду определено.
§ 6. Проективные пространства 325 Для изучения центрального проектирования удобно рассмот- реть множество, называемое проективной плоскостью, «точками» которого являются прямые, проходящие через центр проектиро- вания, а пересечения этих прямых с плоскостью проектирования считать изображениями соответствующих «точек». При этом «точ- ки», соответствующие прямым, параллельным выбранной плоско- сти проектирования, не получают никакого изображения. (Но они будут иметь изображение при другом выборе плоскости проекти- рования). Они называются «бесконечно удаленными точками» по отношению к данной плоскости проектирования. Далее, множество «точек», соответствующих прямым, лежащим в какой-либо плоскости, проходящей через центр проектирования, естественно называть «прямой» проективной плоскости. На плоско- сти проектирования такая «прямая», за вычетом ее «бесконечно уда- ленной точки», изображается в виде обычной прямой. Единствен- ным исключением является «прямая», соответствующая плоскости, параллельной плоскости проектирования. Она целиком состоит из «бесконечно удаленных точек» и не получает никакого изображе- ния. Эта «прямая» называется «бесконечно удаленной прямой» по отношению к данной плоскости проектирования. Описанную конструкцию можно интерпретировать как добавле- ние к аффинной плоскости «бесконечно удаленных точек», составля- ющих «бесконечно удаленную прямую». При этом к каждой прямой из пучка параллельных прямых аффинной плоскости добавляется одна и та же «бесконечно удаленная точка». В построенной таким образом «плоскости» любые две прямые пересекаются. Важно, однако, отметить, что все «точки» и «прямые» проектив- ной плоскости равноправны. Понятие бесконечной удаленности от- носительно: оно зависит от выбора плоскости проектирования. Обобщая эти идеи на произвольную размерность и произволь- ное поле, мы приходим к следующим определениям. Определение 1. Множество одномерных подпространств (п+За- мерного векторного пространства V над полем К называется п-мер- ным проективным пространством над К и обозначается PV. Для всякого (к 4- 1)-мерного подпространства U с V подмножество PU с CPV называется к-мерной плоскостью пространства PV. В частности, нульмерные плоскости — это точки пространст- ва PV; одномерные плоскости называются прямыми, (п - 1)-мер- ные — гиперплоскостями.
326 Глава 7. Аффинные и проективные пространства Очевидно, что пересечение плоскостей, если только оно не пусто, также является плоскостью. Пространство РКп+1, построенное указанным образом по про- странству строк Кп+1, обозначается также КР\ Для всякого ненулевого вектора х € V мы будем обозначать че- рез х одномерное подпространство (х), рассматриваемое как точка пространства PV. Пусть S — какая-либо гиперплоскость пространства V, не прохо- дящая через нуль, и Vs — ее направляющее подпространство. Опре- делим отображение (^s:PV\PVs-S, ставящее в соответствие каждой точке х G PV \ PVS (х G V \ Vs) точку пересечения прямой {х) с S (см. рис. 19). Определение 2. Гиперплоскость {х). S вместе с отображением ips назы- у____________/ вается аффинной картой пространст- Vs (*) z^^Z^ ва РV. Точки гиперплоскости PVS про- ________/ s' странства PV называются бесконечно удаленными по отношению к аффин- zz~7 -—у ной карте S. >z z>q ^z Замечание 1. Термин «аффинная —7Z—___________/ карта» вполне согласуется с обычным рис употреблением слова «карта». Точ- но так же как географическая карта представляет собой отображение части земной поверхности на лист бумаги, аффинная карта представляет собой отображение части проективного пространства на аффинное пространство. Замечание 2. Отождествляя точки проективного пространства с их изображениями на аффинной карте, мы иногда будем говорить об аффинной карте как о части проективного пространства. Имея это в виду, можно сказать, что проективное пространство получает- ся из аффинного пространства добавлением бесконечно удаленных точек. Каждая k-мерная плоскость пространства PV, не лежащая цели- ком в PVS, за вычетом ее бесконечно удаленных точек изображается k-мерной плоскостью на аффинной карте S, Плоскости, целиком лежащие в PVS, называются бесконечно удаленными по отношению к S.
§ 6. Проективные пространства 327 Однородными координатами точки х G PV называются коорди- наты вектора х в каком-либо выбранном базисе пространства V. Однородные координаты точки определены лишь с точностью до одновременного умножения на число Л / 0. Этим они отличаются от координат в привычном смысле слова. Кроме того, они не могут быть равны нулю одновременно. Точка с однородными координата- ми х0, хь ..., хп обозначается (х0: Xj:...: хп). Неоднородными координатами точки пространства PV называ- ются аффинные координаты ее изображения на какой-либо аффин- ной карте. В отличие от однородных координат, неоднородные ко- ординаты точки определены однозначно, но они могут быть вообще не определены, а именно, они не определены для точек, бесконечно удаленных по отношению к выбранной аффинной карте. Установим связь между однородными и неоднородными коорди- натами. Пусть {е0, е1?..., еп} — базис пространства V. Рассмотрим аффинную карту Sq = е0“Ь (^1, •••> (36) s' еоРо (см. рис. 20). Изображением точки --------4---- х = (х0 : Xj : ... : хп) на So служит ______________ точка s' /_____>е2 ~7 X X X °^^е1 / + 1 Л I 1 *А’П _ *------ / —ег +... + — еп> ----------/ Ло х0 , , „ Рис. 20 аффинные координаты которой от- носительно репера {е0; е1?..., еп} суть Таким образом, при указанном выборе аффинной *0 *0 карты и репера неоднородными координатами точки (х0: хг:...: хп) служат отношения Точки с х0 = 0 являются бесконечно Х0 хо удаленными по отношению к So. Аналогично, неоднородными координатами точки х на аффин- ной карте S{ = е( + (е0, ег,.... е^, ei+1,.... еп) (37) Хо X] Х.-1 Х.+1 Хп Л служат отношения —, —,...,---,----,..., —. Точки сх, = 0 являют- J Xi Xi Xi X, Xj ся бесконечно удаленными по отношению к St . Отметим, что карты So, Slf..., Sn составляют «атлас» в том смыс- ле, что они покрывают все пространство PV,
328 Глава 7. Аффинные и проективные пространства Задача 1. Доказать, что не существует атласа пространства PV из меньшего числа карт. Задача 2. Пусть уь ...,уп — неоднородные координаты изобра- жения точки х е PV на карте So. Найти ее неоднородные координаты на карте Теорема 1. Через любые к -I-1 точек проективного пространст- ва проходит плоскость размерности $ к, причем если эти точки не содержатся в плоскости размерности < к, то через них проходит единственная плоскость размерности к. Доказательство. Перевод утверждения теоремы на язык вектор- ных пространств есть следующее очевидное утверждение: любые к 4-1 векторов содержатся в подпространстве размерности к 4-1, и если они не содержатся в подпространстве размерности < к 4-1, то они содержатся в единственном подпространстве размерности к + 1. □ Теорема 2. Пусть Щ и П2 — плоскости п-мерного проективного пространства. Если dimЩ + dimП2п, то П1ПП2^0, причем dim(nj П П2) dim Щ + dim П2 - и. (38) Например, любые две прямые проективной плоскости пересека- ются. Доказательство. Если Щ =PUlf П2 = Р[/2, то dim Uj + dimU2 = dimЩ + dimП2 + 2^п + 2>dimV. Следовательно, иг П U2 # 0 и, значит, Пх ПП2 = Р(1/1 П1/2) / 0. Более точно, dim(1^ П U2) dim Щ + dim U2 - dim V, откуда следует (38). □ Всякий невырожденный линейный оператор зУ е GL(V) перево- дит одномерные подпространства в одномерные подпространства и тем самым определяет некоторое биективное преобразование зУ пространства PV. Определение 3. Преобразования вида зУ, где зУ gGL(V), назы- ваются проективными преобразованиями пространства PV. Очевидно, что проективное преобразование переводит любую плоскость пространства PV в плоскость той же размерности. Отображение з/ —> з/ является гомоморфизмом группы GL(V) в группу преобразований пространства PV. Его образ есть группа
§ 6. Проективные пространства 329 всех проективных преобразований пространства PV, называемая также полной проективной группой пространства PV и обозначае- мая через PGL(V). Лемма 1. Ядро гомоморфизма d —> аУ есть группа скалярных операторов (ЛеК*). Доказательство. Если оператор j/ переводит каждое одномер- ное подпространство в себя, то все ненулевые векторы являются его собственными векторами. Но очевидно, что сумма собственных векторов с различными собственными значениями не может быть собственным вектором. Следовательно, все собственные значения оператора аУ одинаковы, а это и означает, что он скалярен. □ Таким образом, PGL(V)^GL(V)/{A£: Ле К*}. Посмотрим, как представляется проективное преобразование jzf на аффинной карте S. Оператор аУ осуществляет аффинное отображе- ние гиперплоскости S на гиперплоскость a/S. Изображение точки аУх = аУ х (х е S) на карте S есть центральная проекция (с центром в нуле) точки аУхе a/S на S (см. рис. 21). Таким образом, можно Рис. 21 сказать, что, с точки зрения аффинной карты, проективное преобра- зование есть композиция аффинного отображения и центрального проектирования. В координатах это выглядит следующим образом. Пусть матрица оператора а/ в базисе {е0, ..., еп} имеет вид А = {a^j=Q. Рассмот-
330 Глава 7. Аффинные и проективные пространства рим неоднородные координаты в пространстве PV, определяемые репером {е0; еп} аффинной карты So (см. (36)). Пусть х = е0 + х1е1 + ... + хпеп, так что точка х G PV имеет неоднородные координаты Xj,..., хп. Обо- значим через ..., уп неоднородные координаты ее образа. Тогда &i0 + S ^ij^j у, =----------- G = I,.... И). (39) ^00 + aOjXj 7=1 Например, проективные преобразования прямой суть дробно- линейные преобразования У = (ad-bc0O). (40) (При с 0 0 точка —d/с переходит в бесконечно удаленную точку, а бесконечно удаленная точка переходит в точку а/с.) Если л/S = S, то преобразование d представляется на карте S как аффинное преобразование. Следующая лемма показывает, что всякое аффинное преобразование пространства S получается таким образом. Лемма 2. Всякое аффинное преобразование гиперплоскости S с V, не проходящей через нуль, единственным образом продолжается до линейного преобразования пространства V. Доказательство. Репер {е0; еь ..., еп} гиперплоскости S есть в то же время базис пространства V (см. рис. 20). Продолжением аффин- ного преобразования f гиперплоскости S является линейное преоб- разование пространства V, переводящее базис {е0, еь..., еп} в базис {f(e0),df(e1),...,d/(en)}. □ Рассматривая аффинное пространство S как часть проективного пространства PV, можно сказать, что группа GA(S) есть подгруппа группы PGL(V). Задача 3. Доказать, что для всякого проективного преобразова- ния комплексного проективного пространства существует аффин- ная карта, на которой оно представляется как аффинное преобра- зование. Геометрия, определяемая группой проективных преобразова- ний, называется проективной геометрией. Следующая теорема при
§ 6. Проективные пространства 331 сравнении с теоремой 2.1 показывает, насколько группа проектив- ных преобразований богаче группы аффинных преобразований. Назовем систему п + 2 точек п-мерного проективного простран- ства системой точек общего положения, если никакие п +1 из них не лежат в одной гиперплоскости. Теорема 3. Пусть {р0, р1? ..., рп_ц} и {qQ}q1}qn+i} — две си- стемы точек общего положения п-мерного проективного простран- ства PV. Тогда существует единственное проективное преобразова- ние, переводящее pL в qt при i = 0,1,..., п +1. Доказательство. Пусть pt = eit qt =fh где eh f (i = 0,1,..., n 4-1) — ненулевые векторы пространства V. Условие теоремы означает, что {е0, elf..., еп} (соответственно {/о, Л, — базис пространст- ва V и все координаты вектора еп+1 (соответственно /п+1) в этом базисе отличны от нуля. Нормировав векторы е0,е1,...,еп (соот- ветственно ...,/п) некоторым вполне определенным образом, можно добиться того, чтобы еп+1 = е0 + + ... + еп (соответственно /п+1 = /о + Л + ... + /Д ПРИ этих условиях пусть лУ — линейный оператор, переводящий базис {е0, е1?..., еп} в {f0, f19..., fn}. Тогда j</en+1 =/n+i и лУ есть единственное проективное преобразование, удовлетворяющее требованию теоремы. □ В частности, любые 3 различные точки проективной прямой про- ективным преобразованием можно перевести в любые 3 различные точки. Из-за этого в проективной геометрии не существует не толь- ко понятия расстояния между точками, но и понятия отношения тройки точек прямой, имеющегося в аффинной геометрии. Однако существует некий инвариант четверки точек прямой. А именно, пусть рь р2, р3, р4 — точки прямой PU с PV. Выберем в пространстве U какой-либо базис {еъе2} и для любых векторов и, v е U обозначим через det(u, v) определитель матрицы, составлен- ной из их координат в этом базисе. Пусть pt = tzt (i = 1, 2, 3, 4). Легко видеть, что выражение г г, . n n 'I - det(Ul’ Цз) . det<Ul> Ц4) СД-П (Р1> Р2> Рз> Р4) det(u3, u2) det(u4, u2) не зависит ни от нормировки векторов щ, ни от выбора базиса {е1?е2} в U. Оно называется двойным отношением четверки точек Ръ Р2> Рз, Р4- Пусть L — аффинная карта прямой PU. Выберем базис {е1ге2} так, чтобы L = е2 4- (е^, и пусть = е2 4- Тогда х, — неоднород-
332 Глава 7. Аффинные и проективные пространства Ui и2 е2 и3 и4 О ej Рис. 22 Следовательно, ная координата точки р( на карте L (см. рис. 22) и det(ui,uJ)= х‘ , . Ху-Хъ Хх-Х4 (Ръ Р2^ Рз, Р4) “ х _у ' х _у • W2) Л3 Л2 Л4 Л2 Подчеркнем, что в силу наличия инвариантного определения (41) выражение (42) не зависит от выбора аффинной карты и координа- ты на ней. Замечание 3. Двойное отношение считается определенным, ес- ли среди точек ръ р2, р3, р4 нет трех одинаковых. При этом если р2 = Рз или рх = р4, его значение считается равным со. Задача 4. Выяснить что происходит с двойным отношением (Pi, P2J Рз, Р4) = S при перестановках точек рь р2, р3, р4. Доказать, что выражение ках. (52-5 + 1)3 52(5-1)2 не меняется ни при каких перестанов- Задача 5. Изучив изображение четырех симметрично располо- женных вдоль центральной аллеи квадратных цветников на рис. 18, показать, что гравер существенно исказил перспективу. (Указание: сравнить двойное отношение трех равноотстоящих точек централь- ной аллеи, определяемых этими цветниками, и ее бесконечно уда- ленной точки с двойным отношением изображений этих точек на гравюре.) Так как двойное отношение определялось в терминах, инвари- антных относительно линейных преобразований пространства V, то оно сохраняется при любых проективных преобразованиях. Перейдем теперь к проективной теории квадрик. Как мы сей- час увидим, она проще аффинной. Это одно из проявлений совер- шенства проективной геометрии, завораживавшего еще математи- ков XIX в., которые считали, что все геометрии следует выводить из проективной. Подмножество векторного пространства V будем называть ко- нусом, если оно инвариантно относительно умножений на числа, т.е. вместе со всяким вектором содержит все пропорциональные ему векторы. (Это то же самое, что конус с вершиной в нуле в смыс- ле определения, данного в § 5.) В частности, квадрика X с V явля-
§ 6. Проективные пространства 333 ется конусом в этом смысле тогда и только тогда, когда X = X(Q), где Q — квадратичная функция в пространстве V. Такие квадрики будем называть квадратичными конусами (что слегка расходится с терминологией § 5). Для любого конуса X с V назовем его проективизацией и обозна- чим через РХ подмножество пространства PV, образованное всеми одномерными подпространствами, содержащимися в X. Ясно, что изображением подмножества РХ на аффинной карте S является пе- ресечение XAS. Определение 4. Квадрикой в пространстве PV называется про- ективизация квадратичного конуса в пространстве V. Иными словами, это подмножество вида PX(Q), где Q — квад- ратичная функция в пространстве V, при условии, что оно не пу- сто и не является плоскостью. Изображение проективной квадрики на аффинной карте, если оно не пусто и не является плоскостью, представляет собой аффинную квадрику. Однако тип этой квадрики зависит от аффинной карты. (Вспомните световое пятно от лампы с абажуром.) Проективная квадрика PX(Q) называется невырожденной, если квадратичная функция Q невырожденна. Замечание 4. Используя идеи доказательства теоремы 5.1, нетрудно по- казать, что, если только поле К содержит более пяти элементов, пересече- ние X(Q) nS никогда не пусто и может быть (гипер)плоскостью только то- гда, когда Q есть произведение двух линейных функций (и, следовательно, PX(Q) есть объединение двух гиперплоскостей). В однородных координатах проективная квадрика PX(Q) задает- ся уравнением QCxo.Xp ...,xn) = S aijxixj = 0 (ау = а}1). (43) i,J=0 Ее изображение на аффинной карте So задается в аффинных коор- динатах уравнением Q(l,x1,...,xn) = 0, (44) а ее пересечение с бесконечно удаленной по отношению к So ги- перплоскостью задается в однородных координатах на этой гипер- поверхности уравнением Q(0,x1,...,xn) = 0. (45)
334 Глава 7. Аффинные и проективные пространства Отметим, что всякая квадрика X на карте So (а следовательно, и на любой аффинной карте) является изображением некоторой проективной квадрики X. Уравнение квадрики X в однородных ко- ординатах получается из уравнения квадрики X, если вставить х0 во все линейные члены и — в свободный член. Из теоремы 5.1 (в тех случаях, когда она верна) следует, что квадрика X однозначно определяется квадрикой X. Пример 1. Рассмотрим конику С с IRP2, задаваемую в однород- ных координатах уравнением хо “ Х1 “ Х2 = О* Ее изображением на аффинной карте So является эллипс x*+xf = l; бесконечно удаленных по отношению к So точек на С нет. На аффин- ной карте х0 - х2 = 1 та же коника изображается параболой где у = х0 + х2; при этом имеется одна бесконечно удаленная точка (1:0:1). Наконец, на аффинной карте S2 коника С изображается гиперболой x§-x2 = i; при этом имеются две бесконечно удаленные точки (1:1:0) и (1: (-1): 0). Все это хорошо видно на карте So, где изображение прямой х0 ~ х2 = 0, бесконечно удален- ной по отношению к карте х0 — х2 = 1, задается уравнением х2 = 1 и касается изображения коники, а изображение пря- мой х2 = 0, бесконечно удаленной по от- ношению к S2, пересекает изображение коники в двух точках (см. рис. 23). Та- ким образом, можно сказать, что пара- бола касается бесконечно удаленной пря- мой, а гипербола пересекает ее в двух точках. Нетрудно видеть, что бесконечно удаленная точка параболы соответствует ее особому направлению (см. §5), а бесконечно удаленные точки гиперболы — ее асимп- тотам.
§ 6. Проективные пространства 335 Задача 6. Доказать, что всякий параболоид в вещественном аф- финном пространстве касается бесконечно удаленной гиперплос- кости. Если квадратичная функция Q вырожденка и одномерное под- пространство (xQ) содержится в ее ядре, то конус X(Q) вместе со вся- ким одномерным подпространством {х) # (х0) содержит двумерное подпространство (х, х0). Это означает, что квадрика PX(Q) вместе со всякой точкой х 0 х0 содержит прямую хх0, т. е. является конусом с вершиной в х0. Ее изображением на аффинной карте будет конус или цилиндр в зависимости от того, принадлежит точка х0 этой карте или нет. (Таким образом, в проективной геометрии исчезает разница между конусами и цилиндрами.) Замечание 5. Отметим, что согласно нашей терминологии аф- финное изображение вырожденной проективной квадрики может быть невырожденной аффинной квадрикой (конусом). В случаях К = С или R в пространстве V можно выбрать базис, в котором квадратичная функция Q имеет нормальный вид. Отсю- да следует, что уравнение всякой невырожденной квадрики в ком- плексном проективном пространстве может быть приведено к виду Xq+Xj+...+х2 = 0, (46) а в вещественном — к виду Xg+Xj+ ...+х£-х£ -...-x* = 0 (47) (Неравенство к достигается за счет возможного умножения уравнения на —1.) Мы видим, таким образом, что все невырожденные комплекс- ные квадрики проективно эквивалентны, а невырожденные веще- ственные квадрики распадаются на + 1 классов проектив- ной эквивалентности. Тот факт, что квадрики, задаваемые уравнением (47), при раз- личных к проективно не эквивалентны, вытекает из теоремы 5.1 и закона инерции. Однако он проявляется и в различиях геометри- ческого строения этих квадрик. Следующая теорема указывает одно из таких различий. Теорема 4. Максимальная размерность плоскостей, содержа- щихся в вещественной проективной квадрике (47), равна п — к — 1.
336 Глава 7. Аффинные и проективные пространства Доказательство. Очевидно, что k-мерная плоскость По, задавае- мая уравнениями Xk+i = --- = xn = Q, не пересекается с квадрикой (47). Так как всякая плоскость размер- ности п - к пересекается с По, то она не может целиком содержать- ся в квадрике. С другой стороны, перейдя к другому базису, уравнение квадри- ки (47) можно записать в виде УоУк+i + У1Ук+2 + • • • + Уп-к-гУп + Уп-к + -+У? = 0, откуда видно, что (п - к - 1)-мерная плоскость Уо=У1 = ---=Ук = ° содержится в квадрике. □ В частности, квадрика (47) не содержит прямых линий тогда и только тогда, когда к = п - 1. Такая квадрика называется оваль- ной. Одним из ее аффинных изображений является эллипсоид. При к < п - 1 квадрика называется линейчатой. В табл. 2 перечислены невырожденные квадрики в RP2 и RP3 и их аффинные изображения. В каждом случае указывается также Таблица 2 п к Название Аффинное изображение Бесконечно удаленная часть 2 1 коника эллипс 0 парабола точка гипербола пара точек 3 2 овальная квадрика эллипсоид 0 эллиптический параболоид точка двуполостный гиперболоид коника 1 линейчатая квадрика однополостный гиперболоид коника гиперболический параболоид пара прямых
§ 6. Проективные пространства 337 бесконечно удаленная часть квадрики по отношению к соответству- ющей аффинной карте. Отметим, что линейчатая квадрика в IRP3 «соткана» из двух се- мейств прямых: см. рис. 24, где показаны ее аффинные изображе- ния. Рис. 24 Следующая теорема тесно связана с теоремой 5.2 и является ее проективным аналогом. Теорема 5. Для любой невырожденной вещественной проектив- ной квадрики РХ группа G(PX) проективных преобразований, отоб- ражающих X на себя, действует на РХ транзитивно. Доказательство. Из условия невырожденности следует, что ну- левой вектор является единственной вершиной конуса X. Поэтому теорема 5.2 в применении к X означает, что группа линейных преоб- разований, отображающих конус X на себя, транзитивно действует на множестве его ненулевых векторов. Доказываемое утверждение получается отсюда проективизацией. □ Задача 7. Доказать, что если РХ — овальная квадрика, то группа G(PX) транзитивно действует на множестве (упорядоченных) троек различных точек из РХ. Группа G(PX) в случае овальной квадрики РХ может служить базой для построения конформной геометрии и геометрии Лобачев- ского. А именно, конформная геометрия реализуется на самой квад- рике РХ, а геометрия Лобачевского — на ее внутренности. В обоих случаях группой, определяющей геометрию в смысле § 4.2, является группа G(PX) (но действующая на разных множествах). Задача 8. Доказать, что группа G(PX) действует транзитивно на внутренности овальной квадрики РХ. (Ср. задачу 5.1.)
Глава 8 Тензорная алгебра Тензорная алгебра — это скорее язык, чем содержательная тео- рия, но язык очень полезный и, более того, совершенно необходи- мый. Он позволяет, в частности, охватить единым взглядом и даже организовать в одну алгебру все объекты, рассматриваемые в ли- нейной алгебре. § 1. Тензорное произведение векторных пространств Начнем со следующего весьма общего понятия, охватывающего многие объекты, рассматривавшиеся нами ранее. Пусть Уь..., Ур и U — векторные пространства над полем К. Отображение VjX...xVp-С/ (1) называется полилинейным (или, точнее, р-линейным), если оно ли- нейно по каждому из р аргументов при фиксированных значени- ях других аргументов. Такие отображения образуют векторное про- странство — подпространство в векторном пространстве всех отоб- ражений из Vi х ... х Vp в U. Обозначим это векторное пространство через Нот(Уъ ..., Ур; U). Если пространства У1?..., Vp и U конечномерны, то и простран- ство HomCVp ..., Vp; U) конечномерно. Более точно, dimHom(Vi,..., Vp; U) = dim Vi •... - dim Vp - dim U, так как полилинейное отображение (1) определяется своими значе- ниями на наборах базисных векторов пространств Vi,..., Vp, кото- рые, в свою очередь, определяются своими координатами в базисе пространства U. При U = К мы получаем пространство Нот(Уь ..., Vp; К) полили- нейных функций на Vi х ... х Ур. В частности, Нот(У; К) есть про- странство У*, сопряженное У.
§ 1. Тензорное произведение векторных пространств 339 Тензорное произведение векторных пространств V и W есте- ственным образом возникает при рассмотрении всевозможных би- линейных отображений у: V х W —> U. Как мы увидим, среди этих отображений имеется одно «универсальное», через которое могут быть описаны все остальные. Соответствующее пространство U и называется тензорным произведением пространств V и W. Предложение 1. Пусть V u W — векторные пространства с ба- зисами {et: i eZ} и {fj: jeJ} соответственно. Следующие свойства билинейного отображения tp:V*W-*U эквивалентны: 1) векторы y>(eiffj) (ieZ, JeJ) составляют базис пространст- ва U\ 2) каждый вектор zeU единственным образом представляется в виде z = '£lip (е„ у) (у, е W); i 3) каждый вектор zeU единственным образом представляется в виде z = е V). j (В случае бесконечномерных пространств предполагается, что лишь конечное число слагаемых в суммах отлично от нуля.) Доказательство. Если ZyV(ef, /Д то z=£ у,), где у= i,j i =S Ztjfj* и наоборот. Отсюда вытекает эквивалентность свойств 1) j и 2). Аналогично доказывается эквивалентность свойств 1) и 3). □ Следствие. Выполнение условия 1) не зависит от выбора бази- сов в пространствах V и W. Определение 1. Тензорным произведением двух векторных про- странств V и W называется векторное пространство Т вместе с би- линейным отображением 0: V х W —*Т, (х,у)—>х0у, удовлетворяющим следующему условию: если {ef: ie/} и {J;: jej} — базисы пространств V nW соответственно, то {e^fj: i el, jeJ} — базис пространства Т. Согласно доказанному выше, выполнение последнего условия не зависит от выбора базисов в V и W. Очевидно, что тензорное произведение существует для любых векторных пространств V и W: достаточно взять векторное про- странство Т с базисом {ty: iel, j G J} и определить билинейное отображение 0: V х W Т, задав его на парах базисных векторов по формуле ef 0 fj = t#.
340 Глава 8. Тензорная алгебра Тензорное произведение единственно в следующем смысле: ес- ли (Ть ®J и (Т2, ®г) —Два тензорных произведения пространств V и W, то имеется (единственный) изоморфизм 'ф: 7\ —► Т2, удовлетво- ряющий условию 'ф(х®1у)=х®2у (2) для любых х е V, у е IV. В самом деле, искомый изоморфизм можно построить, задав его на базисных векторах по формуле По соображениям линейности условие (2) будет тогда выполняться для любых х е V, у g IV. Тензорное произведение векторных пространств V и W обозна- чается через V ® W, а при необходимости указать основное поле — через V ®к IV. Из определения следует, что в конечномерном случае dim(V ® IV) = dim V • dim W. (3) Пример 1. Рассмотрим билинейное отображение ®:К[х]хК[у]->К[х,у], определяемое по формуле (/®g)(x,y)=J(x)g(y). Так как произведения х10 у; = xlyJ (i, j = 0,1, 2,...) составляют ба- зис пространства К[х,у], то К[х,у] =К[х] ® К [у]. Аналогично, К[Х1,...,хт,У1,...,уп]=К[хь ...,хт]®К[уь...,уп]. (4) В следующих двух примерах V и IV — конечномерные векторные пространства с базисами {е1? ...,еп} и {j\, Через {бд,..., £п} и 0т} обозначаются сопряженные базисы пространств V* и W* соответственно. Пример 2. Для любых а е V* и у е W определим линейное отоб- ражение а ® у из V в W по формуле (а® у)(х) = а(х)у. (5) Мы получим билинейное отображение ®: V* х W—>Hom(V; IV).
§ 1. Тензорное произведение векторных пространств 341 Легко видеть, что г, ® — это линейное отображение, задаваемое матрицей Е^. Так как такие матрицы составляют базис пространст- ва всех матриц размера т х п, то Hom(V; W) = V*®W. (6) Пример 3. Для любых a G V* и /3 G W* определим билинейную функцию а ® /3 на V х W по формуле (а®0)(х,у) = а(х)0(у). (7) Мы получим билинейное отображение ®: V* ® W* —>Hom(V, W; К). При этом (fi ® 0;)(х, у) =х1у/-, где х1э..., хп и у1? ...уш — координаты векторов х и у соответственно. Так как всякая билинейная функ- ция у на V х W однозначно представляется в виде у (х, у) = £ с^х^уу, то функции ® 6j составляют базис пространства Hom(V, W;K). Следовательно, Hom(V, W; К) = V* ® W*. (8) Свойство универсальности тензорного произведения, о котором говорилось в начале этого параграфа, выражается в следующем. Предложение 2. Для произвольного билинейного отображения у, V х W —> U существует единственное линейное отображение гр: V®W —>U, такое, что 4>(х,у) = гр(х®у) (9) для любых х G V, yeW. Доказательство. Искомое линейное отображение задается на базисных векторах пространства V ® W по формуле Каждый элемент z G V ® W единственным образом представляет- ся в виде * = 2^® A (^GK). (10) м Числа Zy называются координатами элемента z относительно задан- ных базисов пространств V и W. В частности, в конечномерном слу- чае элемент z задается матрицей (zi;) размера т х п, где т = dim V, n = dim W.
342 Глава 8. Тензорная алгебра Элемент z G V ® W называется разложимым, если он представля- ется в виде z = x®y (xGV,yGW). (И) Ясно, что если х = £ х(еь у = y^fj, то z^ = xlty;. В конечномерном i ) случае это означает, что rk(z[;) $ 1. Таким образом, разложимые элементы, хотя они и порождают пространство V ® W, составляют весьма малую его часть (за исключением случаев, когда V или W одномерно). Задача 1. Доказать, что представление ненулевого разложимого элемента z е. V ® W в виде (11) единственно с точностью до замены х—>Лх, у —>Л“1у (Ле/С*). Часто бывают полезны и другие представления элемента тен- зорного произведения, вытекающие из предложения 1. А именно, всякий элемент z G V ® W единственным образом представляется в виде 2 = £е.®У.- (12) i а также в виде z = (xyev). (13) j Задача 2. Доказать, что всякий элемент z G V ® W представляет- ся в виде г (14) к=1 где векторы ..., ur G V, а также векторы шь..., щ. G W линейно независимы. Такое представление единственно с точностью до за- мены u’k^XbkiWi, I I где А= (afcf) и В = (Ь^г) —невырожденные квадратные матрицы по- рядка г, связанные соотношением АТВ = Е. Число г равно рангу матрицы координат элемента z. Важным применением тензорного умножения является опера- ция расширения основного поля, с простейшим част- ным случаем которой — комплексификацией вещественного век- торного пространства — мы уже встречались в § 6.2.
§ 1. Тензорное произведение векторных пространств 343 Пусть V — векторное пространство над полем К и L — какое-ли- бо расширение поля К, т. е. поле, содержащее К в качестве подполя. Рассматривая L как векторное пространство над К, мы можем обра- зовать тензорное произведение V(L) = L®V. Согласно определению, это векторное пространство над К. Однако его можно превратить в векторное пространство над L, определив умножение на элементы поля L по правилу р) = Ag® р (Л, geL, v g V). Исходное пространство V можно считать вложенным в V(L), отождествив каждый вектор v G V с вектором 1 ® и G V(L). При таком соглашении Л®р = Лр. Рассматривая разложение элемента V(L) по базису второго множителя, мы получаем, что всякий базис пространства V над К является базисом пространства V(L) над L. Однако смысл расширения основного поля заключается в том, что в пространстве V(L) существуют и другие базисы, в которых изучае- мые объекты (например, линейные операторы) могут иметь более простой вид. С другой стороны, если {0^. iel} — базис L над К, то всякий век- тор пространства V (L) однозначно представляется в виде £ где i Vi (iel) — какие-то векторы пространства V (лишь конечное число которых отлично от нуля). Например, всякий вектор комплексифи- кации V (С) вещественного векторного пространства V однозначно представляется в виде х + (у, где х, у eV. Операция тензорного умножения векторных пространств в опре- деленном смысле коммутативна и ассоциативна. А именно, для лю- бых векторных пространств V и W имеется изоморфизм V®W^W®V, (15) при котором х ® у (х G V, у G W) переходит в у ® х. В самом деле, ис- комый изоморфизм определяется условием, что базисные векторы е, ® пространства V ® W переходят в соответствующие базисные векторы fj ® е, пространства W ® V. Аналогично, для любых вектор- ных пространств U, V, W имеется изоморфизм (LT®V)®W^17®(V®W), (16) при котором (x®y)®z (хе U, у eV, zeW) переходит в х ® (у ® z).
344 Глава 8. Тензорная алгебра Отождествляя пространства (U 0 V) 0 W и U 0 (V 0 W) при по- мощи изоморфизма (16), мы можем говорить о тензорном произве- дении любого конечного числа векторных пространств Уь V2,..., Vp, не указывая расстановки скобок. Индукция по р показывает, что всевозможные тензорные произведения базисных векторов прост- ранств Ц,..., Vp составляют базис пространства Vi 0... 0 Vp. С другой стороны, это свойство можно принять за определение Уг 0 ... 0 Vpf т. е. можно сразу определить тензорное произведение нескольких векторных пространств так же, как это было сделано для двух про- странств (заменив билинейное отображение р-линейным). В силу предложения 2 имеется изоморфизм Hom(V 0 W; U) Hom(V, W; U), (17) переводящий линейное отображение гр: V 0 W —► U в билинейное отображение V х W —► U, определяемое равенством (9). В част- ности, при U = К получаем изоморфизм (V0 W)* Hom(V, W; К). (18) Предложение 2 тривиально обобщается на любое конечное чис- ло векторных пространств (вместо двух пространств V и W). Это дает изоморфизм Hom(V10...0Vp; U)^Hom(Vb ..., Vp; U), (19) переводящий линейное отображение гр: Ц 0 ... 0 Vp -♦ U в р-линей- ное отображение ср: Vi х ... х Vp -♦ U, определяемое равенством (р(хъ ...,хр)=-ф(х10...0хр). (20) В частности, при U = K получаем изоморфизм (Vi 0... 0 VpY Hom(Vi,..., Vp; К). (21) Элементы вида jq 0 ... 0хр называются разложимыми элемен- тами тензорного произведения Уг 0 ... 0 Vp. Наличие канониче- ского изоморфизма (19) эквивалентно следующему основному принципу тензорной алгебры, позволяющему опреде- лять линейные отображения тензорного произведения, задавая их на разложимых элементах: для любого р-линейного отображения ip: Vi х ... х Vp —> U существует единственное линейное отображе- ние гр: Ц 0... 0 Vp -♦ U, удовлетворяющее условию (20).
§ 1. Тензорное произведение векторных пространств 345 Для тензорных произведений конечномерных пространств име- ются и другие естественные изоморфизмы, играющие важную роль в тензорной алгебре. Прежде всего, можно обобщить пример 3 на любое число конеч- номерных векторных пространств Уь..., Vp. Полагая (а!® ...®ар)(Х1, ...,хр) = а1(х1)...ар(хр) (22) при СЦ g V*,..., ар еУр*, мы получаем, что Hom (Vj,..., Vp; К) = V? 8... 8 Ур*. (23) В сочетании с изоморфизмом (21) это дает изоморфизм V{ 8... 8 V* (Уг 8... 8 УрУ. (24) Комбинируя равенство (6) с изоморфизмами (19) и (24), мы по- лучаем для любых конечномерных векторных пространств ..., Vp и U изоморфизм УГ 8... 8 V* 8 U Нот(У!,..., Vp; 17). (25) Имея в виду построенные выше естественные изоморфизмы, обычно отождествляют соответствующие векторные пространст- ва, т. е. считают, что V 8 W = W 8 V, (17 8 V) 8 W = U 8 (V 8 IV), V*8W*8t/=Hom(V, IV; 17) (для конечномерных пространств) и т. д. Для любых линейных операторов аУ G L(V) и G L(W) можно определить линейный оператор а/ 8 G L(V 8 IV), задав его на разложимых элементах по формуле (лУ 8 ^)(х8у) = аУх8 (26) Оператор j7 8 $ называется тензорным произведением операторов d и Пусть А = (ад) — матрица оператора d в базисе ..., еп} про- странства V и В = (bjtz) — матрица оператора в базисе {/ь..., fm} пространства IV. Тогда матрица оператора лУ 8 в базисе {e2 8/1? ei ® У2> ® fm,e2 ® fi,e2® f2, ...,е2® fm, ...,еп ® /ьеп ® /2> ••• ..., еп 8 fm } пространства V 8 W имеет вид ^ОцВ fl]2^ ••• 0-21^ U-22^ ••• @2цВ (27) VniB ап2В ... аппв]
346 Глава 8. Тензорная алгебра Она называется тензорным произведением матриц А и В и обознача- ется через А®В. Легко видеть, что tr А ® В = tr А • tr В и, значит, tr аУ® ^=tr зУ *tr 98. (28) Задача 3. Доказать, что det ® 98 = (det j^)m(det 98}п. (29) Задача 4. Предположим, что характеристический многочлен оператора j/ имеет (с учетом кратностей) п корней А1э..., Ап, а характеристический многочлен оператора 98 имеет т корней gp ..., /ит. Доказать, что тогда характеристический многочлен опе- ратора j/® 98 имеет пт корней А^- (i = l,..., п; j = 1,..., т). Выве- сти отсюда (при сделанных предположениях) формулы (28) и (29). Задача 5. Доказать, что (для конечномерных пространств V и W) пространство L(V ® W) является тензорным произведением пространств L(V) и L(W) относительно определенного выше тен- зорного умножения линейных операторов. Аналогичным образом определяется тензорное произведение нескольких линейных операторов. § 2. Тензорная алгебра векторного пространства В этом параграфе V есть п-мерное векторное пространство. Пространство TP(V) = V® ... ® V ® y*®...®v; р я называется пространством тензоров типа (p,q) на V. (Простран- ство Т0°(У) полагают равным К.) Очевидно, что dim Tq(V) = np+q. Имеем Tj (V) = V, Т°(У) = V*. Более общо, ?0(У) = Hom(V,..., V; К), (30) я (V) = Hom(V,..., V; V). (31) я
§ 2. Тензорная алгебра векторного пространства 347 В частности, тензоры типа (0,2) — это билинейные функции, тензоры типа (1,1) — это линейные операторы, а тензоры типа (1,2) —это билинейные операции (структуры алгебр) на V. Тензорное умножение определяет билинейную операцию ®: Т₽(У) х ТДУ) -т£(У) таким образом, что (x18...®xp8a1®...®aq)® (xp+1®...®xp+r®aq+1®...®a<1+s) = = x1®...®xp+r®a1® ...®aq+s. Пример 1. Пространство T22(V) = V®V®V*®V* = (V®V)® (V®V)* можно трактовать как L(V 0 V). При этом тензорное умножение совпадает с тензорным умножением линейных операторов в смыс- ле § 1. В самом деле, в силу билинейности обоих умножений доста- точно проверить это для разложимых линейных операторов. Пусть d = и 0 a, ЗВ = v 0 Р (u, v G V, а, р G V*), и пусть лУ 0 ЗВ — тензор- ное произведение операторов а/ и ЗВ в смысле §1. Учитывая, что (а 0 /3) (х 0 у) = аМр(у) (см. пример 1.3 и определение изоморфиз- ма (18)), получаем: (d 0 ЗВ) (х 0 у) = rfx 0 ^у = a(x) (у) и 0 р = = ((a0/3)(x0y))u0y = ((u0y) 0 (а0/3))(х0у). Следовательно, d 0 ЭВ = u®v®a®p, что и требовалось доказать. Другая важная операция над тензорами — это свертка, представ- ляющая собой линейное отображение ТчР(У)^т£(У) (p,q>0), определяемое следующим образом. Рассмотрим отображение V х ... х V х У* х х V*-» Тр~'(V), р ч (хь ...,хр, аъ ..., aq)—►ai(x1)(x2® ...®хр®а2® ...®aq).
348 Глава 8. Тензорная алгебра Очевидно, что оно полилинейно. Следовательно, существует линей- ное отображение Tqp(V) Тр~* (V), при котором х2 0... 0хр 0 СЦ 0... 0aq -»a1(x1)(x20 ...0хр 0 а20...® aq). Это и есть свертка. В данном определении свертка производилась «по первым мно- жителям» в произведениях у 0... 0и у*0...0У*, тензорным про- Р я изведением которых является Tqp (V). Совершенно так же определя- ется свертка по любой паре множителей. Пример 2. Свертка линейного оператора (как тензора типа (1,1)) — это его след. Действительно, в силу линейности достаточно проверить это утверждение для разложимых операторов, т. е. опера- торов вида x0a (xgV, aG V*). Оператор такого вида равен нулю на (п - 1)-мерном подпространстве Кег а и действует как умножение на а(х) на факторпространстве V/Kera. Следовательно, его след равен а(х), что совпадает со сверткой. Пример 3. Свертка тензорного произведения линейного опера- тора а/ и вектора х по второму множителю V и первому (един- ственному) множителю V* равна вектору аУх. Действительно, для разложимого оператора d = и 0 а результат указанной свертки есть а(х)и, что совпадает с лУх. Пример 4. Свертка тензорного произведения линейных опера- торов jy и по второму множителю V и первому множителю V* равна обычному произведению операторов а/ и Действи- тельно, для разложимых операторов d = и0а и = у 0 /3 резуль- тат указанной свертки есть оператор a(i/)u0j3, переводящий каж- дый вектор xg V в вектор a(p)^(x)u; с другой стороны, d&x = /3 Wjz/u = a(p)/3 (x)u. Пример 5. Как следует из формулы (7), свертка тензорного про- изведения билинейной функции а и двух векторов х и у по двум парам множителей равна а(х, у) или а(у, х) в зависимости от того, как комбинируются сворачиваемые множители. Свертку тензорного произведения тензоров Г и U часто называ- ют сверткой тензора Т с тензором U (по указанным индексам). Пусть {е£}— базис пространства V и {еД — сопряженный базис пространства V*. Тогда {е£1 0 ... 0 0 0 ... 0 eJq} — базис прост- ранства Т/(У). Любой тензор Т типа (p,q) может быть выражен
§ 2. Тензорная алгебра векторного пространства 349 через этот базис: Т = У Т; j ® ® ...® Ej . Числа называются координатами тензора Т в базисе {е,} пространства V. Пример 6. Координаты линейного оператора как тензора типа (1,1) —это в точности элементы матрицы этого оператора. В самом деле, если si = £ s^e{ 0 Ер то ij i Пример 7. Аналогично, координаты билинейной функции как тензора типа (0, 2) —это элементы матрицы этой функции. В символике, изобретенной Эйнштейном, используются как ниж- ние, так и верхние индексы, причем базисные векторы простран- ства V нумеруются нижними индексами, а базисные векторы про- странства V* — верхними. Соответствующие индексы у координат тензора пишутся, напротив, вверху и внизу соответственно. Если в каком-либо произведении какой-либо индекс встречается дважды, причем один раз вверху, а другой — внизу (другие повторения не допускаются), то предполагается суммирование по этому индексу. Так, предыдущая формула записывается в виде т = т‘,-|',е. ®...®е.- ®ejl (32) Пример 8. Координаты образа вектора х при действии линейно- го оператора st записываются в этой символике формулой (jix)l = s/jXJ. Пример 9. Произведение линейных операторов si и записы- вается формулой Координаты тензорного произведения Т ® U тензоров Т е Tqp (V) и U eTsr(V) суть произведения координат множителей: Jl‘”Jq+s )\”‘)q Jq+l"'Jq+s Координаты свертки S тензора Т е Tqp (V) по первой паре мно- жителей (или, как говорят, по первой паре индексов) находятся по формуле п’г-’р __Tki2-ip bh-Jq ^h-jq ’
350 Глава 8. Тензорная алгебра Это следует из равенства (32), если учесть, что свертка произведе- ния et]®®равна 5^el2®...®eir®£7’2®(где —символ Кронекера). Аналогично находятся координаты сверт- ки тензора Т по любой паре индексов. В евклидовом векторном пространстве V имеется выделенный тензор Т2°(У), определяющий скалярное умножение. Он называ- ется метрическим тензором пространства V. Свертка метрического тензора с любым тензором Г € Т? (V) по любому индексу тензора g и первому верхнему индексу тензора Т есть тензор Т G Т^(У)9 ко- ординаты которого находятся по формуле Т12--1р Tkl2"'lp jh-jq *)k h-jq ' Переход от тензора Т к тензору Т называется спуском первого верхнего индекса тензора Т. Аналогично определяется спуск любого верхнего индекса. В ортонормированном базисе пространства V имеем gjk = Sjk, откуда "" 'jl-Jq * Из этого можно сделать два вывода. Во-первых, операция спуска ин- декса обратима. Обратная операция называется подъемом индекса. Во-вторых, если ограничиться ортонормированными базисами, в ев- клидовом векторном пространстве исчезает разница между верхни- ми и нижними индексами тензоров. Пример 10. При спуске индекса вектора и G V получается линей- ная функция a(x)=gjkxlul=(x, и). Тем самым устанавливается уже известный нам канонический изо- морфизм между евклидовым пространством V и его сопряженным пространством V*. Пример 11. При спуске индекса линейного оператора зг? получа- ется билинейная функция а(х, у) = g^x1 jrfy1 = (х, аУу). Тем самым устанавливается уже известный нам канонический изо- морфизм между пространствами линейных операторов и билиней- ных функций в евклидовом пространстве (см. §6.3).
§ 2. Тензорная алгебра векторного пространства 351 Тензоры типа (р, 0) называются контравариантными тензора- ми степени р. Положим T₽(V) = TOP(V). Пространства T°(V) =К, = V, Т2(У),... можно организовать в алгебру. Для этого нам понадобится понятие внешней прямой суммы векторных пространств. С разложением векторного пространства в прямую сумму под- пространств мы уже встречались в § 5.1. Соответствующее опреде- ление может быть дано следующим образом. Определение 1. Говорят, что векторное пространство V разлага- ется в прямую сумму подпространств V1} если каждый элемент х е V единственным образом представляется в виде х = х^ 4-... 4- хк, где х, е При этом пишут v=v1®...®vk. В случае двух подпространств Уь V2 единственность представле- ния любого элемента х € V в виде х = х^ 4- х2 Cq е Уг, х2 € У2) равно- сильно тому, что Vi П У2 = 0. Имеется другой подход к понятию прямой суммы, при котором пространства Ц, ..., Vk заранее не предполагаются вложенными в ка- кое-то одно пространство. Определение 2. Прямой суммой векторных пространств ... ..., Vk называется векторное пространство Vi Ф... ® Ук, составленное из всех последовательностей (хъ ...,хк\ где x^V^ с покомпонент- ными операциями сложения и умножения на элементы основного поля К. Более подробно, операции в Vi Ф ... Ф Vk определяются следую- щим образом: (Xi, ...,xfc) + (yi, ...,yfc) = (xi+yi,...,xfc + yfc), Л(Х1, ...,xt) = (x1, ...,xfc). Тот факт, что при этом действительно получается векторное про- странство, очевиден. В частности, его нулем является последова- тельность (0,..., 0). Прямую сумму в смысле определения 1 называют внутренней, а в смысле определения 2 — внешней. Однако эти два понятия тесно связаны друг с другом.
352 Глава 8. Тензорная алгебра А именно, рассматривая последовательности вида (0,..., х,..., 0), где х G Vi стоит на i-м месте, мы видим, что операции над ними сводятся к соответствующим операциям над f-ми компонентами. Отождествляя элемент х G VJ с такой последовательностью, мы полу- чаем вложение пространства Ц в качестве подпространства в про- странство Vi ® ... ® Vfc. При этом каждый элемент из Ц Ф ... Ф Vk единственным образом представляется в виде суммы элементов из этих подпространств. Это означает, что пространство Ц Ф ... Ф Vk есть прямая сумма подпространств Vi,..., Vk. Имея в виду указан- ное отождествление, элемент (хь ...,х*) внешней прямой суммы Vi ®... Ф Vk часто записывают как Xj 4-... 4- хк. Обратно, пусть какое-то векторное пространство V разложено в прямую сумму своих подпространств Vlf...,Vk. Образуем внеш- нюю прямую сумму Vi Ф... Ф Vk. Тогда отображение Vi ® ...®Vk—>V, (хь ...,xfc)-*x14-...4-xfc, является изоморфизмом векторных пространств. Все предыдущее можно распространить на случай бесконечного числа слагаемых Уь У2,..., если рассматривать не все последователь- ности (хь х2,...), где х, G а только финитные, т. е. такие, в кото- рых лишь конечное число членов отлично от нуля. Вернемся к построению тензорной алгебры. Рассмотрим беско- нечную прямую сумму Т(У) = ф Т₽(У). (33) р=0 Так как Тр(У)®Г(У)сТр+ч(У), то тензорное умножение определяет в Т(У) структуру градуирован- ной алгебры. Эта алгебра называется тензорной алгеброй простран- ства V. Отметим, что она ассоциативна (но не коммутативна) и об- ладает единицей, каковой является единица поля К = Т°(У). Аналогично, тензоры типа (0, р) называются ковариантными тензорами степени р. Положим Tp(V) = Тр (V). Алгебра ГДУ)=®Гр(У) р=0 называется алгеброй полилинейных функций на V. Тензорное умно- жение полилинейных функций имеет простую интерпретацию.
§ 3. Симметрическая алгебра 353 А именно, значения (р + д)-линейной функции а ® р (а е Тр(V), /3 е £Tq(V)) находятся по формуле (a®j3)(xbxp+q) = а(х1( ...,xp)0(xp+1, ...,xp+q). (34) В самом деле, по соображениям линейности достаточно проверить справедливость этой формулы для а = ® ... ® ар (а1?..., ар е V*) и Р = рг ®® f}q (&, ..., Pq е V*); но в этом случае она легко следует из формулы (22). С другой стороны, так как Tp(V) = W), то алгебру ковариантных тензоров можно понимать как тензорную алгебру пространства V*. Согласно основному принципу тензорной алгебры (см. § 1) вся- кое р-линейное отображение <р: Ух^хУ^Ц (35) р «пропускается» через ТР(У) в том смысле, что существует такое (од- нозначно определенное) линейное отображение гр: Тр(У)-*и, (36) что (р(хь ...,хр)='ф(х1®...®хр) (37) для любых хь ..., хр е V. При U = К это дает изоморфизм Tp(V)^(Tp(V))* (38) (частный случай изоморфизма (21)). Если рассматривать только симметрические или же только косо- симметрические полилинейные отображения, то мы придем к поня- тию симметрической или соответственно, внешней степени прост- ранства V. Этому посвящены следующие два параграфа. § 3. Симметрическая алгебра Определение 1. Полилинейное отображение (35) называется симметрическим, если <р(х11,...>х1/>) = ^(Х1,...,хр) для любой перестановки (ц,..., ip) чисел 1,..., р.
354 Глава 8. Тензорная алгебра Очевидно, что в этом определении можно ограничиться переста- новками двух аргументов. При U = К оно превращается в определение симметрической по- лилинейной функции. Пусть {еь еп} — базис пространства V. Определение 2. Векторное пространство S вместе с симметри- ческим р-линейным отображением V х х V-*S, (хь V... Vxp, (39) р называется р-й симметрической степенью пространства V, если век- торы eti V ... V е, с ц $ ... $ ip составляют базис пространства S. Подчеркнем, что выражение хг V... Vxp в (39) следует понимать как единое целое. Это просто способ обозначения образа элемента (Х!,...,Хр). Данное определение не зависит от выбора базиса пространст- ва V. В самом деле, если {ер..., е^}—другой базис, то векторы е^ V ... V е'р с $ ... $ jp также составляют базис пространства S, так как их число равно числу векторов ei} V ... V е, с ц $ ... $ ip и последние через них линейно выражаются. Симметрическая степень существует: достаточно взять вектор- ное пространство S с базисом {s, л : ц ... $ ip} и определить р-ли- нейное отображение (39), задав его на наборах базисных векторов пространства V по формуле e^V... VeI₽=s;i 7р, где jlf ...,jp—числа ix, •••> расположенные в порядке неубывания. Симметрическая степень единственна в следующем смысле: ес- ли (Sb Vj) и (S2, V2) —две р-е симметрические степени простран- ства V, то имеется (единственный) изоморфизм ф: Sx —>S2, удовле- творяющий условию V>(xT V1...V1xp)=x1 V2... V2xp для любых хр ...,хр G V. Искомый изоморфизм можно построить, задав его на базисных векторах по формуле Vi... Vi eip) =efiV2... V2ei(i (ц ... ip). Симметрическая степень пространства V обозначается через S₽(V).
§ 3. Симметрическая алгебра 355 Следующее предложение выражает свойство универсальности симметрической степени, аналогичное свойству универсальности тензорного произведения (см. предложение 1.2). Предложение 1. Для произвольного симметрического р-линейно- го отображения (35) существует единственное линейное отображе- ние гр: SP(V) —> U, такое, что (/>(хь ...,хр) = -0(х1 V...Vxp) (40) для любых xlt ...,хре V. Доказательство. Искомое линейное отображение задается на базисных векторах пространства Sp (V) по формуле V... Velp) = ^(et],..., eip) (ц $ ... $ ip). Ввиду симметричности отображения (/? эта формула автоматически будет выполняться при любых ц,..., ip, а уже отсюда по линейности вытекает (40). □ Элементы вида Xj V ... Vхр (хь ..., хр € V) симметрической сте- пени SP(V) называются разложимыми. Предложение 1 позволяет определять линейные отображения пространства SP(V), задавая их на разложимых элементах так, чтобы выполнялись условия полили- нейности и симметрии относительно множителей хь ..., хр. В частности, имеется билинейное отображение V: SP(V) х Sq(V) —>Sp+q(V), задаваемое на разложимых элементах по формуле (X! V ... Vxp) V (хр+1 V... Vxp+q) = Xi V... Vxp+q. (41) Рассмотрим прямую сумму S(V) = ®Sp(V). р=0 Определенная выше операция V превращает S(V) в градуирован- ную алгебру. Эта алгебра называется симметрической алгеброй пространства V. Очевидно, что она ассоциативна, коммутативна и обладает единицей (каковой является единица поля К = S°V). Из определения (41) следует, что всякий разложимый элемент Xj V ... V хр gSp(V) совпадает с произведением элементов хп ...,хр в алгебре S(V).
356 Глава 8. Тензорная алгебра Симметрическая алгебра векторного пространства на самом де- ле не является новым для нас объектом. В ней можно узнать ал- гебру многочленов. А именно, поставив в соответствие каждому произведению ef] V ... v eip (ц $ ... ip) одночлен ui{...uip от пере- менных иь ..., ип, мы получим изоморфизм алгебры S(V) на алгебру K[ult Более того, если рассматривать еь ..., еп как координатные функ- ции на сопряженном пространстве V*, то любой элемент алгебры S(V) как многочлен от elt..., еп будет определять некоторую функ- цию на V*. В этом смысле можно сказать, что алгебра S(V) есть ал- гебра многочленов на V* (хотя в случае конечного поля ее элементы нельзя отождествлять с определяемыми ими функциями). Соответ- ственно этому алгебра S(V*) есть алгебра многочленов на V. Если char К = 0, то пространство SP(V) можно отождествить с подпространством симметрических тензоров в ТР(У). А именно, для любой перестановки а G Sp определим линейное преобразование Т Та пространства ТР(У), задав его на разложи- мых тензорах формулой (Xj ®... ® хр)а = хст(1) ®... ® хст(р). (42) Отметим, что ((Xi ® ... ®Хр)а)т = (x^d) ®... ®ха(р))т = = Хат(1) ® ... ® ХСТТ(Р) = (хг ® ... ® Хр)стт и, следовательно, (Та)Т = гат (43) для любого тензора Т G ТР(У). Тензор Т еТр(У) называется симметрическим, если Та = Т для любой подстановки ст GSp. Симметрические тензоры образуют под- пространство в ТР(У); обозначим его STP(V). Предположим, что char К = 0. Тогда можно определить оператор симметрирования Sym в пространстве ТР(У) по формуле SymT=^ £ Та. (44) Ясно, что Sym Т G STP (V) при любом Т и Sym Т = Т при Т G STP (V). Это означает, что Sym — проектор на STP(V).
§ 3. Симметрическая алгебра 357 Предложение 2. При условии char К = 0 имеется изоморфизм р: SP(V')-+STP(V'), для которого М(^ V... V хр) = SymOq ®® хр). (45) Доказательство. Так как правая часть (45) полилинейна и сим- метрична относительно хъ ...,хр, то имеется линейное отображе- ние/!: SP(V) ->STP(V\ удовлетворяющее условию (45). Оно перево- дит базисные векторы ef] V... Vе, (ц ^ ... ^ ip) пространства SP(V) в тензоры Symfe^ ® $ ... ^ip). Рассматривая разложение симметрических тензоров по базис- ным векторам ® ... ® е, пространства ТР(У), мы видим, что коэффициенты при базисных векторах, отличающихся только по- рядком индексов, одинаковы. Поэтому тензоры Symfe^ ® ... ®е1р) с ц $ ... $ ip составляют базис пространства STP(V). Следовательно, р — изоморфизм. □ Пользуясь этим изоморфизмом, пространство SP(V) часто отож- дествляют с STP(V). Заметим, что подпространство ST(V) = © STp(V)cT(V) р=0 отнюдь не является подалгеброй в Т(У), но его отождествление с S(V) позволяет ввести в нем структуру алгебры. Умножение в этой алгебре выглядит следующим образом: TVl/ = Sym(T®U). (46) Применим вышеизложенное к сопряженному пространству V*. Положим Sp (V) = Sp (V*), STp (V) = STp (V*). Пространство STp(V) есть не что иное, как пространство симмет- рических р-линейных функций на V. Операция симметрирования выглядит следующим образом: (Syma)(xb ...,хр) = -^ £ (47> р- cr^Sp Каждой симметрической р-линейной функции a^STp(V) поста- вим в соответствие многочлен fa G Sp (V) по формуле /а(х) = а(х, ...,х) (48)
358 Глава 8. Тензорная алгебра подобно тому, как § 5.4 каждой симметрической билинейной функ- ции была поставлена в соответствие квадратичная функция. Предложение 3. Если char К = 0, то отображение STp(V)-*Sp(y), a^fa, (49) есть изоморфизм векторных пространств, обратный изоморфизму ц: Sp(V) —>STp(V), определяемому как в предложении 2. Доказательство. Достаточно рассмотреть симметрические р-ли- нейные функции вида a = Sym(a!® ...®ap) = g(a1 V... Vap), где ab ..., ар € V*. Для такой функции fa(x) = a1(x)...ap(x) = (a1 V... Vap)(x). Это означает, что /a = aj V...vap=M-1(a), что и требовалось доказать. □ Симметрическая полилинейная функция а называется поляриза- цией однородного многочлена fa. Пример 1. Поляризацией многочлена fM=x^ + x^x3 является симметрическая трилинейная функция а(х, у, z) = x^zi +1 (x3y2z2+x2y3z2 + x2y2z3). (Здесь x, у, z — векторы трехмерного пространства, хь yh z{ (i = = 1, 2, 3) — их координаты.) Замечание 1. В случае поля положительной характеристики отображение (49), вообще говоря, не является изоморфизмом. Так, над полем характеристики 2 симметрической билинейной функции «(*, у) = *1У2 + х2У1 соответствует нулевая квадратичная функция, а квадратичная функция f (х) =х}х2 не соответствует никакой сим- метрической билинейной функции. Замечание 2. Формула (48) позволяет каждой (а не только сим- метрической) р-линейной функции поставить в соответствие одно- родный многочлен степени р. Однако определенное таким образом линейное отображение Тр(У) —>Sp(V) при р > 1 не будет изомор- физмом.
§ 3. Симметрическая алгебра 359 Умножение в алгебре симметрических полилинейных функций ST*(V) = ©STp(V), р=0 соответствующее умножению в алгебре S,(V)=®S,(V), р=0 выглядит следующим образом: (aV0)(xb ...,xp+q) = = У а(х,х,: )/3(х, , ...,х, ), (50) (р + а)! ' г '₽+> *р+ч (ll,..., Iр|lp+i, • ••» lp+q) где суммирование происходит по всем разбиениям (i19..., ip | ip+lt... ..., ip+q) множества {1,..., р +q} на две группы из р и q элементов соответственно (порядок чисел в каждой группе безразличен). Это следует из формул (46), (34) и (47), если учесть симметричность функций а и /3. Произведение aV^ называется симметрическим произведением функций аи /3. Симметрическое произведение р линейных функций аь ..., ар € е V* задается формулой (<Х1 V...Vap)(xi, ...,xp) = ^j per(a,(Xj)), (51) где per А — перманент квадратной матрицы А, определяемый ана- логично определителю с той разницей, что все члены, независимо от четности перестановки, берутся со знаком плюс. Замечание 3. В случае поля положительной характеристики форму- ла (50) для симметрического произведения не имеет смысла. Ситуацию можно исправить, убрав коэффициент перед суммой. Определенная таким образом операция в ST*(V) будет по-прежнему ассоциативной и коммута- тивной, но полученная алгебра не будет изоморфна алгебре S*(V). Аналогично тензорному произведению линейных операторов можно определить симметрическую степень Spjtf линейного опе- ратора как линейный оператор в пространстве SP(V), действующий на разложимые элементы по формуле (Sp (*! V ... V Хр) = j^Xi V ... V лУХр. (52)
360 Глава 8. Тензорная алгебра Если отождествить пространство Sp (V) с пространством STP (V) сим- метрических тензоров (в случае char К = 0), то оператор Spjtf будет не чем иным, как ограничением р-й тензорной степени операто- ра лУ на инвариантное подпространство ST₽(V) с ТР(У). Пример 2. Имея в виду приложение к теории линейных пред- ставлений групп в § 11.4, вычислим след симметрического квадрата 52аУ линейного оператора аУ. Пусть {e!,...,en}— базис простран- ства V. Тогда векторы е, V с i $ j составляют базис пространства S2(V). Имеем (в символике Эйнштейна) (S2jy)(et Vе;) = зУе, V зУе, = rfkek V d{-e{ = = V е( = + л/'л/к)ек V et. Следовательно, tr S2^ = 1 (зУ/зУ/ + = 1 ((tr зУ )2 + tr зУ 2). (53) Задача 1. Предположим, что характеристический многочлен оператора зУ имеет (с учетом кратностей) п корней Аь..., Ап. До- казать, что тогда характеристический многочлен оператора S2a/ имеет п(п 4-1)/2 корней AIA; (1 $ i $ j $ п). Вывести отсюда форму- лу (53). § 4. Алгебра Грассмана Алгебра Грассмана, или внешняя алгебра, строится аналогично симметрической с той разницей, что условие симметричности заме- няется условием кососимметричности. При этом следует предпола- гать, что char К 02. (Случай char К = 2 может быть включен в об- щую схему, но он требует особой заботы.) Определение 1. Полилинейное отображение (35) называется ко- сосимметрическим, если 4>(xh, ...,xip)=sgn(i1, ...,1р)<р(хъ ...,хр) для любой перестановки (£1э..., ip) чисел 1,..., р. В этом определении можно ограничиться перестановками двух аргументов (потребовав, чтобы при этом образ умножался на — 1). Ясно также, что если <р — кососимметрическое р-линейное отоб- ражение, то <р(хь ..., хр) = 0 всякий раз, когда среди векторов хь..., хр есть одинаковые.
§ 4. Алгебра Грассмана 361 При U = К данное определение превращается в определение ко- сосимметрической полилинейной функции. Пусть {еь еп} — базис пространства V. Определение 2. Векторное пространство Л вместе с кососим- метрическим р-линейным отображением V х х V-»Л, (х1?хр) •—>х1 Л ... АХр, (54) р называется р-й внешней степенью пространства V, если векторы ei} Л... Л eip с ц < ... < ip составляют базис пространства Л. По тем же причинам, что и определение симметрической степе- ни, это определение не зависит от выбора базиса пространства V. Так же как и симметрическая степень, внешняя степень суще- ствует и единственна. Она обозначается через ЛР(У). Из определения следует, что dim Лр (V) = Ср = n(n~1)-^n-P + 1) В частности, Лр (V) = 0 при р > п. Элементы пространства ЛР(У) называются поливекторами или, точнее, р-векторами. В частности, 1-векторы — это просто векто- ры пространства V; 2-векторы называют бивекторами, 3-векторы — тривекторами. Свойство универсальности внешней степени выражается следу- ющим предложением, доказательство которого аналогично доказа- тельству предложения 3.1. Предложение 1. Для любого кососимметрического р-линейного отображения (35) существует единственное линейное отображение ф: Лр (V) —> U, такое, что (р(х1? ...,хр)=-ф(х1Л...Лхр) (55) для любых х1? ...,xpG V. Поливекторы вида х2 Л ... Лхр (х1?..., хр G V) называются разло- жимыми. Имеется билинейное отображение Л: Лр (V) х Aq (V) — Ap+q (V). задаваемое на разложимых поливекторах по формуле (X! Л ... ЛХР) Л (хр+1 Л ... Axp+q) =Х! Л ... Axp+q. (56)
362 Глава 8. Тензорная алгебра Рассмотрим прямую сумму A(V)=®A₽(V). р=0 Операция Л превращает Л(У) в градуированную алгебру, которая называется внешней алгеброй, или алгеброй Грассмана, пространст- ва V. Она ассоциативна и обладает единицей, но не коммутативна. Однако в ней выполняется следующее свойство, заменяющее ком- мутативность: uAv = (-l)pqiMu при ugAp(V), i;GAq(V). Градуированные алгебры, обладающие этим свойством, называют супер коммутативными. (Суперкоммутативность лежит в основе так называемой суперматематики.) Всякий разложимый поливектор jq Л ... Л хр G ЛР(У) совпадает с произведением векторов ..., хр в алгебре Л(У). В отличие от симметрической алгебры, внешняя алгебра конеч- номерна. Более точно, поскольку ее базисные векторы (ц <... < ip) находятся во взаимно однозначном соответствии с под- множествами множества {1,..., п}, то dimA(V) = 2n. Пространство ЛР(У) можно отождествить с подпространством кососимметрических тензоров в ТР(У). А именно, тензор Т G Тр(У) называется кососимметрическим, ес- ли Та = (sgn ст) Т для любой подстановки er GSp. Кососимметриче- ские тензоры образуют подпространство в TP(V); обозначим его ЛТр(У). Предположим, что char К = 0. Тогда можно определить оператор альтернирования Alt в пространстве ТР(У) по формуле Alt Т = S (sgn <т)Та. (57) Р' aeSp Это проектор на ЛТР(У). Предложение 2. При условии char К = 0 имеется изоморфизм р: Лр (V) -♦ ЛТР (V), при котором gCq Л ... Лхр) = Altfrq 0... 0хр). (58) Доказательство аналогично доказательству предложения 3.2. Единственное дополнительное соображение состоит в том, что в
§ 4. Алгебра Грассмана 363 разложении кососимметрического тензора по базисным векторам ei} 0... 0е, пространства Тр (V) коэффициенты при базисных векто- рах, среди индексов которых есть одинаковые, равны нулю. □ Пользуясь этим изоморфизмом, пространство Лр (V) часто отож- дествляют с ЛТР(У). Задача 1. Доказать, что Т2 (V) = ST2 (V) Ф AT2 (V), но, если только dim V> 1, TP(V)/STP(V) + ATP(V) при р >2. Подпространство ЛТ(У) = Ф ЛТр(У)сТ(У) р=0 не является подалгеброй в Т(У), но его отождествление с Л(У) поз- воляет ввести в нем структуру алгебры, умножение в которой выгля- дит следующим образом: TA U = Alt(T 0 U). Применим вышеизложенное к сопряженному пространству. По- ложим Лр (V) = Лр (V*), ЛТр (V) = ЛТр (V*). Пространство ЛТр(У) есть не что иное, как пространство косо- симметрических р-линейных функций на V. Операция альтерниро- вания выглядит следующим образом: (AltoOfaj, = 2 (Sgn cr)a(xa(1), ...,xa(p)). (59) P' <7€Sp Умножение в алгебре кососимметрических полилинейных функ- ций ЛТДУ) = фЛТр(У), р=0 соответствующее умножению в алгебре ЛДУ)=фЛр(У), р=0
364 Глава 8. Тензорная алгебра выглядит следующим образом: (аЛ^)(хр ...,xp+q) = = (Si . . S . sgn(i1;..., ip+q)a(xii, ...,х|р)(х|р+1,..., xip+(|), (i ip [ip+if-tip+q) (60) где суммирование, как и в формуле (50), происходит по всем разби- ениям (ib ..., ip | ip+1,..., ip+q) множества {1,..., p + q} на две группы из р и q элементов соответственно. Произведение а Л /3 называется внешним произведением функций а и )3. Внешнее произведение р линейных функций аь ..., ар G V* зада- ется формулой (oti Л... л ар)(хъ ..., хр) = det(a,(x,)). (61) Замечание 1. В случае поля положительной характеристики формула (60) не имеет смысла. Однако, если убрать коэффициент перед суммой, полученная алгебра будет по-прежнему изоморфна алгебре АДУ). Иногда такое определение внешнего умножения принимают и в случае поля нуле- вой характеристики. Аналогично симметрической степени линейного оператора оп- ределяется внешняя степень линейного оператора л/. Задача 2. Доказать, что trA2j?/ = |((trjy)2-trjy2). (62) В то время как понятие симметрической алгебры есть лишь но- вый взгляд на алгебру многочленов, понятие алгебры Грассмана является действительно новым для нашего курса, хотя неявно мы со- прикоснулись с ним в теории определителей. Приложения алгебры Грассмана, о которых будет рассказано ниже, можно рассматривать как развитие теории определителей. Пусть V есть п-мерное векторное пространство над полем К ха- рактеристики / 2. Теорема 1. 1) Система векторов {а1?..., ар} пространства Vли- нейно зависима тогда и только тогда, когда а1Л...Лар = 0. 2) Если системы векторов {а^ ..., ар} и {Ь1?..., Ьр} линейно неза- висимы, то (аь ..., ар) = (Ь1?..., Ьр) тогда и только тогда, когда р-векторы aj Л... Лар и Ьг Л... Л Ьр пропорциональны.
§ 4. Алгебра Грассмана 365 Доказательство. 1) Если векторы а1? ...,dp линейно зависимы, то один из них линейно выражается через остальные. Пусть, напри- мер, р-1 ар = S i=l Тогда р-1 СЦ Л... Acip-! Лар = Aidj Л... Adp.j Аа1 = 0. i=l Если векторы аь ..., ар линейно независимы, то их можно вклю- чить в базис пространства V. Тогда р-вектор dj Л ... Лар будет од- ним из векторов базиса пространства Лр (V), построенного согласно определению внешней степени. Следовательно, он отличен от нуля. 2) Если (аь ..., ар) = (Ьъ ..., Ър), то векторы Ьъ ..., Ьр линейно вы- ражаются через векторы аь ..., ар и, значит, р-вектор Ьг Л ... Л Ьр линейно выражается через р-векторы вида ai} Л...ла^. Однако _ (±а1л...Аар, если ц, ..., ip различны, 11 1р [0 в противном случае. Следовательно, Ьг Л... Л bp = Л... Л ар. Если {аг, ар)^(Ъ1}..., Ър), то существует такой базис {е1?..., еп} пространства V, что (а1,...,ар) = (е1, ...,ер), (Ь1г ...,bp) = (ed+1, ...,ed+p) (0<d^p). По уже доказанному р-вектор СЦЛ...Лар пропорционален ег Л...Лер, а р-вектор Ьг А ... Abp пропорционален ed+1 Л ... Aed+p. Но р-векто- ры ej Л ... Л ер и ed+1 Л ... Л ed+p не пропорциональны, так как они суть различные векторы базиса пространства ЛР(У), построенного согласно определению внешней степени. Следовательно, и р-векто- ры СЦ Л... Л ар и Л... Л Ьр не пропорциональны. □ Совокупность разложимых р-векторов называется грассмано- вым. конусом. Проективизация этого конуса называется грассмано- вым многообразием и обозначается Grp(V). Согласно доказанной теореме, точки многообразия Grp(V) находятся во взаимно одно- значном соответствии с р-мерными подпространствами простран- ства V. Пусть — фиксированный базис пространства V и {аь ...,ар} — базис подпространства U. Найдем координаты р-век- тора dj Л... Лар в базисе пространства ЛР(У), образованном произ- ведениями ei} Л ... Aeip с ц <... <ip.
366 Глава 8. Тензорная алгебра Пусть А = (ai}) — матрица размера р х и, образованная координа- тами векторов а1? ...,ар в базисе {еь ...,еп}, т. е. ai = Lave; (i = l, •••>₽)• J Имеем тогда агЛ...Лар = S Л... Aeip. Й,...,ip Если среди индексов ц,..., ip есть одинаковые, то е1} Л ... Л eip = 0. Если же они все различны, то мы можем переставить множители в Л... Л так, чтобы их индексы шли в порядке возрастания; при этом все произведение умножится на (-l)s, где $ — число инверсий в последовательности (ib..., ip). Отсюда следует, что а1Л...Лар= S (63) ii<-..<ip где Mf f — минор порядка р матрицы А, образованный столбцами с номерами ц,..., ip. Согласно теореме 1, числа Mf однозначно определяют под- пространство U. Они называются его плюккеровыми координата- ми. Это не что иное, как однородные координаты соответствующей точки проективного пространства РЛР(У). Они определены с точ- ностью до одновременного умножения на число с # 0. Кроме того, так как разложимые р-векторы составляют лишь часть пространст- ва ЛР(У), плюккеровы координаты подпространства не могут быть произвольными. Они связаны соотношениями, описываемыми сле- дующей ниже теоремой. Для того чтобы было удобнее написать эти соотношения, примем сле- дующее соглашение: если заданы какие-то числа pi} ip для ц < ... < ip, то будем считать, что числа автоматически определены для любых ilt..., ip таким образом, что при перестановке любых двух индексов число Мц...ip умножается на -1 (и, тем самым, оно равно нулю, если какие-либо два индекса совпадают). В частности, Mi} ip для любых ц,..., ip будет тогда равно определителю матрицы порядка р, составленной из столбцов матри- цы А с номерами ц,..., ip (в указанном порядке). Теорема 2. Числа являются плюккеровыми координатами неко- торого р-мерного подпространства U с V тогда и только тогда, когда они не равны одновременно нулю и для любых ц,..., ip+1, jlt..., jp_2 выполнено
§ 4. Алгебра Грассмана 367 соотношение р+1 (64) к=1 где крышка обозначает пропуск соответствующего индекса. Соотношения (64) называются соотношениями Плюккера. Замечание 2. Так как левая часть соотношения (64) кососимметрична по f],ip+1 и по у’р-1, то можно считать, что ц < ... < ip+1 и < ... Доказательство. Докажем, что соотношения (64) выполняются для плюккеровых координат М(1 р-мерного подпространства U с V. Разлагая определитель Mikj} jpпо первому столбцу, получаем = asik^s> s где Ns не зависит от к. Поэтому достаточно доказать, что р+1 (65) к=1 для всех s. Припишем к матрице А ее s-ю строку. Полученную матрицу размера (р + 1) х п обозначим через As. Тогда левая часть равенства (65) есть с точностью до знака результат разложения по последней строке опре- делителя матрицы порядка р +1, составленной из столбцов матрицы As с номерами ц,..., ip+1. Так как матрица As имеет две одинаковые строки, то этот определитель равен нулю. Обратно, пусть числа р1} _ip не равны одновременно нулю и удовлетворя- ют соотношениям (64). Докажем, что существует такая матрица А размера р х п, что (66) (где 1р имеет тот же смысл, что и выше) для всех ц,..., ip. Считая для определенности, что р = 1, будем искать матрицу А в виде <1 0 ... О ai>p+i ••• д = 0 1 ... 0 аг,р+1 ••• а2п \0 0 ... 1 <1р>р + 1 ••• apnJ При j > р имеем тогда Поэтому мы должны взять ^ij ( Ml...L..pj>
368 Глава 8. Тензорная алгебра тогда равенство (66) будет выполнено во всех случаях, когда множество {ц,..., ip} не более чем одним элементом отличается от множества {1,р}. Докажем теперь индукцией по т, что равенство (66) выполнено, ес- ли множество {ц, ..., ip} отличается от множества {1,..., р} тп элементами. Пусть, скажем, $ {1,..., р}. Согласно условию, выполнено соотношение Mi112...lp =Mi...pMili2...1|> = S(-l)*+1MiU..JL.PMW2....,- (67) k=l С другой стороны, по уже доказанной части теоремы аналогичное соотно- шение выполнено для миноров матрицы А: Mili2...fp = Е (-1)^’4, . (68) к=1 По предположению индукции правые части равенств (67) и (68) совпадают. Следовательно, p,i} ip = . □ Пример 1. При п = 4, р = 2 соотношения Плюккера сводятся к одному соотношению М12М34 + М23М14 + М31М24=О- (69) Пример 2. При р = п - 1 нетривиальных соотношений Плюккера нет. Следовательно, всякий (и — 1)-вектор разложим. Задача 3. Доказать, что при р q существует билинейное отображение : А₽ (V) х Д’ (V*) — ЛГР (V*), задаваемое на разложимых элементах формулой (/>(*! А... Дхр, a1A...Aaq) = = Е Sgn(l’l> •••, ip,Л> •••>)q-p)aii (X1)-"aip(Xp)aJi Л Aaj4 ()> <1 где суммирование происходит по всем различным ...,ipi a {j\,..., jq-p} есть дополнение к {ц,..., ip} в {1,..., q}, упорядоченное произвольным об- разом. Задача 4. Доказать, что если 5 — ненулевой элемент из Ап (V*), то отоб- ражение А₽ (V) -> Ап’₽ (V*), и ~ у>(и, 5), где (/? — билинейное отображение из задачи 3, является изоморфизмом, пе- реводящим разложимые элементы в разложимые. Вывести отсюда другим способом (по сравнению с примером 2), что всякий (и - 1)-вектор разло- жим. В качестве другого приложения алгебры Грассмана выведем так называ- емый пфаффиан кососимметричной матрицы четного порядка.
§ 4. Алгебра Грассмана 369 Пусть и = 2m и А = (а0) — кососимметричная матрица порядка и. Рас- смотрим бивектор О- S О-ij (в, Л €j ) 2 S О-ij А j ) > i<j ij где {elf..., еп} — фиксированный базис пространства V. Вычислим его т-ю степень в алгебре Л(У): = ъа( S sgn(ii>...,in)alll-2...aiii_liJe1A...Aen> 41.........in) ' где последняя сумма берется по всем перестановкам (ц,in) чисел 1,... ..., п. Слагаемые этой суммы, отличающиеся лишь порядком пар (ц, i2), ... ..., Gn-i, 1п) и порядком элементов в каждой паре, равны между собой. Сле- довательно, ara=ml( £ sgn(ij,in)a(j(2...a(ii_](n)e1A...Aen, (70) где суммирование происходит по всем разбиениям множества {1,..., и} на пары (fj, i2),..., Ц) (порядок пар и порядок элементов в каждой паре выбираются произвольно). Выражение pfA= £ sgn(ii,...,in)a(1(2...a(n_liii (71) называется пфаффианом матрицы А. Формула (70) переписывается в виде am = rn\ (pf A)ejA...Aen. (72) Она справедлива и в том случае, когда векторы еь ..., еп линейно зависимы; но тогда она означает просто, что ат = 0. Теорема 3. 1) pf САСТ = det С • pf А для любой, матрицы С порядка п. 2) (pfA)2 = detA. Доказательство. 1) Вначале докажем эту формулу в предположении, что char К = 0. Пусть {е',..., е'} — базис пространства V и (е1,...,еп) = (е/1,...,е')С. Выразим бивектор а = | Ле, через e'v е'п. Пусть С = (с1}); тогда а=5 Е k,l
370 Глава 8. Тензорная алгебра где akl = S aijckiclj- Положим А' = (а'к1У, тогда А' = САС\ Следовательно, ат = m! (pf А)е1 Л... Леп = т! (pf А')е' Л... Ле'п. С другой стороны, ej Л... Aen = (det С)е' Л... Ле' (ср. формулу (63)). Значит, pf А • det С = pf А', что и требовалось доказать. Доказанное равенство можно рассматривать как некое тождество в кольце многочленов с целыми коэффициентами от элементов матриц А и С. Редукция по модулю р показывает, что оно верно и для поля Zp, а следовательно, и для любого поля характеристики р. 2) По теореме 5.4.6 существует такая невырожденная матрица С, что A = CFCJ, где F — матрица вида f 0 1 -1 0 Л о о7 о V Легко видеть, что f 1 при к = т, detF = pfF=< н (О при/с<гп, так что в любом случае det F = (pf F)2. Согласно первой части теоремы, pf A = detC-pf F. С другой стороны, det А = (det С)2 detF. Следовательно, det А = (pf А)2. □
§ 4. Алгебра Грассмана 371 Пример 3. Для кососимметрической матрицы А порядка 4 имеем pf А = П12а34 + а23а14 + а31а24‘ Сравнивая эту формулу с формулой (69), мы видим, что условие разложимо- сти бивектора а = £ ai;e, Л е, может быть записано в виде pf А = 0, что ввиду теоремы 3 равносильно условию det А = 0. Так как ранг кососимметриче- ской матрицы всегда четен, то это условие, в свою очередь, равносильно условию rk А 2. С другой стороны, легко доказать и непосредственно, что бивектор а разложим тогда и только тогда, когда rk А 2.
Глава 9 Коммутативная алгебра Наиболее важными типами алгебраических структур, для кото- рых имеется содержательная теория, являются кольца (в частности, поля) и группы. В этой главе мы разовьем темы абелевых групп и коммутативных ассоциативных колец, начатые в гл. 1 и 3. Впро- чем, некоторые общие определения и простейшие факты, приведен- ные в § 2, 3, относятся к более общим кольцам. § 1. Конечно порожденные абелевы группы Абелевы группы до некоторой степени схожи с векторными про- странствами, с которыми читатель уже хорошо знаком. Во всяком случае, понятие линейной зависимости в теории абелевых групп также играет важную роль. Напомним, что элементы аддитивной абелевой группы можно умножать на целые числа (что соответствует возведению в степень в мультипликативной группе). Эта операция обладает такими же свойствами, как умножение векторов на элементы основного поля. А именно, пусть А — аддитивная абелева группа. Тогда легко проверить, что k(a + b) = ka + kb, (1) (k + Z)a = ka + Za, (2) (kZ)a = k(Za) (3) для любых a, be А, к, left. (Свойство (2) в мультипликативном ва- рианте было доказано в § 4.3.) Из (1) и (2) выводятся аналогичные свойства для вычитания: к (a - Z?) = ка - kb, (k - Z)a = ка - 1а. Для любого подмножества S с А совокупность всех линейных комбинаций ктаг +... + кпап (a, G S, k, G Z)
§ 1. Конечно порожденные абелевы группы 373 есть наименьшая подгруппа группы А, содержащая S. Она назы- вается подгруппой, порожденной подмножеством S, и обозначает- ся через (S). Если (S) = А, то говорят, что группа А порождается подмножеством S или что S — система порождающих группы А. (Это согласуется с понятиями, введенными в §4.4 для произволь- ных групп.) Абелева группа, допускающая конечную систему порож- дающих, называется конечно порожденной. Конечно порожденные абелевы группы аналогичны конечномерным векторным простран- ствам. Система {а1,...,ап} элементов группы А называется линейно независимой, если к1а1 + ... + кпап = 0 только при кх = ... = кп = = 0. Линейно независимая система порождающих называется ба- зисом. В отличие от векторных пространств, не всякая конечно порож- денная абелева группа обладает базисом. Так, группа Zn порождает- ся одним элементом, но она не обладает базисом, так как всякий ее элемент а удовлетворяет нетривиальному соотношению па = 0. Определение 1. Конечно порожденная абелева группа, облада- ющая базисом, называется свободной. Для свободных абелевых групп справедливы аналоги некоторых теорем о векторных пространствах, доказанных в § 2.2. Теорема 1. Все базисы свободной абелевой группы L содержат од- но и то же число элементов. Доказательство. Пусть {е1? ...,еп} и {ер ..., е^} — базисы груп- пы L. Предположим, что т > п. Имеем: (е'1,...,е;) = (е1,...,еп)С, где С — некоторая целочисленная матрица размера п х т. По основ- ной лемме о линейной зависимости столбцы матрицы С линейно зависимы как элементы пространства Qn. Отсюда следует, что меж- ду ними имеется нетривиальная линейная зависимость с целыми коэффициентами; но тогда такая же линейная зависимость имеется между элементами ер ..., е' группы L, что невозможно. □ Число элементов базиса свободной абелевой группы L называет- ся ее рангом и обозначается через rkL. Очевидно, что всякая сво- бодная абелева группа ранга п изоморфна группе Zn строк длины п, составленных из целых чисел. Замечание 1. Нулевая группа считается свободной абелевой группой ранга 0.
374 Глава 9. Коммутативная алгебра Опишем все базисы свободной абелевой группы L. Пусть {еь ... ...,еп}— какой-либо один базис и ер...,е'— какие-то элементы группы L. Имеем: (е/1,...,е/п) = (е1,...,еп)С, (4) где С — целочисленная квадратная матрица порядка п. Теорема 2. Элементы е'р составляют базис группы L то- гда и только тогда, когда detC = ±l. Доказательство. Если det С = ±1, то матрица С-1 является цело- численной и (еь еп) = (ер .... е')С-1. Отсюда следует, что элементы e'p порождают группу L, а из невырожденности матрицы С — что они линейно независимы. Обратно, пусть {ер ..., е^}— базис группы L. Тогда (ер ..., en) = (е', ...,e^)D (5) для некоторой целочисленной матрицы D. Из (4) и (5) следует, что CD = Е и, значит, det С • det D = 1. Так как det С и det D — целые числа, то det С = ±1. □ Если уподоблять свободные абелевы группы векторным про- странствам, то роль подпространств следует отвести подгруппам. Это частично оправдывается следующей теоремой. Теорема 3. Всякая подгруппа N свободной абелевой группы L ран- га п является свободной абелевой группой ранга $ п. Доказательство проведем индукцией по п. При п = 0 доказы- вать нечего. При п > 0 пусть {ер ..., еп} — базис группы L. Рассмотрим под- группу L1 = (еь ..., en_j) С L. Это свободная абелева группа ранга и - 1. По предположению индукции подгруппа N1=NC\L1 является свободной абелевой группой ранга т $ п - 1. Пусть {/р ..., fm} — ее базис. Рассмотрим последние координаты всех элементов из N в базисе {ер ..., еп} группы L. Они образуют подгруппу в группе Z, которая по теореме 4.3.2 имеет вид kZ для некоторого k G Z+. Если к = О, то N = Nj и все доказано. Если к > 0, то пусть fm+1 — какой-ли- бо элемент из N, последняя координата которого равна к; тогда {/р ..., fm, fm+i} — базис группы N и также все доказано. □ Аналогия между подгруппами свободной абелевой группы и под- пространствами векторного пространства все же неполная. В отли-
§ 1. Конечно порожденные абелевы группы 375 чие от векторных пространств, в свободной абелевой группе ранга и > 0 существуют подгруппы того же ранга, не совпадающие со всей группой. Так, подгруппа mZ С Z при т > 0 имеет ранг 1, как и вся группа Z. Однако связь между свободными абелевыми группами и вектор- ными пространствами не исчерпывается аналогией между ними. Свободная абелева группа ранга п может быть вложена в виде под- группы в n-мерное евклидово векторное пространство Еп. А имен- но, пусть {en ...,еп}— какой-либо базис пространства Еп. Тогда подгруппа L, порожденная векторами elf..,,en (т.е. совокупность векторов с целыми координатами в базисе {е1,...,еп}) является свободной абелевой группой ранга п. Этот геометрический образ (см. рис. 1) очень помогает восприятию свободных абелевых групп. Рис. 1 Подгруппы L С Еп, получаемые указанным выше способом, назы- ваются решетками в Еп. Задача 1. Параллелепипед Р(е1} ...,еп), натянутый на какой-ли- бо базис {в!,..., еп} решетки LСЕП, называется фундаментальным параллелепипедом этой решетки. Доказать, что его объем не зави- сит от выбора базиса решетки L. Для решеток в Еп имеется также аксиоматическое описание, ис- пользующее топологическое понятие дискретности. Определение 2. Подмножество М с Еп называется дискретным, если в каждом ограниченном подмножестве пространства Еп имеет- ся лишь конечное число его элементов. Очевидно, что всякая решетка дискретна. Более общо, подгруп- па, порожденная любой линейно независимой системой векторов
376 Глава 9. Коммутативная алгебра (т. е. решетка в подпространстве пространства Еп), также диск- ретна. Задача 2. Доказать, что подгруппа L с Еп дискретна тогда и толь- ко тогда, когда ее пересечение с некоторой окрестностью нуля состо- ит только из нуля. Теорема 4. Всякая дискретная подгруппа Lc.En порождена неко- торой линейно независимой системой векторов пространства Еп. Доказательство. Пусть U с Еп — линейная оболочка подгруп- пы L. Очевидно, что L — дискретная подгруппа в U. Поэтому, заме- нив пространство Еп на пространство U, мы можем свести доказа- тельство к случаю, когда линейная оболочка подгруппы L совпадает со всем пространством. В этом случае подгруппа L содержит некоторый базис {е1?..., еп} пространства Еп. Рассмотрим решетку Lo в Еп, порожденную этим базисом. В любом смежном классе группы L по Lo имеется вектор, принадлежащий параллелепипеду P(elt..., еп). Так как пересечение LnPCej,..., еп) конечно, то индекс \L :L0| конечен. Если он равен d, то dx G Lq для любого х G L (см. следствие 4 теоремы 4.5.1). Таким образом, L0CLcd-1L0. (6) Заметим, что d-1L0— это решетка в Еп, порожденная базисом {d“1e1, ...,d-1en}. По теореме 3 из (6) следует, что L — свободная абелева группа, причем п = rk Lo $ rk L $ rk d^LQ = n, t. e. rkL = n. Базис группы L является в то же время базисом прост- ранства Еп. Это означает, что L — решетка в Еп. □ Следствие. Всякая дискретная подгруппа L с Еп, линейная обо- лочка которой совпадает с Еп, является решеткой в Еп. Пример 1. Решетки в Е3 играют важную роль в кристаллогра- фии. Кристаллические структуры характеризуются тем, что распо- ложение атомов в них периодически повторяется во всех трех из- мерениях (см. рис. 2 §4.2). Более точно, пусть Г — группа симмет- рии некоторой кристаллической структуры (мысленно продолжен- ной на все пространство). Обозначим через L группу всех таких векторов а, что параллельный перенос ta принадлежит Г. Сказанное выше означает, что L порождает пространство Е3 (как векторное пространство). С другой стороны, так как в любой ограниченной
§ 1. Конечно порожденные абелевы группы 377 части пространства имеется лишь конечное число атомов кристал- лической структуры, группа L является дискретной подгруппой про- странства Е3. Следовательно, L — решетка в Е3. Как правило, группа Г, кроме параллельных переносов, содер- жит и другие движения. Именно они определяют симметрию ре- альных кристаллов, которую мы можем наблюдать, точнее, груп- па G симметрии любого кристалла, симметрия структуры которого описывается группой Г, совпадает с группой dr линейных частей движений из Г. Пользуясь полученным выше описанием группы параллельных переносов, содержащихся в Г, можно получить информацию о груп- пе G. А именно, для любого у G Г и любого a G L имеем: ^dy(a) Y^aY Г* (см. формулу (5) §4.2). Следовательно, любое преобразование g G G сохраняет решетку L и, значит, в базисе этой решетки записывается целочисленной матрицей. Отсюда получаем, что trgGZ. Но, с дру- гой стороны, если g — поворот на угол а вокруг какой-либо оси, то tr g = 2 cos а +1. Следовательно, 2 cos a G Z. Это означает, что 71 71 271 ^1 ае i0, 3’ 2’ 3 ’ В частности, кристаллы, в отличие от цветов и низших животных, не могут иметь поворотной симметрии 5-го порядка. Дадим теперь более точное описание подгрупп свободных абе- левых групп. Ключевую роль в этом описании будет играть одно вспомогательное утверждение о целочисленных матрицах. Определение 3. Целочисленными элементарными преобразова- ниями строк матрицы называются преобразования следующих трех типов: 1) прибавление к одной строке другой, умноженной на целое число; 2) перестановка двух строк; 3) умножение одной строки на -1. Аналогично определяются целочисленные элементарные преоб- разования столбцов. Прямоугольную матрицу С = (Су) размера п х т назовем диаго- нальной и обозначим через diagCtq,..., пр), если с^ = 0 при i / j и Сц = щ при i = l,..., р, где p = min{n, т}.
378 Глава 9. Коммутативная алгебра Предложение 1. Всякую целочисленную прямоугольную матри- цу С = (ctj) с помощью целочисленных элементарных преобразова- ний строк и столбцов можно привести к виду diagCuy,..., ир), где иь ир ^0 и щ | ul+1 при i = l,р -1. Доказательство. Если С = 0, то доказывать нечего. Если С # 0, но сп =0, то путем перестановки строк и столбцов добьемся того, чтобы сп / 0. Далее, умножив, если нужно, первую строку на —1, до- бьемся того, чтобы сп > 0. После этого с помощью целочисленных элементарных преобразований строк и столбцов будем стремиться уменьшить сп. Если какой-то элемент сп (i 2) не делится на сп, то разделим его на сп с остатком: Qi^n+r (0 < г < Сц). Вычтя из i-й строки 1-ю строку, умноженную на q и переставив 1-ю и i-ю строки полученной матрицы, мы уменьшим сп. Аналогично, если какой-то элемент с1; (J 2) не делится на сп, мы можем умень- шить сп, работая со столбцами. Если все элементы первого столбца и первой строки делятся на сп, но какой-то элемент с i,;2 не делится на сп, то поступим следующим образом. Вычтя из i-й строки 1-ю строку с подходящим коэффициентом, добьемся того, чтобы с(1 = 0 (при этом с у по-преж- нему не будет делиться на сп). После этого прибавим к 1-й строке i-ю строку. Элемент сп при этом не изменится, но элемент с1; пере- станет делиться на сп, и мы сможем применить описанную выше процедуру для уменьшения сп. Поступая таким образом, мы в конце концов придем к ситуации, когда все элементы матрицы делятся на сп. Вычитая подходящие кратные 1-й строки из всех остальных строк и подходящие кратные 1-го столбца из всех остальных столбцов, мы получаем матрицу вида (щ о ... (А 0 где все элементы матрицы С\ делятся на Последнее свойство будет сохраняться при любых целочисленных элементарных преоб- разованиях строк и столбцов матрицы .
§ 1. Конечно порожденные абелевы группы 379 Поступая таким же образом с матрицей С1 и т.д., мы в конце концов приведем матрицу С к требуемому виду. □ Для матриц размера 2x1 или 1x2 описанная в этом доказа- тельстве процедура есть не что иное, как алгоритм Евклида для нахождения наибольшего общего делителя двух целых чисел. Пример 2. Проиллюстрируем процедуру, описанную в этом до- казательстве, на конкретном примере: /2 6 2\ /2 6 2Л /2 3 4Л I 2 3 4 ] —> ( О -3 2 ] —> I О -3 2 1—* И 2 47 \4 2 47 к4 2 47 /2 1 4\ / 1 2 4Л /1 0 0 \ -> I 0 -3 2 I —♦ I -3 0 2 ] —* I О 6 14 1—* к4 —2 47 к-2 4 47 кО 8 127 /1 0 0 \ /1 0 0 \ /1 О О Л -> 0 6 14 ) —► I О 2 —2 j —» I 0 2 0 . кО 2 -27 кО 6 147 кО 0 207 Здесь с самого начала все элементы первого столбца и первой стро- ки делились на сп = 2, но элемент с22 = 3 не делился на сп; поэтому мы вычли из второй строки первую и прибавили к первой строке полученную вторую. Конечно, используя особенности конкретной матрицы, тот же результат можно было бы получить более коротким способом. Задача 3. Доказать, что щ = djd^^ где d( — наибольший общий делитель миноров i-ro порядка исходной матрицы С (d0 считается равным 1 и 0/0 считается равным 0). Замечание 2. Как следует из предыдущей задачи, числа ... ..., ир однозначно определяются матрицей С. Если отказаться от тре- бования щ | uf+1, то процедура приведения целочисленной матрицы к диагональному виду несколько облегчится, но диагональный вид уже не будет, вообще говоря, определен однозначно. Теорема 5. Для всякой подгруппы N свободной абелевой группы L ранга п существует такой базис {еь еп} группы L и такие нату- ральные числа и1,...,ит что {и1е1,..., итет} — базис груп- пы N и щ\ и1+1 при i = l,..., т-1. Доказательство. Согласно теореме 3 группа N является свобод- ной абелевой группой ранга т $ п. Пусть {е1?..., еп} — какой-нибудь базис группы L и {Д,..., fm} — базис группы N. Тогда с/т, ...,/т) = Се1, ...,еп)С,
380 Глава 9. Коммутативная алгебра где С — целочисленная матрица размера п х гл и ранга т. У нас есть возможность делать следующие «элементарные» преобразова- ния базисов групп LnN: 1) прибавление к одному базисному элементу другого, умножен- ного на целое число; 2) перестановка двух базисных элементов; 3) умножение одного базисного элемента на -1. Элементарные преобразования базиса группы L приводят к це- лочисленным элементарным преобразованиям строк матрицы С, а элементарные преобразования базиса группы N — к целочис- ленным элементарным преобразованиям столбцов этой матрицы. Согласно предложению 1, с помощью таких преобразований мы можем добиться того, чтобы C = diag(u1, ...,um), где ит >0 и щ | ui+1 при i = 1,гп - 1. (Среди чисел иъ ..., ит не может быть нулей, так как rk С = гп.) Но это как раз и означа- ет, что полученные в результате преобразований базисы {ej,..., еп} и {fj,..., fm} групп LnN связаны соотношениями Z=yiei (i = l, □ Базис {е1?..., еп} группы L, удовлетворяющий требованиям тео- ремы, не единствен. Однако числа иъ ..., ит, как мы увидим ниже, определены однозначно. Они называются инвариантными множи- телями подгруппы N С L. Задача 4. Доказать, что при гп = п индекс \L: W| конечен и равен произведению инвариантных множителей. Задача 5. Пусть L — решетка в Еп nN — ее подрешетка. Дока- зать, что индекс \L: W| равен отношению объемов фундаментальных параллелепипедов решеток N и L. На рисунке 2, иллюстрирующем теорему 5, точками изображены элементы решетки L С Е2, а кружками — элементы подрешетки N. Векторы и е2 составляют базис решетки L, удовлетворяющий тре- бованиям теоремы; при этом Uj = 1, и2 = 4. Изучим теперь строение произвольных конечно порожденных абелевых групп. Для этого нам понадобится понятие прямой суммы абелевых групп. Определение 4. Говорят, что (аддитивная) абелева группа А разлагается в прямую сумму подгрупп Аь ..., Ак, если каждый эле-
§ 1. Конечно порожденные абелевы группы 381 © • © • © © © ©•©•©• Рис. 2 мент a G А единственным образом представляется в виде а = аг 4-... ... + ак, где af G Af. При этом пишут В случае двух подгрупп А1? А2 единственность представления лю- бого элемента аеА в виде а = аг + а2 (ai а2еА2) равносильна тому, что Aj П А2 = 0. Определение 5. Прямой суммой (аддитивных) абелевых групп Аь ..., Ак называется абелева группа Aj ф ... ф Ак, составленная из всех последовательностей (аь ..., ак), где aI G А,, с покомпонентной операцией сложения. Так, например, 2£ф...ф%=%п. Отметим, что если группы Аь ... И ..., Ак конечны, то |А1Ф...ФАк| = |А1|...|Ак|. Прямую сумму в смысле определения 4 называют внутренней, а в смысле определения 5 — внешней. Эти два понятия связаны между собой так же, как в случае векторных пространств (см. § 8.2). Вслучае мультипликативных абелевых групп Gb ..., Gk обычно говорят не о прямой сумме, а о прямом произведении и пи- шут Gj х ... х Gk. Это согласуется с общим определением прямого произведения групп, которое будет дано в § 10.1. Рассмотрим вначале разложения циклических групп в прямую сумму (циклических) подгрупп. Напомним, что всякая бесконечная циклическая группа изо- морфна аддитивной группе Z, а всякая конечная циклическая
382 Глава 9. Коммутативная алгебра группа порядка п изоморфна аддитивной группе Zn вычетов по модулю п. Задача 6. Доказать, что группа Z не может быть разложена в прямую сумму двух ненулевых подгрупп. Предложение 2. Пусть п = п!...пр где числа nlt...,ns попарно взаимно просты. Тогда отображение V: Zn —>Zni ©... ©Z„s, [a]n ([а]П1,..., [a]ns), является изоморфизмом групп. Доказательство. Из определения сложения в группах вычетов и в прямой сумме следует, что — гомоморфизм. Найдем его ядро. Ясно, что (р([а]п) = 0 тогда и только тогда, когда а делится на каж- дое из чисел пъ ..., ns. Так как эти числа попарно взаимно просты, то это имеет место, только если а делится на Пр.-п, = п, т.е. если [а]п = 0. Таким образом, Кег ср = 0 и, значит, — инъективный гомо- морфизм. Так как порядки групп Zn и Zni ф... Ф Z„s равны, то отсюда следует, что ср — изоморфизм. □ Замечание 3. Доказанное утверждение носит название китай- ской теоремы об остатках и обычно формулируется следующим образом: если числа пь ..., ns попарно взаимно просты, то система сравнений х = mt (mod nf) (i = 1,..., s) имеет решение при любых mp ...,rns. Задача 7. Найти прообразы элементов [1]3 G Z3 и [1]5gZ5 при изоморфизме : Z15 —> Z3 ф Z5, построенном, как в предложении 2. Следствие. Если п = р^...pss—разложение числа п на простые множители, то Zn — Z *1 ф... ф Z ks. (7) Р] Ps Задача 8. Доказать более сильную версию китайской теоремы об остатках, не предполагающую попарной взаимной простоты чи- сел пъ ..., ns: система сравнений х = т( (mod nt) (i = 1, ...,s) имеет решение тогда и только тогда, когда тг = гп, (mod (пь п,)) при лю- бых i, j. Определение 6. Конечная группа, порядок которой есть сте- пень простого числа р, называется примарной, или р-группой. Таким образом, всякая конечная циклическая группа разлагает- ся в прямую сумму примарных циклических подгрупп. Задача 9. Доказать, что примарная циклическая группа не мо- жет быть разложена в прямую сумму двух ненулевых подгрупп.
§ 1. Конечно порожденные абелевы группы 383 Теорема 6. Всякая конечно порожденная абелева группа А разла- гается в прямую сумму примарных и бесконечных циклических под- групп, причем набор порядков этих подгрупп определен однозначно. Доказательство. Пусть {аь ап} — система порождающих группы А. Рассмотрим гомоморфизм ср: Zn—>А, (къ ...,kn)^k1a1 + ... + knan. По теореме о гомоморфизме А Zn/N, где N = Ker<p. По теоре- ме 5 существует такой базис {еь еп} группы Zn и такие натураль- ные числа ult ...,ит (т^п), что {и^,..., итет} — базис группы N и щ | п1+1 при i = 1,..., т — 1. Рассмотрим гомоморфизм гр: Zn->ZU] ©...©ZUw©Z©...©Z, п—т ^1^1 4"... 4"Inen ([/i]U1, •••> lm+l> •••> Очевидно, что Кег гр = N. Отсюда следует, что A^ZU1 ф... ©ZU)i ©Z©... ©Z. (8) n-m (Если Uj = ... = uq = 1, то первые q слагаемых имеют вид Zj =Z/Z = 0 и их следует отбросить.) Таким образом, группа А разлагается в прямую сумму цикли- ческих подгрупп. Каждое конечное слагаемое этого разложения, в свою очередь, может быть разложено в прямую сумму примарных циклических подгрупп. Тем самым получится требуемое разложе- ние группы А. Перейдем к доказательству единственности. Пусть (c)q обозна- чает циклическую группу порядка q с порождающим элементом с. Предположим, что группа А каким-то образом разложена в прямую сумму примарных и бесконечных циклических подгрупп: A ® ••• ® {Cs)P^s ® (с$+1)оо Ф ... ® (с$+г) 00 (9) (среди простых чисел рь...,р5 могут быть одинаковые). Рассмот- рим так называемую подгруппу кручения Tor А = {a G А: та = 0 для некоторого т G Z, т / 0}. (10) Очевидно, что Тог А есть сумма первых $ слагаемых разложения (9). Следовательно, А/Tor A~Zf. Так как определение подгруппы Тог А
384 Глава 9. Коммутативная алгебра не зависит от разложения (9), то тем самым показано, что число t не зависит от этого разложения. Далее, для каждого простого числа р можно рассмотреть подгруп- пу р-кручения ТоГр А = {аеА: рка = 0 для некоторого к GZ+}. (11) Очевидно, что Тогр А есть сумма тех конечных слагаемых разложе- ния (9), порядки которых суть степени р. Поэтому сумма этих сла- гаемых не зависит от разложения (9). Тем самым доказательство единственности сводится к случаю, когда А — примарная группа. Пусть |А| = рк и группа А каким-то образом разложена в прямую сумму циклических подгрупп: А = (q)рк} Ф... ф {сг)ркг (к т . + кг = к). (12) Докажем индукцией по к, что набор чисел {кь ..., кг} не зависит от разложения (12). При к = 1 утверждение очевидно. При к > 1 рассмотрим под- группу рА = {ра: а€А}сА. Очевидно, что pA = (pcj)ph-i Ф...Ф(рсг)р1г->; в частности, при к, = 1 соответствующее слагаемое просто исчезает. Так как определение подгруппы рА не зависит от разложения (12), то по предположению индукции набор отличных от единицы чисел кь ..., кг не зависит от этого разложения. Что касается единиц, то их количество может быть определено из соотношения кг +... + кг = к и потому также не зависит от разложения (12). □ Замечание 4. Сами подгруппы разложения (12) при г > 1 опреде- лены не однозначно. Например, при кг =... = kr = 1 группу А можно рассматривать как r-мерное векторное пространство над полем Zp, и ее разложение в прямую сумму циклических подгрупп — это то же самое, что разложение векторного пространства в прямую сумму одномерных подпространств, которое, очевидно, не единственно. Замечание 5. Если группа А конечна, то в ее разложении не мо- жет быть бесконечных слагаемых и, значит, она разлагается в пря- мую сумму примарных циклических подгрупп. Условие п, | не было использовано в доказательстве теоремы. Однако оно позволяет восстановить числа и19..., ит) т. е. инвариант-
§ 1. Конечно порожденные абелевы группы 385 ные множители подгруппы N с по числу п и порядкам слагае- мых разложения (9) и тем самым доказать, что инвариантные мно- жители подгруппы свободной абелевой группы L не зависят от вы- бора базиса группы L, удовлетворяющего требованиям теоремы 5. А именно, анализируя доказательство теоремы 6, мы видим, что для каждого простого числа р степень, в которой оно входит в разло- жение ит, равна максимальной степени р среди чисел pf1, ...,pfs; степень, в которой число р входит в разложение равна его максимальной степени среди оставшихся чисел pf1,..р$5 и т. д. Тем самым числа щ, ...}ит определяются однозначно. В частности, всякая конечная абелева группа А допускает разло- жение А=(а1)Ц]Ф...Ф(аг)и„, (13) в котором щ | ui+1 при i = 1,..., т - 1. Можно считать, что иг / 1; иначе какое-то число первых слагаемых можно было бы отбросить. При этом условии числа и19..., ит определены однозначно. Они на- зываются инвариантными множителями группы А. Их произведе- ние равно |А|. Последний инвариантный множитель имеет простой смысл. Определение 7. Наименьшее общее кратное порядков элемен- тов конечной группы называется ее экспонентой. Следствие 4 теоремы 4.5.1 показывает, что экспонента любой конечной группы делит ее порядок. Предложение 3. Экспонента конечной абелевой группы А равна ее последнему инвариантному множителю ит. Доказательство. Ясно, что ита = 0 для любого а € А. Это озна- чает, что экспонента группы А делит ит; но так как в А имеется циклическая подгруппа порядка ит, то экспонента равна ит. □ Следствие. Конечная абелева группа А является циклической тогда и только тогда, когда ее экспонента равна ее порядку Доказательство. Группа А является циклической тогда и только тогда, когда в разложении (13) имеется только одно слагаемое, но это как раз и означает, что ит = |А|. □ Этот критерий цикличности конечной абелевой группы имеет интересное приложение. Теорема 7. Любая конечная подгруппа мультипликативной груп- пы поля (в частности, мультипликативная группа всякого конечно- го поля) является циклической.
386 Глава 9. Коммутативная алгебра Доказательство. Пусть G — конечная подгруппа мультиплика- тивной группы поля К. Предположим, что ее экспонента равна гп. Тогда gm = 1 для всех g € G. Так как уравнение хт = 1 имеет в поле К не более т решений, то |G| $ т и, значит, |G| = т. □ Задача 10. Найти какие-нибудь порождающие элементы групп Задача 11. Доказать, что для любого простого р И 2 группа Z*k обратимых элементов кольца Zp* является циклической. (Указание: доказать, что элемент [р + 1]р* этой группы имеет порядок рк-1.) Задача 12. Доказать, что группа Z2* обратимых элементов коль- ца Z2* не является циклической при к > 2; более точно, Z2* = (3) х X (— 1) — Z2k-2 ©Z2. Пример 3. При нечетном простом р группа Z* является цикли- ческой группой четного порядка и, следовательно, квадраты ее эле- ментов образуют подгруппу индекса 2. Поэтому отображение, ста- вящее в соответствие каждому квадратичному вычету по модулю р число 1, а каждому квадратичному невычету — число —1, является гомоморфизмом группы Z* в (мультипликативную) группу {±1}. Образ вычета [к]р при этом отображении обозначается через и называется символом Лежандра. Вычет [~1]р является единственным элементом порядка 2 в груп- пе Z*. Он является квадратом тогда и только тогда, когда в этой группе имеется элемент порядка 4, т.е. когда |Z*| = р - 1 делится на 4. Таким образом, Задача 13. Доказать, что многочлен х4 +1 приводим над любым конечным полем. (Указание: доказать вначале, что хотя бы один из элементов —1, 2, —2 является квадратом в этом поле.) § 2. Идеалы и факторкольца Обобщая конструкцию кольца вычетов Zn, изложенную в §1.5, можно рассматривать отношения эквивалентности, согласованные с операциями, в произвольных кольцах. Так как кольцо — это преж- де всего абелева группа по сложению, то такое отношение должно быть отношением сравнимости по модулю некоторой аддитивной
§ 2. Идеалы и факторкольца 387 подгруппы (см. §4.5, в частности, задачу 4.5.3). Выясним, какой должна быть эта подгруппа для того, чтобы отношение эквивалент- ности было согласовано с умножением. Пусть А — кольцо и I с А — его подгруппа по сложению. Предложение 1. Отношение сравнимости по модулю I согласо- вано с умножением тогда и только тогда, когда подгруппа I инвари- антна относительно умножений слева и справа на любые элементы из А. Последнее означает, что для любых х е I и а € А должны иметь ме- сто включения axel и ха el. Аддитивная подгруппа I, удовлетворя- ющая этим условиям, называется (двусторонним) идеалом кольца А. Подгруппа, удовлетворяющая первому (соответственно второму) из этих условий, называется левым (соответственно правым) идеалом. Понятно, что в коммутативном кольце нет разницы между левыми, правыми и двусторонними идеалами. Доказательство. Пусть отношение сравнимости по модулю I со- гласовано с операцией умножения. Тогда для любого а е А x = 0(modZ) => ах = а-0 = 0 (mod I). Это означает, что I — левый идеал. Аналогично доказывается, что I — правый идеал. Обратно, пусть I — идеал, и пусть а = а' (mod I), b = b' (mod I), t. e. a' = a + x, b' = b + y (x,yel). Тогда a'b' = ab + ay + xb + xy = ab (mod I). □ Итак, если I — идеал кольца А, то на факторгруппе А/I можно определить операцию умножения по правилу (a + I)(b + I) = ab + I. Легко видеть, что эта операция дистрибутивна относительно сложе- ния. Построенное таким образом кольцо называется факторколь- цом кольца А по идеалу I и обозначается А/I. Если кольцо А комму- тативно, ассоциативно или обладает единицей, то и факторкольцо обладает соответствующим свойством.
388 Глава 9. Коммутативная алгебра Пример 1. В поле нет нетривиальных (т. е. отличных от нуля и всего поля) идеалов. В самом деле, если х — ненулевой элемент поля К, то всякий элемент поля К может быть представлен в виде ах, где а еК, и поэтому всякий идеал, содержащий х, совпадает с К. Пример 2. Всякая аддитивная подгруппа кольца Z имеет вид nZ, где п е Z+ (см. пример 4.3.10), и является идеалом. Факторкольцо Z/nZ при и00 — это не что иное, как кольцо вычетов Zn. Примеры идеалов в других кольцах мы рассмотрим несколько позже, а сейчас покажем, каким образом идеалы и факторкольца возникают при рассмотрении гомоморфизмов колец. Отображение f кольца А в кольцо В называется гомоморфизмом, если оно сохраняет операции, т. е. если /(х + у)=/(х)+/(у), /(лу)=/(х)/(у) для любых х, у еА. Образ 1т/ гомоморфизма / является подколь- цом кольца В, а его ядро Кег/ = {хбА:/(х) = 0} — идеалом кольца А. Согласно определению факторкольца А/Z, отображение я: А —> А/I, а *-> а + Z, является гомоморфизмом. Оно называется каноническим гомомор- физмом кольца А на факторкольцо А/Z. Его ядром, очевидно, явля- ется идеал Z. Имеет место следующая теорема о гомоморфизме колец, анало- гичная теореме о гомоморфизме групп (теореме 4.6.1). Теорема 1. Пусть f:A—>B — гомоморфизм колец. Тогда 1т/~А/Кег/. Более точно, имеется изоморфизм А/Кег/, ставящий в соответствие каждому элементу b = f(a) G Im f смеж- ный класс я (а) = а + Кег/. Доказательство. Благодаря теореме 4.6.1 мы уже знаем, что отображение ip является изоморфизмом аддитивных групп. Оста-
§ 2. Идеалы и факторкольца 389 ется только проверить, что оно сохраняет операцию умножения. Пусть /(х) = и и f(y) = v. Тогда f(xy) = ии и = л(ху) = я(х) л(у) = (/?(u)(/?(v). □ Пример 3. Рассмотренная нами в § 3.6 редукция по модулю р является гомоморфизмом кольца Z[t] на кольцо Zp [t]. Его ядро есть идеал pZ[t], образованный многочленами, все коэффициенты кото- рых делятся на р. Следовательно, Z[t]/pZ[t]^Zp[t]. Пример 4. Пусть К — поле и с G К — его фиксированный эле- мент. Как мы фактически доказали в § 3.1, отображение K[t] ->К, /-/(с), является гомоморфизмом колец. В силу теоремы Безу его ядро состо- ит из всех многочленов, делящихся на t — с. Следовательно, K[t]/(t-c)K[t]^K. Пример 5. Пусть г2 4- pt 4- q G IR[t] — квадратный трехчлен с от- рицательным дискриминантом и с G С — один из его мнимых кор- ней. Отображение R[t]—>С, /~/(с), является гомоморфизмом колец. Его образ совпадает с С, а ядро состоит из всех многочленов с вещественными коэффициентами, делящихся на (t - с) (t - с) = t2 4- pt 4- q. Следовательно, K[t]/(t2 + pt + q)K[t]^C. В случае, когда А — алгебра над полем К, в определении (левого, правого или двустороннего) идеала I требуется, чтобы он выдержи- вал также умножение на элементы поля К, т. е. был подпростран- ством. Если I — (двусторонний) идеал алгебры А, то в факторкольце А/I определяется операция умножения на элементы поля К по пра- вилу A(a+Z) = Aa + Z и тем самым оно превращается в алгебру над К, называемую фак- торалгеброй алгебры А по идеалу I.
390 Глава 9. Коммутативная алгебра Замечание 1. Если А — алгебра с единицей 1, то идеалы алгеб- ры А — это то же, что идеалы кольца А. В самом деле, пусть I — левый идеал кольца А. Тогда для любых х GI и Л G К имеем Ax = (A1)xgZ. Это означает, что I — подпространство и, следовательно, — левый идеал алгебры А. Аналогично обстоит дело с правыми идеалами. Пример 6. Непосредственно проверяется, что матрицы, у кото- рых все столбцы, кроме первого, равны нулю, образуют левый идеал в алгебре Ln(K) матриц порядка п. Аналогично, матрицы, у кото- рых все строки, кроме первой, равны нулю, образуют правый иде- ал. Однако нетривиальных двусторонних идеалов в алгебре Ln(K) нет. В самом деле, пусть I с Ln (К) — ненулевой двусторонний идеал и А = (ai}) — ненулевая матрица из этого идеала. Предположим, что ам 0. Для любых i, j имеем EikAEij ак1Еу G Z, и, значит, EijEL Следовательно, Z = Ln(K)« Пример 7. Нильтреугольные матрицы образуют идеал в алгебре всех треугольных матриц. Пример 8. Функции, обращающиеся в нуль в заданной точке xogX, образуют идеал в алгебре F(X, К) всех функций на множе- стве X со значениями в поле К, Отображение f алгебры А в алгебру В называется гомоморфиз- мом, если оно линейно и сохраняет операцию умножения, т. е. /(лу)=/(х)/(у) для любых х, у G А. Образ 1т/ гомоморфизма / является подалгеб- рой алгебры В, а его ядро Кег / — идеалом алгебры А. Для любого идеала I алгебры А определяется канонический гомо- морфизм л::А—*А/1, а—>а + 1, ядром которого является I. Имеет место теорема о гомоморфизме алгебр, формулируемая точно так же, как теорема о гомоморфизме колец. Пример 9. Отображение, ставящее в соответствие каждой тре- угольной матрице ее диагональную часть, является гомоморфиз- мом алгебры треугольных матриц на алгебру диагональных матриц. Ядром этого гомоморфизма служит идеал нильтреугольных матриц.
§ 2. Идеалы и факторкольца 391 Следовательно, факторалгебра алгебры треугольных матриц по идеалу нильтреугольных матриц изоморфна алгебре диагональных матриц. Пример 10. Отображение, ставящее в соответствие каждой фун- кции f eF(X, К) ее значение в точке х0 GX, является гомоморфиз- мом алгебры F(X, К) на поле К, рассматриваемое как (одномерная) алгебра над самим собой. Его ядром служит идеал /(х0) функций, обращающихся в нуль в точке х0. Следовательно, F(X,K)//(x0)^K. Используя понятие прямой суммы абелевых групп (см. § 1) и век- торных пространств (см. §8.2), определим прямые суммы колец и алгебр. Определение 1. Говорят, что кольцо (соответственно алгебра) А разлагается в прямую сумму своих подколец (соответственно подал- гебр) Аь ..., Ак, если 1) оно разлагается в прямую сумму Аь..., Ак как аддитивная группа (соответственно как векторное пространство); 2) AiAj = Q при i^j. Последнее условие (при наличии условия 1) равносильно тому, что Alf...,Ak— идеалы. Оно обеспечивает следующее «покомпо- нентное» правило умножения: (Xi +... +хк)(у! +... +ук) = х1у1 +... + хкук (х„ У, € А,). Пусть теперь Аь ..., Ак — какие-то кольца или алгебры. Определение 2. Прямой суммой колец (соответственно алгебр) Аъ ..., Ак называется их прямая сумма Аг Ф... $ Ак как аддитивных групп (соответственно как векторных пространств) с покомпонент- ной операцией умножения: (хъ ...,хк)(У1, ...,Ук) = (х1у1, ...,хкук) (Xi.y eAi). Очевидно, что определенная таким образом операция умноже- ния в Aj Ф ... Ф Ак дистрибутивна по отношению к сложению (со- ответственно билинейна), так что Aj ф ... ф Ак действительно явля- ется кольцом (соответственно алгеброй). Если все кольца Аь ..., Ак коммутативны, ассоциативны или обладают единицей, то и их пря- мая сумма обладает соответствующим свойством. Прямая сумма колец или алгебр в смысле определения 1 назы- вается внутренней, а в смысле определения 2 — внешней. Между
392 Глава 9. Коммутативная алгебра этими двумя понятиями имеется такая же связь, как и в случае векторных пространств. Пример 11. Пусть п = п1...п5, где числа пь rts попарно взаим- но просты. Тогда отображение zn^znie...ezns, (14) рассмотренное в предложении 1.2, является не только изоморфиз- мом групп, но и изоморфизмом колец. Оно индуцирует изоморфизм мультипликативных групп обратимых элементов этих колец: (15) Задача 1. Используя результат примера 11, получить следующую формулу для функции Эйлера (см. пример 4.5.6): где pi,..., ps — все (различные) простые делители числа п. Задача 2. Доказать, что группа Z* является циклической тогда и только тогда, когда п = 2,4, рк или 2рк, где р — нечетное простое число. (Указание: использовать задачи 1.11 и 1.12.) Задача 3. Доказать, что для составного п утверждение «ап-1 = = 1 (mod п) для любого целого а, взаимно простого с п» (наивный аналог малой теоремы Ферма: см. пример 4.5.6) может быть верно, только если п является произведением не менее трех различных нечетных простых чисел, и что наименьшее составное п, для кото- рого это утверждение верно — это 561. Пример 12. Отображение, ставящее в соответствие каждой диа- гональной матрице последовательность ее диагональных элемен- тов, является изоморфизмом алгебры диагональных матриц поряд- ка п над полем К на прямую сумму п экземпляров поля К. Начиная с этого момента, будем предполагать, что А — ком- мутативное ассоциативное кольцо с единицей. Для любого подмножества S с А совокупность всех «линейных комбинаций» CllXi + ... + атХт (Xj, ..., Хт G S, Gy, ..., dm Е А) является наименьшим идеалом, содержащим S. Оно называется иде- алом, порожденным подмножеством S, и обозначается через (S). В частности, идеал (и), порожденный одним элементом и, называ- ется главным.
§ 2. Идеалы и факторкольца 393 Определение 3. Целостное кольцо, в котором всякий идеал яв- ляется главным, называется кольцом главных идеалов. В частности, всякое поле по тривиальным причинам является кольцом главных идеалов. Теорема 2. Всякое евклидово кольцо является кольцом главных идеалов. Доказательство. Очевидно, что нулевой идеал является глав- ным. Пусть I — ненулевой идеал кольца А, и пусть и — наименьший по норме ненулевой элемент идеала I. Остаток при делении на и любого элемента идеала I принадлежит I и, следовательно, может быть только нулем. Это означает, что I = (и). □ Таким образом, кольца Z и К[с] (где К — поле) являются кольца- ми главных идеалов. Замечание 2. Легко видеть, что свойство «всякий идеал являет- ся главным» сохраняется при переходе к факторкольцу. Однако фак- торкольцо кольца главных идеалов не обязано быть кольцом глав- ных идеалов в смысле нашего определения, так как в нем могут по- явиться делители нуля. Так, в кольце Zn = Z/nZ все идеалы главные, но оно является кольцом главных идеалов только при простом п (когда оно является полем). Замечание 3. Существуют кольца главных идеалов, не являющиеся ни полями, ни евклидовыми кольцами, например, кольцо чисел вида a + b J-19, где a, beZ или а, beZ + Свойства делимости, доказанные в § 3.5 для евклидовых колец, обобщаются на произвольные кольца главных идеалов. Теорема 3. В кольце главных идеалов А для любых элементов х, у существует наибольший общий делитель d, и он может быть представлен в виде d = ax + by, где a, be А. Доказательство. Рассмотрим идеал (х, У) = {a* + by: a, be А}, порожденный элементами х и у. Существует такой элемент de А, что (х, у) = (d). Это и будет наибольший общий делитель эле- ментов х и у. По самому построению он представляется в виде d = ax + by. □ Замечание 4. Обозначение (х, у) для идеала, порожденного эле- ментами х и у, хорошо согласуется с обозначением (х, у) для их наибольшего общего делителя.
394 Глава 9. Коммутативная алгебра Теорема о существовании и единственности разложения на про- стые множители также справедлива в любых кольцах главных иде- алов. В самом деле, доказательство единственности, данное в § 3.5 для евклидовых колец, с учетом теоремы 3 дословно переносится на кольца главных идеалов. Что касается существования, то оно будет позже доказано для гораздо более широкого класса колец (см. тео- рему 7.1). Следующая теорема является обобщением теоремы 1.5.1. Теорема 4. Пусть и — ненулевой необратимый элемент кольца главных идеалов А. Факторкольцо А /(и) является полем тогда и только тогда, когда элемент и прост. Доказательство. Для всякого a G А будем обозначать через [а] смежный класс а + (и) € А/(ц). Если и = vu>, где и и ш необратимы, то [у] [ш] =0, но [у], [ш] 00, так что в кольце А/(и) есть делители нуля и, стало быть, оно не является полем. Обратно, если элемент и прост, то для всякого х ф (и) элемен- ты х и и взаимно просты и, следовательно, существуют такие а и Ь, что ах + bu = 1. Переходя к смежным классам, получаем [а] [х] = 1 в А/(и). Таким образом, всякий ненулевой элемент кольца А/(и) обратим и, значит, оно является полем. □ Пример 13. Выясним, когда простое число р является простым элементом кольца Z[i] целых гауссовых чисел (см. пример 3.5.1). Так как Z[i] ^Z[t]/(t24-1) (ср. пример 5), то Z[i]/(p) — Z[t]/(t2 +1, р) *Zp[t]/(t2 +1) (см. пример 3). Согласно примеру 1.3, многочлен г2 4-1 неприводим над Zp тогда и только тогда, когда р = -1 (mod 4). Двукратное при- менение теоремы 4 показывает, что последнее условие и является необходимым и достаточным для того, чтобы элемент р был прост BZ[i]. Пусть р = 1 (mod 4), и пусть р = Яр..ns (s 2) — разложение р на простые множители в кольце Z[i]. Переходя к нормам, получаем N(^1)...N(7ts)=N(p)=p2, откуда s = 2 и N(^j) = ЛГ(л2) = р. Если = а + Ы (a, b G Z), то а2 4- Ь2 = р (и л2 = а — bi). Таким образом, всякое простое число вида 4k 4-1 представимо в виде суммы квадратов двух целых чисел. Задача 4. Доказать, что простые элементы кольца Z[i] — это, с точностью до ассоциированности, простые натуральные числа
§ 3. Модули над кольцами главных идеалов 395 вида 4k 4- 3, числа вида а + Ы (a, b G N), где а2 4- Ь2 есть простое натуральное число вида 4k 4-1 и число 14- i. Задача 5. Пользуясь однозначностью разложения на простые множители в кольце Z[i], доказать, что натуральное число п пред- ставимо в виде суммы квадратов двух целых чисел тогда и только тогда, когда в его разложение на простые множители (в Z) все множители вида 4k 4- 3 входят в четной степени, и найти число таких представлений в этом случае. Следующая теорема является обобщением примера 11. Теорема 5. Пусть и, и — взаимно простые элементы кольца главных идеалов А. Тогда Al(uv}^Al(u)QAl(y). (16) Доказательство. Отображение /: А -* А/(и) ФА/(у), а (а 4- (и), а 4- (п)), является гомоморфизмом колец. Пусть а и Ь — такие элементы коль- ца А, что аи 4- bv = 1. Тогда / (Ьи) = (1 + (ц), 0 + (у)), /(ап) = (0 4- (u), 1 + (п)), откуда следует, что гомоморфизм / сюръективен. Очевидно, что Кег/ = (пп). Это и дает изоморфизм (16). □ Пример 14. Если f eK[t] — неприводимый многочлен над по- лем К, то факторкольцо К[г]/(/) является полем. Например, фактор- кольцо R[t]/(t2 4-1) изоморфное (см. пример 5). Напротив, если f = (t — c{).,.[t — cn)i где q, ...,сп различны, то из теоремы 5 следует, что (см. пример 4). § 3. Модули над кольцами главных идеалов Ввиду свойств (1)—(3) на абелевы группы можно смотреть как на «векторные пространства над Z». Аналогичным образом можно определить «векторные пространства» и над более общими кольца- ми. Они называются модулями.
396 Глава 9. Коммутативная алгебра Понятие модуля оказывается очень полезным. В частности, тео- рия модулей над кольцами главных идеалов, которая будет изложе- на в настоящем параграфе, включает в себя теорию конечно по- рожденных абелевых групп, которой был посвящен § 1, и теорему о приведении матрицы линейного оператора к жордановой форме. Начнем, однако, с общих понятий. Пусть А — ассоциативное кольцо с единицей. Определение 1. (Левым) A-модулем (или модулем над А) назы- вается аддитивная абелева группа М с операцией умножения (сле- ва) на элементы кольца А, обладающей следующими свойствами: 1) а(х + у) = ах + ау для любых a G А, х, уеМ; 2) (а 4- Ь)х = ах + Ьх для любых а, be А, хеМ; 3) (ab)x = a(bx) для любых а, be А, хеМ; 4) 1х = х для любого хеМ. В частности, модули над полем — это векторные пространства; модули над Z — это просто аддитивные абелевы группы. Имеются, однако, и другие важные примеры модулей. Пример 1. Модуль над кольцом многочленов К [t] (К — поле) — это векторное пространство над К с линейным оператором, играю- щим роль умножения на с. Пример 2. Кольцо А является модулем над самим собой (произ- ведение элемента модуля на элемент кольца определяется как про- изведение этих элементов в кольце). Пример 3. Всякое векторное пространство V тавтологическим образом является модулем над кольцом L(V) всех линейных опера- торов в V. Замечание 1. Аналогичным образом определяются правые модули. Раз- ница состоит в том, что в этом случае элементы кольца А пишутся в произве- дении справа от элементов модуля и соответственно этому при умножении на произведение элементов кольца элемент модуля умножается сначала на первый множитель (а не на второй, как в случае левых модулей). Если кольцо А коммутативно, то разницы между левыми и правыми модулями нет (и элементы кольца могут писаться в произведении с любой стороны от элементов модуля). Подмножество N модуля М называется подмодулем, если оно за- мкнуто относительно сложения и умножения на элементы кольца А. Всякий подмодуль является модулем относительно тех же операций. Пример 4. Подмодуль абелевой группы, рассматриваемой как Z-модуль — это просто подгруппа.
§ 3. Модули над кольцами главных идеалов 397 Пример 5. Подмодуль К [г]-модуля (см. пример 1) — это подпро- странство, инвариантное относительно оператора умножения на с. Пример 6. Подмодуль кольца А, рассматриваемого как (левый) модуль над самим собой — это левый идеал этого кольца. Так же, как это было сделано для векторных пространств в § 8.2 и для абелевых групп в § 1, определяется (внутренняя и внешняя) прямая сумма модулей. Определим теперь понятие фактормодуля. В A-модуле М отношение эквивалентности R следует считать согласованным с операцией умножения на элементы кольца А, если хух' => ах~ах'. Отношение сравнимости по модулю аддитивной подгруппы N сМ согласовано с операцией умножения на элементы кольца А тогда и только тогда, когда N — подмодуль. В этом случае на факторгруп- пе М/N можно определить операцию умножения на элементы коль- ца А по правилу a(x + N) = ax + N, превратив ее тем самым в A-модуль, называемый фактормодулем модуля М по подмодулю N и обозначаемый через M/N. В частности, таким образом определяется факторпространство V/U векторного пространства V по подпространству U. Фактормо- дули Z-модулей— это то же, что факторгруппы. Отображение f модуля М в модуль N (над тем же кольцом) на- зывается гомоморфизмом, если /(х + у)=/(х)+/(у), /(ах) = а/(х). Обратимый гомоморфизм называется изоморфизмом. Если f:M-+N — какой-либо гомоморфизм модулей, то его об- раз Im/ = {/(x):xGM}cN — подмодуль модуля N, а его ядро Кег f = {xeM: f(x) = 0}cM — подмодуль модуля М.
398 Глава 9. Коммутативная алгебра Для любого подмодуля N С М определяется канонический гомо- морфизм TT.M-+M/N, x->x + N, ядром которого является N. Теорема 1 (о гомоморфизме модулей). Пусть — гомо- морфизм A-модулей. Тогда Im/^M/Кег/. Более точно, имеется изоморфизм <р: Im f^M/Кег/, ставящий в соответствие каждому элементу у = /(х) G 1т/ смеж- ный класс п (х) = х + Кег /. Доказательство. Благодаря теореме 4.6.1 мы уже знаем, что отображение является изоморфизмом аддитивных групп. Оста- ется только проверить, что оно перестановочно с умножениями на элементы кольца А. Пусть /(х) = у. Тогда /(ах) = ау при a G А и (ау) = л (ах) = ал(х) = а<р (у). □ Пусть М — некоторый А-модуль. Для любого подмножества S с М совокупность всех линейных комбинаций ajXj +... + akxk (xt G S, a, G A) есть наименьший подмодуль, содержащий S. Он называется подмо- дулем, порожденным подмножеством S, и обозначается через (S). Ес- ли (S) = М, то говорят, что модуль М порождается подмножеством S или что S — система порождающих модуля М. Модуль, допускаю- щий конечную систему порождающих, называется конечно порож- денным. Модуль, порождаемый одним элементом, называется цикличе- ским. Идеал Ann М = {a G А: аМ = 0} называется аннулятором модуля М. Если АппМ / 0, то модуль на- зывается периодическим. Теорема 2. Всякий циклический A-модуль М изоморфен модулю вида А/I, где I —левый идеал кольца А. Если кольцо А коммутатив-
§ 3. Модули над кольцами главных идеалов 399 но, то идеал I совпадает с Ann М и тем самым определен модулем М однозначно. Доказательство. Пусть М = (х) — циклический A-модуль. Отоб- ражение /: А —>М, а>-*ах, является гомоморфизмом модулей, причем 1т/= М. По теореме о гомоморфизме М^А/I, где I = Кег/. Второе утверждение теоре- мы очевидно. □ Система {х^, ...,хп} элементов модуля М называется линейно независимой, если + ... + апхп = 0 (af G А) только при а! = ... ... ~ап = 0. Линейно независимая система порождающих называет- ся базисом. Конечно порожденный модуль, обладающий базисом, называет- ся свободным. Свободный циклический модуль изоморфен А (как А-модуль). Для конечно порожденных модулей над кольцами главных идеа- лов можно построить теорию, вполне аналогичную теории конечно порожденных абелевых групп. Начиная с этого момента, мы будем предполагать, что А — кольцо главных идеалов. Теорема 3. Все базисы свободного A-модуля L содержат одно и то же число элементов. Доказательство. Пусть р — какой-либо простой элемент коль- ца А. Тогда А/(р)— поле и L/pL — векторное пространство над этим полем. Если {е1? ...,еп}— базис модуля L, то {[ej],..., [еп]} (где [х] обозначает класс х + pL) — базис этого векторного пространст- ва. Следовательно, п = dim L/pL. □ Число элементов базиса свободного модуля L называется его ран- гом и обозначается через rkL. Теорема 4. Всякий подмодуль N свободного A-модуля L ранга п является свободным A-модулем ранга т^п, причем существует такой базис {е1?..., еп} модуля L и такие (ненулевые) элементы и19 ...,ит^А, что {ще1}...,итет}—базис подмодуля N и п1 | ul+1 при i = l, ...,т — 1. Доказательство. Первое утверждение теоремы при п = 1 есть определение кольца главных идеалов; при п > 1 она доказывается точно так же, как для А = Z (см. теорему 1.3). Доказательство второго утверждения, как и в случае А = Z, осно- вано на приведении матрицы С перехода от базиса модуля L к бази-
400 Глава 9. Коммутативная алгебра су модуля N к диагональному виду с помощью элементарных преоб- разований этих базисов. В случае, когда А — евклидово кольцо, элементарными преобра- зованиями базиса A-модуля называются: 1) прибавление к одному элементу другого, умноженного на эле- мент кольца А; 2) перестановка двух элементов; 3) умножение одного элемента на обратимый элемент кольца А. Приведение матрицы С к диагональному виду в этом случае может быть осуществлено так же, как в доказательстве предложе- ния 1.1, с той оговоркой, что минимизировать следует не сам эле- мент сп (что не имеет смысла), а его норму. В общем случае понятие элементарного преобразования следует расширить. Назовем квазиэлементарным преобразованием базиса {х1?..., хр} какого-либо A-модуля замену двух элементов х,- и Xj их линейными комбинациями aXi + bXj, cXj + dXj, где — обратимая матрица с элементами из кольца А. (Обра- тимость матрицы равносильна обратимости ее определителя.) Ясно, что преобразование, обратное к квазиэлементарному, также являет- ся квазиэлементарным и что элементарные преобразования являют- ся квазиэлементарными. Любую пару элементов {х, у} самого кольца А с помощью квази- элементарного преобразования можно привести к виду {d, 0}, где d = (х, у). В самом деле, существуют такие a, b G А, что ах 4- by = d. Рассмотрим матрицу • Она обратима, так как ее опре- делитель равен 1. Соответствующее квазиэлементарное преобразо- вание переводит {х, у} в {d, 0}. Следовательно, если в каком-либо столбце или какой-либо стро- ке матрицы С имеются элементы х, у, то с помощью квазиэлемен- тарного преобразования строк или столбцов из них можно получить элементы d, 0. Такого рода преобразований достаточно, чтобы, сле- дуя в целом доказательству предложения 1.1, привести матрицу С к диагональному виду. □ Изучим теперь строение произвольных конечно порожденных А-модулей.
§ 3. Модули над кольцами главных идеалов 401 Всякий нетривиальный циклический A-модуль изоморфен ли- бо А, либо А/(и), где и — необратимый ненулевой элемент. Если (и, и) = 1, то изоморфизм колец А/(и, и) построенный в доказательстве теоремы 2.5, является, как легко по- нять, и изоморфизмом A-модулей. Следовательно, если и=р^...р^ — разложение элемента и на простые множители, то имеет место изо- морфизм А-модулей A/(u) ^A/CpJ1) ф... ф А/(р^)- (17) Определение 2. Конечно порожденный A-модуль М, аннулятор которого содержит степень простого элемента р е А, называется примарным или, точнее, р-примарным. Таким образом, всякий периодический циклический А-модуль разлагается в прямую сумму примарных циклических подмодулей. Теорема 5. Всякий конечно порожденный А-модуль М разлагает- ся в прямую сумму примарных и свободных циклических подмодулей, причем набор аннуляторов этих подмодулей определен однозначно. Доказательство этой теоремы аналогично доказательству тео- ремы 1.6. В частности, существование требуемого разложения вы- водится из теоремы 4 и изоморфизма (17). Для доказательства его единственности (в указанном смысле) следует рассмотреть подмо- дуль кручения Tor М = {х е М: ах = 0 для некоторого а е А, а 0 0} и, для каждого простого элемента р е А, подмодуль р-кручения Тогр М = {х еМ: ркх = 0 для некоторого к е Z+}. Единственность разложения примарного модуля в прямую сум- му примарных циклических подмодулей доказывается по индукции, как и в случае абелевых групп. Однако соображение, использовав- шее порядок группы, в общем случае не работает. Вместо него мож- но применить следующее соображение: если модуль М разложен в прямую сумму р-примарных циклических подмодулей, то число слагаемых равно размерности подмодуля {х е М: рх = 0} как век- торного пространства над полем А/(р). □
402 Глава 9. Коммутативная алгебра Так же, как и в случае абелевых групп, для всякого периодическо- го A-модуля М одновременно с доказательством теоремы 5 получа- ется, что М^А/(и1)Ф...©А/(иП1), (18) где и1г..., ит —такие необратимые ненулевые элементы кольца А, что щ | ul+1 при i = 1,..., т - 1. Элементы ui9..., ит определены од- нозначно с точностью до умножения на обратимые элементы. Они называются инвариантными множителями модуля М. Очевидно, что AnnM = (um). (19) В случае A = K[t] (К — поле) теорема 5 описывает строение ли- нейных операторов в векторных пространствах над полем К (см. пример 1). Условие конечной порожденное™ заведомо выполняет- ся, если векторное пространство конечномерно. Более того, в этом случае отсутствуют свободные слагаемые, так как свободный цик- лический модуль над K[t] имеет бесконечную размерность над К. Результат выглядит особенно просто, если поле К алгебраически замкнуто. В этом случае примарные циклические модули имеют вид K[t]/((t-A)m) (АеК). Такой модуль является гп-мерным векторным пространством над К с базисом {[(t-A)m-1],.... [t —А], [1]}, где [/(t)] обозначает класс /(t) + ((t — A)m). Оператор умножения на t записывается в этом базисе жордановой клеткой ДА) = т Из предыдущего вытекает Теорема 6. Всякий линейный оператор в конечномерном вектор- ном пространстве над алгебраически замкнутым полем в некото- ром базисе записывается жордановой матрицей, причем эта мат- рица определена однозначно с точностью до перестановки диаго- нальных клеток.
§ 4. Нётеровы кольца 403 Напомним, что первое утверждение этой теоремы было доказа- но другим способом в § 6.4. Из (19) следует, что последний инвариантный множитель К [t]- модуля, ассоциированного с линейным оператором зУ, — это не что иное, как минимальный многочлен оператора л? (ср. теорему 6.5.1). Задача 1. Доказать, что оператор умножения на t в К [t]-модуле K[t]/(h(t)), где h(t) = tn + + ... + ап_^ + ап, имеет в базисе {[t""1], [tn~2],..., [t], [1]} матрицу Г -аг 10 ... 0 ОА -а2 0 1 ... 0 0 -ап_! 0 0 ... 0 1 V -ап 0 0 ... 0 0J а его характеристический многочлен равен h(t). Вывести отсюда, что произведение инвариантных множителей К [t]-модуля, ассоции- рованного с любым линейным оператором а?/, равно характеристи- ческому многочлену оператора а/. Задача 2. Вывести из предыдущей задачи теорему Гамильтона— Кэли (следствие 3 теоремы 6.5.1). Задача 3. Получить канонический вид матрицы линейного опе- ратора над полем вещественных чисел. Задача 4. Получить канонический вид матрицы линейного опе- ратора в четырехмерном векторном пространстве над полем Z2. § 4. Нётеровы кольца Начиная с этого момента и до конца главы термин «кольцо» озна- чает «коммутативное ассоциативное кольцо с единицей». Подколь- ца предполагаются содержащими единицу, гомоморфизмы колец — переводящими единицу в единицу. Естественным расширением класса колец главных идеалов явля- ется класс нётеровых колец. Определение 1. Кольцо А называется нётеровым, если выполня- ется любое из следующих эквивалентных условий: 1) всякий идеал порождается конечным числом элементов; 2) не существует бесконечной строго возрастающей цепочки идеалов/i с/2с... с/п с... (/n/In+i).
404 Глава 9. Коммутативная алгебра Напомним, что идеалом, порожденным элементами хъ ..., хп е А, называется идеал (х1э ...,xn) = {a1x1 + ... + anxn: ...,апеА}. Эквивалентность условий 1) и 2) доказывается следующим обра- зом. Пусть Ц <zl2 с ... — возрастающая последовательность идеалов. 00 Тогда I = |J 1п есть также идеал. Если он порождается конечным П = 1 числом элементов, то все они принадлежат идеалу 1п для некоторого достаточно большого п и, значит, / = /п, так что последовательность не является строго возрастающей. Обратно, если некоторый идеал I не порождается конечным чис- лом элементов, то существует такая последовательность элементов х1? х2,...е/, что последовательность идеалов (х1)с(х1,х2)с... является строго возрастающей. Предложение 1. Всякое факторкольцо А/I нётерова кольца нё- терово. Доказательство. Пусть J — идеал кольца А/I. Тогда его пол- ный прообраз при каноническом гомоморфизме я: А—*А/1 явля- ется идеалом кольца А, и если этот идеал порождается элемен- тами хь ...,хп е А, то идеал J порождается элементами лСхД ... ...,я(хп). □ Конечно порожденные модули над произвольными нётеровыми кольцами устроены не так просто, как над кольцами главных идеа- лов. Однако следующая теорема показывает, что и они в некотором смысле похожи на конечномерные векторные пространства. Теорема 1. Всякий подмодуль N конечно порожденного модуля М над нётеровым кольцом А конечно порожден. Замечание 1. В случае М = А (т. е. когда М — свободный цик- лический модуль) утверждение этой теоремы совпадает с первым определением нётерова кольца. Доказательство. Пусть М = (хъ ..., хп). Докажем утверждение теоремы индукцией по и. При п = 1 можно считать, что М = А//, где I — идеал кольца А (см. теорему 3.2). Тогда N — идеал кольца А/I, и утверждение тео- ремы вытекает из предложения 1. При п > 1 рассмотрим подмодуль = (хь ..., х^) с М и поло- жим Nj = N П Мг. По предположению индукции модуль конечно порожден. Пусть = (yi,..., ук). Фактормодуль N/NT является под-
§ 4. Нётеровы кольца 405 модулем циклического модуля М/Мг и конечно порожден по уже доказанному. Пусть N/N^ = (2^ 4-Np ..., Тогда N = {y1,...,yk,z1,...,zl}. □ Как можно доказать нётеровость какого-либо кольца? Одним из основных инструментов для этого является следующая теорема. Теорема 2 (теорема Гильберта о базисе идеала). Кольцо много- членов А[х] над нётеровым кольцом А нётерово. Доказательство. Пусть I — идеал кольца А[х]. Обозначим через А[х]п совокупность многочленов степени п. Это свободный А-мо- дуль с базисом {1, х, ...,хп}. Положим 1п = /П А[х]п. По теореме 1 00 1п — конечно порожденный A-модуль. Очевидно, что 1= |J 1п. п=0 Обозначим через Jn совокупность коэффициентов при хп всех многочленов из 1п. Очевидно, что это идеал кольца А и что Jn с Jn+1. В силу нётеровости кольца А существует такое т, что Jn = Jm при всех п^т. Поэтому для всякого многочлена feln (п^гп) найдется такой многочлен gelm, что f — xn~mg G 1п_1. Это показывает, что идеал I кольца А[х] порождается своим подмножеством 1т. Следова- тельно, если 1т порождается какими-то многочленами Д,..., Д как A-модуль, то I порождается этими же многочленами как А [х]-мо- дуль. □ Следствие 1. Кольцо многочленов от любого числа переменных над нётеровым кольцом нётерово. Говорят, что кольцо В порождается элементами и1г..., ип над под- кольцом А, если каждый его элемент может быть представлен в ви- де многочлена от и19 ...,ип с коэффициентами из А. В этом случае имеется гомоморфизм /: А[хъ ...,хп] —>В, xi*—^ui (где А[хъ ..., хп] обозначает кольцо многочленов от х1}..., хп с коэф- фициентами из А), и, следовательно, В^А[хъ ...,хп]/Кег/. Часто пишут В = А[и1,..., un], хотя это не означает, что В есть коль- цо многочленов от п независимых переменных (между иъ ...,ип мо- гут быть алгебраические зависимости). Следствие 2. Всякое кольцо, конечно порожденное над нётеро- вым подкольцом, нётерово.
406 Глава 9. Коммутативная алгебра Замечание 2. Имеется следующий «абсолютный» вариант следствия 2, не привязанный ни к какому выделенному подкольцу. Говорят, что кольцо порождается элементами ..., un, если каждый его элемент может быть представлен в виде многочлена от ии ...,ип с целы- ми коэффициентами. В этом случае оно изоморфно факторкольцу кольца Z[xb ...,хп] и, следовательно, является нётеровым. Таким образом, всякое конечно порожденное кольцо нётерово. При работе с кольцами делители нуля, если они есть, часто до- ставляют неприятности. Существуют методы борьбы с ними. Наи- более «злостными» из делителей нуля являются нильпотентные эле- менты. Элемент а кольца А называется нильпотентным, если ат = 0 для некоторого натурального гл. Легко видеть, что совокупность всех нильпотентных элементов является идеалом кольца А. Он называ- ется (нильпотентным) радикалом кольца А и обозначается через rad А. Факторкольцо A/radA уже не имеет нильпотентных элемен- тов (отличных от нуля). Пример 1. Пусть А — кольцо главных идеалов. Найдем rad(A/(u)), где и G А — ненулевой необратимый элемент. Пусть и = р*1 ...р*5 — разложение элемента и на простые множители. Элемент а + (u) G G А/ (и) нильпотентен тогда и только тогда, когда ап G (и) для некото- рого натурального и; но из единственности разложения на простые множители в кольце А следует, что это имеет место тогда и только тогда, когда а делится на Pi...ps. Таким образом, rad (А/(и)) = (рг..р5)/(и). Задача 1. Доказать, что rad (А! ф... ф Ak) = rad Aj Ф... Ф rad Ak. Определение 2. Идеал I кольца А, не равный А, называется про- стым, если факторкольцо А/I не имеет делителей нуля. Это означает, что из ab GI следует, что a GI или b G /. Например, в кольце главных идеалов А ненулевой идеал (р) яв- ляется простым тогда и только тогда, когда р — простой элемент. Идеал I кольца А, не равный А, называется максимальным, если он не содержится ни в каком большем идеале, не равном А. Из вто- рого определения нётерова кольца следует, что в нётеровом кольце имеется хотя бы один максимальный идеал.
§ 5. Алгебраические расширения 407 Предложение 2. Идеал I кольца А максимален тогда и только тогда, когда факторкольцо А/I является полем. Доказательство. Очевидно, что идеал I максимален тогда и только тогда, когда в факторкольце А/I нет нетривиальных идеалов. Мы видели (см. пример 2.1), что в поле нет нетривиальных идеа- лов. Обратно, пусть в каком-то кольце К нет нетривиальных идеа- лов. Тогда для любого ненулевого элемента a G К идеал (а) совпада- ет с К и, в частности, содержит единицу, а это как раз и означает, что элемент а обратим. Следовательно, К — поле. □ Следствие. Всякий максимальный идеал прост. Теорема 3. Радикал нётерова кольца А совпадает с пересечени- ем всех простых идеалов. Доказательство. Если элемент а не нильпотентен, то мы можем построить кольцо Az = A[a-1] дробей вида b/an (be A, neZ+) ана- логично тому, как было построено поле дробей целостного кольца в § 3.10. Ввиду следствия 2 теоремы 2 кольцо А' нётерово. Поэтому в нем имеется какой-то максимальный идеал I'. Так как элемент а обратим в А', то а ф I'. Положим I = /' П А. Тогда кольцо А/I вкла- дывается в поле А'/1' и, следовательно, не имеет делителей нуля. Таким образом, I — простой идеал кольца А, не содержащий а. □ Замечание 3. Используя трансфинитные средства (например, лемму Цорна), легко доказать, что в любом (не обязательно нётеровом) кольце имеется максимальный идеал. Отсюда следует, что и теорема 3 на самом деле справедлива для любых колец. § 5. Алгебраические расширения Если кольцо А является подкольцом кольца В, то говорят, что В — расширение кольца А. В этом случае В — не просто кольцо: оно яв- ляется алгеброй над А, что дает дополнительные возможности для его изучения. (Определение алгебры над кольцом такое же, как над полем.) Введем некоторую терминологию, относящуюся к этой ситуа- ции. Элемент и G В называется алгебраическим над А, если он удовле- творяет некоторому нетривиальному алгебраическому уравнению с коэффициентами из А, и трансцендентным в противном случае. В частности, любой элемент a G А алгебраичен над А, так как он
408 Глава 9. Коммутативная алгебра удовлетворяет линейному уравнению х - а = 0. Кольцо В называет- ся алгебраическим расширением кольца А, если всякий его элемент алгебраичен над А. Более общо, элементы иъ..., ипеВ называются алгебраически зависимыми над А, если они удовлетворяют некоторому нетриви- альному алгебраическому уравнению (с п неизвестными) с коэффи- циентами из А. Совокупность элементов кольца В, которые могут быть представ- лены в виде /(up ..пп), где f — многочлен с коэффициентами из А, является его подкольцом (содержащим А). Оно называется подколь- цом, порожденным над А элементами иъ ..., ип, и обозначается че- рез А[иь ип]. Если Пр ип алгебраически независимы, то оно изоморфно кольцу многочленов от п переменных с коэффициента- ми из А; в общем случае оно изоморфно факторкольцу кольца мно- гочленов по идеалу алгебраических зависимостей между и19..., ип. Расширение В кольца А называется конечно порожденным, если су- ществуют такие элементы и1г..., ипеВ, что В = А[иъип]. Если кольцо В (а, значит, и А) не имеет делителей нуля, то можно рассмотреть поля отношений К = Quot A, L = Quot В и считать, что все действие разворачивается в «большом» поле L. Имеет место сле- дующая диаграмма включений: А с В А А (20) К С L Если элементы и1г..., uneL алгебраически зависимы над К, то они алгебраически зависимы и над А, так как коэффициенты алгеб- раической зависимости можно сделать «целыми», т. е. принадлежа- щими А, умножив всю зависимость на их общий знаменатель. Рассмотрим вначале алгебраические расширения полей. Клю- чом к их пониманию является вводимое ниже понятие конечно- го расширения, а единственной идеей доказательств приводимых ниже утверждений — использование теоремы о том, что всякое подпространство конечномерного векторного пространства конеч- номерно. Если поле L является расширением поля К, то его можно рас- сматривать как векторное пространство над К. Размерность этого векторного пространства обозначается через dimK L.
§ 5. Алгебраические расширения 409 Определение 1. Расширение L поля К называется конечным, ес- ли dimKL < оо. Число dimKL в этом случае называется степенью расширения L. Способ получения конечных расширений полей дается следую- щей теоремой. Теорема 1. Пусть h е К[х] — неприводимый многочлен степе- ни п. Тогда L = K[x]/(h) — конечное расширение поля К, причем dimK L = п. Доказательство. Тот факт, что L — поле, вытекает из общей тео- ремы 2.4. Далее, из возможности и единственности деления с остат- ком в К[х] следует, что всякий элемент из L однозначно представля- ется в виде a0 + a1x + ...+an_1xn-1 + (h) (а^сц, Это означает, что смежные классы l + (h), x + (h), .... x^ + Ch) составляют базис поля L над К, □ Элемент а = х + (h) е L является, очевидно, корнем многочлена h в поле L, причем L = К [а]. Поэтому переход от поля К к полю L назы- вается присоединением к полю К корня неприводимого многочлена h. Расширения описанного типа называются простыми. В § 11.6 мы покажем, что всякое конечное расширение поля нулевой характери- стики является простым (теорема о примитивном элементе). Одна- ко это обстоятельство не играет существенной роли для понимания дальнейшего, и мы пока не будем доказывать (и использовать) эту теорему. Пример 1. Если a G К — элемент, не являющийся квадратом в по- ле К, то поле К [ Уа], получающееся присоединением к К корня мно- гочлена х2 = а, является расширением степени 2, или, как говорят, квадратичным расширением поля К. В частности, R[V-Т] =С. Пусть L — какое-то расширение поля К. Если элемент и G L алгебраичен над К, то совокупность всех многочленов / €К[х], для которых /(и) = 0, является ненулевым идеалом кольца К[х]. Порождающий элемент этого идеала назы- вается минимальным многочленом элемента и и обозначается че- рез ти (ср. определение минимального многочлена линейного опе- ратора в § 6.5). Отметим, что минимальный многочлен неприводим. В самом деле, если ти = fg, то либо f (и) = 0, либо g(u) = 0, так
410 Глава 9. Коммутативная алгебра что один из многочленов f и g должен иметь такую же степень, что и ти. Степень многочлена ти называется степенью элемента и над К. Теорема 2. Элемент ueL алгебраичен над К тогда и только тогда, когда К [и] — конечномерное векторное пространство над К. При этом условии К [и] есть поле и его размерность над К равна степени и над К. Доказательство. Если пространство К [и] конечномерно над К, то оно порождается конечным числом степеней элемента и. Следо- вательно, найдется такое п, что ип линейно выражается через преды- дущие степени, а это и означает, что и алгебраичен над К. Обратно, пусть и — алгебраический элемент степени п над К. То- гда ип линейно выражается через предыдущие степени элемента и. Последовательно умножая это выражение на и и заменяя образу- ющуюся при этом п-ю степень элемента и ее выражением через предыдущие степени, мы получаем, что и любая степень элемента и, а значит, и любой элемент пространства К [и], линейно выражается через 1, п,..., и”"1. Следовательно, dimK К[и] п. Более точно, рассмотрим гомоморфизм ip:K[x]—>L, f^f(u). Его образ есть К [и], а ядро есть идеал, порожденный минимальным многочленом ти элемента и. Следовательно, К[и]^К[х]/(ти). Так как многочлен ти неприводим, то, согласно теореме 1, К [и] есть поле и его размерность над К равна deg ти = п. □ Следствие. Всякое конечное расширение поля является алгебра- ическим. 2л Пример 2. Пусть р — простое число. Так как число ер = cos-h 2 л 1 4- i sin — G С является корнем многочлена хр-1 + ... + х + 1, непри- водимого над Q (пример 3.6.2), то Q[ep] есть расширение степени р - 1 поля Q. Оно содержит все комплексные корни р-й степени из 1 и называется круговым полем (или полем деления круга). Теорема 3. Если L — конечное расширение поля К, а М — конеч- ное расширение поля L,moM — конечное расширение поля К, причем dimK М = dimK L • dimL М.
§ 5. Алгебраические расширения 411 Доказательство. Если {еД — базис расширения L над К, а {/Д — базис расширения М над L, то {еДД — базис расширения М над К. □ Для любых элементов ип G L совокупность элементов по- ля L, которые представимы в виде отношения элементов кольца К[иъ ц„], является подполем, изоморфным Quot К[и1}..., ц„]. Оно называется подполем, порожденным над К элементами щ,... ..., ип, и обозначается через К(иь ..., un). В частности, если ugL— алгебраический над К элемент, то, согласно теореме 2, K(u) = К[ц] (феномен «уничтожения иррациональности в знаменателе»). Если К(и1?..., un) =L, то говорят, что поле L порождается над К элементами ..., ип. Теорема 4. Если поле L порождается над К конечным числом алгебраических элементов ип, то оно является конечным рас- ширением поля К. Доказательство. Рассмотрим «башню расширений» КсК(цД cK(ub ц2) с ...сК(щ, ..., un) = L. Так как К(щ,..., um) = К(и1?..., и элемент ит, будучи ал- гебраичен над К, тем более алгебраичен над К(и1}и^^, то все «этажи» башни являются конечными расширениями. По теореме 3 отсюда следует, что и L — конечное расширение поля К. □ Теорема 5. Пусть L — какое-либо расширение поля К. Совокуп- ность К всех элементов поля L, алгебраических над К, является подполем, алгебраически замкнутым в L. (Последнее означает, что всякий элемент поля L, алгебраиче- ский над К, принадлежит К, т. е. алгебраичен уже над К.) Доказательство. Если и, и еК, то, согласно теореме 4, К(и, и) с СК; в частности, u + v, uv, и~1еК. Это означает, что К — подполе поля L. Пусть и G L — элемент, алгебраический над К, и пусть ..., ип G GK — коэффициенты алгебраического уравнения, корнем которого он является. По теореме 4 К' = К(иъ ..., un) — конечное расширение поля К. Так как элемент и алгебраичен над К', то К'(и) — конечное расширение поля К'. Следовательно, К'(и) — конечное расширение поля К и, значит, К'(и) с К; в частности, u GK. □
412 Глава 9. Коммутативная алгебра Поле К называется алгебраическим замыканием поля К bL. Например, поле всех алгебраических чисел есть алгебраическое замыкание Q поля Q в С. Так как поле С алгебраически замкнуто, то и Q алгебраически замкнуто (в абсолютном смысле, а не только в С). Всякое конечное расширение поля Q называется полем алгебра- ических чисел (так что существует много различных полей алгебраи- ческих чисел). Нетрудно доказать, что всякое поле алгебраических чисел изоморфно подполю поля Q (проделайте это!). В простом расширении поля К, полученном присоединением корня неприводимого многочлена /, этот многочлен не обязан (хотя и может) иметь более одного корня. Если мы хотим получить поле, в котором f разлагается на линейные множители, необходимо, вообще говоря, дальнейшее расширение. Определение 2. Расширение L поля К называется полем разло- жения многочлена f €К[х] (не обязательно неприводимого), если f разлагается в L [х] на линейные множители и поле L порождается над К его корнями. Гомоморфизмы (в частности, изоморфизмы) расширений по- ля К, тождественные на К, называются гомоморфизмами (изомор- физмами) над К. Теорема 6. Поле разложения любого многочлена f еК[х] суще- ствует и единственно с точностью до изоморфизма над К. Для доказательства второй части теоремы нам понадобится Лемма 1. Пусть Р(а) —расширение поля Р, полученное присоеди- нением корня а неприводимого многочлена heP[x], и р— гомомор- физм поля Р в некоторое поле F. Гомоморфизм ip продолжается до гомоморфизма ф: P(a)—>F ровно столькими способами, сколько раз- личных корней имеет в F многочлен №, полученный из многочлена h применением к его коэффициентам гомоморфизма р. Доказательство. Искомое продолжение ф, если оно существует, задается формулой ^(a0 + a1a4-...4-amam) = ^(a0) + ^(ai)^ + ...4-^(am)^m (a0,ai, ...,ameP), (21) где fl =ф(а) — некоторый элемент поля F. Применяя эту формулу к равенству h(a) = 0, получаем, что h* (fl) = 0. Обратно, если fl eF — корень многочлена то формула (21) корректно определяет гомо- морфизм ф: Р(а) -*F. □
§ 5. Алгебраические расширения 413 Доказательство теоремы 6. Рассмотрим последовательность расширений K = KQcK1cK2c...) в которой Ki получается из присоединением корня какого-либо неприводимого множителя ft степени > 1 многочлена f над К^. Так как число неприводимых множителей многочлена f каждый раз увеличивается, то эта последовательность не может быть бес- конечной. Последний ее член Ks = L и является полем разложения многочлена /. Пусть теперь L — другое поле разложения. Построим последова- тельность гомоморфизмов 4>i-.Ki~>L (i = 0,1, ...,s) так, чтобы </>o = id, Vik., =4>i-v Согласно лемме, i-й шаг этого построения будет возможен, если многочлен fi = имеет корень в L. Так как делит f в К^-Дх], то ft делит f в L [х]. Но многочлен f разлагается в L[x] на линейные множители и, следовательно, любой его делитель положительной степени имеет корень в L. Таким образом, искомые гомоморфиз- мы ipi существуют. Последний из них = L — L является изоморфизмом, так как, согласно определению поля раз- ложения, поле L является минимальным расширением поля К, над которым многочлен / разлагается на линейные множители. □ Пример 3. Найдем степень поля разложения L кубического мно- гочлена / = х3 + сцх2 + а2х 4- а3 е К [х], char К / 2. Рассмотрим различные случаи. 1) f имеет 3 корня в К. Тогда L = K. 2) f имеет 1 корень в К. Тогда L — квадратичное расширение поля К. 3) f не имеет корней в К и, следовательно, неприводим над К. Пусть тогда Кд D К — кубическое расширение, полученное присо- единением корня cq многочлена f. Могут представиться два случая: а) / имеет 3 корня в К1; тогда L = К1;
414 Глава 9. Коммутативная алгебра б) / имеет только 1 корень в Кг; тогда L — квадратичное расши- рение поля Кг и, следовательно, dimK L = 6. Для различения случаев За) и 36) рассмотрим дискриминант многочлена /, равный по определению D = (dj - а2')2(а1 - а3)2(а2 - »з)2, где а1? а2) а3 — корни многочлена f в L. (Выражение D через коэф- фициенты многочлена f см. в § 3.9.) Докажем, что если многочлен / не имеет корней в К, то dimK L = 3 тогда и только тогда, когда De К2. Заметим, что если D^K2, то D$K2, так как иначе K(a/D) было бы квадратичным расширением поля К, содержащимся в Klf что невозможно в силу формулы умножения размерностей в башне рас- ширений (теорема 3). Поэтому DeK2 <=> DgKj <=> (aj-a2)(«i-а3)(а2“аз)е^1- Далее, так как cq GK1? а а2 и а3 суть корни квадратного трехчле- на с коэффициентами из Kl9 то (а1-а2)(а1-а3)еК1 и, значит, De К2 <=> а2 — <=> а2, а3еКг <=> Ь = Кг (здесь мы использовали, что char К 0 2). Воспользуемся теперь теоремой 6 для описания всех конечных полей. Всякое конечное поле F имеет характеристику р > 0, являющу- юся простым числом, и его циклическая аддитивная подгруппа, по- рожденная единицей, есть подполе, изоморфное полю вычетов Zp. Мы будем отождествлять это подполе с Ер. Если dimZp F = п, то Н=РП. Таким образом, число элементов любого конечного поля есть сте- пень простого числа. Теорема 7. Для любого простого р и натурального п существу- ет поле из рп элементов и все такие поля изоморфны. Доказательство этой теоремы потребует некоторой подготовки.
§ 5. Алгебраические расширения 415 Пусть F — любое (может быть, бесконечное) поле характеристи- ки р > 0. Рассмотрим отображение 4>:F—>F, х^>хр. Очевидно, что ср(ху) = <р(х)<р(у). Кроме того, как это ни странно, <Р С* + У) = <р С*) + <р (у). Действительно, как мы видели в § 1.5, (х + у)р= £ Скхр~кук = хр+ ур. к=0 Р Таким образом, ср — эндоморфизм (гомоморфизм в себя) поля F. Он называется эндоморфизмом Фробениуса. Так как Кег ср = 0, то Im <р = Fp ы F. Очевидно, что для конечного поля Fp = F, так что эндоморфизм Фробениуса в этом случае являет- ся автоморфизмом. Доказательство теоремы 7. Пусть F — конечное поле из q = рп элементов. Так как мультипликативная группа F* имеет порядок q — 1, то а4"1 = 1 для любого a G F* и, значит, aq = a VaeF. Иначе говоря, все элементы поля F являются корнями многочле- на xq - х. Следовательно, F — поле разложения этого многочлена над Zp. В силу теоремы 6 это показывает, что все поля из q элемен- тов изоморфны. С другой стороны, пусть F — поле разложения многочлена f = = xq —х над Zp. Так как //== — 1, то многочлен f не имеет кратных корней. Его корни — это неподвижные точки автоморфизма <рп по- ля F, где (р — автоморфизм Фробениуса. Легко видеть, что неподвиж- ные точки любого автоморфизма поля образуют подполе. Таким об- разом, совокупность корней многочлена f есть подполе из q эле- ментов в F (и, следовательно, совпадает с F). Тем самым доказано существование поля из q элементов. □ Следствие. Для любого простого р и любого натурального п су- ществует неприводимый многочлен степени п над Zp. Доказательство. Пусть F — поле из q = рп элементов и а — по- рождающий элемент его мультипликативной группы (которая, как известно, циклическая). Тогда F = Zp(a), и, значит, минимальный многочлен элемента а над Zp имеет степень п. □ Поле из q элементов обозначается через Fq. (В частности, Fp = Zp при простом р.)
416 Глава 9. Коммутативная алгебра Пример 4. Единственным неприводимым многочленом второй степени над полем Z2 является многочлен х2 + х + 1. Присоединяя к Z2 корень этого многочлена, мы получаем поле F4. Задача 1. Составить таблицы сложения и умножения в поле F4. Во всяком конечном расширении L поля К, рассматриваемом как векторное пространство над К, можно естественным образом ввести «скалярное умножение». А именно, для любого u GL определим линейный оператор Т(п) в пространстве L по формуле Т(и)х = их (xgL). След этого оператора назовем следом элемента и и обозначим через tru. Очевидно, что след — линейная функция на L. Определим ска- лярное умножение в L по формуле (п, y) = truiL (22) Это симметрическая билинейная функция на L. Если char К = 0, то она невырожденна, так как (п, и-1) = tr 1 = dimK L О для любого ненулевого элемента u GL. Пример 5. Опишем скалярное умножение в поле деления круга Q(ep) = Qkp] (см. пример 2). Как векторное пространство над Q поле Q(sp) порождается элементами 1, ер, е2,..., е£-1, сумма кото- рых равна нулю. Базис этого пространства составляют, например, элементы 1, epj £?,..., ер“2. Записав операторы Т(е£) в этом базисе, легко получить, что tr 1 = р — 1, tre£ = -l (k = l, ...,р-1). Следовательно, р -1 при к 4-1 = 0 (mod р), -1 во всех остальных случаях. Скалярное произведение двух элементов поля Q(ep) вычисляется особенно просто, если один из них представлен в виде рациональ- ной линейной комбинации элементов 1, £р, е2,..., Ер~т с суммой ко- эффициентов, равной нулю (что всегда можно сделать). А именно,
§ 5. Алгебраические расширения 417 Р-1 если хк = 0, то к=0 ,р-\ р-1 х z р-1 X S хк£р> S УкСр = Р *оУо + S хкУр-к \к=о к=0 7 V к=1 7 Часть изложенных выше результатов о расширениях полей мо- жет быть обобщена на расширения нётеровых колец, если надле- жащим образом видоизменить понятия алгебраического элемента и алгебраического расширения. Пусть кольцо В является расширением кольца А. Элемент и G В называется целым алгебраическим или просто целым над А, если он удовлетворяет нетривиальному алгебраическому уравнению с коэф- фициентами из А и со старшим коэффициентом, равным 1. В част- ности, элементы самого кольца А являются целыми над А. Всякий элемент и еВ, алгебраический над А, становится целым после умно- жения на подходящий ненулевой элемент кольца А (а именно, на старший коэффициент алгебраического уравнения с коэффициента- ми из А, которому удовлетворяет п). Кольцо В называется целым расширением кольца А или просто целым над А, если всякий его элемент цел над А. В случае когда А — поле, эти определения эквивалентны опреде- лениям алгебраического элемента и алгебраического расширения. Следующее определение является ключевым. Определение 3. Расширение В кольца А называется конечным, если В является конечно порожденным А-модулем. Ниже формулируются частичные аналоги теорем 2—5 для рас- ширений колец. Их доказательства практически не отличаются от доказательств соответствующих утверждений теорем 2—5. Нужно только слово «базис» всюду заменить на «систему порождающих» и теорему о конечномерности любого подпространства конечномер- ного векторного пространства — на теорему 4.1. Пусть В — какое-то расширение кольца А. Теорема 8. Элемент иеВ цел над А тогда и только тогда, когда А[п] — конечно порожденный А-модуль. Следствие. Всякое конечное расширение нётерова кольца явля- ется целым. Теорема 9. Если В — конечное расширение кольца А, а С — конеч- ное расширение кольца В, то С — конечное расширение кольца А.
418 Глава 9. Коммутативная алгебра Теорема 10. Если кольцо В порождается над А конечным числом целых элементов, то оно является конечным расширением коль- ца А. Напомним, что конечно порожденное (и, тем более, конечное) расширение нётерова кольца также нётерово (следствие 2 теоре- мы 4.2). Теорема 11. Пусть В — какое-то расширение нётерова кольца А. Совокупность А всех элементов кольца В, целых над А, является подкольцом, целозамкнутым в В. (Последнее означает, что всякий элемент кольца В, целый над А, принадлежит А, т. е. цел уже над А.) Кольцо А называется целым замыканием кольца А в В. Например, все алгебраические числа, целые над Z, — они назы- ваются целыми алгебраическими числами — образуют подкольцо Z в поле Q всех алгебраических чисел. Поле отношений кольца Z сов- падает с Q. Замечание 1. На самом деле следствие теоремы 8 и, тем самым, теоре- ма 11 верны дня произвольных (не обязательно нётеровых) колец. Это мож- но установить при помощи следующего рассуждения. Пусть В = Ае1 4-... ...4- Аеп. Тогда е(е; = для каких-то ciJk € А. Если А' — какое-либо к подкольцо кольца А, содержащее все cijk, то В' = A'e} 4-... 4- А'еп — подколь- цо кольца В, являющееся конечным расширением кольца А'. Для любого и = а1е1 4-... 4- аПеп (а, с А) возьмем в качестве А' подкольцо, порожденное всеми Сук и а(. Так как оно нётерово (см. замечание 4.2), то согласно след- ствию теоремы 8 элемент и еВ' цел над А'; но тогда он тем более цел над А. Следующая теорема устанавливает связь между конечными рас- ширениями полей и конечными расширениями колец. Целостное кольцо называется нормальным (или целозамкну- тым), если оно целозамкнуто в своем поле отношений. Например, кольцо Z нормально в силу следствия теоремы 3.6.1. Примерами не нормальных колец могут служить кольцо многочленов без линейно- го члена и кольцо чисел вида а 4- ЬУ—3, где a, b е Z (докажите, что они не нормальны!). Теорема 12. Пусть А — нормальное нётерово кольцо, К — его по- ле отношений, L — конечное расширение поля К и В — целое замыка- ние кольца А в L. Предположим, что char К = 0. Тогда В — конечное расширение кольца А. (См. диаграмму (20).)
§ 5. Алгебраические расширения 419 Доказательство. Докажем вначале, что true А для любого и е В. Пусть aj,..., ат е А таковы, что ит + um-1 +... + am_! и + ат = 0. Тогда Т (и)т + ai Пи)"1-1 +... + am_i Т(и) 4- атЕ = 0. (23) Пусть Р D К — поле разложения характеристического многочлена оператора Т(п). Из (23) следует, что все корни этого многочлена в поле Р целы над А; но след tr и = tr Т(и) равен их сумме, и, значит, также цел над А. С другой стороны, tr и G К, Ввиду нормальности кольца А отсюда вытекает, что true А. Пусть {еь ..., еп} — базис L над К. Умножив е1?..., еп на подходя- щие элементы кольца А, можно добиться того, чтобы е1?..., еп еВ. Тогда Су = (ef, е; ) € А при всех i, j и Д = det(ci;) #0. Выясним, когда элемент u = XiCi + ... + xnen (хь ...хпеК) цел над А. Это заведомо так, если хь ..., хп G А. Это условие, вообще говоря, не является необходимым, но мы сейчас покажем, что коэф- фициенты ..., хп все же не могут быть «слишком дробными». Составляя скалярные произведения элемента и с базисными век- торами, находим: £(^• = (6,,и)€А (i = l, (24) J Рассматривая (24) как систему линейных уравнений относительно ..., хп, по формулам Крамера получаем, что хь ..., хп G Д'1 А. Таким образом, кольцо В содержится в A-подмодуле, порожден- ном элементами Д’1е1,..., Д-1еп. Так как кольцо А нётерово, то отсюда вытекает, что В — конечно порожденный А-модуль. □ Замечание 2. Теорема 12 и ее доказательство верны и в случае, когда char К = р > 0, при условии, что скалярное умножение в L невырожденно. Конечное расширение L поля К, удовлетворяющее этому условию, называ- ется сепарабельным (см. по этому поводу замечание 11.3.2). Пусть К — какое-либо поле алгебраических чисел (т. е. конечное расширение поля Q). Целое замыкание кольца Z в К называется
420 Глава 9. Коммутативная алгебра кольцом целых (чисел) поля К. Обозначим его через ZK. Из теоре- мы 12 следует, что ZK — конечно порожденная абелева группа (по сложению). Так как группа не имеет кручения, то она свободна. Более того, поскольку всякий элемент поля К становится целым после умножения на подходящее целое рациональное число, базис группы является в то же время базисом поля К как векторного пространства над Q, так что rk ZK = dimQ К. Задача 2. Доказать, что в поле Q (д/d), где d — целое число, сво- бодное от квадратов, целыми являются числа вида а + bVd, где a, beZ либо, если d = 1 (mod 4), a, beZ + Задача 3. Доказать, что в поле деления круга Q(ep) (см. приме- ры 2 и 5) целыми являются числа а0 + а1Ер + ... + ар_2££’2> а0,аи ...,ap.2eZ. (Указания: 1) следуя доказательству теоремы 12, доказать вначале, что знаменателями рациональных чисел а0, аь ..., ар_2 могут быть только степени числа р; 2) вместо разложения по степеням числа ер рассматривать раз- ложение по степеням числа 1 — £р; 3) доказать, что в кольце целых поля Q(ep) имеют место следую- щие ассоциированности: 1-£P~1-^ (к = 1,2, ...,р —1), р~(1-£р)Р"1; 4) доказать, что если какое-либо целое рациональное число де- лится на 1 — Ер, то оно делится на р.) § 6. Конечно порожденные алгебры и аффинные алгебраические многообразия В этом параграфе мы будем рассматривать алгебры над полем К, причем под словом «алгебра» будет пониматься коммутативная ас- социативная алгебра с единицей. Алгебра А будет называться ко- нечно порожденной, если она конечно порождена над К. Отметим, что в силу следствия 2 теоремы 4.2 всякая конечно порожденная алгебра является нётеровым кольцом.
§ 6. Конечно порожденные алгебры 421 Теория конечно порожденных алгебр лежит в основе исследо- вания систем алгебраических уравнений, составляющего предмет алгебраической геометрии. Пусть А — алгебра без делителей нуля. Элементы ць..., ип алгеб- ры А будут называться алгебраически зависимыми, если они алгеб- раически зависимы над К. Определение 1. Алгебраически независимая система элемен- тов {иъ ..., ud} называется базисом трансцендентности алгебры А, если для любого ugA система {и1}..., ud, и} алгебраически зависи- ма или, что равносильно, если алгебра А является алгебраическим расширением подалгебры K[ult..., ud], порожденной элементами п1?..., ud. (Ср. определение базиса векторного пространства.) Например, {хь ..., хп} — базис трансцендентности алгебры мно- гочленов К[хъ ..., хп]. Предложение 1. Всякий базис трансцендентности алгебры А яв- ляется в то же время базисом трансцендентности ее поля отноше- ний Quot А (рассматриваемого как алгебра над К). Доказательство. Пусть {пь ..., ud} — базис трансцендентности алгебры А. Элементы поля Quot А, алгебраические над подалгеброй К[и1}..., ud] —это то же, что элементы, алгебраические над подпо- лем К(щ,..., ud) = QuotK[u1,..., ud]. Все такие элементы образуют подполе в Quot А (теорема 3.5). Так как это подполе содержит А, то оно совпадает с Quot А. □ Предложение 2. Пусть А = K[ult..., ип]. Тогда всякая макси- мальная алгебраически независимая подсистема системы {щ,..., ип} является базисом трансцендентности алгебры А. Доказательство. Пусть {щ,..., ud} — максимальная алгебраиче- ски независимая подсистема системы {ulf..., ип}. Рассмотрим ал- гебраическое замыкание подполя K(uli..., ud) в поле Quot А. По условию оно содержит элементы и1г..., ип, а следовательно, совпа- дает с Quot А и, в частности, содержит А. □ Следствие. Во всякой конечно порожденной алгебре без делите- лей нуля существует базис трансцендентности. Предложение 3 (лемма о замене). Пусть {и1? и2,...» ud} — базис трансцендентности алгебры А и и е А — элемент, трансцендент- ный над К[и2) ...,ud]. Тогда {и,и2, ...,ud} — также базис трансцен- дентности алгебры А.
422 Глава 9. Коммутативная алгебра Доказательство. Ясно, что элементы у, и2, • ••>ud алгебраически независимы. С другой стороны, элементы vf ць п2,ud алгебраи- чески зависимы. Рассмотрим нетривиальную алгебраическую зави- симость между ними. Она должна нетривиальным образом содер- жать щ. Следовательно, элемент щ алгебраичен над подалгеброй К[и, п2, •••> udl- Таким образом, алгебраическое замыкание подполя K(v1} u2, ...» ud) в Quot А содержит K(u1? и2,..., ud) и, значит, совпа- дает с Quot А. □ Теорема 1. Все базисы трансцендентности алгебры А (если они существуют) содержат одно и то же число элементов. Это число называется степенью трансцендентности алгебры А и обозначается через tr. deg А. Доказательство. Пусть {ulf...,ud} и {уъ ..., ц,}—два базиса трансцендентности. Если все элементы алгебраичны над К[и2,..., ud], то уже элементы и2,..., ud составляют базис трансцен- дентности алгебры А, что невозможно. Следовательно, существует такой номер ц, что элемент vi} трансцендентен над К[и2,..., ud]. Со- гласно предложению 3, {ц , и2,..., ud} — базис трансцендентности алгебры А. Рассуждая таким же образом, мы можем в этом базисе заменить и2 некоторым элементом ц2 и т.д. В конце концов мы получим базис трансцендентности вида Ч.ц2.-.цД. Ясно, что числа ц, i2,..., id должны быть различны и что среди них должны быть все числа 1, 2,..., е. Отсюда следует, что d = е. □ Теорема 2 (лемма Нётер о нормализации). В конечно порожден- ной алгебре А = К[и1г..., пл] без делителей нуля существует та- кой базис трансцендентности {щ, ...,vd}, что алгебра А цела над K[vlf...fvd]. Доказательство. Мы докажем эту теорему в предположении, что поле К бесконечно. В этом случае искомый базис трансцен- дентности можно составить из линейных комбинаций элементов Проведем индукцию по п. Если элементы и1г ...}ип алгебраиче- ски независимы, то они и составляют искомый базис трансцендент- ности. В противном случае рассмотрим нетривиальную алгебраиче- скую зависимость между ними: f(ub ..., un) = 0, f eK[xlf ...,хп].
§ 6. Конечно порожденные алгебры 423 Пусть degf = т. Если f содержит х™ с ненулевым коэффициентом, то элемент ип цел над подалгеброй В = К[и1,..., и^]. По предпо- ложению индукции в В существует такой базис трансцендентности • ••» vd, что алгебра В цела над иД Он же будет искомым базисом трансцендентности алгебры А. Общий случай сводится к рассмотренному с помощью подходя- щей замены вида х1=У<+а|Уп = хп = уп (аъ ...,ап_гек). Многочлен £(У1> •••> Уп-1, Уп) =/(У1 +а1Уп> •••> Уп-1 + ап-1Уп> Уп) также имеет степень т и содержит у™ с коэффициентом, равным go(O,0,1) =/0(а1,ап_ъ 1), где /0 и g0 — старшие однородные компоненты многочленов f и g со- ответственно. Так как /0 — ненулевой однородный многочлен, то он не может быть тождественно равен нулю на гиперплоскости хп = 1. Следовательно, при подходящем выборе аь ..., ап_г многочлен g бу- дет содержать у™ с ненулевым коэффициентом. Положим + (i = l,...,и-1), пп = уп; тогда g(v1? ...,уп) = /(ц1,...,цп) = 0, и доказательство сводится к уже рассмотренному случаю. □ Теорема 3. Если конечно порожденная алгебра А является полем, то это (конечное) алгебраическое расширение поля К. Доказательство. Согласно теореме 2, существует такой базис трансцендентности {у1? ..., vd} алгебры А, что алгебра А цела над подалгеброй B = K(vlt...,vd]. Докажем, что В — также поле. Для любого и G В существует и-1 е А. Элемент п-1 цел над В, т. е. и~т 4- Ьг u’m+14-... 4- bm_i u"14- Ът = О для некоторых Ь1?..., Ът еВ, Отсюда и-1 = -bj — Ъ2и —... - Ьтит~г еВ.
424 Глава 9. Коммутативная алгебра Так как алгебра В изоморфна алгебре многочленов от d перемен- ных, то при d > 0 она не является полем. Следовательно, d = О, т. е. А — алгебраическое расширение поля К. □ Следствие. Если конечно порожденная алгебра А над алгебраиче- ски замкнутым полем К является полем, то А —К. Теорема 4. Пусть А — конечно порожденная алгебра над алгеб- раически замкнутым полем К. Тогда для любого не нильпотентно- го элемента а€А существует такой гомоморфизм <р: А —>К, что </>(а)0О Доказательство. Следуя доказательству теоремы 4.3, возьмем какой-нибудь максимальный идеал Iх алгебры А/ = А[а-1]. Поле АХ/1Х, будучи конечно порожденной алгеброй над К, совпадает с К. В качестве искомого гомоморфизма ip можно взять ограничение на А канонического гомоморфизма А' Ах /Iх = К. □ Применим эту теорему к исследованию систем алгебраических уравнений. Пусть М с Кп — множество решений системы алгебраических уравнений Л(х1,...,хп) = 0 (i = l,. ..,гп). (25) Рассмотрим алгебру А = К[х1,...,хп]/(/1,...,/т) (26) и канонический гомоморфизм л:К[хъ...,хп]->А (27) Положим я(х() = и,; тогда А=К[и1,ип]. (28) Каждой точке х е Кп соответствует гомоморфизм /~/(х), (29) и, обратно, каждый гомоморфизм -ф: K[Xl, ...,Хп]—*К имеет вид т/>х, где х — точка с координатами ("ф(х,),ч/>(хп)).
§ 6. Конечно порожденные алгебры 425 Если хеМ, то грх переводит идеал (J\,..., fm) в нуль и поэтому может быть пропущен через гомоморфизм л: К[Х1,...,хп]---------- А Возникающий при этом гомоморфизм <рх: А —* К переводит элемен- ты п1?ип, порождающие алгебру А, в координаты точки х. Обрат- но, каждый гомоморфизм : А —> К включается в коммутативную диаграмму (30) и поэтому имеет вид <рх, где хеМ. Итак, точки множества М взаимно однозначно соответствуют гомоморфизмам алгебры Ав К. Это по существу тривиальное сооб- ражение перекидывает мост между коммутативной алгеброй и ал- гебраической геометрией и, в частности, позволяет придать следу- ющую форму теореме 4. Теорема 5 (теорема Гильберта о нулях). Пусть М—множество решений системы алгебраических уравнений (25) над алгебраически замкнутым полем К, и пусть многочлен f е К[х1?..., хп] тожде- ственно обращается в нуль на М. Тогда (31) для некоторого натурального к. Доказательство. Определим алгебру А, как выше, и положим а = я(/) е А. Условие (31) означает, что элемент а нильпотентен. Если это не так, то по теореме 4 существует такой гомоморфизм : А —* К, что </?(а) 0 0. Этот гомоморфизм определяет точку мно- жества М, в которой многочлен f не обращается в нуль. □ Заметим, что и, обратно, всякий многочлен f е К[х1?..., хп], удовлетворяющий условию (31), тождественно обращается в нуль на М. Следствие. Система алгебраических уравнений (25) над алгебра- ически замкнутым полем К несовместна тогда и только тогда, ко- гда (32) т.е. когда существуют такие многочлены g19 ...,gm еК[хъ ...,хп], что /lgl + ...+/mgm = l. (33)
426 Глава 9. Коммутативная алгебра Доказательство. Применим теорему Гильберта о нулях к много- члену/=1. □ Определение 2. Аффинным алгебраическим многообразием над полем К или алгебраическим многообразием в Кп называется множе- ство решений системы алгебраических уравнений. Пусть М с Кп — алгебраическое многообразие. Функции на М со значениями в К, являющиеся ограничениями многочленов на пространстве Кп, называются многочленами на М. Они образуют алгебру, называемую алгеброй многочленов на М и обозначаемую через К[М]. Ядром гомоморфизма ограничения р:К[хъ...,хп]-К[М] является идеал /(М), состоящий из всех многочленов на Кп, тожде- ственно обращающихся в нуль на М. Имеем По теореме Гильберта о базисе идеала идеал Z(M) имеет конечную систему порождающих: цм)=(Л,...,/т). Очевидно, что многообразие М может быть задано уравнения- ми (25). Идеал /(М) называется идеалом многообразия М. Каждая точка х G М определяет гомоморфизм Ч>Х:К[М]-+К, /->/(х). (34) Проведенное выше рассуждение показывает, что тем самым уста- навливается взаимно однозначное соответствие между точками многообразия М и гомоморфизмами алгебры К[М] в К. Отметим, что алгебра К[М], будучи алгеброй функций на М, не имеет ниль- потентных элементов. Обратно, пусть А = К[и1г..., ип] —конечно порожденная алгеб- ра. Рассмотрим гомоморфизм я: К[хь A, Xf— Его ядро есть некоторый идеал I алгебры многочленов K[xf,..., хп]. Пусть и М с Кп — алгебраическое многообразие, определяемое системой уравнений (25). Тогда точки многообразия М взаимно однозначно
§ 6. Конечно порожденные алгебры 427 соответствуют гомоморфизмам алгебры Ав К. Однако идеал /(М) может быть больше, чем Z, и из-за этого алгебра К[М] может не совпадать с алгеброй А. В любом случае Ker р э Кег л и, следовательно, имеется гомомор- физм сг: А—*К[М]. Его ядро состоит из тех элементов алгебры А, которые приходят (при гомоморфизме л) из многочленов, тождественно равных нулю на М. Согласно теореме Гильберта о нулях, если поле К алгебраиче- ски замкнуто, то Кег сг = rad А. В частности, если алгебра А не имеет нильпотентных элементов (и поле К алгебраически замкнуто), то А = К[М]. Итак, в случае алгебраически замкнутого поля К мы установили взаимно однозначное соответствие между алгебраическими много- образиями в Кп и алгебрами с п порождающими, не имеющими нильпотентных элементов. Для любой конечно порожденной алгебры А над полем К множе- ство всех ее гомоморфизмов в К назовем ее спектром и обозначим через Spec А. Если в алгебре А выбрана система порождающих из п элементов, то согласно предыдущему Spec А отождествляется с ал- гебраическим многообразием в Кп. В частности, если М — алгебраическое многообразие в Кп, то Spec К [М] отождествляется с М при выборе в качестве порожда- ющих элементов ограничений координатных функций пространст- ва Кп. При других выборах систем порождающих получаются другие «модели» спектра, которые считаются алгебраическими многообра- зиями, изоморфными М. Соответственно этому внутренними свой- ствами многообразия М считаются такие свойства, которые могут быть выражены в терминах алгебры К[М]. При изучении этих свойств удобно пользоваться топологией За- рисского. А именно, подмножество N с М считается замкнутым в то- пологии Зарисского, если оно может быть задано уравнениями вида /. = 0 (i = l, ...,гп), где еК[М]. Например, замкнутые подмножества в Кп — это в точности алгебраические многообразия. Замкнутые подмно-
428 Глава 9. Коммутативная алгебра жества в любом алгебраическом многообразии М с Кп — это алгеб- раические многообразия в Кп, содержащиеся в М. Нетрудно проверить, что данное определение удовлетворяет аксиомам топологии, т. е. что пересечение любого числа и объеди- нение конечного числа замкнутых подмножеств замкнуты. Напри- мер, объединение подмножеств, задаваемых уравнениями /^ = 0 (i = 1,..., иг) и g; = 0 (j = 1,..., р) соответственно, может быть за- дано уравнениями ftg},= 0 (i = l,..., иг; j = 1,..., р). Топология Зарисского, за исключением тривиальных случаев, не является хаусдорфовой. Например, замкнутые подмножества пря- мой К1 в топологии Зарисского — это вся прямая и конечные под- множества; поэтому если поле К бесконечно, то любые два непу- стых открытых подмножества пересекаются. Ввиду своей бедности топология Зарисского играет в основном вспомогательную роль как удобный язык при изучении алгебраиче- ских многообразий. Однако некоторые грубые свойства алгебраиче- ских многообразий ею все же улавливаются. Определение 3. Топологическое пространство называется нёте- ровым, если в нем не существует бесконечной строго убывающей последовательности замкнутых подмножеств. Каждому замкнутому подмножеству N аффинного алгебраиче- ского многообразия М соответствует идеал алгебры К[М], состоящий из всех многочленов, тождественно равных нулю на N; при этом D N2 тогда и только тогда, когда /M(Ni) с По- этому из нётеровости алгебры К[М] следует, что многообразие М является нётеровым топологическим пространством (в топологии Зарисского). Определение 4. Топологическое пространство М называется не- приводимым, если оно непусто и удовлетворяет любому из следую- щих эквивалентных условий: 1) его нельзя представить в виде объединения двух собственных замкнутых подмножеств; 2) любые два его непустых открытых подмножества пересека- ются. (Сравните это определение с определением связного топологиче- ского пространства.) Теорема 6. Аффинное алгебраическое многообразие М неприводи- мо тогда и только тогда, когда алгебра К[М] не имеет делителей нуля.
§ 6. Конечно порожденные алгебры 429 Доказательство. Пусть /ь f2GK[M] —такие ненулевые много- члены, что j\f2 = 0. Тогда М = NT U N2, где N, (i = 1, 2), — замкнутое подмножество, выделяемое уравнением = 0. Обратно, пусть М = U N2, где N1? N2 — собственные замкну- тые подмножества. Возьмем какие-нибудь ненулевые многочлены fi6AGlM(.N2y, тогда /1/2 = 0. □ Предложение 4. Всякое нётерово топологическое пространство М единственным образом представляется в виде (35) 1=0 где М1? ...,MS— неприводимые замкнутые подмножества, ни одно из которых не содержится ни в каком другом. Подмножества М, называются неприводимыми компонентами пространства М. Доказательство. Предположим, что существуют нётеровы топо- логические пространства, которые нельзя представить в виде ко- нечного объединения неприводимых замкнутых подмножеств. На- зовем их плохими. Пусть MQ плохое. Тогда Мо приводимо, т. е. Мо = = Mj UN1? где Мх и N± —собственные замкнутые подмножества. Яс- но, что хотя бы одно из них плохое. Пусть это . Тогда M1=M2UN2, где М2 и N2 — собственные замкнутые подмножества, причем хотя бы одно из них плохое. Продолжая этот процесс, мы получаем беско- нечную строго убывающую последовательность замкнутых подмно- жеств MqDMj эМ2э..., что противоречит нётеровости простран- ства Мо. Таким образом, всякое нётерово топологическое пространство М можно представить в виде (35), где —неприводимые замкнутые подмножества. Убрав те из них, которые содержатся в других, мы можем добиться того, чтобы ни одно из них не содер- жалось в другом. Покажем, что при этом условии разложение (35) единственно. г Пусть М = |J Nj —другое такое разложение. Тогда для любого j J = 1 s N;. = U(M,nWp, i=l откуда в силу неприводимости следует, что существует такое i, что Nj с Мр Аналогично, существует такое к, что MI с Nk; но то- гда Nj с Nk, откуда следует, что j = к и Nj = М,. Таким образом,
430 Глава 9. Коммутативная алгебра {N1?Nt} с {М1?Ms}. Аналогично доказывается обратное вклю- чение. □ В частности, всякое аффинное алгебраическое многообразие единственным образом разлагается на неприводимые компоненты. Пример 1. Пусть q — многочлен второй степени от п перемен- ных над алгебраически замкнутым полем К. Уравнение q = 0 задает в Кп гиперповерхность М. Возможны следующие случаи: 1) q не разлагается на линейные множители; тогда М — непри- водимая квадрика; 2) q разлагается на два непропорциональных линейных множи- теля; тогда гиперповерхность М есть объединение двух гиперплос- костей, которые и являются ее неприводимыми компонентами; 3) q есть квадрат линейного многочлена; тогда М — гиперплос- кость (но в этом случае Z(M) 0 (q)). Все это может быть выведено из более общей теоремы 7.5, кото- рая будет доказана в следующем параграфе. Важнейшей характеристикой неприводимого аффинного алгеб- раического многообразия является его размерность. Определение 5. Размерностью неприводимого аффинного ал- гебраического многообразия М называется число dim М = tr. deg К [М]. В частности, dimKn = tr. degK[x1?..., хп] = n. Размерность алгебраического многообразия обладает следую- щим свойством, аналогичным свойству размерности векторного пространства. Теорема 7. Пусть N — неприводимое замкнутое подмножество неприводимого аффинного алгебраического многообразия М. Тогда dim N dim М, причем равенство имеет место только тогда, когда N = M. Доказательство. Пусть p:K[M]->K[N] — гомоморфизм ограничения. Ясно, что если элементы p(fi),... ...,р(Д) алгебраически независимы в K[N], то элементы алгебраически независимы в К[М]. Отсюда следует первое утвер- ждение теоремы.
§ 7. Разложение на простые множители 431 Предположим теперь, что N^M. Пусть {р (А),..., р (А)} — базис трансцендентности алгебры K[N] и f f ^0. Докажем, что тогда Д,..., А, / алгебраически независимы в К[М], откуда будет следовать второе утверждение теоремы. Предположим, что /ь fk, f связаны некоторой нетривиальной алгебраической зависимостью. Эту зависимость можно предста- вить в виде ао(/1>.... А)Г +ai(/i,.... Л)/"”1 + - + ат(/1,.... fk) = o, где а0,а1,...,ат — некоторые многочлены, не все равные нулю. Можно считать, что ат # 0, — иначе равенство можно сократить на /. Применяя гомоморфизм р, получаем тогда, что ат(р(Л)> •••>Р(А)) = О, а это противоречит алгебраической независимости р(А), •••> p(fk)- □ § 7. Разложение на простые множители Одной из основных задач арифметики является разложение на простые множители в кольцах целых алгебраических чисел. Анало- гичная проблема для конечно порожденных алгебр возникает в ал- гебраической геометрии (например, в связи с описанием линейных расслоений над алгебраическими многообразиями). Несмотря на различие между этими двумя типами колец, проблема разложения на простые множители в них может трактоваться до некоторой сте- пени единообразно. Схема такого подхода будет изложена в конце этого параграфа, а в первой части параграфа будут доказаны тео- ремы о существовании и единственности разложения на простые множители для некоторых типов колец. Заметим, что если А — целостное кольцо, то для элементов a, b G А условие b | а равносильно тому, что (а) с (Ь), и соответствен- но условие а ~ b равносильно тому, что (а) = (Ь). Теорема 1. В нётеровом целостном кольце каждый необрати- мый ненулевой элемент может быть разложен в произведение про- стых элементов. (Имеется в виду, что это произведение может состоять только из одного множителя.)
432 Глава 9. Коммутативная алгебра Доказательство. Предположим, что существуют необратимые ненулевые элементы, которые нельзя разложить на простые множи- тели. Такие элементы будем называть плохими. Пусть а0 — плохой элемент. Тогда он, в частности, не является простым и, значит, где а2 и Ьг —необратимые элементы. Ясно, что хотя бы один из элементов а2 и Ьг плохой. Пусть это аР Тогда а2 = а2Ъ2, где а2 и Ь2 — необратимые элементы, причем хотя бы один из них плохой. Продолжая этот процесс, мы получаем бесконечную строго возрастающую последовательность идеалов (a0)c(a1)c(a2)c..., что противоречит нётеровости. □ Что касается единственности разложения на простые множите- ли, то она, конечно, может иметь место лишь с точностью до пере- становки множителей и умножения их на обратимые элементы. По- этому в дальнейшем, говоря о единственности, мы будем понимать ее именно в этом смысле. Анализируя доказательство единственности разложения на про- стые множители в евклидовом кольце, данное в §3.5, мы видим, что оно опирается только на одно свойство кольца: если простой элемент р делит произведение ab, то он делит а или Ь; иначе говоря, идеал (р), порожденный любым простым элементом р, прост. Это приводит нас к следующей теореме. Теорема 2. Если в целостном кольце А главный идеал, порожден- ный любым простым элементом, прост, то любой элемент этого кольца не более чем одним способом может быть разложен в произ- ведение простых элементов. Заметим, что главный идеал, порожденный не простым необра- тимым ненулевым элементом, не может быть простым ни в каком кольце. Определение 1. Целостное кольцо А называется факториаль- ным, если каждый его необратимый ненулевой элемент может быть разложен на простые множители, причем это разложение единственно в указанном выше смысле. В частности, всякое кольцо главных идеалов факториально (см. §2). Очевидно, что в факториальном кольце главный идеал, порож- денный любым простым элементом, прост.
§ 7. Разложение на простые множители 433 В факториальном кольце для любых двух элементов а и Ь суще- ствует наибольший общий делитель НОД{а, Ь} — общий делитель, делящийся на все другие общие делители. А именно, если а = ПР,*'» Ь = Пр!’ i=l i=l где Pi,..., ps — простые элементы, то НОД{а, b} = np(min{'t"'i>. i=l Наибольший общий делитель определен однозначно с точностью до умножения на обратимый элемент. Элементы а и b факториального кольца называются взаимно про- стыми, если НОД{а, Ь} = 1, т.е. если в разложениях элементов а и b на простые множители не содержится общих (с точностью до ассоциированности) множителей. Следующая теорема является обобщением (следствия) теоре- мы 3.6.1. Теорема 3. Всякое факториальное кольцо нормально. Доказательство этой теоремы ничем не отличается от доказа- тельства теоремы 3.6.1. Теорема 4. Кольцо многочленов А[х] над факториальным коль- цом А также факториально. Доказательство этой теоремы требует некоторой подготовки. Многочлен /€А[х] назовем примитивным, если его коэффици- енты взаимно просты в совокупности. Пусть К — поле отношений кольца А. Очевидно, что всякий мно- гочлен h G К[х] можно представить в виде h = Л/ц, где Л G К*, a е GA[x] —примитивный многочлен. Лемма 1 (лемма Гаусса). Если многочлен /еА[х] разлагается в произведение двух многочленов в кольце К[х], то он разлагает- ся в произведение двух пропорциональных им многочленов в кольце А[х]. Эта лемма доказывается так же, как теорема 3.6.2. Небольшое отличие состоит в том, что факторкольцо кольца А по идеалу, по- рожденному простым элементом, в общем случае может не быть полем, но оно во всяком случае не имеет делителей нуля, а этого достаточно для доказательства.
434 Глава 9. Коммутативная алгебра Следствие. Если многочлен f G А[х] может быть разложен в произведение двух многочленов меныией степени в кольце К[х], то он может быть разложен в произведение многочленов меньшей степени и в кольце А[х]. Доказательство теоремы 4. Следствие леммы Гаусса и очевид- ные соображения показывают, что простыми элементами кольца А[х] могут быть только элементы следующих двух типов: 1) простые элементы кольца А; 2) примитивные многочлены heA[x], неприводимые над по- лем К. С другой стороны, ясно, что все эти элементы действительно являются простыми и что любой необратимый ненулевой элемент кольца А[х] может быть разложен в произведение таких элемен- тов. Если имеется два таких разложения многочлена /еА[х], то, рассматривая их как разложения в кольце К [х], факториальность которого известна, мы заключаем, что множители второго типа в этих разложениях ассоциированны в К[х]; но так как они являют- ся примитивными многочленами, то они ассоциированны и в А[х]. После сокращения на эти множители мы получаем два разложения на простые множители элемента кольца А и можем воспользоваться факториальностью этого кольца. □ Рассуждая по индукции, из доказанной теоремы можно вывести Следствие. Кольцо многочленов К[хь ...,хп] от п переменных над полем К факториально при любом п. Простые элементы кольца К[хь ..., хп] называются неприводимы- ми многочленами. Очевидно, что всякий многочлен первой степени неприводим. Лемма 2. Если многочлен f G К[хь ..., хп] над бесконечным по- лем К обращается в нуль во всех точках гиперплоскости 1 = 0^ + ... + апхп + Ь = 0, то он делится на I. Доказательство. Перейдя к другой аффинной системе коорди- нат, мы можем считать, что I = хТ. Тогда условие леммы означа- ет, что все члены многочлена f содержат х2 и, значит, f делится на I. □ Приведем два примера разложения многочленов на линейные множители с использованием этой леммы и факториальности коль- ца многочленов.
§ 7. Разложение на простые множители 435 Пример 1. Вычислим другим способом определитель Вандер- монда У(хъ ..., хп) (см. пример 2.4.5). Очевидно, что У(х1э..., хп) — многочлен от хъ ...,хп. При Х( = х; (i, j различны) он обращается в нуль, так как соответствующая матрица в этом случае имеет две одинаковые строки. По лемме 2 мы можем заключить, что многочлен У(хь ..., хп) делится на х1—Xj в кольце К[хь ..., хп] при любых различных i, j; но тогда из факториальности этого кольца следует, что У(хь ...хп) делится на П(х; “ хр- Легко видеть, что i/г л « 1>; п(п-1) _ VCxj,..., хп) — однородный многочлен степени —-—• Поэтому У(хь ...л) = сП(хгхР (сеК). i>j Сравнивая коэффициенты при х2Хз...х£~1, получаем, что с = 1. Задача 1. Доказать аналогичным способом, что Х3+у3 +z3 -3xyz = (х + у + z)(x + coy + coz)(x + coy + coz), 1 . -Уз гдесо = -5 + 1—. Применим результат о факториальности кольца многочленов к описанию (п — 1)-мерных алгебраических многообразий в Кп. Пусть К — алгебраически замкнутое поле. Для всякого многочле- на /gK[xj, ...,хп] обозначим через алгебраическое многооб- разие в Кп, задаваемое уравнением / = 0. Теорема 5. Отображение р М(р) устанавливает взаимно од- нозначное соответствие между неприводимыми многочленами от п переменных, рассматриваемыми с точностью до ассоциирован- ности, и (п — 1}-мерными неприводимыми алгебраическими много- образиями в Кп; при этом идеал многообразия М(р) порождается многочленом р. Доказательство. 1) Пусть реК[х1}..., хп] — неприводимый мно- гочлен. Тогда идеал (р) прост и, следовательно, многообразие М(р) неприводимо и 1(М(р)) = (р). В частности, многочлен р с точно- стью до ассоциированности однозначно восстанавливается по мно- гообразию М(р). 2) В предыдущих обозначениях, имеем К[М(р)] = К[хъ ..., хп]/(р) =K[ult..., un], где щ,..., ип — ограничения координатных функций х1? ...,хп про- странства Кп на М(р). Предположим, что многочлен р содержит
436 Глава 9. Коммутативная алгебра нетривиальным образом переменную хп. Тогда и любой многочлен из идеала (р) содержит хп. Это означает, что ulf..., алгебраиче- ски независимы. Следовательно, dim М(р) = п — 1. 3) Обратно, пусть М с Кп — (и - 1)-мерное неприводимое ал- гебраическое многообразие. Возьмем любой ненулевой многочлен f GI (М) и разложим его на неприводимые множители. Из простоты идеала ЦМ) следует, что хотя бы один из этих множителей при- надлежит /(М). Пусть это будет неприводимый многочлен р. Тогда МсМ(р), но из совпадения размерностей следует, что на самом делеМ = М(р). □ Пусть f е. К[xlf ...,хп] —любой необратимый ненулевой много- член. Разложим его на неприводимые множители: Из теоремы 5 очевидным образом следует, что M(/) = M(p1)U...uM(ps) есть разложение многообразия на неприводимые компонен- ты. Задача 2. Найти /(М(/)). Такие же результаты получатся, если вместо пространства Кп взять любое неприводимое аффинное алгебраическое многообра- зие М, для которого алгебра К[М] факториальна. (Единственным местом, где в общем случае требуются дополнительные соображе- ния, является п. 2) доказательства теоремы.) Если же алгебра К[М] не факториальна, то в ней существуют простые элементы, которые порождают главные идеалы, не являю- щиеся простыми, и одновременно в М существуют (и - 1)-мерные неприводимые подмногообразия, идеалы которых не являются глав- ными. Пример 2. Пусть Q с К3 — квадратичный конус, задаваемый уравнением ху = z2. Имеем K[Q] =К[х, у, z]/(xy - z2) = К[и, и, ш], где п, v, iv связаны соотношением ии = ш2. Очевидно, что п, и, w (как и все линейные формы от них) — простые элементы алгебры K[Q]. Поэтому соотношение ии = ш2 является нарушением факто- риальности. Это находит свое отражение в том, что идеалы (и), (и), (ш) не являются простыми (например, uv € (ш), но и ф (ш)
§ 7. Разложение на простые множители 437 и v ф (иУ)У и одновременно в том, что идеалы образующих конуса Q не являются главными (например, идеал оси х есть (v, иУ), а идеал оси у есть (и, иУ)У Наблюдения подобного рода приводят к мысли о том, что, мо- жет быть, правильнее рассматривать не простые элементы алгебры К[М], а простые идеалы, соответствующие (п - 1)-мерным непри- водимым подмногообразиям. И, действительно, на этом пути может быть построена очень красивая теория, причем не только для конеч- но порожденных алгебр, но и для любых нётеровых колец. Изложим кратко основные идеи этой теории. Пусть А — нормальное нётерово кольцо. Назовем нормированием коль- ца А сюръективное отображение и: А\{0}—»Z+, обладающее следующими свойствами: 1) v (ab) = u(a) + и (by, 2) у(а + Ь) ^min{y(a), у(Ь)}. Совокупность элементов а € А, для которых и (а) > 0, есть простой идеал кольца А. Он называется идеалом нормирования и и обозначается через р(^). С каждым простым элементом р G А, для которого идеал (р) прост, связано нормирование vpi определяемое следующим образом: ур(а) есть наибольшая степень элемента р, на которую делится а. Очевидно, что р(ур) = (р). Если кольцо А факториально, то для любых его ненулевых элементов верно следующее: Ь|а <=> ур(а)^ур(Ь) Vp. В общем же случае нормирований вида ир недостаточно для выяснения во- проса о делимости элементов. Каким должно быть их разумное обобщение, подсказывают следующие две задачи. Задача 3. Доказать, что всякий ненулевой простой главный идеал явля- ется минимальным среди ненулевых простых идеалов кольца А. Задача 4. Доказать, что в факториальном кольце любой минимальный простой идеал является главным. Минимальные простые идеалы кольца А называются его простыми ди- визорами. В рассматривавшемся выше случае, когда А = К[М], простые дивизоры — это идеалы (п - 1)-мерных неприводимых подмногообразий многообразия М. Можно доказать, что любой простой дивизор р является идеалом неко- торого однозначно определенного нормирования ц,. Идея доказательства состоит в том, что идеал р становится главным при вложении кольца А
438 Глава 9. Коммутативная алгебра в подходящее кольцо вида А[и г], где и G А \ р. Очевидно, что если р = (р), то ир = ир. В случае когда А = К[М] и p = /(N), где N есть (и - 1)-мерное неприво- димое подмногообразие многообразия М, число ир(/) при feK[M] имеет смысл «порядка нуля» функции f на подмногообразии N. Пример 3. В примере 2 плоскость х = 0 касается конуса Q по оси у, плоскость у = 0 касается него по оси х, а плоскость z = 0 трансверсально пересекает его по осям х и у. Поэтому, если обозначить через р и q идеалы осей х и у в алгебре К [Q], то up(u) = 0, Up (и) = 2, up(iu) = l, uq(u) = 2, uq(u) = 0, uq(iu) = l, что согласуется с соотношением uv = tu2. Основные свойства нормирований ир, оправдывающие их рассмотре- ние, состоят в следующем: 1) для любого ае А \ {0} множество таких р, что ир(а) > 0, конечно; 2) для любых а, ЬеА\{0} Ь\а <=> Up(a)^up(b) Vp. Исторически эта теория была впервые построена для колец целых чи- сел круговых полей в работах Куммера по теореме Ферма. В отличие от общего случая, в кольцах целых алгебраических чисел все нетривиальные простые идеалы, как мы покажем ниже, являются минимальными. Кроме того, в этом случае теория может быть интерпретирована как теорема об однозначном разложении идеалов на простые множители. А именно, определим умножение идеалов по правилу ab= аД: Qi,...»flfc €а, Ьь ..., Gb|. Очевидно, что это умножение коммутативно и ассоциативно и что (а)(Ь) = = (ab). Тем самым полугруппа ненулевых элементов кольца А, рассматри- ваемых с точностью до ассоциированности, оказывается вложенной в полу- группу идеалов. Можно доказать, что если А — кольцо целых чисел некоторого поля алгебраических чисел, то всякий ненулевой идеал в нем однозначно раз- лагается в произведение простых идеалов. Число ир(а) интерпретируется тогда как показатель при р в разложении идеала (а). Два идеала называются эквивалентными, если они становятся равными после умножения их на подходящие главные идеалы. Классы эквивалент- ных идеалов кольца А целых алгебраических чисел образуют группу, назы- ваемую группой классов идеалов кольца А и обозначаемую через С1 А. Она измеряет отклонение кольца А от факториальности.
§ 7. Разложение на простые множители 439 Пусть К — поле алгебраических чисел, а ZK — кольцо его целых чисел. Теорема 6. Любой ненулевой идеал а кольца ZK является под- группой конечного индекса (по сложению). Доказательство. Мы знаем, что существует такой базис {еь ... ..., еп} пространства К над Q, что ф... ф Zen. Пусть а — какой-либо ненулевой элемент идеала а. Отображение х —♦ ах является невырожденным линейным преобразованием про- странства К над Q и, следовательно, {aelf ...,аеп}— также базис этого пространства. Так как он содержится в а, то а — подгруппа конечного индекса bZk. □ Следствие. Любой нетривиальный простой идеал р кольца ZK является максимальным идеалом. Доказательство. Факторкольцо ZK/p конечно и не имеет де- лителей нуля. Доказываемое утверждение вытекает из следующей леммы. □ Лемма 3. Всякое конечное кольцо А без делителей нуля является полем. Доказательство. Пусть a G А — ненулевой элемент. Отображе- ние А-+А, х—>ах, ввиду отсутствия в кольце А делителей нуля инъективно и, значит, сюръективно. В частности, существует такой элемент Ь, что ab = = 1. □ Следствие. Любой нетривиальный простой идеал кольца ZK яв- ляется минимальным простым идеалом. Доказательство. Если бы существовал меньший простой идеал, то он не был бы максимальным. □ Пример 4. Кольцо целых чисел поля Q(/^5) есть й[лЛ-5]. Опре- делим норму N(c) числа с = а 4- Ь/—5 G Z[>/-5] (а, beZ) по фор- муле N(c) = cc = a2 + 5b2eZ. Очевидно, что норма мультипликативна: N(c1c2)=N(c1)N(c2).
440 Глава 9. Коммутативная алгебра Поэтому, если с — обратимый элемент кольца то N(c) = ±1. Отсюда следует, что обратимы только ±1. Если с — не простой необ- ратимый ненулевой элемент, то N(c) представляется в виде произ- ведения двух норм, отличных от 1. С помощью этого соображения легко показать, что все элементы, участвующие в равенстве 2 • 3 = (14- /^5X1 - 7^5), (36) просты. Таким образом, кольцо Й[У^5] не факториально. С точки зрения теории идеалов равенство (36) находит следующее объ- яснение: (2) = р2, (3) = q1q2, (14--/—5) = pqi, (1 —\/5) = pq2, где р = (2, 1 4- лЛ35) = (2,1 - У=5), Я1 = (3,14-7=5), q2 = (3,1-/=5) — простые идеалы. (Проверьте это!) Можно показать, что С12[У—5] Вообще, группа классов идеалов кольца целых любого поля алгебраиче- ских чисел конечна. Это означает, в частности, что некоторая степень любо- го идеала является главным идеалом.
Глава 10 Группы § 1. Прямые и полупрямые произведения В § 9.1 были рассмотрены прямые суммы аддитивных абелевых групп. Конечно, название операции в группе неважно. Ничто не мешает сделать то же для мультипликативных групп; только в этом случае естественно говорить не о прямой сумме, а о прямом произ- ведении. Более существенно то, что можно отказаться от коммута- тивности. Дадим соответствующие точные определения. Определение 1. Говорят, что группа G разлагается в прямое про- изведение своих подгрупп G1?..., Gk) если 1) каждый элемент g е G единственным образом представляется в виде g = gi.. .gfc, где gt G Gt; 2) gig, = gjgi при g, e Gb gj eGj,i/j. В этом случае пишут G = Gi x ... x Gk. Очевидно, что если груп- па G конечна, то |G| = |G1|...|Gfc|. Из условия 1) следует, что Gt A G; = {е} при i / j, но, как мы видели уже на примере векторных пространств (ср. с задачей 5.1.2), при к > 2 последнее условие является более слабым, чем условие 1). Из условия 2) вытекает следующее правило умножения элемен- тов группы G: (gi-gfcXs'r-Sp = -Cgkg'k) (-Sbg'i^Gi'). (1) В частности, легко видеть, что каждая из подгрупп Gt нормальна. Как вытекает из следующей леммы, условие 2) можно заменить требованием, чтобы подгруппы Gb ..., Gk были нормальны. Лемма 1. Пусть G^ и G2 — нормальные подгруппы группы G, при- чем G) П G2 = {е}. Тогда gjg2 = g2gy для любых gj е G1; g2 е G2. Доказательство. Имеем g\g2g^g21 =£1 = (gig2gi-1)g21 е Gj n G2 = {е}> откуда g1g2 = g2g1. □
442 Глава 10. Группы Рассмотрим отдельно случай двух множителей. Предложение 1. Группа G разлагается в прямое произведение своих подгрупп G} и G2 тогда и только тогда, когда 1) подгруппы Gj и G2 нормальны', 2) Gj AG2 = {e}; 3) G = G^G^ m. e. каждый элемент geG представляется в виде 8 = 81&2> 2degieG1Jg2eG2. Доказательство. Утверждение «только тогда» уже доказано вы- ше. Пусть, обратно, выполнены условия 1)—3) предложения. Тогда по лемме 1 g^g2 = g2£i при gi е Glf g2 е G2. Остается проверить един- ственность представления элемента g€ G в виде g = gig2, где g2 G G1? g2€G2. Пусть &1&2 = #2 fen £iG Gb g2, g2 G2). Тогда 8'1=8282 1^G1nG2 = {e}, откуда gi=g'P 82=82- ° Пример 1. Пусть G = {e, a, b, c} — нециклическая группа поряд- ка 4. Легко видеть, что квадрат любого из элементов а, Ь, с равен единице, а произведение любых двух из них (в любом порядке) равно третьему (см. пример 4.1.7, где выписана таблица умноже- ния этой группы). Отсюда следует, что G есть прямое произведение любых двух различных циклических подгрупп второго порядка, на- пример, G = {e, а} х {е, Ь}. Пример 2. Возможность и единственность представления ком- плексного числа, отличного от нуля, в тригонометрической форме означает, что C* = IR+ хТ (см. обозначения в примерах 4.5.2 и 4.5.3). Пример 3. Пусть G = GL+ (R) — группа матриц с положительным определителем, Gj — подгруппа скалярных матриц ЛЕ с Л > 0 и G2 = = SLn(R). Тогда G = G-^ х G2. В самом деле, G^ и G2 — нормальные подгруппы (причем элементы подгруппы Gj коммутируют со всеми
§ 1. Прямые и полупрямые произведения 443 элементами группы), Gj П G2 = {е} и G = G1G2f так как каждая мат- рица A G G может быть представлена в виде А = ЛА1 = (ЛЕ)А1, где Л = VdetA, Aj = IА € SLn (Ж) = G2. Л, Задача 1. Выяснить, при каких п GLn(R) = {ЛЕ: AgR*} х SLn(R). Дадим теперь определение внешнего прямого произведения групп. Определение 2. Прямым произведением групп G1?..., Gk называ- ется совокупность последовательностей (g1?..., gfc), где gf G Gf, с по- компонентной операцией умножения: (gi> = •••.gkgfc)- Очевидно, что таким образом действительно получается группа. Она обозначается через Gj х ... х Gk. Отождествляя каждый элемент g G G( с последовательностью (е,..., g,..., е) G Gj х ... х Gfc, где g стоит на i-м месте, мы получаем вложение G,-в Gx х ... х Gk в виде подгруппы. Группа х ... х Gk есть прямое произведение этих подгрупп в смысле определения 1. Обратно, если некоторая группа G разлагается в прямое произ- ведение своих подгрупп G1?..., Gk, то отображение Gj х ...xGfc —G, (gi,...,gk)~gi---gk> в силу формулы (1) является изоморфизмом групп. Пример 4. Группа (невырожденных) диагональных матриц по- рядка п изоморфна группе (К*)п = К*х хК*. п Гораздо чаще, чем разложение группы в прямое произведение, встречается разложение в так называемое полупрямое произведе- ние. Перед тем как дать соответствующие определения, поговорим об автоморфизмах групп. Определение 3. Автоморфизмом группы называется ее изомор- физм на себя.
444 Глава 10. Группы Пример 5. Отображение х ах (а / 0) является автоморфиз- мом аддитивной группы поля. Примерб. Отображение X (Хт)-1 является автоморфизмом группы невырожденных матриц. Все автоморфизмы группы G обра- зуют группу, обозначаемую через Aut G. Для любого элемента g G G отображение a(g): х —> gxg-1 (х G G) является автоморфизмом: a(g)(xx) =gxyg~1 = (gxg-1)(gyg_1) = (a(g)x)(a(g)y). Такой автоморфизм называется внутренним автоморфизмом, опре- деляемым элементом g. Отображение g —* a(g) является гомоморфизмом группы G в группу Aut G: a(gh)x = ghx(gh)-1=g(/ix/r1)g-1=a(g)a(h)x. Его ядро есть центр Z группы G: Z = {zGG: zg = gz VgGG}. Его образ есть подгруппа группы Aut G, называемая группой внут- ренних автоморфизмов группы G и обозначаемая через IntG. По теореме о гомоморфизме Int G^G/Z, Пример 7. Легко доказать, что при п 3 центр группы Sn триви- ален. Следовательно, Int Sn — Sn. Пример 8. Центр группы GLn (К) (где К — поле) состоит из ска- лярных матриц и изоморфен мультипликативной группе К*. Фактор- группа GLn(K)/{AE: AgK*} есть не что иное, как проективная груп- па PGLn(K) (группа проективных преобразований (и - 1)-мерного проективного пространства РКп, ассоциированного с векторным пространством Кп). Таким образом, Int GLn(K)^PGLn(K). Пусть G Aut G — любой автоморфизм и g G G. Непосредственная проверка показывает, что <pa(g)</?-1 =a(</?(g)). Следовательно, Int G — нормальная подгруппа группы Aut G.
§ 1. Прямые и полупрямые произведения 445 Конечно, нетривиальные внутренние автоморфизмы имеются лишь у неабелевых групп. Пример 9. Найдем группу AutS3. Так как при любом изомор- физме групп сохраняются порядки элементов, то всякий автомор- физм у группы S3 переводит транспозиции в транспозиции. Более того, так как группа S3 порождается транспозициями, то автомор- физм однозначно определяется тем, как он переставляет транспо- зиции. Следовательно, |AutS3|^|S3| = 6. Но группа Int S3, как мы видели выше, содержит как раз 6 элементов. Следовательно, Aut S3 = Int S3. Пример 10. Найдем группу AutZn. Пусть G AutZn и (^([1]) = = [к]. Тогда V СП]) = уС[1] + .;. + [1]) = [к] + .;. + [к] = [kZ] = [к] [Z], i i где умножение в последнем выражении понимается в смысле коль- ца Zn. Таким образом, всякий автоморфизм группы Zn имеет вид 4>а- х—*ах для некоторого aGZn. Обратно, для любого aeZn отображение <ра является гомоморфизмом группы Zn в себя и ^а^ь = ^ab- Следовательно, гомоморфизм обратим, т. е. является автомор- физмом, тогда и только тогда, когда обратим элемент а в кольце Zn. Таким образом, Aut Zn^Z*, где Z* — группа обратимых элементов кольца Zn. Пользуясь понятием внутреннего автоморфизма, можно следу- ющим образом переформулировать определение нормальной под- группы: подгруппа нормальна, если она инвариантна относительно всех внутренних автоморфизмов группы G. Пусть N — нормальная подгруппа группы G, а Н — любая под- группа. Тогда произведение NH = {nh:n<=N,heH}
446 Глава 10. Группы является подгруппой, как показывают следующие тождества: (n1h1)(n2h2) = n1(h1n2hr1)h1h2, (2) (nh) ^(h^n 2h)h \ Кроме того, NH = HN. Определение 4. Говорят, что группа G разлагается в полупрямое произведение подгрупп N и Н, если 1) N — нормальная подгруппа; 2) NnH = {e}; 3) NH = G. При этом пишут G = NXH (или G = H AN). Свойства 2) и 3) эквивалентны тому, что каждый элемент груп- пы G единственным образом представляется в виде произведе- ния nh, где пGN, hGH. В частности, если группа G конечна, то |G| = |N||H|. Пример 11. Sn = Ап X ((12)). Пример 12. S4 = V4 X S3, где V4 — четверная группа Клейна (см. пример 4.6.15), a S3 вложена в $4 в виде подгруппы, оставляющей на месте символ 4. В самом деле, легко видеть, что для каждого k € {1, 2, 3,4} в У4 имеется единственная подстановка, переводя- щая 4 в к. Отсюда следует, что каждая подстановка а G S4 единствен- ным образом представляется в виде сг = тр, где т G V4, р G S3. Пример 13. GLn(K) = SLn(K)X{diag(A, 1,..., 1): ЛеК*}. Пример 14. Группа GA(S) аффинных преобразований аффинно- го пространства S есть полупрямое произведение (нормальной) под- группы Trans (S) параллельных переносов и группы GL(V) линей- ных преобразований ассоциированного векторного пространства V, вложенной в GA(S) в виде подгруппы, оставляющей на месте ка- кую-либо фиксированную точку. Пример 15. Группа Isom S движений евклидова аффинного про- странства S есть полупрямое произведение группы параллельных переносов и группы О(У) ортогональных преобразований ассоции- рованного евклидова векторного пространства. Если G = N X Н, то G/N Н. Однако не следует думать, что для всякой нормальной подгруппы N найдется такая подгруппа Н (изоморфная G/N), что G = NXH. Например, для (нормальной) подгруппы 2Z в группе Z не существует дополнительной подгруппы.
§ 1. Прямые и полупрямые произведения 447 Пусть G = NXH. Для каждого heH обозначим через a(h) огра- ничение на N внутреннего автоморфизма a(h) группы G. Очевидно, что a(h) G Aut N и что отображение h —* a(h) является гомоморфиз- мом группы Н в группу Aut N. Первую из формул (2) можно перепи- сать в виде (.n1h1)(.n2h2) = (n1a(h1)n2)(h1h2)- (3) Пусть теперь имеются какие-то группы N и Н и задан гомомор- физм a: Н —AutN. Определим в декартовом произведении N х Н операцию умноже- ния по формуле (пъ hi)(n2, h2) = GhaChi)^, h^). (4) подсказанной формулой (3). Непосредственно проверяется, что опе- рация (4) удовлетворяет аксиомам группы. Полученная группа G на- зывается (внешним) полупрямым произведением групп N и Н, опре- деляемым гомоморфизмом а, и обозначается N Ха Н или просто N ХН. Если отождествить группу N с подгруппой группы G, состо- ящей из пар вида (п, е), а группу Н — с подгруппой, состоящей из пар вида (е, h), то группа G будет полупрямым произведением этих подгрупп в смысле определения 4. Обратно, если какая-то группа G разлагается в полупрямое про- изведение своих подгрупп N и Н и а: Н —► Aut N — гомоморфизм, определенный, как было указано выше, то отображение NH->G, (n,h)~nh, есть изоморфизм групп. Прямое произведение является частным случаем полупрямого: оно получается, если в качестве а взять тривиальный гомоморфизм. Условимся обозначать через (а)п циклическую группу порядка п с порождающим элементом а. Пример 16. Опишем группы, являющиеся полупрямыми произ- ведениями циклических групп (а)п и (Ь)т порядков п и т соответ- ственно. Гомоморфизм a: (Ь)т — Aut(a)n^Z* определяется образом элемента Ь, который представляет собой воз- ведение в некоторую степень к в группе (а)п. (См. пример 10.) Чис-
448 Глава 10. Группы ло к (его задание существенно лишь по модулю и) должно удовле- творять условию кт = 1 (mod п). В частности, если число |Z*| = </?(п) взаимно просто с т, то отсю- да следует, что к = 1, а это соответствует прямому произведению. Например, всякое полупрямое произведение групп {а)7 и (b)s явля- ется прямым произведением. Полупрямое произведение групп {а)п и {Ь)т> отвечающее числу к, обозначим через (а)п Хк (Ь)т. Оно опре- деляется соотношением balT1 =ак. Например, (а)п (b)2 есть группа диэдра Dn. Некоторые из полу- ченных таким образом полупрямых произведений могут оказаться изоморфными. А именно, при (s, т) = 1 мы можем заменить эле- мент b элементом bs, который также порождает группу (Ь); при этом к заменится на к5. Это показывает, что существенно не само число к, а циклическая подгруппа, порожденная элементом [к] в Z„. Например, имеются всего две неизоморфные группы, разлагающи- еся в полупрямое произведение групп (а)п и (b)s (одна из них есть прямое произведение этих групп). § 2. Коммутант Пусть G — какая-либо группа. Коммутатором элементов х, у е G называется элемент (^,у)=лух"1у"1. Очевидны свойства: 1) (*, у) = е <=> ху = ух; 2) (х,у)-1 = (у,х). Подгруппа, порожденная всеми коммутаторами, называется ком- мутантом группы G и обозначается (G, G) или Gz. Ввиду свой- ства 2) для образования коммутанта достаточно брать произве- дения коммутаторов. Коммутант тривиален тогда и только тогда, когда группа G абелева. Очевидно, что если (/?: G—*H — какой-либо гомоморфизм групп, то ^(Gz) с Н', а если </?(G) = Н, то </?(Gz) =Н'. В частности, комму- тант инвариантен относительно всех внутренних автоморфизмов группы, т. е. является нормальной подгруппой.
§ 2. Коммутант 449 Теорема 1. Коммутант G' группы G является наименьшей нор- мальной подгруппой, факторгруппа по которой абелева. Доказательство. 1) Пусть G/G' = А и я: G—*А— канонический гомоморфизм. Тогда А' = ti(G') = {е} и, значит, группа А абелева. 2) ПустьNcG — такая нормальная подгруппа, что факторгруп- па G/N = A абелева, и пусть л: G—★ А— канонический гомомор- физм. Тогда л (G') = А' = {е} и, значит, G' с N. □ Для анализа дальнейших примеров нам понадобятся следующие предложения, представляющие и независимый интерес. Предложение 1. Группа Ап порождается тройными циклами, а при п ^5 — произведениями пар независимых транспозиций. Доказательство. Так как группа Sn порождается транспозиция- ми, то группа Ап порождается произведениями пар транспозиций. Доказываемые утверждения вытекают из следующих соотношений: (y)(jk) = (yk), (y)(kO = (yk)(jkO, (y)(jk) = [(y)(Zrn)][(jk)(Irn)] (где i, j, k, I, m различны). □ Предложение 2. Группа SLn(K) порождается элементарными матрицами первого типа, т. е. матрицами вида Е + сЕ^ Доказательство. Слегка модифицируя метод Гаусса, покажем, что путем элементарных преобразований только первого типа лю- бую матрицу AGSLn(K) можно привести к единичной матрице. Отсюда, как и при доказательстве теоремы 4.4.2, будет следовать доказываемое утверждение. Пусть А = (ai}) G SLn (К), п > 1. Вначале с помощью элементарных преобразований первого типа добьемся того, чтобы ап = 1. Если 0 0 для некоторого i > 1, то этого можно добиться за один шаг, прибавив к 1-й строке z-ю строку с подходящим коэффициентом. Если = 0 для всех i > 1, то ап / 0 и, прибавив ко 2-й строке 1-ю строку, мы придем к уже рассмотренной ситуации. Если уже ап = 1, то, вычитая из каждой строки 1-ю строку с под- ходящим коэффициентом, добьемся того, чтобы = 0 при всех i > 1. После этого применим описанную процедуру к матрице по- рядка п — 1, получаемой вычеркиванием из матрицы А 1-й строки и 1-го столбца. Продолжая так дальше, мы в конце концов придем к треугольной матрице, все диагональные элементы которой, за ис-
450 Глава 10. Группы ключением, быть может, последнего, равны 1. Но так как опреде- литель матрицы был по условию равен 1 и он не изменился при сделанных преобразованиях, то и последний диагональный элемент полученной треугольной матрицы равен 1. Наконец, с помощью обратного хода метода Гаусса, как и обыч- но, приведем полученную унитреугольную матрицу к единичной матрице. □ Пример 1. Докажем, что S'n = Ап. Так как группа Sn/An абелева, то S'n с Ап. Так как группа S3 не абелева и |А31 = 3, то S'3 = А3. Сле- довательно, при любом п группа S'n содержит все тройные циклы и, значит, совпадает с Ап. Пример 2. Докажем, что A4 = V4 и А'п = Ап при п 5. Так как группа А4/У4 абелева, то А4 с У4, но так как группа А4 не абелева, то А4 = У4. Следовательно, при любом п группа А'п содержит все произведения пар независимых транспозиций и, значит, при п 5 совпадает с Ап. Пример 3. Докажем, что SLn(K)' = GLn(K)' = SLn(K), если по- ле К содержит более 3 элементов. (На самом деле это верно и при |К| 3, если только п 3.) Так как группа GLn(K)/SLn(K) абеле- ва, то GLn(K)' с SLn(K). Непосредственное вычисление показывает, что ш ли; он; пн Следовательно, если в поле К найдется элемент Л 0, ±1, то группа SLn(K)' содержит все элементарные матрицы первого типа и, зна- чит, совпадает с SLn(K). Задача 1. Найти коммутант группы (a)nXfc (Ь)т (см. пример 1.16). Определим кратные коммутанты G(fc) группы G следующим об- разом: G(1) = G', G(fc+1) = (G(fc))'. Определение 1. Группа G называется разрешимой, если суще- ствует такое натуральное т, что G(m) = {е}. Очевидно, что всякая подгруппа и всякая факторгруппа разре- шимой группы разрешимы. Обратно, если нормальная подгруппа N группы G и факторгруппа G/N разрешимы, то и группа G разреши- ма (докажите это). Пример 4. Как следует из примеров 1 и 2, группа Sn разрешима при п $4 и не разрешима при п 5.
§ 3. Действия 451 Пример 5. Докажем индукцией по п, что группа ВП(Х) (невы- рожденных) треугольных матриц разрешима. Группа Bj (К) ~ К* абе- лева. Далее, вычеркивая из каждой треугольной матрицы поряд- ка п последнюю строку и последний столбец, мы получаем гомомор- физм По предположению индукции группа В^/Ю^ВДЮ/Кег/ разрешима. Группа Ker f состоит из матриц вида С 0 С11 П ’’ (5) U 1 сп_, ко ... О сп У Поставив в соответствие каждой такой матрице число сп, мы по- лучаем гомоморфизм Ker f -»К*, ядро которого состоит из матриц вида (5) с сп = 1 и, как легко видеть, коммутативно. Следовательно, группа Кег/, а значит, и группа ВП(К), разрешимы. § 3. Действия Напомним, что через S(X) мы обозначаем группу всех преобра- зований (взаимно однозначных отображений на себя) множества X. В частности, S({ 1,..., n}) = Sn — симметрическая группа, или груп- па подстановок. Всякая подгруппа группы S(X) называется группой преобразова- ний множества X. Многочисленные примеры групп преобразова- ний уже встречались нам в этом курсе. Понятие действия группы близко к понятию группы преобразо- ваний, но язык действий более гибок. Определение 1. Действием группы G на множестве X называет- ся любой гомоморфизм a: G — S(X). Иначе говоря, задать действие G на X — это значит поставить в соответствие каждому g G G преобразование a(g) G S(X) таким
452 Глава 10. Группы образом, что a(gh) = a(g)a(h). (6) По общему свойству гомоморфизмов единице группы G соответству- ет тождественное преобразование id, а обратному элементу — об- ратное преобразование. Результат применения преобразования a(g) к «точке» хеХ обо- значается через a(g)x или, если ясно, о каком действии идет речь, просто через gx. Свойство (6) переписывается в виде «ассоциатив- ности»: (gh)x = g(hx). Если задано действие а группы G на X, то пишут G : X или просто G:X. а Всякая группа преобразований G с S(X) действует на X «тавто- логически» — путем тождественного гомоморфизма G S(X). Обратно, для любого действия G : X подгруппа Im а с S(X) есть некоторая группа преобразований множества X. По теореме о гомо- морфизме Ima~G/Kera. Нормальная подгруппа Ker а с G называется ядром неэффективно- сти действия а. Если Кега = {е}, то действие а называется эффек- тивным. Частным случаем действия является линейное представление — гомоморфизм группы G в группу GL(V) (обратимых) линейных пре- образований векторного пространства V. Всякое действие G : X естественным образом порождает ряд дру- а гих действий: на любом инвариантном подмножестве множества X, на множестве всех (или не всех) подмножеств множества X, на фак- тормножестве множества X по инвариантному отношению эквива- лентности и т. п. Отметим особо индуцируемое действием а линей- ное представление а* группы G в пространстве всех (или не всех) функций на X со значениями в поле К, определяемое по формуле (a*(g)/)(x) = /(a(g)-1x). (7) Обычно мы опускаем символ а; тогда эта формула переписывается в виде (g/)(x)=/(g-1x). (8)
§ 3. Действия 453 Всякое действие G: X, ограниченное на подгруппу Н с G, опреде- ляет действие Н: X. Для любой группы G определяются следующие три ее важных действия на самой себе: 1) действие I левыми сдвигами: l(g)x = gx; 2) действие г правыми сдвигами: r(g)x = xg-1; 3) действие а сопряжениями (внутренними автоморфизмами): a(g)x = gxg-1. Действие I (а также г) эффективно, так что G ~ Im Z с S(G). Отсю- да, в частности, получается теорема Кэли: всякая конечная группа порядка п изоморфна некоторой подгруппе группы Sn. Ядро неэф- фективности действия а, как мы уже видели в §1, есть центр Z группы G. Действие G: X определяет на множестве X отношение эквива- лентности ~ по правилу: х ~ у, если существует g е G, такой, что у = gx (проверьте аксиомы отношения эквивалентности!). Классы эквива- лентности называются орбитами. Таким образом, орбита, содержа- щая точку х (орбита точки х), есть подмножество Gx = {gx:geG}cX. Если все элементы множества X эквивалентны (т. е. имеется всего одна орбита), то действие называется транзитивным. Пример 1. Орбиты группы поворотов плоскости вокруг точки о суть окружности с центром в точке о и сама эта точка. Пример 2. Группа всех движений и даже группа параллельных переносов действуют на плоскости транзитивно. Пример 3. Четверная группа Клейна У4 действует на множестве {1, 2, 3, 4} транзитивно. Пример 4. Если ограничить действие I (соответственно г) груп- пы G на себе на подгруппу Н с G, то орбитами будут правые (соот- ветственно левые) смежные классы по Н.
454 Глава 10. Группы Элементы группы G, эквивалентные относительно действия а группы G на себе сопряжениями, называются сопряженными, а ор- биты этого действия — классами сопряженных элементов. Если группа G задана как группа преобразований некоторого множества X, то описание ее классов сопряженных элементов мо- жет быть получено с помощью следующего простого соображения: если элемент g G G переводит точку х в точку у, то элемент hgh~r переводит точку hx в точку hy. Пример 5. Пусть подстановка ст е Sn разложена в произведение независимых циклов: a = (i1i2...ip)01j2.. Тогда для любой подстановки т eSn имеем: тстт-1 = (T(i1)T(i2)...T(ip))(T(;i)T(;2)...T0q))... Отсюда следует, что две подстановки сопряжены тогда и только то- гда, когда в их разложениях в произведение независимых циклов наборы длин циклов совпадают. Таким образом, число классов со- пряженных элементов в группе Sn равно числу (неупорядоченных) разбиений числа п в сумму натуральных чисел. Пример 6. Группа Isom+ Е2 собственных движений плоскости состоит из параллельных переносов и поворотов (см. §7.4). Из сформулированного выше принципа следует, что движение, сопря- женное при помощи движения h параллельному переносу на век- тор а, есть параллельный перенос на вектор dh(a) (см. рис. 1, а)). (Впрочем, мы уже доказали это в §4.2.) Аналогичным образом, движение, сопряженное при помощи собственного движения h повороту на угол а вокруг точки о, есть поворот на угол а вокруг Рис. 1
§ 3. Действия 455 точки ho (см. рис. 1, б)). Таким образом, классы сопряженных эле- ментов группы Isom+ Е2 суть подмножества следующих двух видов: 1) совокупность параллельных переносов на векторы заданной длины г 0; 2) совокупность поворотов на заданный угол a G (0,2л). Задача 1. Описать классы сопряженных элементов в группе вра- щений куба. Пусть заданы действия а и /3 одной и той же группы G на мно- жествах X и Y соответственно. Отображение f: X —> Y называется эквивариантным или, точнее, G-эквивариантным, если для любого g € G диаграмма f f коммутативна. Эквивариантная биекция называется изоморфизмом действий. (Диаграмма, состоящая из множеств и отображений, на- зывается коммутативной, если композиция отображений вдоль лю- бых двух путей, имеющих общее начало и общий конец, дает один и тот же результат.) Подгруппа Gx = {geG: gx = x} называется стабилизатором точки х. Для любой подгруппы HcG определим действие группы G на множестве G/Н левых смежных классов по Н формулой g(uH) = (gu)H. Следующая теорема, показывающая, что действие группы G на орбите Gx с точностью до изоморфизма определяется стабилизато- ром точки х, является обобщением и уточнением теоремы 4.5.2. Теорема 1. Отображение f: Gx^G/Gx, y^G? = {geG:gx = y} является изоморфизмом действий. Доказательство. 1) Покажем, что при у = gx подмножество Gx совпадает со смежным классом gGx. Действительно, 81Х = у <=> g-1gix = x <=> g_1giGGx <=> gi€gGx.
456 Глава 10. Группы 2) Из определения ясно, что отображение f биективно. 3) Покажем, что отображение f эквивариантно. Пусть у = их (ueG). Для любого gG G имеем f (gy) =f ((gu)x) = (gu)Gx=g(uGx) = gf(y). □ Следствие 1. Всякое транзитивное действие группы изоморфно ее действию на множестве левых смежных классов по некоторой подгруппе. Следствие 2. Если группа G конечна, то |GX| = M. (9) (Здесь |Gx| обозначает число элементов орбиты Gx.) Легко видеть, что Ggx = gGxg-1. (10) Так как в теореме 1 в качестве точки х можно взять любую точку ор- биты, то отсюда следует, что для любой подгруппы Н с G и любого gGG действия группы G на G/Н и на G/gHg~x изоморфны. Ядро неэффективности действия G: G/Н есть пересечение стаби- лизаторов всех точек, т. е. Q gHg”1. Это наибольшая нормальная geG подгруппа группы G, содержащаяся в Н. В частности, подгруппа Н нормальна тогда и только тогда, когда она тривиально действует на G/H. Пример 7. Пусть К с Е3 — куб. Изоморфизм S4 Sym.,. К (см. пример 4.6.19) определяет действие S4: Е3. В свою очередь, это дей- ствие индуцирует действие группы S4 на множестве вершин куба, на множестве его диагоналей и т.д. В табл. 1 перечислены неко- торые получаемые таким образом транзитивные действия S4 : X. Для каждого из них указан стабилизатор Н одного из элементов множества X. Во всех случаях |Х|\Н| = |S4| = 24, как и должно быть согласно следствию 2 теоремы 1. Пример 8. Докажем, что если |G| = п < & и р — наименьший простой делитель числа п, то всякая подгруппа Н cG индекса р нормальна. Действительно, рассмотрим действие Н : G/Н. Число элементов любой орбиты этого действия делит \Н\ и, значит, либо равно 1, либо больше или равно р. Так как \G/H\= р и имеется
§ 3. Действия 457 Таблица 1 Элементы множества X |Х| |Н| Н ребра куба 12 2 ((12)) диагонали граней куба 12 2 <(12)(34)) вершины куба 8 3 ((123)) грани куба 6 4 ((1234)) пары противоположных ребер куба 6 4 ((12), (34)) пары противоположных вершин (или диагонали) куба 4 6 s3 пары противоположных граней куба 3 8 (V4, (1234)) по меньшей мере одна неподвижная точка (смежный класс еН), то отсюда следует, что действие тривиально. Задача 2. Пусть задано действие конечной группы G на конеч- ном множестве X. Множество орбит этого действия обозначим че- рез Х/G, и для каждого элемента g G G множество его неподвижных точек в X обозначим через X8, Доказать формулу Бернсайда: IWI = iFi S 1^1- М geG (Указание: подсчитать двумя способами число элементов множе- ства F = {(g, x)eGxX: gx = x}.) Задача 3. Пользуясь формулой Бернсайда и задачей 1, найти чис- ло существенно различных раскрасок граней куба в 3 цвета. (Две раскраски считаются существенно различными, если они не могут быть совмещены путем вращения куба.) Для действия группы G на самой себе сопряжениями стабилиза- тором точки х служит подгруппа Z(x) = {gGG: gx = xg}, называемая централизатором элемента х. Обозначим через С(х) класс сопряженных элементов (орбиту этого действия), содержа- щий х. Для конечной группы G формула (9) дает 1№)| = ^. (И)
458 Глава 10. Группы Действие группы G сопряжениями на самой себе порождает ее действие на множестве ее подгрупп. Подгруппы, эквивалентные от- носительно этого действия, называются сопряженными. (Так, ста- билизаторы эквивалентных точек для любого действия группы G являются в силу формулы (10) сопряженными подгруппами.) Стаби- лизатором подгруппы Н с G для этого действия служит подгруппа N(H) = {g€G:gHg-1 = H}, называемая нормализатором подгруппы Н. В случае конечной груп- пы G формула (9) показывает, что число подгрупп, сопряженных подгруппе Н, равно [G: N(H)] (индексу подгруппы N(H)). Отметим, что N(H) D Н и потому в случае конечной группы [G : N(H)] делит [G:H]. § 4. Теоремы Силова Пусть р — простое число. Напомним, что конечная группа G на- зывается р-группой, если |G| = pn. Теорема 1. Центр нетривиальной р-группы нетривиален. Доказательство. Пусть G — нетривиальная р-группа, a Z — ее центр. Множество G \ Z разбивается на нетривиальные классы со- пряженных элементов, число элементов в каждом из которых, со- гласно формуле (11), делится на р. Следовательно, число элементов центра также делится на р. □ Следствие 1. Всякая р-группа разрешима. Доказательство. Пусть G — нетривиальная р-группа, a Z — ее центр. Доказывая утверждение индукцией по п = logp |G|, мы можем считать, что группа G/Z разрешима. Так как группа Z тоже разреши- ма (даже абелева), то отсюда следует, что и группа G разрешима. □ Следствие 2. Всякая группа порядка р2 абелева. Доказательство. Пусть G — группа порядка р2 и Z — ее центр. Предположим, что Z / G. Тогда \Z\ = р и | G/Z | = р, так что группа G/Z является циклической. Пусть aZ — ее порождающий элемент. Тогда каждый элемент g G G представляется в виде g = akz (z G Z). Ho любые два элемента такого вида коммутируют, что противоречит нашему предположению. □ Пусть теперь |G| =рпт, где (р, гп) = 1.
§ 4. Теоремы Силова 459 Определение 1. Силовской р-подгруппой группы G называется всякая ее подгруппа порядка рп. Теорема 2. Силовская р-подгруппа существует. Доказательство. Если группа G абелева, то ее (единственной) силовской р-подгруппой является подгруппа р-кручения (см. §9.1). В общем случае докажем теорему индукцией по |G|. Если |G| = 1, то доказывать нечего. Пусть |G| > 1. Рассмотрим разбиение группы G на классы сопряженных элементов. Возможны два случая. 1-й случай. Существует нетривиальный класс С(х), число эле- ментов которого не делится на р. Тогда |Z(x)| делится на рп и по предположению индукции в Z(x) имеется подгруппа порядка рп. Она и будет силовской р-подгруппой в G. 2-й случай. Не существует такого класса. Тогда, как и в доказа- тельстве теоремы 1, получаем, что |Z| делится на р. Пусть |Z| = рп°гл0, где (р, гп0) = 1, и пусть Zx с Z — подгруппа порядка рп°. В группе G/ZXy порядок которой равен рп-п°пг, по предположению индукции существует подгруппа порядка рп“п°. Ее полный прообраз при кано- ническом гомоморфизме G-+ G/Zx и будет силовской р-подгруппой в G. □ Теорема 3. Всякая р-подгруппа группы G содержится в некото- рой силовской р-подгруппе. Все силовские р-подгруппы сопряжены. Доказательство. Пусть S с G — силовская р-подгруппа и Si — какая-либо р-подгруппа. Рассмотрим действие на G/S. Так как число элементов любой нетривиальной -орбиты делится на р, а число всех элементов множества G/S не делится на р, то Sj имеет в G/S неподвижные точки. Если gS— такая точка, то с gSg-1, что доказывает первое утверждение теоремы. Если, кроме того, — силовская р-подгруппа, то сравнение порядков дает равенство Si=gSg-1. □ Задача 1. Рассуждая аналогичным образом, доказать, что в груп- пе порядка рп всякая подгруппа Н порядка pfc, к < и, имеет непо- движные точки в G/Н, отличные от еН. Вывести отсюда, что / /Ни что Н содержится в некоторой подгруппе порядка pfc+1. Теорема 4. Число силовских р-подгрупп сравнимо с 1 по моду- лю р. Доказательство. Пусть S — силовская р-подгруппа и C(S) — класс подгрупп, сопряженных S. По теореме 3 это и есть сово- купность всех силовских р-подгрупп. При действии G на C(S) со-
460 Глава 10. Группы пряжениями стабилизатором любой подгруппы S' е C(S) служит ее нормализатор N(S'). Ограничим это действие на S. Тогда C(S) каким-то образом разобьется на нетривиальные S-орбиты, число элементов в каждой из которых делится на р, и на неподвижные точки. Докажем, что единственной неподвижной точкой является сама подгруппа S, откуда и будет следовать что |C(S)| = 1 (mod р). Пусть S' G С(S) — неподвижная точка. Это означает, что S с N(S'). Тогда S и S' — силовские р-подгруппы группы N(S') и, значит, сопря- жены в ней. Но S' — нормальная подгруппа в N(S')« Следовательно, S = S'. □ Теорема 4 в соединении с тем фактом, что число силовских р-под- групп делит индекс (любой) силовской р-подгруппы, иногда позво- ляет доказать, что силовская р-подгруппа единственна и, значит, нормальна. Пример 1. Докажем, что всякая группа G порядка pq, где р и q — различные простые числа, является полупрямым произведением циклических групп порядков р и q (см. пример 1.16). Действительно, пусть р > q. Тогда силовская р-подгруппа Gp нормальна в силу примера 3.8. Если Gq — силовская q-подгруппа, то Gp П Gq = {е} и, значит, |GpGq| = pq = |G|. Следовательно, G = GpXGq. Пример 2. Докажем, что всякая группа G порядка 45 абелева. Действительно, пусть Np (р = 3,5) — число ее силовских р-подгрупп. Тогда N3 = l (mod 3),N3|5 => N3 = l, N5 = l (mod 5),N5|9 => N5 = l, так что силовские подгруппы G3 и G5 нормальны и G = G3 х G5. Но группа G3 имеет порядок 9 и, значит, абелева (следствие 2 теоре- мы 1). Следовательно, и группа G абелева. Задача 2. Доказать, что все группы порядка < 60 разрешимы. (Указание: доказать, что если |G| = п < 60, то для некоторого про- стого р, р | и, число N силовских р-подгрупп группы G не превосхо- дит 4; если при этом N > 1, то, рассмотрев действие группы G на
§ 5. Простые группы 461 множестве силовских р-подгрупп сопряжениями, получить нетриви- альный гомоморфизм G —>SN.) § 5. Простые группы Определение 1. Нетривиальная группа G называется простой, если она не содержит нетривиальных (т. е. отличных от {е} и G) нормальных подгрупп. Всякая разрешимая простая группа G есть циклическая груп- па простого порядка. Действительно, так как G' 0 G, то G' = {е}, т. е. группа G абелева. Но в абелевой группе все подгруппы нормаль- ны. Следовательно, группа G циклическая и, более того, простого порядка. Таким образом, простые группы бывают двух типов: 1) абелевы, к которым относятся лишь циклические группы про- стого порядка; 2) неабелевы (и, следовательно, неразрешимые). Примером неабелевой простой группы может служить группа Д5 (доказательство ее простоты см. ниже). Значение простых групп может быть пояснено следующими со- ображениями. Пусть имеется цепочка вложенных подгрупп G = Go DGi D... DG,^ JGm = {e}, (12) в которой Gi+1 < Gt (i = 0,1,..., m - 1). Если факторгруппа содержит нетривиальную нормальную подгруппу N, то между G1 и Gl+1 можно вставить еще одну подгруппу, а именно полный про- образ N при каноническом гомоморфизме Gt —> F(. Поэтому, если, например, группа G конечна, то можно построить цепочку (12), в ко- торой все факторы просты. В любом случае такая цепочка, если она существует, называется композиционным рядом группы G. Несложно доказывается теорема Жордана—Гёлъдера: если груп- па G обладает композиционным рядом, то набор его факторов опре- делен однозначно с точностью до перестановки. Таким образом, с каждой группой, обладающей композиционным рядом (например, с каждой конечной группой), каноническим образом связывается набор простых групп. Поэтому классификация простых групп имеет фундаментальное значение для понимания строения любых групп.
462 Глава 10. Группы Задача 1. Доказать, что конечная группа разрешима тогда и только тогда, когда все факторы ее композиционного ряда абелевы. Классификация неабелевых простых конечных групп чрезвы- чайно сложна. Она была получена в результате 30-летней работы нескольких сотен математиков всего мира, завершившейся в 1981 г. Мы ограничимся рассмотрением примеров. Предложение 1. Группа Ап проста при п 5. Лемма 1. Если в разложении подстановки сгеАп в произведение независимых циклов присутствует цикл четной длины или два цик- ла одинаковой нечетной длины, то класс сопряженности подстанов- ки сг в Ап совпадает с ее классом сопряженности в Sn. (Неподвижный символ следует рассматривать как цикл дли- ны 1.) Доказательство. В любом из рассматриваемых случаев в цен- трализаторе подстановки сг в группе Sn имеется нечетная подстанов- ка т0. Действительно, если в разложении сг присутствует цикл чет- ной длины, то в качестве т0 можно взять этот цикл, а если присут- ствуют циклы одинаковой нечетной длины q, то можно взять т0 = (iiJi)(12J2)• • Пусть теперь т —любая нечет- ная подстановка. Тогда тстт"1 = (тт0)<т(тт0)~ \ причем подстановка тт0 уже четна. □ В частности, все произведения пар независимых транспозиций, а при и £ 5 и все тройные циклы сопряжены не только в Sn, но и в Ап. Доказательство предложения 1. Пусть N с Ап — нормальная подгруппа, содержащая какую-то подстановку сг 0 е. Возведя подста- новку сг в подходящую степень, можно добиться, чтобы она имела простой порядок р. Тогда сг есть произведение какого-то числа неза- висимых циклов длины р. Рассмотрим отдельно три возможности. 1) Пусть р 5. Запишем подстановку сг в виде a = (i1i2i3i4...ip)T, где т — произведение остальных циклов (если их нет, то т = е), и со- пряжем ее с помощью тройного цикла Мы получим (см. при- мер 3.5): ст' = (11121з)ст(11121з)_1 = (i2i3i1i4...ip)TeN
§ 5. Простые группы 463 и, значит, сг'ст 1 = Так как все тройные циклы сопряже- ны в Ап и группа Лп ими порождается (см. предложение 2.1), то N = An. 2) Пусть р = 3. Если сг есть просто тройной цикл, то, как и выше, получаем, что N = An. В противном случае запишем подстановку сг в виде a = (i1i2i3)(j1j2j3)T> где т — произведение остальных циклов, и сопряжем ее с помощью подстановки (iiJi)(i2j2). Мы получим: а' = (‘1 адз) € N> (j'q-i = (ЙЛ )(ШeN- Так как все произведения пар независимых транспозиций сопряже- ны в Ап и группа Ап ими порождается (см. предложение 2.1), то и в этом случае N = Ап. 3) Пусть, наконец, р = 2. Тогда подстановка сг есть произведение какого-то четного числа независимых транспозиций. Запишем ее в виде <7 = (i1i2)(i3i4)T> где т — произведение остальных транспозиций, и сопряжем с помо- щью цикла (Ц1*213). Мы получим: от'=(121’з)(Ц14)т€^ откуда, как и выше, следует, что N = Ап. □ В частности, группа А5 является простой группой порядка 60. В силу задачи 4.2 это наименьший порядок, который может иметь неабелева простая группа. Заметим, что при п = 5 предыдущее дока- зательство сильно упрощается, сводясь (с учетом леммы) к рассмот- рению случая, когда а — цикл длины 5. Задача 2. Доказать, что единственной нетривиальной нормаль- ной подгруппой группы А4 является четверная группа Клейна У4. Задача 3. Доказать, что всякая простая группа G порядка 60 изо- морфна А5. (Указание: рассмотрев действие группы G на множестве силовских 5-подгрупп, получить вложение G с А6; далее рассмот- реть действие группы G на A6/G.)
464 Глава 10. Группы В качестве примера еще одной серии простых групп приведем без доказательства следующий факт: при п 2 группа PSLn (К) = SLn (К)/{ЛЕ: Л G К*, Лп = 1} проста, за исключением случаев, когда п = 2 и К — конечное поле из 2 или 3 элементов. Задача 4. Найти порядок группы PSL2(Fq), где Fq — конечное по- ле из q элементов. Доказать, что PSL2 (F2) S3, PSL2 (F3) Л4, PSL2 (F4) PSL2 (F5) A5. (Указание: рассмотреть естественное действие группы G = PSL2(Fq) на проективной прямой P(F^) над полем Fq; при q = 5 рассуждать, как в задаче 3.) Группа PSL2(F7) есть простая группа порядка 168. Это следую- щая по порядку неабелева простая группа после группы Д5. Группа PSL2(F9), как можно показать, изоморфна группе А6. Задача 5. Доказать, что группа PSL2(C) проста. В качестве примера использования геометрических соображе- ний для доказательства простоты (бесконечной) группы докажем, что группа SO3 проста. Всякий элемент группы SO3 есть поворот на некоторый угол а вокруг некоторой оси. Преобразование, сопряженное с помощью элемента g G SO3 повороту на угол а вокруг оси Z, есть поворот на тот же угол а вокруг оси gl (ср. пример 3.6). Поэтому всякая нормальная подгруппа группы SO3 вместе с поворотом на угол а вокруг какой-либо оси должна содержать поворот на угол а вокруг любой оси. Легко видеть (ср. пример 6.3.4), что произведение поворотов на л вокруг осей т и гл', образующих между собой угол у, есть поворот на угол 2у вокруг оси, перпендикулярной плоскости осей т и гл'. Предположим теперь, что N с SO3 — нормальная подгруппа, со- держащая поворот $ на угол ае (0,2л) вокруг какой-то оси I. Пусть g — поворот на л вокруг оси гл, образующей с осью I угол в G G [0, л/2]. Тогда h = g(sgs~1') = (gsg-1)s-1 G N; но так как sgs"1 есть поворот на л вокруг оси $гл, то, согласно предыдущему замечанию, h есть поворот на угол 2у, где у — угол
§ 6. Расширения Галуа 465 Рис. 2 между тп и sm (см. рис. 2). Угол у равен 0 при в = 0 и равен а при 9 = л/2. Из соображений непрерывности следует, что он может при- нимать любые значения в отрезке [0, а]. Следовательно, группа N содержит повороты на все углы из отрезка [0,2d]. Возведением этих поворотов в степени можно получить поворот на любой угол. Это показывает, что N = SO3. Можно показать, что группа SOn проста при любом п 3, за исключением п = 4. Отсутствие простоты группы SO4 является уди- вительным обстоятельством, которое будет обсуждено в § 12.4. § 6. Расширения Галуа Расширения поля К, получаемые присоединением корней раз- личных неприводимых многочленов, могут оказаться изоморфны- ми или, более общо, одно из них может изоморфно вкладываться в другое. Выяснить, когда это имеет место, не так просто. Изуче- нием гомоморфизмов (и, в частности, автоморфизмов) алгебраиче- ских расширений полей как раз и занимается теория Галуа. В §4.2 было рассказано о том, какую роль играют группы в гео- метрии и физике. Однако своим происхождением теория групп обя- зана теории Галуа, в которой группы появляются принципиально
466 Глава 10. Группы иным образом. Идеи теории Галуа находят воплощение и в других разделах математики. Так, аналогом теории Галуа в топологии яв- ляется теория накрытий (в частности, аналогом группы Галуа поля является фундаментальная группа топологического пространства), а в теории функций комплексной переменной — теория голоморф- ных отображений римановых поверхностей. Пусть L — конечное расширение степени п поля К. Автоморфиз- мы поля L над К образуют группу, которую мы обозначим через AutK L. Предложение 1. |AutK L\ п. Доказательство. Поле L может быть получено из К последова- тельными простыми расширениями: K = KQCK1CK2 С...с KS = L, где Ki получается из присоединением корня какого-то непри- водимого многочлена ft е [х]. Согласно лемме 9.5.1, любой гомо- морфизм : Kt_} —> L продолжается до гомоморфизма : К;—>L не более чем ni = degZ = dimK. , К, способами. Следовательно, тождественный автоморфизм поля К продолжается до автоморфизма поля L не более чем n1n2...ns = п способами. □ Пусть G с AutK L — какая-то (конечная) группа автоморфизмов поля L над К. Обозначим через LG подполе G-инвариантных элемен- тов поля L. Теорема 1. LG = К тогда и только тогда, когда |G| = п. Кроме то- го, если Lg = К, то для любых полей Р, Q, таких, что К с Р С Q с L, всякий гомоморфизм ср: Р —> L над К продолжается до гомоморфиз- ма ф: Q—>L ровно dimP Q способами. Доказательство. 1) Согласно определению, G с AutLG L. Следо- вательно, |G| dimLG L $ dimK L = п. Если же |G| = п, то dimLG L = dimK L и, значит, LG = К. 2) Обратно, пусть LG = К. Для любого элемента а е L пусть {cq,..., ат} — его G-орбита. Тогда т / = П(х-а,)б1с[х]=К[х] (13) i=l
§ 6. Расширения Галуа 467 есть минимальный многочлен элемента а над К. По построению он разлагается на различные линейные множители в £[х]. Докажем теперь второе утверждение теоремы. Так как всякое конечное расширение может быть получено путем последователь- ных простых расширений, то достаточно доказать его в случае, ко- гда Q = Р(а) — простое расширение поля Р. Пусть h — минималь- ный многочлен элемента а над Р. Тогда h делит минимальный мно- гочлен / элемента а над К в кольце Р[х]. Следовательно, № де- лит f в кольце (Р) [х] и, значит, разлагается на различные линей- ные множители в 1[х]. Согласно лемме 9.5.1, гомоморфизм про- должается до гомоморфизма гр: Q —> L ровно deg h = dimp Q спосо- бами. Применяя доказанное утверждение к случаю Р = Kt Q = L, полу- чаем, что |AutK L\ = и. Остается доказать, что G = AutK L. Пусть ср G AutK L. Тогда для лю- бого aGL элемент </?(а), как и а, является корнем многочлена (13), т.е. существует такой элемент gGG (быть может, зависящий от а), что </?(a) = ga. Если поле L конечно, то в качестве а возьмем элемент, порожда- ющий группу L*, и тогда мы получим, что ip = g G G. Если же L (и, стало быть, К) бесконечно, то для каждого gGG положим Lg = {aeL: </?(а) = ga}CL. Очевидно, что Lg— подпространство над К (и даже подполе). Из доказанного следует, что L = U Lg' geG Отсюда мы должны получить, что на самом деле L = Lg для некото- рого gGG. Это вытекает из следующей ниже леммы. □ Лемма 1. Конечномерное векторное пространство V над беско- нечным полем не может быть покрыто конечным числом собствен- ных подпространств. s Доказательство. Пусть V = |J Vif где Уь ..., Vs — собственные i=l подпространства. Для каждого i возьмем какую-нибудь ненулевую линейную функцию lt G V*, обращающуюся в нуль на V-, и рассмот- s рим многочлен F = П Ц. Из условия следует, что F(v) = О для любого i=l v G V; но тогда F — нулевой многочлен, что, очевидно, неверно. □
468 Глава 10. Группы Определение 1. Конечное расширение L поля К называется рас- ширением Галуа, если |AutKL| = dimKL. Группа AutK L в этом случае называется группой Галуа расширения L и обозначается через GalL/K. (Косая черта здесь не подразумевает никакого факторобразова- ния.) Из теоремы 1 следует, что если L — расширение Галуа поля К и Р D L — подполе, содержащее К, то L — расширение Галуа поля Р. Многочлен f G К[х] называется сепарабельным, если он не имеет кратных корней ни в каком расширении поля К. Обозначим через /' формальную производную многочлена f. Предложение 2. Многочлен f еК[х] сепарабелен тогда и толь- ко тогда, когда (J, f') = 1. Доказательство. Заметим, прежде всего, что наибольший об- щий делитель любых двух многочленов /, g еК[х] может быть най- ден с помощью алгоритма Евклида и потому не изменяется при любом расширении поля К. С другой стороны, если над каким-либо расширением L поля К многочлен / имеет кратный корень с, то с бу- дет также корнем производной и, значит, (/, /')/!. Таким образом, если (/, /') = 1, то многочлен / сепарабелен. Обратно, если многочлен / сепарабелен и L — какое-либо расши- рение поля К, над которым он разлагается на линейные множители, то ни один из его корней в L не является корнем производной (по- скольку все они простые) и, значит, (/, /') = 1. □ Из доказанного предложения следует, что неприводимый много- член несепарабелен, только если его производная является нулевым многочленом. Это, конечно, невозможно, если char К = 0; если же char К = р > 0, то это имеет место только для многочленов вида f = а0 + ^1ХР 4- а2х2р 4-... 4- атхтр. (14) Таким образом, всякий неприводимый многочлен f над полем нуле- вой характеристики или над полем характеристики pfdeg/ сепара- белен. Предложение 3. Всякий неприводимый многочлен над конечным полем сепарабелен. Доказательство. Пусть f — несепарабельный неприводимый многочлен над конечным полем К характеристики р. Тогда он
§ 6. Расширения Галуа 469 имеет вид (14). Так как Кр = К (см. §9.5), то существуют такие b0, Ь19 ...,ЬтеК, что Ь? = afc; но тогда f = (b0 + b1x + b2x2 + ... + bmxmy, (15) что противоречит предположению о неприводимости. □ Примером несепарабельного неприводимого многочлена может служить многочлен xp-t = (x_ pjty над полем Zp(t)- Теорема 2. Пусть f еК[х] —многочлен, все неприводимые мно- жители которого сепарабельны. Тогда его поле разложения над К является расширением Галуа. Доказательство получается путем анализа доказательства вто- рой части теоремы 9.5.6 в случае L = L с учетом того, что в условиях настоящей теоремы все многочлены / сепарабельны. □ Заметим, что если L — поле разложения многочлена f е К[х], то любой автоморфизм ср поля L над К сохраняет множество корней многочлена /, каким-то образом их переставляя. Так как L = K(alt то автоморфизм ср однозначно определяется той перестановкой, которую он осуществляет на множестве корней. Тем самым группа AutK L изоморфно вкладывается в Sn. Пример 1. Как следует из формулы для решения квадратного уравнения, всякое квадратичное расширение поля К характеристи- ки 2 имеет вид К (л/d), где d G К \ К2. Всякое такое расширение является расширением Галуа. Его группа Галуа порождается авто- морфизмом а + Ьд/d—>а-Ьл/3 (a, be К). Пример 2. Всякое конечное поле Fq, q = рп, является расшире- нием Галуа поля Zp. Его группа Галуа — это циклическая группа порядка п, порождаемая автоморфизмом Фробениуса. Пример 3. Круговое поле Кп = Q(e2fn/n) есть поле разложения многочлена хп — 1 над Q и потому является расширением Галуа по- ля Q. Всякий автоморфизм поля Кп индуцирует автоморфизм (цик- лической) группы Сп корней п-й степени из 1, содержащейся в Кп. Как мы знаем, всякий автоморфизм группы Сп есть возведение в сте- пень к, взаимно простую с п. Тем самым группа GalKn/Q вклады- вается в группу Z*, порядок которой равен <р(п) (где ip —функция Эйлера). На самом деле это вложение является изоморфизмом. Для того чтобы это доказать, достаточно установить, что для любого
470 Глава 10. Группы простого р, не делящего и, существует автоморфизм поля Кп, ин- дуцирующий на Сп возведение в р-ю степень. Последнее означает, что если f — минимальный многочлен числа е = е2т/п над Q, то /СеР) = О. Можно считать, что f — примитивный многочлен с целыми ко- эффициентами. Тогда по лемме Гаусса хп - 1 = /g, где g G Z[x]. Легко видеть, что многочлен хп -1 остается сепарабельным при редукции по модулю р. Следовательно, многочлены [/]р и [g]p взаимно про- сты. Предположим теперь, что f(ep) 0. Тогда g(e₽) = 0 и, следова- тельно, g(xp)=/WhW, heZ[x]. Редуцируя по модулю р, получаем [g]^ = [/]pWp, что противоречит взаимной простоте многочленов [/]р и [g]p. Таким образом, dimQ Кп = <р(п). Пример 4. Пусть L — поле разложения неприводимого кубиче- ского многочлена f с дискриминантом D над полем К характери- стики 0 2,3 (см. пример 9.5.3). Тогда L — расширение Галуа поля К, и если D $ К2, то dimK L = 6 и GalL/K ~ S3. Если же De К2, то dimKL = 3 и GalL/K А3. Последнее означает, что группа Галуа осуществляет только четные перестановки корней многочлена f. Пример 5. Пусть f = xn Н-а^И"14-... +ап_1Х + ап — «общий» многочлен степени п, коэффициенты которого рас- сматриваются как элементы поля К = к(аь ..., ап) рациональных функций от и независимых переменных над некоторым полем к. Пусть L — поле разложения многочлена f над К и хь ..., хп е L — его корни. По формулам Виета ak = (-l)fco\, гДе СЪ •••> ап — элемен- тарные симметрические многочлены от хь ...,хп. Следовательно, L = k(xb ..., хп). Так как tr. deg L = tr. deg К = п, то х1э..., хп алгебраически независимы над к. В частности, они раз- личны, так что f — сепарабельный многочлен и L — расширение
§ 7. Основная теорема теории Галуа 471 Галуа поля К, Любая перестановка корней хп определяет авто- морфизм поля L, тождественный на К. Следовательно, Gal L/K^Sn. Одновременно мы доказали, что ...,xn)s"=k(<Ti, ...,сгп). § 7. Основная теорема теории Галуа В теории Галуа устанавливается соответствие между подполями расширения Галуа L поля К, содержащими К, и подгруппами группы G = GalL/K. А именно, каждому подполю Р с L, содержащему К, ставится в соответствие подгруппа GP = {gGG: g|р = id}сG и каждой подгруппеHcG ставится в соответствие подполе LH = {aeL: ha = a VheH}cL. Теорема 6.1 показывает, что |Gp| = dimPL, (16) dirnLH L = \H\. (17) Теорема 1 (основная теорема теории Галуа). Описанные выше отображения P^GpuH^LH взаимно обратны и, таким образом, устанавливают взаимно однозначное соответствие между множе- ствами подполей поля L, содержащих К, и подгрупп группы G. При этом подполям Р, являющимся расширениями Галуа поля К, соот- ветствуют нормальные подгруппы Н группы G, и наоборот. Доказательство. Очевидно, что LGpOP. В то же время из (16) и (17) вытекает, что dimLGP L = |Gp| = dimp L. Следовательно, LGf=P. Аналогично доказывается, что Glh=H.
472 Глава 10. Группы Далее, так как по теореме 6.1 все автоморфизмы подполя Р над К продолжаются до автоморфизмов поля L, поле Р является расши- рением Галуа поля К тогда и только тогда, когда преобразования из группы G, переводящие его в себя, индуцируют на нем dimK Р различных автоморфизмов. Но из формулы (16) следует, что dimK P = \G: Gp|. Поэтому Р — расширение Галуа тогда и только тогда, когда все пре- образования из группы G переводят его в себя. Так как Р = LH, где Н = GP, то gP = LgHg'. Следовательно, подполе Р инвариантно относительно всех пре- образований из G тогда и только тогда, когда подгруппа Н нор- мальна. □ Пример 1. Пусть f — неприводимый кубический многочлен над полем К характеристики /2 с D <£К2 (см. пример 9.5.3), и пусть L — его поле разложения над К, Тогда Gal L/K S3. Подгруппе А3 с S3 отвечает квадратичное расширение K(\/D) поля К, содержащееся в L. Пример 2. Пусть — автоморфизм Фробениуса конечного поля Fpn (р простое). Как мы знаем, GalFpn/Zp = (<р)п. Всякая подгруппа группы (<р)п имеет вид {<рт)п/т, где т | и. Соответствующее подпо- ле есть подполе неподвижных точек автоморфизма <рт. Оно имеет размерность т над Zp, т. е. изоморфно Fp™. Пример 3. Пусть р — нечетное простое число. Группа Галуа G кругового поля Кр = Q(ep) (см. примеры 9.5.2 и 6.3) есть цикличе- ская группа порядка р -1. ПустьHcG — (единственная) подгруппа индекса 2. Тогда Р = К? — квадратичное расширение поля Q. Дока- жем, что {Q(-/p), если р = 1 (mod 4), если р = -1 (mod 4). Порождающий элемент группы G действует на группе Ср корней р-й степени из 1 как возведение в некоторую степень г (где [г]р — порождающий элемент группы Z*). Рассмотрим число К=1 Г
§ 7. Основная теорема теории Галуа 473 символ Лежандра (см. пример 9.1.3). Очевидно, что а при geH, я(а) = \ 1-а npngeG\H, Следовательно, a G Р и a2 G Q. Пользуясь результатами примеров 9.5.5 и 9.1.3, получаем: откуда и вытекает доказываемое утверждение. Теория Галуа была создана в связи с проблемой решения алгеб- раических уравнений в радикалах. Будем говорить, что элемент а какого-либо расширения поля К представляется в радикалах над К, если он выражается через эле- менты поля К при помощи арифметических операций и извлечения корней (любых степеней). Иначе говоря, это означает, что а принад- лежит последнему полю в цепочке расширений K = KocKiC...cKs, в которой = где сг' для некоторого nf eN. Предложение 1. Если многочлен feK[x] неприводим и хотя бы один его корень представляется в радикалах над К, то и все его корни обладают этим свойством. Доказательство. Пусть cxj и а2 — корни многочлена f в ка- ких-то расширениях поля К. Тогда существует изоморфизм поля Ktcq) на поле К(а2), переводящий в а2. Поэтому, если пред- ставляется в радикалах над К, то и а2 обладает этим свойством. □ Алгебраическое уравнение f (х) = 0, где f е К [х], называется раз- решимым в радикалах над К, если каждый его корень представляет- ся в радикалах над К. Это равносильно тому, что поле разложения L многочлена f над К содержится в поле, получаемом из К последова- тельными присоединениями корней из каких-то элементов. Основной результат Э. Галуа (1830 г.), касающийся разрешимо- сти алгебраических уравнений в радикалах, заключается в следую- щей теореме. Теорема 2. Пусть f — неприводимый многочлен над полем К ну- левой характеристики и L — его поле разложения над К. Уравнение
474 Глава 10. Группы /(х) = 0 разрешимо в радикалах над К тогда и только тогда, когда группа GalL/K разрешима. Доказательство этой теоремы основано на том, что если Р — поле, содержащее п различных корней п-й степени из 1, то его расширения вида Р(а), где ап = a G Р — это то же самое, что рас- ширения Галуа с циклической группой Галуа, порядок которой де- лит и. Мы приведем ниже полное доказательство более простого варианта теоремы 2, относящегося к разрешимости в квадратных радикалах. Пример 6.5 вместе с тем фактом, что группа Sn разрешима толь- ко при п $ 4, показывает, что общее алгебраическое уравнение сте- пени и над (произвольным) полем к нулевой характеристики раз- решимо в радикалах только при п $ 4. Разрешимость в радикалах общего уравнения степени и над к означает возможность выразить единообразно, т. е. одной и той же формулой, корни любого урав- нения степени и над к через его коэффициенты и фиксированные элементы поля к при помощи арифметических операций и извлече- ния корней. Отсутствие такой формулы не означает невозможности решения в радикалах конкретных уравнений. Например, любое ал- гебраическое уравнение над С разрешимо в радикалах, так как его корни лежат в С. Традиционно наибольший интерес вызывала разрешимость в ра- дикалах алгебраических уравнений над Q. Теорема 2 позволяет до- казать, что для любого и 5 существуют такие неприводимые мно- гочлены f G Q[x] степени п, что уравнение /(х) = 0 не разрешимо в радикалах. Разрешимость в квадратных радикалах определяется совершен- но так же, как разрешимость в радикалах, с той разницей, что раз- решается извлечение только квадратных корней. Теорема 3. Пусть f — неприводимый многочлен над полем К характеристики 02 и L — его поле разложения над К. Уравнение fM = Q разрешимо в квадратных радикалах над К тогда и только тогда, когда dimKL = 2n (и GN). (18) Доказательство. 1) Пусть уравнение /(х) = 0 разрешимо в квад- ратных радикалах. Тогда существует такая цепочка квадратичных расширений K = KqgK1gK2^...^K5,
§ 7. Основная теорема теории Галуа 475 что Lc.Ks. Имеем dimKL|dimKKs = 2s, откуда и следует (18). 2) Обратно, пусть dimK L = 2П. Тогда группа G = GsAL/К есть 2-группа и, следовательно, разрешима. Рассмотрим какой-либо ее композиционный ряд G = G0DG1DG2D...DGs = {e}. Очевидно, что все его факторы имеют порядок 2. Положив = LG|, мы получим цепочку квадратичных расширений K = K0<=K1cK2c...cKs = L, которая и доказывает разрешимость уравнения /(х) = 0 в квадрат- ных радикалах. □ Замечание 1. Так как deg/ = dimKK(a), где a G L — какой-либо корень многочлена /, то из (18) следует, что deg f есть степень двойки. Обратное неверно. Замечание 2. Во второй части доказательства мы пользовались тем, что L — расширение Галуа поля К. Это, конечно, верно, если char К = 0. Если char К = р > 2, то это вытекает из того, что много- член f сепарабелен, так как его степень, будучи степенью двойки, не делится на р. Разрешимость уравнений в квадратных радикалах вызывала ин- терес в связи с задачами на построение циркулем и линейкой. Всякая задача на построение циркулем и линейкой может быть сформулирована следующим образом: дана единица измерения и даны отрезки длин ...,afc; требуется построить отрезок дли- ны а. Анализируя возможные элементарные шаги построения, мож- но доказать, что сформулированная выше задача может быть реше- на тогда и только тогда, когда число а представляется в квадратных радикалах над полем K = Q(a1? ...,afc). Замечание 3. Когда мы говорим о представлении вещественного чис- ла в квадратных радикалах над полем К с R, то исходное определение не исключает извлечения квадратных корней из отрицательных чисел, что вы- водит нас в комплексную область. Однако задание комплексного числа рав- носильно заданию его вещественной и мнимой частей, а арифметические
476 Глава 10. Группы операции над комплексными числами и извлечение квадратных корней из них сводятся к арифметическим операциям над вещественными числами и извлечению квадратных корней из положительных чисел. Все эти опера- ции выполнимы циркулем и линейкой. В частности, если а трансцендентно над К, то задача неразреши- ма. Таким образом доказывается неразрешимость квадратуры круга (если радиус круга выбрать за единицу измерения, то задача равно- сильна построению отрезка длины я). Если а алгебраично над К и f G К [х] — его минимальный много- член, то в силу теоремы 3 задача разрешима тогда и только тогда, когда степень поля разложения многочлена f над К является сте- пенью двойки. В частности, для этого необходимо, чтобы степень самого многочлена f была степенью двойки. Пример 4. Удвоение куба сводится к построению отрезка длины V2. Так как многочлен х3 — 2 неприводим над Q и его степень не есть степень двойки, то эта задача неразрешима. Пример 5. Трисекция угла, равного у>, сводится к построению отрезка длины cos у по отрезку длины cos (/?. По известной формуле « (Л (Л COS (£ = 4 COS*5 у - 3 COS у, так что число а = cos у является корнем многочлена f = 4х3 - Зх - cos G К [х], где К = Q(cos (/?). Если речь идет об универсальном методе трисек- ции угла, не зависящем от величины угла tp, то мы должны рас- сматривать cos как независимую переменную. Тогда многочлен f неприводим над К (проверьте это!), и задача неразрешима по той же причине, что в предыдущем примере. Для конкретных углов (на- пример, для прямого) задача, конечно, может быть разрешимой, но можно указать такие значения (/?, для которых она неразрешима. Критерием разрешимости является наличие у многочлена f корня в поле К. Если, например, (/? = —, то K = Qh/ = 4х3 - Зх - | не имеет корней в К, так что задача неразрешима. Пример 6. Деление окружности на п равных частей (циклото- мия) сводится к построению отрезка длины cos или, что рав- носильно, числа е2я1/п = cos + i sin Поэтому циклотомия воз-
§ 7. Основная теорема теории Галуа 477 можна тогда и только тогда, когда степень кругового поля Кп = = Q(e2nz/n) является степенью двойки. Как известно, она равна (/?(п) (см. пример 6.3). Если п — простое число, то ip(n) = п - 1, так что должно быть и = 2т +1. Легко видеть, что число 2т +1 может быть простым только тогда, когда т есть степень двойки. Таким образом, число п должно иметь вид и = 22Ч1. Такие числа называются числами Ферма. При k = 0,1, 2, 3,4 получа- ем простые числа 3, 5,17, 257, 65537, но при к = 5 получается уже не простое число. В настоящее время не известно ни одного простого числа Ферма, кроме перечисленных выше. Теория Галуа позволяет дать концептуальное доказательство основной теоремы алгебры комплексных чисел, использующее только следующие два свойства полей R и С: 1) любой многочлен нечетной степени над полем R имеет корень в R; 2) в поле С возможно извлечение квадратного корня из любого эле- мента. Оба эти свойства легко доказываются без привлечения основной теоре- мы (см. §3.4 и §1.4 соответственно). Из свойства 1) следует, что над полем R не существует неприводимых многочленов нечетной степени, отличной от единицы, и, значит, не суще- ствует нетривиальных конечных расширений нечетной степени (так как минимальный многочлен любого элемента такого расширения должен был бы иметь нечетную степень). Пусть /€С[х]. Обозначим через f многочлен, получаемый из / за- меной всех коэффициентов комплексно сопряженными числами. Тогда ff = ff = ff и, следовательно, ff е 1й[х]. С другой стороны, если с е С — корень многочлена ff, то с или с — корень многочлена /. Поэтому нам достаточно доказать, что всякий многочлен положительной степени с ве- щественными коэффициентами имеет корень в С. Пусть f G ]R[x] — многочлен положительной степени, L э R — его поле разложения над R и G = Gal L/R. Пусть Н — какая-либо силовская 2-под- группа группы G. Рассмотрим поле LH = К. Так как dimR K = \G:H\ — нечет- ное число, то в силу предыдущего G = Н, т. е. G — 2-группа. Но тогда по теореме 3 поле L содержится в поле, получаемом из R последовательными присоединениями квадратных радикалов, и из сформулированного выше свойства 2) следует, что L = R или С. Таким образом, f имеет корень в С.
Глава 11 Линейные представления и ассоциативные алгебры В приложениях теории групп важнейшую роль играют их линей- ные представления. Имеются следующие два основных источника линейных представлений групп: 1) для любой группы G дифференцируемых преобразований, оставляющих на месте некоторую точку, взятие дифференциала в этой точке есть линейное представление группы G; 2) любое действие группы на множестве X определяет по фор- муле (7) § 10.3 ее линейное представление в пространстве функций на X. С другой стороны, алгебра матриц, благодаря своему богатству и высокой эффективности производимых в ней вычислений, служит эталоном при изучении многих алгебраических структур. Сравне- ние с ней осуществляется при помощи линейных представлений. § 1. Инвариантные подпространства Для всякого векторного пространства V над каким-то полем К мы будем обозначать через L(V) (ассоциативную) алгебру всех ли- нейных операторов на V. Если пространство V конечномерно, то линейные операторы можно задавать матрицами в каком-либо ба- зисе, и таким образом устанавливается изоморфизм алгебры L(V) и алгебры матриц Ln (К) (где п = dim V). Определение 1. Линейным представлением множества X в век- торном пространстве V называется любое отображение R:X — L(V) (1) Пространство V называется пространством представления, его размерность — размерностью представления, а операторы R(x), х е еХ,— операторами представления. Если в множестве X определены какие-либо операции, то есте- ственно потребовать, чтобы представление было согласовано с
§ 1. Инвариантные подпространства 479 ними. Так, линейное представление группы определяется требова- ниями R(xy)=R(x)R(y), R(e) = <£* (и тем самым может быть определено как гомоморфизм в группу GL(V)), а линейное представление ассоциативной алгебры — требо- ваниями R(* + у) = R(x) + R (у ), Я(лу) = RMR(y ), R(Ax) = AR(x), Хе К. Мы, однако, сначала займемся теми свойствами линейных пред- ставлений, которые имеют смысл безотносительно к каким-либо операциям в множестве X. Определение 2. Пусть R: X L(V) и S: X -+ L(L7) — два линей- ных представления одного и того же множества X над одним и тем же полем. Морфизмом представления R в представление S называ- ется любое линейное отображение : V —> U со следующим свой- ством: для любого хеХ диаграмма у ч> коммутативна. Обратимый морфизм называется изоморфизмом представлений. Линейные представления R и S называются изоморфными, если существует изоморфизм представления R в представление S. В этом случае пишут R^S. Изоморфные представления в подходящих ба- зисах пространств V и U записываются одними и теми же матри- цами. Пример 1. Линейное представление одноэлементного множест- ва — это просто один линейный оператор в каком-то векторном про- странстве. Два линейных представления одноэлементного множе- ства над алгебраически замкнутым полем изоморфны тогда и толь- ко тогда, когда матрицы соответствующих линейных операторов приводятся к одной и той же жордановой форме. Таким образом, в этом случае классы изоморфных представлений параметризуются жордановыми матрицами.
480 Глава И. Линейные представления и ассоциативные алгебры Замечание 1. Задача описания линейных представлений двухэлемент- ного множества, не говоря уже о более мощных множествах, считается «ди- кой». Это означает, что по современным представлениям она не может быть решена ни в каком разумном смысле. Однако реально интересны лишь представления множеств с теми или иными операциями (в первую очередь, групп), и в этой ситуации сложность описания представлений зависит во- все не от количества элементов. Всякое линейное представление R: X —»L(V) над полем К можно рассматривать как линейное представление над любым расшире- нием L поля К, продолжив операторы представления до линейных операторов в пространстве V(L) (см. §8.1). В базисе пространства V(L), составленном из векторов пространства V, продолженное та- ким образом представление будет задаваться такими же матрицами, что и исходное представление. Предложение 1. Пусть R: X —> L(V) и S: X -^L(W) —линейные представления множества X над бесконечным полем К, и пусть L — какое-либо расширение поля К. Если представления RuS изоморфны над L, то они изоморфны и над К. Доказательство. Запишем представления R и S матрицами в ка- ких-нибудь базисах пространств V и W, Изоморфность представле- ний R и S над К означает существование такой невырожденной матрицы С с элементами из К, что CR(x)=S(x)C VxeX. (2) Соотношения (2) представляют собой систему однородных линей- ных уравнений относительно элементов матрицы С с коэффици- ентами из поля К. Пусть {С1? — фундаментальная система ее решений. Если представления R и S не изоморфны над К, то det (А! Q +... + Am Ст) = 0 при любых Aj,..., Am е К и, следовательно, detCtjCj +... + tmCm) есть нулевой многочлен от t1?..., tm. Но тогда detCAjCi + ... 4- AmCm) = 0 при любых Аь ..., Am eL, а это означает, что представления R и S не изоморфны над L. □ Для понимания структуры линейных представлений важную роль играют инвариантные подпространства. Пусть задано представление R: X —► L(V). Подпространство U с V называется инвариантным относительно представления R, если оно инвариантно относительно всех операторов этого представле- ния. Очевидно, что сумма и пересечение инвариантных подпрост- ранств являются инвариантными подпространствами.
§ 1. Инвариантные подпространства 481 С каждым инвариантным подпространством U с V связаны два новых представления множества X: подпредставление Ru-.X^UIT), RVM = RM\VJ и факторпредставление Rv/u: X LCV/C7), RV/UM(v + U) = RMv + U. Представление Rv (соответственно Ry/ц) однозначно определяется тем свойством, что тождественное вложение U —> V (соответствен- но каноническое отображение V -♦ V/U) является морфизмом пред- ставлений. В матричной форме все это выглядит следующим образом: ес- ли базис пространства V выбран так, что какое-то число первых базисных векторов составляет базис инвариантного подпространст- ва U, то Определение 3. Линейное представление (1) называется непри- водимым, если V 0 0 и не существует нетривиальных подпрост- ранств U с V, инвариантных относительно R. Очевидно, что всякое одномерное представление неприводимо. Пример 2. Представление П аддитивной группы К поворотами евклидовой плоскости Е2, задаваемое в ортонормированном базисе {еь е2} формулой n(t)=fcost —sintA k J Vslnf COS tj’ неприводимо, так как никакое одномерное подпространство не пе- реходит в себя при всех поворотах. Однако если рассматривать это представление как комплексное, то оно будет приводимо. Более точно, одномерные подпространства, натянутые на векторы - ie2 и ej 4- ie2, будут инвариантны, и в базисе, составленном из этих векторов, представление будет иметь вид еЧ (см. пример 6.2.3). Пример 3. Изоморфизм S4 Sym+ К (см. пример 4.6.19) опре- деляет линейное представление группы S4 в пространстве Е3. До- кажем, что оно неприводимо. Так как ортогональное дополнение
482 Глава И. Линейные представления и ассоциативные алгебры к инвариантному подпространству также инвариантно, то достаточ- но доказать, что нет одномерных инвариантных подпространств, но это очевидно. На самом деле указанное представление неприводи- мо не только над R, но и над С. Это вытекает из следующего общего предложения. Предложение 2. Пусть R: X —> L(V) — неприводимое нечетно- мерное вещественное линейное представление множества X. Тогда комплексификация представления R также неприводима. Доказательство. Предположим, что W с V (С) — нетривиальное инвариантное подпространство. Заметим, что если какое-либо под- пространство пространства У(С) инвариантно относительно ком- плексного сопряжения, то оно вместе с любым вектором содержит его вещественную и мнимую части и, значит, является комплекси- фикацией некоторого подпространства пространства V. Отсюда сле- дует, что инвариантные подпространства W A W и W 4- W являются комплексификациями каких-то инвариантных подпространств про- странства V. В силу неприводимости представления R должно быть WAVV = 0, W + W = V(C), т. е. V(С) = W Ф W; но тогда dim V(С) = 2 dim W, что противоречит нечетномерности пространства V. □ Пример 4. Пусть V есть n-мерное векторное пространство с ба- зисом {еъ ..., еп}. Линейное представление М группы SnJ определяе- мое формулами M(cr)ei = e(j(i) (aeSn), называется мономиальным представлением. Это представление при- водимо: можно указать по меньшей мере два нетривиальных инвари- антных подпространства: одномерное подпространство ^ +...+еп) и (п - 1)-мерное подпространство v(Sw 1> = о}. Докажем, что если char К = 0, то представление Мо = MVq неприво- димо. В самом деле, пусть U с Уо — инвариантное подпространство и х = x^i eU — ненулевой вектор. Так как £ xf = 0, то не все чис- i i ла хь ..., хп равны между собой. Пусть для определенности Xj 0х2. Тогда х - М((12))х= (х2 - x2)(ei - е2) G U,
§ 1. Инвариантные подпространства 483 откуда ег - е2 е U. Применяя к ег - е2 операторы представления, мы получаем, что е, —е^и при всех i, j; но тогда U = Уо. Пример 5. Пусть А — ассоциативная алгебра. Тогда формула Т(а)х = ах (а, хе А) определяет линейное представление Г алгебры А в своем собствен- ном пространстве, называемое ее (левым) регулярным представле- нием. Подчеркнем, что это именно представление алгебры, т. е. Т(а + Ь) = Т(а) + Т(Ь), Т(аЬ) = Т (а) Т(Ь), Т(Аа) = АТ(а). Например, второе из этих свойств эквивалентно ассоциативности умножения в А. Инвариантные подпространства для этого представ- ления суть не что иное, как левые идеалы алгебры А. Если <р: V —> U — морфизм представления R: X —> L(V) в пред- ставление S: X -♦ L((J), то Im есть инвариантное подпространство в U, а Кег ip есть инвариантное подпространство в V. Поэтому спра- ведлива Теорема 1. Всякий морфизм неприводимых представлений есть либо изоморфизм, либо нулевое отображение. В дальнейшем мы будем без специальных оговорок предпола- гать, что все рассматриваемые линейные представления конечно- мерны. Теорема 2 (лемма Шура). Всякий эндоморфизм (т.е. морфизм в себя) неприводимого представления над алгебраически замкнутым полем скалярен. Доказательство. Пусть R: X L(V) —данное представление. Линейный оператор е L(V) является его эндоморфизмом, если он перестановочен со всеми операторами представления. Следователь- но, если <р — эндоморфизм представления R, то таковым является и tp — при любом A е К. Выбрав в качестве А какое-нибудь собственное значение оператора ip, мы получим по теореме 1, что ср-А^ = О. □ Следствие 1. Пусть R: Х-> L(V) и S: X -* L(17) — два неприводи- мых представления множества X над алгебраически замкнутым по- лем. Тогда любые два морфизма представления R в представление S пропорциональны. Доказательство. Если один из морфизмов равен нулю, то дока- зывать нечего. Поэтому мы должны только доказать пропорциональ- ность любых двух изоморфизмов. Но если ip: V -+U и ф: V -+U —
484 Глава 11. Линейные представления и ассоциативные алгебры два изоморфизма представления R в представление S, то i/r1 : V —► —> V есть автоморфизм представления R. По лемме Шура г/,-1 = А<£, откуда = Аг/,. □ Следствие 2. Всякое неприводимое представление абелевой груп- пы над алгебраически замкнутым полем одномерно. Доказательство. В случае абелевой группы все операторы пред- ставления перестановочны между собой и, значит, каждый из них является эндоморфизмом представления. По лемме Шура все они скалярны. Следовательно, любое подпространство инвариантно, и представление может быть неприводимым, только если оно од- номерно. □ Определение 4. Линейное представление R: X —> L(V) называ- ется вполне приводимым, если для любого инвариантного подпро- странства U с V имеется инвариантное дополнительное подпро- странство, т. е. такое инвариантное подпространство W с V, что V = U®W. Отметим, что всякое неприводимое представление, как это ни странно звучит, вполне приводимо. Пример 6. Формула ад=(„ °.) «ею задает двумерное вещественное линейное представление аддитив- ной группы R. Нетривиальные инвариантные подпространства — это только одномерные подпространства, натянутые на базисные векторы (координатные оси). Так как эти подпространства дополни- тельны друг к другу, то представление R вполне приводимо. Пример 7. Формула s«=G Q задает другое линейное представление той же группы. В этом случае единственное нетривиальное инвариантное подпространство — это одномерное подпространство, натянутое на первый базисный век- тор. Поэтому представление S не является вполне приводимым. Предложение 3. Всякое подпредставление и всякое факторпред- ставление вполне приводимого представления вполне приводимы. Доказательство. Пусть R : X —>L(V) — вполне приводимое пред- ставление и U с V — инвариантное подпространство. Для любого инвариантного подпространства иг с U в пространстве V существу-
§ 1. Инвариантные подпространства 485 ет инвариантное дополнительное подпространство, скажем, У2. Под- пространство U2 = U П V2 будет тогда инвариантным подпростран- ством, дополнительным к иг в U. Пусть теперь п: V —> V/U — каноническое отображение и W1 с с V/U — инвариантное подпространство. Тогда Vi = TfKWi) — ин- вариантное подпространство в V (содержащее U). Если V2 с V — до- полнительное к нему инвариантное подпространство, то W2 = тг(У2) будет инвариантным подпространством, дополнительным к в V/U. □ Дадим теперь другую характеризацию вполне приводимых пред- ставлений. Теорема 3. 1) Если представление R: X —*L(V) вполне приводи- мо, то пространство V может быть разложено в прямую сумму минимальных инвариантных подпространств. 2) Обратно, если пространство V может быть разложено в сум- му (не обязательно прямую) минимальных инвариантных подпро- странств Vi,..., Vm, то представление R вполне приводимо, причем для любого инвариантного подпространства U С V в качестве инва- риантного дополнительного подпространства может быть взята сумма некоторых из VJ. (Минимальным инвариантным подпространством здесь называ- ется подпространство, минимальное среди ненулевых инвари- антных подпространств.) Доказательство. 1) Берем любое минимальное инвариантное подпространство Уь находим инвариантное дополнительное под- пространство, в нем берем любое минимальное инвариантное под- пространство V2 и т. д. 2) Пусть U с V — инвариантное подпространство. Для любого подмножества I с {1,..., п} положим V7 VJ. Пусть I — максималь- iel ное подмножество (быть может, пустое), для которого U П Vj = 0. Тогда для любого j <£1 должно быть U П V/u{;} 00 и, значит, (U©V7)nV;/0. Так как V; — минимальное инвариантное подпространство, то V; с с U Ф У7. Следовательно, V = UQVj. □ Пример 8. Если char К = 0, то мономиальное представление группы Sn, определенное в примере 4, вполне приводимо, так как
486 Глава 11. Линейные представления и ассоциативные алгебры пространство V в этом случае разлагается в прямую сумму мини- мальных инвариантных подпространств: V = (ег +... 4-еп) Ф Vo. Задача 1. Рассмотрим линейное представление Ad группы GLn(X) в пространстве Ln(X), задаваемое формулой Ad(A)X = AXA"1. Доказать, что если char К = 0, то (Е) и (X е Ln(X): tr X = 0) — ми- нимальные инвариантные подпространства, и вывести отсюда, что представление Ad вполне приводимо. Определение 5. Суммой линейных представлений Rt: X —> L(VJ), i = 1,..., гп, называется линейное представление R = R1 + ...+Rm: Х-*Ь(У1Ф...ФУт), определяемое по формуле R(x)(Ui, ...,um) = (R1(x)p1, ...,Rm(x)vm). В матричной записи /%(х) 0 ... 0 А R(x) = 0 Й2(х) •" 0 . к о О ... RmwJ Если R: X —> L(V) — какое-то линейное представление и про- странство V разложено в прямую сумму инвариантных подпрост- ранств ..., Vm, то R^Rj + ... +Rm, где R,=RV.. Теорема 3 дает следующую характеризацию вполне приводимых представлений. Следствие 1. Линейное представление вполне приводимо тогда и только тогда, когда оно изоморфно сумме неприводимых представ- лений. Следствие 2. Пусть R: Х—>L(V) — вполне приводимое представ- ление, изоморфное сумме неприводимых представлений Тогда всякое подпредставление, а также всякое факторпредставле- ние представления R изоморфны сумме некоторых из представле- ний Rj. Доказательство. Пусть У = У1ф...фУт
§ 1. Инвариантные подпространства 487 — такое разложение в прямую сумму инвариантных подпространств, что Rv ^Rj, и пусть U с V — какое-то инвариантное подпростран- ство. По теореме 3 существует такое подмножество I с {1,гл}, что V = U Ф Vj. Ясно, что ^V/U — Rv, — S Яр iel Далее, положим J = {1,т}\1. Тогда V = Vj®Vt и, следовательно, с* KV/V/ — Rvj — ^Rj- □ jeJ Пример 9. Всякое неприводимое линейное представление одно- элементного множества X над алгебраически замкнутым полем К одномерно. Следовательно, всякое вполне приводимое представле- ние множества X над полем К задается линейным оператором, мат- рица которого в некотором базисе диагональна. Пусть Я: X —> L(V) — вполне приводимое представление и У = У!Ф...ФУт (3) — какое-то разложение пространства V в прямую сумму минималь- ных инвариантных подпространств. Определение 6. Изотипной компонентой представления Я, от- вечающей неприводимому представлению S множества X, называ- ется сумма V(s) тех слагаемых разложения (3), для которых Rv. S, а также ограничение R(S) представления Я на эту сумму. Всякое (минимальное) инвариантное подпространство U с V, для которого Rv S, может нетривиальным образом проектиро- ваться только на те слагаемые Ц разложения (3), для которых Яц ^S, и потому содержится в V(s). Это показывает, что изотипные компоненты не зависят от выбора разложения (3). Из определения ясно, что пространство V разлагается в прямую сумму изотипных компонент, отвечающих различным неприводи- мым представлениям множества X. Пример 10. Для вполне приводимого представления одноэле- ментного множества над алгебраически замкнутым полем изотип- ные компоненты — это собственные подпространства соответству- ющего линейного оператора. Представление Я называется изотипным или, точнее, S-изотип- ным, если Я = Я(5).
488 Глава 11. Линейные представления и ассоциативные алгебры Изотипные представления удобно описывать следующим обра- зом. Пусть S: X L(LO — неприводимое представление и Z — лю- бое векторное пространство. Определим представление L(170Z) (4) по формуле R(x) (u 0z) = (S(x)u) 0 z. Если {zb ..., zm} — базис пространства Z, то разложение L/0Z = ([J0z1)©...©(LJ0zm) (5) является разложением пространства U 0 Z в прямую сумму инвари- антных подпространств, причем ограничение представления R на каждое из них изоморфно S. Теорема 4. Если основное поле К алгебраически замкнуто, то всякое инвариантное подпространство пространства U&Z имеет вид U ®Z0, где Zo — некоторое подпространство пространства Z. Доказательство. Так как сумма подпространств вида U 0 Zo есть подпространство того же вида, то достаточно доказать теорему для минимальных инвариантных подпространств. Пусть W с U 0 Z — минимальное инвариантное подпростран- ство. Для любого ш GIV в соответствии с разложением (5) имеем w = (/?! (ш) 0 zx +... + ipm (ш) 0 zm, где <рг, — некоторые морфизмы представления Rw в представ- ление S. Согласно следствию 1 теоремы 2, = А,^, где А,еК, а — некоторый фиксированный изоморфизм представления Rw в пред- ставление S. Таким образом, ш = 0 (AjZj +... + Amzm) и, стало быть, W = C/0(A1z1 + ... + Arnzm). □ Задача 2. Доказать, что, если поле К алгебраически замкнуто, всякий эндоморфизм представления (4) имеет вид и 0 z —> и 0 4>z, где — некоторый линейный оператор в пространстве Z.
§ 1. Инвариантные подпространства 489 Теорема 5 (теорема Бернсайда). Пусть R: X —> L(V) — неприво- димое представление множества X над алгебраически замкнутым полем. Тогда подалгебра алгебры L(V), порожденная множеством R(X), совпадает с L(V) за исключением тривиального случая, когда dimV = l uK(X) = 0. Заметим, что подалгебра, порожденная множеством R(X), состо- ит из всевозможных линейных комбинаций произведений операто- ров R(x), хеХ. Таким образом, теорема утверждает, что, за исклю- чением упомянутого тривиального случая, всякий линейный опе- ратор является линейной комбинацией произведений операторов К(х),хеХ. Доказательство. Как мы знаем, пространство L(V) может быть отождествлено с V ® V* таким образом, что всякому разложимому элементу и ® a G V 0 V* соответствует оператор и®а: и^->а(р)п. При этом соглашении произведения оператора и ® а на любой ли- нейный оператор j/gL(V) выглядят следующим образом: л/(и®а) = зг?и®а, (6) (u® a)j/ = u® л/*а, (7) где j/* — сопряженный оператор, определяемый по формуле (j/*a)(u) = a(j/y). Заметим, что ввиду канонического взаимно однозначного соот- ветствия между подпространствами пространства V и подпростран- ствами пространства V*, сопоставляющего каждому подпростран- ству его аннулятор, представление R*:X->L(V*), определяемое формулой R*(x)a = K(x)*a, неприводимо. Определим представления 7} и Тг множества X в пространстве L(V) по формулам Tt (х) 4 = RM ТГ (х) а/ = j/R(x) . Ввиду формул (6) и (7) эти представления изотипны.
490 Глава 11. Линейные представления и ассоциативные алгебры Обозначим через А подалгебру алгебры L(V), порожденную мно- жеством Я(Х). Ясно, что она является подпространством в L(V), ин- вариантным как относительно представления Th так и относитель- но представления Тг. По теореме 4 она должна представляться в ви- де А = V 0 Wo, где Wo — подпространство пространства V*, и в то же время в виде А = Vo 0 V*, где Уо — подпространство пространства V. Это возможно, только если А есть L(V) или 0. В последнем случае dim V = 1, так как иначе представление R было бы приводимо. □ Задача 3. Тензорным произведением представлений групп R: G—> -♦GL(V) и S: Н —* GL(VV) называется представление K0S:GxH — GL(V0W), определяемое формулой (R0S)(g,/i) = R(g)0S(h). (См. определение тензорного произведения линейных операторов в § 8.1.) Доказать, что тензорное произведение неприводимых пред- ставлений групп G и Н над алгебраически замкнутым полем непри- водимо. Рассмотрим теперь класс вполне приводимых линейных пред- ставлений, в определенном смысле противоположный классу изо- топных представлений. А именно, будем говорить, что вполне при- водимое представление имеет простой спектр, если оно являет- ся суммой попарно не изоморфных неприводимых представлений или, иначе говоря, если все его (ненулевые) изотопные компоненты неприводимы. Пример И. Вполне приводимое представление одноэлементно- го множества над алгебраически замкнутым полем имеет простой спектр тогда и только тогда, когда все корни характеристического многочлена соответствующего линейного оператора являются про- стыми. Для представлений с простым спектром инвариантные подпро- странства и эндоморфизмы описываются особенно просто. Предложение 4. Пусть R: X -* L(V) — вполне приводимое пред- ставление с простым спектром. Рассмотрим какое-то разложе- ние (3) пространства V в прямую сумму минимальных инвариант- ных подпространств. Тогда 1) всякое инвариантное подпространство пространства V есть сумма некоторых из слагаемых разложения (3);
§ 2. Полная приводимость линейных представлений 491 2) если основное поле К алгебраически замкнуто, то всякий эндо- морфизм ip представления R имеет вид с/?(х) = Л1х npuxeVi (Ль ...,Лт€К). (8) Доказательство. 1) Всякое инвариантное подпространство есть сумма минимальных инвариантных подпространств. Всякое мини- мальное инвариантное подпространство по определению представ- ления с простым спектром есть изотопная компонента и, значит, совпадает с одним из слагаемых разложения (3). 2) Каждое слагаемое разложения (3), будучи изотопной компо- нентой, инвариантно относительно эндоморфизма (/?, а по лемме Шура <р действует на нем скалярно. □ Следствие. Для вполне приводимого представления с простым спектром разложение пространства представления в прямую сум- му минимальных инвариантных подпространств единственно. Линейное представление R: G—>GL(V) группы G (над полем К характеристики / 2) называется ортогональным (соответственно симплектическим), если в пространстве V существует невырож- денная симметрическая (соответственно кососимметрическая) би- линейная функция, инвариантная относительно всех операторов представления. Задача 4. Доказать, что если R: G -* GL(V) — неприводимое представление группы G над алгебраически замкнутым полем, то а) любая ненулевая инвариантная билинейная функция в прост- ранстве V невырожденна; б) любые две такие функции пропорциональны; в) любая такая функция либо симметрична, либо кососиммет- рична. § 2. Полная приводимость линейных представлений конечных и компактных групп Для некоторых классов групп можно доказать априори полную приводимость всех линейных представлений. Мы начнем с конечных групп, для которых доказательство чисто алгебраическое. Оно основано на простой идее, заключенной в сле- дующей ниже лемме. Пусть S — конечномерное аффинное пространство над полем К.
492 Глава 11. Линейные представления и ассоциативные алгебры Лемма 1 (о неподвижной точке). Всякая конечная группа G аф- финных преобразований пространства S, порядок которой не делит- ся на char К, имеет в S неподвижную точку Доказательство. Неподвижной точкой является центр тяжести орбиты любой точки р G S: center Gp = £ gp. □ м gee Пусть теперь V — конечномерное векторное пространство над полем К и G с GL(V) — некоторая группа его линейных преобразо- ваний. Теорема 1. Если G — конечная группа и ее порядок не делится на char К, то для любого G-инвариантного подпространства U с V существует G-инвариантное дополнительное подпространство W. Доказательство. Задать подпространство W, дополнительное к U, — это все равно, что задать проектор & на U параллельно W. Инвариантность подпространства W равносильна тому, что соответ- ствующий проектор 9 перестановочен со всеми преобразованиями из G. Совокупность всех проекторов на G описывается линейными уравнениями 9v eU Vv eV, 9u=uVueU и, следовательно, представляет собой плоскость в пространстве L(V) всех линейных операторов на V. Обозначим эту плоскость через S. При линейном действии группы G на L(V) сопряжениями плос- кость S переходит в себя и на ней индуцируются какие-то аффинные преобразования. Тем самым мы получаем конечную группу аффин- ных преобразований плоскости S. Ее неподвижная точка и будет искомым проектором. □ Следствие. Всякое линейное представление конечной группы G над полем К, характеристика которого не делит |G|, вполне приво- димо. Доказательство получается применением теоремы к образу группы G при рассматриваемом линейном представлении. □ Пример 1. Докажем другим способом, что трехмерное линейное представление группы S4, построенное в примере 1.3, неприводимо не только над R, но и над С. Так как оно во всяком случае вполне приводимо, то достаточно доказать отсутствие одномерных инвари-
§ 2. Полная приводимость линейных представлений 493 антных подпространств, т. е. отсутствие общих собственных векто- ров у операторов представления. Как мы знаем (предложение 6.2.1), всякому мнимому собственному значению вещественного линейно- го оператора соответствует двумерное инвариантное вещественное подпространство. Однако для рассматриваемого представления нет двумерных инвариантных вещественных подпространств. При К = R или С разумным обобщением конечных групп являют- ся компактные топологические группы. Определение 1. Топологической группой называется группа G, снабженная хаусдорфовой топологией таким образом, что группо- вые операции g:GxG->G, (х,у)-*ху, i:G-*G, х—>х-1, являются непрерывными отображениями. Гомоморфизмом тополо- гических групп называется гомоморфизм групп, являющийся в то же время непрерывным отображением. Примерами топологических групп могут служить аддитивные и мультипликативные группы полей R и С, а также группы невырож- денных матриц над этими полями. Всякая группа (например, конеч- ная) может рассматриваться как топологическая, если ее снабдить дискретной топологией. Всякая подгруппа топологической группы, наделенная индуциро- ванной топологией, является топологической группой. Прямое про- изведение топологических групп является топологической группой. Топологическая группа называется компактной, если она являет- ся компактным топологическим пространством. В частности, все ко- нечные группы компактны. Примерами бесконечных компактных групп могут служить «окружность» T = {zGC*: |z| = 1}, ортогональная группа Оп и унитарная группа Un. Докажем компакт- ность группы Оп. Эта группа выделяется в п2-мерном пространстве Ln(R) всех вещественных матриц X = (х^) порядка п уравнениями S %ik%jk ~ &ij к и, следовательно, замкнута в Ln(R). Из выписанных уравнений сле- дует также, что |Ху| 1, а потому группа Оп ограничена в Ln(R). Следовательно, она компактна. Аналогично доказывается компакт- ность группы Un.
494 Глава 11. Линейные представления и ассоциативные алгебры Всякая замкнутая подгруппа компактной группы компактна. Прямое произведение компактных групп компактно. Так, прямое произведение п экземпляров окружности Т есть компактная группа, называемая п-мерным тором и обозначаемая Тп. Образ компактной группы при (непрерывном) гомоморфизме (в частности, линейном представлении) является компактной группой. Имеются аналоги леммы о неподвижной точке и теоремы 1 для компактных групп. Для их доказательства мы используем понятие центра тяжести выпуклого множества. Пусть М — непустое ограниченное выпуклое множество в веще- ственном аффинном пространстве S. Если aff М = S, то определим центр тяжести center М множества М по формуле center M = g(M)"1 x/i(dx), Jm где /1 — обычная мера в пространстве S, инвариантная относитель- но параллельных переносов. Мера /х определена с точностью до постоянного множителя, но из вида формулы ясно, что произвол в выборе /х не влияет на результат. Интеграл в правой части может определяться либо покоординатно, либо непосредственно как пре- дел интегральных сумм, представляющих собой (с учетом множите- ля, стоящего перед интегралом) барицентрические линейные ком- бинации точек пространства S и поэтому имеющих инвариантный смысл. Первое определение показывает существование интеграла, второе — его независимость от выбора системы координат. В общем случае определим center М так же, как и выше, но заменив простран- ство S пространством aff М. Так как определение центра тяжести дается в терминах аффин- ной геометрии, то center а(М) = a(center М) для любого аффинного преобразования а. В частности, если множе- ство М инвариантно относительно какого-либо аффинного преобра- зования, то его центр тяжести является неподвижной точкой этого преобразования. Из определения центра тяжести ясно, что center М G М. На самом деле center МбМ°,
§ 2. Полная приводимость линейных представлений 495 где М° — внутренность множества М относительно пространства affM. Действительно, для любой аффинно-линейной функции /, неотрицательной на М и не равной тождественно нулю на aff М, имеем /(center М) =/х(М)-1 /(х)/x(dx) > 0. Jm Лемма 2 (о неподвижной точке). Пусть G — компактная группа аффинных преобразований вещественного аффинного пространст- ва S, и пустьMcS — непустое выпуклое множество, инвариантное относительно G. Тогда группа G имеет в М неподвижную точку. Заметим, что в качестве М можно взять все пространство S. Доказательство. Искомой неподвижной точкой является центр тяжести выпуклой оболочки орбиты любой точки реМ. □ Теорема 2. Пусть G — компактная группа линейных преобразо- ваний векторного пространства V над полем К = R или С. Тогда для любого G-инвариантного подпространства UcV существует G-инвариантное дополнительное подпространство W. Доказательство этой теоремы дословно повторяет доказатель- ство теоремы 1. Нужно только заметить, что в случае К = С плос- кость S, составленную проекторами на U, следует рассматривать как вещественное аффинное пространство. □ Следствие. Всякое вещественное или комплексное линейное пред- ставление компактной топологической группы вполне приводимо. Пример 2. Согласно теореме 2 и следствию 2 теоремы 1.2 всякое (непрерывное) комплексное линейное представление компактной абелевой группы есть сумма одномерных представлений, т. е. в неко- тором базисе оно записывается диагональными матрицами. В част- ности, это применимо к конечным абелевым группам и к группе Т. Имеется другой подход к доказательству полной приводимости линейных представлений компактных групп, представляющий ин- терес и сам по себе. Теорема 3. Пусть G — компактная группа линейных преобразо- ваний вещественного (соответственно комплексного) векторного пространства V. Тогда в пространстве V существует G-инвариант- ная положительно определенная квадратичная (соответственно эрмитова) функция. Доказательство. Совокупность всех положительно определен- ных квадратичных (соответственно эрмитовых) форм есть G-инва-
496 Глава 11. Линейные представления и ассоциативные алгебры риантное выпуклое множество в пространстве всех квадратичных (соответственно эрмитовых) форм. Неподвижная точка группы G в этом множестве и будет искомой формой. □ Следствие. Всякая компактная (в частности, конечная) под- группа группы GLn (R) (соответственно GLn(C)) сопряжена подгруп- пе группы Оп (соответственно Un). Теорема 3 дает другой способ доказательства теоремы 2: в каче- стве инвариантного подпространства, дополнительного к U, можно взять ортогональное дополнение к U в смысле скалярного умноже- ния, определяемого инвариантной квадратичной (соответственно эрмитовой) формой. § 3. Конечномерные ассоциативные алгебры Техника линейных представлений позволяет, прежде всего, до- статочно хорошо описать строение конечномерных ассоциативных алгебр. Пусть А — конечномерная ассоциативная (но не обязательно коммутативная) алгебра над полем К. Элемент a G А называется нильпотентным, если ап = 0 для неко- торого п Е N. Алгебра А называется нильпотентной, если все ее элементы нильпотентны. Всякая подалгебра и всякая факторалгеб- ра нильпотентной алгебры нильпотентны. С другой стороны, если идеал I и факторалгебра А/I нильпотентны, то и алгебра А нильпо- тентна. Пример 1. Алгебра всех нильтреугольных (треугольных с нуля- ми на диагонали) матриц порядка п нильпотентна. Более того, про- изведение любых п элементов этой алгебры равно нулю. Как мы сей- час увидим, аналогичным свойством обладает любая нильпотент- ная алгебра. Теорема 1. Для любой нильпотентной алгебры А существует такое neN, что произведение любых п элементов алгебры А равно нулю. Для любых подпространств В, С с А условимся обозначать че- рез ВС линейную оболочку всевозможных произведений вида Ьс (be В, се С). При этом соглашении утверждение теоремы можно записать так: Ап = 0 для некоторого п е N.
§ 3. Конечномерные ассоциативные алгебры 497 Доказательство. Пусть В с А — максимальное подпространство, для которого существует такое п е N, что Вп = 0. Предположим, что В 0 А, и пусть a G А \ В. Так как аВп = 0, то существует такое к 0, что аВк ф В, но аВк+1 с В. Заменив а подходящим элементом из аВк, мы можем добиться, чтобы аВсВ. (9) Для некоторого т eN имеем: ат = 0. (10) Положим С = Вф (а). Из условий (9) и (10) следует, что Спт = 0, но это противоречит определению подпространства В. □ В отличие от коммутативного случая, все нильпотентные эле- менты произвольной ассоциативной алгебры А не обязаны образо- вывать идеал (и даже подпространство). Однако если I и J — два нильпотентных идеала, то их сумма Z +J = {x + y: xgZ, у G J}. также является нильпотентным идеалом, так как она содержит ниль- потентный идеал Z, факторалгебра (Z + J)/Zs±J/(ZnJ) по которому также нильпотентна. Поэтому существует наибольший нильпотентный идеал. Он называется радикалом алгебры А и обо- значается через rad А. В коммутативном случае он совпадает с радикалом кольца А в смысле § 9.4. Алгебра А называется полупростой, если rad А = 0. Пример 2. В силу примера 9.4.1 алгебра K[t]/(h) полупроста то- гда и только тогда, когда многочлен h не имеет кратных неприводи- мых множителей. В случае, когда char К = 0, полупростые алгебры могут быть оха- рактеризованы с другой точки зрения. Пусть Т: A -*L(A) — регулярное представление алгебры А (см. пример 1.5). Определим в А «скалярное умножение» по формуле (а, b) = tr Т(аЬ) = tr Т(а)Т(Ь). (11)
498 Глава 11. Линейные представления и ассоциативные алгебры Это симметрическая билинейная функция (может быть, вырожден- ная). Кроме того, она обладает свойством (ab, с) = (а, Ьс), вытекающим из ассоциативности умножения в А. (В случае, ко- гда А — поле, это скалярное умножение совпадает с введенным в §9.5.) Предложение 1. Ортогональное дополнение I1 к любому идеа- лу I алгебры А также является идеалом. Доказательство. Пусть хе!1, аеА, у el. Тогда (ха, у) = (х, ау) = 0, (ах, у) = (у, ах) = (уа, х) = 0. □ Предложение 2. Если char К = 0, то всякий элемент аеА, орто- гональный всем своим степеням, нилъпотентен. Доказательство. Пусть (an,a) = trT(a)n+1=0 VhgN. Возьмем подходящее расширение поля К, в котором характеристи- ческий многочлен f оператора Т (а) разлагается на линейные мно- жители: S / = tfc° f](t —Ai)fc’ (Ль ..., As различны и отличны от 0). i=l Тогда trT(a)n+1 = ^fciAp+1=O. i=i Пусть п пробегает значения 1, ...,s. Рассмотрим предыдущие равен- ства как квадратную систему однородных линейных уравнений от- носительно кь ..., ks. Ее определитель, который лишь множителем отличается от определителя Вандермонда для Л15 ..., As, от- личен от нуля. Следовательно, кг = ... = ks = 0 в поле К, что невоз- можно, если char К = 0. Поэтому $ = 0, а это означает, что оператор Т(а) нильпотентен, т. е. Г(а)т = 0 для некоторого т е N. Но тогда am+1 = T(a)ma = 0. □ Теорема 2. 1) Если скалярное умножение (11) невырожденно, то алгебра А полупроста.
§ 3. Конечномерные ассоциативные алгебры 499 2) Обратно, если алгебра А полупроста и char К = 0, то скаляр- ное умножение (11) невырожденно. Доказательство. 1) Пусть/ — нильпотентный идеал алгебры А. Тогда для любого х ЕI и любого a G А элемент ах нильпотентен (так как принадлежит Z) и, следовательно, (a, x) = trT(ax) = 0. Таким образом, I с А1 = 0. 2) Обратно, если char К = 0, то предложения 1 и 2 показывают, что А1 есть нильпотентный идеал. □ Замечание 1. На самом деле мы доказали больше: если char К = = 0, то rad А совпадает с ядром скалярного умножения (И). Пример 3. Как следует из формулы (6), регулярное представ- ление алгебры L(V) изотипно. Более точно, оно изоморфно nR, где п = dim V, a R — тавтологическое представление алгебры L(V) в пространстве V (т. е. тождественное отображение L(V) —>L(V)). Следовательно, скалярное умножение (11) в L(V) имеет вид (j/, &) = ntrj/^. (12) Если — оператор, задаваемый (в каком-либо фиксированном ба- зисе) матричной единицей Еу, то 1 0 tr<£y<£w — при k = j> I = i, в остальных случаях. Отсюда следует, что если char К | и, то скалярное умножение (12) невырожденно и, стало быть, алгебра L(V) полупроста. (Как мы уви- дим (см. пример 6), она полупроста и в том случае, когда char К | и.) Пример 4. Пусть A = K[t]/(h). Мы можем рассмотреть А как К [t] -модуль. Тогда h будет характеристическим многочленом опера- тора умножения на t (см. задачу 9.3.1). Пусть сь ..., сп — его корни (с учетом кратностей) в поле разложения. Тогда для любого много- члена f е К [t] корнями характеристического многочлена оператора умножения на /(t) будут /(q), ...,/(сп). Но оператор умножения на /(г) в К[t]-модуле А — это то же, что оператор умножения на [/] = /+ №) в алгебре А, т. е. оператор Т([/]). Следовательно, tr ?([/]) = £/(с,).
500 Глава 11. Линейные представления и ассоциативные алгебры Поэтому в базисе {[1], [t], [t2],..., [tn !]} алгебры А матрица ска- лярного умножения (11) имеет вид $о 52 $1 $2 $3 $2 $з 54 • 5л-1 • Sn 5п+1 , (13) \5п-1 5п 5п+1 ••• 52л-27 где = С1 + ... +с*. Заметим, что степенные суммы sk можно выра- зить через коэффициенты многочлена h без того, чтобы находить его корни. Согласно теореме 2, если char К = 0, алгебра А полупроста тогда и только тогда, когда матрица (13) невырожденна. С другой стороны (см. пример 2), она полупроста тогда и только тогда, когда много- член h не имеет кратных неприводимых множителей, что в случае char К = 0 равносильно тому, что сь ..., сп различны. Таким образом, мы приходим к следующему выводу: многочлен h над полем нуле- вой характеристики сепарабелен (т. е. не имеет кратных корней ни в каком расширении поля К) тогда и только тогда, когда матри- ца (13) невырожденна. Замечание 2. Последнее утверждение верно в любой характе- ристике и может быть доказано более непосредственно. А именно, матрица (13) может быть представлена в виде произведения Следовательно, ее определитель равен ПСс.-ср2’ i>j т. е. дискриминанту многочлена h (см. § 3.9), откуда и следует дока- зываемое утверждение. В частности, для неприводимого многочлена h над полем К положитель- ной характеристики мы получаем, что поле L = K[x]/(h) является сепара- бельным расширением поля К в смысле определения, данного в замеча- нии 9.5.2, тогда и только тогда, когда многочлен h сепарабелен.
§ 3. Конечномерные ассоциативные алгебры 501 Задача 1. Доказать, что в случае char К = 0 число различных кор- ней многочлена h равно рангу матрицы (13). Алгебра А называется простой, если А / 0 и А не имеет никаких нетривиальных (т. е. отличных от 0 и А) идеалов. Пример 5. Всякое расширение L поля К является простой (ком- мутативной) алгеброй над К. Задача 2. Доказать обратное утверждение: всякая простая ком- мутативная алгебра над К есть либо поле, содержащее К (т. е. расши- рение поля К), либо одномерная алгебра с нулевым умножением. Для любой алгебры А подпространство А2 является идеалом (как и вообще произведение двух идеалов). Если алгебра А нильпотент- на, то А2 / А. Поэтому простая алгебра А не может быть нильпотент- ной, за исключением тривиального случая, когда А2 = 0 и dim А = 1, т.е. когда А — одномерная алгебра с нулевым умножением. За ис- ключением этого случая, всякая простая алгебра является полупро- стой. Пример 6. Алгебра L(V) проста (см. пример 9.2.6) и, следова- тельно, полупроста. Теорема 3. Всякая полупростая ассоциативная алгебра А разла- гается в прямую сумму (нетривиальных) простых алгебр: А = А!Ф...ФА5, (14) причем любой идеал алгебры А является суммой некоторых слагае- мых этого разложения. Доказательство. Мы докажем эту теорему в предположении, что char К = 0. Если алгебра А проста, то доказывать нечего (в этом случае $ = 1). Пусть она не проста, и пусть А2 с А — какой-нибудь ее минимальный идеал. Тогда либо А = А2ФА^, (15) либо AjCAp Но во втором случае идеал А2 в силу предложения 2 нильпотентен, так что этот случай невозможен. В первом случае из разложения (15) следует, что всякий идеал алгебры А1? а также всякий идеал алгебры А^, является идеалом алгебры А и, значит, алгебра А2 проста, а алгебра А^ полупроста. Если алгебра А^ еще не проста, то применяем к ней такое же рассуждение и т. д. Пусть теперь I — любой идеал алгебры А. Обозначим через пк проекцию на k-е слагаемое разложения (14). Очевидно, что 1к = = пк (Z) — идеал алгебры Ак. Если 1к / 0, то 1к = Ак и, следовательно,
502 Глава 11. Линейные представления и ассоциативные алгебры Это как раз и означает, что идеал I есть сумма некоторых слагаемых разложения (14). □ В частности, всякая (конечномерная) полупростая коммутатив- ная ассоциативная алгебра А есть прямая сумма нескольких конеч- ных расширений поля К (см. задачу 2), а если поле К алгебраически замкнуто — то просто нескольких копий самого поля К. Задача 3. Доказать последнее утверждение (относящееся к ал- гебраически замкнутому случаю) средствами коммутативной ал- гебры. (Указание: рассмотреть Spec А и воспользоваться теоремой Гильберта о нулях.) Пример 7. Пусть многочлен heК[х] не имеет кратных неприво- димых множителей, и пусть h = p1...ps — его разложение на непри- водимые множители над К. В силу теоремы 9.2.5 имеет место изо- морфизм алгебр К [Г] / (h) К [t] / (pi) Ф... Ф К [Г] / (ps). (16) Это и дает разложение полупростой алгебры К [t] /(h) в прямую сум- му простых алгебр (конечных расширений поля К). В частности, при К = R каждому вещественному корню многочлена h отвечает одномерное слагаемое разложения (16), изоморфное R, а каждой па- ре сопряженных мнимых корней — двумерное слагаемое, изоморф- ное С (см. примеры 9.2.4 и 9.2.5). Задача 4. Вычислив двумя способами скалярное умножение (11) в алгебре R[x] / (h), где h G R[x] — многочлен, не имеющий кратных комплексных корней, доказать, что число пар сопряженных мни- мых корней многочлена h равно отрицательному индексу инерции симметричной матрицы (13). В частности, все корни многочлена h вещественны тогда и только тогда, когда матрица (13) положитель- но определенна. Что касается простых алгебр, то их строение в случае алгебраиче- ски замкнутого поля К описывается следующей теоремой, а общему случаю будет посвящен § 6. Теорема 4. Всякая нетривиальная простая ассоциативная ал- гебра А над алгебраически замкнутым полем К изоморфна алгебре вида L(V), где V — векторное пространство над К, а всякое ее нетри- виальное неприводимое представление изоморфно тавтологическо- му представлению алгебры L(V). (Под тривиальным неприводимым представлением здесь пони- мается одномерное представление К, при котором К(А) = 0.)
§ 3. Конечномерные ассоциативные алгебры 503 Доказательство. Рассмотрим ограничение регулярного пред- ставления алгебры А на какое-либо минимальное инвариантное подпространство V (левый идеал) алгебры А. Полученное непри- водимое представление обозначим через R. Его ядро есть идеал алгебры А. По теореме Бернсайда либо A^R(A) = L(V), либо dim V = 1 и R(A) = 0. Во втором случае AV = 0, так что Ао = {х G А: Ах = 0} И 0; но легко видеть, что Ао — идеал алгебры А и, значит, Ао = А, что противоречит нетривиальное™ алгебры А. Пусть теперь А = L(V), где V — какое-то векторное пространство, и R — тавтологическое представление алгебры А в пространстве V. Тогда регулярное представление Т алгебры А изоморфно nR, где п = dim V. Пусть S: А —> L(U) —любое неприводимое представление алгебры А. Возьмем какой-нибудь ненулевой вектор u0 G U и рас- смотрим отображение у>:А-+и, a-*S(a)u0. Так как ^(T(a)x) = (/?(ax)=S(ax)uo=5(a)S(x)uo = 5(a)^(x), то у? — морфизм представления Т в представление S. Если представ- ление S нетривиально, то Im = U, так что представление S изо- морфно факторпредставлению представления Г. Так как S неприво- димо, то S^R (см. следствие 2 теоремы 1.3). □ Из теорем 3 и 4 следует, что всякая полупростая ассоциативная алгебра над алгебраически замкнутым полем изоморфна алгебре вида А = Ь(У1)Ф...ФЬ(УД (17) где Vj,..., Vs — какие-то векторные пространства. Если dim щ (i = l, ...,$), то dim А = +... + п2. (18) Число s можно найти, если известен центр алгебры А. Вообще, центром ассоциативной алгебры А называется (коммутативная) по- далгебра Z(A) = {zeA: az = zaVaeА}.
504 Глава 11. Линейные представления и ассоциативные алгебры Известно (см. задачу 1.8.2), что центр алгебры L(V) одномерен и со- стоит из скалярных преобразований. Поэтому для полупростой ал- гебры А, заданной разложением (17), dim Z(A) = s. (19) Пусть Ri (i = 1, ...,s) обозначает неприводимое представление алгебры А в пространстве V-, задаваемое проекцией на L(VJ) в раз- ложении (17). Отметим, что представления Rlf..., Rs попарно не изо- морфны, так как их ядра различны. Теорема 5. Всякое нетривиальное неприводимое представление алгебры (17) изоморфно одному из представлений RlfRs. Доказательство. Пусть S: A-^L(U)— нетривиальное неприво- димое представление алгебры А. Так как S(A) = L(L7) — простая ал- гебра, то KerS есть сумма всех слагаемых разложения (17), кроме одного, скажем ЦЦ). Но тогда S кроме одного, скажем ЦЦ). Но тогда S фактически сводится к представлению алгебры L(VJ) и по теореме 4 изоморфно Rt. □ Имеет место также следующая теорема: всякое линейное пред- ставление полупростой ассоциативной алгебры (над любым полем) вполне приводимо. § 4. Линейные представления конечных групп Теория ассоциативных алгебр дает важную информацию о ли- нейных представлениях конечных групп. Пусть G — конечная группа порядка п и К — какое-нибудь поле. Определение 1. Групповой алгеброй группы G над полем К на- зывается алгебра KG, базисные элементы которой занумерованы элементами группы G, причем произведение базисных элементов с номерами g, h е G есть базисный элемент с номером gh. Обычно базисные элементы алгебры KG отождествляют с соот- ветствующими элементами группы G. При таком соглашении вся- кий элемент алгебры KG записывается в виде (аг€К). (20) gGG Из ассоциативности умножения в группе G следует ассоциативность умножения в алгебре KG.
§ 4. Линейные представления конечных групп 505 Всякое линейное представление R группы G в векторном про- странстве V над полем К однозначно продолжается до линейного представления алгебры KG в том же пространстве по формуле r(S ag&) = Е agR(g). geG Обратно, ограничение всякого линейного представления алгебры KG на G есть линейное представление группы G. Тем самым устанав- ливается естественное взаимно однозначное соответствие между представлениями группы и представлениями ее групповой алгебры. Очевидно, что соответствующие друг другу представления груп- пы G и алгебры KG имеют один и тот же набор инвариантных под- пространств. В частности, неприводимым представлениям группы отвечают неприводимые представления групповой алгебры, и на- оборот. Теорема 1. Если charKfn, то алгебра KG полупроста. Доказательство. Воспользуемся теоремой 3.2. Для этого вычис- лим скалярное умножение (11) на алгебре KG. Легко видеть, что для любого g е G Поэтому для любых g, h 6 G (21) При char К { п это скалярное умножение невырожденно и, значит, алгебра KG полупроста. В оставшейся части этого параграфа мы будем считать, что К = С. Из теоремы 1 и результатов § 3 следует, что алгебра CG есть прямая сумма матричных алгебр. Теорема 2. Группа G имеет, с точностью до изоморфизма, лишь конечное число неприводимых комплексных представлений. Их раз- мерности п1?..., ns подчиняются соотношению П1 + ... + п2 = п, (22) а их число s равно числу классов сопряженных элементов группы G.
506 Глава 11. Линейные представления и ассоциативные алгебры Доказательство. Первое утверждение теоремы вытекает из тео- ремы 3.5, а соотношение (22) — из формулы (18). Число s по форму- ле (19) равно размерности центра алгебры CG. Найдем этот центр. Элемент (20) принадлежит центру алгебры CG тогда и только то- гда, когда он перестановочен со всеми элементами группы G, т. е. ко- гда hah~1= 2 ax(hg/i_1)= S ah-ighg = a g^G geG для любого h 6 G. Последнее означает, что в выражении элемента а коэффициенты при сопряженных элементах группы G равны. Сле- довательно, центр алгебры CG есть линейная оболочка элементов вида где С — класс сопряженных элементов, а его размерность geC равна числу классов сопряженных элементов. □ Пример 1. Для абелевой группы все неприводимые представле- ния одномерны (следствие 2 теоремы 1.2). Их число равно п, так как в этом случае каждый класс сопряженных элементов состоит из одного элемента. Это согласуется с формулой (22). Пример 2. Так как при любом гомоморфизме группы G в абеле- ву группу ее коммутант переходит в единицу, то одномерные пред- ставления любой группы G сводятся к представлениям факторгруп- пы G/Gz. В частности, группа Sn при любом п имеет ровно два од- номерных представления: тривиальное и нетривиальное, ставящее в соответствие каждой подстановке ее знак. Пример 3. Для группы S3 заведомо имеются следующие три по- парно не изоморфных неприводимых представления: — тривиальное одномерное представление, R\ — знак подстановки, R2 —двумерное представление, при котором S3 изоморфно отоб- ражается на группу симметрии правильного треугольника (про- верьте, что это представление неприводимо не только над R, но и над С!). Так как в S3 имеется ровно три класса сопряженных элементов (или, если угодно, так как I2 + I2 + 22 = 6), этим исчерпывается список неприводимых представлений группы S3. Пример 4. Аналогичным образом можно получить следующий полный список неприводимых представлений группы S4: Rj —тривиальное одномерное представление, R\ — знак подстановки,
§ 4. Линейные представления конечных групп 507 R2 — композиция гомоморфизма S4 —> SA/VA — S3 и двумерного неприводимого представления группы S3, R3 — изоморфизм на группу вращений куба, R'3 — изоморфизм на группу симметрии правильного тетраэдра. Замечание 1. Как следует из примеров 3 и 4, все неприводимые комплексные представления (а, значит, и вообще все комплексные представления) групп S3 и SA являются комплексификациями веще- ственных представлений. Можно доказать, что то же самое верно для группы Sn при любом и. Поэтому, учитывая предложение 1.1, с вещественными представлениями групп Sn можно работать так же, как с комплексными. В частности, для них справедлива вся тео- рия, изложенная в этом параграфе. Задача 1. Описать неприводимые представления группы диэд- paDn. Задача 2. Доказать, что что всякое неприводимое представле- ние группы GxH есть тензорное произведение неприводимых пред- ставлений групп G и Н (см. определение в задаче 1.3). Пусть Rt:G->GL(V;) (i = l, ...,s) — все неприводимые комплексные представления группы G. Тогда, произведя подходящие отождествления, мы можем считать, что €0 = ^)®...®^), (23) причем Ri есть просто проекция на i-e слагаемое в этом разложении. Подпространства L(VJ) суть изотипные компоненты регулярного представления Т алгебры CG, причем ограничение Т на L(VJ) изо- морфно пД-, где П( = dim VJ. Поэтому для любых a, be CG (a,b) = t п,1гК((а)К((Ь) (24) i=l (ср. формулу (12)). Рассмотрим теперь пространство C[G] всех функций на G со значениями в С. Поскольку всякая функция на G однозначно про- должается до линейной функции на CG по формуле agg) = S ag4>(.8)> geG ' gGG то пространство C[G] естественно отождествляется с пространст- вом, сопряженным к CG.
508 Глава 11. Линейные представления и ассоциативные алгебры С другой стороны, имеющееся скалярное умножение в простран- стве CG определяет его изоморфизм с сопряженным пространством. В частности, элементу g G G при этом изоморфизме соответствует функция определяемая согласно формуле <Pg(h) = (g, h) = |"’ gJ”e’ (0, gh/e, т. e. взятая с множителем п 5-функция 5g-i в точке g"1. Перенесем с помощью указанного изоморфизма скалярное умно- жение из пространства CG в пространство С [G]. Тогда для 5-функ- ций мы получим (5g’5h) n2(g ,h ) а для любых функций игр — = (25) gEG Вычислим теперь скалярные произведения матричных элемен- тов неприводимых представлений группы G. В каждом из пространств Ц (i = 1,..., s) выберем базис и обозна- чим через (pijk {j, к = 1,..., щ) (j, к)-й матричный элемент оператора Ki(g) в этом базисе. Функция ^€C[G], определенная таким обра- зом, называется (J, к)-м матричным элементом представления Яр С другой стороны, обозначим через линейный оператор в пространстве VJ-, матрица которого в выбранном базисе есть мат- ричная единица Ejk. Ввиду разложения (23) элементы £^к составля- ют базис пространства CG. Из формулы (24) следует, что ^iJy) ~ (26) а все остальные скалярные произведения элементов £цк равны нулю. При изоморфизме пространств CG и C[G] элементу ^к в си- лу (26) соответствует матричный элемент ipikj с коэффициентом п,. Следовательно, (^>W = b (27)
§ 4. Линейные представления конечных групп 509 а все остальные скалярные произведения матричных элементов рав- ны нулю. Особенный интерес представляют суммы диагональных матрич- ных элементов, называемые характерами представлений R,. Вообще, пусть R: G -* GL(V) — любое линейное представление группы G. Определение 2. Функция % eC[G], определяемая формулой /(g) = tr R(g), называется характером представления R. Очевидно, что характер суммы двух представлений равен сумме их характеров. Так как следы сопряженных операторов равны, то /(hgh-1) = /(g) Vg,heG. Функции х gC[G], обладающие этим свойством, называются цен- тральными. Они образуют в C[G] подпространство, которое мы обозначим через ZC[G]. Очевидно, что dimZC[G] =s. В частности, пусть Xi G = 1,s) — характер представления Rt. Из (27) следует Теорема 3. Характеры Xi, •••> Xs образуют ортонормированный базис пространства ZC[G], т. е. = (28) Пусть R: G —>GL(V) — какое-то линейное представление и х — его характер. Следствие 1. Кратность, с которой неприводимое представле- ние R; входит в представление R, равна (/, Xi)- Доказательство. Если R^ X то X = S ^iXi и> следователь- но, (/, х^ =ki- 1=1 1=1 □ Следствие 2. Представление R неприводимо тогда и только то- гда, когда (/, х) = 1- $ $ Доказательство. Если R то (Х>Х) = = 1 тогда 1=1 i=i и только тогда, когда одна из кратностей к, равна 1, а все остальные равны 0. □
510 Глава 11. Линейные представления и ассоциативные алгебры Вместо билинейного скалярного умножения (25) в пространстве С [G] можно рассматривать эрмитово скалярное умножение (<р|^) = | S (29) более удобное для практических вычислений. Если в каждом из пространств Ц выбрать базис, ортонормированный относительно инвариантного эрмитова скалярного умножения (см. теорему 2.3), то операторы представления запишутся унитарными матрицами, т. е. будут выполняться соотношения ^•(g"1) = ч>Цк№- Соотношения (27) и (28) в терминах эрмитовой метрики (29) озна- чают, что матричные элементы образуют ортогональный базис пространства C[G], причем (4>цк 14>цк) = а характеры fa образуют ортонормированный базис пространства ZC[G]. Пример 5. Характер одномерного представления совпадает с единственным матричным элементом и, если угодно, с самим пред- ставлением. Циклическая группа (а)п имеет п одномерных ком- плексных представлений Ro, Rlt..., Rn_lf определяемых условиями Rk(a) = сок, со = е2т/п. Поэтому характеры этой группы задаются следующей таблицей: Хо Zi Хп-1 е 1 1 1 а 1 со соп-1 а2 1 со2 w2(n-l) ... ... а"’1 1 со"-1 w(n-l? Соотношения ортогональности для характеров означают в данном случае, что если таблицу характеров поделить на Уп, то получится унитарная матрица.
§ 4. Линейные представления конечных групп 511 Пример 6. Пользуясь описанием неприводимых представлений группы S4, данным в примере 4, нетрудно получить следующую таб- лицу характеров группы S4: Zi х{ /2 Хз Хз е 1 1 2 3 3 1 (12) 1 -1 0 -1 1 6 (12)(34) 1 1 2 -1 -1 3 (123) 1 1 -1 0 0 8 (1234) 1 -1 0 1 -1 6 В левом (входном) столбце этой таблицы указаны представители классов сопряженных элементов группы S4, а в крайнем правом приведены числа элементов в этих классах, необходимые для вычис- ления скалярных произведений. Так, например, (Хг> Хз) = (Хг I Хз) = = ;~г(1-2-3 + 6-0-(—1) 4-3-2-(-1)+ 8-(—1)-0 + 6-0-1) = 0. Пример 7. Пусть V есть (6-мерное) пространство функций на множестве граней куба. Изоморфизм группы S4 и группы симмет- рии куба определяет линейное представление группы S4 в прост- ранстве V. Обозначим это представление через К, а его характер — через х- Всякий элемент geS4 каким-то образом переставляет гра- ни куба и таким же образом K(g) переставляет 5-функции этих гра- ней. Поэтому /(g) = trK(g) есть число граней, которые элемент g оставляет на месте. Таким образом получается следующая таблица значений характера х • е (12) (12) (34) (123) (1234) X 6 0 2 0 2 Вычисляя скалярные произведения этого характера и характеров неприводимых представлений группы S4 (см. пример 6), находим: (xlXi) = l> (X 1x0 = 0, (zlz2) = l> (х1хз) = 1> <Х 1x0 = 0. Таким образом, R — R] 4" /^2 Я3 •
512 Глава 11. Линейные представления и ассоциативные алгебры Задача 3. Найти минимальные инвариантные подпространства для представления R из примера 7. Задача 4. Пусть G с Sn — дважды транзитивная группа подста- новок. (Это означает, что для любых двух упорядоченных пар раз- личных символов найдется подстановка из G, переводящая первую пару во вторую.) Доказать, что представление группы G в простран- стве функций на множестве {1,..., п} разлагается в сумму ровно двух неприводимых представлений, одно из которых — тривиаль- ное одномерное. (Указание: использовать выражение, которое дает формула Бернсайда (см. задачу 10.3.2) для числа орбит группы G в множестве {1,..., п} х {1,..., и}.) Задача 5. Составить таблицу характеров группы Д5. Задача 6. Пусть R: G —> GL(V) — какое-то линейное представле- ние конечной группы G. Доказать, что проектор пространства V на его изотопную компоненту, отвечающую неприводимому пред- ставлению R, группы G, может быть задан формулой ^ = 7 Ez.Cg’1)^), П gGG где п = |G|, п( = dim R,, a %i — характер представления R,. (Указание: доказать, что элемент 7 Е XiCg^geCG geG есть единица i-ro слагаемого разложения (23), для чего вычислить его скалярные произведения с элементами группы G, пользуясь фор- мулами (21) и (24).) Помимо уже рассмотренной нами операции сложения представ- лений, имеются и другие важные операции над линейными пред- ставлениями (произвольных) групп. Для любого линейного представления R: G —> GL(V) можно опре- делить сопряженное представление R*: G—>GL(V*) по правилу (R*(g)a)(x) = a(R(g)-1x) (aeV.xeV), (30) т. е. по обычному правилу действия преобразований на функции. На матричном языке это выглядит следующим образом: R*(g) = (R(g)T)~1- (31)
§ 4. Линейные представления конечных групп 513 Следовательно, характер сопряженного представления находится по формуле Z«<(g) = ZR(g-1)- (32) Определение сопряженного представления может быть перепи- сано в следующем симметричном виде: (R*(g)a)(R(g)x) = a(x). Отсюда следует, что R** = R (при каноническом отождествлении пространства V** с V). Может случиться, что R* ^R; в этом случае представление R называется самосопряженным. Для комплексного линейного представления конечной группы в базисе, ортонормированном относительно инвариантного эрмито- ва скалярного умножения, формулы (31) и (32) принимают вид R*(g)=m zHg)=z® (33) Пример 8. Для неприводимых (одномерных) представлений циклической группы имеем в обозначениях примера 5: R*-Ro, Rk~Rn_k (k = l, ...,п-1). Пример 9. Как следует из примера 10.3.5, в группе Sn любой эле- мент сопряжен своему обратному. Поэтому всякое линейное пред- ставление группы Sn самосопряженно. Задача 7. Доказать, что если R — неприводимое представление какой-либо группы, то представление R* также неприводимо. Задача 8. Доказать, что все представления конечной группы G самосопряженны тогда и только тогда, когда всякий элемент груп- пы G сопряжен своему обратному. Определим теперь операцию умножения линейных представле- ний группы G. Произведением линейных представлений R: G —* GL(V) и S: G —> —> GL(W) называется линейное представление RS: G — GL(V®W), g —R(g)®S(g). (См. определение тензорного произведения линейных операторов в §8.1.) Замечание 2. Иногда представление RS называют тензорным произведением представлений R и S, но мы сохраняем этот термин для представления прямого произведения двух групп, определенно- го в задаче 1.3.
514 Глава 11. Линейные представления и ассоциативные алгебры Задача 9. Пусть в пространствах V и W выбраны какие-то бази- сы и представления R и S записаны в этих базисах. Будем задавать элемент пространства V ® W матрицей Z, составленной из его ко- ординат (см. формулу (10) §8.1). Доказать, что представление RS в этих терминах задается формулой (RS)(g)Z=R(g)ZS(g)T. (34) Из формулы (28) § 8.1 следует, что Xrs = XrXs- (35) Произведение неприводимых представлений, как правило, не является неприводимым. Разложение произведений неприводимых представлений на неприводимые компоненты — это одна из основ- ных задач теории представлений. Для представлений конечных групп благодаря формуле (35) она в принципе может быть решена с помощью теории характеров. Пример 10. Разложим в сумму неприводимых представлений квадрат представления R3 группы S4 (см. пример 4). Пользуясь таб- лицей характеров группы S4, приведенной в примере 6, получаем: (Хз I Zi) = 1, (*з । = °’ (Хз I Х2> = 1, (Хз1Хз) = 1> (Хз1*з) = 1> Следовательно, R2^R1+R2 + R3 + R;|. (36) Аналогично определяется произведение нескольких представле- ний, а также симметрическая и внешняя степени представления. Например, симметрический квадрат представления R: G —> GL(V) есть представление S2R: G—»GL(S2(V)), g~S2(R(g)). (См. определение симметрического квадрата линейного оператора в §8.3.) Из формулы (53) § 8.3 следует, что Ws) = |(ZR(z)2 + Zr(Z2))- (37) Если отождествить пространство S2(V) с пространством ST2(V) симметрических тензоров, то представление S2R будет не чем
§ 4. Линейные представления конечных групп 515 иным, как ограничением представления R2 на инвариантное под- пространство ST2(V). Аналогичное утверждение справедливо и для внешнего квадрата Л2К представления R. Так как Т2(У)=$Т2(У)Ф ФЛТ2(У), то R2^S2R + A?R. (38) Пример 11. Закон Гука в теории упругости выражает связь меж- ду тензором деформации сг и тензором напряжений т твердого те- ла в какой-либо его точке. Оба этих тензора суть симметрические операторы в пространстве Е3. (Определение тензора деформации см. в примере 6.3.5). Подняв индексы, их можно рассматривать, если угодно, как элементы пространства S2(E3). Закон Гука имеет вид а = <#4, где — некоторый симметрический оператор в про- странстве S2(E3), называемый тензором упругости и характеризую- щий упругие свойства данного твердого тела в данной точке (при заданных температуре и давлении). Так как dimS2(E3) = 6, то раз- мерность пространства симметрических операторов в S2(E3) равна = 21. Таким образом, в общем случае тензор упругости опреде- ляется 21 параметрами, которые должны быть найдены опытным путем. Ситуация упрощается, если тело имеет кристаллическую струк- туру. А именно, пусть G = dr, где Г — группа симметрии данной кристаллической структуры (см. пример 9.1.1). Тогда оператор Ж мжжел быть перестановочен со всеми операторами S2 аУ, где аУ е G. Общий вид такого оператора может быть найден с помощью теории представлений. Число параметров, от которых он зависит, будет тем меньше, чем больше группа G. Рассмотрим, например, кристалл поваренной соли (см. рис. 2 §4.2). В этом случае группа G есть группа симметрии куба, т. е., в обозначениях примера 4, G = R3(S4) х {±<?}. Второй множитель тривиально действует на S2(E3), поэтому его можно не учитывать. Таким образом, оператор должен быть эндоморфизмом представ- ления S2R3 группы S4. По формуле (37) получаем следующую табли- цу значений характера / этого представления: е (12) (12)(34) (123) (1234) X 6 2 2 0 0
516 Глава И. Линейные представления и ассоциативные алгебры Вычисляя его скалярные произведения с характерами неприводи- мых представлений, находим, что S2K3^Ri+R2 + R'. (39) В частности, представление S2R3 имеет простой спектр. Согласно предложению 1.4 (см. также замечание 1), общий вид его эндомор- физма зависит от 3 параметров. Итак, для определения тензора упругости кристалла поваренной соли требуется найти опытным путем значения лишь 3 параметров (вместо 21!). Замечание 3. Ввиду изоморфизма (38) разложение (39) можно было бы найти вычитанием из разложения (36) представления А2Я3, которое, как легко показать, изоморфно R3. Задача 10. Доказать, что неприводимое представление группы самосопряженно тогда и только тогда, когда оно ортогонально или симплектично (см. определение в конце §1). Задача 11. Доказать, что неприводимое комплексное представ- ление конечной группы является комплексификацией вещественно- го представления тогда и только тогда, когда оно ортогонально. Задача 12. Доказать, что сумма размерностей ортогональных неприводимых представлений конечной группы G минус сумма размерностей ее симплектических неприводимых представлений равно числу решений уравнения х2 = е в G. (Указание: подсчитать след антиавтоморфизма групповой алгебры CG, индуцированного инверсией в группе G, в базисе из элементов группы G и в базисе, согласованном с разложением (23).) § 5. Инварианты Всякое действие группы G на множестве X определяет по фор- муле (8) § 10.3 линейное представление этой группы в пространстве F(X, К) функций на X со значениями в (любом) поле К. Определение 1. Функция feF(X,IC) называется инвариантом (данного действия) группы G, если gf = f для любого gGG. Иными словами, инвариант — это функция, постоянная на ор- битах группы G. Знание инвариантов помогает решению важной задачи описания орбит. А именно, если какой-либо инвариант f принимает разные значения в каких-либо двух точках, то эти точки заведомо принадлежат разным орбитам. Идеальным решением за-
§ 5. Инварианты 517 дачи является указание таких инвариантов /ь fm, что для любых двух точек, принадлежащих разным орбитам, хотя бы один из них принимает в этих точках разные значения. В этом случае говорят, что инварианты f19 разделяют орбиты. Пример 1. Рассмотрим так называемое присоединенное линей- ное представление Ad группы GLn(C) в пространстве Ln(C), опреде- ляемое по формуле Ad(A)X = AXA'1. Пусть /x(t) = det(tE - X) —характеристический многочлен матри- цы X. Запишем его в виде Тогда Д(Х) есть сумма главных миноров порядка к матрицы X (см. задачу 6.2.1). Так как характеристические многочлены подоб- ных матриц равны, то — инварианты рассматриваемого действия группы GLn(C). Однако они не разделяют орбит. Действи- тельно, две матрицы принадлежат одной орбите тогда и только тогда, когда они имеют одну и ту же жорданову форму, в то время как значения инвариантов /ь ...,fn определяют лишь собственные значения матрицы. Пример 2. Инварианты симметрической группы Sn, действую- щей в Кп перестановками координат, — это функции от п пере- менных, не меняющиеся ни при какой перестановке переменных. В частности, инвариантные многочлены этой группы — это симмет- рические многочлены. Пространство F(X, X) является алгеброй относительно обычной операции умножения функций, и преобразования из группы G явля- ются автоморфизмами этой алгебры. Отсюда следует, что инвариан- ты образуют подалгебру в F(X, К). Обычно инварианты ищут не среди всех вообще, а среди «хоро- ших» в том или ином смысле функций. Наиболее распространенной является ситуация, когда X = V — векторное пространство над по- лем К, а действие группы G определяется ее линейным представле- нием в пространстве V. В этой ситуации обычно ищут инварианты в алгебре К[У] многочленов на V. (Именно так обстояло дело в при- мере 1.) Подалгебра инвариантов в K[V] обозначается через K[V]G. Говорят, что орбиты линейной группы G с GL(V) разделяются инвариантами, если для любых двух различных орбит найдется ин- вариант f eK[V]G, принимающий на них различные значения.
518 Глава 11. Линейные представления и ассоциативные алгебры Теорема 1. Если G с GL(V) — конечная группа и ее порядок не делится на char К, то ее орбиты разделяются инвариантами. Доказательство. Пусть Oj и О2—две различные орбиты. Тогда существует многочлен /е К [V], равный 1 во всех точках орбиты и 0 во всех точках орбиты О2. Совокупность всех многочленов сте- пени deg /, обладающих этим свойством, есть некоторая плос- кость S в пространстве всех многочленов степени deg/. Группа G сохраняет эту плоскость и действует на ней аффинными преобра- зованиями. Согласно лемме 2.1, в S существует неподвижная точка группы G. Это и будет искомый инвариант. □ Задача 1. В приведенном доказательстве использовался тот факт, что для любого конечного числа точек пространства V существует многочлен, принимающий в этих точках любые наперед заданные значения. Докажите это. Пример 3. Задание вектора (хь х2, - хп) е Кп с точностью до перестановки его координат равносильно заданию многочлена (х-х1)(х-х2)...(х-хп)еК[х]. Коэффициенты этого многочлена суть с точностью до знака элемен- тарные симметрические многочлены от хьх2, ...,хп. Следователь- но, орбиты группы Sn в пространстве Кп (см. пример 2) разделя- ются элементарными симметрическими многочленами (являющи- мися инвариантами группы Sn) и, тем более, разделяются всеми инвариантами. Если алгебра K[V]G порождается инвариантами /ь и эти инварианты принимают одинаковые значения в каких-то двух точ- ках, то и все инварианты принимают одинаковые значения в этих точках. Поэтому, если орбиты группы G разделяются (всеми) инва- риантами, то они разделяются инвариантами /ъ ..., fm. Так, в преды- дущем примере можно было заранее предсказать (в случае, когда char К {|G|), что орбиты группы Sn должны разделяться элементар- ными симметрическими многочленами, поскольку эти многочлены порождают алгебру всех симметрических многочленов. Следующая теорема является частным случаем современной вер- сии теоремы Гильберта об инвариантах. Сам Гильберт доказал эту теорему в 1891 г. для линейных представлений группы SLn(K), но ос- новная идея его доказательства применима в гораздо более общей ситуации и в том числе для конечных групп.
§ 5. Инварианты 519 Теорема 2. Если G — конечная группа и ее порядок не делится на char К, то алгебра K[V]G является конечно порожденной. Утверждение теоремы означает, что существуют такие инвариан- ты Д, что всякий инвариант представляется (быть может, не однозначно) в виде многочлена от Доказательство. Определим в алгебре K[V]G так называемый оператор Рейнольдса I] (читается «бекар») по формуле /h = center G/ = Л: S gf. (40) |U| g€G Это линейный оператор, обладающий следующими свойствами: 1) /4eK[V]G для любого/GK[V]; 2) /*=/для любого/eK[V]G; 3) (/h)4=/7i4 для любых/бК[У]с, heK[V], Иными словами, это проектор на алгебру инвариантов, перестано- вочный с умножениями на инварианты. Заметим, что многочлен инвариантен тогда и только тогда, ко- гда инвариантны все его однородные составляющие, и что оператор Рейнольдса переводит любой однородный многочлен в однородный многочлен той же степени. Пусть теперь I с K[V] —идеал, порожденный всеми однородны- ми инвариантами положительной степени. По теореме Гильберта о базисе идеала идеал I порождается конечным числом многочле- нов. Ясно, что их можно выбрать среди однородных инвариантов. Пусть это будут инварианты /ъ .../т, и пусть к[Л.../т]ск[у]с — порожденная ими подалгебра. Мы докажем, что она совпадает с алгеброй инвариантов. Для этого докажем индукцией по и, что каждый однородный инвариант степени п принадлежит алгебре При и = 0 доказывать нечего (алгебра К [/2,..., fm ] содержит еди- ницу по определению). Пусть / — произвольный однородный инва- риант положительной степени. Так как f G /, то существуют такие многочлены h19 ...,hmeK[V], что т i=l
520 Глава 11. Линейные представления и ассоциативные алгебры Можно считать, что ht — однородный многочлен, степень которого равна deg hi = deg f - deg /f < deg f. Применяя к предыдущему равенству оператор t|, мы получаем тогда 1=1 По предположению индукции hj ..., /т]. Следовательно, и f G еК[Л,...,/т]. □ Явное нахождение конечной системы порождающих алгебры ин- вариантов в конкретном случае может представлять собой трудную задачу. Пример 4. Дадим новое доказательство того, что алгебра инва- риантов симметрической группы Sn (см. пример 2), т. е. алгебра сим- метрических многочленов, порождается элементарными симметри- ческими многочленами ctj,..., ап. В примере 10.6.5 уже было пока- зано, что К(х1(xn)s" = K(altсгп), причем сгъ ..., (jn алгебраически независимы. Так как ..., хп явля- ются корнями многочлена (х - Xj)... (х - хп) = хп - O-jX"-1 +... + (- 1)пстп с коэффициентами из К[aj,..., ап], то алгебра К[хь ...,хп] всех мно- гочленов и, тем более, ее подалгебра К[хх,..., xn]Sn являются целы- ми расширениями алгебры ..., ап]. В то же время К[х1(xn]s» сК(хъ Xn)s" =K(altстп). Так как алгебра KEctj,..., <тп], будучи изоморфна алгебре многочле- нов от п переменных, факториальна, то она нормальна (целозамкну- та в своем поле отношений). Следовательно, К[хъ ...,xn]s" =К[<71, стп]. Пример 5. Не следует думать, что алгебра инвариантов все- гда порождается алгебраически независимыми элементами, как в предыдущем примере. Такая ситуация является скорее исключе- нием, чем правилом. Рассмотрим, например, группу G = {±Е} с GL(V), char К # 2.
§ 5. Инварианты 521 Однородный многочлен является инвариантом этой группы тогда и только тогда, когда его степень четна. Поэтому минимальная си- стема однородных порождающих алгебры инвариантов состоит из многочленов которые связаны соотношениями fijfkl = fikfjl' Замечание 1. Теоремы 1 и 2 справедливы и для конечных групп, по- рядок которых делится на char К, но приведенные выше доказательства в этом случае не проходят. В случае К = R доказанные теоремы могут быть обобщены на произвольные компактные группы. Теорема 3. Орбиты компактной группы G линейных преобразо- ваний вещественного векторного пространства V разделяются ин- вариантами. Доказательство. Следуя доказательству теоремы 1, мы не мо- жем теперь априори гарантировать существование многочлена, рав- ного 1 на Oj и 0 на О2. Однако из теоремы Вейерштрасса о рав- номерной аппроксимации непрерывных функций на компактных множествах многочленами следует, что существует многочлен /, по- ложительный на Oj и отрицательный на О2. Совокупность всех мно- гочленов степени deg /, обладающим этим свойством, есть неко- торое G-инвариантное выпуклое множество М в пространстве всех многочленов степени ^deg/. Неподвижная точка группы G в этом множестве и будет искомым инвариантом. □ Замечание 2. Для комплексных векторных пространств ана- логичная теорема неверна, как показывает пример окружности TcC* = GL1(C). Теорема 4. Пусть G — компактная группа линейных преобразо- ваний векторного пространства V над полем К = R или С. Тогда алгебра K[V]G является конечно порожденной. Эта теорема, как и теорема 2, является частным случаем теоре- мы Гильберта об инвариантах. Доказательство может быть проведено так же, как и доказатель- ство теоремы 2, если только нам удастся определить оператор Рей- нольдса, обладающей свойствами 1)—3). Это можно сделать, заме- нив в формуле (40) суммирование по конечной группе надлежащим образом определенным интегрированием по компактной группе. (Например, в случае G = Т это будет обычное интегрирование по окружности.) Однако мы дадим другое доказательство.
522 Глава 11. Линейные представления и ассоциативные алгебры В силу полной приводимости линейных представлений компакт- ных групп (следствие теоремы 2.2) пространство К [У]п однородных многочленов степени п на V может быть разложено в прямую сумму подпространства K[V]G G-инвариантных многочленов и некоторо- го G-инвариантного подпространства (К[V]n)G. Положим K[V]G = ®(X[V]n)G. п=0 Очевидно, что подпространство K[V]G инвариантно относитель- но G и X[V]=K[V]G®K[V]G. (41) Определим теперь оператор I] как проектор на X[V]G относитель- но разложения (41). По построению этот проектор перестановочен с действием группы G. Единственное, что нам нужно проверить — это то, что он перестановочен с умножениями на инварианты. Для этого достаточно доказать, что K[V]gK[V]g CK[V]G. Умножение на инвариант f е X[V]G перестановочно с действием группы G, т.е. является эндоморфизмом представления группы G в пространстве К[У]. Так как подпространство K[V]G по построе- нию дополнительно к K[V]G, то представление группы G в K[V]G разлагается в сумму нетривиальных неприводимых представлений. То же самое можно сказать и о представлении группы G в fK[V]G. Значит, проекция этого подпространства на K[V]G равна нулю, т. е. fK[V]GaK[V]G, что и требовалось доказать. □ Пример 6. Рассмотрим линейное представление А группы Оп в пространстве L* вещественных симметричных матриц порядка п, определяемое формулой R(A)X = AXA'1 (= АХАТ). Рассмотрим характеристический многочлен матрицы X: det(tE-X) = tn-/1(X)tn-1+/2(X)tn-2-... + (-l)n/nW)- Докажем, что K[L+]R(0-)=R[/1,...,/n]
§ 6. Алгебры с делением 523 и что /i,..., fn алгебраически независимы. Для этого вспомним, что каждая симметричная матрица ортогонально подобна диагональ- ной матрице. Поэтому любой инвариант f группы К(ОП) однознач- но определяется своим ограничением на подпространство D диа- гональных матриц. Так как диагональные матрицы, отличающиеся лишь порядком диагональных элементов, ортогонально подобны, то f\D есть симметрический многочлен от диагональных элементов хъ ...,хп. Непосредственно проверяется, что ограничения на D ин- вариантов суть элементарные симметрические многочле- ны от хъ...,хп. Доказываемые утверждения вытекают теперь из теоремы о симметрических многочленах. Заметим, что, как и долж- но быть, согласно теореме 3, в этом примере орбиты разделяются инвариантами. § 6. Алгебры с делением Из алгебраической замкнутости поля комплексных чисел следу- ет, что единственные конечномерные алгебры над К, являющиеся полями, — это R и С. Однако если отказаться от коммутативности умножения, то можно построить еще одну такую алгебру, а именно, алгебру кватернионов, которая также играет заметную роль в ма- тематике и ее приложениях. Теория становится еще более содержа- тельной, если в качестве основного поля рассматривать вместо R произвольное поле (например, Q). Определение 1. Ассоциативное кольцо с единицей, в котором каждый ненулевой элемент имеет обратный, называется телом. Ал- гебра, являющаяся телом, называется алгеброй с делением. Замечание 1. Кольцо, состоящее из одного нуля, не считается телом. Иными словами, тело — это «некоммутативное поле». Как и в поле, в теле нет делителей нуля и элементы, отличные от нуля, обра- зуют группу по умножению (но уже не обязательно абелеву). Муль- типликативная группа ненулевых элементов тела D обозначается через D*. Всякое тело D может рассматриваться как алгебра с делением над своим центром Z(D) = {z G D: za = az Va G D}> который, очевидно, является полем.
524 Глава 11. Линейные представления и ассоциативные алгебры Если D — алгебра с делением над полем К и 1 — ее единица, то элементы вида Al, Л G К, образуют подкольцо, изоморфное К и содержащееся в центре Z(D) алгебры D. Обычно эти элементы отождествляют с соответствующими элементами поля К, При та- ком соглашении Z(D) D К. Алгебра D называется центральной, если Z(D) = K. Задача 1. Доказать, что конечномерная ассоциативная алгебра является алгеброй с делением тогда и только тогда, когда в ней нет делителей нуля. Наиболее простые и важные примеры некоммутативных алгебр с делением — это алгебры кватернионов. (Обобщенной) алгеброй кватернионов над полем К характеристи- ки 0 2 называется алгебра D = D(a, fl), порождаемая элементами i и j, удовлетворяющими соотношениям i2 = a, j2 = fl, ij = —ji (а,/Зе К*). Легко видеть, что базис алгебры D над К составляют элементы 1, i, j и k = ij, причем элементы i, j, к попарно антикоммутируют и k2 = -afl. В частности, при K = R алгебра D(—1,-1) есть обычная алгебра кватернионов Н, открытая Гамильтоном в 1843 г. Алгебра D(l, 1) изоморфна алгебре матриц L2(K). Изоморфизм между этими алгебрами устанавливается следующим образом: fl ОА fl ОА fO 1А , f О П 1J’ 1<ло -ij* oj’ R<-4-i oj' Для того чтобы выяснить возможность деления в алгебре кватер- нионов, определим для любого кватерниона q = x+yi + zj + uk (х,у, z,ueK) сопряженный кватернион q по формуле q = x-yi -zj-uk. Легко видеть, что линейное отображение q —> q, называемое стан- дартной инволюцией, является антиавтоморфизмом алгебры D, т. е. Q1Q2 —
§ 6. Алгебры с делением 525 (Ввиду линейности достаточно проверить это равенство для базис- ных элементов.) Элемент N(q) = qq = х2 - ay2 - fiz2 + а/Зи2 G К (42) называется нормой кватерниона q. Ясно, что q обратим тогда и толь- ко тогда, когда N(q) 00 (и в этом случае q"1 = N(q)“1q). Алгебра D = D(a, /3) является алгеброй с делением тогда и только тогда, когда уравнение х2 - ay2 - fiz2 + aflu2 = 0 не имеет ненулевых решений в поле К, или, как говорят, квадра- тичная форма (42) не представляет нуля над К, В частности, это условие выполнено, если К = 1Киа = /3 = — 1, так как в этом случае квадратичная форма (42) положительно определенна. Заметим, наконец, что для любых a, b G К* имеем (ai)2 = a2a, (bj')2 = b2p, (ai)(bj) = -(bj)(ai). Это показывает, что D(a2a, b2fi)^D(a,/3). Задача 2. Доказать, что в алгебре D(l, 1) Ь2(Ю норма есть определитель соответствующей матрицы. Как в матричных терми- нах интерпретируется стандартная инволюция этой алгебры? Задача 3. Доказать, что D(a, 1) ^L2(K) при любом аеК*. Если D — конечномерная алгебра с делением над полем К, то для любого xgD подалгебра К[х] коммутативна и, следовательно, является полем. Поэтому всякая конечномерная алгебра с делением над алгебраически замкнутым полем К совпадает с полем К. Когда мы имеем дело с алгебрами над алгебраически незамкну- тым полем, всегда полезно посмотреть, что происходит при алгеб- раических расширениях этого поля. Например, для изучения веще- ственных алгебр полезно посмотреть, что происходит при их ком- плексификации. Разрешив делать алгебраические расширения, мы ставим себя в ситуацию, равнозначную той, когда основное поле алгебраически замкнуто. С другой стороны, многие свойства алгебр при таких расширениях сохраняются. Пусть А — алгебра над полем К и Р — какое-либо расширение поля К. Векторное пространство А(Р) = Р А можно превратить
526 Глава 11. Линейные представления и ассоциативные алгебры в алгебру над Р*, определив умножение его элементов правилом (А ® и) (/1 0 и) = А/i 0 ии. Отождествляя каждый элемент a G А с элементом 1 0 a G А(Р), мы получаем вложение алгебры А в А(Р). Если {elf..., еп} — базис ал- гебры А над К, то умножение в А определяется формулами вида = S cykek- к Элементы G К называются структурными константами алгеб- ры А в базисе {е1э ...,еп}. Те же формулы определяют умножение в алгебре А(Р) в базисе {еь ...,еп}. Однако смысл расширения ос- новного поля состоит в том, что в алгебре А(Р) существуют другие базисы, в которых структурные константы могут иметь более про- стой вид. Для того чтобы этот метод привел к каким-то результатам, нуж- но, конечно, заранее доказать инвариантность каких-то свойств ал- гебры при расширении основного поля. Предложение 1. Полупростая конечномерная ассоциативная алгебра А над полем К нулевой характеристики остается полупро- стой при переходе к любому расширению Р поля К. Доказательство. Воспользуемся критерием полупростоты ко- нечномерной ассоциативной алгебры, связанным со скалярным умножением (теорема 3.2). Очевидно, что в базисе, составленном из элементов алгебры А, матрица скалярного умножения в алгебре А(Р) такая же, как в алгебре А. Следовательно, она невырожденна, а это означает, что алгебра А(Р) полупроста. □ Пусть, например, L — конечное расширение поля К. Рассмотрим его как алгебру над К. Эта алгебра полупроста (и даже проста) и, согласно доказанному, для любого расширения Р поля К алгебра L(P) также полупроста и, следовательно, является прямой суммой нескольких конечных расширений поля Р. Пусть a G L \ К — какой-либо элемент и h — его минимальный многочлен над К. Тогда LDK[a]~K[x]/(h) и, следовательно, L(P)DP[a]^P[x]/(h).
§ 6. Алгебры с делением 527 Если многочлен h приводим над Р и, в частности, если он имеет корень в Р, то Р[а] и, тем более, L(P) — не паля. Поэтому последо- вательными простыми алгебраическими расширениями поля К мы можем получить такое конечное расширение Р, что 1(Р)^РФ„.ФР (n = dimKL). (43) п Если РЖ — такое расширение, что имеет место изоморфизм (43), то говорят что L расщепляется над Р. В качестве примера применения этой идеологии докажем теоре- му о примитивном элементе. Теорема 1. Всякое конечное расширение L поля К нулевой харак- теристики является простым, т. е. порождается над К одним эле- ментом. Доказательство. Пусть dimK L = п. Если L не порождается как алгебра над К одним элементом, то для любого a G L элементы 1, а, а2,..., а"”1 линейно зависимы. Это можно записать в виде тож- дественного равенства нулю определителя, составленного из коор- динат элементов 1, а, а2,..., ап-1 в каком-либо базисе L над К. Как функция от координат элемента а этот определитель представляет собой некоторый многочлен с коэффициентами из К. Если он равен нулю при всех значениях переменных в поле К, то он является нуле- вым многочленом и, следовательно, равен нулю и при всех значени- ях переменных в любом расширении Р поля К, а это, в свою очередь, означает, что алгебра L(P) не порождается над Р одним элементом. Однако если L расщепляется над Р, то легко доказать, что ал- гебра L(P) порождается одним элементом. В самом деле, рассмот- рим элемент а = (аь ..., ап) G РФ...ФР с различными координа- тами аь ...,апеР. Тогда определитель, составленный из коорди- нат элементов 1, а, а2,..., а"”1, есть определитель Вандермонда для аь ..., ап и, значит, отличен от нуля. □ Обратимся теперь к изучению некоммутативных конечномер- ных алгебр с делением. Очевидно, что всякая алгебра с делением является простой. Пусть D — центральная конечномерная алгебра с делением над полем К. Предложение 2. Алгебра D остается простой при переходе к лю- бому расширению Р поля К.
528 Глава 11. Линейные представления и ассоциативные алгебры Доказательство. Пусть / с D(P) — ненулевой идеал. Рассмот- рим самую короткую линейную комбинацию вида а = S ^-iai (А, е Р, aj е D), <=1 принадлежащую I и отличную от нуля. Очевидно, что а19 ...,as ли- нейно независимы над К, так как иначе число слагаемых можно было бы сократить. Точно так же, Ab...,As линейно независимы над К. Домножив элемент а на а^"1 (с любой стороны), что не выведет нас за пределы идеала I, добьемся того, чтобы = 1. Если при этом s>l,roa2$K = Z (D) и, значит, существует такой элемент с G D*, что са2/а2с. Имеем $ а — сас”1 = Af (щ - еще”1) GI, i=2 причем а — сас-1 / О, так как А2,As линейно независимы над К, а а2 - са2с-1 / 0. Это противоречит определению элемента а. Следо- вательно, s = 1; но тогда I э 1 и, значит, / = D(P). □ Теорема 2. Существует такое конечное расширение Р поля К, что D(P) Ln(P) для некоторого п G N. Следствие. dimD = n2. Число п называется степенью алгебры D и обозначается через degD. Так, степень алгебры кватернионов равна 2. Доказательство теоремы 2. Пусть К — максимальное алгебра- ическое расширение поля К. (Существование такого расширения доказывается при помощи леммы Цорна.) Это алгебраически за- мкнутое поле, называемое алгебраическим замыканием поля К. По теореме 3.4 D(K)^Ln(K) для некоторого п G N. Пусть е^ G D(K) — элементы, соответствую- щие при этом изоморфизме матричным единицам, и Р с К — под- поле, порожденное над К координатами всех этих элементов в ка- ком-либо базисе алгебры D(K), составленном из элементов алгеб- ры D. Очевидно, что Р — конечное расширение поля КиЯ(Р)^ ^к(Р). □ Если Р э К — такое расширение, что D(P) Ln(P), то говорят, что алгебра D расщепляется над Р.
§ 6. Алгебры с делением 529 Пример 1. Алгебра кватернионов D(a, /3) расщепляется над по- лем Р = К(Уа, Важную информацию об алгебре D доставляет изучение ее мак- симальных коммутативных подалгебр или, что то же, максималь- ных подполей. Теорема 3. Всякое максимальное подполе F алгебры D имеет раз- мерность п над К. Всякий изоморфизм максимальных подполей про- должается до внутреннего автоморфизма алгебры D. (Не утверждается, что все максимальные подполя изоморфны.) Доказательство. Заметим, прежде всего, что если F — макси- мальная коммутативная подалгебра в D и Р — любое расширение поля К, то F(P) — максимальная коммутативная подалгебра в D(P). В самом деле, условие максимальности означает, что F совпадает со своим централизатором ZD(F) = {xeD: ах = ха VaeF}, а это эквивалентно тому, что dim ZD(F) = dimF. Но в координатах определение централизатора записывается как система однородных линейных уравнений с коэффициентами из К, а размерность пространства решений любой системы однородных линейных уравнений не меняется при расширении поля. Пусть теперь К — алгебраическое замыкание поля К, Тогда D(K)-Ln(K)n F(K) КФ. „ФК, т где m = dimF. Последнее означает, что в F(K) имеется такой базис {ebет}, что е? = е,-, 6,6; = 0 npHi/j. Если рассматривать алгебру Ln(K) как алгебру линейных операто- ров, то элементам еь..., ет будут соответствовать попарно комму- тирующие проекторы. В подходящем базисе эти проекторы одновре- менно записываются диагональными матрицами. Отождествим алгебру D (К) с Ln(K) при помощи какого-либо фик- сированного изоморфизма. Тогда из сказанного выше следует, что
530 Глава И. Линейные представления и ассоциативные алгебры существует такой элемент cgD(K)*, что cF(K)c“1 состоит из диаго- нальных матриц. Но так как cF(K)c-1 — максимальная коммутатив- ная подалгебра, то она совпадает с подалгеброй всех диагональных матриц. Следовательно, т = и, что доказывает первое утверждение теоремы. Пусть теперь Fb F2 С D —две максимальные коммутативные по- далгебры и : Fj F2 — какой-либо изоморфизм. Тогда продолжа- ется до изоморфизма Из предыдущего следует, что существует такой элемент с GD(K)*, что cF1(K)c“1 = F2(K). Более того, так как всякий автоморфизм ал- гебры диагональных матриц есть просто перестановка диагональ- ных элементов и, следовательно, индуцируется внутренним авто- морфизмом алгебры Ln(K) = D(K), мы можем считать, что сас“1 = (^(а) при а eFx (К). (44) Нам нужно доказать существование такого ненулевого элемента xgD, что хах-1 = (а) при a GFj или, что равносильно, ха = у>(а)х VaeFp В координатах эти условия записываются как система однородных линейных уравнений с коэффициентами из К. Из (44) следует, что эта система имеет ненулевое решение в К; но тогда она имеет нену- левое решение и в К. □ Применим развитую теорию к описанию конечномерных алгебр с делением над полем R и над конечными полями. Теорема 4 (теорема Фробениуса). Всякая конечномерная алгеб- ра с делением D над полем R изоморфна либо R, либо С, либо Н. Доказательство. Центр Z(D) алгебры D, будучи конечным рас- ширением поля R, изоморфен либо R, либо С. Во втором случае D можно рассматривать как алгебру над С и, поскольку поле С алгеб- раически замкнуто, D~C. Пусть теперь Z(D) = R, т.е. D — центральная алгебра. Так как всякое максимальное подполе алгебры D изоморфно R или С, то deg D = 1 или 2. В первом случае D = R. Рассмотрим второй случай. Выберем какое-либо максимальное подполе в D и отождествим его с С. По теореме 3 комплексное сопряжение в С продолжает- ся до внутреннего автоморфизма алгебры D, т. е. существует такой
§ 6. Алгебры с делением 531 элемент j G D, что jzj"1 = z для любого z G С. Ясно, что j £ С. Сле- довательно, D = С ф С/. Далее, поскольку j2 коммутирует с j и со всеми элементами из С, то j2gZ(D) =R. Умножив j на подходящее вещественное число, добьемся того, чтобы j2 = ±1. Случай j2 = 1, однако, невозможен, ибо тогда (j 4-1) (j — 1) = 0. Таким образом, i2 = J2 = -l, = откуда следует, что D ~ И. □ Теорема 5 (теорема Веддербёрна). Всякое конечное тело комму- тативно, т. е. является полем. Доказательство. Пусть D — конечное тело и К — его центр. То- гда D есть конечномерная центральная алгебра над К. Из первого утверждения теоремы 3 следует, что все максимальные подполя те- ла D содержат одно и то же число элементов и, значит, изоморфны, а из второго — что все они получаются друг из друга внутренними автоморфизмами тела D. Кроме того, всякий элемент а тела D содер- жится в подполе К [а] и, следовательно, в каком-то максимальном подполе. Пусть F — какое-либо максимальное подполе тела D. Из предыду- щего следует, что группа D* покрывается подгруппами, сопряженны- ми F*. Число таких подгрупп равно [D*: N(F*)] и, во всяком случае, не превосходит [D* :F*]. Следовательно, |D*| |F*|[D* :F*] = |D*|. Однако равенство невозможно хотя бы потому, что все эти подгруп- пы содержат единицу. Единственным исключением является триви- альный случай, когда D* = F* и, значит, D = F(= К). □ В отличие от поля R и конечных полей, над многими другими полями, например над полем Q, существуют центральные алгебры с делением любой степени. В качестве примера построим центральную алгебру с делением степе- ни 3 над полем Q. Пусть F = Q(0), где 0 — корень неприводимого много- члена / = с3-Зс+1. Дискриминант многочлена f равен 81 = 92; следовательно, F — расшире- ние Галуа степени 3 поля Q (см. пример 10.6.4). Пусть ст — порождающий элемент группы Gal F/Q. Рассмотрим формальные выражения вида ао + а^ + аз*2 (а0> W5)
532 Глава 11. Линейные представления и ассоциативные алгебры Определим их умножение, руководствуясь правилами дистрибутивности и ассоциативности и соотношениями s3 = 2, sa = cr(a)s (a GF). Мы получим некоторую 9-мерную некоммутативную алгебру D над Q, со- держащую поле F в качестве подалгебры. Докажем, что D — алгебра с деле- нием. Алгебра D может быть представлена матрицами 3-го порядка над по- лем F. А именно, поставив в соответствие каждому элементу a eF матрицу га О 0 \ Г(а)= 0 а(а) 0 , КО 0 а2 (а)? мы получим вложение поля F в Ьз(Г) в виде Q-подалгебры. Далее, рассмот- рим матрицу ГО 1 0\ S= 0 0 1 . \2 О О? Легко проверить, что S3 = 2E, ST(a) = T(a(a))S. Следовательно, матрицы вида (а0 а1 а2 \ 2ст(а2) cr(a0) cr(ai) (46) 2<т2(а1) 2а2(а2) ст2(а0)7 (а0, а1,а2е^’) образуют Q-подалгебру алгебры LjCF), изоморфную D. Она состоит из всех матриц A GL^F), удовлетворяющих условию SAS-1 = cr(A), (47) где сг(А) обозначает матрицу, получаемую применением сг ко всем элемен- там матрицы А. Очевидно, что если матрица А, удовлетворяющая условию (47), невы- рожденна, то матрица А"1 также удовлетворяет условию (47). Поэтому для доказательства того, что D — алгебра с делением, достаточно проверить, что всякая ненулевая матрица вида (46) невырожденна. Для доказательства последнего факта мы применим редукцию по моду- лю 2. Пусть О — кольцо целых чисел поля F. Очевидно, что О инвариантно относительно группы GalF/Q, так что если а GO, то Т(а) GL3(О). Далее, О содержит подкольцо Z[0] = {u0 4- щО 4- и262: п0, иъ и2 € Z}. Так как мно- гочлен [/]2 = t3 + t + leZ2[t]
§ 6. Алгебры с делением 533 неприводим над Z2, то факторкольцо Z[0]/2Z[0]^Z2[t]/[/]2Z2[t] есть поле из 8 элементов. Имеется естественный гомоморфизм Z[0]/2Z[0]->O/2O. (48) Так как аддитивная группа кольца О изоморфна Z3, то |О/2О| = 8. Отсюда следует, что гомоморфизм (48) есть на самом деле изоморфизм, так что кольцо О/2О также является полем. Путем умножения элемента (45) алгебры D на подходящее рациональ- ное число можно добиться того, чтобы все числа а0, ар а2 принадлежали О, но хотя бы одно из них не принадлежало 20. Если при этом а0 е 20, но Qi 20, то умножением на s"1 =s2/2 мы добьемся того, чтобы а0 20. Если а0, dj € 20, но а2 Ф 20, то мы получим тот же результат умножением на s-2 = s/2. Таким образом, достаточно доказать обратимость элементов (45) алгебры D, для которых а0,а1}а2еО, а0$2О. При этих условиях все элементы матрицы (46) принадлежат О и ее редукция по модулю 2 есть строго треугольная матрица над полем 0/20. Определитель последней матрицы отличен от нуля. Отсюда следует, что определитель матрицы (46) тем более отличен от нуля, что и требовалось доказать. Так как dim D = 9, то D — центральная алгебра с делением степени 3. Алгебры с делением естественно возникают при рассмотрении неприводимых линейных представлений над алгебраически не за- мкнутыми полями. А именно, пусть R: X —>L(V) —нетривиальное неприводимое представление множества X над полем К. Рассмот- рим совокупность D всех эндоморфизмов представления R. Очевид- но, что это подалгебра в L(V). В силу теоремы 1.1 всякий ненулевой эндоморфизм представления R обратим. Следовательно, D — алгеб- ра с делением. Пространство V можно рассматривать как D-модуль или, как говорят, векторное пространство над телом D. (Легко видеть, что всякий конечно порожденный модуль над телом обладает базисом, как и векторное пространство над полем.) Множество К(Х) содер- жится в алгебре LD(V) линейных преобразований этого векторного пространства (изоморфной алгебре матриц над D). Нетрудно полу- чить следующее обобщение теоремы 1.5: подалгебра алгебры L(V), порожденная множеством R(X), совпадает с LD(V).
534 Глава 11. Линейные представления и ассоциативные алгебры Отсюда, в свою очередь, вытекает следующее обобщение теоре- мы 3.4: всякая нетривиальная простая конечномерная ассоциатив- ная алгебра над полем К изоморфна алгебре всех линейных преобра- зований некоторого векторного пространства над некоторой алгеб- рой с делением над К. В частности, неприводимые вещественные представления в си- лу теоремы Фробениуса разбиваются на три типа, для которых D = К, С и Н соответственно. Задача 4. Показать, что представления этих трех типов характе- ризуются тем, что их комплексификация неприводима, разлагается в сумму двух неизоморфных неприводимых представлений и раз- лагается в сумму двух изоморфных неприводимых представлений соответственно. Если не требовать ассоциативности, то определение алгебры с делени- ем следует видоизменить. Алгебра D (не обязательно ассоциативная) на- зывается алгеброй с делением, если для любых a, b е D, а # 0, каждое из уравнений ах = b и ya = b имеет решение. Задача 5. Доказать, что для ассоциативных алгебр это определение эк- вивалентно данному выше. Задача 6. Доказать, что утверждение задачи 1 справедливо и для неас- социативных алгебр. При отказе от ассоциативности возникают новые интересные примеры алгебр с делением, даже в случае поля R. Приведем конструкцию алгебры октав О, являющейся наиболее ин- тересным и важным примером неассоциативной алгебры с делением над R. Пусть V — трехмерное векторное пространство над полем Z2. Рассмот- рим 8-мерную алгебру О над R с базисом {еа: а е V} и таблицей умножения еаеь = е(а,Ь)еа+ь, где коэффициенты е(а, Ь), равные ±1, определяются в соответствии со сле- дующими правилами: 1) е(О, Ь) = е(а, 0) = 1, так что е0 = 1 является единицей алгебры О; 2) е(а, а) = — 1 при а / 0, так что квадрат каждой «мнимой единицы» еа (а/0) равен -1; 3) е(а, Ь) = —е(Ь, а) при а, b / 0, а / Ь, так что мнимые единицы анти- коммутируют; 4) е(а, Ь) = е(Ь, с) = е(с, а) при а, Ь, с # 0, а 4- b 4- с = 0, так что любые две мнимые единицы порождают подалгебру, изоморфную алгебре кватерни- онов;
§ 6. Алгебры с делением 535 5) е(а, b)e(b, c)s(c, d)e(d, a) = -1 при различных a, b, c, d / 0, a + b + + c + d = 0. Ненулевые векторы пространства V можно представлять как точки про- ективной плоскости PV над полем Z2. При такой интерпретации условие 4) относится к тройкам точек, лежащих на одной прямой, а условие 5) — к чет- веркам точек, из которых никакие три не лежат на одной прямой. Пример выбора коэффициентов е(а, b) (a, b / 0, а / Ь), удовлетворяю- щих условиям 3)—5), приведен на рис. 1, где прямые плоскости PV условно изображены шестью прямыми и одной окруж- ностью, а стрелка, идущая от точки а к точке b, Л означает, что е (a, b) = 1. (Остальные коэффици- / \ енты восстанавливаются в соответствии с пра- вилами 3) и 4).) Несложно показать, что лю- £ бой другой допустимый выбор коэффициентов e(a, b) приводится к этому за счет умножения /I /\ некоторых мнимых единиц на -1. Ххх Построенная алгебра О называется алгеб- рой октав или алгеброй Кэли. рис j Как и в случае кватернионов, линейное отображение и —> й, оставляющее на месте единицу и умножающее все мнимые единицы на -1, является антиавтоморфизмом алгебры О. Элемент N(u) = uii, называемый нормой октавы и, принадлежит R и равен сумме квадратов ее координат. Если и ^0, то N (и) /0 и и'^ЩиУ'й (49) есть элемент, обратный и. Для установления всех этих свойств достаточно условий 1)—3), однако ввиду отсутствия ассоциативности они еще не гаран- тируют того, что О — алгебра с делением. При отсутствии ассоциативности для некоторых целей может оказаться достаточным более слабое свойство альтернативности. Алгебра называется альтернативной, если ассоциатор [црш] = (цр)ш — ц(рш) любых ее элементов кососимметричен по и, и, ш. В частности, отсюда следу- ет, что если какие-либо два из трех перемножаемых элементов совпадают, то имеет место ассоциативность. Задача 7. Доказать, что в альтернативной алгебре подалгебра, порож- денная любыми двумя элементами, ассоциативна. Проверим, что алгебра О альтернативна. По соображениям линейности достаточно проверить кососимметричность ассоциатора любых базисных векторов ea,eb,ec (a,b,ceV). Если а, Ь, с линейно зависимы, то еа,еь,ес принадлежат ассоциативной подалгебре и проверять нечего. Пусть а, Ь, с
536 Глава 11. Линейные представления и ассоциативные алгебры линейно независимы. Докажем, что тогда не только ассоциатор, но и каж- дое из произведений (еаеь)ес, еа(еьес) кососимметрично по а,Ь, с. Рассмот- рим, например, первое из них. Очевидно, что оно кососимметрично по а и Ь. Поэтому достаточно проверить, что оно кососимметрично по b и с. Пользуясь свойствами 3) и 4), получаем (Мь)ес = Ь)е(а 4-Ь, с)еа+ь+с = -е(а, Ь)е(а + b + с, с)еа+ь+с и, аналогично, (еаес)еь = е(а, с)е(а 4- с, Ь)еа+ь+с = -е(с, а)е(Ь, а 4- b 4- с)еа+ь+с; но из свойства 5) следует, что е(а, Ь)е(а 4- b 4- с, с) = —е (с, а)е(Ь, а 4- b 4- с), откуда (баеь)ес = -(еаес)еь. Аналогично проверяется кососимметричность второго произведения. Из формулы (49) для обратного элемента в алгебре О вытекает, что u-1g(1, и), и поэтому, если какие-либо два из трех перемножаемых элементов взаим- но обратны, то, как и в случае их совпадения, имеет место ассоциатив- ность. Следовательно, при и /0 элемент и~ги является решением уравне- ния их = и, а элемент uiT1 — решением уравнения уи = и, и, значит, О — алгебра с делением. Имеет место теорема: всякая альтернативная конечномерная алгебра с делением над R изоморфна либо R, либо С, либо Н, либо О.
Глава 12 Группы Ли Определение группы Ли аналогично определению топологиче- ской группы. А именно, группой Ли называется группа G, снаб- женная структурой гладкого (дифференцируемого) многообразия таким образом, что групповые операции g:GxG-*G, (х,у)-»ху, с: G—>G, х — х"1, дифференцируемы. Иными словами, (локальные) координаты про- изведения должны быть дифференцируемыми функциями от (ло- кальных) координат множителей и координаты обратного элемента должны быть дифференцируемыми функциями от координат само- го элемента. Всякую группу Ли можно рассматривать как тополо- гическую группу, но структура группы Ли богаче, чем структура топологической группы. В приведенном определении под гладким многообразием мож- но понимать как вещественное, так и комплексное многообразие. В соответствии с этим получается определение вещественной или комплексной группы Ли. Мы будем рассматривать одновременно оба этих случая, обозначая через К поле R или С соответственно. Примерами групп Ли служат аддитивная и мультипликативная группы поля К и группа невырожденных матриц GLn(K) (или, в гео- метрических терминах, группа GL(V) обратимых линейных пре- образований п-мерного векторного пространства V над полем К). В последнем случае координатами служат матричные элементы. Теория групп Ли объединяет в себе алгебру, анализ и геометрию. Благодаря этому ее понятия и методы играют важную роль в боль- шинстве разделов математики и теоретической физики. § 1. Определение и простейшие свойства групп Ли Мы не будем пользоваться данным выше общим определением группы Ли. Ради простоты изложения мы ограничимся линейными
538 Глава 12. Группы Ли группами Ли — группами Ли, являющимися подгруппами группы GLn(K). На самом деле почти все группы Ли могут быть представ- лены как линейные группы Ли. Договоримся понимать под дифференцируемой функцией функ- цию, имеющую непрерывные частные производные первого поряд- ка в ее области определения. Впрочем, во всех конкретных приме- рах рассматриваемые функции будут аналитическими, а в случае К = С, как известно, всякая дифференцируемая функция автомати- чески является аналитической. Напомним, что подмножество М с Кп называется d-мерным гладким многообразием, если в некоторой окрестности любой своей точки р оно может быть задано системой уравнений f^xlt ...,xn) = 0 (i = 1, (1) где т = и - d и ..., fm —дифференцируемые функции, ранг якоби- евой матрицы которых в точке р равен т. Замечание 1. Всякое открытое подмножество пространства Кп локально задается пустой системой уравнений и, согласно опреде- лению, является п-мерным гладким многообразием. С другой сторо- ны, всякое дискретное подмножество локально задается системой уравнений вида = q (i = 1,..., п) и потому является нульмерным гладким многообразием. Условие на ранг якобиевой матрицы функций Д, ..., fm означает, что некоторый ее минор порядка т отличен от нуля в точке р. Пред- положим для определенности, что d/i Ы dxi дхт №0- (2) dxi ”• дхт Тогда, согласно теореме о неявной функции, в качестве параметров точки многообразия М в некоторой окрестности точки р, как и в слу- чае системы линейных уравнений, могут быть взяты «свободные» неизвестные хт+1,...,хп, через которые дифференцируемым обра- зом выражаются «главные» неизвестные хъ ..., хт: (3)
§ 1. Определение и простейшие свойства групп Ли 539 Более точно, пусть plf..., рп — координаты точки р. Тогда суще- ствуют такая окрестность U точки (рь ...,рт) в пространстве Кт главных неизвестных и такая окрестность V точки (рт+1,..., рп) в пространстве Kd свободных неизвестных, что пересечение М П П (U х V) есть график дифференцируемого отображения : V —> U, задаваемого уравнениями (3), т. е. точка (хь ...,xm,xm+1, ...,хп) е G U х V принадлежит М тогда и только тогда, когда выполнены соотношения (3). Касательное пространство Тр(М) многообразия М, заданного уравнениями (1), в точке реМ состоит из векторов (dxb ..., dxn) е еКп, удовлетворяющих системе однородных линейных уравнений, получающихся дифференцированием в точке р уравнений (1): dfi(p) = E B^dxj = O G = l>->rn). (4) j=l oxj Заметим, что условие, налагаемое на ранг якобиевой матрицы функ- ций равносильно тому, что размерность пространства решений системы (4) равна п — т. Иногда это удобнее для провер- ки упомянутого условия, чем непосредственное вычисление ранга якобиевой матрицы. Если выполнено условие (2), то в качестве свободных неизвестных системы (4) могут быть взяты dxm+1,... ..., dxn. Пространство Тр (М) может быть описано как совокупность всех касательных векторов кривых на многообразии М, проходящих че- рез точку р. Отсюда, в частности, следует, что оно не зависит от вы- бора системы уравнений, задающих многообразие М в окрестности точки р. Подчеркнем, что мы понимаем касательное пространство Тр(М) как подпространство векторного пространства Кп> а не как парал- лельную ему плоскость, проходящую через точку р. Определение 1. Линейной группой Ли называется всякая под- группа G группы GLn (К), являющаяся гладким многообразием в про- странстве Ln(K) всех матриц. Так как всякая подгруппа G с GLn(K) инвариантна относительно умножений на свои элементы, являющихся линейными преобразо- ваниями пространства Ln(K), то условие, составляющее определе- ние гладкого многообразия, достаточно проверить в какой-либо од- ной точке группы G, например, в единице е. (Единицей линейной группы является единичная матрица Е.)
540 Глава 12. Группы Ли Задача 1. Если G —линейная группа Ли, то Tg(G) = Te(G)g для любой матрицы g G G. В дальнейшем под группами Ли мы понимаем именно линейные группы Ли, а касательное пространство группы Ли G в единице обо- значаем просто T(G). Пример 1. Сама группа GLn(K), будучи открытым подмноже- ством пространства Ln(K), является п2-мерной группой Ли. Пример 2. Группа SLn(К) является (и2 - 1)-мерной группой Ли. Действительно, дифференцируя в единице задающее ее уравнение detg = 1, получаем линейное уравнение d det g = tr dg = 0, задающее (и2 — 1)-мерное пространство матриц с нулевым следом. В § 6.5 мы дали определение производной матричной функции одной переменной. Точно так же определяются частные производ- ные матричной функции нескольких переменных. Определим диф- ференциал матричной функции Ф = Ф(х1,..., хп) по формуле Переходя к матричным элементам, легко доказать формулы dtb + V^db + dV, (5) d (ФФ) = (с/Ф)Ф + ФМФ). (6) Используя последнюю формулу для вычисления дифференциала й(ФФ-1), равного нулю, находим: Пример 3. Группа Оп (К) задается матричным уравнением ggT = = Е, которое ввиду очевидной симметрии можно рассматривать п(п + 1) как систему —- уравнении относительно матричных элемен- тов. Дифференцируя в единице это уравнение, получаем линейное уравнение d (ggT) = dg+ (dg)T = 0,
§ 1. Определение и простейшие свойства групп Ли 541 п(п -1) задающее —--мерное пространство кососимметрических мат- риц. Так как 2 _ п(п + 1) _ п(п — 1) 2 2 ’ то ОП(К) есть —---мерная группа Ли. Заметим, что группу On(R) обычно обозначают просто через Оп. Задача 2. Доказать, что псевдоортогональная группа Ok b где к 4-1 = п (см. § 7.4), также является —п^~-1- -мерной группой Ли. Задача 3. При четном п = 2m рассмотрим группу линейных пре- образований пространства Кп} сохраняющих невырожденную косо- симметрическую билинейную функцию а(х, у) = S (*|Ут+4 “ • 1=1 Она называется симплектической группой и обозначается через SpnGO. Доказать, что Spn(KJ есть ----- -мерная группа Ли. Пример 4. Группа Вп(/С) невырожденных треугольных матриц, будучи открытым подмножеством в пространстве всех треугольных п(п + 1) « « п матриц, является ——- -мерной группой Ли. Пример 5. Всякая дискретная (в частности, конечная) подгруп- па группы GLn(/C) является нульмерной группой Ли. Мы будем также рассматривать вещественные группы Ли, состо- ящие из комплексных матриц, понимая под этим такие подгруппы группы GLn(C), которые являются гладкими многообразиями в про- странстве Ln(C), рассматриваемом как 2п2-мерное вещественное векторное пространство. Пример 6. Группа Un задается в Ln(C) матричным уравнением gg* = E (7) (где g* = gT). Это уравнение можно рассматривать как систему п2 ве- щественных уравнений относительно вещественных и мнимых ча- стей элементов матрицы g: Lkkl2=1 (i=i, •••>"), k = = ° (i, j = l, .->n; i<j). k k
542 Глава 12. Группы Ли Дифференцируя в единице уравнение (7), получаем линейное урав- нение dg+(dg)* = O, задающее п2-мерное пространство косоэрмитовых матриц. Так как 2п2 - п2 = п2, то Un есть п2-мерная вещественная группа Ли. Пример 7. Группа SUn = Un П SLn(C) является (п2 - 1)-мерной вещественной группой Ли (докажите это). Ее касательное про- странство в единице состоит из косоэрмитовых матриц с нулевым следом. Предложение 1. Всякая группаЛи GcGLn(K) замкнута в GLn(K). Доказательство. Пусть G — замыкание группы G в GLn(K). Из соображений непрерывности следует, что G — подгруппа, а из опре- деления гладкого многообразия — что G открыта в G. Пусть теперь ge G. Тогда смежный класс gG открыт в G и, следовательно, пересе- кается с G; но это значит, что gG = G и, в частности, g е. G. □ Основной метод теории групп Ли состоит в переходе от рас- смотрения группы G к рассмотрению ее касательного пространства Te(G) = T(G) (которое, как мы увидим, имеет структуру алгебры). Однако если, например, группа G дискретна, то ее касательное про- странство равно нулю и не несет никакой информации о структуре группы G. В общем случае группа Ли достаточно хорошо контроли- руется своим касательным пространством в единице, только если она связна. Напомним, что топологическое пространство называется связ- ным, если его нельзя представить в виде объединения двух непе- ресекающихся собственных замкнутых подмножеств. Объединение двух пересекающихся связных подмножеств топологического прост- ранства М связно. Отсюда следует, что отношение «х ~ у, если х и у содержатся в некотором связном подмножестве» является отноше- нием эквивалентности на М. Классы этой эквивалентности называ- ются связными компонентами пространства М. Если М — гладкое многообразие, то у каждой его точки есть связ- ная окрестность (например, гомеоморфная шару). Отсюда следует, что связные компоненты многообразия М открыты в М. В то же время они замкнуты в М, так как каждая из них есть дополнение к объединению остальных. Связную компоненту группы Ли G, содержащую единицу, обозна- чим через G°.
§ 1. Определение и простейшие свойства групп Ли 543 Предложение 2. G° — нормальная подгруппа группы G, а прочие связные компоненты суть смежные классы по G°. Доказательство. Умножение слева или справа на любой эле- мент g G G является гомеоморфизмом топологического простран- ства G на себя и потому может только переставлять его связные компоненты. Следовательно, gG° = G°g есть связная компонента, содержащая g. В частности, если gG G°, то gG° = G°. Это означает, что G° замкнута относительно умножения. Аналогично, инверсия является гомеоморфизмом топологиче- ского пространства G на себя и может только переставлять его связные компоненты. Так как (G°)-1 содержит единицу, то (G0)"1 = = G°. Таким образом, G° — подгруппа. Все остальное уже доказано выше. □ Примере. Докажем, что группа SLn(K) связна. При фиксиро- ванных различных i, j матрицы вида Е 4- сЕ^ (с G К) образуют связ- ное подмножество, содержащее единицу. Следовательно, все эле- ментарные матрицы первого типа принадлежат SLn(K)°. Но мы зна- ем (см. §10.2), что они порождают группу SLn(K). Следовательно, SLn(K)° = SLn(K). Пример 9. Аналогичным образом доказывается (проделайте это!), что группа GLn(C) связна, а группа GLn(R) состоит из двух связных компонент, одна из которых есть группа матриц с положи- тельным определителем. Пример 10. Докажем, что группа Оп состоит из двух связных компонент, одна из которых есть SOn (а другая состоит из ортого- нальных матриц с определителем -1). Пусть п = 2m или 2т 4-1. Ортогональные матрицы вида fn(^) ПС-Ал) I 0 (1)7 (8) где клетка первого порядка, заключенная в скобки, присутствует, ес- ли и = 2m 4-1, образуют связное подмножество (гомеоморфное пря- мому произведению т окружностей, т.е. m-мерному тору). Так как это подмножество содержит единицу, то оно целиком содержится в 0°. Но мы знаем (см. §6.3), что всякая матрица из SOn сопряжена
544 Глава 12. Группы Ли в Оп матрице вида (8). Следовательно, 0° э SOn. С другой стороны, так как Оп есть объединение двух смежных классов по SOn, каждый из которых, очевидно, замкнут, то 0° = SOn. Пример 11. Аналогичным образом доказывается, что группы Un и SUn связны. Задача 4. Доказать, что группа SOn т состоит из двух связных компонент, причем S0° т есть подгруппа, образованная теми преоб- разованиями, которые оставляют на месте каждую из двух связных компонент гиперболоида л1т...тлп лп+1 ±. (Указание: доказать, что всякое преобразование из группы SOn>1, оставляющее на месте каждую связную компоненту указанного ги- перболоида, есть произведение гиперболического поворота в дву- мерном подпространстве, содержащем базисный вектор еп+1, и пре- образования из группы SOn (оставляющего на месте вектор еп+1).) Предложение 3. Связная группа Ли порождается любой своей окрестностью единицы. Доказательство. Пусть U — окрестность единицы группы Ли G. Обозначим через G порожденную ею подгруппу. Для любого g G G подмножество gU, являющееся окрестностью элемента g в G, со- держится в смежном классе gG. Это показывает, что все смежные классы группы G по G открыты в G. В то же время они замкнуты в G, так как каждый из них есть дополнение к объединению осталь- ных. Следовательно, если группа G связна, то имеется только один смежный класс, т. е. G = G. □ Замечание 2. Мы избрали в этой главе матричный язык. Одна- ко ясно, что вместо матриц можно было бы говорить об определяе- мых ими линейных преобразованиях. Так, можно говорить о груп- пе Ли GL(V) невырожденных линейных преобразований п-мерно- го векторного пространства V над полем К, о группе Ли 0(7) ортогональных преобразований п-мерного евклидова пространст- ва V и т. п. В некоторых случаях, когда это будет более удобно, мы будем переходить на язык линейных преобразований. Замечание 3. Ввиду леммы 7.6.2 группа GA(S) аффинных пре- образований п-мерного аффинного пространства S естественным образом вкладывается в группу GL(V) линейных преобразований (п 4-1)-мерного векторного пространства V. В подходящем базисе
§ 2. Экспоненциальное отображение 545 образ этого вложения записывается матрицами вида <ап . •• Ощ м <*nl • • • ^пп Ьп (о . .. 0 и где матрица А = (а^-) невырожденна. Тем самым группу GA(S), а так- же различные ее подгруппы, например, группу движений п-мерного евклидова пространства, можно рассматривать как линейные груп- пы Ли. § 2. Экспоненциальное отображение Связь группы Ли G с ее касательным пространством T(G) осу- ществляется экспоненциальным отображением. В § 6.5 была определена экспонента матрицы. Тем самым опреде- лено отображение ехр: Ln(X) —>GLn(X), (9) называемое экспоненциальным отображением. Из определения экспоненты матрицы следует, что ехр 0 = Е и ехрХ = Е + Х + о(||Х||). (10) Это показывает, что дифференциал экспоненциального отображе- ния в нуле есть тождественное линейное отображение. В частности, якобиан экспоненциального отображения в нуле отличен от нуля, и по теореме о неявной функции отображение ехр осуществляет диффеоморфизм некоторой окрестности нуля в пространстве Ln(X) на некоторую окрестность единицы в группе GLn(X). Обратное отоб- ражение (определенное в некоторой окрестности единицы группы GLn(X)) обозначается через log. Замечание 1. Отображение log задается рядом log(E + X)= n=l абсолютно сходящимся при ||Х|| < 1. Замечание 2. Можно показать, что отображение ехр осуществляет диф- феоморфизм открытого подмножества пространства Ln (К), состоящего из
546 Глава 12. Группы Ли матриц, все комплексные собственные значения Л которых удовлетворяют условию |1тЛ| < я, на открытое подмножество группы GLn(K), состоящее из матриц, не имеющих отрицательных собственных значений. В целом отображение (9) не является диффеоморфизмом. Следующее предложение является обобщением известной фор- мулы еа = Кт(1 + -Г. И—*00 П J Предложение 1. Пусть g(t), |t| <с, —дифференцируемая кривая в группе GLn(K), удовлетворяющая условиям g(O)=E, g'(O)=A. (11) Тогда exp А = lim #(“)”• (12) Доказательство. Кривая log g(t) имеет при t = 0 тот же касатель- ный вектор, что и g (t), т. е. А. Это означает, что logg(t) = tA + o(t), откуда g(t) = exp(tA + o(t)) и, в частности, «(;)) Возводя последнее равенство в п-ю степень, получаем g(i]n = exp(A + o(l)). откуда и следует (12). □ Теорема 1. Пусть G с GLn(K) — группа Ли. Тогда expT(G)cG, (13) причем отображение ехр осуществляет диффеоморфизм некоторой окрестности нуля пространства T(G) на некоторую окрестность единицы группы G. Доказательство. Для любого AgT(G) существует кривая g(t) в группе G, удовлетворяющая условиям (И). Так как группа G за- мкнута в GLn(K) (см. предложение 1.1), то формула (12) показывает, что exp A G G.
§ 2. Экспоненциальное отображение 547 Для того чтобы доказать второе утверждение теоремы, запишем отображение exp: 7(G)—»G (14) во внутренних координатах окрестности единицы группы G и ок- рестности нуля пространства 7(G). В качестве таких координат мож- но взять свободные неизвестные системы уравнений, задающей группу G в окрестности единицы, и соответствующие свободные неизвестные системы однородных линейных уравнений, задающей пространство 7(G). (Напомним, что неизвестными в данном случае являются матричные элементы.) Мы получим дифференцируемое отображение f некоторой окрестности нуля пространства Kd (где d = dim G) в это пространство. Из формулы (10) следует, что диф- ференциал отображения f в нуле есть тождественное линейное отображение, и по теореме о неявной функции отображение f осуществляет диффеоморфизм некоторой (быть может, меньшей) окрестности нуля пространства Kd на некоторую область этого пространства. Переходя к отображению ехр, мы получаем отсюда второе утверждение теоремы. □ Пример 1. В случае G = SLn(K) свойство (13) означает (см. при- мер 1.2), что если tr А = 0, то det exp А = 1. Пример 2. В случае G = Оп (соответственно Un) свойство (13) означает (см. примеры 1.3 и 1.6), что экспонента кососимметричной (соответственно косоэрмитовой) матрицы является ортогональной (соответственно унитарной) матрицей. Впрочем, это легко прове- рить и непосредственно (попробуйте сделать это). Теорема 2. Связная группа Ли однозначно определяется своим касательным пространством в единице. Доказательство. Из предыдущей теоремы и предложения 1.3 следует, что связная группа Ли G с GLn(K) совпадает с подгруппой, порожденной множеством ехр 7 (G). □ Подчеркнем, что в доказанной теореме ничего не говорится о су- ществовании группы Ли с заданным касательным пространством. На самом деле далеко не всякое подпространство пространства мат- риц является касательным пространством группы Ли. Необходимое условие для этого будет указано в следующем параграфе. Замечание 3. Вообще говоря, G/ехр 7(G), т.е. отображение (14) мо- жет не быть сюръективным (даже для связной группы Ли G). Например, для группы G = SLjGR) пространство 7(G) состоит из матриц с нулевым следом.
548 Глава 12. Группы Ли Комплексные собственные значения такой матрицы А имеют вид Л, —Л, где либо Л G R, либо Л G Ж. В обоих случаях tr ехр А = еЛ + е"л -2. г—2 О Л Поэтому матрицы gGG, для которых trg< -2 (например, g= I 0 не принадлежат ехр T(G). Пусть G С GLn(К), Н С GLm(/С) — группы Ли. Отображение f:G~* ->Н называется гомоморфизмом групп Ли, если оно является гомо- морфизмом групп и дифференцируемо, т. е. элементы матрицы /(g) являются дифференцируемыми функциями от элементов матрицы gGG. Дифференциал гомоморфизма / в единице есть линейное отображение пространства T(G) в пространство Т(Н). Мы будем обозначать его просто через df, не указывая явно, в какой точке берется дифференциал. Теорема 3. Пусть f: G—>H — гомоморфизм групп Ли, Тогда f (ехр А) = ехр df (А) (15) для любого AeT^Gf Доказательство. Воспользуемся предложением 1. Пусть g(t) — кривая в группе G, удовлетворяющая условиям (11). Тогда кривая h(0 =/(g(0) в группе Н удовлетворяет условиям h(O)=E, h'(0)=d/(A). Следовательно, f (ехр A) =/(lim gQ)") = lim h(|)n = expd/(A). □ Vq—>oo П J > П—*oo VH-' Пример 3. В применении к гомоморфизму det: GLn (С) С* (= GI^ (С)) формула (15) означает, что det ехр A = etrA для любой матрицы A GLn (С) (см. пример 1.2). Теорема 4. Гомоморфизм связной группы Ли в какую-либо группу Ли однозначно определяется своим дифференциалом в единице. Доказательство. Пусть f:G—>H — гомоморфизм групп Ли. Тео- ремы 1 и 3 показывают, что, зная df, мы можем найти /(g) для эле- ментов g из некоторой окрестности U единицы в группе G. Но если
§ 3. Касательная алгебра Ли и присоединенное представление 549 группа G связна, то, согласно предложению 1.3, она порождается окрестностью U и, значит, мы можем найти /(g) для всех g G G. □ В доказанной теореме ничего не говорится о существовании го- моморфизма групп Ли с заданным дифференциалом. На самом деле далеко не всякое линейное отображение касательных пространств является дифференциалом гомоморфизма групп Ли. Необходимое условие для этого будет указано в следующем параграфе. Задача 1. Доказать, что ядро Кег / гомоморфизма групп Ли f:G—>H есть группа Ли, касательное пространство которой сов- падает с Ker df. Задача 2. В тех же обозначениях доказать, что если Im df = Т (Н) и группа Н связна, то 1т/ = Н. § 3. Касательная алгебра Ли и присоединенное представление Матрица [А, В]=АВ — ВА называется коммутатором матриц А, В GLn(K). Не следует путать коммутатор в этом смысле с групповым коммутатором (А, В) = = АВА“1В“1, определенным для невырожденных матриц; однако эти два понятия тесно связаны между собой. Предложение 1. Для любых матриц А, В eLn(K) [A’B] = d^(exptA’expsB)l=s=o- (16) Доказательство. Дифференцируя групповой коммутатор (ехр tA, ехр sB) = (ехр tA) (ехр sB)(exp tA)“1(exp sB)"1 по s при s = 0, получаем (ехр tA, ехр sB) |5_о = (ехр tA)B(exp tA)-1 - В. Дифференцируя полученное выражение по t при t = 0, приходим к равенству (ехр tA, ехр sB) |t=s=0 = АВ - ВА = [А, В]. □
550 Глава 12. Группы Ли Теорема 1. Касательное пространство T(G) группы Ли G с с GLn (К) замкнуто относительно операции коммутирования, т. е. A,BeT(G) => [A, B]eT(G). Доказательство. При фиксированном t рассмотрим кривую g(s) = (exp tA, exp sB) e G. Так как g(0) = E, to g'(0) = £ (exp tA, exp sB) | j=o 6 T(G). Следовательно, ^(exp tA, exp sB)|(=J=0= [A, B] e T(G). □ Подпространство пространства матриц, замкнутое относитель- но операции коммутирования, называется линейной алгеброй Ли. Таким образом, касательное пространство T(G) любой (линейной) группы Ли G является линейной алгеброй Ли. Эта алгебра Ли назы- вается касательной алгеброй группы G. Пример 1. Для группы SLn(/C) доказанная теорема означает, что если tr А = tr В = 0, то и tr[А, В] = 0. На самом деле последнее равен- ство верно всегда. Иными словами, tr АВ = tr ВА для любых матриц А, В (см. § 5.4). Пример 2. Для группы ОП(К) доказанная теорема означает, что коммутатор двух кососимметричных матриц А, В также является ко- сосимметричной матрицей. Это легко проверить и непосредствен- но: [А, В]т = (АВ - ВА)Т = ВтАт - АТВТ = ВА - АВ = - [А, В]. Операция коммутирования матриц антикоммутативна, т. е. [А, В] 4-[В, А] = 0, (17) и удовлетворяет тождеству Якоби [[А, В], С] + [[В, С], А] + [[С, А], В] = 0. (18) Последнее тождество легко проверяется непосредственным вычис- лением. Оно является следствием ассоциативности умножения мат- риц.
§ 3. Касательная алгебра Ли и присоединенное представление 551 Любая алгебра, в которой выполняются тождества (17) и (18), на- зывается алгеброй Ли. Так, пространство Е3 с операцией векторного умножения является алгеброй Ли (см. пример 1.7.5). Пространство Ln(X) является алгеброй Ли относительно операции коммутирова- ния. Теорема 1 означает, что касательное пространство Т (G) любой группы Ли G с GLn(K) является подалгеброй этой алгебры. Теорема 2. Дифференциал любого гомоморфизма групп Ли явля- ется гомоморфизмом их касательных алгебр. Доказательство. Пусть f: G —► Н — гомоморфизм групп Ли, и пусть А, В G T(G). Согласно теореме 2.3, /((ехр tA, ехр sB)) = (/(ехр tA), / (ехр sB)) = (ехр t d/(A), ехр s d/(B)). Как и в доказательстве теоремы 1, рассмотрим коммутатор элемен- тов ехр tA и ехр sB при фиксированном t как кривую с параметром s в группе G, проходящую при s = 0 через единицу. Отображение df переводит касательный вектор этой кривой при s = 0 в касательный вектор ее образа в группе Н. Таким образом, (£ (ехР tA, ехр sB) |i=o) = £ (ехр t d/(A), ехр s d/(B)) |i=0- Теперь, дифференцируя no t при t = 0 и учитывая, что линейное отображение df перестановочно с дифференцированием, мы полу- чаем ввиду (16), что d/([A,B]) = [d/(A),d/(B)]. □ (Дифференцируемый) гомоморфизм группы Ли G в группу Ли GL(V) называется линейным представлением группы G (как группы Ли) в пространстве V. Для каждой группы Ли G имеется некоторое замечательное ли- нейное представление в пространстве T(G), играющее важную роль в теории групп Ли. Оно строится следующим образом. Всякий элемент geG определяет внутренний автоморфизм a(g) группы G по формуле a(g)x = gxg-1 (xeG). (19) Этот автоморфизм является ограничением на G линейного преобра- зования X—>gXg-1 пространства Ln(X) и, в частности, дифференци- руем. Его дифференциал в единице обозначается через Ad(g) и назы- вается присоединенным оператором элемента ge G. Оператор Ad(g)
552 Глава 12. Группы Ли задается такой же формулой, что и a(g): Ad(g)X=gXg’1 (X€T(G)). Так как а(ху) = а(х)а(у),то Ad(xy) = Ad(x) Ad (у). (Впрочем, это легко проверить и непосредственно.) Далее, если g = (gif), g"1 = (gy), х = то Ad(g)x = гДе Уу S gik^klglj • (20) к,1 В качестве координат в пространстве T(G) могут быть взяты ка- кие-то из матричных элементов; при этом остальные матричные элементы будут через них линейно выражаться. Формула (20) пока- зывает, что матричные элементы оператора Ad(g) являются раци- ональными и, следовательно, дифференцируемыми функциями от элементов матрицы g. Таким образом, отображение Ad: G—>GL(T(G)) является линейным представлением группы Ли G в пространстве T(G). Оно называется присоединенным представлением группы G. Задача 1. Доказать, что если f: G -* Н — гомоморфизм групп Ли, то /(Ad(g)X) = Ad(/(g))d/(X) (g € G, X e T(G)). Задача 2. Доказать, что ядро присоединенного представления связной группы Ли — это ее центр. Гомоморфизм алгебры Ли L в алгебру Ли L(V) линейных пре- образований векторного пространства V (относительно операции коммутирования) называется линейным представлением алгебры L (как алгебры Ли) в пространстве V. Согласно теореме 2, дифферен- циал линейного представления группы Ли G является линейным представлением ее касательной алгебры Ли T(G). Дифференциал присоединенного представления Ad группы Ли G называется присоединенным представлением алгебры Ли T(G) и обо- значается символом ad. Теорема 3. ad(A)X=[A,X] (А, Хе 7(G)). Доказательство. Пусть g(t) — кривая в группе G, удовлетворяю- щая условиям (11). Тогда ad(A) = ^Ad(g(t))|t=0.
§ 3. Касательная алгебра Ли и присоединенное представление 553 Следовательно, для любого X eT(G) ad(A)X=£ Ad(g(t))x|f=0=^gWXg(t)-11t_0=AX—XA= [A, X]. □ Тот факт, что ad есть линейное представление алгебры T(G), означает, что ad([A, B]) = [ad(A),ad(B)] или, ввиду доказанной теоремы, что [[А, В], С] = [А, [В, С]] —[В, [А, С]] для любых А, В, Се T(G). Последнее тождество равносильно тожде- ству Якоби. Полученный результат можно рассматривать как кон- цептуальное (т. е. основанное на понимании существа дела, а не на простом вычислении) доказательство тождества Якоби для опера- ции коммутирования матриц. С другой стороны, приведенное выше рассуждение подсказывает возможность определения присоединенного представления ad лю- бой алгебры Ли L (не обязательно связанной с какой-либо группой Ли) по формуле ad(a)x = [а, х] (а, х е L). Пример 3. Присоединенное представление алгебры Ли (Е3, х) определяется по формуле ad(a)x = a х х. Из кососимметричности смешанного произведения (а, Ь, с) = (а х Ь, с) следует, что оператор ad (а) кососимметричен. Тем самым опреде- ляется гомоморфизм алгебры Ли (Е3, х) в алгебру Ли T(SO3) косо- симметричных матриц 3-го порядка. Легко видеть, что ядро этого гомоморфизма тривиально. Так как обе алгебры трехмерны, то по- строенный гомоморфизм является изоморфизмом. Задача 3. Выписать матрицы присоединенных операторов век- торов ортонормированного базиса пространства Е3 в этом же ба- зисе. Задача 4. Доказать, что для любых матриц А, X GLn(K) справед- ливо равенство (ехрА)Х(ехрА)-1= f [А, [А,.... [А,Х]...]]. к=0 ' '---*----' к
554 Глава 12. Группы Ли Задача 5. Центром алгебры Ли L называется подалгебра Z(L) = {z G L: [г, и] = 0 Vu G L}. Доказать, что центр связной группы Ли G есть группа Ли, касатель- ная алгебра которой совпадает с центром алгебры Ли T(G). (Указа- ние: воспользоваться задачами 2 и 2.1.) Пример 4. Рассмотрим присоединенное представление группы Ли SU2. Алгебра Ли T(SU2) состоит из косоэрмитовых матриц с ну- левым следом, т. е. матриц вида Заметим, что det Х — х^ + х^ + х^. Следовательно, det X — положительно определенная квадратичная функция в пространстве T(SU2). Приняв ее за скалярный квадрат, будем рассматривать Т (SU2) как (трехмерное) евклидово простран- ство. Так как det Ad(g)X = det gXg-1 =detX, то присоединенные операторы элементов группы SU2 ортогональ- ны, т.е. Ad(SU2) с О3. Так как группа SU2 связна, то и ее образ связен и, значит, Ad(SU2) с SO3. Далее, Ker Ad состоит из матриц, коммутирующих со всеми мат- рицами вида (21). Пользуясь тем, что всякая матрица, коммутирую- щая с матрицей I Q . I, диагональна, легко доказать, что KerAd = {±E}. Аналогично доказывается, что Ker ad=0. Так как dim SU2=dim SO3 = =3, то Im ad = T(SO3), и из теорем 2.3 и 2.1 и предложения 1.3 следу- ет, что Ad(SU2) = SO3. Таким образом, присоединенное представление осуществляет гомо- морфизм группы SU2 на группу SO3 с ядром {±Е}. Отметим, что группа SU2 состоит из матриц вида а, ЬеС, |а|2 + |Ь|2 = 1, (22)
§ 4. Линейные представления групп Ли 555 и совпадает с группой кватернионов с нормой 1 в матричной моде- ли алгебры И (см. задачу 1.8.4). Таким образом, группа SU2 представ- ляет собой (трехмерную) сферу в 4-мерном евклидовом пространст- ве И. Группа SO3 получается из нее отождествлением диаметрально противоположных точек и тем самым представляет собой трехмер- ное вещественное проективное пространство. Пространство Т (SU2) совпадает с пространством чисто мнимых кватернионов. Задача 6. Рассуждая аналогичным образом, доказать, что при- соединенное представление осуществляет гомоморфизм группы SL2(1R) на связную компоненту группы SO2>1 (см. задачу 1.2) с яд- ром {±Е}. Задача 7. Доказать, что присоединенное представление осущест- вляет гомоморфизм группы SL2(C) на группу SO3(C) с ядром {±Е}. § 4. Линейные представления групп Ли Линейные представления групп Ли весьма хорошо изучены, но мы здесь имеем возможность рассказать лишь о некоторых началь- ных идеях этой теории. Основная из них состоит в том, чтобы заме- нять изучение линейных представлений групп Ли изучением линей- ных представлений их касательных алгебр Ли. Пусть G — какая-то группа Ли и R : G—>GL(V) — какое-то ее (конечномерное) линейное представление. Тогда dR: T(G) —L(V) есть линейное представление алгебры Ли T(G). Теорема 1. Всякое подпространство U с V, инвариантное отно- сительно G, инвариантно относительно T(G). Если группа G связна, то верно и обратное: всякое подпространство, инвариантное отно- сительно T(G), инвариантно также относительно G. Доказательство. 1) Пусть подпространство U инвариантно от- носительно G, и пусть Ag T(G). Возьмем кривую g(t) в G, удовле- творяющую условиям (11). Тогда и, следовательно, для любого вектора и G U dR(A)u = ^R(g(t))u|t=0GU.
556 Глава 12. Группы Ли 2) Обратно, пусть U инвариантно относительно T(G). По теоре- ме 2.3 для любого А е Т(G) R(exp А) = exp dR(A) и, следовательно, для любого и € U 00 1 R(expA)u=2 T]dR(A)kueU. к=о К‘ Таким образом, подпространство U инвариантно относительно expT(G). Если группа G связна, то отсюда следует, что оно инва- риантно относительно всей группы G. □ Таким образом, если группа G связна, то набор инвариантных подпространств для представления R группы G и для представле- ния dR алгебры T(G) один и тот же. Следствие. Линейное представление R связной группы Ли G неприводимо (соответственно вполне приводимо) тогда и только тогда, когда представление dR алгебры Ли T(G) неприводимо (соот- ветственно вполне приводимо). Задача 1. Пусть G — связная группа Ли и Н — ее связная подгруп- па Ли. Доказать эквивалентность следующих условий: 1) Н — нормальная подгруппа группы G; 2) подпространство Т(Н) инвариантно относительно присоеди- ненного представления группы G; 3) Т(Н) — идеал алгебры T(G). Связная группа Ли называется простой, если она не содержит нетривиальных связных нормальных подгрупп Ли. Алгебра Ли на- зывается простой, если она не содержит нетривиальных идеалов. Задача 2. Доказать, что если касательная алгебра связной груп- пы Ли G проста, то и группа G проста (как группа Ли). (На самом деле верно и обратное.) Задача 3. Доказать, что группа Ли SO3 проста. (На самом деле группа SO3 не имеет никаких нетривиальных нормальных подгрупп. См. §10.5.) Классификация простых групп Ли имеет для теории групп Ли такое же значение, какое имеет классификация простых конечных групп для теории конечных групп. Она была получена в конце XIX — начале XX века В. Киллингом и Э. Картаном (сначала для комплекс- ных групп Ли, затем для вещественных). Это одно из самых порази- тельных достижений математики.
§ 4. Линейные представления групп Ли 557 Можно доказать, что группа Ли SOn проста при любом п 5. Однако группа Ли SO4, как вытекает из следующего ниже примера, простой не является. Пример 1. Как мы видели в примере 3.4, группа SU2 может быть интерпретирована как группа кватернионов с нормой 1. Рассмот- рим линейное представление R группы Ли G = SU2 х SU2 в простран- стве И, определяемое по формуле R(p, q)x = pxq~1 (xGH). Так как N(pxq"1)=N(p)N(x)N(q)’1 = N(x) при р, q G SU2, то E(G) с О4. Из соображений связности следует, что E(G) с SO4. Тем самым определен гомоморфизм R: SU2xSU2-*SO4. Если (р, q) G Ker R, то, в частности, Я(р, q)l = pq'1 = 1, откуда р = = q. Далее, как и в примере 3.4, получаем, что р = q = ±1. Так как dim G = dim SO4 = 6, то отсюда следует, что E(G) = SO4. Таким об- разом, SO4^ (SU2 х SU2)/{(E, Е), (Е, -Е)}. В частности, каждый из множителей произведения SU2 х SU2 при гомоморфизме R переходит в связную нормальную подгруппу Ли группы SO4 и, следовательно, группа SO4 не является простой груп- пой Ли. Задача 4. Доказать, что группа Ли SLn(K) проста при любом пП Комплексные и вещественные группы Ли находятся в тесной связи. Пусть G — связная комплексная группа Ли. Определение 1. Связная вещественная подгруппа Ли Н с G на- зывается вещественной формой группы G, если Замечание 1. Это определение можно распространить на несвяз- ные группы Ли, дополнительно потребовав, чтобы каждая связная компонента группы G пересекалась с Н. Пример 2. Группа SLn (R) является вещественной формой груп- пы SLn(C).
558 Глава 12. Группы Ли Пример 3. Группа SUn также является вещественной формой группы SLn (С), а группа Un — вещественной формой группы GLn (С). Это следует из того, что всякая комплексная матрица единственным образом представляется в виде суммы косоэрмитовой и эрмитовой матриц, а пространство эрмитовых матриц получается из простран- ства косоэрмитовых матриц умножением на i. Пример 4. Группа SOn является вещественной формой группы SOn(C) (которая, как можно доказать, связна). Теорема 2. Пусть R: G -* GL(V) — комплексное линейное пред- ставление связной комплексной группы Ли G, и пусть Н — веще- ственная форма группы G. Тогда набор инвариантных подпрост- ранств для R(G) и для R(H) один и тот же. Доказательство. Согласно теореме 1, подпространство U с V ин- вариантно относительно G (соответственно Н) тогда и только тогда, когда оно инвариантно относительно T(G) (соответственно Т(Н)). Но так как dR(T(G)) = dR(T(H)) + idR(T(HY), то инвариантность подпространства U относительно T(G) равно- сильна его инвариантности относительно Т (Н). □ Этой теоремой можно воспользоваться, чтобы доказать полную приводимость линейных представлений некоторых комплексных групп Ли. Определение 2. Связная комплексная группа Ли называется ре- дуктивной, если она обладает компактной вещественной формой. Так, в силу приведенных выше примеров группы GLn(C), SLn(C) и SOn(C) редуктивны. Можно доказать (но это непросто), что всякая некоммутативная простая комплексная группа Ли редук- тивна. Замечание 2. Более естественно в определении редуктивной группы не требовать связности: тогда в число редуктивных групп войдут все конечные группы. Из теоремы 2 и доказанной в § 11.2 полной приводимости линей- ных представлений компактных групп немедленно вытекает Теорема 3. Всякое линейное представление редуктивной ком- плексной группы Ли вполне приводимо. Этот прием доказательства, принадлежащий Г. Вейлю, носит на- звание «унитарный трюк». С его помощью можно доказывать и дру- гие теоремы. Например, он позволяет распространить на редуктив-
§ 4. Линейные представления групп Ли 559 ные группы теорему Гильберта о конечной порожденное™ алгебр инвариантов, доказанную в § 11.5 для компактных групп. Пользуясь изложенной выше теорией, найдем все неприводимые линей- ные представления группы Ли SI^OC). Этот пример играет ключевую роль в теории линейных представлений произвольных простых групп Ли. Обозначим касательную алгебру Ли группы SI^GC) через sl2(C). Выбе- рем в ней базис из матриц »=с л). м» ;у м; э- ™ Непосредственно проверяется, что [Н,Е+] = 2Е+, [Н, Е_] = —2Е_, [Е+,Е_]=Н. (24) Пусть R: SL2(C) —* GL(V) — какое-то линейное представление. Положим </Я(Н) = Ж, dR(E+) = £+, dR(E_) = <£_. Операторы Jif, £+, удовлетворяют соотношениям Х,£+] = 2£+, Х,<£_] = -2£_, вытекающим из соотношений (24). Лемма 1. Если и — собственный вектор оператора Ж с собственным, значением Л, то вектор £+и (соответственно если он не равен ну- лю, — собственный вектор оператора Ж с собственным значением Л + 2 (соответственно Л — 2). Доказательство. Имеем Ji?£+ и = £+ Jfv + IX, £+ ] и = Л£+ и + 2£+ и = (Л + 2)и. Аналогично доказывается, что М?£_и = (Х-2)£_и. □ Лемма 2. Существует собственный вектор vQ оператора Ж, для кото- рого £+1/о = О. Доказательство. Так как оператор Jtf имеет лишь конечное число соб- ственных значений, то существует такое его собственное значение Ло, что Ло + 2 не является собственным значением. Соответствующий собственный вектор и0 и будет искомым. □ Всякий такой вектор vQ называется старшим вектором для представле- ния R. Пусть и0 — старший вектор и Ло — соответствующее собственное значе- ние оператора Ж. Рассмотрим векторы = (k = 0,1,2,...).
560 Глава 12. Группы Ли По лемме 1 J^uk = (A0-2k)ufc. Лемма 3. &+vk = скик_1} где ск =к(А0-к +1). Доказательство. Докажем эту формулу индукцией по к. Она верна при к = 0, если считать, что = 0. Предположим, что она верна для некоторо- го к. Тогда 1 = Цк = ] Цк = = ck<?_i4_i +^vk = ckvk + (Ло — 2k)vk = ck+ivk, где <VH=Ck + Ao-2k = (k + l)Ao-k2-k = (k + l)(Ao-)<:). □ Так как собственные векторы оператора Jif, отвечающие различным собственным значениям, линейно независимы, то существует такое п, что векторы uQ, vlf v2)..., ул отличны от нуля и линейно независимы, а уп+1 =0. Из леммы 3 следует тогда, что сп+1 = 0, т. е. Ло = и. Далее, как следует из доказанных формул, линейная оболочка векторов и0, •••> ип инвариантна относительно операторов Jff, £+, <?_ и, значит, относительно всей алгебры sl2(С). Если представление R неприводимо, то V= (м0, ..., мп) (25) и операторы <?+, <£_ задаются в базисе {у0, ..., ул} формулами Jfvk = (n-2k)vk, (26) £+ик = к(п - к 4- Dty-i, (27) &_ик = ик+1, (28) если условиться, что y.j = ц1+1 = 0. Число п называется старшим весом представления R. Формулы (26)—(28) показывают, что неприводимое пред- ставление группы SL2(C) полностью определяется своим старшим весом. Обратно, если выполнено условие (25), то представление R неприводи- мо. В самом деле, всякое ненулевое инвариантное подпространство инвари- антно, в частности, относительно оператора Ж и, следовательно, является линейной оболочкой каких-то из его собственных векторов и0, ..., ип. Но, будучи инвариантным также относительно операторов и 8_, оно должно содержать все эти векторы, т. е. совпадать с V. Остается вопрос о существовании неприводимого представления с за- данным старшим весом. Можно проверить прямым вычислением, что опе- раторы JST, <£_, определяемые формулами (26)—(28), задают линейное представление алгебры Ли sl2(C), и затем, пользуясь общей теоремой, кото- рой не было в данном курсе, доказать существование линейного представ-
§ 4. Линейные представления групп Ли 561 ления группы SL2(C), имеющего своим дифференциалом это представле- ние. Мы поступим иначе, а именно, построим нужное представление явно. Будем считать, что группа SL^CC) тавтологически действует в простран- стве С2 с базисом {х, у}, т. е. элемент *=(“ S)gsl*(c) действует по формулам (gx = ax + cy, г. f (29) [ gy = bx + dy. Это действие индуцирует линейное действие группы SL2(C) в пространстве Sn(С2). Если рассматривать х и у как координаты в сопряженном простран- стве (С2)*, а симметрическую алгебру пространства С2 отождествить с ал- геброй многочленов на (С2)* (см. §8.3), то элементы пространства Sn(С2) будут однородными многочленами степени п от х и у или, как говорят, бинарными формами степени и, а действие группы SL2(C) можно будет понимать как линейную замену переменных по формулам (29). Получен- ное таким образом линейное представление обозначим через Rn. Согласно определению, (Rn (g)/) (х, у) = / (ах + cy,bx + dy) для любой бинарной формы / степени п. Вычислим дифференциал представления Rn. Положим dRn(H) = J?> dR(E+) = <^+, dR(E_) = <^_. Принимая во внимание, что ехрГН=(е0' Д), exptE+=(J Q, exptE_=(J J), получаем для бинарной формы feSn (С2) у) = £/(е'х, е'у)|(=0 = (<?+/)(х, у) = £/(х, у + tx) |t=o = Хд-^, (<?-/)(Х, у) = £/(х + ty, у)|(=0 =у д-^-. В частности, для /0 = хп •^/о = п/о> <£+/() = т. е. /о является старшим вектором представления Rn с собственным значе- нием и. При этом А = /о = п (и - 1)... (п - k +1 )хп~кук,
562 Глава 12. Группы Ли так что формы /0, ..., fn составляют базис пространства Sn(С2). Следова- тельно, Rn — неприводимое представление со старшим весом п. Одновременно мы доказали, что всякое неприводимое линейное пред- ставление алгебры Ли sl2 (С) является дифференциалом некоторого (непри- водимого) линейного представления группы SL2(C). Полученные результаты дают также описание неприводимых комплекс- ных линейных представлений групп Ли SL2(R) и SU2, являющихся веще- ственными формами группы SL2(C). В самом деле, если Н — вещественная форма группы SL2 (С) и S: Н -♦ GL(V) — ее неприводимое комплексное ли- нейное представление, то представление dS алгебры Ли Т(Н) однозначно продолжается до линейного представления алгебры Ли sl2(C), которое по доказанному выше является дифференциалом некоторого линейного пред- ставления группы SL2(C). Отсюда следует, что неприводимые комплексные линейные представления группы Н — это в точности ограничения на Н неприводимых линейных представлений группы SL2(C). Задача 5. Доказать, что при п > О {Е}> если п нечетно, {±Е}, если п четно. Задача 6. Описать неприводимые линейные представления группы Ли SO3(C). Задача 7. Описать неприводимые комплексные линейные представле- ния групп Ли SO3 и SO° j. Ker Rn =
Ответы к задачам 1.8.1. EjjEki — 5jkEa (где 5у—символ Кронекера). 2.2.1. qn. 2.2.3. (qn - 1)(qn - q)(q" - q2)...(q" - q^1). 224 (q11 — l)(qn — q)(qn — д2).-.(дп — q*1) ‘ (qk — l)(qk — q)(qk — q2)...(qk — qfc-1) ’ 3.5.4. 2=(l + i)(l — i)~(l + i)2, 3 — простой элемент, 5 = (2+i)x x(2-i). 3.5.5. x, x + 1, x2 + x + 1, № + x2 + 1, x3 + x + 1, x4 + x3 + 1, x4 + x + l, x4 + x3 + x2+x + l. 4.6.3. |GL2(Zp)| = p(p + l)(p-l)2, |SL2(Zp)| = p(p2 —1). 5.1.1. Три различных одномерных подпространства двумерного векторного пространства. 5.1.2. То же, что и в задаче 5.1.1. 5.2.1. 3. 54 2 (nCn + 1) иО1-1)) 1 -cos а12 -cos а13 551 —cosa12 1 -cos а23 —cos а13 —cos а23 1 -cos а14 -cos а24 -cos а34 -cos а14 -cos а24 -cos а34 1 где «у —угол между i-й и j-й гранями; двугранный угол правильного тетраэдра равен arccos 1/3. 5.6.1. ^kickj “ $ij> S Cikcjk к к Га 0 b 0\ , - - 0 a 0 b 61L с 0 d 0 * <0 с 0 dj 6.3.2. Матрица D определена с точностью до перестановки диа- гональных элементов. При заданной матрице D матрицы О2 и О2 определены с точностью до преобразования О2 —> С^О, О2 —> О-1О2, где О — ортогональная матрица, коммутирующая с D. 6.5.1. t; t-1. 6.5.2.1) max ^2 |аг;|, где (а^=А — матрица оператора лУ; 2) ушах Лр где ..., Лп — (неотрицательные) собственные зна- чения самосопряженного оператора аУ*аУ; 3) тах^ |ау|.
564 Ответы к задачам 7.1.1. 5. 7.1.2. dimCl/j + U2), если п ^2 0! dim(U] + 1/2) + 1> если Р1ПР2 = 0. 7.3.2. Грани положительной размерности выделяются тем, что какие-то к < п/2 координат хг равны 0 и какие-то I < п/2 координат равны 1 при условии, что к+1<п—1 (при четном п это условие выполняется автоматически). Вершины — это точки у которых ка- кие-то [п/2] координат равны 0 и какие-то [п/2] координат равны 1, а оставшаяся координата при нечетном п равна 1/2. 7.3.3. Выпуклые оболочки всевозможных подмножеств множе- ства вершин симплекса. 7.2.5. При перестановках точек Р1,Рг,Рз их отношение прини- 11 1с мает значения с, -с — 1, -,------1,----—,------—. Наименьшее с с с+1 с+1 значение различных значений равно 2, если в поле К разрешимо уравнение х2 + х +1 = О, иЗв противном случае. 7.4.5. См. ответ к задаче 10.3.1, где перечислены все элементы группы Sym+ К. Помимо этого, в группе Sym К имеются шесть от- ражений относительно плоскостей, проходящих через ребра, три отражения относительно плоскостей, параллельных граням, восемь зеркальных поворотов на л/3 вокруг осей, проходящих через верши- ны, шесть зеркальных поворотов на п/2 вокруг осей, проходящих через центры граней и центральная симметрия. 7.4.6. (xb х2) -> (txb t-1x2); (xb х2) -> (tx2, где teR*. 7.4.7. Если скалярные квадраты сторон одного треугольника (рассматриваемых как векторы) равны скалярным квадратам со- ответственных сторон другого треугольника, то эти треугольники равны. 7.6.2. У1 У1 У1 7.6.4. При перестановках из группы V4 двойное отношение не меняется. При перестановках, оставляющих на месте точку р4, двой- ное отношение меняется так же, как взятое со знаком минус про- стое отношение точек р19 р2> р3 (см. ответ к задаче 7.2.5), т. е. при- нимает значения 5,1-5,1,1-1 9.1.7. [10]15, [6]15. 9.1.10. [3]7; [6]41. 9.2.5. Если n = 2трк'...pssqli где р1э ...,ps — различные про- стые числа вида 4k +1, a qb ..., qt — различные простые числа вида
Ответы к задачам 565 4k+ 3, причем ..., lt четны, то искомое число равно 4(ki +1) х ... ...x(ks + l). 9.3.3. Например, клеточно-диагональная матрица, составленная из жордановых клеток и клеток вида 9.3.4. Например, клеточно-диагональная матрица порядка четы- ре, составленная из жордановых клеток и клеток вида ГО 1 О ОЛ 0 0 10 10 0 1 VI о о оу Л 1 0 0\ 0 0 10 0 0 0 1 V о о оу Л 1 о 0\ 10 10 0 0 11 Vo о 1 оу /1 1 о 0\ 10 10 10 0 1’ VI о о оу 9.5.1. Таблицы сложения и умножения имеют следующий вид: + 0 1 а а + 1 0 0 1 а а + 1 1 1 0 а + 1 а а а а+1 0 1 а + 1 а + 1 а 1 0 9.7.2. (P1...Ps). X 0 1 а а + 1 0 0 0 0 0 1 0 1 а а + 1 а 0 а а + 1 1 а+1 0 а+1 1 а 10.1.1. При нечетных п. 10.2.1. 10.3.1. 5 классов: тождественное движение (1 элемент); пово- роты на 2л/3 вокруг осей, проходящих через вершины (8 элемен- тов); повороты на п вокруг осей, проходящих через середины ребер (6 элементов); повороты на тг/2 вокруг осей, проходящих через цен- тры граней (6 элементов); повороты на л вокруг осей, проходящих через центры граней (3 элемента).
566 Ответы к задачам 10.3.3. 57. 10.5.4. |q(q2 - 1), если q нечетно, и q(q2 - 1), если q — степень двойки. 11.4.1. В обозначениях примера 10.1.16, Dn = (а)п\ (Ь)2- При нечетном п группа Dn имеет 2 одномерных представления а^>1, Ь-*±1 и двумерных неприводимых представлений ч» ч ч?;) (’«‘ч где со = е2ш/п. При четном п группа Dn имеет 4 одномерных пред- ставления а*-*±1, Ь*->±1 и " 1 двумерных неприводимых представлений, описываемых так же, как при нечетном п. 11.4.3. Одномерное подпространство констант; двумерное под- пространство «четных» функций, принимающих одинаковые значе- ния на противоположных гранях куба, с суммой значений, равной нулю; трехмерное подпространство «нечетных» функций, прини- мающих противоположные значения на противоположных гранях куба. 11.4.5. Таблица характеров имеет следующий вид: Xi Хз Хз *4 Xs е 1 3 3 4 5 1 (12)(34) 1 -1 -1 0 1 15 (123) 1 0 0 1 -1 20 (12345) 1 1 + У5 2 1--/5 2 -1 0 12 (12354) 1 1-/5 2 1 + /5 2 -1 0 12 11.6.2. Стандартная инволюция имеет вид
Ответы к задачам 567 12.3.3. Матрицы присоединенных операторов имеют вид О 0 0\ О 0 -1 , .0 1 О/ О 0 1\ О 0 0 , -1 О О/ О -1 0\ 1 0 0 о о оу 12.4.6. Для каждого п €Z+ имеется единственное (2п + ^-мер- ное неприводимое представление Sn группы SO3(C), связанное с представлением R2n группы SL2(C) коммутативной диаграммой SL2(C)-----GL2n+1(C) SO3(C) (см. задачу 12.3.7). 12.4.7. Для каждого п G Z+ имеется единственное (2п + ^-мер- ное неприводимое комплексное представление группы SO3 (соот- ветственно SC>2 Д получаемое ограничением представления Sn группы SO3(C) (см. ответ к задаче 12.4.6).
Словарь сокращений английских слов, употребляемых в обозначениях Сокращение От слова Перевод Ad (ad) adjoint присоединенный aff affine аффинный Alt alternation альтернирование Ann annihilator аннулятор area area площадь arg argument аргумент Aut automorphism автоморфизм char characteristic характеристика conv convex выпуклый deg degree степень det determinant определитель diag diagonal диагональный dim dimension размерность exp exponential экспонента Hom homomorphism гомоморфизм ht height высота Gr Grassmanian грассманиан id identity тождество Im image образ Im imaginary мнимый inf infimum (лат.) нижний Isom isometry изометрия Ker kernel ядро lim limit предел log logarithm логарифм mod modulo (лат.) по модулю ord order порядок per permanent перманент pf Pfaffian пфаффиан Quot quotient частное
Словарь сокращений английских слов 569 rad radical радикал Re real действительный rk rank ранг sgn signum (лат.) знак Spec spectrum спектр Sym symmetry симметрия Sym symmetrization симметрирование Tor torsion кручение tr trace след tr. deg transcendence degree степень трансцендентности Trans translation перенос vol volume объем
Список литературы 1. Атья М., Макдональд И. Введение в коммутативную алгебру. М.: Факториал Пресс, 2003. 2. Беклемишев Д. В. Дополнительные главы линейной алгебры. М.: Наука, 1983. 3. Беллман Р. Введение в теорию матриц. М.: Наука, 1976. 4. Берже М. Геометрия. М.: Мир, 1984. 5. Боревич 3. И. Определители и матрицы. М.: Наука, 1988. 6. Ван дер Варден Б. Л. Алгебра. М.: Наука, 1979. 7. Винберг Э. Б. Алгебра многочленов. М.: Просвещение, 1980. 8. Винберг Э. Б. Линейные представления групп. М.: Наука, 1985. 9. Гантмахер Ф. Р. Теория матриц. М.: Наука, 1988. 10. Гельфанд И. М. Лекции по линейной алгебре. М.: МЦНМО, 1998. И. Глазман И. М., Любич Ю. И. Конечномерный линейный анализ в задачах. М.: Наука, 1969. 12. Калужнин Л. А., Сущанский В. И. Преобразования и перестанов- ки. М.: Наука, 1985. 13. Каргаполов М. И., Мерзляков Ю. И. Основы теории групп. М.: На- ука, 1996. 14. Кострикин А. И. Введение в алгебру. Часть I: Основы алгебры. М.: МЦНМО, 2009. 15. Кострикин А. И. Введение в алгебру. Часть II: Линейная алгебра. М.: МЦНМО, 2009. 16. Кострикин А. И. Введение в алгебру. Часть III: Основные струк- туры. М.: МЦНМО, 2009. 17. Кострикин А. И., Манин Ю. И. Линейная алгебра и геометрия. М.: Наука, 1986. 18. Кострикин А. И. (ред.) Сборник задач по алгебре. М.: МЦНМО, 2009. 19. Куликов Л. Я., Москаленко А. И., Фомин А. А. Сборник задач по алгебре и теории чисел. М.: Просвещение, 1993. 20. Курош А. Г Курс высшей алгебры. М.: Наука, 1975. 21. Курош А. Г Лекции по общей алгебре. М.: Наука, 1973. 22. Ланкастер П. Теория матриц. М.: Наука, 1982. 23. Ленг С. Алгебра. М.: Мир, 1968.
Список литературы 571 24. Мишина А. П, Проскуряков И. В. Высшая алгебра: Линейная ал- гебра, многочлены, общая алгебра. М.: Физматгиз, 1962. (Сер. «Справочная математическая библиотека»). 25. Постников М. М. Аналитическая геометрия. М.: Наука, 1986. 26. Постников М, М. Линейная алгебра и дифференциальная гео- метрия. М.: Наука, 1979. 27. Проскуряков И. В. Сборник задач по линейной алгебре. М.: Би- ном. Лаборатория знаний, 2005. 28. Скорняков Л. А. Элементы алгебры. М.: Наука, 1980. 29. Скорняков Л. А. (ред.) Общая алгебра. Т. 1. М.: Наука, 1990. (Сер. «Справочная математическая библиотека»). 30. Фаддеев Д. К. Лекции по алгебре. М.: Наука, 1984. 31. Фаддеев Д. К., Соминский И. С. Сборник задач по высшей алгеб- ре. М.: Наука, 1977. 32. Халмош П. Конечномерные векторные пространства. М.: Физ- матгиз, 1963; Ижевск: РХД, 2002. 33. Шафаревич И.Р. Основные понятия алгебры // Итоги науки и техники. Современные проблемы математики. Фундаменталь- ные направления. Т. 11. М.: ВИНИТИ, 1986; Ижевск: РХД, 1999. 34. Шафаревич И. Р. Основы алгебраической геометрии. М: МЦНМО, 2007. 35. Шилов Г. Е. Математический анализ. Конечномерные линейные пространства. М.: Наука, 1969.
Указатель обозначений N 9 Z 9 dim V 63 5a 63 Sn 154 Isom E2 155 Z+ 9 Г 67 Trans(V) 156 Q 9 rk A 68 GL„(Kj 157 R 9 агеа(ах, a2) 75 A’ 157 R+ 9 vol(ax, a2, a3) 76 On 159 ta И det A 77,80 Sym F 161 Rn 15 |a.;l 77 Dn 161 2х 19 sgnCkj.kj, ...,kn) 79 SLn(K) 161 К* 21 84 SLn(Z) 162 С 22 My 85 Fj~F2 162 i 22 Ay 85 GAn(K) 164 Rec 24 R[x] 92 O3! 166 Imc 24 K[x] 93 (gj 168 c 24 deg/ 93,128 ord g 168 |c| 25 K[[x]] 94 (ц/г-.Лр) 169 arg c 25 D 102 C„ 1Л a ~ h, a ~ b 29 /' 103 171 [a]n 30 N(/) 113 |G| 171 Zn 30 L(/) 113 (S) 173 char К 33 b|a 118 T 176 C‘ 33 a~b 118 G/H 177 Kn 35 Z[il 119 |G:H| 177 E2, E3 35 НОД{а, b} 119,433 <p(n) 178 F(K,X) 35 HOK{a, b} ([a, b]) 123 x~y 178 H 41 K[x1,...,xn] 127 Gx 179 (ae) 42 CCd 128 Gx 179 diag(a1; 44 degX1 f 129 |Gx| 179 E 44 и >- v 130 Sym К 180 Ln(K) 45 sk 132 H<G(G>H) 181 Mn(K) 45 ak 132 Im/ 184 45 D(</0 141 Ker/ 184 A' 46 f (a/b) 148 sgn a 185 aj 46 Quot A 148 An 186 A 48 KM 149 df 188, 284, 285 (S) 62 S(X) 154 V4 189
Указатель обозначений 573 G+ 190 SO(V) 253 V®W, V®KW 340 unv 193 U(V) 257 a®0 341 1Л + ... + 14 195 Un 257 V(L) 343 ^Ф...®^ 196 SUn 257 TP(V) 346 L+(K) 196 hte 261 349 Ц(К) 196 /(X) 265 Vj©...©^ 351 Ad 197 md 266 T(V) 352 Im ip 200 Pn 269 T.(V) 352 Ker ip 200 M 272 SP(V) 354 id 204 e* 273 S(V) 355 trX 206 pq "2Л Sym 356 V* 206 affM 279 aV/3 359 Ek 206 center^,..., pk) 281 per A 359 5ц 206 GA(S) 286 A₽(V) 361 UQ 208 Trans(S) 287 A(V) 362 Ker a 211 conv M 290 Alt 362 rka 211 M° 292 aA/3 364 U1 213 Hf 292 Grp(V) 365 214 H+, H' 292 PAP(V) 366 (,) 221, 232 p(p,q) 302 pfA 369 pr^ x 225 Isom S 303 (S) 373 orty x 225 Isom+ S 303 rkL 373 p(x,y) 226 rH 303 Ai®... ©A* 381,391 vol P 228 Sym M 307 GiX...xG|t 381 лУ, 33, ... 234 Sym+ M 307 Tor A 383 n(a) 237 T, K, 0, D, I 308 TorpA 384 La 239 L(V) 240 O(V, a) 308 d0Q 310 (|) 386 S 240 X(Q) 311 A/I 387 GL(V) 240 G(X) 319 Imf 388,397 rk 240 PV 325 Ker/ 388,397 det зУ 240 KPn 326 (S), (u) 392 X/(0 241 x 326 M/N 397 V(C) 242 Vs 326 AnnM 398 243 j? 328 TorM 401 VA(^) 244 PGL(V) 329 Torp M 401 244 det(u, v) 331 rad A 406,497 32 245 (Pi> P2; Рз. Pa) 331 AEux,..., un] 408 247 PX(Q) 333 dimK L 408 j/* 247,256 G(PX) 337 mu 409 O(V) 253 Hom(Vi,Vp; U) 338 XC^,...,^) 411 SOn 253 338 К 411
574 Указатель обозначений A, Z 418 420 tr. deg А 422 К[М], 1(М) 426 Spec А 427 dim М 430 р(и) 437 С1А 438 Aut G, Int G 444 NXH,HAN 446 NXaH, NXH 447 (G, G), G' 448 Bn(K) 451 G:X, G:X 452 1(g) 453 r(g), a(g) 453 x^y 453 Gx 453 Gx 455 Xs 457 Z(x),C(x) 457 N(h) 458 PSLn(K) 464 AutK L 466 Lg 466 GalL/K 468 Kn 469 GP 471 R(x) 478 Ru 481 Ry/и 481 M(cr) 482 T(a) 483 Ad 486,551 ^(S)> *(S) 487 Tn 494 Z(A) 503 KG 504 C[G] 507 4>ijk 508 Z 509 ZC[G] 509 K[V]G 517 11 519 Z(D) 523 D(a,/3) 524 N(q) 525 deg D 528 О 534 N(u) 535 [ut4v] 535 T(G) 542 G° 542 SOn>1 544 exp 545 [A, B] 549 ad 552 Z(L) 554
Предметный указатель А Автоморфизм 24 — группы 184, 443 ---внутренний 444, 551 — Фробениуса 472 Алгебра 38, 39, 525 — альтернативная 535, 536 — ассоциативная 524 — внешняя 362 — градуированная 197 — Грассмана 362 — групповая 504, 505, 507, 508 — инвариантов 517, 520, 521 — касательная группы Ли 550 — кватернионов 41, 46, 63 ---обобщенная 524, 525, 529 — конечно порожденная 420—424, 427 — Кэли 535 — Ли 551 ---линейная 550 ---простая 556 — линейных операторов 240,499, 501, 502 — матриц 45,197, 240, 390, 551 — многочленов 92—94 ---на алгебраическом много- образии 426 ---от и переменных 127, 129, 197, 340 — нильпотентная 496 — нильтреугольных матриц 496 — октав 534—536 — полилинейных функций 352 — полупростая 497—499,501,502, 504, 526 — простая 501, 502, 534 — с делением 523, 525, 527, 530, 533, 534 ---центральная 524, 527—529, 531 -------расщепимая 528 — с единицей 390 — симметрическая 355—357 — суперкоммутативная 362 — тензорная 352 — формальных степенных рядов над К 94 — функций на множестве 39, 390, 391, 517 — К [t] /(h) 497, 499, 500, 502 Алгоритм Евклида 120 Аннулятор модуля 398 — подпространства 208 Антиавтоморфизм 524 Антикоммутативность 19, 550 Аргумент комплексного числа 25 Ассоциативность 14,15,156 Ассоциатор 535 Б Базис абелевой группы 373, 374 — векторного пространства 37, 62, 63, 243 -------, согласованный с подпро- странством 192,193 — жорданов 264 — модуля 399 — ортогональный 214 — ортонормированный 224, 233 — симплектический 220 — трансцендентности 421, 422
576 Предметный указатель Бивектор 361 В Вектор 35, 37 — в аффинном пространстве 277 — геометрический 35 — корневой 258, 259 — собственный 241, 243, 250 /-вектор выпуклого многогран- ника 299 р-вектор 361 Векторизация 278 Векторы линейно зависимые 59—61, 64, 223, 364 ----независимые 59, 60, 64, 364 —, ориентированные положи- тельно 75, 76 — ортогональные 212, 231 Вершина выпуклого многогран- ника 298 — квадрики 311 — параболоида 322 Вершины смежные 299 Высота вектора 261 — корневого вектора 258, 260 — нильпотентного оператора 261, 265 — параллелепипеда 227 Вычет квадратичный 219 — числа 30 Г Геометрия аффинная 164, 288, 289 — конформная 337 — Лобачевского 337 — проективная 330, 335 — псевдоевклидова 308 Гиперболоид 319 Гипергрань выпуклого много- гранника 298 Гиперплоскость в аффинном пространстве 278 — опорная 293, 295 — проективная 325 Гиперповерхность второго поряд- ка 311 Гомоморфизм алгебр 390 — групп 183,186,189 ----Ли 548, 551 — канонический 191, 388, 390, 398 — колец 388 — модулей 397 — над полем 412 Гомотетия 287, 288 Градуировка 197 Грань выпуклого многогранника 298, 299 Группа 156,158 — абелева (коммутативная) 14, 15, 157, 182, 184, 372, 396, 484, 495, 506 ----конечно порожденная 373, 383 ----свободная 373, 374, 379 ----циклическая 385 — автоморфизмов 444 ----внутренних 444 ----конечного расширения поля 466 — аддитивная вещественных чисел 187, 481, 484 ----комплексных чисел 176,182, 186 ----целых чисел 17,171,173,182, 382 — аффинных преобразований квадрики 319 — вращений куба 190, 455, 456, 481 — вычетов по модулю п 171, 382, 445
Предметный указатель 577 — Галилея 165 — Галуа 468 — дважды транзитивная 512 — движений евклидова аффинно- го пространства 303, 304, 446 -------пространства Е3 155 ----евклидовой плоскости Е2 155,164,170,175,179, 453 ----------собственных 454 — диагональных матриц 162,183, 443 — диэдра 161,190, 448, 507 — знакопеременная 186,187, 449, 450, 462 ----порядка 4 450, 463, 464 ----порядка 5 461, 463, 464, 512 — классов идеалов 438, 440 — Клейна четверная 189,453,463 — кольца аддитивная 18 — конечная 177—179, 186, 456, 457, 462, 492, 504, 505, 512, 513, 516, 518, 519 ----порядка р2 458 -------pq 460 — Ли 537, 542, 546 ----комплексная 558 -------редуктивная 558 ----линейная 539, 540 ----простая 556 ----связная 544, 547, 548 — Лоренца 166, 309 — мультипликативная корней из 1171,173 ----поля 21,157, 385, 537 -------С 170, 176, 183, 184, 187, 189, 442 -------гр 178 — невырожденных квадратных матриц см. группа полная линейная ----треугольных матриц 162, 451, 541 — обратимых элементов кольца 157 ----------Zn 32, 171, 178, 386, 392, 445 — однопараметрическая, порож- денная оператором 273 — ортогональная 159—161, 179, 253, 254, 453, 493, 496, 522, 540, 543, 547, 550 ----специальная 253, 465, 558 -------порядка 3 464, 553—556 -------порядка 4 465, 557 — параллельных переносов 156, 158,163, 287, 453 — подстановок см. группа сим- метрическая — полная аффинная 164,188,190, 286, 287, 330, 446, 545 ----линейная 157,163, 174,177, 183,187—189, 240, 287, 444, 446, 450, 486, 496, 537, 540, 541, 543, 548 ----проективная 329, 444 —, порожденная подмножеством 173 — преобразований 154, 157, 159, 166,178, 451 ----транзитивная 163,179 — примарная (р-группа) 382,458 — простая 461 — псевдоортогональная 308, 541 — Пуанкаре 165,166, 309 — разрешимая 450 — симметрии куба 180, 308, 511 ----правильного многогранни- ка 180, 308 ----фигуры 161, 307 — симметрическая 154,169,174, 177, 179,183, 185, 187, 444, 446, 450, 454, 482, 507, 513, 517, 518, 520
578 Предметный указатель Группа симметрическая поряд- ка 3 158,188,191, 445, 464, 506 ----порядка 4181,188—190, 446, 456, 481, 492, 506, 511 — симплектическая 541 — топологическая 493 ----компактная 493, 495, 496, 521 — унимодулярная 161, 162, 175, 177,185,189,191, 449, 450, 540, 543, 547, 555, 557, 559 ----проективная 464 — унитарная 257, 493, 541, 544, 547 ----специальная 257, 542, 544, 554, 558 — циклическая 171—173,178,183, 381, 382, 385, 447, 510, 513 — Т 185, 493 Д Движение 302, 304, 306 — винтовое 306 — несобственное 303 — собственное 303 Действие 453 — группы на множестве 451—453 — левыми сдвигами 453 — правыми сдвигами 453 — сопряжениями 453 — транзитивное 453, 456 — эффективное 452 Деление окружности на п равных частей 476 — с остатком 96,118 Делимость элементов 118 Делитель нуля 20, 21 Детерминант 185 Диагональ главная 44 — побочная 44 Диаграмма коммутативная 455 Дивизор простой 437 Дискриминант 141,142 — кубического многочлена 142—144 Дистрибутивность 18,19 Дифференциал аффинно-квадра- тичной функции 310 — аффинно-линейной функции 285 — аффинного преобразования 188 — отображения 284 Длина вектора 222, 232 — орбиты 179 Дополнение алгебраическое 85 — ортогональное 213, 231 Дробь 148 — несократимая 149 — рациональная 150 ----правильная 150,151 ----простейшая 151 Е Единица матричная 45 — правая 158 3 Задача интерполяции 96, 269 — о получении максимальной прибыли 300 — транспортная 301 Закон инерции 218, 232 Замыкание кольца целое 418 — поля алгебраическое 412, 528 Знак перестановки 79 — подстановки 185,186 Значение собственное 241, 242, 250 И Идеал алгебры 389 — главный 392, 437 — кольца двусторонний 387
Предметный указатель 579 ---левый 387 ---правый 387 — максимальный 406, 407 — многообразия 426, 435 — нормирования 437 —, порожденный подмноже- ством 392 — простой 406 Идеалы эквивалентные 438 Изоморфизм алгебр 41 — алгебраических структур 11 — векторных пространств 36, 205 — групп 184 — действий 455 — евклидовых пространств 229 — естественный 344, 345, 353 — канонический 350 — модулей 397 — над полем 412 — представлений 479 Инвариант действия группы 516, 517 Инверсия элементов 79 Инволюция 524 Индекс инерции 218, 232 — подгруппы 177 К Карта аффинная 326 Квадрат симметрический пред- ставления 514 Квадрика 311—313, 315, 316, 319, 321, 322 — коническая 312, 315, 316, 321 — невырожденная 314, 335 — нецентральная 315, 316, 322 — проективная 333, 335 ---линейчатая 336, 337 ---невырожденная 333, 337 ---овальная 336, 337 — центральная 311 ----неконическая 315, 316, 321 — цилиндрическая 314 Кватернион 524 — сопряженный 524 Китайская теорема об остатках 382 Класс смежный 176—179 — сопряженных элементов 454 — эквивалентности 29 Клетка жорданова 264, 266 ----нильпотентная 262 Кольцо 18,184, 387, 396, 397 — ассоциативное 18 — без делителей нуля 20, 439 — вычетов 31, 32, 47, 388, 392 — главных идеалов 393—395, 399, 406, 432 — евклидово 118, 119, 121—123, 149, 393 — коммутативное 18—20 ----ассоциативное с единицей 47, 94,138, 403 — конечно порожденное 406 — многочленов 118,119,121, 389, 393, 405, 433 ----от нескольких переменных 129, 405, 434 — нётерово 403—406, 417, 418, 431, 437 — подмножеств 19, 21, 39 — с единицей 19 — факториальное 432, 433, 437 — функций 19, 20 —, целое над подкольцом 417 — целостное 118,147, 431, 432 ----нормальное (целозамкну- тое) 418 ----факториальное 432 — целых гауссовых чисел 119,123, 394, 395 ----чисел 20, 21, 47,118,119,121, 388, 393
580 Предметный указатель Кольцо целых чисел поля 420,439, 440 Комбинация векторов линейная 37, 59, 67 -------нетривиальная 59 -------тривиальная 59 — точек барицентрическая 280, 281 ----выпуклая линейная 290 Коммутант 448, 449 — кратный 450 Коммутативность 14,15 Коммутатор 448 — матриц 549 Комплексификация 242, 257 Композиция отображений 10 Компонента изотипная представ- ления 487 — многочлена однородная 128 — неприводимая 429 — связная группы Ли 543 ----пространства 542 Коника 311 Константа структурная алгебры 526 Конус 312, 332 — грассманов 365 — квадратичный 319, 333 Координаты барицентрические 282, 286 — вектора 37 — неоднородные 327, 328 — однородные 327 — плюккеровы 366 — тензора 341, 349 Корень многочлена 99,100 ----кратный 100,104,117,142 ----простой 100 — первообразный 171 Коэффициент многочлена 93,104 ----старший 93 Коэффициенты линейного урав- нения 48 — линейной функции 206 Кратность корня 100 Кривая второго порядка 311, 317 Критерий Сильвестра 218, 232 Л Лемма Гаусса 124, 433 — Даламбера 109 — Нётер о нормализации 422 — о замене 421 — о линейной зависимости 61 — о неподвижной точке 492, 495 — Шура 483 М Матрица 41, 50 — билинейной функции 210 — верхняя треугольная 52 -------строго 52, 54 — вырожденная 74 — Грама 223 — диагональная 44, 377 — единичная 44 — жорданова 264 — квадратная 44,196 — кососимметричная 196 — косоэрмитова 231 — коэффициентов 48 ---расширенная 48 — линейного оператора 234, 235, 237 ---отображения 199 — невырожденная 73, 74, 82, 226, 255 — нижняя треугольная 52 — нильтреугольная 259, 390 — обратная 73, 74, 90 — оператора 264 — ортогональная 224, 253 — перехода 66
Предметный указатель 581 — полуторалинейной функции 230 — симметричная 196 — скалярная 46 — ступенчатая 50 — транспонированная 46 — трапецеидальная 52 — унитарная 233, 257 — целочисленная 91,162, 378 — элементарная 57, 58 — эрмитова 231 Матрицы подобные 265 Матричная единица 204 Метод вращений 58 — Гаусса 49, 54—56 — Якоби 218, 232 Минор 85, 91 — главный 242 — дополнительный 85 — окаймляющий 91 — угловой 214 Многогранник выпуклый 296, 297, 300, 307 — правильный 307, 308 — телесный 296 Многогранники правильные двойственные 308 Многообразие алгебраическое 426, 427 ---аффинное 426, 428,430, 436 ---неприводимое 435 — гладкое 538 — грассманово 365 Многоугольник правильный 308 Многочлен 92—96,106,110,141 — аннулирующий 266 — деления круга 125 — кубический 142, 470, 472 — минимальный 266, 267, 403 ---элемента 409 — на алгебраическом многообра- зии 426 — неполный 143 — неприводимый 121, 395, 415, 434, 435, 468, 473 — нормированный 102 — от п переменных 127—130 ----однородный 128 -------степени d 128 — от матрицы (оператора) 265, 268 — приведенный 102 — примитивный 433 — с вещественными коэффици- ентами 111—113,142 — с целыми коэффициентами 123—126 -------примитивный 124 — сепарабельный 468 — симметрический 132, 134,138, 159, 517 ----элементарный 132 — характеристический 241, 242, 244—246, 259, 261, 264, 268, 346, 360 Множество выпуклое 290—292, 295, 297 —, замкнутое относительно опе- рации 16 Множитель инвариантный 385 ----модуля 402 ----подгруппы 380 Модуль 47, 396, 397 — комплексного числа 25,106 — конечно порожденный 398, 400, 401 — периодический 398 — правый 396 — примарный (р-примарный) 401 — свободный 399 ----циклический 399 — циклический 398 Морфизм представлений 479, 483
582 Предметный указатель Н Наибольший общий делитель 119, 433 Наименьшее общее кратное 122 Направление особое параболои- да 321 Начало отсчета пространства 155, 277 Невычет квадратичный 219 Неизвестные главные 53 — свободные 53 Неравенство Коши—Буняковско- го 222, 232 Норма 118, 270 — кватерниона 525 — линейного оператора 272 — октавы 535 Нормализатор подгруппы 458 Нормирование 437 О Область целостности 118 Оболочка аффинная 279, 281 — выпуклая 291, 297 — линейная 62, 64 Образ гомоморфизма 184, 388 — линейного отображения 200, 201 Объем параллелепипеда 228 Оператор альтернирования 362 — в евклидовом пространстве 247, 254 — в эрмитовом пространстве 255 — дифференцирования 238, 241, 245, 259, 261, 274 — кососимметрический 247, 248, 251 — косоэрмитов 256 — линейный 234, 235, 240, 242, 243, 246, 265, 350, 402, 403 — нильпотентный 261, 263 — ортогональный 248, 252 — представления 478 — присоединенный 551 — Рейнольдса 519 — самосопряженный 248, 256 — симметрирования 356 — симметрический 247—249, 257 ---положительно определен- ный 251, 254 — сопряженный 247, 256 — тождественный 240 — унитарный 256 — эрмитов 256 ---положительно определен- ный 257 Операция альтернирования 363 — в множестве 9 — коммутативная 12 — симметрирования 357 Определитель Вандермонда 84, 132, 435 — линейного оператора 240 — матрицы 76, 80—83, 86, 185, 210 Орбита 179, 453 Основание параллелепипеда 227 Основная теорема алгебры ком- плексных чисел 106, 477 ---теории Галуа 471 Остаток от деления многочленов 96 Ось движения 305 — параболоида 322 Отношение двойное 331, 332 — на множестве 28 — сравнимости по модулю 30 -------подгруппы 175 — тройки точек 289 — эквивалентности 28 ---, определяемое действием 453 ---, согласованное с операцией 29
Предметный указатель 583 Отображение аффинное 283—285 — билинейное 339 — линейное 197,198, 201—204 — полилинейное (р-линейное) 338, 340, 341, 344 ----кососимметрическое 360, 361 ----симметрическое 353, 355 — факторизации 29 — эквивариантное (G-эквивари- антное) 455 — экспоненциальное 545, 547 Отражение 245, 303 — ортогональное 248 — скользящее 306 Отрезок 290 П Параболоид 321, 322, 335 — гиперболический 319 — эллиптический 319 Параллелепипед 227, 296, 299 — фундаментальный 375 Перемена знака 113 Перенос параллельный 156 Пересечение подпространств 193 Перестановка элементов 78 ----тривиальная 78 ----четная (нечетная) 79 Перманент матрицы 359 Плоскости параллельные 280 — скрещивающиеся 280 Плоскость 305 — бесконечно удаленная 326 — в аффинном пространстве 278—281, 295 — проективная 325, 328 Поверхность второго порядка 311, 317 Поворот 198, 199, 237, 241, 243, 306 — зеркальный 252, 306 Подалгебра 41 Подгруппа 159 — абелевой группы 16,17 — дискретная 376 — кручения 383 — р-кручения 384 — нормальная 181,182, 445 —, порожденная подмножеством 173, 373 — силовская 459, 460 — циклическая, порожденная элементом 168 Подгруппы сопряженные 458 Подкольцо 21 —, порожденное элементами 408 Подматрица 85 Подмножество дискретное 375 Подмодуль 396 — кручения 401 —, порожденный подмноже- ством 398 Подполе 21, 36 — G-инвариантных элементов 466 —, порожденное элементами 411 Подпредставление 481 Подпространства линейно неза- висимые 195 Подпространство 36, 65, 208, 209 — инвариантное 236, 480, 555 — корневое 259—261 — направляющее 278 — невырожденное 213 — собственное 244, 245 — циклическое 262 Подстановка 154 — четная (нечетная) 186 Подход аксиоматический 27 Подъем индекса 350 Поле 20, 32, 39, 388 — алгебраически замкнутое 106
584 Предметный указатель Поле алгебраических чисел 412, 419 — вещественных чисел 27, 64, 67 — вычетов 32, 34, 415 — комплексных чисел 23, 24, 27, 38—40, 46, 63,106,121, 389 — конечное 414, 415, 468, 469 — круговое (деления круга) 410, 416, 420, 469, 472 — отношений (дробей) кольца 148, 421 —, порожденное элементами 411, 412, 418 — разложения многочлена 412, 469, 470, 472 — рациональных дробей (функ- ций) 149 ----чисел 21 — числовое 32 Поливектор 361 — разложимый 361, 368 Полупространство 292 — опорное 293 Поляризация 358 — квадратичной функции 212 Порядок группы 171,177 — элемента группы 168—170,178 Последовательность финитная 67 Построение циркулем и линей- кой 475 Представление алгебры 479, 483, 552 — вполне приводимое 484—486 — группы 452, 478, 479, 512 ----Ли 551 -------неприводимое 556 ----неприводимое 491 ----одномерное 506 ----ортогональное 491 ----симплектическое 491 — изотипное (S-изотипное) 487, 488 — множества 478, 480 ----одноэлементного 479, 487, 490 — мономиальное 482, 485 — неприводимое 481, 482, 509, 513, 516 — присоединенное 486, 552 ----алгебры 552 -------Ли 553 — регулярное 483 — с простым спектром 490, 491 — самосопряженное 513 — сопряженное 512 — тавтологическое 499 Представления изоморфные 479 Преобразование аффинное 164, 165, 286, 288, 289, 330 — квазиэлементарное базиса модуля 400 — координат 66 — линейное 234 — Лоренца 166 — множества 154, 239 — ортогональное 159 — проективное 328—331 — элементарное системы линей- ных уравнений 49 ----строк матрицы 50, 57, 71 ----целочисленное 377 Приведение к главным осям 250 Присоединение корня многочле- на 409 Программирование линейное 300 Проективизация конуса 333 Проектирование 198 — ортогональное 200, 238 Проектор 244, 245 — ортогональный 248 Проекция вектора 196 ----ортогональная 225, 233 Произведение групп 507
Предметный указатель 585 — идеалов 438 — линейных операторов 349 — матриц 42 — матрицы на элемент поля 42 — отображений 10 — полупрямое 447 ----подгрупп 446 — представлений 490, 513, 514 ----тензорное 513 — прямое 381 ----групп 443 ----подгрупп 441, 442 — смешанное 553 — тензорное векторных прост- ранств 339, 340, 344 ----матриц 346 ----операторов 345, 346 — функций внешнее 364 ----симметрическое 359 Производная многочлена 103 Пространство аффинное 277, 285 ----евклидово 302 ----псевдоевклидово 309 — векторное (линейное) беско- нечномерное 62, 66, 208, 271 ----евклидово 221, 229, 246, 302 ----конечномерное 35, 38, 62, 63, 65,196, 270, 271, 396, 467 ----несчетномерное 68 ----псевдоевклидово 308 ----счетномерное 67, 68 — второе сопряженное 207 — касательное 539 ----к группе Ли 540, 546, 550 — Минковского 309 — над полем из q элементов 64, 65 — непрерывных функций 64 — представления 478 — проективное 325, 328 — сопряженное 206, 207 ----к евклидову 247 — строк длины п 35, 63, 65 — топологическое неприводи- мое 428 ----нётерово 428, 429 ----связное 542 — финитных последовательно- стей 67, 93, 208 — функций на группе 507, 508, 510 -------центральных 509, 510 ----на множестве со значения- ми в поле 35, 63, 205, 239, 452 — эрмитово 232, 233 Процесс ортогонализации Гра- ма—Шмидта 216, 225 Прямая в аффинном пространст- ве 278 — проективная 325 Пфаффиан 369, 371 Р Радикал алгебры 497 — кольца 407 — нильпотентный 406 Разделение орбит инвариантами 517, 521 Разложение многочлена на мно- жители 110,111,117 — полярное 254, 257 — элемента на простые множите- ли 121, 431, 432 Размерность аффинного алгебра- ического многообразия 430 ----пространства 278 — векторного пространства 63, 66 — представления 478 Разность симметрическая 19 — элементов 14 Разрешимость в квадратных ра- дикалах 474
586 Предметный указатель Ранг билинейной функции 211, 221 — квадратичной функции 212 — линейного оператора 240 — матрицы 68, 69, 71—73, 91, 205 — модуля 399 — свободной абелевой группы 373 — системы векторов 68 Расстояние между векторами 226 — между плоскостями 302 — между точками 302 — от вектора до подпространст- ва 226, 227 Расширение Галуа 468 — кольца 407, 418 ----алгебраическое 408 ----конечно порожденное 408 ----конечное 417 ----целое 417 — основного поля 342 — поля 411, 412, 501 ----алгебраическое 408 ----квадратичное 409, 420, 469 ----конечное 409, 410, 466, 527 ----простое 409 ----расщепимое 527 ----сепарабельное 419 Ребро выпуклого многогранника 298 Редукция многочлена по моду- лю р 124 Резольвента кубическая 140 Репер 278 Рефлексивность 28 Решение общее 53 Решетка 375, 376 Ряд абсолютно сходящийся 271 — композиционный 461 С Свертка 348 — тензора 347 Сигнатура квадратичной функ- ции 218 Символ Кронекера 206 — Лежандра 386 Симметричность 28 Симметрия центральная 288 Симплекс п-мерный 291, 299 Симплекс-метод 301 Система алгебраических уравне- ний 424, 425 — векторов 59 — координат аффинная 278 ----прямоугольная 302 — линейных уравнений 48, 89, 279, 280 -------неопределенная 53, 56 -------несовместная 49, 90 -------определенная 53, 54, 73 -------совместная 49, 55 -------(строго) треугольная 52 -------ступенчатая 52 — однородных линейных уравне- ний 55, 69, 209 — порождающих модуля 398 — порождающих (элементов) группы 173, 373 — решений фундаментальная 70 — точек общего положения 331 — элементов модуля линейно независимая 399 Системы векторов эквивалент- ные 68 — линейных уравнений эквива- лентные 49 След 348 — матрицы 206, 242 — элемента 416 Соотношения Плюккера 367, 368 Сопряжение комплексное 24 Спектр алгебры 427 Спуск индекса 350
Предметный указатель 587 Стабилизатор 179 — точки 455 Степень линейного оператора симметрическая 359 — многочлена 93 ----от п переменных 128 -------по переменной 129 — оператора внешняя 364 — представления внешняя 514 ----симметрическая 514 — пространства внешняя 361, 362, 368 ----симметрическая 354, 357 — расширения 409 — центральной алгебры с деле- нием 528 — элемента группы 166,169 Строка 15 — единичная 37 — нулевая 15 Сумма внешняя 381 — внутренняя 381 — линейных представлений 486 — матриц 42 — подпространств 193—195 — прямая алгебр 391 ----внешняя 351, 391 ----внутренняя 351, 391 ----— групп 381 ----колец 391, 406 ----модулей 397 ----подгрупп 380 ----подколец 391 ----подпространств 196, 351 ----пространств 351 Схема Горнера 97 Т Тело 523 — выпуклое 291—293 — платоново 308 Тензор 342 — ковариантный 352 — контравариантный 351 — кососимметрический 362 — метрический 350 — разложимый 342, 344, 355 — симметрический 356 — типа Ср, q) 346 Теорема Безу 97 — Бернсайда 489 — Веддербёрна 531 — Вильсона 102 — Гамильтона—Кэли 268, 403 — Гильберта о базисе идеала 405 ----о нулях 425 ----об инвариантах 518, 519,559 — Декарта 113 — Жордана—Гёльдера 461 — китайская об остатках 382 — Кронекера—Капелли 69 — Кэли 453 — Лагранжа 177 — Менелая 283 — Минковского—Вейля 297 — о гомоморфизме алгебр 390 ----групп 186,191 ----колец 388 ----модулей 398 — о примитивном элементе 527 — о ранге матрицы 91 — об определителе матрицы с углом нулей 83 — основная алгебры комплекс- ных чисел 106, 477 ----теории Галуа 471 — отделимости 293 — Ферма малая 178 — Фробениуса 530 — Чевы 282 — Штейница 299 — Эйлера 178, 253 Тождество Якоби 19, 41, 550 Топология Зарисского 427, 428
588 Предметный указатель Тор п-мерный 494 Точка аффинного пространства 277 — бесконечно удаленная 326 — внутренняя 291 — граничная 291 — крайняя 296, 300 Точки аффинно зависимые 279 ----независимые 279, 288 Транзитивность 28 Транспозиции смежные 174 Транспозиция 174 — элементов 79 Тривектор 361 Трисекция угла 476 У Угол между векторами 222 Удвоение куба 476 Умножение левое на элемент 239 — матриц 43, 45, 66, 204 — скалярное 210, 217, 221, 232 — тензорное векторных прост- ранств 343 Упорядочение лексикографиче- ское 130,131 Уравнение алгебраическое 99 — линейное 48 ----однородное 48 — разрешимое в радикалах 473, 474 -------квадратных 474 Ф Факторалгебра 389 Факторгруппа 182,191 Факторкольцо 387 Фактормножество 29 Фактормодуль 397 Факторпредставление 481 Факторпространство 397 Фигуры эквивалентные 162,164 Флаг многогранника 307 Форма билинейная см. функция билинейная — вещественная группы Ли 557 — жорданова матрицы операто- ра 264, 267 — квадратичная см. функция квадратичная — линейная см. функция линей- ная Формула Бернсайда 457 — Кардано 146 — Лагранжа интерполяционная 152, 207 — Муавра 26 — разложения определителя 86 — Тейлора 104, 208 Формулы Виета 101,133 — Крамера 89 Функция аффинно-квадратичная 309, 314 — аффинно-линейная 285, 300 — билинейная 209, 212 ----кососимметрическая 211, 212, 220, 221 ----невырожденная 211 ----симметрическая 211, 212, 214 -------положительно опреде- ленная 217 — дифференцируемая 538 — квадратичная 212, 250 ----, канонический вид 250 ----над полем Zp 219 ----невырожденная 212 ----, нормальный вид 216, 217 ----отрицательно определен- ная 217 ----положительно определен- ная 217, 218 ----эрмитова 231 -------, канонический вид 256
Предметный указатель 589 -------, нормальный вид 231 -------положительно опреде- ленная 232 — координатная 206 — линейная 75, 205, 206 — полилинейная (т-линейная) 77,338 ----кососимметрическая 78, 361 ----симметрическая 354, 358 — полуторалинейная 230 ----косоэрмитова 231 ----невырожденная 231 ----эрмитова 231 — центральная 509 — Эйлера 178, 392 X Характер представления 509 Характеристика поля 32,169 Ц Целая часть дроби 150 Центр алгебры ассоциативной 503 ----Ли 554 — аффинно-квадратичной функ- ции 310, 311 — группы 444 ----Ли 552 — квадрики 311, 313 — тела 523 — тяжести выпуклого множества 494 ----системы точек 281 Централизатор элемента 457 Цикл (в симметрической группе) 169 Циклы независимые 169 Ч Частное неполное 96 Частное (отношение) элементов 16 Четность перестановки 79 Число комплексное 24 ---, алгебраическая форма 24 ---, вещественная часть 24 ---, извлечение корня 26 ---, мнимая часть 24 ---, тригонометрическая фор- ма 25 — мнимое 24 — сочетаний 34 ---с повторениями 128 — Ферма 477 — целое алгебраическое 418 ---гауссово 119 — чисто мнимое 24 Член старший многочлена от п переменных 131 Э Экспонента группы 385 — оператора 273 Элемент алгебраический 407, 410 ---целый 417 — ведущий 50 — единичный (в группе) 15,156, 157 — единичный (в кольце) 18 — матричный представления 508 — нильпотентный 406, 496, 498 — нулевой (в группе) 14 — обратимый 20 — обратный (в группе) 15, 156, 157 ---правый 158 — обратный (в кольце) 20 — порождающий 171 — представимый в радикалах 473 — простой 121
590 Предметйый указатель Элемент противоположный (в группе) 14 — трансцендентный 407 Элементы абелевой группы ли- нейно независимые 373 — алгебраически зависимые 408, 421 — ассоциированные 118 — взаимно простые 120, 433 — группы, сравнимые по модулю подгруппы 175 — сопряженные 454 Эллипсоид 319 Эндоморфизм 184 — Фробениуса 415 Я Ядро билинейной функции 211 — гомоморфизма 184, 388 — линейного отображения 200 — неэффективности 452, 456
Эрнест Борисович Винберг Курс алгебры Издательство Московского центра непрерывного математического образования 119002, Москва, Большой Власьевский пер., 11. Тел. (499) 241-74-83 Подписано в печать 20.09.2010 г. Формат 60x90V16. Бумага офсетная. Печать офсетная. Печ. л. 37. Тираж 2000. Заказ 3303. Отпечатано с готовых диапозитивов в ГУП «Типография ,,Наука“». 199034, Санкт-Петербург, В. О., 9 линия, 12. Книги издательства МЦНМО можно приобрести в магазине «Математическая книга», Большой Власьевский пер., д. 11. Тел. (499) 241-72-85. E-mail: biblio@mccme.ru