Автор: Винберг Э.Б.  

Теги: математика   алгебра  

ISBN: 5-88417-133-1

Год: 1998

Текст
                    Э.Б.Винберг
НАЧАЛА
МКНМУ
МОСКВА • 1998
УРСС
МЦНМО


Эрнест Борисович Винберг, доктор физ.-мат. наук Винберг Э.Б. Начала алгебры. М.: МЦНМО, МК НМУ, «УРСС», 1998. — 192 с. Книга написана по мотивам лекций, прочитанных автором студентам 1 курса Математического колледжа НМУ в осеннем семестре 1992/93 учеб- учебного года. По сравнению с предыдущим изданием книга подверглась сущест- существенной переработке, что позволяет пользоваться ею как учебником. Издательство «УРСС». Ш672, г. Москва, ул. Новокасинская, 27/174. Лицензия ЛР № 063377 от 23.05.94 г. Подписано к печати 20.02.98. Формат 60x84/16. Печ. л. 12. Зак. N° %$ Отпечатано в ТОО «Типография ПЭМ». 121471, г. Москва, Можайское шоссе, 25. ISBN 5-88417-133-1 © Э.Б.Винберг,1998 © МЦНМО, МК НМУ, 1998 © Издание: «УРСС», 1998
Оглавление Предисловие 4 Глава 1. Алгебраические структуры 5 §1.1. Введение 5 §1.2. Абелевы группы 8 §1.3. Кольца и поля 11 §1.4. Подгруппы, подкольца и подполя 15 §1.5. Поле комплексных чисел 17 §1.6. Кольца вычетов 23 §1.7. Векторные пространства 29 §1.8. Алгебры 33 §1.9. Алгебра матриц 36 Глава 2. Начала линейной алгебры 42 §2.1. Системы линейных уравнений 42 §2.2. Базис и размерность векторного пространства 51 §2.3. Линейные отображения 62 §2.4. Определители 74 §2.5. Некоторые приложения определителей 88 Глава 3. Начала алгебры многочленов 92 §3.1. Построение и основные свойства алгебры многочленов . 92 §3.2. Общие свойства корней многочленов . 98 §3.3. Основная теорема алгебры комплексных чисел 106 §3.4. Корни многочленов с действительными коэффициентами 111 §3.5. Теория делимости в евклидовых кольцах 118 §3.6. Многочлены с рациональными коэффициентами 124 §3.7. Многочлены от нескольких переменных 128 §3.8. Симметрические многочлены 133 §3.9. Кубические уравнения 141 §3.10. Поле рациональных дробей 148 Глава 4. Начала теории групп 156 §4.1. Определение и примеры 156 §4.2. Группы в геометрии и физике 162 §4.3. Циклические группы 167 §4.4. Системы порождающих 173 §4.5. Разбиение на смежные классы 175 §4.6. Гомоморфизмы 183 Словарь сокращений 191
Предисловие Настоящая книга написана по мотивам 6 лекций, прочитанных ав- автором студентам 1 курса Математического колледжа НМУ в осен- осеннем семестре 1992/93 учебного года. Конспективное изложение этих лекций было опубликовано тогда же. Настоящая книга су- существенно отличается от него, во-первых, степенью подробности, позволяющее пользоваться ею как учебником, и, во-вторых, тем, что в ней добавлены начала линейной алгебры и некоторые дру- другие более мелкие разделы (но кое-что и выкинуто, например, фак- торкольца). При ее написании автор опирался на свой 35-летний опыт преподавания алгебры на механико-математическом факуль- факультете МГУ. Нумерация теорем, предложений, лемм, примеров, задач и за- замечаний производится в пределах каждого параграфа. Система ссы- ссылок поясняется следующими примерами: в тексте §3.2 «теорема 1* означает теорему 1 того же параграфа, «теорема 1.4» — теорему 4 §3.1, а «теорема 1.4.2» — теорему 2 §1.4.
Глава 1. Алгебраические структуры Когда вы знакомитесь с новыми людьми, вы прежде всего запоми- запоминаете их имена и внешность. После этого, встречаясь с ними в разных ситуациях, вы постепенно узнаете их лучше и некоторые из них, может быть, становятся вашими друзьями. В этой главе состоится лишь внешнее знакомство читателя с многими из алгебраических структур, рассматриваемых в курсе. Более глубокое их понимание будет приходить в процессе дальней- дальнейшего чтения книги и решения задач. §1.1. Введение Если вообще можно четко определить предмет алгебры, то это изу- изучение алгебраических структур — множеств с определенными в них операциями. Под операцией в множестве М понимается лю- любое отображение М х М -> М. т. е. правило, по которому из любых двух элементов множества М получается некоторый элемент этого же множества. Элементами множества М могут быть как числа, так и объекты другого рода. Хорошо известными и важными примерами алгебраических структур являются следующие числовые множества с операциями сложения и умножения: N — множество натуральных чисел, Z+ = N U {0} — множество неотрицательных целых чисел, Z — множество всех целых чисел, Q — множество рациональных чисел, 1R+ — множество неотрицательных действительных чисел, Ш — множество всех действительных (= вещественных) чисел. Подчеркнем, что операции сложения и умножения определены далеко не на всяком числовом множестве. Например, в множестве отрицательных чисел не определена операция умножения, так как произведение двух отрицательных чисел является положительным числом. В множестве иррациональных чисел не определены ни сло- сложение, ни умножение, так как сумма и произведение двух ирраци- иррациональных чисел могут быть рациональными. Приведем примеры алгебраических структур, состоящих ие из чисел.
Глава 1. Алгебраические структуры I Пример 1. Пусть М, N, Р — какие-то множества и f:N-+M, g:P-+N — какие-то отображения. Произведением, или композицией, ото- отображений /яд называется отображение /д:Р-+М, определяемое формулой (/<?)(<*) =/($(<*)) VaeP, т. е. результат последовательного выполнения сначала д, а потом /. В частности, при М = N = Р мы получаем таким образом операцию на множестве всех отображений множества М в себя. Эта операция дает много важных примеров алгебраических стру- структур, называемых группами. Так, например, согласно аксиоматике евклидовой геометрии произведение двух движений плоскости есть также движение. Рассматривая в множестве всех движений плос- плоскости операцию умножения, мы получаем алгебраическую струк- структуру, называемую группой движений плоскости. Пример 2. Множество векторов пространства с операциями сложения и векторного умножения является примером алгебраи- алгебраической структуры с двумя операциями. Кстати отметим, что ска- скалярное умножение векторов не является операцией в определенном выше смысле, так как его результат не есть элемент того же мно- множества. Подобные более общие операции также рассматриваются в алгебре, но мы пока не будем об этом думать. Все приведенные выше примеры являются естественными в том смысле, что они были открыты в результате изучения реально- реального мира и внутреннего развития математики. В принципе можно рассматривать любые операции в любых множествах. Например, можно рассматривать операцию в множестве Z+, сопоставляющую любым двум числам число совпадающих цифр в их десятичной за- записи. Однако лишь немногие алгебраические структуры предста- представляют реальный интерес. Следует уточнить, что алгебраиста интересуют только те свой- свойства алгебраических структур и составляющих их элементов, ко- которые могут быть выражены в терминах заданных операций. Этот подход находит свое выражение в понятии изоморфизма. Определение. Пусть М — множество с операцией о, а N — множество с операцией *. Алгебраические структуры (М, о) и
f ¦§1.1. Введение 7 (jV, *) называются изоморфными, если существует такое биектив- биективное отображение /: M-+N, что f(aob)=f(a)*f(b) для любых а, 6 € М. Само отображение / называется при этом изоморфизмом структур (Af, о) и (JV, *). Аналогичным образом определяется изоморфизм алгебраиче- алгебраических структур с двумя или большим числом операций. Пример 3. Отображение является изоморфизмом множества всех действительных чисел с операцией сложения и множества положительных чисел с опера- операцией умножения, поскольку па+Ь _ Вместо основания 2 можно было бы взять любое положительное основание, отличное от 1. Это показывает, что между изоморфны- изоморфными алгебраическими структурами может существовать много раз- различных изоморфизмов. Пример 4. Пусть М — множество параллельных переносов плоскости на векторы, параллельные какой-либо фиксированной прямой. Для любого действительного числа а обозначим через ta элемент множества М, представляющий собой перенос на вектор длины \а\ в одном из двух возможных направлений, определяемом знаком а. (Если а = 0, то ta — это тождественное преобразова- преобразование.) Легко видеть, что ta+b = tao f6, где о обозначает умножение (композицию) параллельных перено- переносов. Следовательно, отображение ан(о является изоморфизмом алгебраических структур (К,+) и (Af, о). Ясно, что если две алгебраические структуры изоморфны, то любое утверждение, формулируемое только в терминах заданных операций, будет справедливым в одной из этих структур тогда и только тогда, когда оно справедливо в другой. Например, операция о в множестве М называется коммута- коммутативной, если а о Ь = Ъ о а
8 Глава 1. Алгебраические структуры для любых о, Ъ € М. Если структура (М, о) изоморфна структуре (JV, *) и операция о в множестве М коммутативна, то и операция \ * в множестве N коммутативна. ' ! Таким образом, в принципе все равно, какую из изоморфных; друг другу алгебраических структур изучать: все они являются ' различными моделями одного и того же объекта. Однако выбор мо- модели может оказаться не безразличен для фактического решения какой-либо задачи. Какая-то определенная модель может предоста- предоставить для этого наибольшее удобство. Например, если какая-то мо- модель имеет геометрический характер, то она позволяет применить геометрические методы. §1.2. Абелевы группы Сложение действительных чисел обладает следующими свойства- свойствами: (С1) а + Ь = Ь + а (коммутативность); (С2) (а + Ь) + с = а + (Ь + с) (ассоциативность); (СЗ) а + О = а; (С4) а + (-а) = О. Из этих свойств чисто логическим путем могут быть получе- получены и другие свойства. Например, наличие операции вычетания, обратной к сложению, означает, что для любых а, Ь уравнение х + а = Ъ имеет единственное решение. Докажем это. Если с — решение данного уравнения, т. е. с Ч- а = Ь, то (с + а) + (—а) = Ь + (-а). Пользуясь свойствами (С2)—(С4), получаем: (с + а) + (—а) = с+(о + (—а)) = с + 0 = с. Таким образом, с = 6+(-а). Это показывает, что если решение существует, то оно единственно и равно Ь + (—а). С другой стороны, подстановка х = Ь + (—а) в уравнение показывает, что 6 + (—а) действительно является реше- решением: (Ь + (-а)) + а = Ъ + ((-а) + а) = Ь + (а + (-а)) = Ъ + 0 = Ъ.
§1.2. Абелевы группы Умножение действительных чисел обладает аналогичными свойствами: (У1) аЬ = Ъа (коммутативность); (У2) (ab)c = a(bc) (ассоциативность); (УЗ) а\ = а; (У4) аа-1 = 1 при а ф О. Свойства (У1)-(У4) лишь формой записи отличаются от свойств (С1)—(С4), с единственной оговоркой, что в (У4) мы пред- предполагаем, что а Ф О, в то время как в (С4) никаких ограничений на а нет. Поэтому приведенный выше вывод из свойств (С1)-(С4) операции вычитания, будучи переведен на язык умножения, даст вывод из свойств (У1)—(У4) операции деления, обратной к умно- умножению. Более точно, таким путем доказывается, что для любого а Ф 0 и любого Ъ уравнение ха = Ь имеет единственное решение, равное Ьа~1. Все эти рассуждения приведены здесь ие для того, чтобы чи- читатель узнал что-либо новое о действительных числах, а чтобы подвести его к важной для алгебры идее. Эта идея есть аксио- аксиоматический метод в алгебре. Он состоит в одновременном изуче- изучении целых классов алгебраических структур, выделяемых теми или иными аксиомами, представляющими собой какие-то свойства опе- операций в этих структурах. При этом совершенно не важно, как в каждом конкретном случае эти операции определяются. Коль ско- скоро выполнены аксиомы, справедлива и любая теорема, полученная логическим путем из этих аксиом. Конечно, лишь немногие системы аксиом действительно инте- интересны. Невозможно придумать «из головы» такую систему аксиом, которая привела бы к содержательной теории. Все системы акси- аксиом, рассматриваемые в современной алгебре, имеют длительную историю и являются результатом анализа алгебраических струк- структур, возникших естественным путем. Таковы системы аксиом груп- группы, кольца, поля, векторного пространства и другие, с которыми читатель познакомится в этом курсе. Свойства (С1)—(С4), а также (У1)—(У4) являются по сути дела системой аксиом абелевой группы. Перед тем как привести точные формулировки этих аксиом, скажем несколько слов о терминоло- терминологии. Названия и обозначения операций в алгебраических структу- структурах не имеют принципиального значения, однако чаще всего они называются сложением или умножением и обозначаются соответ-
10 Глава 1. Алгебраические структуры ствующим образом. Это позволяет использовать разработанную терминологию и систему обозначений, относящиеся к операциям над действительными числами, а также вызывает полезные ассо- ассоциации. Приведем вначале определение абелевой группы, использующее язык сложения. Определение 1. (Аддитивной) абелевой группой называется множество А с операцией сложения, обладающей следующими свойствами: 1) a + b = b + a Va, Ь (коммутативность); 2) (а + Ь) + с = а + (Ь + с) Va, 6, с (ассоциативность); 3) существует такой элемент О (нуль), что a + 0 = a Va; 4) для любого а существует такой элемент —а (противопо- (противоположный элемент), что а + (—а) = 0. Выведем некоторые простейшие следствия из этих аксиом. 1) Нуль единствен. В самом деле, пусть Oi и Ог — два нуля. Тогда Oi = Oi + 02 = 02. 2) Противоположный элемент единствен. В самом деле, пусть (—а)\ и (—а)г — два элемента, противоположных а. Тогда (-a)i = (-a)i + (a + (-aJ) = ((-a)! + a) + (~aJ = (-aJ. 3) Для любых a, b уравнение х + a = b имеет единственное решение, равное b + (—a). Доказательство см. выше. Это решение называется разностью элементов b и а и обозначается b — а. Пример 1. Числовые множества Z, Q, Ш являются абелевыми группами относительно обычной операции сложения. Пример 2. Множество векторов (плоскости или пространства) является абелевой группой относительно обычного сложения век- векторов. Пример 3. Последовательность из п чисел назовем строкой длины п. Множество всех строк длины п обозначим через W1. Определим сложение строк по правилу (ai,a2, ...,о„) + (&ъ &2> • • •, Ьп) = (oi + bi,O2 +62, ...,an + &n)- Очевидно, что множество Rn является абелевой группой относи- относительно этой операции. Ее нулем является нулевая строка 0=@,0,...,0).
§1.3. Кольца и поля И Пример 4. Множество всех функций, определенных на задан- заданном подмножестве числовой прямой, является абелевой группой относительно обычного сложения функций. Приведем теперь определение абелевой группы, использующее язык умножения. Определение 1'. (Мультипликативной) абелевой группой называется множество А с операцией умножения, обладающей следующими свойствами: 1) аЪ = Ъа Va, Ь {коммутативность); 2) (аЪ)с = а(Ьс) \/а,Ь,с (ассоциативность); 3) существует такой элемент е (единица), что ае = a Va; 4) для любого а существует такой элемент а (обратный элемент), что аа~1 = е. Единица мультипликативной абелевой группы иногда обозна- обозначается символом 1. Простейшие следствия аксиом абелевой группы, полученные выше на аддитивном языке, на мультипликативном языке выглядят следующим образом. 1) Единица единственна. 2) Обратный элемент единствен. 3) Для любых а, Ь уравнение ха = Ь имеет единственное ре- решение, равное ba~l. Оно называется частным от деления Ь на a (или отношением элементов Ъ и а) и обозначается —. Пример 5. Числовые множества Q* = Q \ {0} и R* = R \ {0} являются абелевыми группами относительно обычной операции умножения. В дальнейшем мы познакомимся с общим понятием группы (не обязательно абелевой), которое не включает требования коммута- коммутативности операции. §1.3. Кольца и поля В отличие от групп, кольца и поля — это алгебраические струк- структуры с двумя операциями, называемыми обычно сложением и умножением. Их аксиомы, как и аксиомы абелевой группы, под- подсказаны свойствами операций над действительными числами. При этом аксиомы кольца — это разумный минимум требований относительно свойств операций, позволяющий охватить и другие важные примеры алгебраических структур, из которых мы пока
12 Глава 1. Алгебраические структуры можем привести только уже упоминавшееся множество векторов пространства с операциями сложения и векторного умножения. Определение 1. Кольцом называется множество К с операци- операциями сложения и умножения, обладающими следующими свойства- свойствами: 1) относительно сложения К есть абелева группа (называемая аддитивной группой кольца К); 2) а(Ь + с) = ab + ас и (а + Ь)с = ас + be Vo,b,c (дистрибутивность умножения относительно сложения). Выведем некоторые следствия аксиом кольца, не входящие в чи- число следствий аксиом аддитивной абелевой группы, перечисленных в §1.2. 1) аО = Оа = 0 Va. В самом деле, пусть аО = Ь. Тогда Ь + Ь = аО + аО = а@ + О) = аО = Ь, откуда ь = ь - ь = о. Аналогично доказывается, что 0а = 0. 2) a(—b) = (—a)b = —ab Va, 6. В самом деле, ab + a(-6) = а(Ь + (-Ь)) = аО = 0 и, аналогично, аЬ + (—а)Ь = 0. 3) а(Ь — с) = аЬ—ас и (а — Ь)с = ас—be \/а,Ъ,с. В самом деле, а(Ь — с) + ас = а(Ь — с + с) = об и, аналогично, (а — Ь)с + Ьс = ас. Кольцо К называется коммутативным, если умножение в нем коммутативно, т. е. аЬ = Ьа Va, b, и ассоциативным, если умножение в нем ассоциативно, т. е. (аЬ)с = а(Ьс) Va,b,c Элемент 1 кольца (если такой существует) называется едини- единицей, если al = la = a Va. Так же, как в случае мультипликативной абелевой группы, доказы- доказывается, что в кольце не может быть двух различных единиц. Замечание 1. Если 1 = 0, то для любого а имеем а = al = aO = 0,
' §1.3. Кольца и поля 13 j т.е. кольцо состоит из одного нуля. Таким образом, если кольцо содержит более одного элемента, то 1 ф 0. Замечание 2. При наличии коммутативности из двух то- тождеств дистрибутивности, входящих в определение кольца, можно оставить лишь одно. Аналогичное замечание относится к опреде- определению единицы. Пример 1. Числовые множества Z,QR являются коммутатив- коммутативными ассоциативными кольцами с единицей относительно обычных операций сложения и умножения. Пример 2. Множество 2Z четных чисел является коммутатив- коммутативным ассоциативным кольцом без единицы. Пример 3. Множество всех функций, определенных на задан- заданном подмножестве числовой прямой, является коммутативным ас- ассоциативным кольцом с единицей относительно обычных операций сложения и умножения функций. Пример 4. Множество векторов пространства с операциями сложения и векторного умножения является некоммутативным и неассоциативным кольцом. Однако в нем выполняются следую- следующие тождества, которые в некотором смысле заменяют коммута- коммутативность и ассоциативность: ох4 + 6хо = 0 {антикоммутативность), (а х Ь) х с + (Ь х с) х о + (с х о) х 6 = 0 (тождество Якоби). Антикоммутативность очевидна из определения векторного умно- умножения. По поводу проверки тождества Якоби см. пример 8.2. Задача 1. Пусть М — какое-либо множество и 2м — множе- множество всех его подмножеств. Доказать, что 2м — кольцо относи- относительно операций симметрической разности А А В = (А\ В) U (В \ А) и пересечения, взятых в качестве сложения и умножения соответ- соответственно. Доказать, что это кольцо коммутативно и ассоциативно. Элемент о кольца с единицей (если такой существует) назы- называется обратным к элементу а, если аа~х = а~га = 1. (В коммутативном кольце достаточно требовать, чтобы аа~1 = 1.) Так же, как в случае мультипликативной абелевой группы, доказы- доказывается, что в ассоциативном кольце с единицей никакой элемент не
14 Глава 1. Алгебраические структуры может иметь двух различных обратных элементов. Элемент, имею-] щий обратный, называется обратимым. 1 Определение 2. Полем называется коммутативное ассоциа-! тивное кольцо с единицей, в котором всякий ненулевой элемент! обратим. I Замечание 3, Кольцо, состоящее из одного нуля, не считается'* полем. ; Примерами полей служат поле рациональных чисел Q и по- поле действительных чисел R Кольцо Z не является полем: в нем: обратимы только del. ' Задача 2. Доказать, что существует поле, состоящее из двух элементов. (Очевидно, что один из этих элементов должен быть нулем поля, а другой — его единицей.) В любом поле выполнено следующее важное свойство: ab = О ==> а = 0 или Ь = 0. В самом деле, если а Ф 0, то, умножая обе части равенства аЬ = 0 на а, получаем 6 = 0. Существуют и другие кольца, обладающие этим свойством, на- например, кольцо Z. Они называются кольцами без делителей нуля. В кольце без делителей нуля возможно сокращение равенств: ас = Ьс (или са = сЬ) ис^О => а = Ь. В самом деле, равенство ас = Ьс может быть переписано в виде (а — Ь)с = 0, откуда при с ф 0 получаем а — 6 = 0, т. е. а = Ь. Приведем пример коммутативного ассоциативного кольца с де- лнтелями нуля. Пример 5. В кольце функций на подмножестве X числовой прямой (см. пример 3) есть делители нуля, если только X содержит более одной точки. В самом деле, разобьем X на два непустых подмножества Х\ и Х% и положим /./-л-/1 прих€Хь Тогда !\%!гф 0, но /i/2 = 0. Отсутствие делителей нуля в поле означает, что произведение любых двух ненулевых элементов также является ненулевым эле- элементом. Ненулевые элементы поля К образуют абелеву группу относительно умножения. Она называется мультипликативной группой поля К и обозначается через К*.
Jjjl.4. Подгруппы, подкольца и подпол я 15 Г ~ I §1.4. Подгруппы, подкольца и подполя j Пусть М — множество с операцией о и N — какое-либо его под- подмножество. Говорят, что N замкнуто относительно операции о, если а, 6 € N => а о b G N. I В этом случае операция о определена в множестве N и превращает j его в некоторую алгебраическую структуру. Если операция о в М i обладает некоторым свойством, имеющим характер тождественного . соотношения (например, коммутативна или ассоциативна), то она, 1 очевидно, обладает этим свойством и в N. Однако другие свойства ; операции о могут не наследоваться подмножеством N. • . Так, подмножество аддитивной абелевой группы, замкнутое от- ! носительно сложения, не обязано быть абелевой группой, так как оно может не содержать нуля или элемента, противоположного какому-либо его элементу. Например, подмножество Z+ замкнуто относительно сложения в абелевой группе Z, но не является абе- абелевой группой, так как не содержит противоположных элементов ко всем своим элементам, кроме нуля. Определение 1. Подмножество В аддитивной абелевой груп- группы А называется подгруппой, если 1) В замкнуто относительно сложения; 2) a G В => -a G В; 3) О G В. Замечание. Легко видеть, что если В непусто, то из первых двух условий вытекает третье. Поэтому третье условие может быть заменено условием непустоты. Очевидно, что всякая подгруппа аддитивной абелевой группы сама является абелевой группой относительно той же операции. Пример 1. В аддитивной группе Ш имеется следующая цепочка подгрупп: ZcQ.CR Пример 2. В аддитивной группе векторов пространства мно- множество векторов, параллельных заданной плоскости или прямой, является подгруппой. В любой аддитивной абелевой группе имеются две «тривиаль- «тривиальные» подгруппы: всяг группа и подгруппа, состоящая только из нуля. Задача 1. Доказать, что всякая подгруппа группы Z имеет вид где п е Z+ (решение этой задачи можно найти в §4.3).
16 Глава 1. Алгебраические структуры; Приведем мультипликативный вариант предыдущего определе- определения. Определение 1'. Подмножество В мультипликативной абеле- вой группы А называется подгруппой, если j 1) В замкнуто относительно умножения; f 2) а€ В ==> а~1 6 В; { 3) ее В. 1 Пример 3. В группе R* имеется следующая цепочка подгрупп:! ] Соображения, с которых начинается этот параграф, могут быть i распространены на алгебраические структуры с несколькими опе- операциями. Таким образом мы приходим к следующим понятиям под- кольца и подполя. Определение 2. Подмножество L кольца К называется под- кольцом, если 1) L является подгруппой аддитивной группы кольца К; 2) L замкнуто относительно умножения. Очевидно, что всякое подкольцо само является кольцом отно- относительно тех же операций. При этом оно наследует такие свойства, как коммутативность и ассоциативность. Пример 4. Цепочка подгрупп аддитивной группы R, приведен- приведенная в примере 1, является в то же время цепочкой подколец. Пример 5. При любом п € Z+ множество пЪ является под- кольцом кольца Z. (Ср. задачу 1.) Задача 2. Доказать, что все конечные подмножества множе- множества М образуют подкольцо кольца Iм из задачи 3.1. Определение 3. Подмножество L поля К называется подпо- лем, если 1) L является подкольцом кольца К; 2) a G L, а ф О ==> а~х € L; 3) 1 € L. Очевидно, что всякое подполе является полем относительно тех же операций. Пример 6. Поле Q является подполем поля R Задача 3. Доказать, что подмножество L поля К является под- подполем тогда и только тогда, когда 1)L замкнуто относительно вычитания и деления; 2) L Э 0,1. Задача 4. Доказать, что поле Q не имеет нетривиальных под- полей (т. е. отличных от него самого).
§1.5. Поле комплексных чисел 17 §1.5. Поле комплексных чисел Подобно тому как невозможность деления в кольце целых чисел приводит к необходимости расширить его до поля рациональных чи- чисел, невозможность извлечения квадратных корней из отрицатель- отрицательных чисел в поле действительных чисел приводит к необходимости расширить его до большего поля, называемого полем комплексных чисел. Для того чтобы лучше понять, что такое поле комплексных чи- чисел, нужно прежде подумать над тем, что такое поле действитель- действительных чисел. Строгое построение поля действительных чисел обычно приводится в курсе анализа. Мы не будем входить в его детали. Од- Однако заметим, что имеется несколько определений действительных чисел: как бесконечных десятичных дробей, как сечений Дедекии- да множества рациональных чисел и т.д. Формально говоря, при этом получаются различные поля. Какое из них является «настоя- «настоящим» полем действительных чисел? Ответ иа этот вопрос состоит в том, что все они изоморфны и их следует рассматривать про- просто как различные модели одного и того же объекта, называемого полем действительных чисел. Наиболее удовлетворительным в подобной ситуации всегда является аксиоматический подход, при котором сначала форму- формулируются в виде аксиом свойства, которыми должен обладать искомый объект, а затем доказывается, что этими свойствами он определяется однозначно с точностью до изоморфизма, и с по- помощью какой-либо конструкции доказывается его существование. В случае поля действительных чисел такими аксиомами (помимо аксиом поля) могут быть аксиомы порядка, аксиома Архимеда и аксиома непрерывности. Замечание 1. Нетрудно доказать, что любые две модели поля действительных чисел не просто изоморфны, но между ними име- имеется единственный изоморфизм. (Доказательство сводится к тому, что всякий изоморфизм поля К на себя тождествен, и основано на соображении, что неотрицательные числа при любом изоморфизме должны переходить в неотрицательные, так как они и только они являются квадратами в поле R.) Это означает, что каждый элемент поля Ш имеет свою индивидуальность, т. е. в любой модели могут быть идентифицированы числа 10, \/2, тг ит.д. Дадим теперь аксиоматическое определение поля комплексных чисел.
18 Глава 1. Алгебраические структуры Определение. Полем комплексных чисел называется всякое поле С, обладающее следующими свойствами: 1) оно содержит в качестве подпол я поле Ж действительных чисел; 2) оно содержит такой элемент *, что г2 = — 1; 3) оно минимально среди полей с этими свойствами, т. е. если К С С — какое-либо подполе, содержащее R и г, то К — С. Замечание 2. Из равенства х2 + 1 = (x — i)(x + i) следует, что уравнение х2 = — 1 имеет в С ровно 2 решения: t и —г. Если какое- либо подполе содержит одно из этих решений, то оно содержит и другое. Теорема 1. Поле комплексных чисел существует и един- единственно с точностью до изоморфизма, переводящего все действительные числа в себя. Каждое комплексное число од- однозначно представляется в виде а + Ы, где а,Ь € М, a i — (фиксированный) элемент, квадрат которого равен —1. Доказательство. 1) Пусть С — какое-то поле комплекс- комплексных чисел (если оно существует). Рассмотрим его подмножество К =* {а + Ы : а,Ь€Ш}. Из свойств операций в поле и соотношения ъ2 — — 1 следует, что (п1 + bit) + (o2 + hi) = («г + а2) + (bi + Ьг)г, A) (а\ + bii)(a2 + hi) = (aia2 - Ь\Ьг) + (aih -f bia2)i. B) Решая соответствующие уравнения, находим также, что C) Формулы A)-D) показывают, что К — подполе. Так как К, оче- очевидно, содержит R и *, то К = С Таким образом, каждый элемент поля С представляется в виде а+Ы, где а, 6 € Ш. Докажем, что такое представление единственно. Пусть а\ + Ь\ъ = а2 + hi (<4,bi,O2,h € Щ- Тогда ai — аг = (h —
! §1.5. Поле комплексных чисел 19 Возводя это равенство в квадрат, получаем откуда а\ — а2 = 62 — ^1 = О, что и требовалось доказать. Если теперь С' — другое поле комплексных чисел и *' € С' — такой элемент, что (i'J = —1, то поскольку формулы A) и B) остаются справедливыми при замене i на г', отображение /:С-*-С', а + Ы^а + Ы' (a,b€R), является изоморфизмом поля С на поле С'. 2) Предыдущее исследование подсказывает, как доказать суще- существование поля комплексных чисел. Рассмотрим множество С пар (а, Ь), где а, Ъ G R. Определим в нем сложение и умножение по формулам (oi, 6i) + (a2,62) = («l + «2, Ьх + Ьг), подсказанным формулами A) и B). Очевидно, что С является абе- левой группой относительно сложения (ср. пример 2.3) и что умно- умножение дистрибутивно относительно сложения и коммутативно. Не- Непосредственной выкладкой проверяется ассоциативность умноже- умножения. Таким образом, С — коммутативное ассоциативное кольцо. Так как то элемент A,0) — единица кольца С. Формула D) подсказывает, как должен выглядеть элемент, обратный к (а, Ь) при а2 + b2 ^ 0. И, действительно, непосредственная проверка показывает, что (а,Ь)(а/(а2 + Ь2), -Ь/(а2 + Ь2)) = A,0). Следовательно, С — поле. Далее, имеем (ab0) + (a2,0) = (ai+a2H), (ai,0)(a2,0) = (aia2,0), т.е. операции над парами вида (а,0) сводятся к соответствую- соответствующим операциям над их первыми компонентами. Условимся отожде- отождествлять пару (а, 0) с действительным числом а. Тогда мы можем
20 Глава 1. Алгебраические структуры сказать, что построенное поле С содержит поле Ш. в качестве под- поля. Положим i = @,1); тогда *2 = (-1,0) = -1, а + Ы = (а,Ь) при о, 6 € К. Таким образом, каждый элемент поля С (однозначно) представля- представляется в виде а + Ы, где а, 6 € М. Поэтому, если какое-либо подполе К С С содержит Ш. и *, то К — С. Следовательно, С — поле комплексных чисел. Представление комплексного числа с € С в виде а+Ы (а, Ье1) называется его алгебраической формой; при этом число а называ- называется действительной частью числа с и обозначается через Пес, а число Ь называется мнимой частью числа с и обозначается через Imc. Комплексные числа, не являющиеся действительными, назы- называются мнимыми; числа вида Ы, где Ь 6 R называются чисто мнимыми. Если в первой части доказательства теоремы в качестве С взять то же поле С, а в качестве i' — элемент —i, то мы получим, что отображение с = а + Ы*-*с = а — Ы (a,6€R), является изоморфизмом поля С на себя. Оно называется комплекс- комплексным сопряжением. Вообще, изоморфизм какой-либо алгебраиче- алгебраической структуры на себя называется ее автоморфизмом. Таким образом, комплексное сопряжение с *-* с есть автоморфизм поля комплексных чисел. Очевидно, что с = с. Действительные числа характеризуются тем, что они совпа- совпадают со своими сопряженными. Отсюда следует, что для любого с ? С числа с + с и ее действительны. В самом деле, с-\-с — с-\-с = с-\-с, ё? = <й: — ее. Легко видеть, что если с — а + Ы (a, b € R), то с -I- g = 2о, сс = а2 + Ь2. E) Комплексные числа можно изображать точками или векторами на плоскости. А именно, число с = о -I- 6» изображается точкой или вектором с декартовыми координатами (а,Ь) (рис. 1). Иногда бывает удобнее представление комплексных чисел точками, иногда
til.5- Поле комплексных чисел 21 Рис. 1 Рис. 2 — векторами. При векторном представлении сложению комплекс- комплексных чисел соответствует обычное сложение векторов по правилу параллелограмма (или эквивалентному ему правилу треугольника). Отметим, что разность комплексных чисел сг и с\ предста- представляется вектором, соединяющим точки, изображающие с\ и С2 (рис. 2). Вместо декартовых координат на плоскости иногда бывает удоб- удобно использовать полярные. Это приводит к следующим понятиям. Модулем комплексного числа с — а + Ы называется длина век- вектора, изображающего это число. Модуль числа с изображается че- через \с\. Очевидно, что с = о + W \c\ = у/а2 + b?. Аргументом комплексного числа называется угол, образуемый соответствующим вектором с положительным направлением оси абсцисс. Аргумент определен с точностью до прибавления целого кратного 27г. Аргу- Аргумент числа О не определен. Аргумент чи- числа с обозначается через arg с. Пусть г и (р — модуль и аргумент чи- числа с (рис. 3). Очевидно, что а = г cos tp, Ь = г sin tpt °ТКУДЗ Рис. 3 с = r(cos ip + i sin ip). Такое представление комплексного числа называется его три- тригонометрической формой. Так как тригонометрическая форма дан-
22 Глава 1. Алгебраические структура ного комплексного числа определена однозначно с точностью до прибавления к (р целого кратного 2v, то при гх,Г2 > О ri(cosy?i + isintpi) = гг(со8у>2 + >*=*¦ П as Г2, V?l = ?>2 + 27ГЛ (Л € Z). Тригонометрическая форма комплексных чисел хорошо приспо< соблена к таким операциям, как умножение, деление, возведение в степень и извлечение корня. А именно, из формул для косинуса и синуса суммы двух углов следует, что | т. е. при умножении комплексных чисел их модули перемножаются,; а аргументы складываются. Отсюда вытекают следующие формулы, для деления и возведения в степень: ri(cos<pi -+•1sin031) n [г(cos^» + i sin^>)]n = rn(cosтир +1 sinn^) (формула Муавра). Извлечение корня тг-й степени из комплексного числа с = = г (cos (p + i sirup) есть решение уравнения zn = с. Пусть |z| = s, axg z = ф; тогда sn =s г, n^ = tp 4- 2я-Л (Л € Z), Следовательно, s = v^* (арифметическое значение корня), . <р + 2жк ф =- z. # ^ п Окончательно получаем пг- ( <р + 2тгк , . . ш + 2жк\ у/т I cos Н i sm — ). \ п п / Одинаковые значения z получаются по этой формуле тогда и толь- только тогда, когда в качестве к берутся числа, сравнимые по моду- модулю п. Отсюда следует, что при с Ф 0 уравнение zn = с имеет ровно п решений, получаемых, например, при к — 0,1,... ,п — 1. В геометрическом изображении эти числа располагаются в верши- вершинах правильного п-угольника с центром в начале координат (см. рис. 4, где изображен случай п — 6).
с i.e. Кольца вычетов 23 Рис. 4 §1.6. Кольца вычетов I расширения кольца целых чисел приводят к цепочке колец j ZCQCRCC, | в которую, как мы позже увидим, можно вставить и другие звенья ; (в том числе и продолжить ее вправо). Кольца вычетов определяют- \ ся также на основе целых чисел, но идея их определения совершен- [ но иная. Это часто используемый в математике прием «склейки» — образования фактормножества по отношению эквивалентности. Пусть М — какое-нибудь множество. Всякое подмножество R С М х М называется отношением на множестве М. Если (а, Ъ) G R, то говорят, что элементы о и 6 находятся в отношении R, и пишут aRb. Примеры отношений. \. М — множество людей; aRb, если а знает Ь. 2. М — то же; aRb, если а я b знакомы. 3. М — то же; aRb, если а и Ь живут в одном доме. 4. М = R; aRb, если a t^b. 5. М — множество окружностей на плоскости; aRb, ес- если окружности а и b равны, т. е. переводятся одна в другую движением. Отношение R называется отношением эквивалентности, ес- если выполняются следующие свойства: 1) aRa (рефлексивность); 2) aRb ==> bRa (симметричность); 3) aRb и bRc ==> aRc (транзитивность). Из приведенных выше примеров отношений только третье и пятое являются отношениями эквивалентности: первое и четвертое не симметричны, а второе симметрично, но не транзитивно.
24 Глава 1. Алгебраические структуры Отношение эквивалентности обычно записывается как а. ~ Ы R I или просто а ~ Ь. I Пусть R — отношение эквивалентности на множестве М. Для? каждого а € М положим j Из свойств отношений эквивалентности легко выводится, что а €! € R(a) и j R(a) П R(b) фа => R(a) = R(b). I Таким образом, подмножества Ща) образуют разбиение множества; М, т. е. покрывают его и попарно не пересекаются. Они называ-j ются классами эквивалентности R. Два элемента эквивалентны; тогда и только тогда, когда они принадлежат одному классу. 1 Множество, элементами которого являются классы эквивалент-: ности R, называется фактормножеством множества М по отно- отношению эквивалентности R и обозначается через M/R. Отображе- Отображение М -f M/R, а м- Л(а), называется отображением факторизации. Так, в третьем из приведенных выше примеров классы экви- эквивалентности — это множества жильцов одного дома. Фактормно- Фактормножество отождествляется с множеством домов, а отображение фак- факторизации — это отображение, сопоставляющее каждому человеку дом, в котором он живет. В пятом примере классы эквивалентности — это множества окружностей одного радиуса, фактормножество отождествляется с множеством положительных чисел, а отображе- отображение факторизации — это отображение, сопоставляющее каждой окружности ее радиус. Пусть в множестве М задана некоторая операция (х,у) *-+ »-> х*у. Отношение эквивалентности R в множестве М называется согласованным с операцией *, если а ~ а', Ь ~ У => о * Ь ~ а' * Ь'. я я я В этом случае на фактормножестве M/R также можно определить операцию * по правилу R(a) * R(b) = R(a * b). F)
igl.6. Кольца вычетов 25 В словесном выражении это определение выглядит так: чтобы | произвести операцию над какими-либо двумя классами эквивалент- эквивалентности, надо выбрать из них произвольных представителей, произве- произвести операцию над ними и взять тот класс, в котором будет лежать получившийся элемент. То, что этот класс не будет зависеть от выбора указанных представителей, как раз и обеспечивается со- согласованностью отношения эквивалентности с операцией. Очевидно, что все свойства операции в М, имеющие характер тождества, например, коммутативность и ассоциативность, насле- наследуются определенной таким образом операцией в M/R. То же са- самое можно сказать о наличии нуля (единицы) и противоположного (обратного) элемента. Более точно, если, скажем, операция в М называется сложением и в М имеется нулевой элемент 0 относи- относительно этой операции, то Л@) — нулевой элемент в M/R; если —о — элемент, противоположный элементу а в М, то R{—а) — элемент, противоположный элементу R(a) в M/R. Приступим теперь к построению колец вычетов. Пусть п — фиксированное натуральное число. Рассмотрим в множестве Z це- целых чисел следующее отношение сравнимости по модулю п: а сравнимо с Ь по модулю п (обозначение: а = Ь (mod n)), если а — Ъ делится на п или, что равносильно, если а и Ь дают одинако- одинаковые остатки при делении на п. Очевидно, что это отношение эквивалентности, причем классы эквивалентности могут быть занумерованы числами 0,1,..., п — 1 таким образом, что r-й класс состоит из всех целых чисел, дающих при делении на п остаток г. Класс эквивалентности, содержащий целое число а, называется вычетом числа а по модулю п и обозначается через [а]п или просто через [а], если ясно, какое п имеется в виду. Фактормножество множества Z по отношению сравнимости по модулю п обозначается через Zn. Мы можем написать, что но следует понимать, что каждый элемент множества Zn может быть обозначен по-разному. Так, элемент [1]п может быть с таким же успехом обозначен как [2п + 1]п, [— (п — 1)]„ и т.д. Докажем теперь, что отношение сравнимости по модулю п со- согласовано с операциями сложения и умножения в Z. Пусть а = a! (mod n), b s b' (mod n).
26 Глава i. Алгебраические структур» Тогда и, аналогично, (mod п) аЬ s а'Ь = а'Ь' (mod n). Таким образом, мы можем определить в множестве Zn операции сложения и умножения по формулам | М« + М« = [<* + &]«, [«]«$» = М>1« j (справедливым для любых о, 6 € Z). Тем самым Ъп превращается к коммутативное ассоциативное кольцо с единицей. Оно называется* /сольцой вычетов по модулю п. | Пример 6. Ниже приведены таблицы сложения и умножения! в кольце Z&. При этом ради простоты квадратные скобки в обозна- обозначениях элементов этого кольца опущены. , + 0 1 2 3 4 0 0 1 2 3 4 1 1 2 3 4 0 2 2 3 4 0 1 3 3 4 0 1 2 4 4 0 1 2 3 X 0 1 2 3 4 0 0 0 0 0 0 1 0 1 2 3 4 2 0 2 4 1 3 3 0 3 1 4 2 4 0 4 3 2 1 Мы видим, в частности, что элементы 2 и 3 взаимно обратны, а элемент 4 обратен сам себе. Пример 7. Вычислим [2]100 в кольце Z125: [2]7 = [128] = [3], [2]35 = ([2]7M = [З]5 = [243] = [-7], [2]50 = [2]35([2]7J[2] - [-7][3]2[2] = [-126] = [-1], [2]100 = ([2]50J = [1]. Полученный результат означает, что 2100 = 1 (mod 125). Отсюда нетрудно вывести, что 2100 s 376 (mod 1000), т. е. десятичная запись числа 2100 оканчивается на 376.
Ц.6. Кольца вычетов 27 Кольцо Zn обладает всеми свойствами поля, кроме, быть мо- [, обратимости ненулевых элементов. Очевидно, что Z2 — поле из двух элементов, о котором шла речь в задаче 3.2. Рассмотрение приведенной выше таблицы умножения в кольце Zs показывает, что Zs — также поле. С другой стороны, Z4 — не поле, так как элемент [2] в этом кольце не обратим. 1 Теорема 1. Кольцо Zn является полем тогда и только то- ! гда, когда п — простое число. Доказательство. 1) Пусть п составное, т. е. n = kl, где I к k, I < п. Тогда [&]„, [/]„ ф О, но [k]n[l]n = [kl]n = [п]п = 0. Таким образом, в кольце Zn имеются делители нуля и, значит, оно не является полем. 2) Пусть, напротив, п — простое число и [а]п ф 0, т.е. а не делится на п. Будем искать элемент, обратный к [а]п, подбором, т. е. умножая [а]п по очереди на все элементы кольца. Получим элементы [0]п, [а]п, [2а]п,...,[(«- 1)«3п. G) Докажем, что все они различны. В самом деле, если [ка]п = [1а]п @ ^ к < I < п — 1), то [(/ — к)а]п = 0, т. е. (/ — к)а делится на п, что невозможно, так как ни / — к, ни а на п не делятся. (Здесь мы использовали то, что п простое.) Следовательно, в ряду элементов G) встречаются все элементы кольца Zn, в том числе [1]„, а это и означает, что элемент [а]п обратим. В полях вычетов мы встречаемся с новым явлением, не имев- имевшим места в числовых полях. А именно, в поле Zn (n простое) выполняется равенство 1 + 1 + ... + 1 = 0. (8) п (Конечно, это верно и в кольце Zn при любом п.) Это приводит к некоторым особенностям алгебраических преобразований в этом поле, о которых мы скажем ниже. Пусть, вообще, К — произвольное поле. Наименьшее нату- натуральное п, для которого в поле К выполняется равенство (8), назы- называется характеристикой этого поля; если такого п не существует,
28 Глава 1. Алгебраические структур* то говорят, что К — поле нулевой характеристики. Таким образом, Zn (n простое) — поле характеристики п, а числовые поля им© ют нулевую характеристику. Характеристика поля iif-обозначаете* через char К. Если char К = п, то для любого а е К имеем 1 а + а + ... + а = A + 1 + ... + 1)а = Оа = 0. 1 N w ' » w ' | П П : Характеристика поля, если она положительна, всегда является простым числом. В самом деле, пусть char К = п = Ы A < к, I < < п). Тогда i 1 + 1 + ... + 1 = A + 1 + ... + 1) A + 1 + ... + 1) = 0 I к * . ] и, значит, либо 1 + 1 + ... 4- 1 = 0, либо 1 + 1 + ... + 1 = 0, чт<й к I % противоречит определению характеристики. > Большинство формул элементарной алгебры справедливы в лю- любом поле, так как при их выводе используются только те свойств»- операций сложения и умножения, которые входят в число аксиом! поля или являются их следствием. Особенность полей положитель| ной характеристики проявляется только в тех формулах, которые содержат умножение или деление на натуральные числа. ¦ Рассмотрим, например, формулу * (а + ЬJ = в2 + 2а&+62. Она справедлива в любом поле, если понимать 2аЬ как аЪ + аЬ. Однако в поле характеристики 2 она принимает более простой Более общо, в поле характеристики п справедливо тождество (а + Ь)п = ап + Ьп. В самом деле, по формуле бинома Ньютона к=0 Однако при 0 < к < п
gl.7. Векторные пространства 29 (число сочетаний из п по к), очевидно, делится на п. Следова- Следовательно, все слагаемые формулы бинома Ньютона, кроме первого и последнего, в рассматриваемом случае равны нулю. Задача. Вывести отсюда, что в поле Zn (n простое) ап — а для любого а. (Другое доказательство последнего факта, называемого малой теоремой Ферма, будет дано в §4.4.) Хуже обстоит дело, когда приходится делить на натуральное число, например, когда мы находим выражение для аЬ из выписан- выписанной выше формулы квадрата суммы. Для того чтобы придать смысл этому делению в любом поле, можно рассматривать умножение на натуральное число к как умножение на элемент 1 ¦+¦ 1 ¦+¦ -?\. к данного поля; тогда деление на к можно понимать как деление на этот элемент. Однако если к делится на характеристику поля, то этот элемент равен нулю и деление невозможно. Так, формула для решения квадратного уравнения, содержащая деление на 2, применима в указанном смысле в любом поле харак- характеристики ф 2, но в поле характеристики 2 она не работает. Пример 8. Решим квадратное уравнение х2 + х - 1 = О в поле Zn- По обычной формуле находим: хг,2 « щ • Так как [5] = [16] = [4]2, то можно считать, что у/Щ = [4] (одно из значений квадратного корня). Следовательно, §1.7. Векторные пространства Векторы, рассматриваемые в элементарной геометрии, можно не только складывать, но и умножать на числа. Анализ свойств этих двух операций приводит к понятию векторного пространства. Прежде чем мы дадим определение, необходимо отметить, что здесь мы выходим за рамки того понимания операции на множе- множестве, которое принималось до сих пор. Умножение вектора на число
30 Глава 1. Алгебраические структуры не есть операция над двумя элементами одного и того же множе- множества. Это операция, которая каждой паре (число, вектор) сопоста- сопоставляет вектор. В общем определении векторного пространства дело обстоит так же, но действительные числа заменяются элементами произвольного (но фиксированного) поля. Определение 1. Векторным пространством над полем К называется множество V с операциями сложения и умножения на элементы поля К, обладающими следующими свойствами: 1) относительно сложения V есть абелева группа; 2) Л(а + Ь) = Ла + ХЬ VA € К, а, Ь € V; 3) (Л + ц)а = Ха + ца VA,/* € К, а € V; 4) (\ц)а = Л(^а) VA,/* € К, а е V; 5) 1а - а Vo € V. Элементы векторного пространства называются векторами. Элементы поля К, в отличие от векторов, мы будем иногда, допуская вольность речи, называть числами, даже если К не есть числовое поле (т.е. подполе поля комплексных чисел). Векторы в смысле элементарной геометрии мы будем отныне называть геометрическими векторами. Операции над ними удо- удовлетворяют всем аксиомам векторного пространства, что, собствен- собственно, и послужило основой для данного выше определения. Простран- Пространство геометрических векторов евклидовой плоскости (соотв. трех- трехмерного евклидова пространства) мы будем обозначать через Е2 (соотв. через Е3). Подчеркнем, что это векторное пространство над полем Ш. Приведем другие важные примеры векторных про- пространств. Пример 1. Множество Кп строк длины п с элементами из по- поля К является векторным пространством над К относительно опе- операций, определенных формулами (аьа2, ...,оя) + (bi,l>2,...,bn) = (ei 4- bua2 + Н, ¦¦ • ,&п +Ьп), Л(а1,а2,...,а„) = (AabAa2,..., Аа„). Пример 2. Множество F(X, К) всех функций на множестве X со значениями в поле К является векторным пространством относительно обычных операций над функциями: Пример 3. Пусть К — подполе поля L. Тогда L можно рассма- рассматривать как векторное пространство над К, определив умножение
§1.7. Векторные пространства 31 элементов из L на элементы из К просто как умножение в L. В частности, поле С есть в этом смысле векторное пространство над К- Укажем некоторые следствия аксиом векторного пространства, не являющиеся следствием только аксиом абелевой группы. Все они доказываются аналогично похожим на них следствиям аксиом кольца (см. §1.3). Символом 0 обозначается как нуль поля К, так и нулевой вектор, т. е. нуль аддитивной группы V; читатель увидит, что это не приводит к путанице. 1) АО = О VA € К (здесь 0 — нулевой вектор). 2) А(-а) = -Аа VA € К, а € V. 3) А(а - Ь) = Аа - ХЬ VA € К, а, Ъ € V. 4) Оа = 0 Va € V (здесь О слева — число, справа — вектор). 5) (-l)a = -a Va € V. 6) (А - ц)а = Ха-/ла VA,/* € К, а € V. Определение 2. Подмножество U векторного пространства V называется подпространством, если 1) U является подгруппой аддитивной группы V; 2) а е U => Хае U VXeK. Замечание. В определении подгруппы требуется, чтобы a € U ==> —а € U. При наличии условия 2) это свойство выполняется автоматически, так как —а = (—1)а. Подпространство векторного пространства само является век- векторным пространством относительно тех же операций. Пример 4. В пространстве Е3 множество векторов, парал- параллельных заданной плоскости или прямой, является подпростран- подпространством. Пример 5. В пространстве F(X, К) всех функций на заданном промежутке X числовой прямой множество непрерывных функций является подпространством. В каждом векторном пространстве V есть два «тривиальных» подпространства: само пространство V и нулевое подпространство (состоящее из одного нулевого вектора). Последнее мы будем обо- обозначать символом 0. Определение 3. Векторные пространства V и U над полем К называются изоморфными, если существует такое биективное
32 Глава 1. Алгебраические структуры отображение что 1) /(а + Ъ) = /(а) + /F) Va, 6 € V; 2) /(Ло) = Л/(а) VA € А\ а € V. Само отображение / называется при этом изоморфизмом про- странств V и G. ; Как мы увидим в §2.2, описание векторных пространств с точ- точностью до изоморфизма весьма просто. В частности, все так назы- называемые конечномерные векторные пространства, с которыми мы в основном и будем иметь дело в этом курсе, изоморфны простран- пространствам Кп. Ключевым понятием этой теории является понятие ба- базиса. Всякое выражение вида Ajai + A2a2 + ... + Хпап (Ль Л2,..., Лп € К) называется линейной комбинацией векторов ai,O2,...,вп € V. Говорят, что вектор Ь линейно выражается через векторы ai,a2,..., an, если он равен некоторой их линейной комбинации. Определение 4. Система векторов {ei,e2,-• • ,еп} С V на- называется базисом векторного пространства V, если каждый вектор a € V единственным образом линейно выражается че- через ei,e2, • • • ,еп. Коэффициенты этого выражения называются координатами вектора а в базисе {ei,e2,... ,еп}. Пример 6. Из геометрии известно, что любые два неколине- арных вектора ei,e2 составляют базис пространства Е2 (рис. 5). Аналогично, любые три некомпланарных вектора составляют базис пространства Е3. Рис. 5
8. Алгебры 33 Пример 7. Единичные строки ех = A,0,...,0), е2 = @,1,...,0), оставляют базис пространства Кп. Координатами строки а = |= (ai,O2,... ,оп) в этом базисе служат числа ai,a2,... ,ап. Ко- Конечно, в пространстве Кп имеются и другие базисы. | Пример 8. В качестве базиса поля С как векторного простран- пространства над R (см. пример 3) можно взять {1,*}. Координатами ком- комплексного числа в этом базисе служат его действительная и мнимая |части. Предложение 1. Всякое векторное пространство V над по- полем К, имеющее базис из п векторов, изоморфно простран- пространству Кп. Доказательство. Пусть {ei,e2, -. • ,е„} — базис про- пространства V. Рассмотрим отображение /: V->Kn, сопоставляющее каждому вектору строку из его координат в ба- базисе {ei,е2,... ,еп}. Очевидно, что это биективное отображение. Далее, если а — aiei + a2e2 + ... + anen, b = Ь\ег + &2б2 + • • • + bnen, то (a2 Xa = (Aa)ei + (Aa2)e2 + ... 4- (Aan)en. Отсюда следует, что / — изоморфизм. Пример 9. Пространство Е2 (соотв. Е3) изоморфно R2 (со- (соотв. К3). §1.8. Алгебры Ввиду крайней простоты своего строения векторные пространства не интересны сами по себе, но они служат необходимым фоном
34 Глава 1. Алгебраические структуры для многих алгебраических (и не только алгебраических) теорий. Так, комбинируя понятия векторного пространства И кольца, мы приходим к важному понятию алгебры. Определение. Алгеброй над полем К называется множество А с операциями сложения, умножения и умножения на элементы поля К, обладающими следующими свойствами: 1) относительно сложения и умножения на элементы поля А есть векторное пространство; 2) относительно сложения и умножения А есть кольцо; 3) (Аа)Ь = а(АЬ) = А(о6) VA € К, а, Ъ € А. Замечание. Термин «алгебра», употреблявшийся нами до сих пор только как название одного из разделов математики, в этом определении имеет, естественно, другой смысл. Пример 1. Всякое поле L, содержащее К в качестве подпол я, можно рассматривать как алгебру над К. В частности, поле С есть алгебра над Ш. Пример 2. Пространство Е3 есть алгебра относительно опера- операции векторного умножения. Пример 3. Множество F(X, К) функций на множестве X со значениями в поле К (см. пример 7.2) является алгеброй над К относительно обычных операций сложения и умножения функций и умножения функции на число. Эта алгебра коммутативна, ассо- ассоциативна и обладает единицей (каковой является функция, тожде- тождественно равная единице). Задача. Доказать, что кольцо 2м из задачи 3.1 превращается в алгебру над полем Z2, если определить в нем умножение на элементы этого поля по правилам 0, 1А = А У А е 2м. Предположим, что алгебра А обладает базисом {ei, е%,... , как векторное пространство над К, и пусть a = a\ex + a2e2 + ... + anen = b = 61 ei + Ьч&2 + ... + bnen = *=i — два произвольных элемента этой алгебры. Тогда из дистрибу- дистрибутивности умножения относительно сложения и свойства 3) в опре-
$1.8. Алгебры 35 делении алгебры следует, что ab = Это показывает, что умножение в алгебре А полностью определя- определяется произведениями базисных векторов. Если умножение базисных векторов коммутативно, т. е. е*ез ~ езе* v*>i> то и умножение в алгебре А в целом коммутативно. В самом деле, для любых a, b € А мы тогда в предыдущих обозначениях получа- получаем: ab = ^2aibi(eiei) ~ Х?2ьз<ц{е]ег) = Ьа. id id Аналогично доказывается, что если умножение базисных век- векторов ассоциативно, т.е. то и умножение в алгебре А в целом ассоциативно. С другой стороны, если V — какое-то векторное пространство с базисом {ei, в2,..., еп} и еу («, j = 1,2,... ,п) — произвольные векторы этого пространства, то мы можем определить операцию умножения в V по правилу id и тем самым превратить V в алгебру. Пример 4. Поле С как алгебра над R задается следующей та- таблицей умножения базисных векторов: X 1 i 1 1 i ъ i -1 Проверка коммутативности и ассоциативности умножения в С сво- сводится к тривиальной проверке коммутативности и ассоциативности умножения элементов 1 и ?.
36 Глава 1. Алгебраические структуры Пример 5. В ортонормированном (т. е. состоящее из ортого- нальных единичных векторов) базисе {г, j, к} пространства Е3 та-? блица векторного умножения выглядит следующим образом': | X i 3 к г 0 -к 3 3 к 0 —г к -з i 0 Это умножение антикоммутативно и удовлетворяет тождеству Яко- би (см. пример 3.4). Последнее тождество достаточно проверить для базисных векторов, что не составляет труда (проделайте это!). Пример 6. Алгебра кватернионов Н задается базисом; {l,i,j,k} со следующей таблицей умножения: X 1 г 3 к 1 1 г 3 к ъ г -1 -к 3 3 3 к —1 —i к к -з г -1 Эта алгебра ассоциативна (проверьте это!), но не коммутативна. Она содержит в качестве подалгебры (см. определение ниже) алге- алгебру комплексных чисел. Позже мы увидим, что в алгебре Н, как/ в поле, всякий ненулевой элемент обратим. Таким образом, это «некоммутативное поле». Подмножество алгебры называется подалгеброй, если оно одно- одновременно является подпространством и подкольцом. Отображение алгебр называется изоморфизмом, если оно одновременно являет- является изоморфизмом векторных пространств и колец. §1.9. Алгебра матриц Матрицей размера т х п над полем К называется прямоугольная таблица из элементов поля К, имеющая т строк и п столбцов. В буквенной записи элементы матрицы обычно обозначаются одной и той же буквой с двумя индексами, первый из которых есть номер
§1,9. Алгебра матриц 37 строки, а второй — номер столбца: /аи а\2 А = I °21 °22 \Ornl Иногда ради краткости мы будем писать просто А = (а^). Суммой матриц А = (aij) и В = F^) одинакового размера называется матрица Произведением матрицы А = (а^) на элемент Л € А" называется матрица ЛА = (Any). Относительно этих двух операций все матрицы размера тхп обра- образуют векторное пространство, которое мы будем обозначать Ктхп. По сути дела оно не отличается от пространства строк К™71. Спе- Специфика матриц проявляется при определении их умножения. Произведением матрицы А = (ац) размера т х п и матрицы В = (bjk) размера п х р называется матрица АВ — (сце) размера т х р, элементы которой находятся по формулам (Смысл этого определения выяснится в §2.3) Подчеркнем, что произведение двух матриц определено только тогда, когда их размеры согласованы, а именно, когда число столб- столбцов первой матрицы равно числу строк второй. Пример 1. 2 + 00 + 2-1) A-(-1)+0-5 + 2 1) \_ (-!)• 0 + 3 1) @- (-!) + (-!) -5 + 3 • 1) J ~ =(-)•
38 Глава 1. Алгебраические структуры Пример 2. /cos a — sina\ /cos/3 —si sin а cosay ysin/3 cos 0 ЗЧ _ J ~~~ _ /cos a cos 0 — sin a sin 0 — cos a sin 0 — sin a cos 0\ _ ~ ^sinacosj3 + cos at sin/3 — sin a sin 0 + cos a cos 0) ~ _ /cos(a + 0) —sin(a + 0)\ \ sin(a + 0) cos(o; + 0)J" Умножение матриц ассоциативно в том смысле, что (АВ)С = А(ВС), (9) если только размеры матриц А, В, С согласованы таким образом, что указанные произведения имеют смысл. В самом деле, пусть (АВ)С = (ии), А(ВС) = (««). Имеем тогда: ' 3,к так что ttj/ = и»;. Матрица размера п хп называется квадратной матрицей по- порядка п. Квадратная матрица имеет две диагонали. Одна из них, ведущая из левого верхнего угла в правый нижний, называется главной диагональю, или просто диагональю, а другая — побоч- побочной диагональю. Квадратная матрица называется диагональной, если все ее элементы, находящееся вне (главной) диагонали, рав- равны нулю. Умножение на диагональные матрицы выглядит особенно просто: °\ /611 bl2 *2 Ib \0 aj
S1.9. Алгебра матриц 39 (каждая строка второй матрицы умножается на соответствующий диагональный элемент первой матрицы) и, аналогично, /an О21 <*2n ат2 ¦•• <hrnn/ 62 0 0\ bn) anbi ... ain6n\ ; (каждый столбец первой матрицы умножается на соответствующий диагональный элемент второй матрицы). Диагональная матрица вида Е 0\ 1/ называется единичной матрицей. Из предыдущих формул следует, что для любой матрицы А размера т х п АЕ = А, = А, (Ю) где Е в первом случае обозначает единичную матрицу порядка л, а во втором — единичную матрицу порядка т. Следующие очевидные свойства связывают операцию умноже- умножения матриц с другими операциями: А(В + С) = АВ + АС, (А + В)С = АС + ВС, A1) (ХА)В = А(ХВ) = Х(АВ) VA 6 К. A2) (Как и в свойстве ассоциативности, здесь предполагается, что раз- размеры матриц согласованы таким образом, что все указанные дей- действия имеют смысл.) Сумма и произведение квадратных матриц одного и того же порядка п определены и также являются квадратными матрицами порядка п. Свойства (9)—A2) показывают, что все квадратные ма- матрицы порядка п образуют ассоциативную алгебру с единицей. Мы будем обозначать ее Ln(K). Отметим некоторые «отрицательные» свойства алгебры Ln{K) при п > 2. (Алгебра L\(K) есть поле К.)
40 Глава I. Алгебраические структуры 1) Алгебра Ln(K) не коммутативна. При п — 2 это можно продемонстрировать на следующем примере: /1 0\ /0 1\ _ /0 1\ /0 1\ A 0\ _ /0 0\ \о о) \о о) - \о о) ' ^о о) \о о) ~ \о о) • Аналогичные примеры можно привести и при п > 2. 2) Алгебра Ln(K) имеет делители нуля. Это показывает, на- например, второе из приведенных выше равенств. Более того, суще- существуют такие ненулевые матрицы, квадрат которых равен нулю, например, о Л2 /о i\ /о Л/о о\ о оу ~ [о о) [о о) ~ \^о оу ¦ 3) Не всякий ненулевой элемент алгебры Ln(K) обратим. Это следует из наличия делителей нуля и того факта, что делитель нуля не может быть обратим (см. доказательство отсутствия делителей нуля в поле, данное в §1.3). Так, например, матрицы ( п « j необратимы в -L2(iiQ. /1 0\ (р о) и Задача 1. Матрица Eij, у которой на (i, j)-m месте стоит 1, а на остальных местах — нули, называется матричной единицей (не путать с единичной матрицей!). Матричные единицы Е^ (i,jf = 1,...,п) образуют базис векторного пространства Ln(K). Выпи- Выписать таблицу умножения алгебры Ln(K) в этом базисе. Задача 2. Матрицы вида ХЕ (Л € К) называются скалярны- скалярными. Очевидно, что всякая скалярная матрица перестановочна со всеми квадратными матрицами того же порядка. Доказать обрат- обратное: всякая квадратная матрица, перестановочная со всеми ква- квадратными матрицами того же порядка, скалярна. Задача 3. Доказать, что в алгебре ^(Ш) матрицы вида a,be К, образуют подалгебру, изоморфную алгебре комплексных чисел. Задача 4. Доказать, что в алгебре L2(C), рассматриваемой как алгебра над R, матрицы вида fa -b {b a a,beC,
gl.9. Алгебра матриц образуют подалгебру, изоморфную алгебре кватернионов (см. при- пример 8.6). Для каждой матрицы _ [ «21 «22 определим транспонированную матрицу Оц п2\ . . . О22 • • • строками которой служат столбцы матрицы А, а столбцами — строки матрицы А. Если (t,j)-H элемент транспонированной ма- матрицы обозначить через afj, то Очевидно, что {Ат)т = А. Очевидно также, что (А + В)Т = АТ + (ХА)Т = ХАТ Докажем, что (АВ)Т = В самом деле, пусть АВ = С = (cjfc); тогда 3 3 откуда видно, что Сг = ВТАТ. Замечание. Читатель может проследить, что все построения последних трех параграфов проходят без изменений, если в каче- качестве К взять произвольное коммутативное ассоциативное кольцо с единицей, например, кольцо целых чисел или кольцо вычетов. Единственное отличие является терминологическим: вместо тер- термина «векторное пространство» в этой более общей ситуации упо- употребляется термин «модуль».
Глава 2. Начала линейной алгебры §2.1. Системы линейных уравнений Пусть К — произвольное (но фиксированное) поле. Допуская воль- вольность речи, мы будем обычно называть его элементы числами. Ес- Если читателю трудно представить себе произвольное поле, он может считать, что К = R, хотя объективно этот случай ничуть не проще общего. Линейным уравнением с неизвестными х\,х%,... ,хл над по- полем К называется уравнение вида а.\Х\ + ачхч + ... + а.пхп = 6, где коэффициенты ai,аг, • • •,ап и свободный член Ь суть элемен- элементы поля К. Линейное уравнение называется однородным, если 6 = 0. Система т линейных уравнений с п неизвестными в общем виде записывается следующим образом: Ч\\Х\ + Л\2Х2 + • • • + О>1пХп = &li О>2\Х\ + Q.22.X2 + . • . - <hn\X\ + OmiXi + ... + OmnXn = Ьт. Матрица (Oil «12 «21 «22 называется матрицей коэффициентов, а матрица (оц а\2 ... а\п Ь\ «21 «22 ••• «2п &2 От\ Огп2 • - • Ornn Ь — расширенной матрицей системы A3). Система уравнений называется совместной, если она имеет хотя бы одно решение, и несовместной — в противном случае. Совместная система может иметь одно или более решений. Решить систему уравнений — это значит найти все ее решения.
82.1- Системы линейных уравнений 43 Подчеркнем, что одно решение системы уравнений с п неиз- неизвестными — это упорядоченный набор из п чисел, т.е. элемент пространства Кп. Существует простой общий метод решения систем линейных уравнений, называемый методом. Гаусса. Его идея состоит в при- приведении любой системы линейных уравнений с помощью некоторых специальных преобразований, называемых элементарными, к экви- эквивалентной системе некоторого простого вида, все решения которой легко найти. Напомним, что две системы уравнений называются эквивалентными, если множества их решений совпадают, т. е. ес- если каждое решение первой из них является решением второй, и наоборот. Определение 1. Элементарными преобразованиями систе- системы линейных уравнений называются преобразования следующих трех типов: 1) прибавление к одному уравнению другого, умноженного на число; 2) перестановка двух уравнений; 3) умножение одного уравнения на число, отличное от нуля. Подчеркнем, что при элементарном преобразовании 1-го типа изменяется только одно уравнение — то, к которому прибавляется другое, умноженное на число. Очевидно, что всякое решение исходной системы уравнений является решением новой системы, полученной элементарным пре- преобразованием. С другой стороны, исходная система уравнений мо- может быть получена из новой системы подходящим элементарным преобразованием того же типа. Так, если мы прибавим к первому уравнению второе, умноженное на с, то можно вернуться назад, прибавив к первому уравнению новой системы ее второе уравне- уравнение (которое такое же, как у исходной системы), умноженное на —с. Поэтому при любом элементарном преобразовании мы получа- получаем систему уравнений, эквивалентную исходной. Так как нам удобнее работать не с самими системами линейных уравнений, а с их (расширенными) матрицами, дадим соответству- соответствующее определение для матриц. Определение 1'. Элементарными преобразованиями строк матрицы А называются преобразования следующих трех типов: 1) прибавление к одной строке другой, умноженной на число; 2) перестановка двух строк; 3) умножение одной строки на число, отличное от нуля.
44 Глава 2. Начала линейной алгебры Очевидно, что всякое элементарное преобразование системы линейных уравнений приводит к соответствующему элементарно- элементарному преобразованию ее матрицы коэффициентов и расширенной ма- матрицы. Покажем теперь, что с помощью элементарных преобразований строк любую матрицу можно привести к достаточно простому виду. Назовем первый отличный от нуля элемент ненулевой строки 0*1,02, • ¦ • 10n) € Кп ее ведущим, элементом. Определение 2. Матрица называется ступенчатой, если 1) номера ведущих элементов ее ненулевых строк образуют строго возрастающую последовательность; 2) нулевые строки, если они есть, стоят в конце. Таким образом, ступенчатая матрица — это матрица вида «2J3 О A4) в которой элементы aij,, а%^ ,••-, «rjV • находящиеся в углах сту- ступенчатой линии, отличны от нуля, а все элементы, находящиеся слева и снизу от этой линии, равны нулю. При этом j\ < J2 < Теорема 1. Всякую матрицу путем элементарных преобра- преобразований строк можно привести к ступенчатому виду. Доказательство. Если данная матрица нулевая, то она уже ступенчатая. Если она ненулевая, то пусть j\ — номер ее пер- первого ненулевого столбца. Переставив, если нужно, строки, добьем- добьемся того, чтобы aij, Ф 0. После этого прибавим к каждой строке, начиная со второй, первую строку, умноженную на подходящее чи- число, с таким расчетом, чтобы все элементы j\-vo столбца, кроме первого, стали равными нулю. Мы получим матрицу вида Поступая таким же образом с матрицей А\, мы в конце концов получим матрицу вида A4).
§2.1 ¦ Системы линейных уравнений 45 Замечание 1. В этом доказательстве мы обошлись без элемен- элементарных преобразований 3-го типа. Однако на практике они могут быть полезны. Пример 1. Приведем к ступенчатому виду матрицу 1 1 2 2 2 3 1 0 1 2 ¦t -2 0 -1 3 3 2 4 -2 Вычитая из 2-й, 3-й и 4-й строк 1-ю строку, умноженную на 1, 2 и 2 соответственно, получаем матрицу 4 2 1 0 2> 0 11-12 0-3-3 3 -6 -4 -4 3 -3/ Далее, прибавляя к 3-й и 4-й строкам 2-ю строку, умноженную на 3 и 4 соответственно, получаем матрицу '1 2 1 0 2> 0 11-12 0 0 0 0 0 0 0-1 5> Наконец, переставляя 3-ю и 4-ю строки, получаем ступенчатую матрицу 1 2 1 0 2> 0 11-12 0 0 0-15 0 0 0 0, Замечание 2. Предыдущий пример специально подобран та- таким образом, чтобы j\, J2, -. •, jr не были просто первыми г чле- членами натурального ряда. Такая ситуация является в определенном смысле исключительной. Например, j\ ф 1 только при условии, что первый столбец исходной матрицы нулевой. Как правило, h = 1, h = 2, • • • , jr = г. В этом случае матрица A4) называется трапецоидальной. Применим доказанную теорему к решению систем линейных уравнений.
46 Глава 2, Начала линейной алгебры Определение 3. Система линейных уравнений называется ступенчатой, если ее расширенная матрица ступенчатая. Из теоремы следует, что всякую систему линейных уравнений с помощью элементарных преобразований можно привести к сту- ступенчатому виду. Поэтому нам достаточно научиться решать сту- ступенчатые системы. Введем некоторую терминологию. Квадратная матрица А = = (Оу) называется треугольной, если а# = О при i > j, и стро- строго треугольной, если, кроме того, ац ф 0 при всех t. Система линейных уравнений называется (строго) треугольной, если ее матрица коэффициентов (строго) треугольна. Рассмотрим теперь произвольную ступенчатую систему ли- линейных уравнений. Пусть число ненулевых строк (число ступе- ступенек) ее матрицы коэффициентов равно г, а число ненулевых строк расширенной матрицы равно г. Очевидно, что г = г или г+1. Возможны следующие три принципиально разных случая. 1-й случай: f = г+1. В этом случае система содержит уравне- уравнение вида + 0х2 + .. • + 0хп = Ъ, где Ь ф 0, и, следовательно, несовместна. 2-й случай: г = г = п. В этом случае после отбрасывания нулевых уравнений получается строго треугольная система. Из ее последнего уравнения однозначно определяется хп, затем из пред- предпоследнего уравнения — xn-i и т. д. Следовательно, система имеет единственное решение. 3-й случай: г = г < п. Пусть в этом случае Ji»J2»--« >Jr — номера ведущих коэффициентов ненулевых уравнений системы. Неизвестные Xjx,Xfa,... ,Xjr назовем главными, а остальные — свободными. После отбрасывания нулевых уравнений и перенесе- перенесения членов со свободными неизвестными в правую часть получает- получается строго треугольная система относительно главных неизвестных. Решая ее, как в предыдущем случае, находим выражения главных неизвестных через свободные. Эти выражения называют общим решением системы. Все решения системы получаются из общего решения подстановкой каких-то значений свободных неизвестных. Поскольку эти значения могут выбираться произвольно, система имеет, во всяком случае, более одного решения, а если поле К бесконечно — то бесконечно много решений.
§2.1. Системы линейных уравнений 47 Совместная система линейных уравнений называется опреде- определенной, если она имеет единственное решение, и неопределенной, если она имеет более одного решения. В последнем случае, как следует из проведенного выше анализа, она имеет бесконечно мно- много решений, если только поле К бесконечно. Ее общее решение с точностью до перенумерации неизвестных имеет вид Х\ = СцЯг+1 + ci,n_rxn + A5) Xr = + Cr2Xr+2 + ...+ Cr,n-rXn Пример 2. Решим систему уравнений х\ + 2x2 + хз =2, 2х\ 3x2 + Х2 — — х\ = 4, = —2, расширенной матрицей которой служит матрица из примера 1. Вы- Вычисления, проведенные в примере 1, показывают, что данная систе- система эквивалентна ступенчатой системе Х\ + 1X2 Х3 =2, хз — х\ = 2, — х\ = 5. Считая неизвестные х\,хъ,х± главными, а неизвестное хз бодным, перепишем систему в виде х\ + 2x2 — —хз + 2, Х2 — Х\ = —Хз + 2, — х\ = 5. Решая ее относительно х\,хъ,х±, находим общее решение сво- I х\ = хз 4- 8, Х2 = —ХЗ — 3, Х4 = — 5.
48 Глава 2. Начала линейной алгебры Замечание 3. Для единообразия можно считать, что в слу- случае определенной системы все неизвестные являются главными, а свободные неизвестные отсутствуют. Общее решение есть тогда единственное решение системы. Замечание 4. Строго треугольную матрицу можно путем эле- элементарных преобразований строк привести к единичной матрице. Для этого нужно сначала к каждой строке, кроме последней, при- прибавить последнюю строку с таким коэффициентом, чтобы элемент последнего столбца стал равным нулю, затем аналогичным обра- образом, прибавляя предпоследнюю строку, сделать равными нулю все элементы предпоследнего столбца, кроме диагонального, и т. д. В результате мы получим диагональную матрицу. Умножая ее строки на подходящие числа, мы получим единичную матрицу. Пользу- Пользуясь этим, можно при решении системы линейных уравнений не останавливаться на ступенчатом виде, а, продолжив преобразова- преобразования, привести матрицу коэффициентов при главных неизвестных к единичной матрице. Тогда общее решение просто считывается с полученной матрицы. Эта процедура называется обратным ходом метода Гаусса. Пример 3. Продолжим преобразование примера 1 предвари- предварительно отбросив нулевую строку. Вычтя из 2-й строки 3-ю, получим матрицу A 2 1 0 2\ О 1 1 0 -3 ) . 0 0 0-1 5/ Вычтя из 1-й строки удвоенную 2-ю и умножив 3-ю строку на —1, получим матрицу '1 0-1 0 8\ 0 1 1 0 -3 1 . ^00 0 1 -5/ Таким образом, система уравнений из примера 2 эквивалентна си- системе х\ - хз = 8, xi + хз = —3, х\ — —5. Перенося члены с хз в правую часть, получаем уже найденное выше общее решение.
§2.1. Системы линейных уравнений 49 Система однородных линейных уравнений всегда совместна, так как она имеет нулевое решение. Если она определенна, то она имеет только нулевое решение, если неопределенна — то имеет хотя бы одно ненулевое решение (и даже бесконечно много таких решений, если поле К бесконечно). В предыдущих обозначениях, последний случай имеет место, если г < п. Пользуясь тем, что все- всегда г < т. мы приходим к следующей теореме, которая является важным теоретическим следствием метода Гаусса. Теорема 2. Всякая система однородных линейных уравне- уравнений, число уравнений которой меньше числа неизвестных, име- имеет ненулевое решение. Неопределенные системы линейных уравнений могут иметь разную «степень неопределенности», каковой естественно считать число свободных неизвестных в общем решении системы. Так, прямая в пространстве задается системой линейных уравнений с одним свободным неизвестным, а плоскость — системой (из одного уравнения) с двумя свободными неизвестными. Ясно, что это принципиально разные случаи. Однако одна и та же система линейных уравнений может допускать различные общие решения, в которых разные неизвестные играют роль свободных, и зако- закономерен вопрос, будет ли число свободных неизвестных всегда одним и тем же. Положительный ответ на этот вопрос дается с помощью понятия размерности векторного пространства, которое будет введено в следующем параграфе. В оставшейся части этого параграфа мы интерпретируем метод Гаусса на языке умножения матриц. Прежде всего, если обозначить через X столбец неизвестных, а через В — столбец свободных членов, то систему A3) можно переписать в следующей матричной форме: АХ=В. A6) Действительно, матрица АХ согласно правилу умножения матриц есть столбец высоты т, t-й элемент которого равен Приравнивая этот элемент t-му элементу столбца В, мы получаем как раз г-е уравнение системы A3).
50 Глава 2. Начала линейной алгебры Пусть U — какая-либо квадратная матрица порядка т. Умно- Умножая обе части уравнения A6) слева на U, мы получаем уравнение U АХ = UB. A7) Очевидно, что всякое решение уравнения A6) удовлетворяет и уравнению A7). Если же матрица U обратима, то умножение сле- слева на U~l осуществляет обратный переход от уравнения A7) к уравнению A6) и, следовательно, эти уравнения эквивалентны. Уравнению A7) соответствует система линейных уравнений с матрицей коэффициентов UA и столбцом свободных членов UB. Легко видеть, что расширенная матрица этой системы равна UА. Далее, непосредственно проверяется, что элементарные пре- преобразования строк какой-либо матрицы А равносильны ее умноже- умножению слева на так называемые элементарные матрицы следующих трех типов: 1) i 2) 3) \ i ф j); = Qi(c) (Все элементы этих матриц, не выписанные явно, — такие же, как у единичной матрицы.)
§2.2. Базис и размерность векторного пространства 51 Так, например, умножение матрицы А слева на E+cEij (t ф j) приводит к тому, что к t'-й строке прибавляется j-я строка, умно- умноженная на с (а прочие строки не изменяются). Все элементарные матрицы обратимы, причем обратные к ним матрицы суть элементарные матрицы, соответствующие обратным элементарным преобразованиям: (Е + cEij)'1 =E- Метод Гаусса в матричной интерпретации состоит в последова- последовательном умножении уравнения A6) слева на элементарные матри- матрицы, имеющем целью приведение матрицы А (а также расширенной матрицы А) к ступенчатому виду. Используя вместо элементарных матриц какие-либо другие ма- матрицы, можно получить другие методы решения систем линейных уравнений, которые, быть может, ие столь просты в теоретическом отношении, но, скажем, более надежны при приближенных вычи- вычислениях (в случае К = Ш). Таков, например, метод вращений, при котором в качестве U берутся матрицы вида \ cos о- • —sin a sin а cos а- §2.2. Базис и размерность векторного пространства Представление о размерности пространства есть одна из фундамен- фундаментальных идей математики. В разных разделах математики оно (как и представление о самом пространстве) принимает разные формы. В этом параграфе мы дадим определение размерности векторного пространства и исследуем связанные с этим вопросы. В §1.7 мы ввели понятие базиса векторного пространства и до- доказали, что векторное пространство над полем К, имеющее базис из п векторов, изоморфно пространству строк Кп. Размерность векторного пространства определяется как число векторов в его
52 Глава 2. Начала линейной алгебры базисе. Однако перед тем как дать такое определение, необходимо ответить на два вопроса: какие векторные пространства облада- обладают базисом и не может ли в векторном пространстве быть двух базисов, состоящих из разного числа векторов. Чтобы ответить на эти вопросы, нам понадобится ввести неко- некоторые понятия и доказать некоторые утверждения, которые важны и сами по себе. Пусть V — векторное пространство над полем К. Линейная комбинация -I- Л2О2 -I- ... 4- AnOn (Ai, A2,. -., An € К) векторов ai,a2, - ¦ - ,cin € V называется тривиальной, если Ai = = А2 = ... = An = 0, и нетривиальной в противном случае. Определение 1. Векторы а1,а2,...,а„ называются линейно зависимыми, если существует их нетривиальная линейная комби- комбинация, равная нулю, и линейно независимыми в противном случае. Подчеркнем, что понятие линейной зависимости (или независи- независимости) относится не к отдельным векторам, а к их совокупностям или, как говорят, системам векторов. Замечание 1. Понятие системы векторов отличается от поня- понятия множества векторов тем, что, во-первых, векторы системы предполагаются занумерованными и, во-вторых, среди них могут быть равные. Таким образом, система из п векторов — это, в сущ- сущности, отображение множества {1,2,... ,п} в пространство V. За- Заметим, однако, что свойство системы векторов быть линейно зави- зависимой или независимой не зависит от нумерации векторов в ней. Замечание 2. Термин «линейная комбинация» на самом деле употребляется в двух смыслах: как указание действий, которые производятся над данными векторами, что равносильно заданию коэффициентов Ai, A2,. -., Ап, и как результат этих действий. В выражении «нетривиальная линейная комбинация данных векто- векторов равна нулю» нетривиальность понимается в первом смысле, а равенство нулю — во втором. Линейная независимость векторов а\,а2, ¦ • ¦ ,вп означает, ины- иными словами, что равенство Aioi -I- A2O2 + ... + AnOn — О выполняется только при Ai = A2 = ... = An = 0. Пример 1. Система, состоящая из одного вектора, линейно за- зависима тогда и только тогда, когда этот вектор нулевой.
§2.2. Базис и размерность векторного пространства 53 Пример 2. Система, состоящая из двух векторов, линейно за- зависима тогда и только тогда, когда эти векторы пропорциональны. Пример 3. Три геометрических вектора линейно зависимы то- тогда и только тогда, когда они компланарны (параллельны одной плоскости). Очевидно, что если система векторов содержит линейно зави- зависимую подсистему, то она сама линейно зависима. Так, например, всякая система векторов, содержащая пропорциональные векторы, линейно зависима. Лемма 1. Векторы а\,а2, ...,Оп (п > 1) линейно зависимы тогда и только тогда, когда хотя бы один из них линейно выражается через остальные. Доказательство. 1) Пусть, например, тогда Ol — М2«2 - ... — (JnOn = О, что показывает линейную зависимость векторов ai,a2,... ,Оп- 2) Обратно, пусть Aioi + Агаг + ... + AnOn = О, где не все коэффициенты Ai, Аг,..., Ап равны нулю. Допустим для определенности, что Х% Ф О. Тогда А2 An Ai Ai т. е. ai линейно выражается через аг, • • •, an. Замечание 3. Неверно, что любой вектор линейно зависимой системы линейно выражается через остальные. Пусть, например, а — какой-нибудь ненулевой вектор. Система {о, 0} линейно зави- зависима, так как 0а + 1 • 0 = 0, но вектор а, очевидно, не выражается через нулевой вектор. Лемма 2. Пусть векторы ai,a2,...,on линейно независи- независимы. Вектор Ь линейно выражается через ai,a2,...,an тогда и только тогда, когда векторы ai,a.2, ¦ ¦ ¦ ,ап,Ь линейно зави- зависимы.
54 Глава 2. Начала линейной алгебры Доказательство. Если вектор Ь линейно выражается че- через ei, а2, -. •, an, то ai, а2,..., On, b линейно зависимы согласно предыдущей лемме. Обратно, пусть Axai + Л2О2 + ... + Ana» + lib = О, причем не все коэффициенты Ai, А2,..., Ад,р равны нулю. Мож- Можно утверждать, что ft ф 0: в противном случае мы получили бы линейную зависимость векторов ai,a2,..., ап, что противоречит условию. Но тогда Лемма 3. Пусть вектор Ь линейно выражается через век- векторы ai,O2,---,an. Это выражение единственно тогда и толь- только тогда, когда векторы а\, вг,..., вп линейно независимы. Доказательство. 1) Пусть вектор Ь допускает два раз- различных выражения через ох,02, ¦.., о»: 6 = Axai + A2a2 + ... + АдОп = Aiai + А2о2 + . •. + \'пОп- Тогда (А'г - Ai)oi + (A2 - А2)о2 + ... + (А; - Хп)ап = 0 есть линейная зависимость между а\,аг,... ,Оп. 2) Обратно, пусть fiiai + fi2ct2 + ¦¦¦+ finOn = 0 есть линейная зависимость между а\, о2, • • ¦, ап. Тогда если Ь = Aid + А2о2 + ... + А„о„, то также Ь = (Ai + jii)ai + (А2 + ^г)о2 + ... + (А„ + цп)ап, что дает другое выражение Ь через oi, о2,..., On. Пусть S С V — какое-то подмножество. Совокупность всевоз- всевозможных (конечных) линейных комбинаций векторов из S называ- называется линейной оболочкой множества S и обозначается через (S). Это наименьшее подпространство пространства V, содержащее S (проверьте это!). Говорят, что пространство V порождается мно- множеством S, если (S) = V. Определение 2. Векторное пространство называется конечно- конечномерным, если оно порождается конечным числом векторов.
§2.2. Базис и размерность векторного пространства 55 Предложение 1 (Основная лемма о линейной зависимости). Если векторное пространство V порождается п векторами, то всякие т > п векторов пространства V линейно зависимы. Доказательство. Пусть V = (oi, 02, • • •, On) и &i, b2, • ¦., bfn (m > n) — какие-то векторы пространства V. Выразим их через oi,a2,... ,о„: &1 = /АЦО1 + Для любых Ai, Л2,..., 6 К получаем отсюда = (Xl/ЛЦ Рассмотрим систему п однородных линейных уравнений с т неиз- неизвестными: (ЛцХг + ЦъхХъ + . .. + fimlXm = О, 1Л\2Х\ + Ц12Х2 + ¦ • . + Ihri&m = О, = 0. Если (Ai, A2,..., Am) — любое решение этой системы, то Albi + А2б2 + .. . + АтЬт = 0. С другой стороны, по теореме 2.2 эта система имеет ненулевое решение. Следовательно, векторы Ъ\,Ьъ,.-.,Ьт линейно зависимы. Ввиду леммы 3 определение 1.7.4 базиса векторного простран- пространства можно переформулировать следующим образом. Определение 3, Базисом векторного пространства V называ- называется всякая линейно независимая система векторов, порождающая пространство V. Теорема 1. Всякое конечномерное векторное пространство V обладает базисом. Более точно, из всякого конечного поро- порождающего мноокества S С V можно выбрать базис простран- пространства V.
56 Глава 2. Начала линейной алгебры Доказательство. Если множество 5 линейно зависимо, то по лемме 1 в нем найдется вектор, линейно выражающийся, че- через остальные. Выкидывая этот вектор, мы получаем порождающее множество из меньшего числа векторов. Продолжая так дальше, мы в конце концов получим линейно независимое порождающее мно- множество, т. е. базис. Теорема 2. Все базисы конечномерного векторного про- пространства V содержат одно и тоже число векторов. Это число называется размерностью пространства V и обо- обозначается dimV. Доказательство. Если бы в пространстве V существо- существовали два базиса из разного числа векторов, то согласно предло- предложению 1 тот из них, в котором больше векторов, был бы линейно зависим, что противоречит определению базиса. Замечание 4. Нулевое векторное пространство (состоящее из одного нулевого вектора) считается обладающим «пустым бази- базисом»; в соответствии с этим его размерность считается равной нулю. Пример 4. Пространство Е2 (соотв. Е3) имеет размерность 2 (соотв. 3). Пример 5. Ввиду примера 1.7.7 пространство Кп имеет раз- размерность п. Пример 6. Поле комплексных чисел как векторное простран- пространство над Ш имеет размерность 2, а алгебра кватернионов (см. при- пример 1.8.6) — размерность 4. Пример 7. Если X — конечное множество из п элементов, то векторное пространство F(X, К) всех функций на X со значени- значениями в К (см. пример 1.7.2) имеет размерность п. В самом деле, рассмотрим так называемые 6-функции 8а (о € X) определяемые формулами при х ф о. Очевидно, что любая функция <р € F(X, К) единственным образом выражается через ^-функции, а именно, аех
§2.2. Базис и размерность векторного пространства 57 Следовательно, функции 8а, а € X, составляют базис простран- пространства F{X,К), причем координатами функции в этом базисе слу- служат ее значения. Если множество X бесконечно, то для любого п в пространстве F(X, К) имеется п линейно независимых векто- векторов, например, Sa%,Sa^, • • ¦ ,<УО„. где oi,O2,...,On € X различны; следовательно, пространство F(X, К) бесконечномерно. Пример 8. Поле К как векторное пространство над Q беско- бесконечномерно. В самом деле, если бы оно было конечномерно, то действительное число определялось бы конечным набором рацио- рациональных чисел — своих координат в некотором базисе этого про- пространства. Но тогда множество всех действительных чисел было бы счетно, что неверно. Задача 1. Найти число векторов п-мерного векторного про- пространства над конечным полем из q элементов. Задача 2. Доказать, что пространство всех непрерывных функций на любом промежутке числовой прямой бесконечномер- бесконечномерно. Из основной леммы о линейной зависимости (предложение 1) следует, что в любом (конечном или бесконечном) множестве S векторов конечномерного векторного пространства V имеется мак- максимальное линейно независимое подмножество, т. е. такое линейно независимое подмножество, которое становиться линейно зависи- зависимым при добавлении к нему любого из оставшихся векторов мно- множества S. Более того, любое линейно независимое подмножество множества S можно дополнить до максимального линейно незави- независимого подмножества. Предложение 2. Всякое максимальное линейно независимое подмножество {е\,... , е*} множества S является базисом ли- линейной оболочки (S) этого множества. Доказательство. Нужно доказать, что каждый вектор из (S) линейно выражается через е\,..., е*. По определению ли- линейной оболочки каждый вектор из (S) линейно выражается через векторы из S. Поэтому достаточно доказать, что каждый вектор а Е S линейно выражается через е\,..., е*. Для а € {ei,..., е*} это очевидно. Для а $ {ei,..., е*} это следует из леммы 2. Применяя высказанные соображения к 5 = V, мы получаем следующию теорему.
58 Глава 2, Начала линейной алгебры Теорема 3. Всякую линейно независимую систему векторов конечномерного векторного пространства V можно дополнить до базиса. В частности, любой ненулевой вектор можно включить в базис, а любые п линейно независимых векторов n-мерного векторного пространства уже составляют базис. Задача 3. Найти число базисов n-мерного векторного про- пространства над полем из q элементов. Следующая теорема устанавливает свойство монотонности раз- размерности. Теорема 4. Всякое подпространство U конечномерного векторного пространства V также конечномерно, причем dimU < dim V. Более того, если U фУ, то dimU < dimF. Доказательство. Пусть {ei,e2,... , ед.} — максималь- максимальная линейно независимая система векторов подпространства U. Со- Согласно предложению 2 {ei,e2,.. • , е*} — базис U. Следовательно, dimU = А;. Линейно независимую систему {ei,e2,... ,ед.} можно дополнить до базиса всего пространства V. Следовательно, если иф V, то dim V > к. Задача 4. Найти число А;-мерных подпространств п-мерного векторного пространства над полем из q элементов. Следующая теорема дает исчерпывающее описание всех конеч- конечномерных векторных пространств. Теорема 5. Конечномерные векторные пространства над одним и тем же полем изоморфны тогда и только тогда, когда они имеют одинаковую размерность. Доказательство. Пусть /: V —> U — изоморфизм векторных пространств и {ei,e2,.. • ,вп} — базис V, тогда {/(ei),/(e2),... ,/(еп)} — базис U, так что dimV = dimU. Обратно, согласно предложению 1.7.1 всякое n-мерное векторное пространство над полем К изоморфно Кп; следовательно, все такие пространства изоморфны между собой. Таким образом, в любом рассуждении мы вправе заменить произвольное n-мерное векторное пространство над полем К пространством строк Кп. В пространстве К11 имеется «при- «привилегированный» базис, состоящий из единичных строк (см.
§2.2. Базис и размерность векторного пространства 59 пример 1.7.7). С другой стороны, если в каком-либо п-мерном векторном пространстве V задан базис, то сопоставление каждому вектору строки его координат (как в доказательстве предложе- предложения 1.7.1) определяет канонический изоморфизм пространства V и пространства Кп, при котором векторам заданного базиса со- соответствуют единичные строки. В этом смысле можно сказать, что пространство строк — это не что иное, как конечномерное векторное пространство с выделенным базисом. Совокупность всех базисов п-мерного векторного пространства V может быть описана следующим образом. Пусть {ei,...,en} — какой-либо фиксировнный базис. Любая система п векторов {е7!,... ,е'п} может быть тогда задана квадратной матрицей С = — (cij), определяемой равенствами (j = l,...,n), A8) и называемой матрицей перехода от базиса {е\,..., е„} к системе {e'i,..., е'п}. Согласно этому определению, j-я столбец матрицы С есть столбец координат вектора e'j в базисе {ei,...,en}. Поэто- Поэтому векторы е[,... ,е'п линейно независимы (и, значит, составляют базис) тогда и только тогда, когда столбцы матрицы С линейно не- независимы, т. е. когда матрица С невырожденна. Тем самым устано- установлено взаимно однозначное соответствие между множеством всех базисов пространства V и множеством невырожденных матриц по- порядка п. Если распространить правило умножения матриц на случай, ко- когда элементами одной из них являются векторы (что имеет смысл ввиду операций, определенных в векторном пространстве), то ра- равенства A8) могут быть переписаны в следующей матричной фор- форме: A9) Пусть х € V — какой-либо вектор. Разложим его по базисам ,...,en} и {е'1,...,е'п}: х = ххех + ... 4- хпеп = х[е[ + ... 4- х'пе'п. Положим X = | : } , X' =
60 Глава 2. Начала линейной алгебры Тогда х = D,..., е'п)Х' = (еь ..., еп)СХ', откуда получается следующая формула преобразования координат при переходе от базиса {е%,..., е»»} к базису {е^,..., е'п}: X = СХ\ B0) или, более подробно, Y (i = l,...,n). B1) 3 Понятия базиса и размерности могут быть распространены на бесконечномерные векторные пространства. Чтобы это сделать, на- надо определить, что такое линейная комбинация бесконечной систе- системы векторов. В чисто алгебраической систуации нет иного выхода, кроме как ограничиться рассмотрением линейных комбинаций, в которых лишь конечное число коэффициентов отлично от нуля. Пусть { щ : г 6 / } — система векторов, занумерованных эле- элементами бесконечного множества I. Линейной комбинацией векто- векторов ai,i е I, называется выражение вида J3 ^iai> B котором лишь конечное число коэффициентов Aj отлично от нуля, так что сум- сумма фактически является конечной и тем самым имеет смысл. На основе этого определения линейной комбинации точно так же, как в случае конечных систем векторов, определяются понятия линей- линейной выражаемости, линейной зависимости и базиса. Мощность базиса называется размерностью пространства. В частности, векторное пространство, обладающее счетным базисом, называется счетномерным. Пример 9. Очевидно, что множество всех последовательно- последовательностей (строк бесконечной длины) из элементов поля К является векторным пространством относительно операций сложения и умножения на элементы поля К, определяемых так же, как для строк конечной длины. Последовательность называется финитной, если лишь конечное число ее членов отлично от нуля. Финитные последовательности образуют подпространство в пространстве всех последовательностей. Обозначим его через К°°, В качестве его базисных векторов можно взять последовательности вида * = (<>,...,0,1,0,...) (* = 1,2,...) (единица стоит на i-u месте). Таким образом, пространство К°° счетномерно.
§2.2. Базис и размерность векторного пространства 61 Так же, как предложение 1.7.1, доказывается, что всякое счет- номерное векторное пространство над К изоморфно К°°. Задача 5. Доказать, что поле Ш как векторное пространство над Q не является счетномерным. Задача 6. Доказать, что из всякого счетного порождающего множества векторного пространства можно выбрать базис. Задача 7. Доказать, что любое несчетное множество векторов в счетномерном векторном пространстве линейно зависимо (и, сле- следовательно, любой базис счетен). Задача 8. Доказать, что всякую (конечную или счетную) ли- линейно независимую систему векторов счетномерного векторного пространства можно дополнить до базиса. . Задача 9. Доказать, что всякое подпространство счетномерно- счетномерного векторного пространства не более чем счетномерно (т.е. счет- номерно или конечномерно). Привести пример счетномерного под- подпространства счетномерного векторного пространства, не совпада- совпадающего со всем пространством. Задачи 6—9 представляют собой аналоги теорем 1—4 для счетномерных векторных пространств. Аналогичные утверждения могут быть доказаны и для несчетномерных пространств, но для этого требуется привлечение аппарата канторовской теории мно- множеств (трансфинитной индукции или леммы Цорна). С другой стороны, такой чисто алгебраический подход имеет ограниченную сферу применения. Обычно несчетномерное векторное простран- пространство снабжается топологией, которая позволяет придавать смысл бесконечным суммам векторов. С понятием размерности тесно связаны понятия ранга системы векторов н ранга матрицы. Определение 4. Рангом системы векторов называется раз- размерность ее линейной оболочки. Рангом матрицы называется ранг системы ее строк. Ранг матрицы А обозначается через rkA. Системы векторов {ai,a2,.... tin} и {Ьх, &2, ¦ • •, bm} называют- называются эквивалентными, если каждый из векторов bj линейно выра- выражается через ai,a.2, ¦.. ,а„. и, наоборот, каждый из векторов а» ли- линейно выражается через Ьг, &2> ¦. • > &т- Это, очевидно, равносильно совпадению линейных оболочек: Поэтому ранги эквивалентных систем векторов равны.
62 Глава 2. Начала линейной алгебры Из определения элементарных преобразований следует, что строки матрицы А', полученной из матрицы А каким-либо эле- элементарным преобразованием, линейно выражаются через строки матрицы А. Но так как матрица А может быть получена из А' обратным элементарным преобразованием, то и, наоборот, ее стро- строки линейно выражаются через строки матрицы А'. Таким образом, системы строк матриц А и А' эквивалентны и, следовательно, ранги этих матриц равны. Этим можно воспользоваться для вычисления ранга матрицы. Предложение 3. Ранг матрицы равен числу ненулевых строк любой ступенчатой матрицы, к которой она приводит- приводится элементарными преобразованиями строк. Доказательство. Так как ранг матрицы не меняется при элементарных преобразованиях, то нам достаточно доказать, что ранг ступенчатой матрицы равен числу ее ненулевых строк. Для этого, в свою очередь, достаточно доказать, что ненулевые строки ступенчатой матрицы линейно независимы. Предположим, что линейная комбинация ненулевых строк сту- ступенчатой матрицы A4) с коэффициентами Ль Аг,..., Лг равна ну- нулю. Рассматривая ji-ю координату этой линейной комбинации, на- находим, что Aiaij, = 0, откуда Ai = 0. Рассматривая, далее, jfe-K» координату с учетом того, что Ai = 0, находим, что Х^аг^ = 0, откуда Аг = 0. Продолжая так дальше, получаем, что все коэффи- коэффициенты Ai, A2,..., Аг равны нулю, что и требовалось доказать. В частности, какую бы последовательность элементарных пре- преобразований, приводящих заданную матрицу к ступенчатому виду, мы ни выбрали, число ненулевых строк полученной ступенчатой матрицы будет одним и тем же. Задача 10. Доказать теорему Кронекера — Капелли: система линейных уравнений совместна тогда и только тогда, когда ранг ее расширенной матрицы равен рангу матрицы коэффициентов. §2.3. Линейные отображения В любой алгебраической теории наряду с изоморфизмами рассма- рассматривают более общие отображения, называемые в общем случае гомоморфизмами, а в случае векторных пространств — линейными отображениями. В то время как изоморфизмы полностью сохраня-
§2.3. Линейные отображения 63 ют внутренние свойства алгебраических структур и их элементов, гомоморфизмы сохраняют их лишь частично. Определение 1. Пусть V и U — векторные пространства над полем К. Отображение f.V-^U называется линейным, если 1) /(о + 6) = /(о) + /(Ь) Vo, Ь € V; 2) /(Ло) = Л/(о) VA € К, а € V. Это определение отличается от определения изоморфизма век- векторных пространств тем, что в нем не требуется биективности. Отметим, что при линейном отображении нулевой вектор пе- переходит в нулевой, а противоположный — в противоположный. В самом деле, /@) =/@-0) = 0/@) = О, /(-«) = /((-!)«) = (-!)/(«) = -Па). Легко также доказать, что Пример 1. Поворот есть линейное отображение (и даже изо- изоморфизм) пространства Е2 в себя (рис. 6). a + b Xa Рис. 6 Пример 2. Ортогональное проектирование на плоскость опре- определяет линейное отображение (но не изоморфизм) пространства Е3 в пространство геометрических векторов этой плоскости. Пример 3. Дифференцирование является линейным отобра- отображением пространства непрерывно дифференцируемых функций на
64 Глава 2. Начала линейной алгебры заданном промежутке числовой прямой в пространство непрерыв- непрерывных функций на этой прямой. Пример 4. Отображение о / dx является линейным отображением пространства непрерывных функций на отрезке [а,Ь] в поле М, рассматриваемое как вектор- векторное пространство над самим собой. Линейное отображение f:V—*U однозначно определяется образами базисных векторов пространства V. В самом деле, пусть {е, : t Е /} — базис пространства V; тогда для любого вектора х = ^2 Xi&i имеем С другой стороны, если щ € 17 (» 6 J) — произвольные векто- векторы, то отображение /: V —» U, определяемое по формуле как легко видеть, является линейным и /(е$) = щ. Эти соображения позволяют получить аналитическое описание линейных отображений. Сделаем это для пространств строк. Пусть — линейное отображение. Применим его к единичным строкам ei,e2,...,en пространства Кп (см. пример 1.7.7). Мы получим какие-то строки f(ej) = (aljt o2i,..., Omj) € К (J = 1,2,..., n). Числа aij {i = 1,2,..., m; j = 1,2,..., n) образуют матрицу А размера т х п, которая называется матрицей линейного ото- отображения f. (Обратите внимание, что координаты строки f{ej) записываются в j-u столбце матрицы А.) Для любой строки х = (xi,x2,...,xn) = y^2,xiei € К™
§2.3. Линейные отображения 65 имеем: Таким образом, если положить f(x)=y=(yi,y2,...,ym), то yi,У2, ¦¦¦,Ут выражается через хх,аг2,...,хп по формулам i = 1,2,..., m). B2) Обратно, если Л = (atj) — произвольная матрица размера тхп.то отображение /: if71 —*¦ Кт, определяемое формулой B2), линейно и его матрица есть А. Тем самым устанавливается взаимно однозначное соответствие между линейными отображениями Кп в Кт и матрицами размера т х п. Соответственно этому матрица линейного отображения f: V -* U произвольных конечномерных векторных пространств определяется следующим образом: в ее j-u столбце стоят коорди- координаты образа j-ro базисного вектора пространства V. Эта матрица, естественно, зависит от выбора базисов в пространствах V и U. Пример 5. В пространстве Е2 выберем ортонормированный базис {еьег}. Пусть / — поворот на угол а. Тогда (рис. 7) = ei cos a 4- = —ei sin а 4- sina, г cos a. Это означает, что матрица / есть B3) Пег) /cos a -sina\ у sin a cosaj ' Рис 7 Заметим, что в данном случае V = U и мы использовали один и тот же базис {еьег} в двух качествах: как базис V и как базис U, хотя согласно определению не обязаны были этого делать. Пример 6. Найдем матрицу проектирования из примера 2. В плоскости проектирования выберем любой базис {еь^} и допол- дополним его ортогональным вектором ез до базиса пространства. Так как при проектировании векторы е\ и ег переходят сами в себя, а
66 Глава 2. Начала линейной алгебры вектор ез — в нуль, то искомая матрица (относительно выбранных базисов) имеет вид Л 0 0\ V0 1 о) • В отличие от изоморфизма линейное отображение не обязано быть ни сюръективным, ни инъективным. Нарушение этих свойств приводит к возможности связать с каждым линейным отображени- отображением два подпространства — его образ и ядро. Определение 2. Образом линейного отображения /: V —> U называется подмножество Im/ = {f(a):a€V}GU, а ядром — подмножество Кег/ = {о € V : /(а) = 0} С V. Легко видеть, что Im / — подпространство в U, а Кег / — под- подпространство в V. Докажем, например, второе. Если а,Ь& Кег/, т.е./(о) = /F) = 0, то т.е. а + Ь 6 Кег/. Далее, если а € Kerf, т.е. /(а) = 0, то для любого A G К /(Ао) = А/(о) = АО = 0, т. е. Ха Е Кег/. Наконец, 0 6 Кег/, так как по доказанному выше /@) = 0. Пример 7. Ядром отображения проектирования из примера 2 является совокупность векторов, ортогональных плоскости проек- проектирования. Пример 8. Ядром отображения дифференцирования из приме- примера 3 является совокупность постоянных функций, а образом — пространство всех непрерывных функций. Последнее следует из существования первообразной у каждой непрерывной функции, до- доказываемого в анализе. Теорема 1. Линейное отображение f:V—*U инъективно тогда и только тогда, когда Кег/ = 0. Более точно, для лю- любого b € Im/ множество решений уравнения /(*) = Ь B4)
§2.3. Линейные отображения 67 имеет вид а + Кег/, где а — какое-то одно решение этого уравнения. (Здесь а4-Кег/ понимается как совокупность сумм вида а + у, где у € Кег/.) Заметим, что Кег/ согласно определению есть множество ре- решений уравнения /(х) = 0. B5) Доказательство. Инъективность отображения / озна- означает, что для любого 6 Е Im / уравнение B4) имеет единственное решение. Поэтому нам достаточно доказать второе утверждение теоремы. Пусть /(а) = 6. Если у G Кег/, то /(а + у) = /(а) +/(у) =6 + 0 = 6. Обратно, если f{x) = 6, то /(* - а) = /(х) - /(а) = 6-6 = 0, т. е. y = i-oe Кег/; следовательно, аг = а + уеа + Кег /. Если /: Кп —? ffm — линейное отображение с матрицей А и Ь = (&i, &2, • •., 6т), то уравнение B4) в координатной форме — это не что иное, как система линейных уравнений A3), а уравнение B5) — это система однородных линейных уравнений с теми же коэффициентами при неизвестных: = 0, = 0, . . Otn\X\ + Om2X2 + • ¦ • + птпХп = 0. Таким образом, множество решений системы уравнений B6) есть подпространство пространства Кп, а множество решений системы A3), если оно не пусто, есть сумма какого-нибудь одного решения и этого подпространства. Какова размерность пространства решений системы B6)? От- Ответ на этот вопрос дает
68 Глава 2. Начала линейной алгебры Теорема 2. Пусть f: Кп —> Кт — линейной отображение с матрицей А. Тогда dim Кег / = п — гк А. Доказательство. С помощью элементарных преобразо- преобразований приведем систему B6) к ступенчатому виду. В силу пред- предложения 2 число ненулевых уравнений в этом ступенчатом виде будет равно г = ткА. Поэтому общее решение будет содержать г главных неизвестных и с точностью до перенумерации неизвестных будет иметь вид (ср. A5)): Х\ = СцХг+1 + Ci2Xr+2 + • • • + Cl,n-rXn, Х2 = + + r_n> B7) Xr = CriXr+i + Cr2XTjr2 + • • • + Cr<n—rXn. Придавая по очереди одному из свободных неизвестных xr+i,xr+2> • • - iXn значение 1, а остальным — значения О, мы получим следующие решения системы B6): «1 = (сц,С2ь...,сгЬ1,0,...,0), «2 = (Ci2, C22, - • • , Сг2, 0, 1, . . . , 0), Un-r — (Ci,n-r> C2,n-r> • • ч Cr,n-r>0, 0, . . . , 1). Докажем, что они составляют базис пространства Кег/, откуда и будет следовать утверждение теоремы. Для любых Ai, Аг, • • •, А„_г б К линейная комбинация и = является решением системы B6), в котором свободные неизвест- неизвестные имеют значения Ai, Аг,..., Ап_г. Так как значения главных неизвестных однозначно определяются значениями свободных не- неизвестных (по формулам B7)), то любое решение системы B6) является линейной комбинацией «х,«2> • • • ,ип-г- С другой сторо- стороны, если и = 0, то Ai = А2 = ... = An_r = 0; следовательно, ui,U2,.. ¦,«n_r линейно независимы. Всякий базис пространства решений системы однородных ли- линейных уравнений называется фундаментальной системой ре- решений. Предыдущее доказательство дает практический способ по- построения такой системы решений.
§2.3. Линейные отображения 69 Пусть /: V —> U — линейное отображение конечномерных векторных пространств и {ei,e2,... ,еп} — базис пространства V. Для любого а = oiei + огег + ... + Опвп € V имеем /(о) = ox/(ei) + о2/(е2) + ... Следовательно, Im/ = </(ех), /(е2),..., /(еп)). B8) Теорема 3. dimlm/ -bdimKer/ = dimV. . Доказательство. Выберем базис пространства V специ- специальным образом: сначала выберем базис {ei, , е*} подпростран- подпространства Кег/, а затем дополним его какими-то векторами е/ь+ь • • •, еп до базиса V. Так как по построению f{e\) = ... = /(е*) = О, то из B8) следует, что Докажем, что векторы /(e^+i),..., /(вп) линейно независимы, от- откуда и будет следовать утверждение теоремы. Пусть Ai/(efc+1) + ... + An_fc/(en) = 0. Рассмотрим вектор о- = Aiefc+i + ... + А„_*еп. Предыдущее равенство означает, что /(о) = 0, т.е. о Е Кег/ = (ex,...,efc). Так как ei,... ,е*,е*+г>... ,еп линейно независимы, то это воз- возможно только при Ах = ... = Ап_* = 0, что и требовалось дока- доказать. Следствие 1. Если f: Кп —> Кт — линейное отображение с матрицей А, то dim Im / = rk A. Доказательство получается сравнением теорем 2 и 3. Следствие 2. Ранг системы столбцов любой матрицы равен рангу системы ее строк.
70 Глава 2. Начала линейной алгебры Доказательство. Пусть /: Кп —> Кт — линейное ото- отображение с матрицей А и е\, ег,..., &п — единичные строки про- пространства Кп. Из B8) следует, что размерность пространства Im/ равна рангу системы столбцов матрицы А. Сравнение этого с пре- предыдущим следствием и дает желаемый результат. Пример 9. Поле К можно рассматривать как (одномерное) векторное пространство над самим собой. Линейное отображение f:V—*K называется линейной функцией на V. Если / — нену- ненулевая линейная функция, то Im / = К и, если dim V = п, теорема 3 дает, что dimKer/ = n —1. Пример 10. Пусть X — множество ребер тетраэдра и У — множество его граней. Каждой функции <р на X со значениями в поле К сопоставим функцию ф на У, определяемую следующим образом: xdy т. е. значение функции ф на какой-либо грани равно сумме значе- значений функции <р на сторонах этой грани. Этим определяется линей- линейное отображение (см. пример 1.7.2). Докажем, что если char/С ф 2, то оно сюръективно. Для этого достаточно показать, что Im/ содер- содержит «5-функции всех граней. Функция <р, для которой f(<p) есть ^-функция нижней грани, изображена на рис. 8а (значения <р на неотмеченных ребрах равны нулю). Так как dim F(X, К) = 6, dim F(Y, К) = 4, то по теореме 3 dim Кег / = 6 — 4 = 2. Функции, составляющие базис Кег/, изображены на рис. 86. Задача 1. Для отображения / из предыдущего примера найти dim Кег / в случае, когда char К = 2. Так как столбцы матрицы А — это строки транспонированной матрицы АТ (см. §1.9), то следствие 2 §2.3 означает, что
§2.3. Линейные отображения 71 б) Рис. 8 Аналогично элементарным преобразованием строк матрицы опреде- определяются элементарные преобразования столбцов. Им соответствуют элементарные преобразования строк транспонированной матрицы. Поэтому ранг матрицы не изменяется не только при элементарных преобразованиях строк, но и при элементарных преобразованиях столбцов. Замечание. Элементарные преобразования столбцов матрицы равносильны ее умножению на элементарные матрицы справа. Обратимся теперь к операциям над линейными отображениями. Линейные отображения V —t U можно складывать и умножать на числа, как обычные функции: Относительно этих операций они образуют векторное простран- пространство. Далее, если — линейные отображения, то их произведение (композиция) fg: W -> U есть также линейное отображение. В самом деле, + Ь) = f{g{a + Ь)) = f(g(a) + д(Ь)) = = f(9(a)) + f(g(b)) = (fg)(a) + (fg)(b), (f9)(*a) = Hg(Xa)) = f(Xg(a)) = Xf(g(a)) =
72 Глава 2. Начала линейной алгебры Умножение линейных отображений связано с линейными операци- операциями свойствами = X(fg) VA e К. Докажем, например, первое из свойств дистрибутивности. Пусть f:V-+U, g:W-+V, h:W-+V — линейные отображения. Для любого a &W имеем: = f((g + Л)(в» = f(g(a) + Л(а)) = + ПНа)) = (fg)(a) + (fh)(a) = (fg + fh)(a). Умножение линейных отображений ассоциативно, как и вообще умножение любых отображений. В самом деле, пусть M,N,P,Q — какие-то множества и f:M-*N, g:P-+N, h: Q-* Р — какие-то отображения. Тогда для любого а € Q имеем: (ШШа) = (fg)(h(a)) - f(g(h(a))), (f(gh))(a) = f((gh)(a)) = f(g(h(a))), откуда (f9)h = f{gh). Операции над линейными отображениями пространств строк соответствуют таким же операциям над их матрицами. Для линей- линейных операций это очевидно. Докажем это для умножения. Пусть f:Kn-^Km, g:Kp-+Kn — линейные отображения с матрицами А = (ау) и В = F,*) со- соответственно. Пусть ei,e2, ,вр — единичные строки простран- пространства К?. Имеем тогда: g(ek) = (bu, &2A, • - •, 4 з i з ' Следовательно, матрица отображения fg есть С = (с»*), где з Это означает, что С = АВ, что и требовалось доказать.
§2.3. Линейные отображения 73 Пример 11. Матричное равенство, доказанное в примере 1.9.2, на языке линейных отображений означает, что произведение пово- поворотов плоскости на углы а и /3 есть поворот на угол а + E (см. пример 3). Поскольку последнее утверждение геометрически оче- очевидно, это дает доказательство формул для косинуса и синуса сум- суммы двух углов. Свойства операций над матрицами, полученные нами в §1.9 прямыми вычислениями, могут быть теперь выведены из соответ- соответствующих свойств операций над линейными отображениями. Очевидно, что тождественное отображение id: V -)¦ V линейно. Матрица тождественного отображения id: Кп —* Кп есть единичная матрица Е порядка п. Поэтому свойства A0) еди- единичной матрицы есть просто перевод на матричный язык очевид- очевидных равенств /id = /, id/ = /, где /: Кп —> Кт — линейное отображение, задаваемое матрицей A, a id в первом случае обозначает тождественное отображение пространства Кп, а во втором — тождественное отображение про- пространства Кт. Если /: V —? U — биективное линейное отображение, то обратное отображение f~x: U —> V также линейно. В самом деле, для любых а, 6 G U пусть с, d е V — такие векторы, что /(с) = о, f(d) = 6; тогда /(с + d) = а + Ь и, следовательно, Г1(а + 6) = с + d = f~l(a) + f'l(b). Аналогично проверяется и второе свойство линейности. Применим эти соображения к проблеме обратимости матриц. Определение 3. Квадратная матрица А порядка п называется невырожденной, если rk A = п. Иными словами, матрица А невырожденна, если ее строки (или столбцы) линейно независимы. Теорема 4. Квадратная матрица обратима тогда и только тогда, когда она невырожденна. (Определение обратимого элемента кольца с единицей см. в §1.3.) Доказательство. Пусть /: Кп —*¦ Кп — линейное ото- отображение, задаваемое матрицей А. Согласно предыдущему матри-
74 Глава 2. Начала линейной алгебры ца А обратима тогда и только тогда, когда отображение / биектив- биективно. Последнее в силу теоремы 1 имеет место тогда и только тогда; когда Im/ = i*rn, Кег/ = 0. Ввиду теоремы 2 и следствия 1 теоремы 3 каждое из этих условий эквивалентно тому, что rk A = п. Нахождение матрицы, обратной к А, можно рассматривать как решение матричного уравнения АХ = Е (где X — неизвестная квадратная матрица). Такое уравнение мож- можно решать, как и уравнение A6), с помощью умножения слева на элементарные матрицы, что равносильно элементарным преобра- преобразованиям строк «расширенной» матрицы (А \ Е). Приведя левую половнну этой матрицы к единичной матрице (что возможно в си- силу невырожденности матрицы А), в правой половине мы получим обратную матрицу. Пример 12. Найдем матрицу, обратную к матрице Для этого проделаем следующие элементарные преобразования: A 2 1 0\ (I 2 1 0\ /10-5 2\ \3 5 0 \) у \0 -1 -3 1/ * \0 1 3 -1) ¦ Таким образом, A-i _ f-5 А ~ V 3 - Задача 2. Используя линейные отображения, доказать, что ранг произведения двух матриц (не обязательно квадратных) не превосходит ранга каждой из них, а если одна из этих матриц невырожденна, то ранг произведения равен рангу другой матрицы. §2.4. Определители Вопрос о невырожденности квадратной матрицы или, что рав- равносильно, о линейной независимости п векторов n-мерного про- пространства в каждом конкретном случае можно решить приведением матрицы к ступенчатому виду элементарными преобразованиями
§2.4. Определители 75 строк. Однако представляет интерес нахождение общего условия, которому должны удовлетворять элементы матрицы для того, чтобы она была невырожденна. Поясним идею получения такого условия на примере геометри- геометрических векторов. Пара неколлинеарных векторов ai,<Z2 € Е2 называется ори- ориентированной положительно, если поворот от а\ к а2 (на угол, меньший 7г) происходит в положительном направлении. Для лю- любых векторов ai,a2 обозначим через axea(oi,a2) ориентирован- ориентированную площадь параллелограмма, натянутого на эти векторы, т. е. площадь, взятую со знаком плюс, если пара {01,02} ориентиро- ориентирована положительно, и со знаком минус в противном случае; если векторы сц и п2 коллинеарны, то положим axea(ai,a2) = 0. Вели- Величина j area(ai,a2)| может служить мерой линейной независимости векторов а\ и а^. Функция area(ai,O2) векторных аргументов ai и а2 обладает следующими свойствами: 1) она линейна по а\ и по а2 (см. пример 2.3.9); 2) area(a2,ai) = — area(oi,O2); 3) если {ех.ег} — положительно ориентированный ортонорми- рованный базис, то агеа(е1,ег) = 1. Последние два свойства очевидны. Для доказательства первого представим площадь параллелограмма как произведение основания на высоту. Мы получим тогда: агеа(о1, a2) = |oi \h2, где |ai| — длина вектора oi, а h2 — 1М I 1 I I 1 I I I I I \/a, проекция вектора a2 на прямую, ортого- ортогональную ai (рис. 9). Так как проекти- рис g рование есть линейное отображение, то отсюда следует линейность area(ai,a2) по ог. Аналогично, взяв за основание а2, можно доказать линейность по а\. Свойств 1)—3) достаточно для вычисления area(ai,O2). Выра- Выразим векторы ai,a2 через положительно ориентированный ортонор- мированный базис {ei,e2}'- Oi = Оцех а22е2.
76 Глава 2. Начала линейной алгебры Имеем тогда: 022^2) = area(ei, ei) + аца.22 area(ei, ег) + + ai2O2i агеа(ег, ei) + 012022 агеа(в2, ег) = = а.ца.22 — ai2O2i. Выражение axia22 —ai2«2i называется определителем матрицы Л = (ay) порядка 2. Из предыдущего следует, что векторы а\ и а2 линейно независимы тогда и только тогда, когда определитель матрицы, составленной из их координат, отличен от нуля. Аналогичным образом можно доказать, что ориентированный объем vol(ai,a2)a3) параллелепипеда, натянутого на векторы а.1,а.2,аз, обладает следующими свойствами: 1) он линеен по каждому из трех аргументов 01,02,03; 2) он меняет знак при перестановке любых двух аргументов; 3) если {ei, ег, ез} — положительно ориентированный ортонор- мированный базис, то vol(ei,e2,e3) = 1. (Тройка {а\,а2,аз} считается ориентированной положительно, если поворот от сц к а? со стороны аз происходит в положительном направлении.) Пользуясь этими свойствами, можно получить следующее вы- выражение уо1(ах,02,аз) через координаты векторов ах,в2,аз в по- положительно ориентированном ортонормированном базисе (проде- (проделайте это!): — «11023032 — 013022031 — 012021033. Выражение, стоящее в правой части этого равенства, называ- называется определителем матрицы А = (о^) порядка 3. Таким образом, векторы ai,O2,a3 линейно независимы тогда и только тогда, когда определитель матрицы, составленной из их координат, отличен от нуля. Определитель матрицы А = (oij) порядка 3 представляет собой алгебраическую сумму всевозможных про- произведений трех элементов матрицы, взя- взятых по одному из каждой строки и из ка- каждого столбца. На рис. 10 схематически изображено, какие из этих произведений рис |Q берутся со знаком плюс и какие со знаком минус.
cos a —sin a 2 . • 2 1 = cos a + sin'' a = 1. sin a cos a §2.4. Определители 77 Определитель матрицы А обозначается либо через detA, ли- либо путем замены круглых скобок, заключающих в себе матрицу, вертикальными чертами. Пример 1. Пример 2. 12 3 4 5 6 = 1-5-9 + 2-6-7 + 3-4-8 —3-5-7 — 2-4-9-1-6-8 = 7 8 9 = 45 + 84 + 96 - 105 - 72 - 48 = 0. В случае произвольной размерности и произвольного поля, ко- когда мы не располагаем такими понятиями, как площадь или объем, естественно попытаться ввести определитель как функцию, обла- обладающую свойствами, аналогичными свойствам 1)—3). Дадим необ- необходимые для этого определения. Пусть V — векторное пространство над полем К и /@1,02,.. •, am) — функция со значениями в К от т векторов пространства V. Определение 1. Функция /@1,02,... ,om) называется поли- полилинейной (или, точнее т-линейной), если она линейна по каждому аргументу. Например, линейность по первому аргументу означает, что /(аг + а",а2,... ,0m) = f(a'l,a2, ¦ ¦. ,От) + /(ei><*2,-.. ,am), /(Лоьа2,...,ота) = A/(oi,o2,...,om). Определение 2. Полилинейная функция /(ai, e»2, ¦ ¦ ¦, ат) на- называется кососимметрической, если при перестановке любых двух аргументов она умножается на —1. Важное свойство кососимметрической полилинейной функции состоит в том, что, если только chaxK ф 2, она обращается в нуль всякий раз, когда какие-либо два аргумента принимают одинаковые значения. В самом деле, при перестановке этих двух аргументов значение функции не изменится, но, с другой стороны, оно должно умножиться на —1; следовательно, оно равно нулю. Замечание 1. Если char К = 2, то последнее свойство следует принять за определение кососимметричности. Докажем, что из не- него, наоборот, вытекает кососимметричность в определенном выше смысле. Поскольку при проверке кососимметричности по каким- либо двум аргументам значения остальных аргументов следует счи-
78 Глава 2. Начала линейной алгебры тать фиксированными (хотя и любыми), достаточно рассмотреть случай билинейной (т. е. 2-линейной) функции. Пусть / — били- билинейная функция, обращающаяся в нуль при одинаковых значениях аргументов. Тогда для любых о, 6 Е V имеем: О = /(а + 6, а + Ь) = /(а, а) + /(а, 6) + /F, а) + /F,6) = откуда Теперь введем понятия, необходимые для описания явного ана- аналитического выражения определителя матрицы порядка п, подоб- подобного тем, какие были получены при п = 2 и 3. Последовательность (к\, къ,... ,кп) чисел 1,2,..., п, располо- расположенных в каком-либо порядке, называется перестановкой из п элементов. Так как к\ может принимать п различных значений, кг при заданном к\ может принимать п— 1 значение, кз при заданных к\ и кг может принимать п — 2 значения и т.д., то имеется всего п(п - 1)(п - 2) • • • 2 • 1 = п! перестановок из п элементов. Перестановка A,2,... ,п) называет- называется тривиальной. Замечание 2. Слово «перестановка» в математической лите- литературе (в частности, в этой книге) иногда употребляется в обще- общечеловеческом смысле как изменение порядка каких-либо объектов (например, перестановка слов в предложении). Говорят, что пара чисел образует инверсию в заданной пере- перестановке, если большее из них стоит левее меньшего. Переста- Перестановка называется четной (соотв. нечетной), если число инвер- инверсий в ней четно (соотв. нечетно). Наряду с этим определяется знак перестановки, равный 1, если перестановка четна, и —1, ес- если она нечетна. Знак перестановки (k\,k2, ¦. ¦ ,кп) обозначается через sgn(A:bA:2,...,A:n). Пример 3. При п = 3 четные перестановки — это A,2,3) (нет инверсий), B,3,1) (две инверсии) и C,1,2) (две инверсии); нечетные — A,3,2) (одна инверсия), C,2,1) (три инверсии) и B,1,3) (одна инверсия). Пример 4. Тривиальная перестановка не имеет инверсий и по- поэтому четна. Напротив, в перестановке (п, п — 1,... ,2,1) любая пара чисел образует инверсию. Поэтому число инверсий в этой
§2.4. Определители 79 перестановке равно Следовательно, sgn(n, n - 1,.... 2,1) = (-1)»(»-1)/2 = (_1)[»/21. Перемена местами двух элементов в перестановке называется транспозицией этих элементов. Предложение 1. При любой транспозиции четность пере- перестановки меняется. Доказательство. При транспозиции соседних элемен- элементов меняется взаимное расположение только этих элементов, так что число инверсий изменяется (увеличивается или уменьшается) на 1; следовательно, четность меняется. Транспозиция элементов i и j, разделенных s другими элементами, может быть осуществлена путем 2s + 1 последовательных транспозиций соседних элементов: сначала переставляем г со всеми промежуточными элементами и с j, затем переставляем j со всеми промежуточными элементами. Каждый раз знак перестановки будет меняться по доказанному выше. Так как это произойдет нечетное число раз, то в результате знак перестановки изменится на противоположный. Следствие. При п > 1 число четных перестановок из п эле- элементов равно числу нечетных. Доказательство. Выпишем все четные перестановки и в каждой из них произведем транспозицию первых двух элементов. Тогда мы получим, причем по одному разу, все нечетные переста- перестановки. Теперь мы в состоянии сформулировать и доказать основную теорему. Теорема 1. В пространстве Кп существует единственная кососимметрическая п-линейная функция det, удовлетворяю- удовлетворяющая условию det(e1,e2,...,en) = l B9) (где еь ег,...,еп — единичные строки). Она имеет вид det(a1)o2,...,an) = J^ sgn(fcbfc2,...,&n)aifcla2fc3 .. .anfcj,, (fci.fca,...,*,.) C0)
80 Глава 2. Начала линейной алгебры где Oik обозначает к-ю компоненту строки сч, а суммирование происходит по всем перестановкам из п элементов. Доказательство. I) Предположим, что функция det удо- удовлетворяет условиям теоремы. Тогда det(ai,a2,... ,Оп) = (Z2llZ33 В силу кососимметричности функции det, если какие-то два из чисел Ai, &2,..., А^, равны, то det(ejt,, е*,, •.., е*„) =0. Если все они различны,то det(efcl, ejfc2,..., ек„) = sgn(fci, к2,..., кп). В самом деле, если это равенство верно для какой-то перестановки (ii>j2> ¦•• ,3п), то оно верно и для любой перестановки, получа- получаемой из нее транспозицией, так как при транспозиции обе части равенства умножаются на —1. По условию теоремы оно верно для тривиальной перестановки. Но очевидно, что любую перестановку можно получить из тривиальной последовательными транспозиция- транспозициями. Следовательно, доказываемое равенство верно для любой пере- перестановки, и мы получаем для det(ai,O2,.- • ,а„) выражение C0). Таким образом, если функция det, удовлетворяющая условиям те- теоремы, существует, то она имеет вид C0). 2) Докажем теперь, что функция det, определяемая равенством C0), удовлетворяет условиям теоремы. Линейность по каждому из аргументов очевидна, поскольку для любого г равенство C0) можно представить в виде det(ob О2, ...,ап) = ^2 ацщ, з где ui,...,Un не зависят от а*. Условие B9) также выполнено, поскольку в выражении для det(ei, e%,..., еп) слагаемое, отвечаю- отвечающее тривиальной перестановке, равно 1, а все остальные слагаемые равны нулю. Остается проверить кососимметричность. Посмотрим, что происходит при перестановке аргументов щ и Oj. Мы можем разбить множество всех перестановок на пары перестановок, получаемых друг из друга транспозицией hi и kj. Согласно предложению 1 произведения аиь,а2*3 • • • Оп*„, соответ- соответствующие перестановкам одной такой пары, входят в выражение
§2.4. Определители 81 C0) с противоположными знаками. При перестановке а» и о,- они меняются местами и, следовательно, все выражение умножается на —1. Замечание 3. Если char if = 2, то кососимметричность сле- следует понимать в смысле замечания 1. Ее доказательство в этом случае состоит в том, что при а* = a.j члены выражения C0), соответствующие перестановкам каждой из описанных выше пар, взаимно уничтожаются. Определение 3. Определителем квадратной матрицы А = = (a,ij) порядка п называется число det A = det(ab a2,..., an), где ai, ai,..., On — строки матрицы А. Таким образом, detA= ^2 sgn(ki,k2,...,kn)aikla2k2-ankn- C1) При n = 2 и 3 мы получаем выражения, приведенные в начале этого параграфа. При п ^ 4 вычисление определителя непосредственно по фор- формуле C1) в общем случае весьма затруднительно. Существуют зна- значительно более простые способы вычисления определителей. Они основаны на свойствах определителей, доказываемых ниже. Предложение 2. Определитель матрицы не изменяется при элементарном преобразовании строк 1-го типа. Доказательство. Пусть, скажем, к 1-й строке матрицы А прибавляется 2-я строка, умноженная на с. Полученную матрицу обозначим через А'. Имеем: det A' = det(ai + саг, <*2, •.., (hi) = = det(oi,O2,...,an) +cdet(a2,a2,...,an) = detA При перестановке двух строк определитель, как мы знаем, умножается на —1, а при умножении какой-либо строки на число он умножается на это число. Таким образом мы можем проследить за изменением определителя при любых элементарных преобра- преобразованиях строк матрицы. Так как любую матрицу с помощью элементарных преобразований строк можно привести к ступен- ступенчатому виду, а всякая ступенчатая квадратная матрица является
82 Глава 2. Начала линейной алгебры треугольной (но, может быть, не строго треугольной), то нам остается научиться вычислять определитель треугольной матрицы. Предложение 3. Определитель треугольной матрицы ра- равен произведению ее диагональных элементов. Доказательство. Произведение диагональных элемен- элементов входит в выражение C1) определителя любой матрицы со знаком плюс, так как соответствует тривиальной перестановке. В случае треугольной матрицы все остальные члены этого выражения равны нулю. В самом деле, если аи^ащ, • • ¦ апк„ Ф 0, то fci ^ 1, к2 ^ 2, ..., кп^п; но так как fci + к2 + ... + кп = 1 + 2 + ... + п, то это возможно только при fci = 1, к2 = 2, ... , кп = п. Помимо того, что они дают практический способ вычисления определителей, предложения 1 и 2 позволяют нам ответить на во- вопрос, ради которого мы и ввели понятие определителя. Теорема 2. Квадратная матрица А невырожденна тогда и только тогда, когда det А ф 0. Доказательство. С помощью элементарных преобразо- преобразований строк приведем матрицу А к ступенчатому виду. Если при этом использовались элементарные преобразования 2-го или 3-го типов, то определитель может измениться, но, во всяком случае, его равенство или неравенство нулю сохранится. Матрица А не- невырожденна тогда и только тогда, когда полученная ступенчатая матрица является строго треугольной; но это равносильно тому, что ее определитель отличен от нуля. Продолжим изучение свойств определителей. Теорема 3. det AT = det A. Доказательство. Определитель матрицы Ат, как и определитель матрицы А, есть алгебраическая сумма всевозмож- всевозможных произведений п элементов матрицы А, взятых по одному из каждой строки и из каждого столбца. Единственное, за чем надо
§2.4. Определители ^__^ 83 проследить — это то, что одинаковые произведения входят в det A и det AT с одинаковыми знаками. Для того чтобы выяснить, с каким знаком входит в detAT про- произведение aikxa^ka • • • апкп< нужно расположить его множители по порядку номеров столбцов. Этого можно достичь, последовательно меняя местами два множителя. При каждой такой перемене в пере- перестановках, образуемых номерами строк и столбцов, одновременно происходят транспозиции, так что произведение их знаков не меня- меняется. Таким образом, если полученное в результате произведение будет иметь вид ед^адо . -. сцпП, то sgn(fci,A:2,...,A:n) = а это и означает, что рассматриваемое произведение входит в det A и det AT с одним и тем же знаком. Из этой теоремы следует, что всякое свойство определителей остается справедливым, если заменить в нем строки столбцами, а столбцы — строками. В частности, мы таким образом получаем Следствие. Определитель есть кососимметрическая поли- полилинейная функция столбцов матрицы. Теорема 4 (об определителе матрицы с углом нулей). Пусть матрица А имеет вид А~ 'О С где В и С — квадратные матрицы. Тогда det A = det В- det С. Доказательство. Пусть матрица В имеет порядок т, матрица С — порядок п. Если det С = 0, то элементарными пре- преобразованиями строк матрицы С можно получить нулевую стро- строку. Проделав такие же элементарные преобразования последних п строк матрицы А, мы получим нулевую строку во всей матрице А. Следовательно, в этом случае det A = 0 и доказываемое равенство верно. Аналогичное рассуждение, но с элементарными преобразо- преобразованиями первых т столбцов, показывает, что если det В = 0, то det A = 0 и доказываемое равенство верно. Пусть теперь det В^Ои det С Ф 0. Рассмотрим отношение detBdetC
84 Глава 2. Начала линейной алгебры Нам нужно доказать, что оно равно 1. При любом элементарном преобразовании последних п строк матрицы A det А и det С умно- умножаются на одно и то же число и, следовательно, отношение C2) не изменяется. Такими преобразованиями можно привести матрицу С к треугольному виду. Аналогично, отношение C2) не изменяется при любых элементарных преобразованиях первых т столбцов ма- матрицы А. Такими преобразованиями можно привести матрицу В к треугольному виду (методом Гаусса, отраженным относительно побочной диагонали). Поэтому нам достаточно доказать, что отно- отношение C2) равно 1 в случае, когда В и С — треугольные матрицы; но это очевидно. Ввиду теоремы 3 аналогичная формула верна и для матриц с правым верхним углом нулей. Пример 5. Вычислим так называемый определитель Вандер- монда V(xux2,...,xn) = х\ \ х2 х\ ... «Т1—1 х ... х. Вычитая из каждого столбца, начиная с последнего, предыдущий столбец, умноженный на х\, и применяя теорему 4, получаем: 10 0 ... 0 1 х2 — xi х2(х2 — хг) ... х\г~2(х2 — х{) V(xi,x2,...,xn) = хп — хг хп{хп — хг) ... х™ \хп — хг) = (х2 -хх)--- (хп - xi) V(x2,... ,хп). Продолжая так дальше, в конце концов получаем: C3) Пусть А — произвольная (не обязательно квадратная) матри- матрица. Всякая матрица, составленная из элементов матрицы А, на- находящихся на пересечении каких-то выбранных строк и каких-то выбранных столбцов, называется подматрицей матрицы А. Под- Подчеркнем, что выбираемые строки и столбцы не обязаны идти под- подряд.
§2.4. Определители 85 Определитель квадратной подматрицы порядка к называется минором порядка к матрицы А. Иногда, допуская вольность речи, саму квадратную подматрицу также называют минором. В частно- частности, если А — квадратная матрица порядка п, то минор порядка п — 1, получаемый вычеркиванием i-й строки и j-ro столбца, на- называется дополнительным минором элемента Оу и обозначается через Mij. Число называется алгебраическим дополнением элемента оу. Смысл ал- алгебраического дополнения ясен из следующей леммы. an О Лемма 1. Onl •• (В левой части стоит определитель матрицы, полученной из матри- матрицы А = (а^) заменой нулями всех элементов i-й строки, кроме ay.) Доказательство. Поменяем местами г-ю строку со все- всеми предыдущими строками и j-й столбец со всеми предыдущими столбцами. При этом мы будем г — 1 раз менять местами строки и j — 1 раз — столбцы, так что определитель умножится на В результате получится определитель вида 0 ... О .. ain где в правом нижнем углу стоит дополнительный минор элемен- элемента ay. По теореме об определителе матрицы с углом нулей этот определитель равен OijMij. С учетом предыдущего знака отсюда и получается доказываемое равенство. Теорема 5. Для любой квадратной матрицы А det А -
86 Глава 2. Начала линейной алгебры Первая из этих формул называется формулой разложения определителя по г-й строке, вторая — формулой разложения определителя по j-му столбцу. Доказательство. Так как каждый член выражения C1) для detA содержит ровно один элемент из i-й строки, то преды- предыдущая лемма означает, что сумма тех членов, которые содержат axj, равна OijAij. Отсюда вытекает формула разложения по стро- строке. Аналогично доказывается формула разложения по столбцу. Замечание 4. Знаки (—l)l+J чередуются в матрице в шахмат- шахматном порядке, причем на главной диагонали стоят плюсы. Пример 6. Вычисление определителя А из примера 2 разло- разложением по 2-й строке дает Д = -4 2 3 8 9 + 5 1 3 7 9 -6 1 2 7 8 = -4 • (-6) + 5 • (-12) - 6 • (-6) = 0. Пример 7. Вычислим определитель порядка п вида 2 1 0 0 0 1 2 1 0 0 0 1 2 0 0 ... 0 ... 0 ... 0 ... 2 ... 1 0 0 0 1 2 Разлагая его по 1-й строке и затем второй из полученных опреде- определителей — по 1-му столбцу, получаем: 1 1 ... 0 0 0 2 ... 0 0 Д„ = 2Д„_1 - о о о о 2 1 1 2 = 2Д„_1 - Д„_2, откуда Д„ - Д„_1 = Д„_1 - Дп-2- Это означает, что последовательность (Дь Дг, Аз* • ¦ •) есть ариф- арифметическая прогрессия. Так как А\ =2, А2 = 3, то ее разность равна 1 и Д„ = п + 1.
§2.4. Определители 87 Теорема 6. Для любых квадратных матриц А, В det АВ = det A • det В. Доказательство. Для любой матрицы U имеем (UA)B = U(AB). В частности, если U — элементарная матрица, это означает, что, когда мы делаем какое-нибудь элементарное преобразование строк матрицы А, в матрице АВ происходит такое же преобразование. Если det A = 0, то с помощью элементарных преобразований строк мы можем получить в матрице А нулевую строку. Соответ- Соответствующая строка произведения АВ, как легко видеть, также станет нулевой. Следовательно, det АВ = 0, так что доказываемое равен- равенство в этом случае верно. Пусть теперь det А ф 0. Рассмотрим отношение Нам нужно доказать, что оно равно det В. Из предыдущего следует, что оно не изменяется при любых элементарных преобразованиях строк матрицы А. Так как с помощью таких преобразований матри- матрицу А можно привести к единичной матрице Е, то нам достаточно доказать, что отношение C4) равно det В в случае, когда А = Е; но это очевидно. Пример 8. Выразим неориенти- неориентированный объем V параллелепипеда, натянутого на векторы ai,a2,a3 € Е3, через длины |ai|, |аг|> 1аз| его ребер и плоские углы (см. рис. 11) pJlc Следовательно, V2 = (det AJ = det A • det AT = det AAT. <*3 = CL1&2' Пусть А = (dij) — матрица, составлен- ная из координат векторов щ в ортонор- ортонормированием базисе. Мы знаем (см. начало параграфа), что
88 Глава 2. Начала линейной алгебры Из правила умножения матриц следует, что (i,j)-ik элемент матри- матрицы ААТ есть скалярное произведение Таким образом, |ai|2 |ai||a2|cosa3 |ai||a3|cosa2 |a2||ai|cosa3 |a2|2 |а2||а3|со8а1 |аз||а1|соза2 |a3||a2|cosai |a3|2 1 cos аз cos a2 cos аз 1 cos a i cos a2 cos ai 1 и, значит. x \/\ + 2 cos ai cos a2 cos аз — cos2 ai — cos2 a2 — cos2 аз- §2.5. Некоторые приложения определителей Как мы видели в предыдущем параграфе (теорема 4.2), определи- определители дают ответ на вопрос о невырожденности (и, тем самым, об обратимости) квадратной матрицы, который служил нам поводом для их введения. Вариации на эту тему приводят к многочислен- многочисленным приложениям определителей в теории линейных уравнений и теории матриц. Первые из таких приложений будут рассмотрены в этом параграфе. Рассмотрим квадратную систему линейных уравнений о.\пхп = F0) + ап2х2 + ... + = Ьп. Обозначим через А ее матрицу коэффициентов и через А* (г = = 1,2,... ,п) матрицу, полученную из А заменой ее г-го столбца столбцом свободных членов. Теорема 1. Если det А ф О, то система C5) имеет един- единственное решение, которое может быть найдено по формулам _ det Ai ,,_ . * detA >>•••>;•
§2.5. Некоторые приложения определителей 89 Эти формулы называются формулами Крамера. Доказательство. При любом элементарном преобразо- преобразовании системы C5) в матрицах А и А\ (г = 1,2,...,п) одновре- одновременно происходит соответствующее элементарное преобразование строк и, следовательно, отношения, стоящие в правых частях фор- формул Крамера, не изменяются. С помощью элементарных преобра- преобразований строк матрицу А можно привести к единичной матрице. Поэтому достаточно доказать теорему в том случае, когда А = Е. Если А = Е, то система имеет вид хп = Ь„. Она, очевидно, имеет единственное решение 2,..., п). С другой стороны, det A = det E = 1, det A = 1 0 0 0 0 0 1 0 0 0 • • • vi • • " Oo ... bi ... bn-1 ... 6n ... 0 ... 0 ... 0 ... 1 ... 0 0 0 0 0 1 = bi (* = 1, так что формулы Крамера в этом случае действительно верны. Если det A = 0, то ступенчатый вид матрицы А не будет стро- строго треугольным и, следовательно, система C5) либо несовместна, либо неопределенна. Опасно в этом случае пытаться как-то трак- трактовать формулы Крамера. Они просто не применимы (ведь они до- доказывались в предположении, что det А ф 0), и надо действовать как-то иначе. Задача 1. Доказать, что если det Л = 0, но det-Aj ф 0 для какого-либо г, то система C5) несовместна. Задача 2. Показать, что если det A = det Аг = ... = det An = 0,
90 Глава 2. Начала линейной алгебры то система C5) может быть как несовместна, так и неопределенна. (Привести примеры на оба случая.) Отметим, что формулы Крамера — это далеко не лучший спо- способ для практического решения систем линейных уравнений, за исключением, быть может, случая п = 2. Они имеют в основном теоретическое значение. В частности, они позволяют получить сле- следующие явные формулы для элементов обратной матрицы. Теорема 2. Пусть А = (а^) — невырожденная квадратная матрица. Тогда (Через Aij обозначается алгебраическое дополнение к элемен- элементу Oij\ см. §2.4.) Доказательство. Матрица А~1 является решением ма- матричного уравнения АХ = Е. Это уравнение рассыпается на п уравнений относительно столбцов Х\, .Хг, ... ,Хп матрицы X: AXj = Ej, C6) где Ej — j-к столбец матрицы Е. В координатной записи уравнение C6) представляет со- собой систему п линейных уравнений относительно элементов x\j,X2j ¦ ¦ ¦ ,xnj столбца Xj. Матрицей коэффициентов этой систе- системы служит матрица А, а столбцом свободных членов — столбец Ej. По формулам Крамера аи ... О ... ain 1 ••• ajn ... О ... Опп i что и требовалось доказать.
§2.5. Некоторые приложения определителей 91 Пример. Для невырожденной матрицы порядка 2 «Л d> ) А-1 = 1 ( получаем d -I ad —be \—c a Эту простую формулу имеет смысл запомнить. Задача 3. Пусть А — невырожденная целочисленная (т. е. со- состоящая из целых чисел) квадратная матрица. Доказать, что ма- матрица А~1 является целочисленной тогда и только тогда, когда det A = ±1. Наконец, нахождение ранга любой матрицы также может быть сведено к вычислению определителей. Теорема 3 (о ранге матрицы). Ранг матрицы равен наиболь- наибольшему порядку ее миноров, отличных от нуля. Доказательство. Пусть ранг матрицы А равен г, и пусть s > г. Тогда любые s строк матрицы А линейно зависимы и, тем более, линейно зависимы строки любой квадратной подма- подматрицы порядка s, представляющие собой части соответствующих строк матрицы А. Следовательно, любой минор порядка s равен нулю. Далее, рассмотрим подматрицу, образованную какими-либо г линейно независимыми строками матрицы А. Ее ранг, очевидно, также равен г и, значит, среди ее столбцов найдется г линейно независимых. Минор порядка г, образованный этими столбцами, не равен нулю. Задача 4. Доказать теорему о ранге матрицы в следующей бо- более сильной форме: если в матрице А имеется минор порядка г, отличный от нуля, а все миноры порядка г +1, получаемые припи- приписыванием к нему одной строки и одного столбца, (так называемые окаймляющие миноры) равны нулю, то гк А = г. Задача 5. Доказать, что в матрице ранга г любой минор по- порядка г, образуемый пересечением г линейно независимых строк с г линейно независимыми столбцами, отличен от нуля.
Глава 3. Начала алгебры многочленов §3.1. Построение и основные свойства алгебры многочленов Функция действительной переменной х называется многочленом, если она может быть представлена в виде f(x) = oq + а\х + О.2Х2 + ... + апхп, где оо, о.\, О2,..., о,» — какие-то действительные числа (некоторые из которых или даже все могут равняться нулю). Можно дока- доказать, и мы это сделаем ниже в более общей ситуации, что такое представление единственно с точностью до приписывания членов с нулевыми коэффициентами, т. е. если то а* = Ьк при к = 0,1,2,..., п. Очевидно, что сумма и произведение многочленов, а также про- произведение многочлена на любое число, также являются многочле- многочленами. Это означает, что многочлены образуют подалгебру в алгебре всех функций действительной переменной (см. пример 1.8.3). Эта подалгебра называется алгеброй многочленов над К и обозначает- обозначается Щх]. Если попытаться аналогичным образом трактовать многочлены над любым полем К, то возникает трудность, состоящая в том, что формально различные многочлены могут быть тождественно равны при всех значениях переменной. Например, многочлены х и х2 над полем Z2 оба принимают значение О при х = 0 и I — при х = 1. В то же время хотелось бы рассматривать их как разные мно- многочлены. Выход состоит в формальном определении, при котором многочлен фактически отождествляется с последовательностью его коэффициентов. Рассмотрим векторное пространство К°° финитных последова- последовательностей элементов поля К (см. пример 2.2.6). Условимся ну- нумеровать члены последовательностей, начиная с нуля, и пусть е& (к = 0,1,2,...) обозначает последовательность, fc-й член кото- которой равен 1, а все остальные члены равны 0. Последовательности L, ег,... образуют базис пространства К°°.
§3.1. Построение и основные свойства алгебры многочленов 93 Превратим пространство К°° в алгебру, определив умножение базисных векторов по правилу Из коммутативности и ассоциативности сложения целых чисел сле- следует, что умножение базисных векторов, а, значит, и любых эле- элементов полученной алгебры, коммутативно и ассоциативно. Эле- Элемент ео является ее единицей. Эта алгебра называется алгеброй многочленов над К и обозначается К[х] (вместо х может исполь- использоваться любая другая буква). Для того чтобы перейти к привычному представлению много- многочленов, условимся, во-первых, отождествлять элементы вида аео (а € К) алгебры К[х] с соответствующими элементами поля К и, во-вторых, элемент е\ обозначим через х (здесь проявляется роль выбранной буквы х). Тогда в соответствии с определением операций в К[х] мы получаем, что е* = хк и {ао,а\,а.2,. ¦ ¦ ,Оп,0,. • •) = аоео + сцех + а-^т. + ... + апеп = Числа 0,0,0.1,0.2, ¦¦¦ называются коэффициентами многочле- многочлена. Последний из ненулевых коэффициентов называется старшим коэффициентом, а его номер — степенью многочлена. Степень многочлена / обозначается через deg/. Степень нулевого много- многочлена не определена, однако иногда удобно считать, что она равна —оо. Легко видеть, что deg(/ + д) < max{deg /, degg}, C7) deg fg = deg / + deg g. C8) Докажем, например, последнее равенство. Пусть (о„ ф 0), Тогда при перемножении / и д получается только один член степе- степени п + 77г, а именно, anbTOarn+m, a членов большей степени не по- получается вообще. Так как в поле нет делителей нуля, то о„Ьт ф 0 и, стало быть, n + m = deg/ + degg.
94 Глава 3. Начала алгебры многочленов Предыдущее рассуждение показывает, что в алгебре К[х] нет делителей нуля. Из него же следует, что обратимыми элементами в этой алгебре являются только многочлены нулевой степени, т. е. ненулевые элементы поля К. Замечание 1. Многочлен можно обозначать f(x) или просто /, если из контекста ясно, какой буквой обозначается «перемен- «переменная». Замечание 2. Часто бывает удобнее располагать многочлен не по возрастающим, а по убывающим степеням х: f — аохп + aixn~1 + ...+ On-ix + ап. Замечание 3. В качестве К можно взять любое коммутатив- коммутативное ассоциативное кольцо с единицей (ср. замечание 1.9.1). В этом случае все предыдущее остается без изменений, за исключением последней части, связанной с формулой C8), где нужно дополни- дополнительно потребовать, чтобы в кольце К не было делителей нуля. Замечание 4. Произведение финитных последовательностей (uq, oi, О2,...) и (bo, Ьь &2» • • •) в кольце К[х] есть последователь- последовательность (со, ci, C2,...), члены которой находятся по формулам 1=0 Эти формулы имеют смысл и для любых (не обязательно финит- финитных) последовательностей. Таким образом получается коммутатив- коммутативная ассоциативная алгебра с единицей, называемая алгеброй фор- формальных степенных рядов над К и обозначаемая ^С[[гс]]. Ее эле- элементы обычно записывают как формальные бесконечные суммы вида ао + а\х + О2Х2 + ... Алгебра if [[ж]], как и К[х], не имеет делителей нуля, но доказы- доказывается это по-другому (попробуйте это сделать!). Каждый многочлен / = а0 + а\х + а2х2 + ... + ОпХп C9) определяет функцию на К со значениями в К, значение которой в точке с € А* по определению равно /(с) = оо + сцс + а%<? + ... +
§3.1. Построение и основные свойства алгебры многочленов 95 Так как сумма и произведение многочленов, а также произведение многочлена на число, приводятся к каноническому виду C9) пре- преобразованиями, использующими только свойства операций в К[х], справедливые и в поле К, то мы придем к одному и тому же резуль- результату, сделав подстановку х = с до или после этих преобразований. Это означает, что (f + 9)(c)=f(c)+g(c), = f(c)g(c). т. е. операции над многочленами приводят к таким же операциям над соответствующими функциями. Как мы показали на примере в начале параграфа, разные мно- многочлены могут определять одну и ту же функцию. Оказывается, однако, что такое возможно, только если поле К конечно. Теорема 1. Если поле К бесконечно, то разные многочлены над К определяют разные функции. Доказательство. Пусть многочлены f,g€ K[x] опреде- определяют одну и ту же функцию. Тогда их разность h = f — g определя- определяет нулевую функцию, т. е. h(c) = 0 для всех с € К. Предположим, что h ф О, и пусть h = ао + а\х + а2х2 + ... + an-iz" (an-i ф 0). Возьмем различные x\,x%,... ,хп € К (здесь используется беско- бесконечность поля К). Совокупность верных равенств + О2х\ + ... + Оп-гж™ = 0, + а^х\ 4-... + ап-\х\~х = 0, Qo ~t~ a>ixn + qqxz, + ... + ctn— ixn 0 рассмотрим как (квадратную) систему однородных линейных урав- уравнений относительно ao, ai, a2,..., an_i. Определитель матрицы коэффициентов этой системы есть определитель Вандермонда V(xi,X2,...,xn) (см. пример 2.4.5) и потому отличен от ну- нуля. Следовательно, система имеет только нулевое решение, что противоречит нашему предположению.
96 Глава 3. Начала алгебры многочленов Замечание 5. Если поле К конечно, то множество всех мно- многочленов над К тем не мение бесконечно (но счетно), в то время как множество всех функций на К со значениями в К конечно. Поэтому в этом случае обязательно должны существовать разные многочлены, определяющие одну и ту же функцию. Задача. Так называемая задача интерполяции состоит в нахождении многочлена степени < п, принимающего в задан- заданных (различных) точках xi,X2, ¦ ¦ ¦ ,хп е К заданные значения УьУг,- • • >Уп ? К. (В частности, при п = 2 это называется ли- линейной интерполяцией.) Доказать, что задача интерполяции имеет единственное решение при любых xi,x2,.. ¦ ,хп и уьуг • • • >Уп- Деление одного многочлена на другой в обычном смысле слова в алгебре К[х], как правило, невозможно. Однако возможно так называемое деление с остатком, похожее на деление с остатком в кольце целых чисел. Теорема 2. Пусть f,g€ K[x], причем g ф 0. Тогда суще- существуют такие многочлены q и г, что f = qg + г и либо г = 0, либо deg r < degg. Многочлены q иг определены этими услови- условиями однозначно. Нахождение таких многочленов q и г и называется делением с остатком f на д. При этом q называется неполным частным, а г — остатком от деления / на д. Многочлен / делится на д в алгебре К[х] тогда и только тогда, когда г = 0. Доказательство. 1) Докажем возможность деления с остатком. Если deg / < deg д, то можно взять q = 0, г = /. Если deg/ ^ deg<7, то q и г находятся обычной процедурой «деления уголком». А именно, пусть / = aQxn + aix71 4-... + an-ix + а„, д = Ьохт + hx-1 + ...+ Ьт_хх + Ьго, где ао,Ьо Ф 0. Рассмотрим многочлен Л = / - J%*n-m9- Его степень меньше, чем степень /. Если deg/i < degg, то мы можем взять
§3.1. Построение и основные свойства алгебры многочленов 97 В противном случае поступаем с многочленом /i так же, как с /. В конце концов мы получим такой многочлен q = сохп-т + ciaj"--1 + ... + с„_го, что deg(/ — qg) < degg. Это и будет неполное частное от деления / на д, а многочлен г = / — qg будет остатком. 2) Докажем, что многочлены q и г определены условиями тео- теоремы однозначно. Пусть где degn < degg и degr2 < degg. Тогда и, если q\ ф qi, то deg(n - г2) = deg(?2 — Яг) + degg ^ degg, что, очевидно, неверно. Следовательно, ?i = да и ri = r%. Особое значение имеет деление с остатком на линейный дву- двучлен х — с.В этом случае остаток имеет степень < 1, т. е. является элементом поля К. Таким образом, результат деления с остатком многочлена / на х — с имеет вид f(x) = (x- c)q(x) +r (г € К). Отсюда следует, что /(с)=г, т.е. остаток равен значению многочлена / в точке с. Это утвер- утверждение называется теоремой Везу. Деление с остатком на х — с осуществляется по замечательно простой схеме, называемой схемой Горнера. А именно, пусть UQX + п\Х ~ + • . . + Ofi—lX + fln = = (х - cXbo*"-1 + hxn-2 + ... + Ь„_2я + 6n_i) + г. Приравнивая коэффициенты при соответствующих степенях х, по-
98 Глава 3. Начала алгебры многочленов лучаем цепочку равенств оо =6о, ai = 6i a2 = 62 o-n-i = bn-i — cbn-2, an = r~ cbn-lt откуда находим следующие рекуррентные формулы для Ьо,Ь\,, ...,bn-i и г: до = во» Ь\ = сц + cbo, 62 = 02 + с&ь 6n-i = <*n-i + сЬп-2, Г = Оп Исходные данные и результаты вычислений удобно расположить в виде таблицы: Оп-1 <*п 60 h &2 ••• Ь„-1 г Каждое число во второй строке этой таблицы, начиная с &ь нахо- находится как сумма числа, стоящего над ним, и числа, стоящего слева, умноженного на с. В частности, это дает очень эффективный способ вычисления значений многочлена. Пример. Найдем значение многочлена / = 2ж6 - Их4 - 19s3 - 7х2 + 8х + 5 в точке х = 3. По схеме Горнера получаем: 2 0 -11 -19 -7 8 5 б 7 2 -1 5 20 Таким образом, /C) = 20. §3.2. Общие свойства корней многочленов Элемент с поля К называется корнем многочлена / € К[х] (или соответствующего алгебраического уравнения f(x) = 0), если
§3.2. Общие свойства корней многочленов 99 /(с) = 0. Из теоремы Безу (см. предыдущий параграф) следует Теорема 1. Элемент с поля К является корнем многочлена f ? К[х] тогда и только тогда, когда f делится на х — с. Этим можно воспользоваться для доказательства следующей те- теоремы. Теорема 2. Число корней ненулевого многочлена не превос- превосходит его степени. Доказательство. Пусть а — корень многочлена /. То- Тогда f = (x-cl)fl (ЛеВД. Пусть С2 — корень многочлена /i. Тогда и, значит, / = (X-Ci)(x-C2)f2- Продолжая так дальше, мы в конце концов представим многочлен / в виде / = (х - сг)(х - сз)... (х - Cyjg, D0) где многочлен g € К[х] не имеет корней. Числа ci,C2,... ,Сщ — это все корни многочлена /. В самом деле, для любого с € К имеем /(с) = (с - ci)(c - ев)... (с - Ст)д(с) и, так как д(с) Ф 0, то /(с) = 0, только если с = Ci для некото- некоторого ъ. Таким образом, число корней многочлена / не превосходит т (оно может быть меньше т., поскольку не исключено, что среди чисел с\,С2,• ¦ ¦,Cm есть одинаковые); но т = deg/ - degff ^ deg/. Замечание 1. Эта теорема фактически уже была нами доказа- доказана другим способом в процессе доказательства теоремы 1.1. С дру- другой стороны, из нее можно получить доказательство теоремы 1.1, не использующее теории линейных уравнений. А именно, если раз- различные многочлены fag над бесконечным полем К определяют одну и ту же функцию, то все элементы поля К являются корнями ненулевого многочлена h = / — д, что противоречит только что доказанной теореме.
100 Глава 3. Начала алгебры многочленов Доказательство предыдущей теоремы наводит на мысль, что некоторые корни правильнее было бы считать несколько раз. Этому можно придать точный смысл. Корень с многочлена / называется простым, если / не делится на (г—сJ, и кратным — в противном случае. Кратностью корня с называется наибольшее из таких к, что / делится на (х — с)*. Таким образом, простой корень — это корень кратности 1. Иногда удобно считать, что число, не являющееся корнем, — это корень кратности 0. Очевидно, что с — корень кратности к многочлена / тогда и только тогда, когда D1) где д(с) ф 0. Теперь мы докажем уточнение теоремы 2. Теорема 3. Число корней ненулевого многочлена с учетом их кратностей (т. е. считая каждый корень столько раз, какова его кратность) не превосходит степени многочлена, причем равенство имеет место тогда и только тогда, когда этот многочлен разлагается на линейные множители. Доказательство. Перепишем равенство D0), объединив одинаковые множители: / = (х - сО*1 (аг - с2)*» ...(х- c,)k-g D2) (cisC2,... ,cs различны). Ясно, что с\,С2,... ,cs — это все корни многочлена. Далее, выделяя в D2) множитель (ж —с*)*', мы можем написать / = (х - (н^Ы, где Ы((к) ф 0. Следовательно, щ — корень кратности к%. Таким образом, число корней многочлена / с учетом их крат- кратностей равно к\ + к2 + ... + fc, = deg/ - degg, откуда и вытекают все утверждения теоремы. Замечание 2. Условно считается, что многочлен нулевой сте- степени разлагается в произведение пустого множества линейных мно- множителей.
§3.2. Общие свойства корней многочленов 101 Если многочлен / = аохп + сцх4'1 +... + пп-хх + an разлагается на линейные множители, то это разложение может быть записано в виде / = ао(х - ci)(x - с2) ... (х - с), где ci, C2,..., с„, — корни многочлена /, причем каждый из них по- повторен столько раз, какова его кратность. Приравнивая коэффици- коэффициенты при соответствующих степенях х в этих двух представлениях многочлена /, мы получаем следующие формулы Виета: С\С2 + СЮз + ...+ Cn-iCn = —, ,() В левой части fc-й формулы Виета стоит сумма всевозможных произведений fc корней многочлена /. С точностью до множите- множителя (—1)* это коэффициент при хк в произведении (х — с\) х х(х-с2)...(х-с„). Пример 1. Комплексные корни 5-й степени из 1 €к = cos —— + г sm —g- (к = 0,1,2,3,4) о о (рис. 15) суть корни многочлена х5 —1. По первой из формул Виета их сумма равна нулю. Приравнивая нулю сумму их действительных частей, получаем 2cos^+2cos^ + l =0. о о Пусть cos -г- = х; тогда cos -?¦ = 2х2 — 1, так что 5 5 4х2 + 2х - 1 = 0, откуда 2тг cos -=- = э
102 Глава 3. Начала алгебры многочленов Рис. 12 Задача. Пусть п — простое число. Пользуясь задачей из §1.6 и последней из формул Виета, доказать теорему Вильсона: (п - 1)! = -1 (mod n). Многочлен / называется нормированным (или приведенным), если а0 = 1. Формулы Виета позволяют выразить коэффициен- коэффициенты нормированного многочлена через его корни (при условии, что число корней равно степени многочлена). Пример 2. Найдем нормированный многочлен 4-й степени имеющий двукратный корень 1 и простые корни 2, 3. По формулам Виета -ах = 1 + 1 + 2 + 3 = 7, -а3 = 1-2-3 = 17, 17а;2 - 17а; + 6. Таким образом, / = х* - 7х3 Кратность корня многочлена может быть истолкована и дру- другим способом, отличным от данного выше определения, по крайней мере в случае char К = 0. Для этого нужно определить дифферен- дифференцирование многочленов.
§3.2. Общие свойства корней многочленов 103 Из правил дифференцирования функций действительной пере- переменной следует, что производная многочлена есть также многочлен. Обозначим через D отображение алгебры Щх] в себя, сопоста- сопоставляющее каждому многочлену его производную. Отображение D обладает следующими свойствами: 1) оно линейно; 3) Dx = 1. Эти наблюдения позволяют определить дифференцирование многочленов над любым полем К, когда определение производной, даваемое в анализе, не имеет смысла. Предложение 1. Существует единственное отображение D: К[х] -> К[х], обладающее свойствами 1)-3). Доказательство. Пусть D — такое отображение. Тогда D1 = ?>A • 1) = (D1) • 1 + 1 • (Dl) = Dl + D1, откуда D1 = 0. Докажем по индукции, что Dxn = nxn~x. При п = 1 это верно по предположению, а переход от п—1 к п делается выкладкой Dxn = D(xn~lx) = (Dxn~l)x + хп~г (Dx) = = (n - l)xn-2 • x + xn~l = m". Тем самым отображение D однозначно определено на базисных векторах 1, ж, х2,..., а значит, и на всем пространстве К[х]. Обратно, построим линейное отображение D: К[х] -> К[х], задав его на базисных векторах по формулам и проверим, что оно обладает свойством 2). В силу линейности достаточно проверить это свойство для базисных векторов. Имеем: D(xmxn) = Dxm+n = (т + п)хт+п~х, (Dxm)xn + хт{?>хя) = тхт-гхп + пхтхп~1 = (т + п) Многочлен Df называется производной многочлена / и обо- обозначается, как обычно, через /'. Сделав в многочлене / € К[х] замену х = с + у, где с 6 К, мы можем представить его в виде многочлена (той же степени) от
104 Глава 3. Начала алгебры многочленов у — х — с или, как говорят, разложить по степеням х — с: f = Ьо + Ьг(х - с) + Ь2(х ~ сJ + ... + Ьп(х - с)я. D3) Очевидно, что если с — корень многочлена /, то его кратность равна номеру первого отличного от нуля коэффициента этого раз- разложения. Предложение 2. Если char К — 0, то коэффициенты раз- разложения многочлена f € К[х] по степеням х — с могут быть найдены по формулам (Здесь /(fc), как обычно, обозначает k-to производную многочле- на/.) Доказательство. Продифференцируем равенство D3) к раз и подставим х — с. Таким образом, Эта формула называется формулой Тейлора для многочленов. Из формулы Тейлора и сделанного выше замечания следует Теорема 4. При условии, что char К — 0, кратность корня с многочлена f С К[х] равна наименьшему порядку производной многочлена f, не обращающейся в нуль в точке с. Следствие. При том же условии всякий k-кратный корень многочлена f является (к — 1)-кратным корнем его производ- производной. Замечание 3. В случае char К > 0 кратность корня с может быть меньше указанного в теореме числа. Более того, такого числа может вообще не существовать. Так, например, если п — про- простое число, то первая, а значит, и все последующие производные многочлена хп е Ъп[х], имеющего n-кратный корень 0, являются нулевыми многочленами. В случае JRT = R теорема 4 позволяет истолковать кратность геометрически. А именно, если кратность корня с многочлена
§3.2. Общие свойства корней многочленов 105 / € К[х] равна к, то вблизи точки с многочлен / ведет себя как Ь(х — с)* (Ь ф 0). Это означает, что его график в точке с при к = 1 просто пересекает ось г, а при к > 1 имеет с ней касание fc-ro порядка. Кроме того, знак /(х) при прохождении точки с при нечетном fc меняется, а при четном к — не меняется (см. рис. 13). Рис. 13 Коэффициенты разложения D3), а, значит, и значения произ- производных многочлена / в точке с (в случае chat К = 0), могут быть найдены последовательными делениями с остатком многочлена / на х — с. А именно, при первом делении получается остаток Ьо и неполное частное - с) Ьп(х - с)п; при делении f\ на х — с получается остаток bi и т. д. Пример 3. Разложим указанным способом по степеням х — 2 многочлен / = х5-5х4 + 7х3-2я2 + 4х-8 е Щх). Последовательные деления с остатком на х — 2 будем проводить по схеме Горнера, используя строку результатов каждого деления как
106 Глава 3. Начала алгебры многочленов строку исходных данных для следующего деления: 2 1 1 1 1 1 1 1 -3 -1 1 3 5 7 1 -1 1 7 2 0 -2 0 4 4 0 -8 0 5(х - 2L + (х - 2M. трехкратный корень многочлена /. Таким образом, / = 7(х - 2K В частности, мы видим, что 2 Кроме того, /шB) =3!-7 = 42, /™B) «4!-5 «120, /vB) = 5! • 1 = 120. §3.3. Основная теорема алгебры комплексных чисел Оценка сверху числа корней многочлена, полученная в предыду- предыдущем параграфе, ничего не говорит о наличии хотя бы одного корня. И действительно, существуют многочлены положительной степени, не имеющие корней, например, многочлен х2 + 1 над полем IS дей- действительных чисел. Именно это обстоятельство послужило поводом для построения поля С комплексных чисел. Если бы и над полем С существовали многочлены положительной степени, не имеющие корней, это привело бы к необходимости его дальнейшего расши- расширения. Однако, к счастью, это не так. Это составляет содержание теоремы, которую называют основной теоремой алгебры комплекс- комплексных чисел. Теорема 1. Всякий многочлен положительной степени над полем комплексных чисел имеет корень. Существует несколько доказательств этой теоремы. Любое из них включает элементы анализа, так как оно должно как-то ис- использовать определение поля действительных чисел, которое не является чисто алгебраическим. Доказательство, приводимое ни- ниже, является почти полностью аналитическим.
§3.3. Основная теорема алгебры комплексных чисел 107 Рис. 14 Рис. 15 Нам понадобится понятие предела последовательности ком- комплексных чисел. Перед тем как дать соответствующее определе- определение, напомним, что модуль |г| комплексного числа z есть длина вектора, изображающего это число. Отсюда следует, что \zi — z^\ есть расстояние между точками, изображающими числа z\ vt z%. Известные из геометрии неравенства, показывают (см. рис. 14 и 15), что (Равенства могут иметь место, когда соответствующий треугольник вырождается в отрезок.) Определение. Последовательность комплексных чисел z* (fc € N) называется сходящейся к комплексному числу z (обозна- (обозначение: Zk —> z), если \zk — z\ —> 0. Лемма 1. Пусть Zk = хк + y*t, z = х + yi (хк,Ук,х,у € R). Тогда zfc -» z «=> Хк -* x и ук -+ у. Доказательство. Имеем (см. рис. 16) так что хк -* х и ук -+ у =Ф- zk -* z. Обратная импликация вытекает из неравенств \Хк~х\ < \zk~z\, \ук— у\ < \zk~z\- Ук У 1 .а Zk \. nU* - г\ Хк X Рис. 16
108 Глава 3. Начала алгебры многочленов Лемма 2. Zk —*¦ z и Wk -* w => г* + tw* —> z + w и > ZW. Доказательство. Представим комплексные числа г*, , z, w в алгебраической форме: •г* — хк + У**> tWfc = «а + «fct, z = x + yi, w = « + vi. Тогда ztu = (aru — yv) + (xv + yu)i. По лемме 1 2?* -+ X, yk -* у, «*-*«, Ufc -* V и нам нужно доказать, что > ж« — yv, XkVk + Ук-Uk -*xv + ущ но это следует из свойств пределов последовательностей действи- действительных чисел, известных из анализа. Аналогично доказывается, что Zk + Wk -* z + w. Следствие. Пусть zk -* z u f € C[z] — любой многочлен. Тогда f(zk) -» f(z). (Здесь мы допускаем вольность в обозначениях, обычную в ана- анализе, когда значение переменной обозначается так же, как сама переменная.) Лемма 3. Zk —> z =» \zk\ —> \z\. Доказательство, следует из того, что Лемма 4 (о возрастании модуля многочлена). Если \zk\ —*¦ оо и / 6 C[z] — многочлен положительной степени, то \f(zk)\ -» оо. Доказательство. Пусть / = aQzn
§3.3. Основная теорема алгебры комплексных чисел 109 On-l тогда Выражение, стоящее в скобках, стремится к |ао|. Следовательно, все произведение и, тем более, \f(zk)\ стремится к бесконечности. Следующая лемма является ключевой для доказательства основной теоремы. Лемма S (Даламбера). Пусть f € C[z] — многочлен положи- положительной степени и f(z0) ф 0. Тогда сколь угодно близко к zq можно найти такое z, что \f(z)\ < \f(zo)\. Доказательство. Разложим / по степеням z — zq и раз- разделим на /(zo). Учитывая, что несколько первых коэффициентов разложения, следующих за свободным членом, могут оказаться рав- равными нулю, запишем результат в виде .. .+Cn(z-z0)n Нам нужно доказать существование такого г, что /(г) ф 0). /(го) < 1. Идея доказательства состоит в том, что если выбирать z достаточно близким к zq, выполнение этого неравенства будет зависеть только от суммы первых двух членов предыдущего разложения. Будем искать z в виде z = zq + tz\ (см. рис. 17), где t E @,1), a z\ — комплексное число, удовлетво- удовлетворяющее условию = -1. Имеем тогда: Рис. 17
ПО Глава 3. Начала алгебры многочленов где <р — некоторый многочлен степени п — р — 1 (с комплексными коэффициентами). Если С — максимум модулей коэффициентов многочлена <р, то \<p(t)\ < А = (п — р)С и, следовательно, f(zo) 1 - tp + A*p+1 = 1 - <рA - At) < 1 при t < -j. Доказательство теоремы. Пусть / € C[z] — мно- многочлен положительной степени. Положим Из определения нижней грани следует, что существует такая по- последовательность комплексных чисел z^, что \f(zk)\ -» М. D4) Если последовательность |z*| неограниченна, то из нее можно выбрать подпоследовательность, сходящуюся к бесконечности; но тогда в силу леммы 4 мы придем в противоречие с D4). Таким образом, существует такое С > 0, что С Vfc. Представим зд в алгебраической форме: Zk = хк + Тогда С, \ук\ < \zk\ < С. По теореме Больцано — Вейерштрасса из последовательности х* можно выбрать сходящуюся подпоследовательность. Перейдя к этой подпоследовательности и изменив обозначения, можно считать, что Аналогичным образом, перейдя еще раз к подпоследовательности, можно считать, что Ук -* Уо-
§3.4. Корни многочленов с действительными коэффициентами 111 Но тогда по лемме 1 Zk -> zq = х0 + yoi и, следовательно, Если М > 0, то лемма Даламбера приводит нас в противоречие с определением М. Следовательно, М = 0, т. е. f(zo) = 0. Следствие 1. В алгебре С[х] всякий ненулевой многочлен разлагается на линейные множители. В самом деле, в силу доказанной теоремы многочлен д в раз- разложении D0) должен иметь нулевую степень, т. е. быть просто числом. В силу теоремы 2.3 получаем отсюда Следствие 2. Всякий многочлен степени п над С имеет п корней {с учетом кратностей). §3.4. Корни многочленов с действительными коэффициентами Многочлен степени п с действительными коэффициентами может иметь < п (в частности вообще не иметь) действительных корней, но, как и всякий многочлен с комплексными коэффициентами, он всегда имеет ровно п комплексных корней (с учетом кратностей). Мнимые корни многочлена с действительными коэффициентами обладают специальным свойством. Теорема 1. Если с — мнимый корень многочлена f E Щх], то с также является корнем этого многочлена, причем той же кратности, что и с. Доказательство. Пусть / = аохп + а1Хп-1 + ... + an-is + an (ao,au ... ,an € R). Если /(с) = 0, то, поскольку комплексное сопряжение является автоморфизмом поля С (см. §1.5), /(с) = аос" + Cic" + ... + an-ic + ап = + oic" + ... +3n_ic + an = J{cj = 0 = 0,
112 Глава 3. Начала алгебры многочленов т.е. с — также корень многочлена /. Аналогично доказывается, что Следовательно, кратности корней сие одинаковы. Следствие 1. В алгебре Щх] всякий ненулевой многочлен разлагается на линейные множители и квадратные множите- множители с отрицательным дискриминантом. Доказательство. Заметим, что если с — мнимое число, то в силу E) квадратный трехчлен (х — с)(х — с) = х2 — (с + с)х + се имеет действительные коэффициенты; его дискриминант, очевидно, отрицателен. Пусть теперь — это все (различные) комплексные корни многочлена / € Щх], причем ci,...,cseR, c,+i,... ,c,+t ? R. Если кратность корня Cj равна fcj, то / = ао(х - ci)*1... (х - с,)*'[(х - c5+i)(x - c,+i)]*'+I ... ...[(x-c,+t)(z-c,+t )]*¦+•, (где од — старший коэффициент многочлена /). Перемножая ли- линейные множители в квадратных скобках, получаем искомое раз- разложение. Пример 1. — ( _ i\ ( —( ?Z[ _i_ • • %Щ\\ ( ( 2тг _ . . 27г\\ х (х- (cos^+isin^)) (x- (cosf -isinf)) = = (х - 1) (х2 - 2xcos y + l) ^х2 - 2xcos Ц- + l) = - (х - "Л(х2 - ^~1х + 1^ (х2 4- ^Lti-r + Л (см. пример 2.1).
§3.4. Корни многочленов с действительными коэффициентами ИЗ Пример 2. Для многочлена / из примера 2.3 разложение, о котором идет речь, имеет вид / = (х-2K(х2 + х + 1). Из теоремы 1 также следует, что любой многочлен / Е Щх] не- нечетной степени имеет хотя бы один действительный корень. Впро- Впрочем, это легко доказать и по-другому. А именно, если старший коэффициент многочлена / положителен, то lim fix) = +оо, lim fix) = —oo и, значит, многочлен / принимает как положительные, так и отри- отрицательные значения. По теореме о промежуточном значении непре- непрерывной функции отсюда следует, что в некоторой точке он обраща- обращается в нуль. Понятно, что представляет интерес определение точного числа действительных корней. Вычисляя значение многочлена в отдель- отдельных точках, мы можем обнаружить, что в каких-то точках а и Ъ он принимает значения разных знаков. Отсюда следует, что в интер- интервале (а, Ь) находится по меньшей мере один корень, а точнее — нечетное число корней (с учетом их кратностей). Таким образом мы можем оценить снизу число действительных корней. Пример 3. Для многочлена находим /@) = 1 >0, /A) = -К 0, /B) = 13 > 0. Следовательно, / имеет корни в каждом из интервалов @,1) и A,2). Нетрудно показать, что /(х) > 0 при х < 0, а также при х ^ 2. Следовательно, все действительные корни многочлена / лежат в интервале @,2). Однако, точное их число остается неясным, так как в одном из интервалов @,1) и A,2) может быть три корня. Существуют методы, которые в принципе позволяют опреде- определить как общее число действительных корней любого многочлена с действительными коэффициентами, так и число его корней в лю- любом промежутке числовой прямой. Однако их практическое приме- применение связано с довольно большими вычислениями. Мы приведем здесь одну теорему, которая хотя и не всегда дает точный ответ, но зато не требует никаких вычислений. Она говорит не просто о числе всех действительных корней, но о числе положительных
114 Глава 3. Начала алгебры многочленов (или отрицательных) корней и является обобщением следующе- следующего тривиального утверждения: если все коэффициенты многочлена неотрицательны, то он не имеет положительных корней. Для формулировки этой теоремы нам понадобится одно вспо- вспомогательное понятие. Пусть имеется конечная последовательность действительных чисел Говорят, что на fc-м месте в этой последовательности имеется пере- перемена знака, если а^Ои знак а* противоположен знаку послед- последнего из предшествующих ему ненулевых членов последовательно- последовательности. (Если а* — первый из ненулевых членов последовательности, то на fc-м месте перемены знака нет.) Теорема 2 (Декарта). Число положительных корней (с уче- учетом их кратностей) многочлена f € Щх] не превосходит чи- числа перемен знака в последовательности его коэффициентов и сравнимо с ним по модулю 2; если же все (комплексные) корни многочлена f действительны, то эти числа равны. Обозначим через JV(/) число положительных корней многочле- многочлена/и через L(f) — число перемен знака в последовательности его коэффициентов. Очевидно, что эти числа не изменяются при умножении / на —1; поэтому всегда можно считать, что старший коэффициент многочлена / положителен. Кроме того, если 0 явля- является А;-кратным корнем многочлена /, то при делении / на х* эти числа также не изменяются; поэтому можно считать, что свобод- свободный член многочлена / отличен от нуля. Лемма 1. N(f) s L(f) (mod 2). Доказательство. Пусть / = aoxn + aix71-1 + ... + an-ix + а„ (а0 > 0, ап ф 0). Тогда /@) = о,» и /(х) > 0 при достаточно больших х. Когда мы двигаемся вправо по числовой прямой, то при прохождении ка- каждого корня /(х) меняет свой знак (а при прохождении fc-кратного корня знак f\x) умножается на ('—1)*, т. е. как бы меняется к раз). Поэтому N(f) четно, если ап > 0, и нечетно, если а,» < 0. То же самое можно сказать и об L{f).
§3.4. Корин многочленов с действительными коэффициентами 115 Лемма 2. N(f) < N(f') + 1. Доказательство. По теореме Ролля между любыми дву- двумя корнями многочлена / лежит корень его производной. Кроме того, каждый fc-кратный корень многочлена / является (к — 1)- кратным корнем его производной (следствие теоремы 2.4). Отсюда получаем, что N(f') > N(f) — 1. Лемма 3. L(f') < L(f). Доказательство очевидно. Число отрицательных корней многочлена / равно числу поло- положительных корней многочлена 7(х) = /(-х). Лемма 4- L(f) + L(J) < n = deg /. Доказательство. Коэффициенты многочлена / получа- получаются из коэффициентов многочлена / попеременным умножением на ±1. Предположим вначале, что все коэффициенты ao,ai,... ,ап многочлена / отличны от нуля. Если тогда на fc-м месте в после- последовательности оо, а\,..., ап имеется перемена знака, то на том же месте в последовательности коэффициентов многочлена / переме- перемены знака нет, и наоборот. Поэтому в этом случае L(f) +L(/) = n. В общем случае, когда среди коэффициентов ао,а\,... ,ап мо- могут быть нули, при их замене произвольными числами, отличны- отличными от нуля, числа L(f) и L(f) могут только увеличиться. Так как после_этого их сумма по доказанному станет равной п, то ЧЛ + L{f) < п. Доказательство теоремы. Докажем неравенство N(f) < L(f) индукцией по deg/. Если deg/ = 0, то N(f) = = L(f) = 0. Пусть deg/ = n > 0. Тогда deg/' — n — 1. Пользуясь леммами 2 и 3 и предположением индукции, получаем: N(f) < N(f') + 1 < ?,(/') + 1 < L(f) + 1. Однако равенство N(f) = L(f) + 1 невозможно ввиду леммы 1. Следовательно, N(f) < L(f). Пусть теперь известно, что все корни многочлена / действи- действительны. Мы можем считать, что 0 не является корнем. Имеем тогда в силу уже доказанного неравенства и леммы 4: п = N(f) + N(J) < L(f) + L{J) < n,
116 Глава 3. Начала алгебры многочленов откуда _ ( ) Пример 4. Для многочлена / из примера 3 имеем L(f) = 2, так что N(f) ^ 2. Но мы уже установили, что N(f) ^ 2. Следова- Следовательно, N(f) = 2. Пример 5. Многочлен / = х2 — х +1 не имеет положительных (и вообще действительных) корней, но L(f) — 2, так что в этом случае N{f) < L(f). Применяя теорему Декарта к многочлену д(а;) = /(с + i) = /(с) + —17~ж + ~^рж + ... Ч ^|—а; , мы получаем информацию о числе корней многочлена / в проме- промежутке (с, +оо). В частности, если все коэффициенты многочлена д неотрицательны, то он не имеет положительных корней (триви- (тривиальной случай теоремы Декарта), а это означает, что все действи- действительные корни многочлена / не превосходят с. Пример в. Найдем границы действительных корней много- многочлена / = а;5 - 5ж3 - 10х2 + 2. Пользуясь схемой Горнера, вычислим /C): 1 0-5 -10 0 2 3 4 2 6 20 Мы видим, что /C) = 20 > 0. Более того, все коэффициенты не- неполного частного оказались положительными. Поэтому все произ- производные многочлена / при х — 3 также положительны (см. пример 2.3) и, значит, все его действительные корни меньше 3. Рассмотрим теперь многочлен J(x) = -f(-x) = Xs - Ъхг + Юх2 - 2. Вычислим значения многочлена / и его производных при х — I: 1 1 1 1 1 0 1 2 3 —о 4 -2 1 10 6 4 5 0 6 10 -2 4 Мы видим, что 7 = 4>0,
§3.4. Корни многочленов с действительными коэффициентами 117 Значения следующих производных также положительны, посколь- поскольку последняя строка таблицы состоит только из положительных чи- чисел. Следовательно, все действительные корни многочлена / мень- меньше 1, а это означает, что все действительные корни многочлена / больше —1. Таким образом, все действительные корни многочлена / лежат в интервале (—1,3). _ Задача. Исследовав производную многочлена /, доказать, что многочлен / из предыдущего примера имеет только один отрица- отрицательный корень. Обратимся теперь к вопросу о приближенном вычислении кор- корней. Если известно, что многочлен / € Щх] имеет ровно один корень в каком-то интервале, то этот корень может быть в принципе най- найден с любой степенью точности с помощью вычисления значений многочлена в подходящим образом подобранных точках. Поясним это на следующем примере. Пример 7. Как мы показали (см. пример 4), многочлен / из примера 3 имеет ровно один корень в интервале A,2). Найдем зна- значение этого корня с точностью до 0,01. Мы видели, что /A) < 0. Вычисляя /(х) при х = 1,1, 1,2, 1,3, мы обнаруживаем, что /A,2) < 0, /A,3) >0. Следовательно, корень лежит в интервале A,2; 1,3). Вычисляя /(х) при х = 1,21, 1,22, 1,23, 1,24, 1,25, находим, что /A,24)<0, /A,25) >0. Следовательно, искомый корень лежит в интервале A,24; 1,25). Конечно, существуют гораздо более совершенные методы при- приближенного вычисления корней. Они применимы к алгебраическим уравнениям любой степени, а некоторые из них — и к трансцен- трансцендентным уравнениям. Однако изложение этих методов выходит за рамки нашего курса: они относятся скорее к вычислительной ма- математике, чем к алгебре. Замечание. Если многочлен имеет кратный корень, но его ко- коэффициенты даны нам лишь приближенно, хотя бы и с любой сте- степенью точности, то мы в принципе не можем доказать наличие этого кратного корня, так как при сколь угодно малом изменении коэффициентов многочлена он может либо рассыпаться на про- простые корни, либо вообще перестать существовать. Так, в случае двукратного корня мы никогда не сможем сделать выбор между си-
118 Глава 3. Начала алгебры многочленов туациями, изображенными на рис. 18а, а в случае трехкратного между ситуациями, изображенными на рис. 186. а) б) 'А Рис. 18 §3.5. Теория делимости в евклидовых кольцах Разложение многочленов над С на линейные множители и много- многочленов над Ш на линейные и квадратные множители аналогично разложению целых чисел на простые множители. Для многочле- многочленов над произвольным полем также имеется подобное разложение, но его множители могут иметь любую степень. Задачу отыскания такого разложения можно рассматривать как обобщение задачи отыскания корней многочлена (которой она равносильна в случае многочленов над С). Она не имеет общего решения, пригодного для любого поля. В этом параграфе мы докажем единственность ука- указанного разложения. Одновременно мы докажем единственность разложения целого числа на простые множители — факт широко известный, но не доказываемый в средней школе. Для того чтобы охватить единым рассуждением оба случая, введем некоторые общие понятия. Определение 1. Коммутативное ассоциативное кольцо с еди- единицей и без делителей нуля называется целостным кольцом (или областью целостности). Так, кольцо Z целых чисел и кольцо К[х] многочленов над лю- любым полем К являются целостными кольцами. Более того, кольцо многочленов над любым целостным кольцом также является це- целостным кольцом (см. замечание 1.3). Пусть А — целостное кольцо. Говорят, что элемент а € А делится на элемент Ь € А (обозначение: а ': Ь) или, иначе, что Ъ делит а (обозначение: 6 | а), если существует такой элемент q <Е А, что а = qb. Элементы а и Ь называются ассоциированны-
§3.5. Теория делимости в евклидовых кольцах 119 ми (обозначение: а ~ Ь), если выполняется любое из следующих эквивалентных условий: 1) Ь | а и а | Ь; 2) а = cb, где с — обратимый элемент. В следующем определении аксиоматизируется то общее, что есть у кольца многочленов над полем и кольца целых чисел — возможность деления с остатком. Определение 2. Целостное кольцо А, не являющееся полем, называется евклидовым, если существует функция N: A\{0}-»Z+ (называемая нормой), удовлетворяющая следующим условиям: 1) N(ab) ^ N(a), причем равенство имеет место только тогда, когда элемент Ь обратим; 2) для любых a,b G А, где 6^0, существуют такие д, г € А, что а = qb + г и либо г = 0, либо N(r) < N(b). Замечание 1. Условие 2) означает возможность «деления с остатком». Его единственности (т.е. однозначной определенности пары (q, г)) не требуется. Замечание 2. Вторая часть условия 1) на самом деле может быть выведена из остальных условий. В самом деле, пусть элемент b необратим. Тогда а не делится на аЬ. Разделим а на ab с остатком: а = q(ab) + г. Так как г = аA — qb), то N(a) < N(r) < N(ab). Основными для нас примерами евклидовых колец являются кольцо Z целых чисел и кольцо К[х] многочленов над полем К. В качестве нормы в первом случае можно взять модуль целого числа, во втором — степень многочлена. Существуют и другие евклидовы кольца. Пример. Комплексные числа вида с = а + Ы, где a, b E Z, называются целыми гауссовыми числами. Они образуют подколь- цо в С, обозначаемое через Щг]. Кольцо Z[i] является евклидовым относительно нормы В самом деле, очевидно, что N(cd) = N(c)N(d)
120 Глава 3, Начала алгебры многочленов и, поскольку NA) = 1, обратимые элементы кольца Z[i] — это элементы с нормой 1, т. е. ±1 и ±*. Отсюда следует, что выполнено условие 1) в определении евклидова кольца. Докажем возможность деления с остатком. Пусть c,d € Z[t], d ф 0. Рассмотрим целое гауссово число о, ближайшее к -т. Легко видеть, что - — q а а (см. рис. 19). Положим г = с — qd. Тогда с = qd + г и N(r) = \c- qdf = ~-qf \df < ^N(d) < N(d). 1 m m • % -1 •— i 0 • • i • • • • • d * • • • • Рис. 19 Определение 3. Наибольшим общим делителем элементов а и Ь целостного кольца называется их общий делитель, делящий- делящийся на все их общие делители. Он обозначается через (а, Ь) или НОД(а,6). Наибольший общий делитель, если он существует, определен однозначно с точностью до ассоциированности. Однако он может не существовать. Например, элементы 2 и х в кольце Щх\ не имеют наибольшего общего делителя. Теорема 1. В евклидовом кольце для любых элементов а, Ь существует наибольший общий делитель d и он может быть представлен в виде d — аи + bv, где и, v — какие-то элементы кольца. Доказательство. Если Ъ — 0, то d = а = а-1+6-0. Если а делится на 6, той = 6 = а-0+Ь-1. В противном случае разделим с остатком а на Ь, затем Ь на полученный остаток, затем первый остаток на второй остаток и т.д. Так как нормы остатков убыва- убывают, то в конце концов деление произойдет без остатка. Получим
§3.5. Теория делимости в евклидовых кольцах 121 цепочку равенств: = дзг2 + Гп-2 = ЯпГп-1 + Гп, Гп-1 — Докажем, что последний ненулевой остаток гп и есть наибольший общий делитель элементов а и ft. Двигаясь по выписанной цепочке равенств снизу вверх, полу- получаем последовательно гп 11"п_ь г„ | г„_2, ... , гп | гг, г„ | Ь, г„ | а. Таким образом, гп — общий делитель элементов а и Ь. Двигаясь по той же цепочке равенств сверху вниз, получаем последовательно гх —au\ = аиз + bv 3, г„ = aun + bv где ui,Vi (i = 1,... ,n) — какие-то элементы кольца (например, ui = 1, vi = —q\). Таким образом, гп можно представить в виде rn = au + bv. Отсюда, в свою очередь, следует, что гп делится на любой общий делитель элементов а и Ь. Процедура нахождения наибольшего общего делителя, исполь- использованная в этом доказательстве, называется алгоритмом Евклида. Элементы а, Ъ € А называются взаимно простыми, если (а, Ъ) = = 1. В этом случае согласно доказанной теореме существуют такие u, v € А, что аи + bv = 1. Перейдем теперь к вопросу о разложении на простые множи- множители. Определение 4. Необратимый ненулевой элемент р целостно- целостного кольца называется простым, если он не может быть представлен в виде р = аЬ, где а и Ъ — необратимые элементы.
122 Глава 3. Начала алгебры многочленов Иначе говоря, элемент р простой, если всякий его делитель ассоциирован либо с 1, либо с р. Простые элементы кольца Z в этом смысле — это числа вида ±р, где р — простое число. Простые элементы кольца К[х], где К — поле, по традиции на- называются неприводимыми многочленами. Таким образом, непри- неприводимый многочлен — это такой многочлен положительной степе- степени, который не может быть разложен в произведение двух много- многочленов положительной степени. Очевидно, что всякий многочлен первой степени неприводим. Из основной теоремы алгебры комплексных чисел следует, что не- неприводимые многочлены над С — это только многочлены первой степени, а из теоремы 4.1 — что неприводимые многочлены над R — это многочлены первой степени и многочлены второй степени с отрицательным дискриминантом. В следующем параграфе мы об- обсудим вопрос о неприводимых многочленах над Q и, в частности, увидим, что они могут иметь любую степень. Пусть теперь А — любое евклидово кольцо. Лемма 1. Если простой элемент р кольца А делит произве- произведение а\п2 ... an, то р делит хотя бы один из сомножителей .. ,ап. Доказательство. Докажем это утверждение индукцией по п. При п = 2 предположим, что р не делит ах. Тогда [р,а\) = 1 и, значит, существуют такие и, v € А, что ри + a\v = 1. Умножая это равенство на аг, получаем откуда следует, что р делит а%. При п > 2 представим произведение а\п2...ап в виде а.\{а.2 ...On). По доказанному р | ах или р \ аъ .. .ап. Во втором случае по предположению индукции р \ сц, где i — один из индексов 2,..., п. Теорема 2. В евклидовом кольце всякий необратимый нену- ненулевой элемент может быть разложен на простые множители, причем это разложение единственно с точностью до переста- перестановки множителей и умножения их на обратимые элементы. Замечание 3. Говоря о разложении на простые множители, мы не исключаем разложения, состоящего только из одного мно- множителя.
§3.5. Теория делимости в евклидовых кольцах 123 Доказательство. Назовем необратимый ненулевой эле- элемент а € А хорошим, если он может быть разложен на простые множители. Предположим, что существуют плохие элементы. Вы- Выберем из них элемент с наименьшей нормой. Пусть это будет эле- элемент а. Он не может быть простым. Следовательно, а — Ьс, где Ъ и с — необратимые элементы. Имеем N(b) < N(a) и N(c) < N(a) и, значит, бис — хорошие элементы; но тогда, очевидно, и а — хороший элемент, что противоречит нашему предположению. Таким образом, всякий необратимый ненулевой элемент кольца А может быть разложен на простые множители. Докажем теперь индукцией по п, что если а = Р\Р2...рп = Ч\Чг--Чт, D5) где Pi, qj — простые элементы, то т = п и, после подходящей перенумерации множителей, щ ~ <fi при i = 1,2,..., п. При п = 1 это утверждение очевидно. При п > 1 имеем Pi I ?i?2 • • • Qm и по лемме 1 существует такой номер t, что р\ \ qi. Тогда р\ ~ qi. Можно считать, что г = 1 и р\ = q\. Сокращая равенство D5) нарх, получаем: Р2- -Рп — 42- -Ят- По предположению индукции отсюда следует, что т = п и, после подходящей перенумерации, Pi ~ 9t при г = 2,..., п. Тем самым утверждение доказано. Следствие 1. Пусть а = р\х ... р*' — разложение элемента а Е А на простые множители, причем pi / Pj при i ф j. Тогда всякий делитель d элемента а имеет вид где 0 ^ li ^ ki (i = 1,..., з), а с — обратимый элемент. Доказательство. Пусть а = qd. Разложим q и d на про- простые множители. Перемножив эти разложения, мы получим разло- разложение а на простые множители. Сравнив его с данным разложени- разложением, получим требуемый результат. Задача 1. Доказать, что в евклидовом кольце а) Ъ | а, с | а и (Ь, с) = 1 =Ф- Ьс | а; б) с | аЬ и (Ь, с) = 1 =Ф- с | а.
124 Глава 3. Начала алгебры многочленов Задача 2. Наименьшим общим кратным элементов а и 6 це- целостного кольца называется их общее кратное (т. е. элемент, деля- делящийся на а и на 6), делящее все их общие кратные. Оно обознача- обозначается через [а, Ь] или НОК(а, Ь). Доказать, что в евклидовом кольце для любых элементов а, Ь существует наименьшее общее кратное [а, Ь], причем (a, b) [a, b] ~ ab. Задача 3. В кольце Z[t] (см. пример 1) разложить на простые множители числа 2, 3 и 5 и подумать, в чем принципиальная раз- разница между этими тремя случаями. Известно, что простых чисел бесконечно много. Напомним рас- рассуждение, которое это доказывает. Предположим, 4Topi,p2> • • • ,Рп — это все простые числа. Тогда число pi,P2,... ,Рп + 1 не делит- делится ни на одно из них, что очевидно, невозможно. Точно такое же рассуждение показывает бесконечность числа нормированных не- неприводимых многочленов над любым полем К. Если поле К бес- бесконечно, то этот результат не представляет интереса, так как в этом случае имеется бесконечно много нормированных многочле- многочленов первой степени. Однако если поле К конечно, то этот резуль- результат означает, что имеются неприводимые многочлены сколь угодно высокой степени. На самом деле в этом случае имеются неприво- неприводимые многочлены любой степени. Задача 4. Перечислить неприводимые многочлены степеней < 4 над полем Z2 и доказать, что существует ровно 6 неприводи- неприводимых многочленов степени 5. §3.6. Многочлены с рациональными коэффициентами Из однозначности разложения целого числа на простые множители вытекает Теорема 1. Если многочлен f = оо*п + агх"-1 + ... + On-ix + an € Щх] имеет рациональный корень —, где и, v 6 Z, («, v) — 1, то и j an uv\oq. Доказательство. Имеем: О = vnf (¦?) = оо«п + а1«в~г« + ... + On-xuv*1 + OnVn.
§3.6. Многочлены с рациональными коэффициентами 125 Все слагаемые в правой части, кроме последнего, делятся на и. Следовательно, и последнее слагаемое должно делиться на и. Но так как и и v взаимно просты, то ап делится на и (см. задачу 5.16). Аналогично доказывается, что oq делится на v. Следствие. Если нормированный многочлен с целыми коэф- коэффициентами имеет рациональный корень, то этот корень — целый. Очевидно, что всякий многочлен с рациональными коэффициен- коэффициентами пропорционален многочлену с целыми коэффициентами. По- Поэтому теорема 1 позволяет путем конечного числа испытаний най- найти все рациональные корни любого многочлена с рациональными коэффициентами. Конечно, таких корней, как правило, нет. Приво- Приводимый ниже специально подобранный пример относится к разряду тех исключений, которые подтверждают правило. Пример 1. Рациональными корнями многочлена / = 2х4 - 7х3 + 4х2 - 2х - 3 согласно теореме 1 могут быть только ±- Испытания дают 2 корня: ±-L 4-1 4-— 4-4 __, _ 1 x\ — о, Х2 — —2". Следующая теорема может рассматриваться как обобщение те- теоремы 1. Теорема 2 (Лемма Гаусса). Если многочлен с целыми коэф- коэффициентами разлагается в произведение двух многочленов с рациональными коэффициентами, то он разлагается в произ- произведение двух пропорциональных им многочленов с целыми коэф- коэффициентами. Иначе говоря, если / € Z[x] и / = gh, где g,h € Qfc], то существует такое Л € Q", что Хд, Л/» € Щх\. Перед тем, как доказывать эту теорему, введем некоторые вспо- вспомогательные понятия. Многочлен / € Ъ\х\ называется примитивным, если его коэф- коэффициенты взаимно просты в совокупности, т.е. не имеют общего
126 Глава 3. Начала алгебры многочленов простого делителя. Если такой делитель есть, то его можно вынести за скобки. Поэтому всякий многочлен с целыми коэффициентами, а значит, и всякий многочлен с рациональными коэффициентами, пропорционален некоторому примитивному многочлену (определен- (определенному однозначно с точностью до умножения на ±1). Пусть р — какое-нибудь простое число. Определим редукцию по модулю р многочлена / = OQXn + аххп~х + ... + пп-ix + Оп€ Z[x] как многочлен [f]P = ЫРхп + [ах]рхп-х + ... + [ап_х]рх + [пп]р € Ър[х\, коэффициенты которого суть вычеты по модулю р коэффициентов многочлена /. Из определения операций над вычетами следует, что [/ + 9]Р = [f]P + Ыр, [fg)p = [ПрЫр для любых многочленов f,g€ Z[x]. Доказательство теоремы. Пусть / € Ъ[х] и / = gh, где g,h G Q[x]. Согласно предыдущему многочлены g и h пропор- пропорциональны каким-то примитивным многочленам д\ и h\. Имеем: / = ftgihi, (л € Q. Пусть /i = —, где и, v € Z, (и, v) = 1. Докажем.-что v — ±1, откуда будет следовать утверждение теоремы. Если это не так, то пусть р — какой-нибудь простой делитель числа v. В равенстве vf = ugxhi сделаем редукцию по модулю р. Мы получим О = b4P[9i]p[hi]p. Однако [и]р ф 0, так как и и v по предположению взаимно просты. В то же время \д{\р /Ои [hi]p ф 0, так как д\ к hx — при- примитивные многочлены и, следовательно, все их коэффициенты не могут делиться на р. Это противоречит отсутствию делителей нуля в кольце Zp[x]. Следствие. Если многочлен f € Щх\ допускает разложе- разложение в произведение двух многочленов положительной степени в кольце Щх\, то он допускает такое разложение и в кольце Z[x].
§3.6. Многочлены с рациональными коэффициентами ^27 Это существенно облегчает доказательство неприводимости многочленов над Q. Пример 2. Пусть р — простое число. Докажем неприводи- неприводимость над Q «многочлена деления круга на р частей» (Комплексными корнями этого многочлена являются все нетриви- нетривиальные корни p-й степени из 1, которые вместе с 1 делят окруж- окружность \z\ = 1 на р равных частей.) Как следует из формулы бинома Ньютона (см. §1.6), в кольце Zp[x] имеет место равенство х" - 1 = (х - 1)р, так что Если / = gh, где g,h 6 Щх] — многочлены положительной степе- степени, то [/]р = [fir]p[/»]p и, значит, Следовательно, Ы1)]р = ЫрA) = о, [MD]p - Wpd) = о, т. е. дA) и /»A) делятся на р. Но тогда /A) = g(l)h(l) делится на р2, что не соответствует действительности, ибо /A) = р. Имеется способ, принадлежащий Кронекеру, который в прин- принципе позволяет для любого многочлена с целыми коэффициентами определить, приводим он или неприводим над Q. Он основывается на следующих соображениях. Пусть / Е Z[x] — многочлен степени п, не имеющий целых корней. Предположим, что он разлагается в Щх] в произведение двух многочленов положительной степени: f = gh. Тогда степень одного из них, скажем, д, не превосходит т = — . Будем придавать х различные целые значения хо,х\,... ,хт. Из равенств следует, что g(xi) | /(х*) при i = 0,1,..., т. Многочлен д одно- однозначно определяется своими значениями в точках xq,xi,. .. ,xm.
128 Глава 3. Начала алгебры многочленов Выбирая всевозможные наборы делителей do,di,..., dm целых чи- чисел f(xo),f(xi),...,f(xm) и находя для каждого из них интер- интерполяционный многочлен степени < т, принимающий в точках xq,xi,. .. ,хт значения do,d\,... ,dm, можно найти всех канди- кандидатов на роль д (их будет конечное число). Тех из них, которые имеют дробные коэффициенты, следует сразу отбросить. Испытав оставшиеся многочлены, можно определить, имеются ли среди них делители многочлена /, в зависимости от чего и будет решен во- вопрос о приводимости последнего. §3.7. Многочлены от нескольких переменных Функция действительных переменных xi,X2,...,xn называется многочленом, если она может быть представлена в виде S1 •••*?". D6) где суммирование происходит по конечному числу наборов (ki,k2y... ,кп) неотрицательных целых чисел. (Формально можно считать, что суммирование происходит по всем таким наборам, но лишь конечное число коэффициентов ajt,jt2...jt» отлично от нуля.) Многочлены образуют подалгебру в алгебре всех функ- функций от х\,Х2,- ¦ ¦ ,хп. Она называется алгеброй многочленов от xi, X2,..., хп над R и обозначается Щх\, хг,..., хп]. Можно показать (см. теорему 6.1), что представление многочле- многочлена над К в виде D6) однозначно, т. е. коэффициенты многочлена определяются его значениями. При определении алгебры многочленов от п переменных над любым полем К возникает такая же трудность, как и в случае од- одной переменной. Это приводит к необходимости формального опре- определения, которое может быть дано, например, следующим образом. Рассмотрим бесконечномерную алгебру над К с базисом ..*:„ : к\, &2, • • •. кп & Z и таблицей умножения Очевидно, что эта алгебра коммутативна и ассоциативна и что элемент еоо...о является ее единицей. Она называется алгеброй многочленов над К и обозначается через К[х\,Х2, • ¦ • ,хп].
§3.7- Многочлены от нескольких переменных 129 Условимся отождествлять элементы вида аеоо...о (а € К) с соответствующими элементами поля К и введем обозначения ею...о = eoi...o = еоо..л = Яп- Тогда ек1к3..А„=х?Х2* •••4" и любой элемент 53 «*,**...*„ в*,*,...*,. 6 ^[хЬ Х2, . . . , Хп] kltk2,...,kn записывается в обычном виде D6). Многочлен D6) называется однородным степени d, если afc,fc3...fc« = 0 при fci + к2 + ... + кп ф d. Однородные многочлены заданной степени d образуют конечномер- конечномерное подпространство, так как имеется лишь конечное число набо- наборов (ki,k2,... ,кп) целых неотрицательных чисел, удовлетворяю- удовлетворяющих условию ki+k2 + ...+kn = d. Задача. Доказать, что размерность пространства однородных многочленов степени d от п переменных равна nd n(n + l)...(n + d-l) Сп = (число сочетаний с повторениями из п по d). Любой многочлен однозначно представляется в виде суммы од- однородных многочленов степеней 0,1,2,..., называемых его одно- однородными компонентами. (Лишь конечное число из них отлично от нуля.) Степенью (по совокупности переменных) ненулевого многочле- многочлена называется максимальная из степеней его ненулевых членов или, что то же, максимальная из степеней его ненулевых однород- однородных компонент. Степень многочлена / обозначается через deg/. Справедливы следующие соотношения: deg(/ + g) < deg / + deg g, deg(/#) = deg / + deg g. Первое из них очевидно, второе мы докажем чуть позже.
130 Глава 3. Начала алгебры многочленов С другой стороны, каждый многочлен / € К[х\, Х2,..., хп] од- однозначно представляется в виде оо . ¦., хп) = ^2 fkfa, • • •, xn)xi, D7) где /с/1,/2, ¦ • • — какие-то многочлены от Х2,.--,хп, лишь ко- конечное число которых отлично от нуля. Наибольший из номеров многочленов /&, отличных от нуля, называется степенью многочле- многочлена / по х\ и обозначается через degXl /. Пользуясь представлением D7), можно рассматривать кольцо К[х\,Х2, ... , хп] как кольцо многочленов от х\ с коэффициентами из К[х2,... ,хп]: К[хх,х2, ...,!«] = К[х2,... ,xn][xi]. D8) Замечание. Мы говорим о кольцах, а не об алгебрах, так как K[xi,x2,. ¦ ¦ ,хп\ по определению есть алгебра над К, в то вре- время как К[х2, • • ¦, xn][xi] есть алгебра над К[х2, ¦ ¦, хп]. Однако если рассматривать К[х2, • • • ,xn][xi] как алгебру над К (пользу- (пользуясь тем, что К[х2,..., хп] D К), то можно говорить о равенстве алгебр. Предложение 1. Алгебра К[х\,Х2, • • •,хп] не имеет делите- делителей нуля. Доказательство. В §3.1 было фактически доказано (см. замечание 1.3), что кольцо многочленов от одной переменной над целостным кольцом также является целостным кольцом (в част- частности, не имеет делителей нуля). Поэтому равенство D8) позво- позволяет доказать наше утверждение индуктивным путем, начиная с поля К. Теперь мы в состоянии доказать соотношение D8). Разложим многочлены / и g на однородные компоненты: / = /о + /х + -.- + Л (deg/fc = A:, /d ^ 0), 9 = 90 + 91 + • • • + 9е (deggk = fc, ge ф 0). Ясно, что при их перемножении не появится членов степени > d + + е, а сумма всех членов степени d + e будет равна fd9e- По дока- доказанному fdge Ф 0. Следовательно, deg/0 = d + e = deg/ + degg.
§3.7. Многочлены от нескольких переменных 131 Как и в случае п = 1, всякий многочлен от п переменных над полем К определяет функцию на Кп со значениями в К. Теорема 1. Если поле К бесконечно, то разные многочлены от п переменных над К определяют разные функции. Доказательство. Как и в случае многочленов от одной переменной (см. доказательство теоремы 1.1), достаточно доказать, что ненулевой многочлен определяет ненулевую функцию. Дока- Докажем это индукцией по п. При п = 1 это составляет содержание теоремы 2.1. Предпо- Предположим теперь, что многочлен / G К[х\,Х2,-.. ,хп] (п > 1) опре- определяет нулевую функцию. Представим его в виде D7) и прида- придадим какие-то значения переменным Х2,...,хп. Мы получим мно- многочлен от одной переменной х\ с коэффициентами из К, обраща- обращающийся в нуль при любом значении х\. По теореме 1.1 все его коэффициенты равны нулю. Таким образом, каждый из многочле- многочленов Д G К[х2,-. ¦ ,хп] обращается в нуль при любых значениях Ж2,... ,хп, т.е. определяет нулевую функцию. По предположению индукции отсюда следует, что Д = 0 при любом к; но тогда и / = 0. При п > 1 члены многочлена от п переменных нельзя, вообще говоря однозначно упорядочить по их степеням, поскольку может быть несколько членов одинаковой степени. Между тем какое-то упорядочение иногда бывает полезно. В этих случаях обычно ис- используют лексикографическое упорядочение (т. е. подобное упоря- упорядочению слов в словаре), при котором вначале сравниваются пока- показатели при х\, затем, если они равны, — показатели при хг и т.д. Если одночлен и лексикографически старше одночлена v, то мы бу- будем писать и >- v. Согласно определению это означает, что первая из переменных, которая входит в и и v с разными показателями, входит вис большим показателем, чем в v. Предложение 2. Отношение лексикографического упорядо- упорядочения одночленов обладает следующими свойствами: 1) если и >- v и v >- w, то и >- w (транзитивность); 2) если и >- v, то uw >- vw для любого одночлена w; 3) если «I >- vi и U2 >- V2, то uit*2 >- Первое из этих свойств, собственно, и дает основание называть отношение «>-» упорядочением.
132 Глава 3. Начала алгебры многочленов Доказательство. 1) Пусть первая переменная, которая не входит во все одночлены «,v, w с одним и тем же показателем, входит в них с показателями k,l,m соответственно. Тогда к ^ I ^ т, причем хотя бы в одном из двух случаев имеет место строгое не- неравенство. Следовательно, к > т, а это и означает, что и >~ w. 2) При умножении на w к показателям, с которыми каждая из переменных входит в и и «, добавляется одно и то же число, и знак неравенства (или равенства) между этими показателями не меня- меняется, а только эти неравенства и имеют значение при сравнении одночленов. 3) Пользуясь предыдущим свойством, получаем: Пример. Следующий многочлен расположен по лексикографи- лексикографическому убыванию членов: — Х2Х3 + 3. Обратите внимание на то, что член х\х%хз лексикографически младше х\х2, хотя его степень больше. Среди ненулевых членов любого ненулевого многочлена / € € К[х\,Х2, ... ,хп] имеется единственный, который лексикогра- лексикографически старше всех остальных. Он называется старшим членом многочлена /. Предложение 3. Старший член произведения ненулевых многочленов равен произведению их старших членов. Доказательство. Достаточно доказать это утверждение для двух многочленов. Пусть /г,/г — ненулевые многочлены, Щ,^2 — их старшие члены, Ui,«2 — какие-то их члены. Если v\ ф и\ или V2 Ф иг, то в силу предложения 2 Следовательно, после приведения подобных членов в произведении /i/г произведение uit*2 сохранится в качестве ненулевого члена, который старше всех остальных.
§3.8. Симметрические многочлены 133 §3.8. Симметрические многочлены Определение. Многочлен / € K[xi,X2,... ,хп] называется сим- симметрическим, если он не изменяется при любых перестановках переменных. Так как любая перестановка может быть осуществлена путем последовательных перестановок двух элементов, то многочлен является симметрическим, если он не изменяется при перестанов- перестановке любых двух переменных. Очевидно, что каждая однородная компонента симметрического многочлена также является симметрическим многочленом. Пример 1. Степенные суммы sfc = xJ + x§ + ... + a? (fc = 1,2,...), очевидно, являются симметрическими многочленами. Пример 2. Следующие симметрические многочлены называют- называются элементарными симметрическими многочленами: хп-\хп, . . .Хп. Пример 3. Определитель Вандермонда V{x\,X2,...,Xn) = Д (Xi -Xj) (см. пример 2.4.5), представляющий собой произведение разностей всевозможных пар переменных, при перестановках переменных мо- может только умножиться на ±1 за счет того, что в некоторых слу- случаях уменьшаемое и вычитаемое поменяются ролями. Число таких случаев равно числу инверсий в соответствующей перестановке. Следовательно, V{xkl,хк„ ..., х*J = sgn(fci,fc2,..., kn)V(xi, x2,...,xn). Таким образом, сам определитель Вандермонда не является симме-
134 Глава 3. Начала алгебры многочленов трическим многочленом, но таковым является его квадрат V(xUX2, . • • , ХПJ = Д (Xi - Xjf. Пример 4. При любых перестановках переменных Х\, Х2, а?з, х\ многочлены Н\ ав Х\Х2 + Х3Х4, /»2 — X\Xz + Х2Х$, Лз — Х\Х^ + Х%Хз переставляются между собой. Поэтому любой симметриче- симметрический многочлен от них будет симметрическим многочленом от з,Х4- В частности, таковым является их произведение Задача 1. Доказать, что многочлен (Xi + Х2 — Хз — X4)(Xi —X2+X3 — Xi)(xi —X2—X3 + Х4) является симметрическим. Симметрические многочлены находят применение к алгебраи- алгебраическим уравнениям с одним неизвестным благодаря формулам Ви- ета (см. §3.2), которые выражают элементарные симметрические многочлены от корней алгебраического уравнения через его коэф- коэффициенты (при условии, что число корней уравнения в рассматри- рассматриваемом поле равно его степени). Ясно, что только симметрические многочлены от корней уравнения однозначно определены: значение любого другого многочлена, вообще говоря, зависит от нумерации корней. С другой стороны, мы покажем, что любой симметриче- симметрический многочлен от корней алгебраического уравнения может быть выражен через коэффициенты этого уравнения. Пример 5. Многочлен S2 = х\ + х\ + ... + х\ является сим- симметрическим. Легко видеть, что D9) Поэтому сумма квадратов корней алгебраического уравнения хп + аххп~х + а2хп~2 + ... + ап-гх + о,, = О равна а? — 2аг- Очевидно, что сумма и произведение симметрических много- многочленов, а также произведение симметрического многочлена на чи- число, являются симметрическими многочленами. Иными словами,
§3.8. Симметрические многочлены 135 симметрические многочлены образуют подалгебру в алгебре всех многочленов. Следовательно, если F € К[Х\,Х2, ¦ •. ,Хт] — произвольный многочлен от т переменных и /i,/г, • • •, fm € К[xi, хг,...,хп] — какие-то симметрические многочлены, то -Р^/г./г, • • • ,/т) — также симметрический многочлен от х\ухг,- • • ,хп. Естественно поставить вопрос, нельзя ли найти такие симметрические мно- многочлены /i,/a, • ¦ • ,/m. чтобы всякий симметрический многочлен можно было выразить через них указанным способом. Оказывает- Оказывается, что в качестве таких многочленов можно взять элементарные симметрические многочлены сп,стг,... ,сгп. Теорема 1. Всякий симметрический многочлен единствен- единственным образом представляется в виде многочлена от элементар- элементарных симметрических многочленов. Доказательству теоремы предпошлем две леммы. Лемма 1. Пусть и = ах\хх^ ... х?- — старший член симме- симметрического многочлена /. Тогда к\ ^ &2 ^ • • • ^ кп- E0) Доказательство. Предположим, что ki < fcf+i для неко- некоторого i. Наряду с членом и многочлен / должен содержать член и =axi1...xi' xi+1...xn", получающийся из и перестановкой х$ и Xi+i- Легко видеть, что и' >- и. Это противоречит тому, что и — старший член многочле- многочлена /. Лемма 2. Для любого одночлена и = х^1 х*7... х?", пока- показатели которого удовлетворяют неравенствам E0), суще- существуют такие неотрицательные целые числа l\,h, • • ¦ ^п, что старший член многочлена о\ о^ ... о\? совпадает с и. Числа li, I2,..., ln определены этим условием однозначно. Доказательство. Старший член многочлена а к равен ¦ •Хк- В силу предложения 3 старший член многочлена ... crjj" равен
136 Глава 3. Начала алгебры многочленов Приравнивая его одночлену и, получаем систему линейных урав- уравнений которая, очевидно, имеет единственное решение fc = fc-*l+i(t = lf2,...,n-l)f In = kn. E1) Из условия леммы следует, что определенные таким образом числа h,h,• • • ,ln неотрицательны. Замечание 1. Уравнение h + 12 + ... + ln = ki показывает, что степень одночлена Х[1 Х23 ¦ • • X}? по совокупности переменных равна степени одночлена и по ii. Доказательство теоремы. Пусть/ е К[х\,х2,... ,хп] — симметрический многочлен. Нам нужно найти такой многочлен F€K[XUX2, ... ,ХЯ], что Если / = 0, то можно взять F = 0. В противном случае пусть ui = ах\1Х2* •Яп" — старший член многочлена /. По лемме 1 выполняются неравенства E0). По лемме 2 существует такой одночлен Fi € К[Х\,Х2,... .,Хп}, что старший член мно- многочлена Fi(<ti,<T2,. .. ,<тп) равен щ. Рассмотрим симметрический многочлен Если /i = 0, то можно взять F = F\. В противном случае пусть и2 — старший член многочлена Д. Ясно, что он младше, чем щ. Существует такой одночлен F2 € K[Xi,X2,. ¦ ¦ ,Хп], что старший член многочлена F2{a\,a2y... ,<тп) равен и2. Рассмотрим симме- симметрический многочлен h — /г- F2(ai,a2, •¦, <*п)- Если /г = 0, то можно взять F = i*i 4- J*2- В противном случае, продолжая процесс, получаем последовательность симметрических многочленов f,fi,f2,..-, старшие члены которых удовлетворяют неравенствам
§3.8. Симметрические многочлены 137 По лемме 1 показатель при любой переменной в любом из од- одночленов Um не превосходит показателя при х\ в этом одночлене, а он, в свою очередь, не превосходит к\. Поэтому для наборов показателей одночленов ит имеется лишь конечное число возмож- возможностей, так что описанный выше процесс должен оборваться. Это означает, что /м = 0 для некоторого М. В качестве F можно тогда взять F\ + F2 + ... + Fm- Докажем теперь, что многочлен F определен однозначно. Пред- Предположим, что F и G — такие многочлены, что ,. ¦. ,ап) = Рассмотрим их разность Н = F — G. Тогда Н (ах, <гг, •••,<**) = 0. Нам нужно доказать, что И = 0. Предположим, что это не так, и пусть Нх,Н2,...,Н3 — все ненулевые члены многочлена if. Обозначим через ад» (»" = 1,2,..., а) старший член многочлена Нх(о\,02,¦ • •,<*п) 6 К[хг,х2,...,хп]. В силу леммы 2 среди одночленов w\,W2,... ,wa нет пропорцио- пропорциональных. Выберем из них старший. Пусть это будет здь По по- построению одночлен шх старше всех остальных членов многочле- многочлена Н\(а\, <У2,..., егп) и всех членов многочленов Нх(а\, оъ,..., ап) (i — 2,... ,з). Поэтому после приведения подобных членов в сумме ..., сгп) + • • • + член toj сохранится, так что эта сумма не будет равна нулю, что противоречит нашему предположению. Замечание 2. Согласно замечанию 1 для любого m degFro = degXl и™ < deg^ щ = degXl /(= А:г). Следовательно, /. E2) Следуя доказательству этой теоремы, можно в принципе найти выражение любого конкретного симметрического многочлена через
138 Глава 3. Начала алгебры многочленов Пример 6. Выразим через егг,ег2, •.. ,<тп многочлен / = а3 = х\ + х\ + ... + а?. Представим вычисления в виде таблицы. m 1 2 3 x\ -3xfx2 3x^2*3 Fm(aba2,. » ?9 + 6 -9 ? 3<73=3«?< E r b xix)xk s Cj — XiXjXk t "jX/e -3 53 a -6 ; /m С 0 XtXjS|; Таким образом, S3 = a i — E3) На практике для однородных симметрических многочленов удобнее применять другой способ, который мы поясним на следу- следующем ниже примере. Пример 7. Выразим через О\,аг,ог,о\ многочлен из примера 4. В обозначениях, доказательства теоремы, имеем щ = х\х2ХзХ4. Не производя вычислений, можно найти с точно- точностью до коэффициентов возможных кандидатов на роль одночленов ¦,из,... Во-первых, их показатели должны удовлетворять не- неравенствам леммы 1. Во-вторых, поскольку / — однородный многочлен степени 6, сумма их показателей должна равняться 6. В-третьих, они должны быть младше щ. Выпишем в таблицу все наборы показателей одночленов, удовлетворяющих этим услови- условиям, в порядке лексикографического убывания, начиная с набора показателей щ. Справа выпишем соответствующие произведе- произведения элементарных симметрических многочленов, найденные по
§3.8. Симметрические многочлены 139 формулам E1). 3 111 2 2 2 0 2 2 11 Итак, мы можем утверждать, что Для того чтобы найти коэффициенты а и Ь, будем придавать в этом равенстве переменным х\,Х2,хз,х\ какие-нибудь выбранные зна- значения. Представим вычисления в виде таблицы, в правом столбце которой будем выписывать получаемые уравнения. Х\ XI 1110 1 1-1-1 СХ\ 3 3 10 0-201 а = Таким образом, о = 1и6= —4, так что ? <т| — 4<72<74- В случае неоднородного симметрического многочлена этот спо- способ можно применить к каждой его однородной компоненте и полу- полученные выражения сложить. Замечание 3. Изложенная теория без всяких изменений пере- переносится на более общий случай, когда К — произвольное комму- коммутативное ассоциативное кольцо с единицей. Так, в случае К = Z получается следующий результат: всякий симметрический много- многочлен с целыми коэффициентами представляется в виде многочлена с целыми коэффициентами от элементарных симметрических мно- многочленов. Доказанная теорема в сочетании с формулами Виета позволяет найти любой симметрический многочлен от корней заданного ал- алгебраического уравнения. А именно, пусть / ? К[х\,Х2,-.-,хп] — симметрический многочлен и F € K[Xi,X2, • •., Хп] — такой многочлен, что Пусть далее, с\,с%,... ,Сп — корни алгебраического уравнения аохп + аххп-х + ... + On-ix + о„ в 0 (ею ф 0).
140 Глава 3. Начала алгебры многочленов Тогда Ba5) (S4) Замечание 4, Пусть degXl / = к. Тогда deg F = к (см. заме- замечание 2) и, домножив равенство E4) на uq, мы получим в правой части однородный многочлен степени к от oq, а\, аг,..., an- Пример 8. Пусть 01,02,03,04 — корни уравнения х4 + рх2 + qx + r = 0. E5) Найдем уравнение 3-й степени, корнями которого являются числа d\ = С\С2 + С3С4, С?2 = С1СЗ + С2С4> <^3 = С\С\ + С2С3. Запишем его в виде У3 + а\У2 + <ЧУ + а3 = 0. Согласно формулам Виета ах = -(<*! +d2+d3), аз = — Имеем dj = hi(ci,02,03,04), где h\,h2,hz — многочлены из при- примера 4. Находим: /»i + Лг + Лз = <Т2» i од* i* (Последнее равенство есть результат примера 7.) По формулам Виета ,С4) =0, Следовательно, oi = -р, О2 = -4г, а3 - д2 - 4рг,
§3.9. Кубические уравнения 141 т. е. искомое уравнение имеет вид ys-py2- 4гу + Dрг - q2) = 0. E6) Задача 2. В обозначениях предыдущего примера, доказать, что (сх + С2 - с3 - сцJ = 4(dx - р), (С1 -С2 + СЗ- С*J - 4(rf2 -р), (Cl -С2-СЗ+ С4>2 = 4(d3 - р) и, кроме того, (С! + С2 - С3 - C4)(Cl - С2 + С3 - Cl)(ci - Qj - С3 + С4) = -8g E7) (см. задачу 1). Пользуясь результатами этой задачи, можно свести реше- решение уравнения E5) к решению уравнения E6) (при условии, что char/С ф 2). А именно, складывая с подходящими знаками равенства с\ получаем d% —p± y/dz — pj , где число минусов должно быть четно. Исходные значения ква- квадратных корней здесь следует выбирать таким образом, чтобы их произведение равнялось — q (см. формулу E7)). Уравнение E6) называется кубической резольвентой уравне- уравнения E5). §3.9. Кубические уравнения При решении квадратных уравнений ключевую роль играет дис- дискриминант. По его обращению в нуль можно судить о наличии кратного корня, а по его зиаку (в случае поля действительных чи- чисел) — о числе действительных корней.
142 Глава 3. Начала алгебры многочленов Выясним смысл дискриминанта D(<p) квадратного трехчлена <р = oqx2 + а\х + а.2 € С[х]. Пусть с\,С2 — корни этого трехчлена. Тогда - 4clC2] = afcci - с2J. В случае, когда ац,а\,а.2 € R, полученная формула хорошо объясняет ту связь между дискриминантом и свойствами корней, о которой говорилось выше. А именно, имеются следующие три возможности: 1) ci,C2 e R, с\ Ф С2\ тогда с\ — сг — отличное от нуля действительное число и D(<p) > 0; 2) с\ = С2 е R: тогда с\ — с2 = 0 и ?>(у?) = 0; 3) с\ = С2 ^ К; тогда c\ — oi —отличное от нуля чисто мнимое число и D((p) < 0. Что еще более важно, эта формула подсказывает, как можно определить дискриминант любого многочлена <р = аохп + агхп~г + ... + Оп-гх + о„ € К[х] (оо ф 0). Предположим вначале, что многочлен <р имеет п корней с\,С2,. ¦ ¦ ,Сп € К. Определим тогда его дискриминант D(<p) по формуле *>(*>) = 4п~2 П (« - ciJ- Eg) (Показатель при а0 не так важен; почему мы выбрали его именно таким, будет ясно из дальнейшего.) Иными словами, D(<p) есть умноженное на а2,™ значение сим- симметрического многочлена (см. пример 8.3) от корней (р. Описанная в §3.8 процедура позволяет выразить D(<p) через коэффициенты <р. Так как , / = 2п - 2,
§3.9. Кубические уравнения 143 то в силу замечания 8.4 это выражение будет представлять собой некоторый однородный многочлен А степени 2п — 2 от = Д(во,аь..., а»). E9) Для нахождения многочлена А нет необходимости знать, что многочлен <р имеет п корней в К. Это позволяет определить дис- дискриминант любого многочлена <р по формуле E9). Замечание 1. Так как / имеет целые коэффициенты, то и А имеет целые коэффициенты (см. замечание 8.3). Замечание 2. Как можно доказать, для любого многочлена <р € € К[х] степени п существует расширение L поля К, в котором <р имеет п корней. (Например, если К = R, то можно взять L = С.) Так как описанная выше процедура вычисления дискриминанта не зависит от того, над каким полем рассматривается многочлен <р (лишь бы его коэффициенты лежали в этом поле), то для D{ip) бу- будет справедлива формула E8), если в качестве ci,c2, •.. ,Сп взять корни многочлена <р в поле L. Из определения E8) дискриминанта ясно, что многочлен <р € € С[х] имеет кратные корни тогда и только тогда, когда D((p) = 0. Это показывает, что наличие кратных корней является исключи- исключительным обстоятельством: если выбрать коэффициенты многочлена наудачу, то вероятность того, что он будет иметь кратные корни, равна нулю. Пусть теперь ip — кубический многочлен с действительными коэффициентами и cltC2,C3 — его комплексные корни. Тогда D{ifi) = 4(Cl - С2J(СХ - С3J(С2 - С3J. Имеются следующие три возможности (с точностью до перенуме- перенумерации корней): 1) c\,C2,cz — различные действительные числа; тогда D(v) > 0; 2) ci, с2,с3 € R, с2 = с3; тогда D(tp) = 0; 3)cx€R, C2 = ci^R; тогда О(ф) = D[(ci - c2)(ci - сг)]2<с2 - ЩJ - = «efcl - <Ы4(е2 - щJ < 0. Таким образом, мы приходим к тому же выводу, что и в слу- случае квадратного трехчлена: все корни многочлена <р действительны тогда и только тогда, когда D(<p) ^ 0.
144 Глава 3. Начала алгебры многочленов Задача. Доказать, что если <р — многочлен любой степени с действительными коэффициентами, не имеющий кратных ком- комплексных корней, то = (-1)*, где t — число пар комплексно сопряженных мнимых корней мно- многочлена tp. Мы найдем теперь явное выражение дискриминанта кубиче- кубического многочлена через его коэффициенты, но перед этим сделаем некоторые общие замечания, позволяющие упростить вычисления. Любой многочлен можно нормировать, разделив на старший коэффициент, что не изменит его корней. Далее, любой нормиро- нормированный многочлен <р - хп + аххп~х + а2хп~2 + ... + On-ix + ап над полем нулевой характеристики (или, более общо, над полем, характеристика которого не делит п) с помощью замены приводится к многочлену Ф = УП + Ь2УП~2 + ... + Ьп-1У + Ьп, в котором коэффициент при уп~1 равен нулю. Многочлен такого вида называется неполным. При п = 2 именно таким способом получается формула решения квадратного уравнения. При п > 2 эта замена не решает дела, но, во всяком случае, может упростить задачу. Найдем дискриминант неполного кубического многочлена <р = х3 + рх + q. F0) Следуя способу, изложенному в примере 8.7, будем искать вы- выражение симметрического многочлена / = (xi - х2J(хг - x3f(x2 - а?3J через элементарные симметрические многочлены oi,02,<Tz. Много- Многочлен / является однородным степени 6, и его старший член равен х\х\. Выпишем наборы показателей старших членов симметриче- симметрических многочленов, которые могут встретиться в процессе, описан- описанном в доказательстве теоремы 1, и соответствующие им произве-
§3.9. Кубические уравнения 145 а\аг дения элементарных симметрических многочленов: 4 2 0 4 11 3 3 0 3 2 1 2 2 2 Мы видим, что F1) Для вычисления D(<p) мы должны будем сделать в выражении F1) подстановку о\ = 0, 02 = Р, = -Ч- Поэтому коэффициенты а и с не будут влиять на окончательный результат, и мы можем их не находить. Для нахождения bud будем в равенстве F0) придавать пе- переменным х\, х2, хз значения, указанные в следующей таблице, в правом столбце которой выписаны получаемые при этом уравне- уравнения. Х\ 1-10 2 -1 -1 <Т\ 0 -1 О -3 о -6 = 4 -276 + Ы = 0 Таким образом, 6 — —4, d = —27 и D(ip) = -Ар3 - Ttq2. F2) Пример 1. Найдем число действительных корней многочлена (р = х3 - 0,Zx2 - 4,3ж 4- 3,9. С помощью замены pi- 0,1 приводим его к неполному многочлену (коэффициенты которого мо- могут быть найдены по схеме Горнера как в примере 2.3) 4,33у + 3,468. Теперь находим: D{<p) ш D(tp) = 4 • 4,333 - 27 • 3.4682 = 0,013 > 0.
146 Глава 3. Начала алгебры многочленов Следовательно, многочлен <р имеет 3 различных действительных корня. Замечание 3. Дискриминант кубического многочлена общего вида 3 i 2 , <р — Oqx -г aj,x + Л2Х + 01з равен y О О Q Q 9 9 /?(^) = а^аг — 40^03 — 4ao<*2 "*" 18aoaifli2a3 ~ 27аоаз» Изложим теперь способ решения кубического уравнения. Предположим, что основное поле К содержит нетривиальный (т.е. отличный от 1) кубический корень из единицы, скажем, w. Тогда ljW.w'1 — это все кубические корни из единицы, и по формуле Виета получаем w + w~l - -1. F3) Рассмотрим линейные многочлены При перестановке хъ и хз они меняются местами, а при переста- перестановке xi и Х2 многочлен h\ переходит в гиЛг, а Лг — в w~lhi. Отсюда следует, что многочлены являются симметрическими. Выражая их через элементарные сим- симметрические многочлены, получаем: / = 2а\ - 9<Т1<т2 + 27а3, 9 = о\ - 3<72. Пусть теперь с\ , сг ,сз — корни многочлена F0). Положим di =Cl+ WC2 + Ш~ХСз, С?2 = Ci + W~1C2 + VJC3- Из предыдущего следует, что rff + 4 = -27?, dxd2 = -Зр и, значит, Таким образом, d\ и d\ — это кории квадратного уравнения хг + 27qx - 27р3 = 0.
§3.9. Кубические уравнения 147 Решая его, находим: (i /??) <64) Заметим, что выражение, стоящее под знаком радикала, лишь мно- множителем — -тг— отличается от дискриминанта многочлена F0). Складывая равенства Cl + С2 + Сз = О, С\ + WC2 + VJ~lC3 = rfl, с учетом соотношения F3) получаем: Поскольку нумерация корней может быть произвольной, эта фор- формула на самом деле дает все три корня, если в качестве d\ и cfe выбирать всевозможные значения кубических корней из выраже- выражений F4) и F5), связанные полученным выше соотношением dxd2 = -Зр. F6) Таким образом, мы приходим к следующей окончательной формуле называемой формулой Кардано. Замечание 4. Формула Кардано имеет смысл, если извлека- извлекаются входящие в нее квадратные и кубические корни. В частно- частности, если мы решаем по этой формуле кубическое уравнение с действительными коэффициентами, то нам, вообще говоря, придет- придется работать с комплексными числами, даже если нас интересуют только действительные корни. Именно так обстоит дело в случае положительного дискриминанта, когда все три корня действитель- действительны: в этом случае число, стоящее под знаком квадратного радикала, отрицательно.
148 Глава 3. Начала алгебры многочленов Пример 2. Найдем корни многочлена ф из примера 1. Имеем: ^ + т = ~mDW * -°'0000120' так что под знаком одного из кубических радикалов в формуле Кардано будет стоять число - | + yj^ + ^ « -1,734 + 0,00347х « « 1,73400[соз(тг - 0,00200) + isinGr - 0,00200)]. Под знаком другого кубического радикала будет стоять комплекс- комплексно сопряженное число. Условие F6) означает в данном случае, что при извлечении кубических корней следует комбинировать их комплексно сопряженные значения. При сложении комплексно со- сопряженных чисел получается их удвоенная действительная часть. Таким образом, d » 2 ^1,73400 cos ж ~ 0;00200 « 1,20278, О с2 » 2 ^1,73400 cos 7Г + °'00200 « 1,20001, О сз « -2 ^1,73400 cos °'0°200 s -2,40277. о §3.10. Поле рациональных дробей Таким же образом, как кольцо целых чисел расширяется до поля рациональных чисел, любое целостное кольцо можно расширить до поля. Пусть А — целостное кольцо. Рассмотрим множество пар (а,Ь), где а, 6 € А, Ь ф 0, и определим в нем отношение эквива- эквивалентности по правилу Рефлексивность и симметричность этого отношения очевидны; до- докажем его транзитивность. Если (ai,6i) ~ @2,62) и ~(аз,63), то 0116263 — 026163 — 013^162, откуда после сокращения на Ъъ получаем: ai&3 = 0361, т.е. (ax,6i) ~ (а3,6з).
§3.10. Поле рациональных дробей 149 Из данного определения следует, что (а,Ь) ~ (ас,Ьс) F7) для любого с ф 0. С другой стороны, как показывает следующая ниже цепочка эквивалентностей, любая эквивалентность (a\,bi) ~ ~ (а2,^2) является следствием эквивалентностей типа F7): (аь6г) ~ @162,6162) = («261,6162) ~ (a2,b2.) (Мы сначала умножили оба члена пары (ai,6i) на 62, а затем сократили оба члена получившейся пары на 6i.) Определим теперь сложение и умножение пар по правилам: (oj, 61) + (a2,62) = (ai&2 + o26i, 6162), (ai,6i)(a2,62) = @102,6162). Докажем, что определенное выше отношение эквивалентности со- согласовано с этими операциями. В силу предыдущего достаточно показать, что при умножении обоих членов одной из пар (ai,6i) и (а2,62) на элемент с ф 0 сумма и произведение этих пар заменятся эквивалентными им парами; но очевидно, что при такой операции оба члена суммы и произведения умножатся на тот же элемент с. Класс эквивалентности, содержащий пару (а, 6), условимся за- записывать как «дробь* — (пока это просто символ, не подразуме- подразумевающий фактического деления). Ввиду доказанного выше операции сложения и умножения пар определяют операции сложения и умно- умножения дробей, осуществляемые по обычным правилам: Докажем, что относительно этих операций дроби образуют поле. Любое конечное множество дробей можно привести к общему знаменателю, а сложение дробей с одинаковыми знаменателями сводится к сложению их числителей. Поэтому сложение дробей коммутативно и ассоциативно. Дробь — (= — при любом 6^0) служит нулем для операции сложения дробей, а дробь — противо- противоположна дроби —. Таким образом, дроби образуют абелеву группу относительно сложения. Коммутативность и ассоциативность умножения очевидны. Следующая цепочка равенств доказывает дистрибутивность умно-
150 Глава 3. Начала алгебры многочленов жения дробей относительно сложения: 02Д3 _ ?1 ?5. 4- gg "" 6 Ь 6 22. ? ?5. 4- gg. 63 "" Юз ~ Ы»з "" 6 Ьз 6 6з " Дробь у служит единицей для операции умножения дробей, а при а^О дробь — обратив дроби j-. Построенное поле называется полем отношений (или полем дробей) кольца А и обозначается через Quot A. Сложение и умножение дробей вида — сводятся к соответ- „ а Ь ствующим операциям над их числителями. Кроме того, — = — только при а = Ь. Следовательно, дроби такого вида образуют под- кольцо, изоморфное А. Условившись отождествлять дробь вида — с элементом а кольца А, мы получим вложение кольца А в поле Quot Л. Далее, поскольку а Ь _ а дробь — равна отношению элементов а и 6 кольца А в поле Quot A. Таким образом, обозначение — можно теперь понимать содержа- содержательным образом. В силу F7) дробь не изменится, если ее числитель и знаме- знаменатель умножить или разделить (если это возможно) на один и тот же элемент кольца А. Если А — евклидово кольцо, то путем сокращения числителя и знаменателя на их наибольший общий делитель любая дробь приводится к виду -г-, где (а, 6) = 1. Такой вид дроби называется несократимым. (Допуская вольность речи, обычно говорят просто о несократимой дроби.) Несократимый вид дроби определен однозначно с точностью до умножения числителя и знаменателя на один и тот же обратимый элемент. Поле отношений кольца Z целых чисел есть поле Q рациональ- рациональных чисел. Поле отношений кольца К[х] многочленов над полем К называется полем рациональных дробей (или рациональных функций) над полем К и обозначается через К(х). Каждая рациональная дробь определяет функцию на К со зна- значениями в К, определенную там, где ее знаменатель (в несокра- несократимой записи) не обращается в нуль. А именно, значением дроби
§3.10. Поле рациональных дробей 151 — (fi9 € К[х\) в точке с € К называется число ~~v« Легко 9 щ 9\с) видеть, что операции сложения и умножения дробей соответству- соответствуют таким же операциям над определяемыми ими функциями в их обшей области определения. Задача 1. Доказать, что если рациональные дроби — и — над 9х 52 бесконечным полем К определяют функции, совпадающие в их общей области определения, то — = —. 9\ 52 Рациональная дробь — называется правильной, если deg / < < deg<?. Очевидно, что сумма и произведение правильных дробей являются правильными дробями. Предложение 1. Всякая рациональная дробь единственным образом представляется в виде суммы многочлена и правильной дроби. Доказательство. Пусть f,gE K[x], g Ф 0. Разделим / на g с остатком в кольце if [х]: / = qg + r (q,r€ K[x], deg г < degg). F8) Тогда ?-«+7- F9) причем правильная дробь. Обратно, из равенства F9) следу- ет равенство F8), так что единственность искомого представления рациональной дроби вытекает из однозначности деления с остатком в кольце многочленов. Изложим теперь теорию, используемую в математическом ана- анализе при интегрировании рациональных функций. Определение. Рациональная дробь — над полем К называ- 9 ется простейшей, если g = jr, где р € К\х] — неприводимый многочлен, и deg / < deg p. В частности, всякая дробь вида
152 Глава 3. Начала алгебры многочленов является простейшей. В случае К = С дробями такого вида исчер- исчерпываются все простейшие дроби. В случае К = Ш. имеются еще простейшие дроби вида тх (о, b,p,qER), {x?+px + q)K где р2 — 4д < 0. Теорема 1. Всякая правильная рациональная дробь — раз- разлагается в сумму простейших дробей. Более точно, если g = — PilP*a •••P*' — разложение многочлена g на неприводимые множители, то дробь — единственным образом разлагается в сумму простейших дробей со знаменателями РиР\, • • • ,Pi\P2,P2. ¦ • • ,Р2% • • Доказательство. Возможность указанного разложения докажем индукцией по числу неприводимых множителей много- многочлена д. Если д — неприводимый многочлен, то сама дробь — является простейшей. Если д = р , где р — неприводимый много- многочлен, то разделим / на р с остатком: / = qp + r, deg r < degp. Мы тогда получим: / _ g . г Второе из слагаемых является простейшей дробью, а первое может быть разложено в сумму простейших дробей со знаменателями р,р2,... ,р*-1 по предположению индукции. Пусть теперь s ^ 2. Так как многочлены р*1 и Л = р*а • • • Рз' взаимно просты, то существуют такие многочлены и и v, что / - ир\х + vh. G0) Мы можем добиться того, чтобы degtt<degh. G1) В самом деле, если это не так, разделим и на Л с остатком: и = qh + г, deg г < deg h.
§3.10. Поле рациональных дробей ^ 153 Равенство G0) может быть тогда переписано в виде где «i = r, vi — v + qp*1 и deg щ < deg Л. В предположении, что выполнено G1), разделим равенство G0) на д. Мы тогда получим: В силу G1) первое из слагаемых является правильной дробью. По предположению индукции оно может быть разложено в сумму простейших дробей со знаменателями Второе слагаемое является правильной дробью как разность пра- правильных дробей и по доказанному выше может быть разложено в сумму простейших дробей со знаменателями Pi.pf.---.Pi'- Это и дает нужное разложение дроби —. Докажем теперь единственность такого разложения. Если име- имеются два таких разложения, то, вычитая одно из другого, получаем равенство вида иц - Ui2_ , , «lfci , «21. , «22 , , «2fca PI P? ¦" p?1 P2 Pi ¦" p1? где degujj < degpj. Нам нужно доказать, что все многочлены Uij равны нулю. Предположим, что это не так. Пусть, например, среди многочленов un,ui2,... ,«!*, имеются ненулевые, и пусть Щк (к ^ к\) — последний из них. Умножив тогда предыдущее равенство на р\pf* • • • р*', мы получим в левой части сумму мно- многочленов, все слагаемые которой, кроме ui*P23 - ¦ • Р**. делятся на р\. Следовательно, и это слагаемое должно делиться на р\, но это невозможно, так как degui* < degpi. Пример 1. Предположим, что д = (х - ci)(x - с2) ... (х -
154 Глава 3. Начала алгебры многочленов где с\, С2,..., Сп различны. Тогда где ах.аг,.••,ая € К. Для нахождения щ умножим обе части предыдущего равенства на д и положим х = С{. Мы получим тогда: f(Ci) = Oi(a - Ci) . . . (Ci - Ci-xXc, - C+1) . . . (<H - Cn) = Oi9'(Ci), откуда ., _ Я*) Итак, ГТ G2) (при условии, что deg/ < degg). Интересно отметить, что, умно- умножив обе части этого равенства на д, мы получим интерполяцион- интерполяционную формулу Лагранжа f -\^h (» с0 •••(»- с»-г)(Д ~ c»+i) • • • (ж - задающую многочлен / степени < п, принимающий в точках cii С2,..., с„ значения 6Ь 62, • •, *п- Задача 2. Доказать равенство I»'1 n ^-r' X - ? j ' где ?o,?i> • • •, ?n-i — комплексные корни n-й степени из единицы. Задача 3. Разложить в сумму простейигах дробей над полем Zp (р — простое) дробь ^ _ . Пример 2. Метод неопределенных коэффициентов, использо- использованный в предыдущем примере, разумно применять и в более об- общей ситуации. Разложим, например, в сумму простейших дробей над Ш. рациональную дробь
§3.10. Поле рациональных дробей 155 Имеем согласно теореме: х a bx + c dx + e (x + l)(x2 + lJ x + 1 x2 + l (x2 + lJ' где a, b, c,d,e — какие-то действительные числа. Для их нахожде- нахождения умножим предыдущее равенство на (х + 1)(х2 + IJ: х = а(х2 + IJ + (Ьх + с)(х + 1)(х2 + l) + (dx + e)(x + 1). Положив в этом равенстве последовательно х = —1 и х = г, полу- получим: -1 = 4a, i = (di + e)(i + 1) = (е - d) + (d + e)t, откуда a = --, d = e=-. Далее, сравнив свободные члены и коэффициенты при хА, получим: откуда ~ Таким образом, х 1 х — 1 х ¦ (х + 1)(х2 + IJ 4(х -I-1) 4(х2 + 1) 2(х2 + IJ *
Глава 4. Начала теории групп §4.1. Определение и примеры В первой главе читатель познакомился с понятием абелевой груп- группы. Абелевыми группами являются, в частности, аддитивная груп- группа любого кольца, мультипликативная группа любого поля и адди- аддитивная группа любого векторного пространства. Важнейшие при- примеры неабелевых групп появляются как группы преобразований. Назовем преобразованием множества X всякое его отображе- отображение в самого себя. Определение 1. Группой преобразований множества X назы- называется всякая совокупность G его биективных преобразований, удовлетворяющая следующим условиям: 1) если <р,ф € G, то срф € G; 2) если <р eG.ro <p~l € G; 3) id € G. (Здесь <рф обозначает произведение (композицию) преобразо- преобразований (риф, id — тождественное преобразование.) Пример 1. Совокупность S(X) всех биективных преобразова- преобразований множества X является группой преобразований. Если множе- множество X бесконечно, эта группа слишком велика, чтобы быть инте- интересной. Если X конечно, то можно считать, что X = {1,2,..., п}; в этом случае группа S(X) называется группой подстановок, или симметрической группой, степени п и обозначается через Sn. Подстановка а € Sn может быть записана в виде таблицы (*1 **2 • • • 5 11 1о • • • ' в первой строке которой выписаны в каком-то порядке числа 1,2,... ,п, а во второй строке — их образы, т.е. jk = о"(**). Фиксируя расположение чисел в первой строке (например, распо- располагая их в порядке возрастания), мы видим, что число подстановок равно числу перестановок (см. §2.4), т.е. п!. При этом каждая подстановка может быть записана п! способами. Приведем пример на умножение подстановок: /1 2 3 4\ /l 2 3 4\ _ \3 4 1 2) \А 3 2 1) ~ _ /4 3 2 1\ (I 2 3 4\ _ (I 2 3 4\ ~ \2 1 4 Зу \4 3 2 I) ~ \2 1 4 3J '
§4.1. Определение и примеры 157 (Здесь мы в начале для удобства переписали первую подстановку таким образом, чтобы первая строка в ее записи совпала со второй строкой в записи второй подстановки.) Пример 2. Движения евклидовой плоскости Е2 (соотв. евкли- евклидова пространства Е3) образуют группу преобразований, обозна- обозначаемую через IsomE2 (соотв. Isom Е3). Это свойство является ак- аксиомой в той версии аксиоматики евклидовой геометрии, в которой понятие движения является одним из неопределяемых понятий. В другой версии, берущей за основу понятие расстояния между точ- точками, движение определяется как преобразование, сохраняющее расстояния, а сформулированное выше свойство является очевид- очевидной теоремой. Замечание 1. В предыдущих главах мы обозначали через Е2 (соотв. Е3) множество векторов евклидовой плоскости (соотв. про- пространства). Здесь же символ Е2 (соотв. Е3) использован для обо- обозначения самой евклидовой плоскости (соотв. пространства). Впро- Впрочем, если в плоскости (соотв. в пространстве) фиксирована неко- некоторая точка о (которую мы будем в дальнейшем называть нача- началом координат), то можно договориться отождествлять точки с их радиусами-векторами относительно точки о. Это соглашение часто будет подразумеваться в дальнейшем. Замечание 2. В той версии аксиоматики евклидовой геоме- геометрии, которая берет за основу понятие движения, утверждение о том, что всякое биективное преобразование, сохраняющее рассто- расстояния, является движением, является (несложной) теоремой. Пример 3. Ввиду свойств линейных отображений, доказанных в §2.3, биективные линейные преобразования векторного простран- пространства V образуют группу преобразований. Она называется полной линейной группой пространства V и обозначается через GL(V). Пример 4. Назовем параллельным переносом векторного про- пространства V на вектор a EV преобразование ta: х *-? х + а. Легко видеть, что l id = to. G3) Эти формулы показывают, что совокупность Tran(F) всех парал- параллельных переносов пространства V является группой преобразова- преобразований.
158 Глава 4. Начала теорий-групп Задача 1. Доказать, что совокупность всех возрастающих не- непрерывных функций на отрезке [0,1], удовлетворяющих условиям /@) = 0, /A) = 1, является группой преобразований отрез- отрезка [0,1]. Анализируя свойства операции умножения в группах преобра- преобразований, мы приходим к следующему понятию группы, которое отличается от понятия абелевой группы отсутствием требования коммутативности. Определение 2. Группой называется множество G с операци- операцией умножения, обладающей следующими свойствами: 1) (аЬ)с = а(Ъс) Va,6, с € G {ассоциативность); 2) существует такой элемент е € G (единица), что ае = еа = a VaGG; 3) для всякого элемента а Е G существует такой элемент а'1 € € G (обратный элемент), что аа~х = а~ха = е. Группа называется абелевой, или коммутативной, если аЪ = Ьа Va,beG. Данное определение группы использует мультипликативную терминологию. Аддитивная терминология обычно используется только для абелевых групп (хотя в принципе операция в группе может называться и обозначаться как угодно). Аналогично тому, как это было сделано для абелевых групп, доказывается единственность единицы и обратного элемента в лю- любой группе. Что касается деления, то в неабелевой группе следует различать левое и правое деления. А именно, для любых а,Ь € G уравнение ах = 6 имеет единственное решение, равное а~1Ь, и уравнение ха = Ь имеет единственное решение, равное 6а. В любой группе (аЬГ1 = 6-ха-1. В самом деле, Ь)(Ь-ха-1) = аЦЛ-^а-1 *= аа-1 = е. Всякая группа преобразований является группой относительно операции умножения преобразований. Действительно, ассоциатив- ассоциативность этой операции известна, единицей служит тождественное преобразование, а обратным элементом — обратное преобразова- преобразование. Пример 5. Невырожденные квадратные матрицы порядка п над полем К образуют группу по умножению, обозначаемую
§4.1. Определение и примеры 159 GLn(K). Поскольку имеется взаимно однозначное соответствие между квадратными матрицами порядка п и линейными преобра- преобразованиями пространства Кп, причем невырожденным матрицам отвечают обратимые линейные преобразования, а умножению матриц соответствует умножение линейных преобразований, груп- группа GLn(K) изоморфна группе GL{Kn) (и, тем самым, группе GL(V), где V — любое n-мерное векторное пространство над полем К). Пример 6. Как показывают формулы G3), группа Tran(V) изоморфна аддитивной группе пространства V. Пример 7. Конечная группа может быть задана своей табли- таблицей умножения. Так, множество С? = {е, а, Ь, с} с таблицей умно- умножения е а Ь с е е а Ь с а а е с Ь Ь Ь с е а с с Ь а е является абелевой группой. В самом деле, элемент е служит ее еди- единицей и каждый элемент обратен сам себе. Далее, легко видеть, что любая перестановка элементов а, Ь, с является автоморфизмом множества G с указанной операцией. Поэтому, если исключить тривиальные случаи с участием единицы и принять во внимание коммутативность, доказательство ассоциативности сводится к про- проверке следующих соотношений: а2Ь = а(аЬ) = Ь, {ab)c = а(Ьс) = е. Задача 2. Доказать, что множество С? = {А,Б,В,Г,Д,Е} с операцией, заданной таблицей А Б В Г Д Е А Е В Б д Г А Б д Г А Е В Б В Г Д Е А Б В Г В Е Д Б А Г д Б А Г В Е Д Е А Б В Г д Е является группой, изоморфной
160 Глава 4. Начала теории групп Определение 3. Подгруппой группы G называется всякое подмножество Н С G, удовлетворяющее следующим условиям: 1) если о, Ь € Я, то аЬ € Я; 2) если о € Я, то о € Я; 3) е € Я. Замечание 3. Так как аа~1 = е, то условие 3) можно заменить требованием непустоты подмножества Я. Очевидно, что всякая подгруппа сама является группой отно- относительно той же операции. Сравнивая определения 1 и 3, мы видим, что группа преобра- преобразований множества X — это не что иное, как подгруппа группы S{X). Пример 8. Пусть / — какой-либо многочлен от п переменных. Тогда Sym/ = {а € Sn : /(х^^х^), • • • ,^(n)) = f(xi,x2,.. .,хп) } есть подгруппа группы Sn. В самом деле, пусть <х, т € Sym/. По- Положим хаф = уг\ тогда f(x<rr(l)iXffTB), • ¦ чХ^г^п)) = /(УтA)>УтB)» • • чУт(п)) = = /(У1,У2, • • • ,Уп) — /(ж«гA),Ж«гB)» • • • iB<T(n)) = f(Xl,X2r. ¦ ,Хп). Остальные две аксиомы подгруппы выполнены очевидным об- образом. Определение симметрического многочлена, данное в §3.8, означает, что Sym/ = Sn. В качестве примера многочлена с ме- менее богатой, но не тривиальной симметрией рассмотрим многочлен / = х\Х2 + хзХ4 (от 4 переменных). Легко видеть, что группа Sym/ состоит из 8 подстановок, сохраняющих разбиение множе- множества {1,2,3,4} на два подмножества {1,2} и {3,4}. (Допускается перестановка этих подмножеств и перестановка элементов в ка- каждом из них; см. по этому поводу также пример 5.11). Пример 9. Аналогично, линейные преобразования простран- пространства Кп, сохраняющие какой-либо заданный многочлен от п пере- переменных, образуют подгруппу группы GLn{K). Линейные преобра- преобразования пространства Rn, сохраняющие многочлен х\ + х\ +... + + %п> называются ортогональными преобразованиями; они обра- образуют подгруппу группы GLn(R), которая называется ортогональ- ортогональной группой и обозначается через Оп, Так как в декартовых ко- координатах пространства Е2 (соотв. Е3) многочлен х2 + у2 (соотв. х2 + у2 + z2) выражает квадрат длины вектора, то ортогональные преобразования пространства Е2 (соотв. Е3) — это не что иное,
§4.1. Определение и примеры Ш как линейные преобразования, сохраняющие длину вектора. Дадим геометрическое описание ортогональных преобразований простран- пространства Е2. Условие *-(:!) € O2 означает, что (ax + byJ + (ex + dyJ =x2+ y2, т.е. a2 + <? = b2 + d2 = 1, ab + cd = 0. Из уравнения a2 + с2 = 1 следует, что существует такой угол а, что a = cos a, с = sin a. Оставшиеся два уравнения показывают, что Таким образом, _ /cos a — sintA /cos a sincA У ~ \sina cos «у и ^sina! — cos «у " В первом случае, как мы уже знаем (см. пример 2.3.5) уз есть по- поворот на угол а. Во втором случае tp — зер- зеркальное отражение относительно прямой I, образующей угол х с осью х (см. рис. 20). Эти два случая отличаются друг от друга тем, что в первом случае <р сохраняет ори- ориентацию плоскости, а во втором — меняет. В курсе линейной алгебры доказы- доказывается, что всякое ортогональное преобразо- преобразование пространства Е3, сохраняющее ориен- ориентацию, есть поворот вокруг некоторой пря- прямой. Пример 10. Движения евклидовой плоскости, оставляющие на месте начало координат о, образуют подгруппу группы IsomJS2. Обозначим ее через Н. Так как сложение векторов и их умножение на числа определяются в инвариантных геометрических терминах, то всякое движение, оставляющее на месте точку о, является ли- линейным преобразованием. Более того, так как оно сохраняет длины У, i 62 а Рис. е 20 ег) г.1 X ip(e2)
162 Глава 4. Начала теории групп векторов, то оно является ортогональным преобразованием. Обрат- Обратно, поскольку расстояние между точками а и Ь есть длина вектора . а — 6, то всякое ортогональное преобразование сохраняет расстоя- расстояние между точками и, значит, является движением. Таким образом, Н = 02. Аналогично, группа движений евклидова пространства, оставляющих на месте начало координат, совпадает с Оз. Пример 11. Пусть F — какая-либо фигура на евклидовой плос- плоскости. Тогда SymF = {<р € IsomJE?2 : <p(F) — F} есть подгруппа группы isomE2; она называется группой симме- симметрии фигуры F. Так, группа симметрии окружности с центром в начале координат о есть группа 02- Группа симметрии правильного п-угольника с центром в точке о есть подгруппа группы 02, состоя- состоящая из поворотов вокруг точки о на углы, кратные —, и отражений относительно прямых, проходящих через о и одну из вершин или середину одной из сторон. Таким образом, эта группа содержит 2п элементов (п поворотов и п отражений); она называется группой диэдра и обозначается через ?>„. Пример 12. В силу формулы умножения определителей матри- матрицы с определителем 1 образуют подгруппу в группе GLn{K). Эта подгруппа называется унимодулярной группой и обозначается че- через SLn(K). Пример 13. Целочисленные матрицы с определителем 1 обра- образуют подгруппу в группе SLn(W), обозначаемую через 5Xn(Z) (см. задачу 2.5.3). Пример 14. Множество невырожденных диагональных матриц порядка п является абелевой подгруппой группы GLn{K). Задача 3. Доказать, что множество строго треугольных ква- квадратных матриц порядка п является подгруппой группы GLn(K). §4.2. Группы в геометрии и физике Цель этого параграфа — дать общее представление о роли групп в геометрии и физике. В XIX веке математики осознали, что евклидова геометрия не является единственной мыслимой геометрией. Даже если принять, что «пространство, в котором мы живем», подчиняется законам ев- евклидовой геометрии (что на самом деле верно лишь в первом при- приближении), имеет смысл изучать геометрию и других пространств,
§4.2. Группы в геометрии и физике 163 которые возникают в результате математических построений. В связи с этим возникает вопрос, что же в таком случае следует по- понимать под геометрией. Обобщая различные понятия, рассматри- рассматриваемые в евклидовой геометрии, можно сформулировать различные ответы на этот вопрос. В частности, обобщая понятие группы движений евклидовой геометрии, немецкий математик Клейн в своей лекции 1872 г., по- получившей известность под названием «Эрлангенская программа», дал определение геометрии как изучения свойств фигур, инвари- инвариантных относительно заданной группы преобразований. Более подробно, пусть задано некоторое множество X и некото- некоторая группа G его преобразований. Фигуру F\ С X будем считать эквивалентной (или равной, как говорят в элементарной геоме- геометрии) фигуре F2 С X относительно группы G и писать F\ ~ Fi, G если существует такой преобразование tp € G, что F2 — <p(Fi). Проверим, что это действительно отношение эквивалентности: 1)F ~ F, так как F - id(F) и id € G; о 2) если F\ ~ F2, т. е. Fi = 4>(F\), где у> € G, то F-i ~ F\, так G G как Fx = f~1(F2) и if'1 € G; 3) если Fi ~ F2 и F2 ~ F3, т. е. Fi = <p(Fi) и F3 = ^(F2), где G G ip,i> € G, то F\ ~ F3, так как F$ — ip<p(Fi) я ф<р € G. G Мы видим, таким образом, что три аксиомы отношения экви- эквивалентности в точности соответствуют трем аксиомам группы пре- преобразований. Одной из задач геометрии является нахождение необходимых и достаточных условий эквивалентности фигур (вспомните призна- признаки равенства треугольников в евклидовой геометрии). Этой цели служат величины, инвариантные относительно преобразований из группы G (такие, как расстояние между точками или мера угла в евклидовой геометрии). Соотношения между этими инвариантами суть геометрические теоремы (например, теорема Пифагора или теорема о том, что медианы треугольника пересекаются в одной точке). Конечно, далеко не любая группа преобразований приводит к интересной и важной для приложений геометрии. Все такие гео- геометрии связаны с достаточно богатыми группами преобразований, которых не так много. Минимальным требованием здесь является транзитивность.
164 Глава 4. Начала теории трупп Определение. Группа G преобразований множества X назы- называется транзитивной, если для любых х,у € X существует такое преобразование (р € G, что у = f(x). (Это означает, что в соответствующей геометрии все точки эквивалентны в смысле данного выше определения эквивалентно- эквивалентности фигур.) Пример. Группа Тгап(У) параллельных переносов векторного пространства V (см. пример 1.4) транзитивна. В самом деле, для любых х, у € V имеем у = ty-xx. Однако группа Tran(V) все еще слишком мала, чтобы опреде- определять интересную геометрию. В качестве примера интересной гео- геометрии, отличной от евклидовой, приведем аффинную геометрию. Пусть V — какое-либо векторное пространство, (р € GL(V) и а € V. Тогда 4>ta<p~l = t^e)- G4) . В самом деле, для любого х € V имеем: (<pta<p~l)(x) = (р((р~Х(х) + а) = х + (р(а) = t^x. Предложение 1. Для любой подгруппы G С GL{V) множе- множество Tran(V) • G = {tav : a € V, V € G} является транзитивной группой преобразований простран- пространства V. Доказательство. При а,6 € V, <р,ф € GL(V) имеем ввиду формул G3) и G4): Отсюда следует, что (taip)-1 = «-^-^а)^ € IVan(F) • G. Таким образом, Tran(V) • G — группа преобразований. Она тран- транзитивна, поскольку уже ее подгруппа Tran(V) транзитивна. В частности, мы можем взять G = GL{V). Полученная группа GA(V) = T*an(F) • GL(V) G5)
§4.2. Группы в геометрии и физике 165 называется полной аффинной группой пространства V, а ее эле- элементы — (биективными) аффинными преобразованиями. Связан- Связанная с ней геометрия называется аффинной геометрией. В случае V = Е2 мы получаем аффинную геометрию евклидо- евклидовой плоскости. Предложение 2. Группа движений евклидовой плоскости {соотв. пространства) есть подгруппа группы GA(E2), равная Tran(J52)-O2. Доказательство. Прежде всего, заметим, что все парал- параллельные переносы и все ортогональные преобразования являются движениями. Пусть теперь а — какое-либо движение. Положим а = а(о). Тогда движение у> = t~la оставляет на месте точку о и, значит, принадлежит группе 02 (см. пример 1.10). Таким образом, а = tatp € Тгап(#2) • О2 Следствие. Если фигуры F\,F<2 С Ё2 равны в евклидовой геометрии, то они равны и в аффинной геометрии. Группа GA(E2) не совпадает с группой движений. Примером аффинного преобразования, не являющегося движением, может служить гомотетия (с коэффициентом ф ±1) или растяжение вдоль какой-либо оси. Таким образом, группа GA(E2) богаче группы дви- движений, и фигуры, не равные в евклидовой геометрии, могут ока- оказаться равными в аффинной геометрии. Так, в аффинной геометрии все окружности равны. Задача 1. Доказать, что в аффинной геометрии все треуголь- треугольники равны. В аффинной геометрии отсутствует понятие расстояния меж- между точками. Однако, как показывает следующая задача, имеется инвариант трех точек, лежащих на одной прямой. Задача 2. Доказать, что при аффинных преобразованиях со- сохраняется отношение, в котором точка делит отрезок. Аналогичным образом определяется аффинная геометрия ев- евклидова пространства. В рамках группового подхода могут быть построены также про- проективная и конформная геометрии, геометрия Лобачевского и дру- другие геометрии, используемые в математике и ее приложениях. Группы преобразований в физике описывают симметрию физи- физических законов, в частности, симметрию пространства-времени.
166 Глава 4. Начала теории групп Точка пространства-времени задается тремя пространствен- пространственными координатами x,y,z и временной координатой t, так что пространство-время с фиксированной системой отсчета может быть отождествлено с К4. Переход к другой системе отсчета означает некоторое преобразование пространства К*. Как в клас- классической, так и в релятивистской механике (точнее, в специальной теории относительности) существует понятие инерциальных си- систем отсчета, в которых все законы механики имеют одинаковый вид. Переходы от одной инерциальной системы отсчета к другим составляют некоторую группу преобразований пространства R4. Эта группа однозначно определяет законы механики. Отличие релятивистской механики от классической обусловлено тем, что она берет за основу другую группу преобразований. Группа симметрии пространства-времени в классической меха- механике есть группа Галилея, описываемая следующим образом: где О% — группа ортогональных преобразований пространственных координат, а Н — группа преобразований вида (ж, у, z, t) ь-> (ж + at, y + bt,z + ct, t), соответствующих переходу к новой системе отсчета, равномерно . и прямолинейно движущейся относительно старой. Из этого опи- описания группы Галилея видно, что в классической механике время абсолютно в том смысле, что разность временных координат двух событий одинакова во всех инерциальных системах отсчета. Согласно представлению релятивистской механики группа сим- симметрии пространства-времени есть группа Пуанкаре G = Tran(M4)-O3,i, где Озд — группа линейных преобразований, сохраняющих мно- многочлен (в системе единиц, в которой скорость света равна 1). Группа Озд содержит группу Оз, не затрагивающую временной координаты. Нетривиальным примером преобразований из Озд могут служить преобразования Лоренца (x,y,z,t) »-» (archa + tsha,у,z,xsha + tcha),
§4.3. Циклические группы 167 перемешивающие пространственные и временные координаты. Вид этих преобразований показывает, что в релятивистской механике время не абсолютно. Группа Пуанкаре была описана в работах Лоренца и Пуанкаре как группа симметрии законов электродинамики (уравнений Макс- Максвелла). Заслуга Эйнштейна состояла в том, что он имел смелость сделать вывод, что и законы механики должны иметь ту же группу симметрии. Группы преобразований лежат также в основе кристаллогра- кристаллографии и теории элементарных частиц. Так, в кристаллографии они описывают симметрию кристаллических структур и, тем самым, — физических свойств кристаллов. §4.3. Циклические группы Так же, как в группе Ш*, в любой группе G могут быть определены степени элемента дббс целыми показателями: e, •9, к 1д-1...д~1, -к 9k9l = 9k+ если если если i к к к >о, = 0, <0. Имеет место свойство G6) Это очевидно, если к,1 > 0. Рассмотрим случай, когда к > 0, I < 0, к +1 > 0. Тогда к -I k+l Аналогично рассматриваются остальные случаи. Из G6) следует, что Кроме того, е = д° по определению. Таким образом, степени эле- элемента д образуют подгруппу в группе G. Она называется цикли- циклической подгруппой, порожденной элементом д, и обозначается через {д).
168 Глава 4. Начала теории-групп Возможны два принципиально разных случая: либо все степени элемента д различны, либо нет. В первом случае подгруппа (д) бесконечна. Рассмотрим более подробно второй случай. Пусть g* = д1, к > I; тогда ср~1 — е. Наименьшее из нату- натуральных чисел т, для которых дт = е, называется в этом случае порядком элемента g и обозначается через ordg. Предложение 1. Если ordg = n, то 1) дт = е «=» п\т; 2) дк — д1 <*=> k = l (mod n). Доказательство. 1) Разделим шнапс остатком: тп = qn + r, 0 ^ г < п. Имеем тогда в силу определения порядка: дт = (gn)q.gr =дг = е <J=> г = 0 2) Имеем в силу предыдущего: дк = д1 «=>. дк~1 = е <=> П \ (к — I) <=> k=l (mod n). Следствие. Если ordg = п, то подгруппа (д) содержит п элементов. Доказательство. Действительно, <9) = {e,g,g2,-..,gn-lh G7) причем все перечисленные элементы различны. В том случае, когда не существует такого натурального т, что дт = е (т. е. имеет место первый из описанных выше случаев), полагают ordg = со. Отметим, что orde = 1; порядки же всех остальных элементов группы больше 1. В аддитивной группе говорят не о степенях элемента д, а о его кратных, которые обозначают через kg. Соответственно этому порядок элемента д аддитивной группы G — это наименьшее из натуральных чисел т (если такие существуют), для которых Ф $ + 9 + ¦ • • -fr g. = 0. Пример 1. Характеристика поля (см. §1.6) есть порядок любо- любого ненулевого элемента в его аддитивной группе.
§4.3. Циклические группы 169 Пример 2. Очевидно, что в конечной группе порядок любого элемента конечен. Покажем, как вычисляются порядки элементов группы Sn. Подстановка г € Sn называется циклом длины р и обозначается через («i«2 • • • гр), если она циклически переставляет i\,%2, ¦ ¦ ¦ ,«р, т.е. г(ч) = г2, т(»2) = *з, • • • , т(*р) = *ь а все остальные числа оставляет на месте. Очевидно, что порядок цикла длины р равен р. Циклы т\ и т2 называются независимыми, если среди фактически переставляемых ими чисел нет общих; в этом случае tit2 = t2ti. Всякая подстановка однозначно разлага- разлагается в произведение независимых циклов. Например, /1 1 234567 8\ ,, ,, , Ь 6 7 4 8 3 2 1у) = B637)A58), что наглядно показано на рис. 21, где действие подстановки а изо- изображено стрелками. Если подстановка а разлагается в произведе- произведение независимых циклов длин р\,Р2, • • • ,Ps> то order = Например, для подстановки а, изображенной на рис. 21, order = = 12. 2 A5 г Л, -4 Рис. 21 Задача 1. Доказать, что порядок любого элемента группы Sn не превосходит числа еп/е и 1,44П. Пример 3. Порядок комплексного числа с в группе С* конечен тогда и только тогда, когда это число есть корень некоторой степе- степени из единицы, что , в свою очередь, имеет место тогда и только тогда, когда \с\ = 1, a argc соизмерим с тг, т. е. ^^ € Q. Задача 2. Доказать, что arctg — несоизмерим с тг. Пример 4. Найдем элементы конечного порядка в группе Isomi?2 движений плоскости. Пусть <р € IsomjE^, <pn = id. Для
170 Глава 4. Начала теории групп любой точки р € Ё2 точки циклически переставляются движением <р, так что их центр тя- тяжести о неподвижен относительно <р. Следовательно, <р — либо 2& 2тг& поворот на угол вида вокруг точки о, либо отражение относи- относительно некоторой прямой, проходящей через о. Пример 5. Найдем порядок матрицы как элемента группы GL^M). Имеем: откуда Л4 = -А, А5 = -Л2, Л6 = -Л3 = Е, так что ог<1Л = 6. Конечно, этот пример специально подобран: вероятность того, что порядок наудачу выбранной матрицы А € € <7ZB(R) будет конечен, равна нулю. Предложение 2. Если oidg = п, то <78) Доказательство. Пусть (п, к) = d, n = nid, A; = k\d, так что (ni,ibi) = 1. Имеем: (S*)m = е <==>• п | Лт <=> щ | fcim ¦*=>• гц | т. Следовательно, ordg* = п\. Определение. Группа G называется циклической, если суще- существует такой элемент д € (?, что С? = {</). Всякий такой элемент называется порождающим элементом группы G. Пример в. Аддитивная группа Z целых чисел является цикли- циклической, так как порождается элементом 1. Пример 7. Аддитивная группа Zn вычетов по модулю п явля- является циклической, так как порождается элементом [1].
§4.3. Циклические группы 171 Пример 8. Мультипликативная группа Сп комплексных кор- корней n-й степени из 1 является циклической. В самом деле, эти корни суть числа ?*=cos h«sin (к = 0,1, ...,п— 1). Ясно, что ?к — ?к. Следовательно, группа Сп порождается элемен- элементом ?1. Легко видеть, что в бесконечной циклической группе G = (д) порождающими элементами являются только д и д . Так в группе Z порождающими элементами являются только 1 и —1. Число элементов конечной группы G называется ее порядком и обозначается через \G\. Порядок конечной циклической группы равен порядку ее порождающего элемента. Поэтому из предложе- предложения 2 следует Предложение 3. Элемент gk циклической группы G = (д) порядка п является порождающим тогда и только тогда, ко- когда (п,к) = 1. Пример 9. Порождающие элементы группы С„ (см. пример 8) называются первообразными корнями п-тл степени из 1. Это кор- корни вида ?fc, где (п, к) = 1. Например, первообразные корни 12-й Степени ИЗ 1 — ЭТО ?l,?5i^7, ?ll- Циклические группы — это наиболее простые группы, которые можно себе представить. (В частности, они абелевы.) Следующая теорема дает их полное описание. Теорема 1. Всякая бесконечная циклическая группа изо- изоморфна группе Z. Всякая конечная циклическая группа порядка п изоморфна группе Zn. Доказательство. Если G = (д) — бесконечная цикли- циклическая группа, то в силу формулы G6) отображение /: Z -*¦ G, к *-?¦ дк есть изоморфизм. Пусть G = (д) — конечная циклическая группа порядка п. Рассмотрим отображение /:Zn->G, [k)^gk (к € Z). Так как [к] = [I] <==> к = I (mod п) <*=> дк = д\
172 Глава 4, Начала теории групп то отображение / корректно определено и биективно. Свойство вытекает из той же формулы G6). Таким образом, / — изомор- изоморфизм. Для понимания строения какой-либо группы важную роль игра- играет знание ее подгрупп. Все подгруппы циклической группы могут быть легко описаны. Теорема 2. 1) Всякая подгруппа циклической группы явля- является циклической. 2) В циклической группе порядка п порядок любой подгруп- подгруппы делит п и для любого делителя q числа п существует ровно одна подгруппа порядка q. Доказательство. 1) Пусть G — (д) — циклическая группа и Н — ее подгруппа, отличная от {е}. (Единичная под- подгруппа, очевидно, является циклической.) Заметим, что если д-т е jj апя Какого-либо т € N, то и дт € Н. Пусть т — наи- наименьшее из натуральных чисел, для которых дт € Н. Докажем, что Н = (дт). Пусть дк € Н. Разделим кнатс остатком: к = qm + г, 0 ^ г < т. Имеем: <Г=0*(<ГГ«€#, откуда в силу определения т следует, что г=0и, значит, дк = 2) Если |G| = n, то предыдущее рассуждение, примененное к к = п (я этом случае дк = е € Н), показывает, что п — qm. Подгруппа Н имеет вид #={е,0"*,<72"\...,<^-1>'1*} G9) и является единственной подгруппой порядка q в группе G. Обрат- Обратно, если q — любой делитель числа п и п = qm, то подмножество Н, определяемое равенством G9), является подгруппой порядка q. Следствие. В циклической группе простого порядка любая неединичная подгруппа совпадает со всей группой. Пример 10. В группе Z всякая подгруппа имеет вид mZ, где m >0.
§4.4. Системы порождающих 173 Пример 11. В группе Сп корней n-й степени из 1 любая под- подгруппа есть группа Сч корней g-й степени из 1, где q \ п. §4.4. Системы порождающих Пусть S — какое-либо подмножество группы G. Обозначим через (S) совокупность всевозможных произведений вида 9?19? ¦•¦9?к (91,92,• • • 9к € S; еъе2,... ,ек = ±1). (80) Это наименьшая подгруппа группы G, содержащая S. В самом деле, если какая-либо подгруппа содержит S, то она содержит и все указанные произведения. С другой стороны, само множество (S) является подгруппой, как показывают следующие равенства Эк Д0*+19к+2 • - - 9к+1) — 9\ 92 ••• 9к+1 \9\ 92 • • • 9к ) — 9к ••92 9\ • Говорят, что {S) — подгруппа, порожденная подмноже- подмножеством S. В частности, если S состоит из одного элемента д, то {S) = (д) есть циклическая подгруппа, порожденная элементом д в том смысле, как это было определено в предыдущем параграфе. Замечание. Удобно считать, что в число произведений (80) входит пустое произведение (к = 0), которое по определению рав- равно е. Определение. Говорят, что группа G порождается своим под- подмножеством S, или что S — система порождающих {элементов) группы G, если G = {S). Конечно, любая группа G порождается подмножеством S = G, однако представляет интерес найти возможно меньшую систему порождающих. Пример. Группа диэдра Dn (см. пример 1.11) порождается по- поворотом ср на угол — и (любым) отражением ф ? Dn. В самом деле, <р порождает циклическую подгруппу Сп всех поворотов, со- содержащихся в группе Dn; умножая элементы этой подгруппы на ф, мы получим все отражения, входящие в группу Dn. Два важных примера систем порождающих содержатся в при- приводимых ниже теоремах. Подстановка, являющаяся циклом длины 2 (см. пример 3.2), называется транспозицией. Теорема 1. Группа Sn порождается транспозициями.
174 Глава 4. Начала теории групп Доказательство. Отметим, что каждая транспозиция обратна сама себе. Поэтому утверждение теоремы означает, что любая подстановка разлагается в произведение транспозиций. Умножение подстановки 2 ... слева на транспозицию (ij) вызывает перестановку г и j в нижней строке. Такая операция также называется транспозицией. Очевид- Очевидно, что путем последовательных транспозиций любую перестанов- перестановку (&i, &2, • • • > кп) можно привести к тривиальной: сначала, если к\ ф 1, меняем местами к\ и 1, ставя тем самым 1 на первое место, затем ставим 2 на второе место и т.д. Таким образом, су- существуют такие транспозиции п, та,..., ts, что ts ... T2Ti<7 = id и, значит, a — t\Xi ... ts. Задача 1. Доказать, что группа Sn порождается смежными транспозициями A2), B3),..., ((п — 1)п), причем минимальное число смежных транспозиций, в произведение которых может быть разложена подстановка а € Sn, равно числу инверсий в нижней строке ее стандартной записи (81). Теорема 2. Группа GLn(K) порождается элементарными матрицами. (Определение элементарных матриц см. в §2.1) Доказательство. Отметим, что матрица, обратная к эле- элементарной, также элементарна (см. §2.1). Поэтому утверждение теоремы означает, что любая невырожденная матрица разлагается в произведение элементарных матриц. Умножение матрицы А € GLn(K) слева на элементарную ма- матрицу вызывает соответствующее элементарное преобразование ее строк. Мы знаем, что с помощью элементарных преобразований строк любую невырожденную матрицу можно привести к единич- единичной матрице. Таким образом, существуют такие элементарные ма- матрицы U\,Щ,•••,Us, что = Е
§4.5. Разбиение на смежные классы 175 и, значит, А = игги?1...иг1. Задача 2. Доказать, что группа SL-iffi) (см. пример 1.13) по- порождается матрицами Задача 3. Доказать, что группа движений плоскости порожда- порождается отражениями относительно прямых. (Указание: доказать вна- вначале, что каждый поворот и каждый параллельный перенос явля- являются произведением двух отражений.) §4.5. Разбиение на смежные классы Пусть G — группа и Я — ее подгруппа. Будем говорить, что элементы G1,52 € G сравнимы по модулю Я, и писать gx = g2 (mod Я), если 9xl92 € Я, (82) т.е. 52 = 9\h, где h € Н. Это определение обобщает определе- определение сравнимости целых чисел по модулю п, которое получается в случае G = Z, Я = nZ. Докажем, что определенное таким образом отношение сравни- сравнимости по модулю Н является отношением эквивалентности: 1) g = g (mod Н), так как g~lg = е € Н\ 2) если 01 = 32 (mod Я), т.е. sf1^ € Я, то 52 = Si (mod Я), так как 92 X9i = tef1») € Я; 3) если 31 = 52 (mod Я) и дъ = зз (mod Я), т.е. д{хдч, 92Х9з € Я, то д\ = дз (mod Я), так как Классы этой эквивалентности называются {левыми) смежными классами группы G по подгруппе Я. Ясно, что смежный класс, содержащий элемент д, имеет вид gH = {gh:h€ Я}. Одним из смежных классов является сама подгруппа Я.
176 Глава 4. Начала теории групп Поскольку умножение в группе не обязано быть коммутатив- коммутативным, мы получим, вообще говоря, другое отношение эквивалентно- эквивалентности, взяв вместо условия (82) аналогичное ему условие 929Т1 € Я. (83) Классы этой эквивалентности называются правыми смежными классами группы G по подгруппе Н. Они имеют вид Hg = {hg:h<= #}. Заметим, что инверсия д *-* д~1 устанавливает взаимно одно- однозначное соответствие между множествами левых и правых смеж- смежных классов. А именно, Пример 1. Смежные классы аддитивной группы С по подгруп- подгруппе К изображаются на комплексной плоскости прямыми, парал- параллельными действительной оси (рис. 22а). Пример 2. Смежные классы мультипликативной группы С* по подгруппе R!J. положительных чисел — это лучи, исходящие из начала координат (рис. 226). Пример 3. Смежные классы группы С* по подгруппе Т = {г € С : |г| = 1} — это окружности с центром в начале координат (рис. 22в). а) Рис. 22 Пример 4. В случае G = GLn(K), Н = SLn(K) (см. при- пример 1.12) условие (82), равно как и (83), означает, что detgi = = detg2- Поэтому левые смежные классы в данном случае совпа- совпадают с правыми (хотя группа GLn(K) не абелева); каждый из
§4.5. Разбиение на смежные классы 177 них представляет собой совокупность всех матриц с определите- определителем, равным какому-либо фиксированному числу. Пример 5. В группе G = Sn рассмотрим подгруппу Н cs Sn-\, состоящую из подстановок, оставляющих на месте число п. Подста- Подстановки <7i,<72 € Sn принадлежат одному левому смежному классу по Н, если (т^1а2(п) = п, т. е. если <ri(n) = <т2(п). Следовательно, имеется п левых смежных классов Pi, Р%у..., Рп, где Рк = {а € Sn : <т(п) = к}. В то же время подстановки а\,(Т2 € Sn принадлежат одному пра- правому смежному классу, если o^crf *(n) = n> т-е- если ^Г1(п)=^-1(п)- Следовательно, имеется п правых смежных классов <2ь $2, • • •, Qn> где QA = {<т € Sn : а(к) = п}. Мы видим, что правые смежные классы отличны от левых (за ис- исключением Qn = Рп = Я"). Множество левых смежных классов группы G по подгруппе Н обозначается через G/H. Число смежных классов G по Н (левых или правых, безразлично), если оно конечно, называется индексом подгруппы Н и обозначается через \G : Н\. Теорема 1 (Лагранж). Если G — конечная группа и Н — лю- любая ее подгруппа, то \G\ = \G:H\ \H\ Доказательство. Все смежные классы дН содержат со- содержат одно и то же число элементов, равное \Н\. Поскольку они образуют разбиение группы G (как классы эквивалентности), по- порядок группы G равен произведению их числа на \Н\. Следствие 1. Порядок любой подгруппы конечной группы де- делит порядок группы. Мы уже видели это в случае циклических групп (теорема 3.2). Следствие 2. Порядок любого элемента конечной группы делит порядок группы.
178 Глава 4. Начала теории групп Действительно, порядок элемента равен порядку порождаемой им циклической подгруппы. Следствие 3. Всякая конечная группа простого порядка является циклической. Доказательство. В силу следствия 1 такая группа долж- должна совпадать с циклической подгруппой, порожденной любым эле- элементом, отличным от единицы. Следствие 4. Если \G\ — п, то дп = е для любого g € G. Доказательство. Пусть ordg = т. В силу следствия 2 m | п. Следовательно, дп = е. Пример 6. Если р — простое число, то мультипликативная группа Z* поля Zp есть (абелева) группа порядка р — 1. Следо- Следовательно, gp~l = 1 для любого элемента д 6 Z*. Это означает, что ар~1 = 1 (mod p) для любого целого числа а, не делящегося на р. Последнее утвер- утверждение есть так называемая малая теорема Ферма. Разбиение на смежные классы естественно возникает при изу- изучении групп преобразований. Пусть G — группа преобразований множества X. Будем гово- говорить, что точки х, у € X эквивалентны относительно G, и писать х~у, если существует такой элемент о € G, что у = дх. Это част- G ный случай эквивалентности фигур, определенной в §2, и, следо- следовательно, — отношение эквивалентности. Класс эквивалентности точки х € X называется ее орбитой. Иначе говоря, орбита точки х есть множество В частности, транзитивные группы преобразований (см. определе- определение 2.1) — это группы преобразований, имеющие единственную орбиту. Подгруппа Gx = {g €G :дх =х} называется стабилизатором точки х. Пример 7. Группа движений евклидовой плоскости транзи- тивна. Стабилизатором начала координат является ортогональная группа 02 (см- пример 1.10).
§4.5. Разбиение на смежные классы 179 Пример 8. Орбиты группы 02 суть окружности с центром в начале координат о и сама точка о. Стабилизатор точки р ф о состоит из тождественного преобразования и отражения относи- относительно прямой ор, а стабилизатор точки о есть вся группа 02- Пример 9. Группа Sn транзитивна на множестве {1,2,..., п}. Стабилизатор числа п есть подгруппа Н ~ Sn-i, рассмотренная в примере 5. Следующая теорема является обобщением (первой части) при- примера 5. Теорема 2. Имеется взаимно однозначное соответствие между орбитой Gx и множеством смежных классов G/Gx, при котором точке у = gx € Gx соответствует смежный класс 9GX. Доказательство. При 31,32 € G имеем: 0i = g2 (mod G)x 91*92 € Gx <=> 9il92X = x Таким образом, элементы одного смежного класса G по Gx харак- характеризуются тем, что они переводят точку х в одну и ту же точку. Более точно, все элементы смежного класса gGx, и только они, пе- переводят точку х в точку у = дх. Тем самым и установлено искомое соответствие. Число элементов орбиты Gx, если оно конечно, называется ее длиной и обозначается через |С7а;|. Следствие. Если G — конечная группа, то \G\ = \Gx\ \GX\. (84) Из этой формулы следует, что порядки стабилизаторов всех то- точек орбиты одинаковы. На самом деле имеется точная связь между стабилизаторами точек одной орбиты, не зависящая от конечности группы G. Мы сформулируем ее в виде задачи. Задача 1. Доказать, что GgX=gGxg~1. Пример 10. Пусть К С Е3 — куб. Рассмотрим группу его симметрии G = SymK = {<р€ ЪютЕ3 : (р(К) =К}.
180 Глава 4. Начала теории групп Очевидно, что это конечная группа. Более того, симметрия куба полностью определяется тем, как она переставляет его вершины. Поэтому мы можем рассматривать группу G как группу преобразо- преобразований множества V вершин куба К. Ввиду того, что куб является правильным многогранником, любую вершину куба можно пере- перевести в любую другую с помощью преобразования из группы G. Иначе говоря, группа G транзитивна на множестве V. Следова- Следовательно, \G\ = 8|О,|, где v — какая-либо вершина. Аналогичным образом, рассматривая группу Gv как группу преобразований множества ребер, выходя- выходящих из v, можно показать, что \GV\ = 3|С7„,е|, где GVje — стабилизатор в группе Gv какого-либо ребра е, выходя- выходящего из v. Группа Gvfi состоит из тождественного преобразования и отражения относительно плоскости, проходящей через центр ку- куба и ребро е (см. рис. 23). Таким образом, = 8-3-2 = 48. Рис.23 Задача 2. Получить тот же результат еще двумя способами, рассмотрев группу SymK как группу преобразований множества граней и множества ребер куба соответственно.
§4.5. Разбиение на смежные классы 181 Пример 11. Пусть G — группа преобразований алгебры много- многочленов К[х1,Х2,хз,Х4], состоящая из всевозможных перестановок переменных х\,Х2,хз,х^. Группа G изоморфна S± и, следователь- следовательно, 1^1 = 4! = 24. Рассмотрим многочлен / = х\Х2 ¦+¦ хзх^. Пере- Перестановками переменных из него можно получить 3 многочлена Это означает, что \Gf\ = 3. По формуле (84) находим 8 Заметим, что, если отождествить группу G с группой S^, то Gj будет не что иное, как подгруппа, обозначенная в примере 1.8 через Sym/. Отношение сравнимости по модулю п в аддитивной группе це- целых чисел согласовано с операцией сложения, что позволяет опре- определить операцию сложения в фактормножестве. Аналогичным об- образом можно определить операцию в множестве смежных классов группы по подгруппе и в других случаях, но не всегда. Определение. Подгруппа Я группы G называется нормаль- нормальной, если V</€G (85) или, что эквивалентно, дНд-1 = Н VS€G. (86) В этом случае пишут Н<G (или G>Н). Для того чтобы подгруппа Н была нормальна, достаточно (но не необходимо), чтобы каждый элемент группы G был перестановочен с каждым элементом из Н. В частности, в абелевой группе любая подгруппа нормальна. Теорема 3. Отношение сравнимости по модулю подгруппы Н согласовано с операцией умножения в группе G тогда и толь- только тогда, когда подгруппа Н нормальна. Доказательство. Согласованность отношения сравни- сравнимости по модулю Н с операцией умножения означает, что 5i = д\ (mod Я), дг = д'2 (mod Я) => (mod H)
182 Глава 4. Начала теории групп или, что эквивалентно, для любых gi,g2 € G и /»i,/»2 € Я (9ihi)(92h2) = 9i92 (mod Я). Последнее условие согласно определению переписывается в виде 92lfli92 € Я. Так как д2 может быть любым элементом группы G, a h\ — любым элементом подгруппы Я, то это равносильно условию нормально- нормальности (86). Задача 3. Доказать, что всякое отношение эквивалентности в группе, согласованное с операцией, есть отношение сравнимости по модулю некоторой подгруппы. Таким образом, если Я <G, то операция умножения в группе G определяет операцию умножения в множестве G/H по правилу (91Н){д2Н) = дхд2Н. Эта операция наследует ассоциативность операции в группе G. Для нее имеется единица — смежный класс еЯ. Каждый смежный класс дН имеет обратный, а именно, д~1Н. Следовательно, G/H — группа. Эта группа называется факторгруппой группы G по Я. Очевидно, что если группа абелева, то любая ее факторгруппа также абелева. Пример 12. Факторгруппа Z/nZ есть группа вычетов Zn. Пример 13. Смежные классы С по R (см. пример 1) суть пря- прямые La = {z : Imz = а} (а € R). Операция сложения в C/R задается формулой La + Ьь — Ьа+ь, так что Пример 14. Смежные классы С по Т (см. пример 3) суть окружности СТ — {z € С" : \z\ = г} (г > 0). Операция умножения вС/Т задается формулой CrCs — Crs, так что Пример 15. Как мы видели выше (см. пример 4), левые смеж- смежные классы GLn(K) no SLn(K) совпадают с правыми и имеют вид Ma = {A€GLn(K):detA = a} (a?K*). Следовательно, SLn(K) — нормальная подгруппа. Операция умно- умножения в факторгруппе задается формулой МаМь = Маъ, так что GLn(K)/SLn(K) s К\
§4.6. Гомоморфизмы 183 Пример 16. Подгруппа Я cz Sn-i группы Sn, рассмотренная в примере 5, не является нормальной при п > 3. Задача 4. Доказать, что всякая факторгруппа циклической группы является циклической. Задача 5. Доказать, что группа диагональных матриц не явля- является нормальной подгруппой группы GLn(K) при п^2и \К\ > 3. §4.6. Гомоморфизмы Связи между различными алгебраическими структурами одного ти- типа устанавливаются при помощи гомоморфизмов. Понятие гомомор- гомоморфизма отличается от понятия изоморфизма тем, что оно не требует биективности. В одном случае мы уже встречались с этим поняти- понятием, А именно, гомоморфизмы векторных пространств — это не что иное, как их линейные отображения. Дадим точное определение гомоморфизма групп. Определение. Гомоморфизмом группы G в группу Я называ- называется отображение f:G—*H, удовлетворяющее условию f(ab) = f{a)f(b) Va, 6 € G. Установим некоторые общие свойства гомоморфизмов групп. 1) /(е) = е. В самом деле, пусть /(е) = h € Я; тогда Л2 = НеJ = /(е2) = Не) = Л, откуда h = e. 2) На-1) = На)~\ ибо 3) Im/ = {/(а) : а е G} есть подгруппа группы Н (называе- (называемая образом гомоморфизма /). Это следует из определения гомо- гомоморфизма и предыдущих свойств. 4) Ker/ = {a € G : /(а) = е} есть нормальная подгруппа группы G (называемая ядром гомоморфизма /). Действительно, a,b e Кег/ а€Кег/ => НаЬ) = Да)/F) = е2 = е => ab = /(а) = е~1 = е =>• а € ее Кег/, €Кег/, Кег/, Кег/, ff G G 1 € Кег/.
184 Глава 4. Начала теории групп Гомоморфизм группы в саму себя называется ее эндоморфиз- эндоморфизмом. Изоморфизм группы на саму себя называется ее автомор- автоморфизмом. Пример 1. Пусть К — произвольное кольцо. Свойство дистри- дистрибутивности а(Ь + с) — аЬ + ас означает, что отображение х *-* ах (умножение слева на а) является эндоморфизмом аддитивной груп- группы кольца К. (Аналогичное утверждение справедливо и для умно- умножения справа.) Пример 2. Пусть G — произвольная аддитивная (соотв. муль- мультипликативная) абелева группа. Тогда для любого n € Z отобра- отображение х i-> пх (соотв. х •-> хп) является эндоморфизмом группы G. (Для неабелевой группы это, вообще говоря, неверно.) В слу- случае G = С" ядром этого гомоморфизма является группа Сп корней n-ой степени из 1. Пример 3. Согласно основному свойству экспоненты отобра- отображение iHe1 является гомоморфизмом аддитивной группы К в мультипликативную группу R*. Его образ есть подгруппа R+ по- положительных чисел, а ядро тривиально. Это отображение может быть продолжено до гомоморфизма С —> С* по формуле z = х -Ь у* •—>¦ ег — ех(со8 у + i sin у) (ж, у € R). В самом деле, пусть z\ = x\ -f y\i, г^ — хчЛ-J/2*; тогда 1 + У2) + tsinfoi -f = [е11 (cos 2/1 -f tsini/i)][eIa(cos{/2 + гзтуг)] = eZle". Образ последнего гомоморфизма есть вся группа С*, а его ядро есть бесконечная циклическая подгруппа 2iriZ группы С. Пример 4. Формула умножения определителей означает, что отображение det: GLn (K)^K', А м- det A, является гомоморфизмом. Его ядро — это унимодулярная группа SLn(K). Пример 5. Назовем знаком подстановки а € Sn и обозначим через sgncr произведение знаков верхней и нижней перестановки в ее записи (см. пример 1.1):
§4.6. Гомоморфизмы 185 Это произведение не зависит от способа записи подстановки а, так как от любого способа записи можно перейти к любому дру- другому последовательными транспозициями столбиков, а при каждой такой транспозиции одновременно меняются знаки верхней и ниж- нижней перестановок, так что их произведение сохраняется. Основное свойство знака состоит в том, что отображение sgn: 5„ -*• С2 - {±1}, а >-» sgncr, является гомоморфизмом. В самом деле, перемножая подстановки опт, мы можем считать, что верхняя перестановка в записи о совпадает с нижней перестановкой в записи г: „ _ (h h • • • in\ _ _ (i\ *2 • • • »n a-v;T~\j Тогда от так что _ fh %2 ... *n\ - \кг k2... *:„; Sgn ОТ = Sgn(ti,t2,...,tn) •Sgn(fci,fc2,..»fcn) = = [Sgn(li, t2, • • • , in) Sgn0l,i2, • • • ,jn)] X x [sgn(ji, j2, • • •,in) sgn(fci, k2,..., fen)] = = sgnr -sgao — sgncr • sgn т. Ядро гомоморфизма sgn называется знакопеременной группой и обозначается через Ап. Употребляется также следующая термино- терминология: подстановки о, для которых sgao — 1 (соотв. sgncr = —1), называются четными (соотв. нечетными). Таким образом, Ап — это подгруппа четных подстановок. Задача 1. Вывести следующую формулу для знака цикличе- циклической подстановки: Пользуясь этим, доказать, что знак любой подстановки равен (—1)та~*, где т — число фактически переставляемых ею (т.е. не оставляемых на месте) элементов, аз — число независимых циклов, в произведение которых она разлагается. Следующая теорема носит название теоремы о гомоморфизме групп.
186 Глава 4. Начала теории групп Теорема 1. Пусть /: G —> U — гомоморфизм групп. Тогда Im/ czG/Keif. Более точно, имеется изоморфизм <р: Im/ -К?/Кет/, сопоставляющий каждому элементу h — f(g) € Im/ смежный класс gKerf. Доказательство. Доказательство этой теоремы анало- аналогично доказательству теоремы 5.2. А именно, 5i =?2 (mod Кет/) -<=>• д^1д2 € Кег/ -<=>• так что элементы одного смежного класса G по Кег/ характери- характеризуются тем, что их образом служит один и тот же элемент группы Н (принадлежащий Im/). Более точно, все элементы смежного класса дКет f, и только они, переходят при гомоморфизме / в эле- элемент h — f(g) € Im/. Тем самым показано, что отображение (р, о котором идет речь в теореме, корректно определено и биективно. Остается проверить, что <р — гомоморфизм. Пусть ffi,02 € G, f{gi) — hi, f(g2) — h2. Тогда f{g\g2) = = Л1Л2, и <p(hih2) = ffiff2Кег/ = @i Кет/)@2 Кег/) = <p(hi)<p(h2), что и требовалось доказать. Следствие 1. Гомоморфизм f является изоморфизмом тогда и только тогда, когда Im/ = Н и Кег/ = {е}. Следствие 2. Если группа G конечна, то (Интересно сравнить эту формулу с формулой (84)) Пример 6. Рассмотрим гомоморфизм Имеем Im / = М, Кег / = R, так что — результат, уже полученный нами в примере 5.13.
§4.6. Гомоморфизмы 187 Пример 7. Рассмотрим гомоморфизм /: С* -^R^, z*-+ \z\. Имеем Im/ = RJ., Ker/ = T = {z € С* : |г| = 1}, так что результат, уже полученный нами в примере 5.14. Пример 8. Отображение также является гомоморфизмом, причем Im/ = Т, Кег/ = Следовательно, as Т. (Соответствующее разбиение на смежные классы было описана в примере 5.2.) Пример 9. Аналогичным образом рассмотрение гомоморфизма det из примера 4 приводит к тому, что GLn(K)/SLn(K) as К* — результат, уже полученный в примере 5.15. Пример 10. Рассмотрение гомоморфизма sgn из примера 5 приводит к тому, что Sn/An as C2. В частности, отсюда следует, что \Ап\ = -jn! Пример 11. Согласно определению (см. §2) всякое аффинное преобразование а есть произведение параллельного переноса и ли- линейного преобразования <р. Последнее называется линейной ча- частью, или дифференциалом преобразования а, и обозначается через da. Формула полученная при доказательстве предложения 2.1, показывает, что отображение d: GA(V) -»¦ GL(V), a^da,
188 Глава 4. Начала теории, групп является гомоморфизмом. Очевидно, что Imd = GL(V), KeTd=Tran(V), так что GA(V)/Tnn(V) s GL(V). Пример 12. Пусть Л = АхА2А^ — правильный треугольник. Сопоставив каждому движению <р € Sym Л подстановку а € S3 по правилу мы получим гомоморфизм /: Поскольку всякое движение плоскости, оставляющее на месте 3 точки, не лежащие на одной прямой, тождественно, Кет f — {id}. Докажем, что Im/ = S3. Так как Im/ — подгруппа группы S3 и группа 5з порождается транспозициями, то достаточно про- проверить, что любая транспозиция принадлежит Im/, т.е. может быть осуществлена некоторым движением <р € Sym Л. Но это действительно так: например, транспозиция A2) осуществля- осуществляется отражением относительно прямой I, показанной на рис. 24. Таким образом, SymA ~53. Аналогично доказывается, что группа сим- симметрии правильного тетраэдра изоморфна S± (проделайте это!). Пример 13. При перестановках переменных Х1,Х2,хз,Х4 мно- многочлены Х\Хг + Ж3Х4, Х\ХЗ + Х2Х±, Х\Х\ + Х2ХЗ (87) переставляются между собой. Занумеровав их каким-либо образом, мы получим гомоморфизм Докажем, что Im/ = S3. Для этого достаточно проверить, что любая транспозиция многочленов (87) может быть осуществлена некоторой перестановкой х\,Х2,хз,Х4. Но это действительно так:
§4.6. Гомоморфизмы 189 например, транспозиция первых двух многочленов (87) может быть осуществлена транспозицией х2 и ж3. Задача 2. Доказать, что для любого п € N имеет место следу- следующий «парадоксальный» изоморфизм: Задача 3. Пусть р — простое число. Найти порядки групп GL2(ZP) и SL2(ZP). Очевидно, что композиция гомоморфизмов F —> G и G —> Н есть гомоморфизм F —> Н. Пример 14. Рассмотрим композицию гомоморфизмов det: GLn(R) -> К* и sgn: W -+ C2 = {±1}, где sgn обозначает знак действительного числа. Мы получим таким образом гомоморфизм е: GLn(R) -+ С2. При п = 2 он имеет следующий геометрический смысл: если е(А) = 1 (соотв. е(А) = —1), то линейное преобразование про- пространства -Б2, определяемое матрицей А, сохраняет (соотв. меня- меняет) ориентацию в том смысле, что любой положительно ориентиро- ориентированный базис оно переводит в положительно (соотв. отрицательно) ориентированный базис. Аналогичная интерпретация возможна и при п — 3. Пример 15. Композиция гомоморфизмов d: GA(Rn) -*¦ GL(WT) = GLn(WL) и e: GLn(WL) -> C2 есть гомоморфизм GA(Wr) -> C2. (88) При n = 2 и З это позволяет распространить на аффинные пре- преобразования евклидовой плоскости и евклидова пространства поня- понятие сохранения или изменения ориентации. А именно, аффинное преобразование сохраняет (соотв. меняет) ориентацию, если его дифференциал сохраняет (соотв. меняет) ориентацию. В частно- частности, можно говорить о движениях, сохраняющих или меняющих ориентацию (что мы уже делали раньше, не давая точного опреде- определения). Пример 16. Пусть G с Isom 2?" (п — 2 или 3) — какая-либо подгруппа, содержащая движения, меняющие ориентацию. Рассма- Рассматривая ограничение на G гомоморфизма (88), мы получаем, что
190 Глава 4. Начала теории групп подмножество движений из G, сохраняющих ориентацию, есть под- подгруппа индекса 2. Мы будем обозначать эту подгруппу через G+. Пример 17. В частности, подгруппу Sym+K С SymK будем' называть группой вращений куба К. Так как |Symif| = 48 (см. пример 5.10), a Sym+ К есть подгруппа индекса 2, то |Sym+ K\ = 24. Докажем, что Sym+ К ~ SA. Для этого занумеруем каким-либо образом 4 диагонали куба К и сопоставим каждому движению <р € Sym+ К подстановку, осуще- осуществляемую им на множестве диагоналей. Мы получим гомоморфизм /: Sym+ К -> S^ Докажем, что Im/ = Si, откуда уже будет следовать, что / — изоморфизм, поскольку |Sym+X| = \Si\. Для этого достаточно проверить, что любая транспозиция принадлежит Im/. Но это действительно так: например, транспозиция A2) осуществляется поворотом на тг вокруг прямой /, изображенной на рис. 25. Рис. 25 Задача 4. Доказать, что группа Dt (группа симметрии квадра- квадрата) изоморфна группе Sym(xia;2 +Ж3Ж4) (см. примеры 1.8 и 5.11). Задача 5. Доказать, что SLi№i) ^ 5з.
Словарь сокращений английских слов, употребляемых в обозначениях сокращение area arg char deg det dim id Im Im inf Isom Ker lim mod ord Quot Re rk sgn Sym Tran vol от слова area argument characteristic degree determinant dimension identity image imaginary тйтит(лат.) isometry kernel limit тос1и1о(лат.) order quotient real rank signum^ar.) symmetry translation volume перевод площадь аргумент характеристика степень определитель размерность тождество образ мнимый нижняя грань изометрия ядро предел по модулю порядок частное действительный ранг знак симметрия перенос объем