Текст
                    М. М. Глухов, В. П. Елизаров, А. А. Нечаев
Алгебра
Том II
Допущено Министерством образования Российской Федерации
в качестве учебника для студентов высших учебных заведений,
обучающихся по группе специальностей в области
информационной безопасности
Москва
«Гелиос АРВ»
2003


УДК 512.8 ББК 22.19 Г22 Рецензенты: д-р физ.-мат. наук, профессор В. К Латышев д-р физ.-мат. наук, ст. н. сотрудник Я М Сидельников Глухов М. M., Елизаров В. П., Нечаев А. А. Г22 Алгебра:Учебник В2-хт.Т.II.—М.:ГелиосАРВ,2003.—416с,ил. ISBN 8-854384-072-2 Учебник содержит полное и систематическое изложение материала, входящего в федеральный компонент дисциплины «Алгебра» Государственных образовательных стандартов по специальностям «Криптография» и «Компьютерная безопасность». В отличие от традиционных курсов высшей алгебры, изучаемых на математических факультетах университетов, данный курс характеризуется углубленным изучением дискретных алгебраических объектов: конечных колец, полей, линейных пространств, полугрупп преобразований, групп подстановок. Том II, наряду с традиционным для математических специальностей материалом, содержит такие важные для специалистов по защите информции разделы, как теория конечных полей, многочлены над конечными полями, группы подстановок, определяющие соотношения групп, линейные рекуррентные последовательности и др. ББК 22.19 Данное издание выпущено при поддержке гранта Президента РФ № НШ-2358.2003.9. © Глухов М. М., Елизаров В. П., Нечаев А. А., 2003 ISBN 8-85438-072-2 © Оформление. Шачек Е. С, 2003
Предисловие Здесь, во втором томе учебника «Алгебра», мы продолжаем изложение основных классических разделов курса: линейные пространства и их преобразования, квадратичные формы, группы, кольца, поля. При этом существенно используется материал первого тома и, по-прежнему, изложение материала ориентируется на потребности специалистов в области защиты информации. Накопленная теоретическая база позволяет (в ряде случаев впервые) изложить в рамках учебника такие специфические разделы из утвержденных программ по указанным ниже специальностям, как линейные неравенства, стохастические матрицы, транзитивные, примитивные и кратно-транзитивные группы подстановок, задание групп образующими элементами и определяющими соотношениями, неприводимые многочлены над конечными полями, линейные рекуррентные последовательности над конечными полями и кольцами, графы линейных преобразований конечных пространств. Большое внимание уделяется алгоритмам решения рассматриваемых задач, которые, как правило, сопровождаются примерами. В конце каждой главы приведены задачи (в основном теоретического характера) ориентированные на закрепление и углубление изложенных результатов. Нумерация глав данного тома является продолжением нумерации глав первого тома. Сохранилась и принятая в первом томе система ссылок на определения, леммы, утверждения, теоремы, примеры и формулы. Ссылки на них имеют двойную нумерацию, в которой последнее число, записанное римскими цифрами, означает номер главы. В конце книги приводятся авторский и предметный указатели, списки основной учебной и монографической литературы и перечень сборников задач по алгебре. Данный учебник предназначается в первую очередь лицам, обучающимся в вузах по специальностям, относящимся к области информационной безопасности: «Криптография»—075100, «Компьютерная безопасность» — 075200,
«Организация и технология защиты информации»—075300, «Комплексная защита объектов информатизации» — 075400, «Комплексное обеспечение информационной безопасности автоматизированных систем» — 075500, «Информационная безопасность телекоммуникационных систем» — 075600, «Противодействие техническим разведкам» — 075700. Авторы выражают признательность всем специалистам, прочитавшим рукопись данного учебника и сделавшим свои замечания.
Глава XIII ВЕКТОРНЫЕ ПРОСТРАНСТВА Изучая множества с бинарными операциями, мы часто пользовались также возможностью "умножать" элементы рассматриваемого множества с операцией * на элементы некоторого другого (!) множества по закону, определенным образом согласованному с операцией *. Например, в предыдущих главах определялось: умножение матриц над кольцом R на элементы этого кольца и умноженияе элементов произвольной абелевой группы (G, +) на целые числа. Такое умножение естественно назвать "внешней" операцией соответственно на Rmjn и(?,а бинарную операцию + на Rm,n и G — "внутренней". Настоящая глава посвящена изучению одного из важнейших понятий математики — понятия векторного пространства, в определении которого используются и "внутренняя" бинарная и "внешняя" операции. § 1. Определение векторного пространства. Базис пространства Определение!.. Говорят, что на множестве L задана внешняя операция о умножения справа на элементы множества К, если задано отображение: о: LxK-+L. Образ элемента (£,k) Е Lx К при этом отображении называют произведением элемента £ на элемент к и обозначают через £ о к (или, для краткости, через £к). Понятие внешней операции обобщает понятие бинарной операции на L, при определении которой К = L. Определение 2. Множество L с внутренней операцией сложения + и внешней операцией о умножения справа на элементы поля Р называют правым линейным пространством, а также правым векторным пространством над полем Р, если
1) (L, +) — абелевая группа; 2) для любых элементов а, /? Е L и а, b £ Р выполнены соотношения: а) а о (аб) = (а о а) о 6 (закон ассоциативности); б) а о (а + Ь) = а о а + а о 6; в) (а + /?) оа = аоа + /Зоа (законы дистрибутивности); г) аое^а, где е — единица поля Р (закон унитарности). Это векторное пространство обозначают через Lp, его элементы называют векторами, а элементы из Р — скалярами. Заметим, что в соотношениях б) и в) одним знаком + обозначены две разные операции: операция сложения в поле Р и операция сложения в группе L. Это не вызывает недоразумения, так как смысл операции + бывает ясен из природы складываемых элементов. П р и м е р 1. Абелева группа (р(п), +), элементы которой умножают- (аг \ / аха \ : I оа = I : I, есть правое 0-п векторное пространство над полем Р (арифметическое пространство Р(п\ введенное в гл. VII). Аналогично, Рп — векторное пространство над полем Р. П р и м е р 2. Абелева группа (Pm,n? +) превращается в векторное пространство над полем Р, если в качестве внешней операции взять обычное умножение матриц из Pm?n на элементы поля Р. П р и м е р 3. Множество С^ад всех действительных функций, непрерывных на отрезке [а, Ь], является векторным пространством над полем Е, если рассматривать обычное сложение функций и определить внешнее умножение как умножение функции на константу. Аналогично правому векторному пространству молено определить и левое векторное пространство. Поскольку далее мы будем изучать только правые векторные пространства, то слово "правое" будем опускать. Часто вместо термина "векторное пространство" мы будем употреблять термин пространство, что не вызовет путаницы. Рассмотрим некоторые простейшие свойства элементов векторного пространства. Через вь обозначим нейтральный элемент группы (L, +) и назовем его нулем векторного пространства Lp, а через 0 обозначим нуль поля Р (часто вместо вь будем писать просто в). Утверждение 1. Для любых элементов a G Lp и a G Р справедливы соотношения:
а) аоО = воа = в; б) (а о а = в) =>> (а = в или а = 0); в) (—а) о а — а о (—а) = —(а о а); г) (—а) о (—а) = а о а. □ Соотношения а), в) и г) доказываются так же, как аналогичные свойства элементов кольца (теорема З.Ш). Докажем б). Пусть аоа = 0. Если а = 0, то доказывать нечего. Если же а ф 0, то в поле Р существует элемент а~1. Ввиду соотношений г) и а) определения 2 получаем цепочку равенств а = аое — ао {ааГ1) = (аоа) о а"1 = в о а"1. Осюда в силу а) а = в. □ 3 а м е ч а н и е 1. Не всякая абелева группа (L, +) может быть превращена в векторное пространство над данным полем Р. Действительно, если L ф в и Lp — векторное пространство, то для любого £ Е L\{в} множество £Р — {toa | a G Р} есть подгруппа группы (L, +), изоморфная группе (Р, +). (Проверьте!) Следовательно, если Р — бесконечное поле, то группа L должна быть бесконечной, а если Р = Z/p, то порядок любого ненулевого элемента из (L, +) должен быть равен р. Для конечных (!) систем векторов произвольного пространства Lp точно так лее, как и в арифметических пространствах Р^ и Рп, рассмотренных в гл. VII, определяются понятия: линейная комбинация векторов, линейное соотношение между векторами, линейная выража- емость вектора через заданную систему векторов, линейно зависимая и линейно независимая система, базис (максимальная линейно независимая подсистема) системы векторов. Обобщим некоторые из указанных понятий на бесконечные системы векторов. Определение 3. Говорят, что: а) вектор a G Lp линейно выражается через бесконечную систему S векторов пространства Lp, если он линейно выражается через какую- либо конечную подсистему системы S; б) система векторов S пространства Lp линейно выражается через систему векторов Т этого пространства, если каждый вектор из S линейно выражается через систему Т. Определение! Бесконечную систему векторов S пространства Lp называют линейно зависимой, если в ней существует хотя бы одна линейно зависимая конечная подсистема. В противном случае систему S называют линейно независимой.
Ясно, что любая подсистема линейно независимой системы сама линейно независима. П р и м е р 4. Кольцо многочленов Р[х] над полем Р является векторным пространством над полем Р относительно обычной операции сложения многочленов и внешней операции умножения, определенной равенством f(x) о а — f(x)a, где f(x) Е Р[х], а Е Р. Система векторов е, х, х2,..., хп,... линейно независима, так как для любой ее конечной подсистемы хп,..., хгк равенство х%1 а\ + ... + хгк а& = 0 означает по определению равенства многочленов, что а\ = ... = а& = 0. Ясно, что любой многочлен из Р[х] линейно выражается через эту систему. Сформулируем и наметим доказательства некоторых утверждений, аналоги которых для конечных систем векторов арифметического пространства доказаны в гл. VII. Теорема1 (критерий линейной зависимости). Пусть S — произвольная система векторов пространства Lp. Если \S\ = 1, то система S линейно зависима тогда и только тогда, когда она состоит из нулевого вектора. Если \S\ > 1, то система S линейно зависима тогда и только тогда, когда в ней существует вектор, линейно выражающийся через систему остальных векторов из S. □ Если \S\ = 1, то теорема верна в силу утверждения 16). Пусть \S\ > 1. Если некоторый вектор а € S линейно выражается через систему векторов £\ {а}, то по определению За) он линейно выражается через некоторую конечную систему векторов /?i,... ,/?& из S\ {а}. Тогда конечная (!) подсистема векторов а, /3±,..., Дь из S линейно зависима (см. доказательство теоремы 5.VII), и по определению 4 система 5 линейно зависима. Обратно, пусть система S линейно зависима. По определению 4 существует конечная линейно зависимая ее подсистема S' = (ai,..., а$). При t = 1 получаем а\ = в (для подсистемы — это случай \Sf\ = 1), а тогда а\ = а.2 о 0 для любого вектора а.^ Е 5\{ai}. При t > 1 рассуждения проводятся дословно так же, как и при доказательстве теоремы 5.VII. D Утверждение2. Пусть вектор а € Lp линейно выражается через линейно независимую систему S векторов пространства Lp в виде: а = (3lCl + ... + prcr + Pr+iCr+i + • • • + fact, <k G P (1)
и а = fad! + ... +prdr + 7r+idr+i + ... + 7*de, d3 G P, (2) /3i,..., /3t и 7r+i, • • •»7« — непересекающиеся подсистемы попарно различных векторов системы S (возможно г = 0, t = О шш 5 = 0). ci = di,..., cr — dr и cr+i — ... = ct = dr+1 = ... = ds = 0. (3) □ Вычитая из равенства (1) равенство (2), получим: 7r+i ( Отсюда следуют равенства (3), так как ввиду условия система векторов /?i,..., $, 7г+ъ • • • 1Ъ линейно независима. □ Следствие. Если вектор а £ Lp линейно выражается через линейно независимую систему fii,...,f3r пространства Lp, то он выражается через нее только одним способом. Сравните это следствие с утверждением 6.VII. Утверждение 3. Если S — непустая линейно независимая система векторов пространства Lp и a G Lp, то система векторов Si = (5, а) линейно зависима тогда и только тогда, когда вектор а линейно выражается через систему S. □ Если вектор а линейно выражается через систему 5, то система Si линейно зависима по теореме 1, так как |Si| > 1. Обратно, пусть система Si линейно зависима. По определению 4 в ней существует конечная линейно зависимая подсистема ai,..., а&. В этой подсистеме содержится вектор а, так как в противном случае система S была бы линейно зависимой вопреки условию. Поэтому можем положить а& = а. Дальнейшее доказательство проводится дословно так же, как доказательство утверждения 5.VII. □ Определение базиса (максимальной линейно независимой подсистемы) для произвольной системы векторов S произвольного пространства Lp вводится совершенно так лее, как вводилось определение базиса для конечной системы векторов арифметического пространства (определение 9. VII).
Определениеб. Подсистему Т системы векторов S пространства Lp называют базисом системы S, если а) система Т линейно независима; б) система, получающаяся добавлением к Г любого вектора системы £, линейно зависима. В частности, если 5 = Lp, то базис системы 5 называют базисом пространства Lp. П р и м е р 5. Как показывает пример 4 базисом пространства Р[х]р является, например, бесконечная система векторов е, х,..., хп,... . Важное свойство базиса для системы векторов, содержащей хотя бы один не нулевой вектор, отмеченное для конечных систем векторов в утверждении 7. VII, дает Утверждение 4. Если система векторов S пространства Lp содержит хотя бы один ненулевой вектор, то ее подсистема Т является базисом тогда и только тогда, когда а) система Т линейно независима; б7) любой вектор системы S линейно выражается через систему Т. □ Условие а) утверждения совпадает с условием а) определения 5. Поскольку в системе S есть ненулевой вектор, то из условия б') следует, что система Т — непустая. Аналогично из условия б) определения 5 также следует, что система Т — непустая. По утверждению 3 условия б) и б7) — равносильны. □ Для сокращения записей вида (1) договоримся о следующих обозначениях. Пусть 7ъ--ч7« ~~ произвольная система векторов из Lp, /\ — произвольный вектор из Р&) и Положим по определению 7 = (7ъ • • • > 7t)5 lj) (4) Нетрудно проверить, что тогда для любых матриц В G PtjS, С € PSjk и любой системы векторов S = (<Уь..., <5t)> гДе й € Lp, г е Т^Ь, справедливы равенства: ( ) = чА + $А (5) 10
и Если 0 = (Pi,... ,/3n) — базис системы 5, то по следствию утверждения 2 для любого вектора а € S существуют такие однозначно определенные скаляры сг G Р, что а = /?iCi + ... + /?ncn. Воспользовавшись первым из равенств (4), запишем а = /3at, (7) где at = (сь...,сп)т. Определение 6. Вектор at Е P(n) называют столбцом координат вектора а £ S в базисе (3 системы S. Вопрос о существовании базиса для конечной системы векторов произвольного пространства Lp решает Теорема2. Если S — конечная система векторов пространства Lp, то в S существует базис (возможно пустой). Любую линейно независимую подсистему системы S можно дополнить до базиса системы S. □ Доказательство теоремы проводится так же, как доказательство утверждения 8.VII. □ Методами, выходящими за рамки нашего курса, может быть доказана ТеоремаЗ. Любая система векторов произвольного пространства Lp (в частности, само пространство Lp) имеет базис. Мы ограничимся рассмотрением систем векторов, имеющих базис из конечного числа векторов, и обобщим результаты, полученные в следствиях 4 и 6 теоремы 7.VII и утверждении 9.VII. Теорема 4. Пусть система векторов S пространства Lp имеет базис ai,..., an. Тогда: а) любая линейно независимая подсистема системы S состоит не более чем из п векторов; б) любой базис системы S состоит из п векторов; в) любая линейно независимая подсистема системы S, состоящая из п векторов, является базисом системы S; г) любую линейно независимую подсистему системы S можно дополнить до базиса системы S. 11
□ а) Пусть /?i,..., /Зп+1 ~~ произвольная подсистема системы S. Так как ai,..., an — базис S, то существует такая матрица С G РП| n+i, что Система линейных уравнений Са^ = 0^ по теореме 6.VII имеет ненулевое решение d^, так как число неизвестных в ней больше числа уравнений. Тогда, используя (4) и (6), получаем равенства: которые показывают, что система /?i,... ,/?n+i линейно зависима. б) В силу а) число векторов в любом базисе системы S не превосходит п. Если в S имеется базис, состоящий из t векторов, то опять ввиду а) п < t. Таким образом, t = п. в) Пусть /?i,... ,/?п — линейно независимая подсистема системы S. Для любого вектора а Е S согласно а) система векторов /?i,..., /3n, a линейно зависима. По утверждению 3 вектор а линейно выражается через систему /?i,..., /?п. По утверждению 4 /?i,..., /Зп — базис системы S. г) Пусть 7b--->7t — линейно независимая подсистема системы 5. Если £ = п, то в силу в) 7ь • • • э7п ~~ базис системы 5. Пусть < < п. Рассмотрим все линейно независимые подсистемы из S, содержащие векторы 7i,• • .,7i- Ввиду а) в любой из них не более п векторов. Пусть 71? • • • j 7tj Tfc-ьъ • • • ? 7л — такая система с максимально возможным числом векторов. Так как эта система линейно независима и добавление к ней любого вектора из S приводит к линейно зависимой системе, то 7i 1 • • • ? 1к — базис системы S, ис учетом а) к = п. □ § 2. Подпространства векторного пространства Пусть К — подмножество пространства Lp. Будем говорить, что К замкнуто относительно умножения на элементы поля Р, если а о a € € К для любых а Е К и а € Р. В этом случае отображение L х Р —» —> L, определенное правилом (/?, 6) —» /3 о 6, индуцирует одновременно отображение К х Р —> if, т. е. задает на if внешнюю операцию умножения на элементы поля Р. 12
Определение?. Непустое подмножество К пространства Lp называют подпространством, если а) К замкнуто относительно операций сложения и умножения на элементы поля Р; б) К является векторным пространством относительно этих операций. Обозначение: Кр < Lp или К < Lp. Критерий того, чтобы подмножество было подпространством дает Утверждение 5. Непустое подмножество К пространства Lp является подпространством тогда и только тогда, когда выполнено условие а) определения 7. D Пусть К удовлетворяет условию а) и а, (3 Е К. В частности, Р(—е) € if, где е — единица поля Р. По утверждению 1 в) /?(—е) = —/3 € £ К. Тогда по условию а) а—/? € К. Следовательно, (К, +) — подгруппа группы (£,+). Соотношения а) — г) определения 2 справедливы для любых а, (3 £ G К и а, Ь Е Р, так как они справедливы для любых элементов из L и Р. Значит, К — векторное пространство над P. D Таким образом, для L = Р^ определение 7 совпадает с определением 11. VII подпространства в Р^п\ В любом пространстве Lp ф в есть, по крайней мере, два подпространства К\ = в и К2 = L. Их называют несобственными подпространствами. Все другие подпространства называют собственными. Приведем примеры собственных подпространств. П р и м е р 6. Множество К всех векторов пространства £>2 (или Ds)j лежащих на фиксированной прямой (или плоскости), проходящей через начало координат, есть подпространство этого пространства: П р и м е р 7. Eq — подпространство в Cq. Утверждение 6. Пересечение любого семейства подпространств Ка, а € А, пространства Lp является его подпространством. 13
□ Доказательство основывается на применении утверждения 5 и предоставляется читателю. □ Определеннее. Пусть S — система векторов пространства Lp. Подпространством, порожденным системой S, называют пересечение всех подпространств из Lp, содержащих S. Его обозначают через (£)р. В силу утверждения 6 (S)p действительно подпространство в Lp. В частности, (0)р = в и (L)p = Lp. Теорема 5. Если S Ф 0, то подпространство (S)p состоит из всех конечных линейных комбинаций векторов из S, т. е. из векторов вида: где 5г G 5, с, G P, keN. (8) г=1 □ Обозначим через Т множество векторов из Lpy имеющих вид (8). Так как (S)p — подпространство пространства Lp, содержащее S, то по определению 7 Т с (S)р. A; m Обратно, пусть *i = ХЗ 5г°г и *2 = 5Z 5]с) ~~ элементы из Т. По- г=1 j=l скольку Аг тп «1 +«2 = г=1 j=l и для любого а £ Р к ^2T, (10) г=1 то по утверждению 5 из (9) и (10) следует, что Г — подпространство в Lp. Ввиду включения Г D 5 по определению 8 Г D (5)р. Значит, Т = (S)P. □ Теорема 5 аналогична соответствующим утверждениям для полугрупп и групп. Эта теорема позволяет, в частности, более кратко формулировать различные утверждения, связанные с представлением вектора в виде линейной комбинации других векторов. Следствие. Вектор а пространства Lp линейно выражается через систему S векторов этого пространства тогда и только тогда, когда a G (S)р. Базис системы S является базисом пространства )p. Доказательство следствия предоставляется читателю. 14
Утверждение?. Пусть К\, ...,Kt — подпространства пространства Lp. Тогда множество также является подпространством пространства Lp. □ По следствию теоремы 8.XI (К, +) — подгруппа группы (L,+). Для любых аг £ Къ и а Е Р справедливы включения ага € Кг. Поэтому ... + at)a = a\a + ... + ata G К. По утверждению 5 К — подпространство в Lp. □ Определение 9. Подпространство К — К\ +... + Kt называют суммой подпространств К\,..., i^. Если К = К\ + ... + Ки то каждый элемент а £ К имеет вид а — = ai + ... + а*, где аг € Кг. Рассмотрим ситуацию, когда такое представление однозначно. Определение 10. Подпространство К = К \ +... + Kt называют прямой суммой подпространств Ki,...,Ktj если каждый элемент а € € К однозначно представим в виде a = а\ + ... + at, где аг € Кг. В этом случае пишут ^FC = .Ki+... +Kt- Пример8. Пространство Р^ есть прямая сумма подпространств Кг = И^}\а е р\ и К2 = И®} Ь е р\ (обобщите на случай пространства Р^). Проверку того, является или нет сумма подпространств прямой, облегчает t Теорема 6. Если К^... ,Kt, К = ]П Кг — подпространства г=1 пространства Lp, то равносильны свойства: б) если в = а\ + ... + at, где аг G Кг, то аг = ... = at = в; в) для любого г € 1, t справедливо КгП^2^з— ^ г) для любого % Е 1, t — 1 справедливо (К\ + ... + Кг) П Кг+\ = в. □ Так как каждое из подпространств Кг есть подгруппа группы (L, +), то равносильность свойств а)—в) следует из теоремы 9.XL Ясно, что в) =>г). Доказательство, например, импликации г) =^б) предоставляется читателю. □ 15
§ 3. Изоморфизмы векторных пространств Определение!!. Отображение ip: Мр -* Lp называют изоморфизмом, если а) ср — изоморфизм абелевых групп (М, +) и (L, +); б) для любых элементов а € М и а £ Р справедливо равенство ср(а о а) = (р(а)а. В случае существования такого отображения ср пространства Мр и Lp называют изоморфными (обозначение: Мр = Lp). Заметим, что ф{0м) = 6ь, так как <р — изоморфизм абелевых групп. П р и м е р 9. Поворот пространства Z?2 вокруг начал координат на угол и против часовой стрелки является изоморфизмом £>2 на 1?2- (Проверьте!) Утверждение 8. Если ср: Мр —> Lp — изоморфизм векторных пространств, то обратное отображение ср~г является изоморфизмом Lp на Мр. Утверждение 9. Если ср: Мр —► Lp uip: Lp —> Кр — изоморфизмы векторных пространств, то отображение ipoip: Мр —> Кр — изоморфизм векторных пространств (о — композиция отображений). Доказательство утверждений 8 и 9 осуществляется непосредственной проверкой (определение обратного отображения см. в определении 10.1). Утверждение 10. Если ср: Мр —* Lp — изоморфизм векторных пространств, то для любых векторов а, а±,..., а& £ Мр и элементов oi,..., ak E P равенство а — OL\(L\ + ... + CXkCLk (11) справедливо тогда и только тогда, когда выполняется равенство ip(a) = </?(ai)ai + ... + ip(ak)ak. (12) □ По определению 11 из равенства (11) следует равенство (12). Так как (р~г о (р = ем, то в силу утверждения 8 из равенства (12) следует равенство (11). □ 16
Теорема 7. Если ср: Мр —> Lp — изоморфизм и S — система векторов пространства Мр, S Ф 0, то: а) система S линейно независима тогда и только тогда, когда линейно независима система (f(S); б) МР = (S)P &Lp = (ip(S))P; в) S — базис Мр тогда и только тогда, когда ip(S) — базис Lp. Da) В силу утверждения 10 для любых векторов ai,..., a& G S и k элементов ai,..., a& £ P линейное соотношение Yl а%а% = 6м равно- г=1 к сильно линейному соотношению ]Г) (р(щ)щ = 6ь- г=1 б) По теореме 5 произвольный вектор из Мр имеет вид: a = aici + ... + atct, где c*i € S, Ci Е Р. Поскольку tp — биекция, то произвольный вектор /3 из Lp имеет вид (3 = у>(а). Тогда и по теореме 5 Lp = (ip(S))p. Аналогично, с использованием изоморфизма ср~г из равенства Lp = = (<p(S))p получаем Мр = (S)p. в) Заметим, что базис пространства есть пустая система векторов тогда и только тогда, когда пространство состоит из нулевого вектора. Для пространств, состоящих не только из нулевого вектора, ввиду утверждения 4 свойство в) следует из а) и б). □ П р и м е р 10. Отображение (р: Р^ —» Рп, определенное равенством =(ai,...,an), является изоморфизмом пространства р(") на пространство Р"1. § 4. Конечномерные пространства Перейдем к изучению векторных пространств, для которых существует базис, состоящий из конечного числа векторов. 17
Определение^. Пространство Lp называют конечномерным, если в нем существует базис, состоящий из конечного числа векторов. Пространства, не являющиеся конечномерными, называют бесконечномерными (см. пример 5). Если Lp — конечномерное пространство и а\,..., ап — некоторый его базис, то по теореме 4 б) любой базис Lp состоит также из п векторов. Поэтому корректно Определение 13. Размерностью конечномерного пространства Lp называют число векторов в любом его базисе. Если Lp имеет базис из п векторов, то его называют пространством размерности п или п-мерным пространством и пишут dim Lp = n. Пример 11. Пространство Р^ — конечномерное и dimP(n) = = п, так как Р^ имеет базис Е[,..., Е^. Это, в частности, оправдывает термин — n-мерное арифметическое пространство, введенный в гл. VII. Пространство (Рп,п)р — конечномерное и dimPn,n = п2, так как (Рщ п)р имеет базис из п2 матриц £^п (см- § 1-VI). Как и в р(п), в любом конечномерном пространстве Lp верна Теорема 8. Если dim Др = n, то: а) любая линейно независимая система векторов из Lp состоит не более чем из п векторов] б) любая линейно независимая система из п векторов является базисом Lp', в) любую линейно независимую систему векторов из Lp можно дополнить до базиса Lp. □ Теорема 8 является перефразировкой теоремы 4. □ Однако в отличие от пространства Р^ у нас пока нет эффективных способов распознавания линейной зависимости или независимости системы векторов из Lp, состоящей из k < n векторов. Для получения таких способов мы воспользуемся свойствами изоморфных пространств. Сначала мы покажем, что все пространства над данным полем, имеющие одинаковую размерность, изоморфны. Утверждение 11. Если а = (ai,..., ап) — базис пространства Lp, то для любых векторов /3, *у G Lp и любого a G Р справедливы равенства: i U i Gft»)i = /9ia. (13) 18
□ В силу (6) (3 = а/Зд и 7 = <*7з- Тогда, учитывая (5), получаем: ^ ) (14) Одновременно Р + 1 = 5{Р + 1% (15) Поскольку а — базис Lp, то из (14) и (15) в силу следствия утверждения 2 получаем первое из равенств (13). Аналогично доказывается и второе из них. □ Теорема 9. Если dimLP = п, то LP 9* Р<п). П Пусть а = {а\,..., ап) — базис Lp. Зададим отображение tp: Lp —> —* P^n), положив для вектора /3 = а/3$ № = 4- (16) Ясно, что отображение ср — биекция. В силу утверждения 11 (р — изоморфизм векторных пространств. □ Теорема 10. Конечномерные векторные пространства Lp и Мр изоморфны тогда и только тогда, когда dimLp = dim Mp. □ Если dim Lp = dim Mp = п, то по теореме 9 существуют изоморфизмы (р: LP -> Р(п) и <ф: МР -> Р<п). По утверждению 8 ^j""1 : P(n) -» —> Мр — изоморфизм. Тогда по утверждению 9 ф~г о ф: Lp —> Мр — изоморфизм. Обратно, пусть существует изоморфизм ср: Lp —> Мр. Если dimLp = = п и ai,..., ап — базис Lp, то по теореме 7в) <^(ai),..., (р(ап) — базис Мр, т. е. dim Мр = п. □ Теоремы 9 и 10 показывают, что n-мерное арифметическое пространство Р(п) является, с точностью до изоморфизма, единственным п- мерным пространством над данным полем. Практический способ определить, линейно зависима или нет система векторов конечномерного пространства, дает Утверждение 12. Если dimLp = п и а — (ai,... ,an) — базис Lp, то система векторов /?i,... ,/?& из Lp линейно независима тогда и только тогда, когда линейно независима система векторов □ Отображение ср: Lp —> р(п\ задаваемое формулой (16), есть изоморфизм векторных пространств. По теореме 7 а) получаем требуемое утверждение. □ 19
Из утверждения 12 и критерия линейной независимости системы векторов из Р(п^ (следствие 3 теоремы 7.VII) получаем Следствие. Система векторов /?i,..., /Зп является базисом Lp тогда и только тогда, когда матрица С = (/?£#,... ?/5^) ~~ невырожденная. Определение 14. Если dimLp = п, /3 = (/3i,..., /?п) и а = = (ах,..., ап) — базисы Lp и /3 = ЙС, то матрицу С называют матрицей перехода от базиса а к базису /3. Таким образом, столбцы матрицы С — это столбцы координат базисных векторов /?i,..., (Зп в базисе а. Выясним, как связаны между собой столбцы координат одного и того же вектора в разных базисах. Пусть а и /3 — базисы пространства Lp и 7 € Lp. Тогда 7 = с?7з = fhg и Д = ЗС, где С = Р£ п. Следовательно, cry,! = ЗС^а- Отсюда Формулы (17) называют формулами преобразования координат. В заключение отметим, что алгоритмические задачи 1) — 6), поставленные в § 3.VII для систем векторов из Р^п\ представляют интерес и в произвольном конечномерном пространстве Lp. Решение любой из этих задач в Lp сводится в силу утверждения 10 и теоремы 9 к решению аналогичной задачи для систем векторов из Р^п\ 5. Подпространства конечномерного пространства Всякое подпространство конечномерного пространства само конечномерно, как показывает Т е о р е м а 11. Пусть dim Lp = п и К < Lp. Тогда: а) пространство Кр конечномерно и dim Kp < щ б) в Lp существует такое подпространство Мр, что Lp = К+М, т. е. каждое подпространство в Lp выделяется прямым слагаемым. □ Утверждение а) справедливо в силу теорем 8 а) и 4. Покажем справедливость б). Если К = в или К = L, то соответственно М — L и М = в. Пусть dimKp = г, 0 < г < п, и а\,...,аг — базис Кр. По 20
теореме 8 в) систему ai, -.., ar можно дополнить до базиса ai,..., ar, ar+i,..., an пространства Lp. Обозначим (ar+i,..., an)p = Mp. Тогда сумма подпространств К + M содержит базис пространства Lp и, значит, К + М D L. Так как обратное включение очевидно, то L — К + М. г п Пусть (3 € К П М, т. е. /3 = J2 aici — Z) ajcj- Тогда имеем равен- г п ство ^ = XI a*c* + Yl aj(~cj)- Поскольку ai,... ,an — базис Lp, то г=1 J=i+1 Ci = 0, г € 1, п, и /? = в. По теореме 6 L = К +М. □ П р и м е р 12. В пространстве Дг рассмотрим подпространства К\, К2 и К3: Ясно, что D2 = К1 + К2 = Ki + Кз и К2 ^ Кз- Таким образом, подпространство Мр в теореме 11 определено, вообще говоря, неоднозначно. В случае конечного поля Р мы можем подсчитать число различных подпространств в Lp. Утверждение 13. Пусть \Р\ = q, dimLp = nuO<k<n. Тогда в Lp имеется ровно {qn_1){qn_g) {gn_qk-l) (в* - l)(qk -q)...(Qk~ Я"'1) ^ } различных подпространств размерности к. □ Доказательство утверждения 10.VII показывает, что (qn — l)(qn — —q) •... • (qn — qk~1) — это число линейно независимых систем векторов из Lp, содержащих по к векторов. Каждая из таких систем порождает подпространство размерности к. Одновременно каждое подпространство размерности к порождается любой из (qk — 1) (qk — q) -... • (qk — qk~~1) линейно независимых своих подсистем, состоящих из к элементов. Значит, число различных подпространств в Lp, имеющих размерность к, определяется формулой (18). □ 21
Установим связь между размерностями суммы и пересечения двух подпространств. Теорема 12 (Грассман г). Если К\ и К2 — подпространства конечномерного пространства Lp, то + К2) = dimifi + dimK2 - dim^i П К2). П Пусть dimi^i = mi, dim^ = rri2 и dim(i^i П К2) = т. Так как К\ П К2 С К\ и К\ П К2 С К2, то по теореме 8в) базис ai,...,am подпространства К\ П К2 молено дополнить до базиса (19) подпространства К\ и до базиса (20) подпространства К2. Это верно и в случае т = 0, т. е. когда К1ПК2 = 0. Покажем, что система векторов: ai,...,am, /?m+l)---,/?mi, 7m+b.-->7m2 (21) является базисом подпространства К\+К2. Этим мы докажем теорему, ибо число векторов в системе (21) равно mi + 7712 — т — dimK\ + dimK2 — dim(lfi П .R^)- Произвольный вектор 5 € i^i + i^2 имеет вид S = Si + 62, где 5i G Xi и #2 ^ ^2- Так как векторы 5i и 62 линейно выражаются соответственно через базисы (19) и (20), то вектор S линейно выражается через систему (21). Поэтому Ki +К2 = («i,...,am,/3m+i,...,7m2)p- Остается показать, что система (21) линейно независима. Если + + атат + /?m+ibm+i + •. - + /3m1bmi + • • • + 7m2cm2 = ^» 1 Г. Грассман — немецкий математик (1809—1877). 22
то имеем равенство aiai + ... + атат + = 7m+l(-Cm+l) + • • • + 7m2(-Cm2)- (22) Вектор Л = 7m+i(—cm+i) + ... + 7m2(-"cm2) из правой части равенства (22) принадлежит подпространству К2, а равный ему вектор из левой части равенства (22) принадлежит подпространству К\. Значит, вектор Л выражается через базис ai,..., ат подпространства К\ П К*?. А = ага[ + ... + ашагт = 7m+i(-em+i) + ... + 7m2(-cm2). В силу линейной независимости системы векторов (20) получаем а^ = ... ... = a^ = cm+i = ... = сШ2 = 0. Но тогда А = 0 и равенство (22) в силу линейной независимости системы векторов (19) дает а\ = ... = ат = = Ьт+1 = -. - = Ьтт — 0- Таким образом, система векторов (21) линейно независима. □ Следствие. Размерность суммы К\ + Къ подпространств пространства Lp равна сумме их размерностей тогда и только тогда, когда сумма подпространств К\ + К2 прямая. □ Доказательство очевидно в силу теоремы 6. □ Рассмотрим практические способы отыскания базисов суммы и пересечения подпространств К\ и К2 пространства Lp. Пусть a = (c*i,..., ап) — базис пространства Lp, а /3 = (/?i,..., /3m) и 7 — (7ъ--ч7*) "" базисы соответственно подпространств iiTi и 1^2, векторы которых заданы своими столбцами координат /?L и 7)5 B базисе а. Тогда К1+К2 = (/3i,..., /3m, 7i? • • •» 7^)р? и базисом подпространства .К1+.К2 является базис системы векторов /3i,..., 7^. Для его нахождения нужно найти базис системы векторов: P M 77 из р(п\ а алгоритм решения этой задачи известен (см. гл. VII). Обозначим К = К\ Г) К2- Вектор S E Lp принадлежит К тогда и только тогда, когда он линейно выражается через каждую из систем векторов /3 и 7? т- в. когда вектор 6$ линейно выражается через каждую из систем векторов /?гй и т^- 4 = 23
или в матричной записи Таким образом, подпространство К состоит из всех векторов вида aUa^, где a* Е p(m) — такой вектор, для которого существует вектор fe* E ^\ удовлетворяющий условию: вектор ( ,j I является решением системы линейных уравнений (U,-V)( Х\ \ =01, (24) где х —v^lj • • • fbm) 5 i/ —\ylj'•')&/£) - Покажем, что для любой фундаментальной системы решений (х\ )'••' (х\) (25) системы уравнений (24) справедливо равенство: К = (aUx[,..., 6tUx\)p. (26) t Система Lfaj;,.. .,Ux\ линейно независима, так как из ^ Ux\ci = 0^ t t t следуют равенства ^ZVy\ct = 0*, J2xici = OS XI У* сг = 0^, Кроме того, по следствию 1 теоремы 6.VIII t = m + £ — rang(C/, —V). Так как rang(t/, —V) = rang(t/, V) и rang(t/, У) по следствию 7 теоремы 7.VII равен числу векторов в базисе системы векторов (23), то по теореме 12 получаем П К2) = га + £ - dim^i + #2) = m + ^ - rang([/, -F). Значит, i = dim(iiTi П i^2) = dim К. По теореме 86) система векторов aUx^, i E l,t — базис подпространства К. Итак, для отыскания базиса подпространства К\ + Къ нужно найти базис системы векторов (23). Соответствующие векторы из системы векторов /?i,..., je образуют базис К\ + i^2- 24
Для отыскания базиса подпространства К = К\ П К2 нужно: а) составить систему линейных уравнений (24); б) найти ее произвольную фундаментальную систему решений (25); в) выписать базис подпространства К в виде (26). В конце главы будет приведен еще один способ отыскания базисов суммы и пересечения двух подпространств пространства Lp. § 6. Факторпространства и многообразия Пусть Lp — подпространство произвольного пространства Мр. Введем на Мр отношение: а = Так как (1/,+) — подгруппа абелевой группы (М, +), то отношение = (L) является конгруэнцией на группе (М, +) и можно рассматривать факторгруппу (M/L,+), где операция определена равенством: (см. § 11.XI). Введем теперь на (M/L, +) внешнюю операцию умножения, положив [a]Loa=[aa]L, a e Р. (27) Проверим корректность определения (27). Пусть [а]ь = Щь-> т. е. а—(3 G G L. Так как Lp — подпространство в Мр, то (а — /3)а = аа — /За G G L. Поэтому [аа]ь = [(За\ь, и, значит, результат операции не зависит от выбора представителя в классе [а]ь- Теорема 13. (M/L, +, о) — векторное пространство над полем Р. □ Доказательство осуществляется непосредственной проверкой соотношений а) — г) определения 2. Например, цепочка равенств (Мь + Щь) о а = [а + (3]L о а = = [аа + /3a]L = [aa]L + [(3a]L = [а\ь ° а + Щь ° а 25
показывает справедливость соотношения в). Проверка остальных соотношений предоставляется читателю. □ Определение 15. Векторное пространство (M/L)p называют факторпространством пространства Мр по подпространству Lp. П р и м е р 13. В векторном пространстве £>2 зафиксируем подпространство L, состоящее из всех векторов, лежащих на некоторой прямой, проходящей через начало координат: Векторы (3 и а находятся в одном классе ([0\ь = [&]ь) тогда и только тогда, когда /?—a Е L. Поэтому класс [o\l есть множество всех векторов, концы которых лежат на прямой, проходящей через конец вектора а, параллельно прямой L. Значит, факторпространство D2/L, являющееся совокупностью классов [а]ь, можно для наглядности интерпретировать как совокупность прямых, параллельных прямой L. Если Мр — конечномерное пространство, то легко найти базис фак- торпространства. Т е о р е м а 14. Если dim Мр = п, Lp < Мр, dim Lp = к и c*i,..., а& — базис Lp, то ai,..., а^,..., ап — базис Мр тогда и только тогда, когда [ajfe+i]^,..., [ап]ь — базис пространства (M/L)p. В частности, dim(M/L)p = dim Мр — dimLp. □ Пусть ..,an (28) n — базис пространства Мр и /3 — Yl aiai ~ произвольный вектор из Мр. г=1 Тогда вектор [/3)ь из M/L имеет вид: г=1 ль 26 г=1 j=k+l
Так как аг £ L при i G Ц, то [аг)ь = Щь- Значит, всякий вектор из M/L является линейной комбинацией векторов системы: ]Lr-,KJL. (29) п Пусть J2 ЫьЬ3 = Щь. Тогда J2 &jbj\ = Щь и, следовательно, ль п к ^2 а3Ъ3 = Y^, а%съ ^ L ПРИ некоторых сг £ Р. 3=к+1 г=1 В силу линейной независимости системы векторов (28) получаем Ь3 = 0 при j G к + 1,п и сг = 0 при г £ 1, Л. Это означает, что система веторов (29) линейно независима. Таким образом, она является базисом факторпространства (M/L)p. В частности, dim(M/L)p = п — к = = dim Мр — dim Lp. Обратно, пусть система (29) — базис пространства (M/L)p. п ЕСЛИ Х>*С* = 0> ТО Ц[аг\ьСг = Щь И £ [«j]l^ = [в]ь- Тогда г=1 г=1 j сэ = 0 при j Е А: + 1,п, ^ а«сг = ^ и в силу линейной независимости г=1 системы ai,..., ajt получаем сг=0и при г £ 1, &. Так как dim Мр = п, то система (28) — базис пространства Мр. □ Пример 13, помимо прочего, дает геометрическую иллюстрацию следующего понятия, обобщающего понятия прямой и плоскости, а также подпространства векторного пространства. Определение 16. Многообразием пространства Мр, порожденным вектором а Е Мр и подпространством Lp, называют смежный класс группы (М, +) по подгруппе L: а + L = {а + Л | Л £ L}, т. е. элемент [ol]l факторпространства (M/L)p. Утверждение 14. Многообразия a + L\ и (3 + L2 пространства Мр равны тогда и только тогда, когда L\ = L^ и а — (3 £ L\. □ Если L2 = Li и а - /3 £ Li, то [а]^ = [Р}ь2-> т. е. а + bi = /3 + L2. Обратно, пусть а + L\ = /3 + L2> Так как в G L2, то для некоторого Ai G L\ получаем /3 = а + Ai. Поэтому а — (3 е L\. Для любого элемента Х2 € L2 существует такой элемент А^ £ L\, что а+Х[ = (3+\2. Тогда Х2 = a—/?+Ai € L\. Значит, L2 С ii. Аналогично показываем, что L\ С L2, и, значит, Li = L2. D 27
Теперь корректно Определение 17. Для конечномерного подпространства Lp пространства Мр размерностью многообразия а + Lp называют размерность подпространства Lp. П р и м е р 14. Любая прямая в векторном пространстве D2 или Ds является одномерным многообразием. Плоскость в пространстве Ds является двумерным многообразием. П р и м е р 15. Если Атхпх^ = Ь^ — совместная система уравнений над полем Р, то совокупность ее решений является многообразием ml + L в пространстве р(п\ где т} — частное решение системы, a L — подпространство решений ассоциированной системы однородных уравнений Ах^ = 0^. Если rang А = г, то dimL = п — г, т. е. размерность многообразия т^ 4- L равна п — г. Покажем теперь, что произвольное многообразие можно задать в виде совокупности решений некоторой системы линейных уравнений. Утверждение 15. Пусть Н = a^+L — многообразие в пространстве Р(п) и aj,... ,aj, — базис Lp. Тогда существуют такие матрица Агхп пад Р и вектор Ь^ Е Р(г\ что vangA = г = п — к и Н — совокупность решений системы уравнений Ах^ = 6^. □ Обозначим В = (а[,..., а].) и рассмотрим систему линейных уравнений В^хпУ1=0[. (30) Так как rang ВТ = rang В = к, то система уравнений (30) имеет фундаментальную систему решений: Обозначим D = (j/j;,..., yln_k), A = DT\ Ъ1 = Аа1. Система уравнений Ах1 = Ь1 (31) имеет в качестве частного решения вектор а*. Ассоциированная система Ах^ = 0^ имеет в качестве фундаментальной системы решений систему векторов а|,... ,а£. Действительно, ввиду (30) выполнено равенство BTD = Okx{n-k)- Переходя к транспонированным матрицам в последнем равенстве, получаем DTB — O(n_fc)x/-, или 28
Поскольку rangy! = rangD = n — к, то aj,... ,aj: — фундаментальная система решений для системы уравнений Ах^ = О*. А тогда общее решение системы уравнений (31) имеет вид a* 4-a^ci +...+а^Ск, с% € Р, i € 1, к. Отсюда и следует, что совокупность решений системы Ах^ = 6* есть Я. □ Утверждение 15 позволяет описать пересечение многообразий и базис пересечения подпространств. Если многообразие Щ = а\ + L$, i € € 1,2, есть совокупность решений системы линейных уравнений: то Hi П i?2 Ф 0 тогда и только тогда, когда совместна система линейных уравнений: (ъ\ \ ь1 ) ' (32) В этом случае совокупность решений системы уравнений (32) очевидно есть Hi П #2. Для подпространств, т. е. при а\ — 0^ и Ь\ = 0^ получаем, что Lif\L2 есть совокупность решений системы однородных уравнений: -> = О1. (33) Следовательно, базисом Li Г) £2 является фундаментальная система решений системы уравнений (33). Задачи 1. Покажите на примерах, что соотношения а) — г) определения векторного пространства независимы. 2. Покажите, что если (L, +) — абелева группа и exp(L, +) = р — простое число, то на (L, +) можно задать (единственным образом) структуру векторного пространства над полем Z/p. При этом любая подгруппа в (L, +) является подпространством. 3. Сколько подгрупп в элементарной абелевой группе порядка рп? 4. Приведите пример векторного пространства £р, в котором существует подгруппа Н < (X, +), не являющаяся подпространством. 5. Системы векторов S иГ пространства Lp называют эквивалентными, если каждая из них линейно выражается через другую (пишут: 29
S ~ Т). Покажите, что отношение ~ есть отношение эквивалентности на множестве всех подсистем пространства Lp и что S ~ Т тогда и только тогда, когда (£)р = (Т)р. 6. Опишите конечные системы векторов из Lp, имеющие единственный базис. 7. Покажите, что если вектор а £ Lp однозначно линейно выражается через систему векторов S пространства Lp, то система 5 линейно независима. 8. Покажите, что всякое векторное пространство Lp, где dim Lp = п, есть прямая сумма п одномерных подпространств. Сколькими разными способами можно представить Lp в виде такой суммы (с учетом порядка слагаемых), если \Р\ —ср. 9. Пусть К < Lp, dim Lp — n, dimKp = t и \Р\ = q. Сколько существует различных подпространств М < Lp таких, что Lp = К+М? 10. Пусть К и М — конечномерные подпространства векторного пространства Lp и К С М. Покажите, что К — М тогда и только тогда, когда dimKp = dim Mp. 11. Пусть dim Lp = n > 1 и поле Р бесконечно. Покажите, что при fcel, n — 1в Lp существует бесконечно много подпространств размерности к. 12. Покажите, что в условиях задачи 11 пространство Lp нельзя представить в виде объединения конечного числа собственных подпространств (используйте индукцию по п). 13. Пусть Hi = oti + Кг — многообразия в пространстве Lp, i G 172. Покажите, что справедливы утверждения: а) Н\ П #2 ф 0 тогда и только тогда, когда а\ — а.2 G К\ + К^\ б) для любого а £ #i Г) #2 верно равенство #i П #2 = ot + (К\ П К2); в) (#i С Я2) => (Кг сК2ка1-а2е К2). 30
Глава XIV СИСТЕМЫ ЛИНЕЙНЫХ НЕРАВЕНСТВ Всякая прямая ах + by + с — 0 на плоскости D2 разбивает эту плоскость на две полуплоскости в соответствии с условиями: ах + by + с > О и ах + by + с < 0: >0 <0 Точно также всякая плоскость ах + by + cz + d = 0 в пространстве Ds разбивает его на два полупространства ах + by + cz + d > 0 и ах + +by+cz+d < 0. Поэтому всякий выпуклый многоугольник на плоскости и всякий выпуклый многогранник в пространстве могут быть заданы системами неравенств указанного выше типа. Это послужило одной из причин, вызвавших потребность в изучении систем линейных неравенств. Первое систематическое изложение теории таких систем осуществил немецкий математик Г. Минковский 2 в книге "Геометрия чисел" (1896). Рассмотрим задачу, возникающую повседневно в производстве. Предприятие производит п видов продукции, используя для этого т видов сырья, имеющегося в количестве bi, i E 1,т. Для производства единицы продукции j-ro вида требуется а# единиц сырья г-го вида, а доход от ее реализации составляет Cj. Сколько следует произвести продукции каждого вида, чтобы суммарный доход предприятия был наибольшим? Обозначим через xi количество произведенной продукции г-го вида. Тогда ясно, что задача сводится к отысканию таких неотрицательных 2 Г. Минковский — немецкий математик (1864—1909). 31
решений системы линейных неравенств: • • - + o>inxn < amnxn < bm, n при которых функция /(xi,... ,жп) = Y^ сгх% принимает максимальное г=1 значение. Решение подобных задач привело к созданию нового раздела математики — линейного программирования, основы которого в конце 30-х годов были разработаны российским математиком Л. В. Канторовичем (1912-1986). В настоящей главе мы рассмотрим первоначальные сведения по теории систем линейных неравенств над полем действительных чисел. § 1. Некоторые свойства систем линейных уравнений При изучении систем линейных неравенств нам понадобятся некоторые свойства систем линейных уравнений. Утверждение1(о следствии системы линейных уравнений). Пусть Ах1 = Ь1 (1) — совместная система линейных уравнений над полем Р, А Е Рт,п и cxi = d — такое уравнение над Р, что из Аа^ = 6* следует са^ = d для любого а^ € Р^пК Тогда вектор (c,d) есть линейная комбинация строк матрицы (Д Ь^). □ Рассмотрим систему линейных уравнений: (2) По условию системы уравнений (1) и (2) равносильны. Множество решений каждой из них есть линейное многообразие векторного пространства р(п) (см. пример 15.ХШ). Если а^+М — множество решений системы уравнений (1), a ffi+L — системы уравнений (2), то о^ +М = £ По утверждению 14.ХШ М = L. 32
Так как система уравнений (1) совместна, то rang Л = г = rang(A, b^). Ранг матрицы D = I - , I равен г либо г + 1. Если rangZ) = г + 1, то dimLp = n — (г +1). В то же время dimМр — п — г фп — (г +1). Полученное противоречие показывает, что rang!? = г. Но rang(^,6^) = г, и, следовательно, строка (c,d) матрицы D есть линейная комбинация строк матрицы (А, 6^). □ Рассмотрим систему линейных уравнений (1) над полем R действительных чисел, А € Mm,n- Вектор S Е ]R(n) называют кеотрг/чотелькылс, если все его координаты неотрицательны (пишут: d^ > 0^). При решении ряда задач возникает вопрос о существовании у системы уравнений (1) неотрицательных решений. Мы укажем один из способов отыскания ответа на этот вопрос. Пусть система уравнений (1) совместна (для несовместной системы уравнений ответ на вопрос ясен), т. е. rang A = rang(A, 6^), и какая-либо ранговая подматрица матрицы А находится в ее столбцах А\г,..., А\ . Переписывая систему уравнений (1) в виде Г где л,... ,jn-r € {1? ^} \ {iu • • • >ir}> и» придавая свободным неизвестным жл,...,ж^Л_г нулевые значения, однозначно определяем соответствующие значения связанных неизвестных: хЪ1 = с%1,..., x%r = ctr. Полученное таким образом решение: с1 = (0,...,сг1,...,сгг,...,0)т системы уравнений (1) называют ее опорным решением, соответствующим базису А[г,..., А\г системы столбцов матрицы А. Примером опорного решения служит нулевое решение системы однородных линейных уравнений — оно соответствует произвольному базису системы столбцов матрицы этой системы уравнений. Теорема!.. Совместная система уравнений (1) над полем R имеет неотрицательные решения тогда и только тогда, когда она имеет неотрицательные опорные решения. 33
□ Утверждение теоремы в одну сторону очевидно. Докажем ее нетривиальную часть. Пусть система уравнений (1) имеет неотрицательные решения. Среди всех неотрицательных решений этой системы выберем решение с^ > 0* с максимально возможным числом нулевых координат. Если при этом с^ = 0^, то Ъ^ = 0^, и, как замечено выше, с^ — опорное решение. Поэтому можем считать, что с^ ^ 0^. Пусть сг1,..., сгк — ненулевые координаты вектора с^. Так как с^ — решение системы уравнений (1), то Предположим, что система векторов А[г,..., А[к линейно зависима, т. е. A^di + ... + A\kdk = 0^ для некоторых d% Е R, и существует d3 ф 0, i,j E l,fc. Очевидно можем считать, что d3 > 0. Обозначим через rfgC"1 максимальный элемент множества М = = {dic"1,...,^"1}. Так как djC'1 € М и d3, ctj > 0, то dsc~* > 0 и ds > 0. Справедливы равенства: Положим mt = clt — dtclads 1. При £ = 5 имеем ms = 0. При £ ф s имеем mt = {<ktds — dtCt^dJ1, где ds > 0. Поскольку dsc~* — dtc~^ = = c^cT1 - {Сг^з — dtcla) > 0 и c%sclt > 0, то mt > 0. Из (З) следует к ;tmt = 61, rat > 0, ras = 0, t=i т. е. вектор m^ = (0,..., mi,..., т&,..., 0)T есть решение системы уравнений (1) с большим, чем у решения с^, числом нулевых координат. Полученное противоречие показывает, что система векторов А^ ,..., А\ линейно независима. 34
Дополнив, если нужно, эту систему до базиса системы столбцов матрицы А векторами А^ ,..., А\г, получим равенство 4lCn +... + AikCtk + Altk+i0 + ... + 4.0 = **, показывающее, что с^ — опорное решение системы уравнений (1), соответствующее базису А\г,..., А\г системы столбцов матрицы А. □ Поскольку в системе векторов-столбцов матрицы А имеется конечное число базисов, то система уравнений (1) имеет конечное число опорных решений. В силу теоремы 1 получаем: если среди опорных решений нет неотрицательных, то у системы уравнений (1) вообще нет неотрицательных решений. § 2. Системы линейных неравенств и сведение их к системам линейных уравнений Решая систему линейных уравнений (1), где А Е Rm,n> мы по существу (см. § 1.VIII) рассматриваем отображение (рл'- R*n' —* R^m\ определенное условием: и находим полный прообраз данного вектора fc* G R(m) при этом отображении. Если прообраз — пустое множество, то система уравнений (1) несовместна, а если прообраз непустое множество, то он является подпространством в R(n) при 6* = 0* и линейным многообразием при Возможна (и нужна) постановка более общих задач, например, выяснить, является ли отображение ц>а сюръективным (т. е. совместна ли система уравнений (1) при любом (!) 6^ G R(m)) или найти полный прообраз при отображении фа заданного подмножества из R(m\ состоящего более чем из одного вектора. Для векторов из R(m) будем писать а^ > Ь^ если а^ — Ь^ > 0^. Частным случаем второй из указанных задач является следующая: 35
при заданном векторе b^ € R^m) найти полный прообраз множества {d^ € R(m)|d* < b^} при отображении <рд. В этом случае говорят, что нужно решить систему линейных неравенств: Ах1 < Ъ1. (4) Для систем линейных неравенств точно так же, как и для систем линейных уравнений, вводят понятия решения системы, совместной (несовместной) системы и равносильных систем. Задача отыскания решений системы неравенств (4) может быть сведена к отысканию специальных решений некоторой системы линейных уравнений. Теорема 2. Вектор с^ € R^ является решением системы неравенств (4) тогда и только тогда, когда существует такой вектор d\ Е R(m^, что d^ > 0^ и вектор I ^ J — решение системы линейных уравнений ^| )* (5) □ Пусть вектор [ ,^ I, где d^ > 0*, есть решение системы уравнений (5). Тогда для г Е 1,т имеем к=1 п Поскольку di > 0, то J2 aikCk = h — di < bi. Следовательно, с^ решение системы неравенств (4). Обратно, пусть с^ — решение системы неравенств (4). Положим а*кСк> г El,т. к=1 Тогда di > 0 и вектор ( ^ 1 — решение системы уравнений (5). □ Пример!. Решить систему неравенств: 36
Составляем систему уравнений: (г \ 1 , 0 + 1 -1 \ -1 1 1 о) Х3 + / -1 \ -2 0 1 1/ —Xi + Х2 + #4 = 0. Ее общее решение имеет вид: 1 — хз — Х4 ^ 1 — хз — 2x4 х4 В силу теоремы 2 всякое решение исходной системы неравенств имеет вид: (}) + (:»)„+(:1)вд *з,*<>о. П р и м е р 2. Решить систему неравенств: Х\ + Х2 < 1, -xi - х2 < 0. Общее решение системы уравнений: —Xi — Х2 + Х4 = 0 имеет вид: / \ 0 0 1 0 \ ) + / —1 \ 1 0 \ / Х2 Н~ / \ 1 0 -1 1 \ У х4. Тогда всякое решение исходной системы неравенств имеет вид: где 1 - х4 > 0, Х4 > 0, т. е. 1 > Х4 > 0, х2 G R. П р и м е р 3. Решить систему неравенств: Х1 + Х2 < 1, -xi - х2 < -2. 37
Общее решение системы уравнений: — Х\ — Х2 + Х4 = — 2 имеет вид: / \ 2 0 -1 0 \ / + / -1 \ 1 0 \ ° / Х2 + / 1 0 -1 ^ 1 \ / #4, а тогда всякое решение исходной системы неравенств имеет вид: где — 1 — Ж4 > О, Х4 > 0, т. е. х± > 0 и х± < — 1. Следовательно, система неравенств несовместна. Приведенные примеры показывают, что общее решение системы неравенств (4), найденное с помощью теоремы 2, зависит от параметров #n+i ^ 0,..., жп+т > 0, область значений которых определяется из системы линейных неравенств, которую, возможно, придется в свою очередь решать. § 3. Критерий совместности системы линейных неравенств Сначала рассмотрим некоторые свойства систем линейных неравенств. Если система линейных неравенств Ах^ < Ы-, А Е Rm,n> и неравенство сх^ < d таковы, что для любого а^ Е R(n) из Аа^ < Ь^ следует са^ < d, то неравенство сх^ < d называют следствием системы неравенств Ах^ < 6^. Утверждение 2. Если неравенство сх^ < 0 есть следствие системы неравенств Ах^ < 0^, то вектор с является линейной комбинацией строк матрицы А. □ Рассмотрим систему линейных уравнений Атхпх^ = 0^. Если (3^ Е Е RW и А/31 = О1, то и А(-/31) = О1. По условию тогда с/31 < 0 и 38
с(—/3^) < 0. Значит, cfr = 0. По утверждению 1 вектор (с,0) есть линейная комбинация строк матрицы (ДО*). □ Л е м м а 1. Если неравенство сх^ < 0 есть следствие системы т _> неравенств Ах^ < 0* и с= Y1 Аг^г> где Ai,..., Am_i >0 и Хт < 0, то г1 неравенство сх^ < 0 является следствием системы неравенств: Ы* (6) Дт-1 П Пусть 7^ ~~ произвольное решение системы неравенств (6). При этом либо Аш^ < 0, и тогда 7^ — решение системы Ах^ < 0* и еу^ < 0, _^ т— 1 _, _, либо Аш^ > 0, и снова С7* = X) Л7^г + ^т7^т < 0. □ г=1 Уточнением утверждения 2 является следующая ТеоремаЗ (Минковский). Если неравенство сх^ < 0 есть следствие системы неравенств Ах^ < 0*, то вектор с является линейной комбинацией системы строк матрицы А с неотрицательными коэффициентами. О Пусть А = (агз)тХп. Если А = Отхп, то с = б, и утверждение теоремы очевидно. Пусть А ф ОтХп- Доказательство теоремы проведем индукцией по числу т неравенств системы. Пусть m = 1, т. е. система неравенств имеет вид: А\х^ = ацх\ + ... + а\пхп < 0. (7) Перенумеровав, если нужно, неизвестные, считаем, что ац Ф 0. Пусть аи > 0. Тогда вектор (—1,0,..., 0) — решение неравенства (7) и, значит, решение неравенства сх^ < 0. Отсюда с\ > 0. По утверждению 2 5 = = ^4iAi. Следовательно, ci = ацАх и Ai = cia^1 > 0, что и требовалось. Ясно, как изменить доказательство в случае ац < 0. Пусть утверждение теоремы верно для любой системы неравенств Вх^ < 0* и ее следствия dx^ < 0, где В € Mfc,n, k <m — l. Рассмотрим систему неравенств Ах^ < 0*, где А е Rm,n. По утвер- ждению 2 с = J2 АгК = АЛ. Среди всех таких векторов А*, что с* = г=1 *, возьмем вектор А^ с максимальным числом s неотрицательных 39
координат. Перенумеровав, если нужно, уравнения, можем считать, что Ai,..., Ав > 0. Если s = т, то теорема доказана. Пусть s <т. Рассмот- -♦ s -. ~> -• рим вектор / = ]£ ЛАг + АтХт. Тогда с - / = г=1 Пусть Ла± < О1. Тогда cal < 0 и fa1 = cal - (с- f)al < 0. Так как /= £ АгХг + /s+i0 + ... г=1 ... + -Am_i0 + AmAm, то по лемме 1 всякое решение системы неравенств (б) является решением неравенства /ж* < 0. По предположению индукции вектор / есть линейная комбинация векторов А\,..., Ат-\ с неотрицательными коэффициентами: тп-1 — / ^ Лг'г? 'г fL ^* г=1 Тогда с = 22 Ak\k+f= 22 AkXk + 2J -^г^г = A\Ti +•. • +Asr3 + 8<к<т г=1 As+i) + ... + ^m^i(rm_i + Am_i) + Лт0, т. е. вектор с есть линейная комбинация строк матрицы А с большим, чем 5, числом неотрицательных координат. Полученное противоречие показывает, что s = т. □ Докажем теперь критерий совместности (несовместности) системы неравенств. Теорема 4. Система линейных неравенств: Ах1 < Ъ1 (4) несовместна тогда и только тогда, когда система линейных уравнений: решение. П Пусть система уравнений (8) имеет неотрицательное решение /?^, и^~ некоторое решение системы неравенств (4). Тогда ATf3^ = 0*, и 40
справедливы соотношения Аа^ < Ь^, аАт < Ь и aAFft < 6/3^, так как ft >0^. Следовательно, а-0^<—1иО<—1- Полученное противоречие показывает, что система неравенств (4) несовместна. Пусть теперь система неравенств (4) несовместна. Рассмотрим вспомогательную систему неравенств: (9) Если а^ = (ai,... ,&m&n+i)T — решение системы неравенств (9), то при an+i > 0 получаем, что (&ia~+u..., апа~+1)т — решение системы неравенств (4). Следовательно, an+i < 0. Это означает, что всякое решение системы неравенств (9) является решением неравенства: 0хг По теореме Минковского 0хп + хп+1 < 0. Но тогда справедливы равенства: о N о (f о т. е. А^ — неотрицательное решение системы уравнений (8). □ § 4. Системы однородных линейных неравенств Систему неравенств: Ах1 <0[ называют системой однородных неравенств. (10) 41
Утверждение 3. Если с[,..., cj; — решения системы неравенств S (10) и Хг > 0, г Е l,s, то вектор с^ = ^2 с^Хг является решением г=1 системы неравенств (10). □ Так как Ас^ =а(£ сгхлЛ = Е(Лсгх)Аг, Ас\ < 0* и (Лсг1)Лг < О1, \г=1 / г=1 то с* — решение системы неравенств (10). □ Утверждение 4. Если вектор с^ — решение системы неравенств (4), а вектор d^ — решение системы неравенств (10), то вектор с^ + d\ — решение системы неравенств (4). □ Справедливость утверждения следует из соотношений: A(cl + dl) = Ас1 + Ad1 < Ъ1 + О1 = Ь1. П Таким образом, для решений систем линейных неравенств частично выполняются те же соотношения, что и для решений системы линейных уравнений и ассоциированной с ней системы однородных уравнений. Задачи 1. Задайте множество точек плоскости, находящихся внутри и на сторонах треугольника с вершинами А(—2,0), В(1,3) и С(4,0), системой линейных неравенств. 2. Найдите опорные решения системы линейных уравнений: \ Х!+Х2Х3 Х4 = ±, ( I I 5ж1 -4- а) < 2xi - х2 + х3 - х4 = 0, б) < I 1 t Х\ I __ | | С\ О ^ + Х2 — 5X4 = 2, 2ж4 = -2, Имеет ли эта система уравнений неотрицательные решения? 3. Решите систему неравенств: < ( х- у + 3<0, -х+ у-3<0, б)/ ж + у-4<0, х + 2у >0, I у >0. Изобразите на плоскости область решений. 42
4. Покажите, что система неравенств: < О1 при т <п имеет ненулевое решение. 5. Выясните, совместна или нет система неравенств: 43
Глава XV ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ВЕКТОРНЫХ ПРОСТРАНСТВ Предметом исследования многих математических дисциплин является изучение отображений множеств. Так, в математическом анализе изучают, например, действительные функции одного или нескольких переменных, т. е. отображения R —> Ш или Rn -» Е. В аналитической геометрии рассматривают переход от одной системы координат на плоскости или в пространстве к другой, т. е. отображения £>2 —> 1>2 и 1?з —► D$. В алгебре изучают множества с операциями, а внутренняя бинарная операция на множестве М — это отображение М х М —► М. В предыдущих главах рассматривались отображения как произвольных множеств, так и множеств с заданными на них операциями: подстановки на множестве М, т. е. биекции М —► М, гомоморфизмы группоидов, в частности — групп и др. В этой главе мы рассмотрим важный класс отображений векторных пространств — линейные отображения, или гомоморфизмы. Наиболее подробно будут изучены линейные отображения данного векторного пространства Lp в себя — линейные преобразования пространства § 1. Линейные отображения векторных пространств Определение!.. Отображение (р пространства Lp в пространство Мр называют линейным отображением, или гомоморфизмом, если для любых а, /? € Lp и a G Р справедливы равенства: <р(а + 0) = ip(a) + (р(/Э), ip(aa) = ip(a)a. Множество всех линейных отображений пространства Lp в пространство Мр обозначим через £(Lp,Mp). Для любого отображения tp G £(Lp,Mp) справедливо равенство — 6м, так как ip — гомоморфизм группы (L, +) в группу (М, +). 44
Пример 1. Всякий изоморфизм пространства Lp на пространство Мр (см. определение 11.ХШ) является линейным отображением. В частности, поворот плоскости Z?2 на угол и против часовой стрелки вокруг начала координат (пример 9.ХШ) является линейным отображением £>2 в J?2- П р и м е р 2. Пусть а 6 Lp. Зададим отображение a: Lp —> Lp, положив а(а) = оса для а £ Lp. Легко проверить, что а — линейное отображение. Его называют склярным отображением, или гомотетией. При а ф О гомотетия а является изоморфизмом. П р и м е р 3. Отображение (р: См —► См, где ip(z) = z, как нетрудно проверить, есть линейное отбражение. Отображение ф: Сс —► Сс, где ip(z) = ~z, не является линейным отображением, так как i\){zz\) = ~zzi — = ~z~z\ Ф ip{z)zi при z\ e С \ R. П р и м е р 4. Пусть а — фиксированный ненулевой вектор пространства 1?з- Отображение ср: D$ —* 1?з? при котором (/?(/?) = (3 + а для любого /3 G 1?з (перенос начала координат), не является линейным отображением, так как <р(в) = а ф в. Как и в теории групп, введем понятие ядра линейного отображения. Определение 2. Ядром отображения (р G £(£р, Мр) называют множество Кет<р = {a G Lp\(p(a) = 6м}- Непосредственной проверкой устанавливается, что справедливо Утверждение1. Если tp E £(Lp, Мр), то Кег (р и ip{Lp) — подпространства соответственно пространств Lp и Мр. Отображение (р является изоморфизмом пространств тогда и только тогда, когда Ker</? = 6l и <p(L) = М. П р и м е р 5. Пусть Кр < Lp. Определим отображение щ: Lp —> —> Lp/Kp, полож:ив Va G LP (<po(a) = [a] = a + KP). (1) Нетрудно проверить, что отбражение ц>о является линейным отображением пространства Lp на факторпространство Lp/Kp, т. е. является эпиморфизмом пространств. Определение 3. Линейное отображение <^о5 заданное формулой (1), называют естественным эпиморфизмом пространства Lp на факторпространство Lp/Kp. Любое линейное отображение сводится к некоторому естественному эпиморфизму и некоторому изоморфизму, как показывает 45
Теорема1 (об эпиморфизме). Если (р € £{Lp,Mp), то существует такой изоморфизм пространств т: что коммутативна диаграмма 9 Lp/Kerp где <ро — естественный эпиморфизм. □ По утверждению 1 Кег<р — подпространство в Lp. Если рассматривать группы (L, +), (М, +) и (Кег <£, +), то по теореме об эпиморфизме групп существует изоморфизм групп т: L/Kenp —> <p(Lp), при котором коммутативна диаграмма. Этот изоморфизм задается равенством т([а]) = <р(а). Поскольку для любых [а] G Lp/ Кег <р и а £ Р справедливы равенства: г([с*]а) = г([аа]) = ^(аа) = ^(а)а = г([а])а? то г — линейное отображение. Значит, г — изоморфизм векторных пространств. □ Теперь определим на множестве £(Lp,Mp) внутреннюю операцию сложения и внешнюю операцию умножения на элементы поля Р, положив для у?, ф Е £(Ьр, Мр) и а Е Р: У а <Е Lp (fa + ф)(а) = <р(а) + ф{а)\ У a GLP, ае Р, (fa © а)(а) = ip(a)a). Читателю предлагается проверить, что ср + *ф и ip © а — линейные отбражения Lp в Мр, т. е., что формулы (2) действительно задают операции на множестве £(Lp, Мр). Т е о р е м а 2. Для произвольных векторных пространств Lp и Мр множество £(Lp,Mp) является векторным пространством над полем Р относительно операций, заданных формулами (2). 46
Доказательство теоремы осуществляется непосредственной проверкой аксиом векторного пространства и предоставляется читателю. Обратим внимание на то, что нулем пространства £(Lp,Mp)p является отображение в: Lp —> Ом, а противоположное отображение — ср для отображения <р Е £(£р, Мр) определяется равенством (—ф)(сх) = —(р(а), а Е Lp. Если пространство Lp конечномерное, то легко описать все его линейные отображения в произвольное пространство Мр. Утверждение 2. Пусть dim Lp — п,а = (ai,..., ап) — базис пространства Lp и Мр — произвольное пространство. Тогда: а) всякое отображение <р Е £(Lp, Мр) однозначно определяется образами <р(аг), г Е 1,п, базисных векторов пространства Lp; б) для любых векторов /?i,...,/3n пространства Мр существует единственное отображение ф G £(Lp,Mp), при котором ф{осг) = Рг, i G l,n. □ а) Обозначим (р(а) = (y?(ai),... ,y?(an)). Так как ip E £(Lp,Mp), то для произвольного вектора 7 = ]С агаг = cfyj* пространства Lp спра- г=1 ведливы равенства: ¥>(<5)7й. (3) г=1 Остается заметить, что для любого вектора 7 £ £р столбец координат ji определен однозначно. п б) Для произвольного вектора 7 = S агаг пространства Lp поло- г=1 жим по определению п г=1 Легко проверить, что ф Е £(Ьр, Мр) и ф(аг) = (Зг, г Е 1, п, т. е. ф — требуемое отображение. Его единственность следует из утверждения а). □ Замечание!.. Утверждение 26) устанавливает взаимо однозначное соответствие между множеством £(Lp,Mp), где dim Lp = n, и множеством всех систем векторов пространства Мр, состоящих из п векторов. Уточним теорему об эпиморфизме. 47
Утверждение 3. Если в условиях теоремы 1 пространство Lp конечномерное, то dim ip(Lp)p = dimLp — dimKer (p. □ По теореме 1 пространства Lp/Kercp и (p(Lp) изоморфны. Тогда по теореме 10.ХШ dimLp/Keiip = dim ip(Lp). Остается заметить, что по теореме 14.ХШ dim Lp /Kercp = dimjLp — dimKer^. □ Рассмотрим теперь ситуацию, когда оба пространства Lp и Мр конечномерные. Утверждение 4. Пусть а = (ai,..., ап) и (3 = (/?i,..., /?m) — базисы соответственно пространств Lp и Мр. Тогда: а) для любой матрицы В Е Рт,п отображение *ф: Lp —> Мр, задаваемое формулой есть линейное отображение; б) если (р £ £(Lp,Mp), то существует такая единственная матрица А € Рт,п> что для каждого вектора у Е Lp выполняется равенство ф) = Д(Лт£). (4) Эта матрица имеет вид 1...,<р(ап)10). (5) □ а) Линейность отображения ф следует из равенств (7 + S)$ = = 7а + $ а и ha)a = 7<sa (см- утверждение 11.XIII) и формул (5) и (6) гл. XIII. Например: фа) = £(B(7a)i) = 0(В^а) = 0(В^)а = ф)а. б) Так как <р(щ) = /5<^(ai)i, г G 1, п, то ввиду равенства (3) справедливо равенство (4), где матрица А имеет вид (5). Если же А Е Рт,п — произвольная матрица, удовлетворяющая равенству (4), то, как нетрудно видеть, <р(щ) = 0А\. Значит, А\ = <^(ai)i, и, следовательно, матрица А определена однозначно. □ Определение 4. Матрицу А € Pm,n, имеющую вид (5), называют матрицей линейного отображения (р: Lp —» Мр в базисах а и /3 и обозначают через А& д(<^). 48
^Замечание 2. Утверждение 4 при фиксированных базисах а и (3 устанавливает взаимно однозначное соответствие а между множествами £(Lp,Mp) и Рт,п: (6) П р и м е р 6. Пусть в условиях примера 2Й= (ai,..., ап) — базис пространства Lp. Тогда Азу$(а) = аЕ. Уточним утверждение 1. Утверждение 5. Если а = (ai,..., ап) и /3 = (/?i,..., /3m) — базисы соответственно пространств Lp и Мр, то для любого отображения ip e £(Lp,Mp) справедливы равенства: а) dim(p(LP) = rangA б) dim Ker ip = n — ran д П а) Ввиду соотношений (3) <p(Lp) — (cp(ai),..., <p(an))p. Значит, по утверждению 12.XIII dim<p(Lp) = dim(y?(ai)t,...,^(an)i)p. По определению 4 и следствию 7 теоремы 7.VII dim cp(Lp) = rangA^ д(^). б) Следует из а) и утверждения 3. □ Уточним теорему 2. Л е м м а 1. Пусть (р, Ф Е £(Lp,Mp), а € Р, а = (c*i,...,an) и (3 = (/?i,..., /Зт) — базисы соответственно пространств Lp и Мр. Тогда справедливы равенства: П Пусть 7 € Lp. Ввиду определения 4 и равенства (4) имеем: (у + Ф)Ь) = 0{asj(<p + ФЬ*)- (8) Левую часть равенства (8), пользуясь первым из равенств (2) и формулами (5), (6) гл. XIII, перепишем в виде: Ф) + ФЬ) = Д 0 Таким образом, 49
По утверждению 46) из (9) следует первое из равенств (7). Аналогично проводится доказательство и второго из этих равенств. □ Теорема 3. Если dim Lp — пи dim Mp = т, то пространство £(Lp,Mp)p изоморфно пространству (Рп,т)р- В частности, dim£(Lp,Mp) = пт. □ В силу замечания 2 и леммы 1 отображение а: £(£р, Mp) —► Pn,m? определенное равенством (6), является изоморфизмом пространства £(£р, Мр)р на пространство (Рт,п)р- По теореме 10.ХШ dim(Pmjn)p = = dim£(Lp, Mp)p = тп. □ § 2. Линейные преобразования векторных пространств Определение 5. Линейное отображение ср: Lp —► Lp называют линейным преобразованием пространства Lp. Множество £(Z>p, Lp) всех линейных преобразований пространства Lp обозначают через £(£р). Линейные отображения, рассмотренные в примерах 1 — 3, это линейные преобразования. П р и м е р 7. Отображение —: Р[х]р —► Р[#]р, где Р — поле и CLX — (f(x)) = ff(x) для f(x) G P[x]j есть линейное преобразование про- ах странства Р[х]р. В § 1 на множестве £(£р) были введены операции сложения и умножения на элементы поля Р. Поскольку элементы из £(Lp) — это линейные отображения Lp в Lp, то на £(£р) можно определить также внутреннюю операцию композиции: если <p,ip e £(Lp), то Va e LP(((f о ф)(а) = ip(ip(a))). (10) Нетрудно проверить, что (р оф € £(Lp). Теорема 4. Для произвольного векторного пространства Lp множество (£(Lp), +, ©) является векторным пространством над полем Р, а алгебра (£(Lp),+,o) — кольцом с единицей. 50
□ Первое утверждение теоремы следует из теоремы 2, Доказательство второго утверждения осуществляется непосредственной проверкой. Заметим, что единицей кольца £(Lp) является тождественное преобразование — гомотетия ё = е, где е — единица поля Р, а нулем — гомотетия б. □ Определение 6. Кольцо (£(Lp),+,o) называют кольцом линейных преобразований векторного пространства Lp. Определение?. Преобразование ip G £(£р) называют обратимым, если существует такое преобразование ф G £(Lp), что ip о ф = ф о (р = е, т. е. если <£> G £(Др)*. Теорема 5. Если (р G £(£р), то следующие утверждения эквивалентны: а) ip G £(Lp)*; б) ср — изоморфизм Lp на Lp; в) tp — обратимое отображение, т. е. <pov = vocp = e для некоторого v: L —> L (определение 10.1). □ а) =Ф- в) По условию существует такое ф Е £(Lp), что (р о ф = = ф о ip = е. Остается положить v = ф. в) => б) По утверждению 4.1 tp — биекция. Значит, по условию и определению 11.XIII tp — изоморфизм. б) => а) По утверждению 8.ХШ существует обратное отображение ip-1 и ip'1 G £(Ьр). Значит, ср G £(Lp)*. D Рассмотрим теперь случай, когда пространство Lp конечномерное. Определеннее. Пусть а = (ai,..., ап) — базис пространства Lp. Матрицей преобразования ip G £(£р) в базисе а называют матрицу В силу равенств (4) и (5) для любого вектора 7 £ Ьр справедливы равенства: <р(-у) = аАз(ф1а, ф)[5 = А5(ф1а. (11) Поэтому а}в,... ,аЛ5(у>)а^5) = аА5(<^). (12) Л е м м а 2. Если а = (ai,...,an) — базис пространства Lp и <p,ip € Z{Lp), то справедливо равенство (13) 51
D Пользуясь равенствами (10), (11) и (12), для 7 £ Lp получаем (14) Ввиду первого из равенств (11) имеем i (15) Ввиду утверждения 4 из равенств (14) и (15) получаем требуемое равенство (13). □ Теорема 6. Если а = (ai,..., ап) — базис пространства Lp, то пространство £(Lp)p изоморфно пространству (Рп,п)р и, в частности, dim£(Lp)p = п2, а кольцо £(ip) изоморфно кольцу Рп,п- □ Первое утверждение теоремы есть непосредственное следствие теоремы 3. В частности, отображение а: £(Ьр) —► Рп>п, где а(<р) = Аз(у>), есть изоморфизм группы ( £ (Lp), +) на группу (Рп,п, +). Из равенства (13) следует, что а(ср оф) = а(ср)а(ф), где <р,ф € £(Хр). Значит, а — изоморфизм колец. □ Следствие. В условиях теоремы 6 преобразование <р £ £(Ьр) обратимо тогда и только тогда, когда обратима матрица А$(}р). При этом Теорема 6, в частности, показывает, что кольцо линейных преобразований £(Lp) пространства Lp не является коммутативным. Однако некоторые преобразования из £(£р) могут быть перестановочными. Пример8. Пусть Lp — произвольное пространство, <р е £(Lp) и а — гомотетия. Для любого вектора 7 £ Lp справедливы равенства: (а о <£>)(7) = й(<£>(7)) = (p(nr)a = ip^a) = (f(a(j)) = (if о а)(7), из которых следует, что а о <р = (р о а. Ясно, что тогда а о ipk = tpk о а для любого k G N. Теперь для случая конечномерного пространства Lp уточним теорему 5. Утверждение 6. Если a = (ai,..., ап) — базис пространства Lp, то для преобразования (р € £(ip) равносильны утверждения: а) ср в £(LP)*; 52
б) tp — биекция* в) tp — инъективное преобразование*, г) (<^(ai),..., 4>{otn)) — базис пространства Lp; д) <р — сюръективное преобразование. Доказательство утверждения б предоставляется читателю. Замечание 3. По утверждению 5.1 для отображения конечного множества в себя совпадают свойства инъективности, сюръективности и биективности. Утверждение 6 показывает, что эти свойства совпадают и для линейного преобразования конечномерного пространства, хотя само пространство может состоять из бесконечного множества элементов. До сих пор мы рассматривали матрицы различных линейных преобразований конечномерного пространства Lp в фиксированном базисе а этого пространства. Рассмотрим теперь вопрос о том, как связаны между собой матрицы одного и того же линейного преобразования в различных базисах этого пространства. Утверждение?. Если а — {а.\,..., ап) и /3 = ЗС — базисы пространства Lp, то для любого преобразования <р Е £(Lp) справедливо равенство 1 (16) □ Из условия /3 = аС получаем tp(fi) = <р(а)С. Ввиду равенств (12) и обратимости матрицы С (следствие утверждения 12.XIII) имеем: 0А0(<р) = SAa(v)C = PC^AaMC. (17) В силу линейной независимости системы векторов (3 из равенства (17) получаем требуемое равенство (16). □ Определение 9. Говорят, что матрица В G Рп,п подобна матрице А £ Рп,пу если существует такая матрица С € Р*п, что В = = С~гАС. В этом случае пишут В « А. к Для матрицы А Е Рп,п и многочлена /(х) = ^ ftxl E Р[х] положим г=0 г=0 Ясно, что f(A) Е Pn,n- 53
Читателю предлагается самостоятельно доказать Утверждение 8. Отношение « есть отношение эквивалентности на множестве Рщп- Если А, В G Рп,п и В = С~гАС, то rang В = = rang А и для любого многочлена f(x) G Р[х] справедливо равенство f(B) = C-if(A)C. Ввиду утверждения 8 из условия В « А следует А « Б, т. е. можно говорить, что матрицы А и В подобны, вместо того, что матрица В подобна матрице А. П р и м е р 9. Матрицы, имеющие одинаковый ранг, не обязательно подобны. Действительно, единичная матрица ЕпХп подобна только самой себе. Однако rangi^xn = п = rang В для любой невырожденной матрицы В. С учетом утверждения 7 и определения 9 мы можем сказать, что матрицы одного линейного преобразования в разных базисах подобны. Оказывается, что верно и обратное утверждение. Утверждение 9. Матрицы А,В е Рщп подобны тогда и только тогда, когда они являются матрицами одного линейного преобразования пространства Lp, где dim Lp = п. □ Ввиду утверждения 7 остается доказать, что подобные матрицы являются матрицами одного линейного преобразования. Пусть В = = С~гАС и Lp — произвольное пространство, где dim Lp = п. Согласно утверждению 4 а) зададим отображение ф G £(Lp), положив = ЗА*уi, где 7 £ Lp и а — базис пространства Lp. Тогда А = А^( Так как С — невырожденная матрица, то система векторов 0 = аС является базисом пространства Lp (см. следствие утверждения 12.ХШ). По утверждению 7 1 что и требовалось. □ Переход к другому базису пространства Lp позволяет иногда существенно упростить вид матрицы линейного преобразования и этим прояснить "геометрический" смысл преобразования. Пути выбора таких базисов указаны в следующих параграфах. П р и м е р 10. На плоскости Дг выберем базисы а = (01,0:2) и 0= ОбьДО, где А = \аг + |а2, А 54
А <*{ Преобразование (р определим матрицей А$((р) = - f 1. Нетрудно проверить, что А* = I n n 1. Значит, преобразование ср — это ортогональное проектирование на прямую, содержащую вектор (3\. § 3. Собственные векторы, собственные значения и характеристический многочлен линейного преобразования В дальнейшем, если не оговорено противное, Lp — конечномерное пространство. Простейшее линейное преобразование пространства Lp — это гомотетия а, где а £ Р. Матрица этого преобразования в любом базисе а = (ai,...,an) пространства Lp — скалярная: А$(а) = аЕ. Геометрический смысл такого преобразования очевиден. При а ф О происходит "растяжение" пространства равномерно вдоль каждой из "осей" qi, ... ,ап. Если (р Е £(Lp) — такое преобразование, что в некотором базисе (3 = (/?i,..., /Зп) матрица Ах((р) диагональная, то геометрический смысл преобразования (р также ясен: если А^{ф) = diag(ri,... ,rn), то преобразование ср состоит в "растяжении" пространства вдоль каждой "оси" /3i "в г г раз". Выясним, когда же преобразование (р имеет такой характер. 55
Определение 10. Ненулевой (!) вектор a £ Lp называют собственным вектором преобразования (р £ £(Lp), принадлежащим собственному значению г £ Р, если (р(а) = от. Элемент г £ Р называют собственным значением преобразования ср £ £(£р), если существует такой ненулевой (!) вектор а £ Lp, что (р(а) = аг. Пример 11.В примере 10 векторы Pi и /?2 — собственные векторы преобразования <р, принадлежащие соответственно собственным значениям 1 и 0. Не всякое линейное преобразование имеет хотя бы один собственный вектор. Пример 12. При повороте плоскости £>2 на угол и = тг/2 вокруг начала координат ни один вектор (кроме нулевого) не переходит в пропорциональный себе вектор. Значит, у этого линейного преобразования нет собственых векторов. Утверждение 10. Матрица преобразования (р £ £(Lp) в базисе а = (ai,... ,ап) — диагональная тогда и только тогда, когда базис а состоит из собственных векторов преобразования <р. □ Если А$((р) — diag(ri,... ,rn), то по определению 8 ^р{аг) = осггг^ г G 1,п. Стало быть, базисные векторы являются собственными векторами преобразования ср. Обратно, если (р(аг) = аггг, г G 1,п, то снова по определению 8 А&{ф) = diag(ri,..., rn). □ Укажем теперь практический способ отыскания собственных векторов и собственных значений линейного преобразования. Определение!!. Характеристической матрицей матрицы А £ РЩп называют матрицу Ех — А £ Р[а:]п,п. Характеристическим многочленом матрицы А называют многочлен ха(х) = \Ех — А\ £ Р[х]. Заметим, что Ха(х) — унитарный многочлен и degXA(#) = п. П р и м е р 13. Если А = diag(ri,..., rn), то Ха{х) = {х — п)... (х - -г„). Утверждение 11. Если А, В £ Рщп и В & А, то хв{х) = Ха(х)- □ По определению 9 существует такая невырожденныя матрица С £ £ РщП, что В = С"1АС. Тогда справедливы равенства Хв(х) = \Ех -В\ = \Ех - С~гАС\ = \С~г(Ех - А)С\ = = 1С"1! • \Ех - А\ • \С\ = \Ех - Л| = Ха(х). П Утверждение, обратное к утверждению 11, неверно. 56
П р и м е р 14. Матрицы I п )'(п 1 )^^2 имеют равные характеристические многочлены, однако, они не подобны (см. пример 8). Определение 12. Матрицу A £ РПуП называют полураспавшейся, если где 1 < к < п. Утверждение 12. Если А — полураспавшаяся матрица (18), то хл(х) = Хв{х) - Xd(x). П Справедливость утверждения легко следует из теоремы Лапласа 3 (теорема 6.VI). □ Утверждения 7 и 11 делают корректным Определение 13. Характеристическим многочленом преобразования (р £ £(Lp) конечномерного пространства Lp называют характеристический многочлен матрицы этого преобразования в произвольном базисе пространства Lp. Его обозначают через х<р(х)* Теорема 7. Собственные значения преобразования <р G £(£р) суть все корни в поле Р многочлена Х<р(х)- Собственные векторы этого преобразования, принадлежащие собственному значению г G Р, — это все такие векторы 7 G Lp \ {в}, столбцы координат ji которых в произвольном фиксированном базисе а пространства Lp являются решениями системы линейных уравнений {Ег-Аа(<р))х1=01. (19) □ Для вектора 7 € Lp и скаляра г G Р равенство (^(7) = 7Г равносильно равенству <£>(7)# — 7<зг или ВВИДУ соотношений (11) равенству j j$ = 75 г> которое можно переписать в виде: {Ег-А*{¥>Ы=01- (20) По определению 10 из равенства (20) получаем, что г — собственное значение преобразования <р тогда и только тогда, когда система линейных уравнений (19) имеет ненулевое решение, т. е. когда \Ег — А^((р)\ = = 0, или X<p(r) = 0. 3 П. С. Лаплас — французский математик и физик (1749—1827). 57
Если же х<р(г) = О И 7 ~~ собственный вектор преобразования <£>, принадлежащий собственному значению г, то из равенства (20) следует, что 7^ ~~~ решение системы линейных уравнений (19). □ В заключении параграфа рассмотрим вопрос о линейной независимости систем собственных векторов линейного преобразования. Утверждение 13. Пусть 7«ь • • • > Ъкг — линейно независимая система собственных векторов преобразования ср Е £(Lp), принадлежащих собственному значению гг Е Р, г Е 1,£, где т8 ф Г£ при s ^ £. Тогда система векторов: линейно независима. □ Доказательство утверждения проведем индукцией по числу t. При t = 1 система векторов (21) линейно независима по условию. Предположим, что утверждение верно для любой системы векторов, удовлетворяющей условиям утверждения при t < m, и докажем, что тогда оно верно при t = т. Пусть т кг ЕЕ^=^> (22) г=1 j=l где сгз G Р. Применив к обеим частям равенства (22) преобразование (р> получим m кг ^Л (23) Теперь умножим обе части равенства (22) на гт и почленно вычтем полученное равенство из равенства (23). Тогда справедливы равенства: т къ т—1 къ г=1 j=l г=1 j=l из которых по предположению индукции следует, что сг<7 = 0 при г G € 1,т — 1, j e l,fcz. Тогда ввиду условия из (22) получаем, что Сг3 = 0 и при i = m, j G 1, fcm. □ Утверждение 10 и пример 12 показывают, что не для всякого линейного преобразования (р пространства Lp можно подобрать такой базис а пространства, чтобы матрица А${ф) была диагональной. Поэтому 58
в следующих параграфах этой главы и в следующей главе будут рассмотрены другие способы получения возможно более простой матрицы § 4. Многочлены, аннулирующие преобразование. Минимальный многочлен к Пусть Р — поле, f(x) = J2 hx% € Р[х], Lp — произвольное про- г=0 странство над полем Р и (р Е £(Lp). Положим л г=0 Так как £(Ьр) — кольцо, то /(<£>) Е £(1/р). П р и м е р 15. Пусть <£> — поворот пространства Дг на угол тг/2 вокруг начала координат. Если д(х) = х2, то д{ф) = —1 — поворот на угол тг, а если /(ж) = х2 +1, то /(у?) = б. Для гомотетии а и £(ж) = а; — а получаем t(a) = 0. Утверждение 14. Пусть Lp — произвольное пространство и f(x), g(x) ЕР[х]. Тогда: а) если <р g £(ip), A g Pn>n, h{x) = f(x) + g(x) и t(x) = f(x)g(x), то справедливы равенства: Hv) = f(v) + 9(<Р), *(V) = f(v) о g{v) = g(<p) о f(<p) (24) h{A) = /(A) + 5(Л), t(il) = /(АЖА) = g(A)f(A); (25) б) еслп (f(x),g(x)) = e, <p e LP и f((f)(nr) = g(v){y) =в, тоу^в. О а) Справедливость первого из равенств (24) очевидна. Пусть £ т £+т /г \ fix) = Е /.*• и д(х) = Е Ля«. Тогда t(x) = Е Е /*ft-fc ^ и г=0 1=0 г=0 \к=0 / = Е Е Л ° ft-fc ) О(^г- Одновременно ввиду примера 8 в кольце г=0 U=0 / имеем: 59
f(<P)°9(<P)= ( \г=0 () г=0 \к=0 / Значит, t(ip) = f(ip) о g(<f). Поскольку f(x)g(x) = g{x)f{x), то t(<p) = Аналогично доказываются и равенства (25). б) По условию и утверждению 4.IX найдутся такие многочлены и(х), v(x) £ Р[х], что u(x)f(x) + v(x)g(x) = е. По утверждению а) получаем и(<р) о f(<p) + v(ip) о д(<р) =ё = е. Тогда справедливы равенства 7 = £(т) = (u(v) ° /(^))(7) + (v(v) ° од(Ф))Ь) = ti(v)(/(v)(7)) + у(Ф)Ш)Ш = <ч>Ш + v(<p)(0) =в.п Утверждение 15. Если а = (ai,..., otn) — базис пространства Lpj <р — произвольное преобразование из £(Lp) и /(ж) — произвольный многочлен из Р[х], то □ Доказательство проводится с использованием равенств (7) и (13). Читателю предлагается провести его самостоятельно. □ Определение 14. Говорят, что многочлен f(x) £ P[x] аннулирует преобразование ср £ £(Lp) (матрицу А £ Рп,п), если /(<£>) = б (f(A) = Опхп)- В таком случае говорят, что <р (соответственно А) — корень многочлена /(ж), a f(x) — аннулирующий многочлен преобразования <р (матрицы А). Пример 15 показывает, что для некоторых преобразований существуют аннулирующие многочлены. Следующая теорема является одной из фундаментальных в теории линейных преобразований конечномерных пространств. Предварительно рассмотрим кольцо матриц Р[гс]П)П, где Р — поле (кольцо полиноминальных матриц). Пусть В(х) = (Ъгз(х))пхп, где 8гэ Ьгэ(х) = J2 b^xk. Обозначим: fc=O 60
где и Е 0, t и t = maxsiy. Так как Р С Р[х] (см. § 1.IX), то J3tt G Р[х]щп и Дц xw — результат умножения матрицы из Р[х]п>п на элемент кольца Р[х\. Поэтому в кольце Р[х)п^п матрица В(х) однозначно представима в виде: В(х) = Btxl + ... + Вгх + Во. Пусть С(х) = Сех£ + ... + Сгх + Со — аналогичное представление матрицы С(х) G Р[х]щп. Ясно, что В(х)+С(х)= J2 {Bv + C^x* (26) i/=0 (если t > I, то Cv = Опхп при v > £). Ввиду дистрибутивности операции умножения матриц над кольцом на элементы этого кольца относительно операции сложения матриц и равенства Dxs = xsD, где D е Рп,п, получаем, что В(х)С(х) = ВгСехш + ... + ( J2 Bi°k-i ) ** + • • - + ^оСо. (27) \г=0 / Установим теперь связь между кольцом Р[х}щп и кольцом многочленов Рп,пИ от одного переменого над кольцом Рп,п- Л е м м а 3. Если Р — поле и п е N, то отображение г: Р[х]ПуП —► —> РщпЩ) определенное равенством т{Вгхг + ... + ВЬ) = Btxl + ... + Во, является изоморфизмом кольца Р[х]щп на кольцо Рп^п[х]. □ Ясно, что т — сюръективное отображение. Если т(В(х)) = 0(х) — нулевой многочлен, то В(х) = ОпХп- Значит, т — инъективное отображение и, таким образом, биекция. Из равенств (26) и (27) следует, что т(В(х) + С{х)) = т{В{х)) + т(С(х)), т{В{х)С(х)) = т(В(х))т(С(х)). Значит, т — требуемый изоморфизм. □ 61
Теоремав (Гамильтон 4, Кэли 5). Если A Е РПлп и <р Е £(Lp), где dimip = п, то справедливы равенства: Ха(А) = Опхп, хМ = б. (28) □ Достаточно доказать первое из равенств (28). Действительно, если оно справедливо, и а = (ai,...,an) — базис пространства Др, то по утверждению 14 и определению 12 имеем: = Опхп и, стало быть, х^(^) = б. Докажем первое из равенств (28). Пусть Ха{х) = хп + Сп-гх71-1 + ... + ах + со G Р[дг]. В кольце Pn,n[3f] выберем многочлен F(x) = Ехп + Сп-гЕ я?1"1 + ... Ясно, что F(A) = ха(А)- Поэтому достаточно показать, что F(A) = = Опхп или ввиду теоремы Безу 6 (§ 3.IX), что многочлен Ех — А Е £ Pn,n[3f] делит справа многочлен F(x). Рассмотрим в кольце Р[х]п^п матрицу Q{x) = (Ex — А)*, взаимную к матрице Ех — А. Как показано в доказательстве теоремы 7.VI, верно равенство (Ех - А)*(Ех -А) = \Ех - А\ • Епхп, т. е. равенство Q(x)(Ex -A) = Ха(х)Епхп. (29) Применив к обеим частям равенства (29) отображение т, определенное в лемме 3, получим в кольце Рп,п[^] равенство r(Q(x))(Ex - А) = F(x), которое и требовалось получить. □ 4 У. Гамильтон — английский математик (1805—1865). 5 А. Кэли — английский математик (1821—1895). 6 Э. Безу — французский математик (1730—1783). 62
По теореме Гамильтона—Кэли для любого преобразования ср £ £(Lp) (любой матрицы А Е Рп,п) существует унитарный многочлен, аннулирующий преобразование ср (матрицу А). Поэтому существуют такие многочлены минимальной степени. Это делает содержательным Определение 15. Унитарный многочлен из Р[х], аннулирующий преобразование <р Е £(£р) ( матрицу А € РПуп) и имеющий наименьшую степень среди многочленов с этим свойством, называют минимальным многочленом преобразования ср (матрицы А). Теорема 9. Если <р Е £(Др), где dim Lp = п, (А € Рп,п), то: а) в Р[х] существует единственный минимальный многочлен преобразования <р (матрицы А); б) если д(х) — минимальный многочлен преобразования <р (матрицы А), то для любого многочлена f(x) € Р[х] справедливы соотношения: № = б * 9(x)\f(x) (f(A) = Опхп * g(x)\f(x)) . П б) Пусть f(x) = g(x)t(x), где t(x) £ Р[х]. По утверждению 14 тогда f(A) = g(A)t(A) = Опхп • t(A) = Опхп. Обратно, пусть f(A) = Onxn- Разделим f(x) на g(x) с остатком: f(x) = q(x)g(x) + г (ж), где degr(x) < degp(x). Так как /(Л) = д(А) = = Опхп и /(А) = ^(Л)5(А) + г(А), то г(А) = Опхп. Если r(x) = c3xs + ... + со ф 0, то положим ri(x) = с^гг(х). Тогда справедливо равенство матриц r\(A) = cJxr(A) = OnXn- Стало быть, г\(х) — унитарный многочлен, аннулирующий матрицу А и имеющий степень, меньшую степени многочлена д(х), ибо degri(a?) = degr(rc). Полученное противоречие показывает, что г(х) = 0 и р(х)|/(х). а) Пусть д(х) и рх(д:) — минимальные многочлены матрицы А. По утверждению б) д(х)\д\(х) и 5i(a:)|p(a;). Тогда многочлены д(х) и 51(^) — ассоциированны, а поскольку они унитарные, то д\(х) = д(х). Аналогично доказывается теорема и для преобразования ср. □ Единственный минимальный многочлен преобразования (р Е £(Lp) (матрицы А е РЩп) обозначают через т(р(х)(тл(х)). Следствие 1. Если ср G £(Lp), где dim Lp = n, (A G Рщп), то тАх)\хЛх) (™<а(х)\ха(х)) . П Утверждение следует из теоремы Гамильтона—Кэли и теоремы 9. □ Следствие 2. Если (р Е £(Lp) и 3 — базис пространства Lp, то 63
□ Пусть t{x) = тц>(х) и д(х) = mAs^){x). Так как t(<p) = б, то A$(t((p)) = Onxn- Тогда по утверждению 15 справедливы равенства г(Ай{ф)) = Aa(t((p)) = Onxn- По теореме 96) отсюда следует g(x)\t(x). Аналогичным образом из равенства А^(д(ср)) = д{А$(ф)) = Onxn получаем д{ф) = б и t(x)\g(x). Значит, д(х) = t(x), так как д(х) и t(x) — унитарные многочлены. □ Следствие 3. Если А,В € Рщп и В & А, то тв(х) = тА(х). □ По утверждению 9 матрицы А и В можно считать матрицами одного линейного преоразования (р пространства Lp, где dim Lp = n, в разных его базисах. По следствию 2 тпа(х) = т^(х) и гпв(х) = тп(р(х). □ Другое доказательство следствия 3 молено получить, используя утверждение 8. П р и м е р 16. Если а Е Р\ {0}, то гп^{х) = х — а, тп^(х) = 1. В некоторых случаях задачу отыскания минимального многочлена матрицы А Е РПуп можно свести к задаче отыскания минимальных многочленов матриц меньших рамеров. Определение 16. Матрицу А Е Рп,п называют распавшейся или квазидиагональной, если (n-k)xk D(n-k)x{n-k) где 1 < к < п. При условии (30) пишут: А = Diag(J5, D). Утверждение 16. Если А есть матрица (18) или матрица (30), то соответственно [mB(x),mD(x)] \тА(х) или тЛ(х) = [mB(x),mD(x)]. □ Если матрица А имеет вид (18) или (30), a f(x) E Р[х], то О Значит, из равенства тпа(А) = Опхп следуют равенства гпа(В) — mA(D) = O(n_fc)x(n_fc). По теореме 9 тогда тв(х)\тА(х) и mD(x)\mA(x). Следовательно, [тв(х),mD(x)] \mA(x). (31) Если же матрица А имеет вид (30) и h(x) = [тв{х)уто{х% то ЦА) = Diag(/i(B),/i(£>)) = Diag(O,O) = Onxn и mA{x)\h{x). Отсюда и из (31) следует равенство тА(х) = [тв(х),то(х)]. П 64
Один из способов вычисления минимального многочлена произвольного преобразования ср G £(Др) будет изложен в следующих параграфах. § 5. Минимальный многочлен вектора относительно линейного преобразования Теорема 9 и ее следствие 1 показывают, что для любого преобразования <р е £(Lp), где dimLp = n, и любого вектора 7 € Lp существуют унитарные многочлены f(x) E Р[х] такие, что /(<Р)(7)=*. (32) Например, можно выбрать f(x) = т^х) или f(x) = х<р(х)- Определение 17. Унитарный многочлен f(x) £ Р[х] называют минимальным многочленом вектора 7 £ Lp относительно преобразования <р € £(£р), если для него выполнено свойство (32) и он имеет наименьшую степень среди всех унитарных многочленов из Р[х], обладающих этим свойством. Следующая теорема аналогична теореме 9. Т е о р е м а 10. Если ц> е £(£р), где dim Lp = n, u^f G Lp, то: а) в Р[х] существует единственный минимальный многочлен вектора 7 относительно преобразования (р; б) если д{х) — минимальный многочлен вектора 7 относительно преобразования (р, то для любого многочлена f{x) G Р[х] справедливо соотношение □ Доказательство проводится совершенно аналогично доказательству теоремы 9 с заменой матрицы А на преобразование ср и рассмотрением не преобразований, а образов вектора 7 ПРИ этих преобразованиях. □ Единственный минимальный многочлен вектора 7 £ Lp относительно преобразования (р е £(Ьр) обозначают через т1%{р{х). Следствие. Если <р € £(£р) wy e Lp, то mJi<f(x)\mip(x). 65
П р и м е р 17. Ясно, что для 7 £ Lp, (р € £(Lp) справедливо неравенство degm7)<^(x) > 0. При этом тпуу(р(х) = е тогда и только тогда, когда 7 = М тп7^(х) = х — г тогда и только тогда, когда 7 — собственный вектор преобразования <р, принадлежащий собственному значению г. Таблица, приведенная ниже, показывает аналогию между понятиями, рассмотренными в теории гупп, и понятиями, введенными в настоящей главе. Таблица 1 Конечная абелева группа (G, 4-) \G\:VgeG(\G\g = 0), expG: Vg e G(expG • д = 0), ordg : д Е G: kg = 0 <=> ordg\k. Конечномерное пространство Lp тп,(р{х) i Vq £ Lp(i7i(p\ip)(q) = 0), Как мы сейчас увидим, эта аналогия может быть продолжена. Сравните следующее утверждение с формулой, выражающей порядок степени де элемента д группы (G, •) через Ordp и!,ис формулой, выражающей порядок произведения элементов, имеющих взаимно простые порядки (теорема 2в), г).XI). Утверждение 17. Пусть ср € £(Ьр), где dim Lp = п, и a G Lp. Тогда справедливы утверждения: а) если f(x) Е Р[х] и (3 = f((p)(a), то б) есл« 7 € £р « (m7iV,(rr),ma>¥,(x)) = e, то D a) Пусть d(x) = (f(x),ma,v(x)), /(ж) = fi(x)d(x) и та^(х) = = mi(a;)d(a;). Нужно доказать равенство . (33) В силу условия и утверждения 14 а) справедлива цепочка равенств: mi(<p)((3) = тг((р)(/(<р)(а)) = (тт((р) о fifo) о d(<p))(a) = 66
По теореме 10 б) тогда тр1(р(х)\ггы(х). (34) С другой стороны, из равенств следует, что mOL^{x)\m^^{x)f{x). Но тогда m\{x)\mp^{x)f\{x) и (x), (35) так как (mi(x),fi(x)) = е. Поскольку mi(x) и mpi(p(x) — унитарные многочлены, то из соотношений (34) и (35) получаем равенство (33). б) Так как справедливы равенства: Av))(a + 7) = тъя?( = в, то по теореме 10 б) (х)\та^(х) • т1^{х). (36) С другой стороны, так как та+7^(<р)(а: + 7) = в, то имеет место равенство ma+7,vfo>)(a) = -™a+7,v>(¥>)(7). (37) Обозначим через <5 равные векторы, стоящие в левой и правой частях равенства (37). Так как гпа^{ф)(5) = т1ч{р{ф){6) = 0, то по условию и утверждению 146) 5 = в. Это означает, что а тогда по свойству взаимно простых многочленов та,<р(х) • mli(p(x)\ma+7i(p(x). (38) Из соотношений (36) и (37) получаем равенство ™>oL+*i,ip{x) — ™>а,<р(х) • m7jV?(a;). □ Следующие два утверждения дают метод вычисления многочлена 67
ства Lp и (р Е £(Lp). Тогда rav(ar) = [maiyip(x),..., manj(p(x)]. □ Пусть t(x) = [mai)V?(x),... ,тап,<р(х)]. По следствию теоремы 10 тп^^х^т^х) при г = 1,п. Значит, <(ж)|т^(я:). (39) Поскольку mat>v?(a:)|t(a:), то по теореме 106) г{ф)(аг) = 0, г = 1, п. Тогда п для любого вектора 7 = S агаг € £р имеем г{ф){^) = в. Значит, г=1 т^хЩх). (40) Из соотношений (39) и (40) получаем требуемое равенство: t{x) = т<р(х). П Утверждение 19. Пусть ip E £(I^p), 2<?e dimLp = n, гл 7 ^ € Lp \ {в}. Тогда существует такое к £ 1,п, -что сглстелса векторов: %V(7),.--,V*"1(7) (41) линейно независима, а вектор <pk{i) линейно выражается через эту систему. Если при этом <РкЬ) = 7Со + ф)сг + ... + ¥Р*-1(7)сЛ-1> (42) то (^) = хк ~ Ск-1Хк~~г - ... - сгх - с0. □ Рассмотрим последовательность векторов 7? ^(7)? • • •»^s(7)> • • • • Так как dim Lp = п, то найдется такое fe € 1,п, что система векторов (41) линейно независима, а система векторов 7? ^(7)» • • •»V*(7) линейно зависима. По утверждению З.ХШ и следствию утверлсдения 2.ХШ вектор (рк(*у) однозначно линейно выражается через систему векторов (41). Пусть это выражение задано равенством (42). Обозначим f(x) = хк — Ck-ixk~1 — ... — Со- Ввиду равенства (42) /(vO(7) = ^- Предположим что многочлен: g(x) = хг -^дгхг Е Р[х] г=0 68
таков, что t < к и 9ifP)b) = <Р*(7) - £^(7)» = Л (43) г=0 Равенство (43) означает, что система векторов 7, <^(7)> •••><£* (7) ли~ нейно зависима и £ < к — 1. Это противоречит линейной независимости системы векторов (41). Значит, f(x) — унитарный многочлен наименьшей степени, удовлетворяющий условию /(<£>) (7) — 0- По определению 17 /(ж) = m7i</?(x). □ Получим теперь основной результат этого параграфа, позволяющий строить векторы с заданными минимальными многочленами. Т е о р е м а 11. Если tp e £(Lp), где dimLp = п, то для каждого унитарного делителя д{х) многочлена т(р(х) существует такой вектор 7 € Lp, что m^t(p(x) = д(х). □ Ввиду утверждения 17 а) достаточно доказать, что существует такой вектор а £ Lp, что та^{х) = т^(х). Пусть каноническое разложение многочлена т<р(х) над полем Р имеет вид: mv(x)=gi(x)kl...gt(x)kt. Одновременно по утверждению 18 где а = (ai,..., an) — базис пространства Lp. Значит, для каждого j E 6 1,4 существует такой вектор /3j G Lp (один из векторов ai,... ,an), что gj(x)k* \m0jt(p(x). Пусть mpji(p(x) = fj(x)gj(x)kj. Тогда по утверждению 17а) вектор jj = fj((f)(0j) имеет минимальный многочлен, равный 9j(x)kj 5 а по утверждению 176) вектор а = 71 + . - • + It удовлетворяет условию та,<р(х) = т<р(х). П § 6. Инвариантные подпространства. Циклические подпространства Определение 18. Подпространство Кр произвольного пространства Lp называют инвариантным относительно преобразования ср е £(LP), если <р(К) С К. 69
Понятие подпространства, инвариантного относительно линейного преобразования, обобщает понятие собственного вектора этого преобразования. П р и м е р 18. Если а € Lp и tp € £(Ьр), то подпространство Кр = (а)р инвариантно относительно преобразования (р тогда и только тогда, когда а — собственный вектор преобразования (р. (Проверьте!) П р и м е р 19. Если а* Е Lp, j G l,t, - собственные векторы преобразования ср, то подпространство Кр = (ai,..., ott)p инвариантно относительно (р. (Проверьте!) Однако существуют подпространства, инвариантные относительно преобразования ср, не содержащие ни одного собственного вектора этого преобразования. Пример 20. Пусть ф — преобразование пространства 1?з5 осуществляющее его поворот вокруг оси OZ на угол тг/2 против часовой стрелки. Плоскость XOY инвариантна относительно ф, но не содержит ни одного собственного вектора этого преобразования. Утверждение 20. Пусть а\,..., am e Lp, где Lp — произвольное пространство. Подпространство Кр = (ai,..., am)p инвариантно относительно преобразования <р € £(Ьр) тогда и только тогда, когда (р(оц) € К для г £ 1,т. Доказательство этого утверждения предоставляется читателю. Существование в пространстве Lp, инвариантного относительно преобразования (р G £(Lp) собственного подпространства, позволяет упростить матрицу этого преобразования. Определение 19. Пусть Lp — произвольное пространство, ср € £(Lp), и Кр — подпространство в Lp, инвариантное относительно tp. Отображение ф: Кр —> Кр, определенное формулой называют ограничением преобразования ср на подпространстве Кр (обозначение: ф = ср\ ). Очевидно, что ф G £(Кр). \Кр Т е о р е м а 12. Пусть а = (ai,..., ап) — базис пространства Lp и <р G £(Lp). Матрица А$(ср) является полураспавшейся тогда и только тогда, когда существует такое k G 1,п — 1, что подпространство Кр = (ai,... ,ctk)p инвариантно относительно (р. При выполнении 70
последнего условия ( ) |. (44) (п- к) х к £>(n-fc) х (п-к) где В — матрица преобразования ф = ср в базисе а' = (ai,..., o>k), Кр \ □ По определению 8 матрица А&(ф) имеет вид (44) тогда и только тогда, когда <р(а{) = а±Ьц + ... + од6м> г G l,fc, т. е. когда vKa*) € G ifp = (ai,..., а^)р, г G 1, fe. По утверждению 20 выполнение последних соотношений равносильно тому, что Кр — инвариантное относительно ср подпространство. По определениям 19 и 8 равенства <p(oti) = aibu +... + анЪы, г G 1, fc, означают, что В = А^(гр). По определению 13 х<р(х) = XAs(<p)(x) и Хф(х) = Хв(^). Ввиду утверждения 12 имеем Xv(x) = X^(x)Xd\x)- □ Т е о р е м а 13. Пусть а = (а±,..., ап) — базис пространства Lp и ср G £(Lp). Матрица А&(ф) является распавшейся и имеет вид: 1 < к < п, тогда и только тогда, когда подпространства Кр = = (ai,..., otk)p ^ Мр = (a*;+i,..., ап)р инвариантны относительно При этом, если ф = ср D = i4(ajb+1,...>an)(0 « Хср(х) П Доказательство теоремы аналогично доказательству теоремы 12 и предоставляется читателю. □ Следующие утверждения дают важные примеры инвариантных подпространств. Утверждение21. Если Lp — произвольное пространство, (р G £(Lp) и f(x) G Р[х], то подпространства Kerf(ip) и f(cp)(L) инвариантны относительно преобразования ср. □ По утверждению 1 Kerf(cp) и f((p)(L) — подпространства пространства Lp. Пусть a G f((p)(L), т. е. а = /(у?)(/?), где /3 G Lp. В силу утверждения 14 а) справедливы равенства: 71
показывающие, что ip(a) G f((p)(L). По определению 18 f((p)(L) — подпространство, инвариантное относительно (р. Пусть 7 € Кег/(у?), т. е. /(^)(7) = 0- Тогда Следовательно, ^(7) G Кег/(у?). Значит, подпространство Кег/(<^) инвариантно относительно ср. □ Утверждение 22. Пусть <р G £(Lp), где dimLp =n,QG г* =Хк - Ск-\Хк~Х - ... - С0. Тогда: а) подпространство Ь* (а) = (а,у>(а),... ,^Л~1(о:))р инвариантно относительно ip и dimL<p(a)p = к; б) то в) подпространство 1Р{а) содержится в любом инвариантном относительно ср подпространстве, содержащем вектор а. □ а) По утверждению 19 система векторов а,... 1(рк~1(а) линейно независима. Значит, dimL(p(a)p = к. При г < к — 1 имеем <р(<рг(а)) = = <^г+1(а) G Lv(a). Кроме того, по утверждению 19 1р((рк~~г (а)) = к-1 = ^2 <^г(а)с4 G Lv(a). Тогда по утверждению 20 подпространство ^(а) г=0 инвариантно относительно ср. б) По определению преобразования ф справедливо равенство ™>а,ф(х) = та,(р(х)- Поэтому degmat^(x) = к. По следствию теоремы 10 и следствию 1 теоремы 9 та^(х)\тф(х) и m^(x)\xrp(x). По утверждению а) degXip(x) = dimLv(a) = fc. Но тогда Xi>{x) = ma,i>{x) = тф(х). в) Пусть Мр — подпространство пространства Lp, инвариантное относительно ср и содержащее вектор а. Тогда (рг(а) G Мр при любом г G N. Следовательно, 1/^(«) С Мр. □ Определение 20. Подпространство ^(а) пространства Lp, построенное в утверждении 22, называют циклическим относительно ср подпространством, порожденным вектором а, а его базис а, <£>(а),..., ^~1(а) — циклическим базисом этого пространства. Пространство Lp называют циклическим относительно преобразования ср G £(Lp), если L = ^(а) для подходящего a G Lp. Получим критерий цикличности пространства. 72
Определение 21. Пусть /(ж) = хп - сп-\хп г —... - с\х — cq € Р[х]. Матрицу ( о е 0 0 ^ 0 0 0 е 0 0 ... 0 ... 0 ... 0 ... 0 ... е со Су С2 Сп-2 Сп-1 пхп называют сопровождающей матрицей многочлена f(x). Пример21. Пусть пространство Lp — цикилическое относительно преобразования ср и Lp = (а, <^(а),... ,у?п~1(а))р. По утверждению п-1 19 (рп(а) = J2 1р*(а)сг, где тау(р{х) = хп — Сп-\хп~х — ... — со- Обозна- чив а = (а, <£>(а),..., у?п~1(а)), получаем, учитывая утверждение 226), Ац(<р) = S(ma,<p(x)) = 5(mv(o;)). Утверждение 23. .Бели ip G £(Lp), mo равносильны утверждения: а) Lp — циклическое относительно ср пространство; б) dimLp = n и т^х) = Хч>{х)\ в) существует такой базис а пространства Lp, чтоА^((р) = S(f(x)) для некоторого унитарного многочлена f(x) € Р[х]. П а) =Ф б) Пусть Lp = Lv(a) и dimLp = п. Тогда система векторов а,... ,<^7г~*1(а) линейно независима и degma^(x) = п. Поэтому ^«,^0*0 = XvC^)- Ввиду соотношений rraa>v(a;)|mv(ar) и mv(a;)|xv(^) получаем т^х) = Х(р(х)- б) => в) По теореме 11 существует такой вектор 7 £ Lp, что mli(fi{x) = = т<р(х). По условию тогда m7,v(a;) = x^(x)- По утверждению 19 система векторов а = (7, <^(7)> • • • > V'71"1!?)) линейно независима и, значит, является циклическим базисом пространства Lp. В силу примера 21 в) => а) Пусть а = (ai,..., ап) — такой базис пространства Lp, что Аа(<р) = S(f(x)). Из вида матрицы S(f(x)) следует, что тогда (p(o>i) = = a^+i при г G 1,п — 1. Значит, a — циклический базис пространства Lp относительно преобразования tp и Lp = L(p(ai). □ 73
Замечание 4. Утверждение 23 дает критерий того, чтобы подпространство Кр пространства Lp, инвариантное относительно преобразования ср, было циклическим относительно ср подпространством. Действительно, если яр = , то подпространство Кр циклично от- р носительно ср тогда и только тогда, когда Кр циклично относительно яр. Теперь получим критерий того, чтобы конечномерное пространство Lp не имело собственных инвариантных подпространств. Т е о р е м а 14. Пусть ср Е £(Lp). Пространство Lp, dim Lp = п, не имеет собственных подпространств, инвариантных относительно (р, тогда и только тогда, когда многочлен х<р(х) неприводим над полем Р. □ Пусть в Lp есть собственное инвариантное относительно ip подпространство Кр. Базис ai,...,afc, I < fc < п, этого подпространства дополним до базиса a = (ai,..., а&,..., ап) пространства Lp. По теореме 12 тогда матрица А${ф) — полураспавшаяся и имеет вид (44). По утверждению 12 и определению 13 х<р(х) = XAa(<p)(x) = Xb(x)xd(x), где 1 < degXB(x) < п. Значит, многочлен Ху(х) приводим над полем Р. Обратно, пусть многочлен Xv(x) приводим над полем Р. Тогда существует такой унитарный многочлен g(x) G Р[х], что д(х)\т(р(х) и 0 < < degp(x) < п = degx^x). Действительно, если degm^x) < n, то можно взять д(х) = т<р(х), а если degm^(x) = п, то т^(х) = х<р(х)> и унитарный делитель многочлена Х<р(х) является делителем и многочлена т^х). По теореме 11 существует такой вектор 7 € Ьр, что mly(fi{x) = д{х). По утверждению 22 Lv{pj) — собственное подпространство в Lp, инвариантное относительно ср. □ Полученный в теореме 14 результат можно применить к решению вопроса о том, можно ли для данного преобразования tp e £(Lp) найти такой базис а пространства Lp, чтобы матрица А$((р) была полураспавшейся. Определение 22. Матрицу A G Рщп называют приводялмой, если она подобна некоторой полураспавшейся матрице, и неприводимой — в противном случае. Следствие. Матрица A G Рщп неприводима тогда и только тогда, когда многочлен Ха(х) неприводим над полем Р. Следующий результат является в некотором смысле обратным к следствию 1 теоремы 9. 74
Т е о р е м а 15. Если A G Рщп и д(х) — неприводимый делитель многочлена ха{х), то g(x)\rriA(x). □ Проведем доказательство индукцией по числу п. Если п = 1, то degXA(x) = 1, т. е. Ха(х) — неприводимый над полем Р многочлен. Тогда тА(х) = Ха{х) и д(х) = тА(х) = Ха(х). Пусть теорема верна для любой матрицы, принадлежащей Pm,m при 1 < т < п. Докажем, что тогда она верна и для матрицы А е Рп,п. Если многочлен Ха{х) неприводим над полем Р, то вновь д{х) = = тпа(х) = Ха{х). Если же многочлен Ха(х) приводим над полем Р, то по следствию теоремы 14 (Вкхк Ckx(n-k) \ О(п-к)хк D(n-k)x(n-k) ) ' где 1 < к < п. Так как ха(х) = Xb(x)xd(x)> то д(х) делит либо Хв(х), либо Xd{x). По предположению индукции д(х)\тв{х) или д{х)\тп(х). Следовательно, д{х)\ [тв(х), тпп(х)] и по утверждению 16 g(x)\mA(x). D Следствие 1. Если (р G £(Lp), где dimLp = п, и д(х) — неприводимый делитель многочлена Х(р(х)> то gix^m^x). Следствие 2. Если (р € £(Ьр), где dim Lp = n, то существует такое к G N, что Х<р(х)\т<р{х)к• При этом к < п. Доказательство следствий предоставляется читателю. Замечание 5. Теорема 15 является аналогом леммы Коши 7 в теории групп (лемма 4.XI). § 7. Разложение пространства в прямую сумму инвариантных подпространств Основой для дальнейшего является Т е о р е м а 16. Пусть Lp — произвольное пространство. Если многочлен f(x) G Р[х] аннулирует преобразование (р € £(Lp) и f(x) = = fi(x) • ... • ft(x), где (fi(x),fj(x)) = е при i ф j, то пространство 7 О. Л. Коши — французский математик (1789—1857). 75
Lp раскладывается в прямую сумму инвариантных относительно (р подпространств: LP = Kerf1(tp)+... + Kerft(<p). (45) □ Проведем доказательство индукцией по числу t. При t = 2 по условию для многочленов fi(x) и /г(х) найдутся такие многочлены щ(х) и U2(ж), что fi(x)ui(x) + f2{x)u2(x) = е. По утверждению 14а) отсюда получаем е = ё = fi(<p) о щ((р) + /г(^) ° ^2(</?)• Поэтому произвольный вектор ^ е Lp представим в виде: 7 = Ф) = ( При этом (/i(v?) otii(^))(7) G Кег/2((^) и (/2M поскольку f(x) = fi(x)f2(x) и /(^) = б. Следовательно, LP = Кег/ifa) + Ker/гЫ. Пусть /3 G Кег/i^) П Кег/2(^)- Тогда /ifo>)(/3) = /2(v)(/3) = Л Так как (/i(x),/2(rc)) = е, то по утверждению 146) /3 = в. Ввиду теоремы 6.ХШ получаем: LP = Kerf1(ip)+Kerf2((p). Дальнейшее проведение индукции предоставляется читателю. П Некоторые из подпространств Kerfi(ip) в разложении (45) могут быть нулевыми. П р и м е р 22. Пусть ср = е. Для многочлена f(x) = х(х — е) выполнены условия теоремы 16. Тогда LP = Кеге+ Кегб = 6+LP. Ниже будет показано, что при некоторых условиях на многочлен f(x) в разложении (45) нет нулевых слагаемых. Укажем критерий подобия матрицы А £ РП)П диагональной матрице. Т е о р е м а 17. Матрица А Е Рп,п подобна диагональной матрице тогда и только тогда, когда многочлен гпа(х) раскладывается над полем Р на линейные множители и не имеет кратных корней. □ Если А « D — diag(ri,...,rn), r« € Р, то по следствию 3 теоремы 9 и утверждению 16 тд(ж) = то(х) — [х — п,..., х — гп]. Стало быть, 76
га а (#) раскладывается над полем Р на линейные множители и не имеет кратных корней. Обратно, пусть гал(ж) = (х — г\)... (ж — г^), где гг е Р и гг ф г3 при г Ф 3- Рассмотрим произвольное пространство Мр, для которого dimMp = п. Пусть а = (ai,..., an) — базис этого пространства. Зададим преобразование ср е £(Мр), положив А$((р) = А. Тогда га^(ж) = = гпа(х) по следствию 2 теоремы 9. По теореме 16 при f(x) = m^x) получаем Мр = Кег(<£ — ri)+ - - - + Ker(ip — fi). Каждый ненулевой вектор подпространства Кет((р — т\) является собственным вектором преобразования у?, принадлежащим собственному значению гг. Поэтому базис (3 пространства Мр, составленный из базисов подпространств Кет((р—г^), г £ 1, *, состоит из собственных векторов преобразования (р. По утверждению 10 ААф) — диагональная матрица. Остается заметить, что в силу утверждения 7 матрицы А$((р) и Ая((р) подобны. □ Уточним теперь теорему 16 в случае, когда пространство Lp конечномерно и f(x) = х<р(х)- Т е о р е м а 18. Если ц> G £(Др), где dim Lp = п, и Ху>(х) — h(x) • • • ... ft(x), где t > 1, (/,(яг), f3{x)) = е при гф j и degft(x) > 0 при г е ТД то пространство Lp раскладывается в прямую сумму инвариантных относительно <р подпространств: LP = Ker/i(^)+.. ЛКегМф). (46) При этом dimКег ft((p) = deg ft(x) и ft(x) = х^г (ж г = (р Кет}г((р) П Равенство (46) получено в теореме 16 (Ху?(9?) = б по теореме Гамильтона—Кэли). По условию deg/t(:c) > 0. Многочлен ft(x) или неприводим, или имеет неприводимый унитарный делитель дг{х) (в первом случае считаем дг(х) = fi(x)). По следствию 1 теоремы 15 ^г(ж)17тг^(ж). Тогда по теореме 11 существует такой вектор аг £ Lp, что mati(p(x) = дг(х). Отсюда следует, что аг ф в. Кроме того, /г(^)(^г) = 0» т. е. аг € Кег/г (<£>). Этим показано, что Кег/г(<^) ф в при г G l,i. Отсюда следует, что 77
По теореме 13 в базисе а пространства Lp, составленном из базисов подпространств Кег/г (</?), матрица А$((р) — распавшаяся, и х<р(х) = = X<pi(x) • • • Х<рЛх)- Ввиду условия получаем равенство X<p(x)=Xvi(x)-.-X<pt(x) = h(x)...Mz). (47) Пусть tt(x) — неприводимый над полем Р многочлен, делящий многочлен х<рг(х)- По следствию 1 теоремы 15 и(х)\т^(х). По теореме 11 существует такой вектор /Зг Е Кег/г(у>), что m/3ti¥?t(x) = tt(x). Поэтому Р% Ф в. Если tt(x) |Л(х), то (t%{x), ft(x)) = е, и по утверждению 146) /3, = = в. Полученное противоречие показывает, что tt(x)\ft(x). Поскольку (Mx)Jj(x)) = е при г ф j, то отсюда следует, что {х<рг(х),х<рАх)) = е при г ф j. Таким образом, для многочленов ft(x) и х<ру(х) из равенства (47) выполнены соотношения: а) degft(x), degx<p,(x) > 0; б) (Mx)Jj(x)) = (х<рг(х),Х<р3(х)) = е ПРИ г^З\ в) любой неприводимый делитель многочлена Хфг(х) делит Л (ж), г еЦ В силу единственности канонического разложения многочлена Ху>(х) над полем Р получаем Хч>г{х) = f%(x)> * € l,t. Из последнего равенства и равенства dimKer/e(y?) = degx^t(^) получаем, что dimKer/t(^) = = deg/,(a?). D Следствие. Если ср Е £(Lp) и каноническое разложение многочлена х<р(х) на>д полем Р имеет вид: то пространство Lp раскладывается в прямую сумму инвариантных относительно ср подпространств: LP = Кет{<р - в)*1 +... + Кет(<р - rt)kt, (48) где dimKer(^ — т\)кг = кг. Определение 23. Инвариантные относительно преобразования (р подпространства Кет((р — r\)k% из разложения (48) называют корневыми подпространствами пространства Lp. Замечание б. Если в теореме 18 в качестве многочленов /г(х) выбрать примарные сомножители из канонического разложения многочлена х<р(х) на*Д полем Р, то получим аналог теоремы о разложении конечной абелевой группы в прямую сумму силовских подгрупп. 78
Следующая теорема является аналогом утверждения о единственности каждой такой подгруппы. Т е о р е м а 19. Если А е РП)П и Хл(х) = fiix)f2(x), где (h{x)-ih{x)) = е и degft(x) > О, г € 1,2, то матрица А подобна распавшейся матрице где хлг(х) = h(x), * Если матрица А подобна также распавшейся матрице где Хвг(х) = Мх), г G Т72, то Аг « В%. П Пусть Lp — произвольное пространство размерности п и а = = (ai,... ,ап) — его базис. Зададим преобразование у? G £(Др) условием Лй(^) = Л. Тогда х<р(ж) = Ха(х) = Л(ж)/2(х), и по теореме 18 Lp = Ker/i(^)+Ker/2((^), где для преобразований (рг = ср Kerft((f) справедливы равенства \ч>% (х) = Л0*0 и dimKer/t(^) = degfz(x). Пусть deg /i(x) = fc, (Pi,..., 0k) — базис подпространства Кег /i(у?) и (/?*+i,... . •. ,/5п) — базис подпространства Кег/2(у>). Тогда Д = (/Зь... ,Pk,Pk+u • • • ..., рп) — базис пространства Lp и по теореме 13 Поскольку ХАг(х) = Хсрг(х) = /г(х)> то А' — искомая матрица. Пусть А « В; = Diag(Si,52), где Хвг(ж) = Л (яг), г G 172. По утверждению 9 существует такой базис 7 = (7ъ • • •»7п) пространства Хр, что Б7 = Л^(^). Покажем, что 7ъ • • •»7* ~ базис подпространства Ker/i (<^). Действительно, так как J5i G ft,* и fi(B\) = OfcXfc, то из равенств: следует, что преобразование fi(<p) аннулирует векторы 711 • • • >7ь т- е. эти векторы принадлежат подпространству Kerfi(cp). Поскольку система векторов 7ь--ч7л линейно независима и dimKer/i(^) = А:, то 7ii • • • >7л "~ базис подпространства Kerfi((p). Но, в таком случае, из равенств: = Diag(Ab A2), A;f(ip) = Diag(Sb B2) 79
следует, что А\ и В\ — матрицы одного линейного преобразования cpi пространства Кет fi(ip) в разных его базисах ai,..., a& и 71» • • • > 7&- Поэтому А\ « Bi. Аналогично показьюается, что Аг ~ #2- □ Следствие. Levitt A € Pn,n tx каноническое разложение характеристического многочлена Ха(х) кад полем Р имеет вид: Ха(х) = gi(x)kl -...-gtix)1**, то матрица А подобна матрице A' = Diag(Ab...,A*) такой, что ХаЛх) = 9i(x)k\ гЕМ. (49) Условием (49) матрица Аг определена однозначно с точностью до подобия клеток. Возможность дальнейшего упрощения матрицы линейного преобразования основана на более глубокой теории, которая будет изложена в следующей главе. Задачи 1. Докажите, что все линейные преобразования пространства Lp являются скалярными тогда и только тогда, когда dim Lp < 1. 2. Укажите какой-либо базис пространства £(Lp)p, если dimLp = п. 3. Покажите, что если dimJDp = п и ср 6 £(Ьр), то при справедливости равенства dim Lp = dim^(Xp) + dimKery? не всегда имеет место равенство Lp = ip{Lp)+K.enp. 4. Пусть А, В € Рщп и В = С~1АС. Покажите, что множество всех таких матриц X € Рп,п? для которых Х~гАХ = В, есть {КС\К е Рп% К-'АК = А}. 5. Покажите, что если dimLp = п, то матрицы преобразования (р £ £{Lp) в любых базисах равны тогда и только тогда, когда ср — скалярное преобразование. 6. Сколько существует обратимых линейных преобразований пространства Lp, если dimLp = п и \Р\ = q? 80
7. Покажите, что все ненулевые векторы пространства Lp являются собственными векторами преобразования ср € £(Lp) тогда и только тогда, когда <р — скалярное преобразование. 8. Пусть dim Zc = ю- Покажите, что для любого преобразования (р £ £(1с) существует собственный вектор. 9. Покажите, что если dimL^ = 2fc + 1, то для любого преобразования (р € £(Lr) существует собственный вектор, а если diml^ = 2k, то существует преобразование ф € £(I>r) не имеющее собственных векторов. 10. Покажите, что если dim Lq = n > 1, то существует преобразование ip € £(Lq), не имеющее собственных векторов. 11. Покажите, что если dim Lp = n > 1 и \Р\ = q, то существует преобразование ср Е £(Lp), не имеющее собственных векторов. 12. Покажите, что если tp G £(£р), где dim Lp = n, и характеристический многочлен х<р{х) раскладывается над полем Р на линейные множители, то в любом ненулевом инвариантном относительно (р подпространстве есть собственный вектор преобразования (р. 13. Покажите, что матрицы А, А € Рп,п подобны, где — ( Вкхк Ckx(n~k) \ А' = 14. Покажите, что матрица А подобна диагональной матрице над соответствующим полем, если а) Л € М„,п, А2 = Е; б) A G С„,п, А* = Е, t € N; 15. Приведите пример матриц А, В Е Рп,п таких, что гпа(х) = тв(х) и Ха(^) = Хв(%), но матрицы не подобны. 16. Пусть ср G £(Lp), dimZrp = n, r € P и х^С^) == (^ — r)kg(x), где (д(х), x — r) = e. Если ai,..., as — линейно независимая система собственных векторов преобразования ср, принадлежащих собственному значению г, то s < к. (Указание: дополните систему ai,...,as до базиса a = (ai,... ,an) пространства Lp, выпишите матрицу А$(ф) и вычислите 81
Глава XVI ПОДОБИЕ МАТРИЦ НАД ПОЛЕМ В предыдущей главе, рассматривая матрицы одного и того же линейного преобразования конечномерного векторного пространства в разных базисах, мы обнаружили, что они подобны. Наоборот, две подобные матрицы над полем можно считать матрицами одного и того же линейного преобразования некоторого пространства, заданными в разных его базисах. В этой главе будет дан критерий подобия матриц над полем, не связанный с соответствующими им преобразованиями, и указан алгоритм решения вопроса о подобии матриц А, В € РПуп и отыскания решений уравнения В = Х~~гАХ в случае, если матрицы А и В подобны. Был также поставлен вопрос о том, какая из матриц, подобных данной матрице, имеет наиболее простой вид. В частности, были рассмотрены вопросы о подобии матрицы из РП}П диагональной, полураспавшейся или распавшейся матрице. Здесь будут введены нормальные и жордановы матрицы и показано, что всякая матрица из Рп,п подобна матрице, имеющей нормальную форму, а матрица, характеристический многочлен которой раскладывается над полем Р на линейные множители, подобна матрице, имеющей жорданову форму. § 1. Критерий подобия матриц над полем Для решения вопроса о подобии матриц А, В € Рщп над полем Р нам придется рассмотреть кольцо полиномиальных матриц Р[х]п,п. Так как Р[х] — комутативное кольцо с единицей, то к матрицам из Р[х]п,п применимы результаты § 5.VI об элементарных преобразованиях матриц. В лемме 3.XV показано, что существует изоморфизм колец т: Р[х]п,п —> Рп>п[#]. Фраза "разделим матрицу С(х) € Р[х)щп как многочлен с остатком слева на унитарный многочлен Ех — D, D € Рп,п" будет означать следующее. Разделим многочлен С(х) = т(С(х)) с остатком на многочлен т{Ех — D)= Ex - D: С(х) = (Ex - D)F(x) + Q(x) и, 82
воспользовавшись обратным изоморфизмом г х, получим равенство: C(x) = (Ex-D)F(x)+Q(x), (1) где F(x) = r""1(F(^)), Q(#) = r"1(Q(x)). Равенство (1) и есть результат деления С(х) с остатком слева на Ex — D. Аналогично под "степенью многочлена С(х) е Р[х]п%п" понимаем степень многочлена С(х) = т(С(х)). Теорема1. Матрицы А, В £ Рп,п подобны над полем Р тогда и только тогда, когда в кольце Р[х]щп эквивалентны их характеристические матрицы. □ Если Т~гАТ = В для некоторой матрицы Т е РщП^ то в кольце Р[х]щп справедливы равенства: Т~\Ех - А)Т = Т~ххТ - Т~ХАТ = Т~гТх -В = Ех-В. Так как Т, Г"1 € Р*п, то по следствию 3 теоремы 3.VII Ех — В ~ ~Ех-А. Обратно, пусть Ех — В ~ Ех — А. По утверждению 6.VI при некоторых матрицах L(x), R(x) € -P[#]njn выполнено равенство L(x)(Ex - A)R(x) = Ex-B, которое перепишем в виде Цх)(Ех -А) = (Ех - ВЩх)-1. (2) Разделим матрицы L(x) и R(x)~x как многочлены с остатком на унитарные многочлены Ех — В и Ех — А соответственно слева и справа: L(x) = (Ex - B)U(x) + L(x), (3) R(x)~1 = V(x)(Ex -A) + R(x). (4) Поскольку deg(i£E — B) = deg(i<Sf — A) = 1, то degL(x), deg i?(x) < 1 и L(x) = X, i?(rr) = R — матрицы над полем Р. Подставив правые части равенств (3) и (4) в равенство (2), получим равенство (Ex-B)U(x)(Ex-A)+L(Ex-A) = (Ex-B)V(x)(Ex-A) + (Ex- 83
которое после очевидных преобразований запишем в виде (Ех - B)(U(x) - V(x))(Ex -А) = (Ех - B)R - Т(Ех - А). (5) Если U(x) — V(x) -ф Опхпз то в силу унитарности многочленов Ех — В и Ех — А многочлен из левой части равенства (5) имеет степень не ниже второй, а многочлен из правой части — степень не выше первой, что невозможно. Значит, U(x) — V(x) = Опхп и получаем L(Ex -A) = (Ex - B)R. (6) Тогда по определению равенства многочленов: L = Я, LA = BR. (7) Остается доказать, что R Е РщП> ибо тогда из (7) следует В = RAR , т. е. В та А. Разделим с остатком матрицу R(х) как многочлен на Ех — В справа: R(x) = W(x)(Ex-B) + S, SePn,n. (8) Перемножая левые и правые части равенств (4) и (8), приходим к равенствам Е = R(x)R(x)-1 = R(x)V(x)(Ex - А) + R(x)R = = R(x)V(x){Ex -A) + W(x)(Ex - B)R + SR. Отсюда и из (6) получаем Е = [R(x)V(x) + W(x)L)(Ex - А) + SR. В правой части последнего равенства должен стоять многочлен нулевой степени. Ввиду унитарности многочлена Ех — А: R{x)V(x) + W(x)L = Onxn, E = SR и S = Д"1. □ Доказательство теоремы 1 дает способ отыскания одного решения уравнения Х~гАХ = В, если существует и известна матрица R(x). Действительно, в этом случае решением будет, например, матрица 5, являющаяся остатком от деления матрицы R(x) как многочлена справа на Ех — В (формула (8)). При этом деление с остатком производить 84
не нужно, так как по теореме Безу для R(х) = RmXm + ... + R\x + До, где Ri € Рп,п, i € 0, га, получаем 5 = R(B) = ДтБт + ... + iJiB + До. (9) Задача отыскания матрицы S сводится, таким образом, к следующему: выяснить, эквивалентны ли матрицы Ех — Аи Ех — В и, если да, указать последовательность элементарных преобразований, переводящих одну в другую. Решение последней задачи для произвольных матриц из Р[х]т^п рассматривается в следующем параграфе. Следствие. Матрицы Вкхк О \ А, _ ( C(n__fc)x(n_fc) О О C(n_fe)x(n_fc) ) U Л ~ { О Вкхк принадлежащие кольцу Рп,п, подобны над полем Р. □ Ясно, что матрицы А и Af эквивалентны. Тогда эквивалентны матрицы: А/ ч / xEkxk-B О \ А(х) = I , у О xE(n-k)x(n-k) -С ) Поскольку А(х) = хЕпхп — А и А'(х) = хЕпхп — Аг, то по теореме матрицы Аи А' подобны. D Другое доказательство следствия может быть проведено с использованием результатов гл. XV (см. задачу 13.XV). Заметим, что условие подобия двух матриц над полем является более сильным, чем условие их эквивалентности. Подобные матрицы эквивалентны, так как обратимая матрица над полем является произведением элементарных матриц. В то же время любая невырожденная матрица эквивалентна единичной матрице, а единичная матрица подобна только самой себе. 85
§ 2. Каноническая форма полиномиальной матрицы Задача об эквивалентности матриц из множества -P[#]m,n решается путем выделения в каждом классе эквивалентных матриц некоторой однозначно определенной (канонической) матрицы подобно тому, как это сделано в § 6.VI для матриц над кольцом Z и в § 2.VII для матриц над полем. Определение 1. Матрицу К(х) Е Р[х]т^п называют канонической^ если: а) К(х) = diag(/i(:z),... ,/*(#))mxn, где t = min{m,n} и fi-i(x)\fi(x) при г € 2, t] б) каждый ненулевой из многочленов fi(x) — унитарный. Из определения 1 следует, что если /* (х) = О при некотором г € 17*, то fj(x) = 0 при j e г, t. Пример 1. Нулевая матрица и всякая матрица вида: / Ekxk О \ \о о) тхп являются каноническими, что согласуется с определением канонической матрицы над полем. Покажем, что всякая матрица из P[x]mjn эквивалентна некоторой канонической матрице (сравните с теоремой 9.VI). Л е м м а 1. Если А(х) = (%(#)) £ P[x]m,n, ац(х) ф 0 и существует элемент акз{х), не делящийся на ац(х), то матрица А(х) эквивалентна матрице В(х), у которой Ьц(х) ф 0 и degbu(x) < degац(х). П Пусть к = 1, и при делении с остатком получаем а\3{х) = = CLn{x)q{x) + г (ж), где 0 < deg г (х) < degan(x). Прибавляя к 5-му столбцу матрицы А(х) 1-й столбец, умноженный на — q(x), получим матрицу А'(х), у которой а'1з(х) = г(х). Для получения нужной матрицы В(х) достаточно переставить 1-й и s-й столбцы матрицы Аг{х). Если к ф 1, но s = 1, то проделаем аналогичные элементарные преобразования со строками матрицы А(х). Пусть теперь все элементы первой строки и первого столбца матрицы А(х) делятся на ац(х). Тогда ак\{х) = an(x)qki(x), к € 2,т. Прибавим к к-й строке матрицы А(х) 1-ю строку, умноженную на — < 86
а затем к-ю строку полученной матрицы прибавим к ее 1-й строке. Получим матрицу А'{х) — (a'tJ(x)), у которой а!1Х{х) = ац(х) и элемент аи(х) = aks(x) + (e — Qki(x))o>is(x) не делится на а'п(х), е — единица поля Р. Следовательно, рассматриваемый случай сведен к случаю, когда к = 1.П Теорема 2. Любая матрица А(х) € P[x]mi7l эквивалентна некоторой канонической матрице. □ Если А(х) = Отхп, то А(х) — каноническая матрица. Для матрицы А(х) ф Отхп доказательство проведем индукцией по числу т + п. Если т + п = 2, то А(х) = ац(х) и А(х) ~ В(х) = ап(х), где ап(х) ~~ ассоциированный с ац(х) унитарный многочлен. Значит, В{х) — нужная каноническая матрица. Пусть / € N и утверждение теоремы верно для любой матрицы с условием т+п < /. Покажем, что тогда оно верно и для любой матрицы с условием т + п = /. Итак, А(х) Е P[#]m,n, m + n = /, А(х) ф ОтХп- Ясно, что матрица А(х) эквивалентна матрице В(х) = (Ьгз(х)), у которой Ьц(гг) ф 0. Если Ьц(х) J(bks(x) для некоторых к и 5, то по лемме 1 матрица В(х) эквивалентна матрице С^\х) — (с[3\х)), у которой c[i (х) ^0и degc[i(x) < <degbn(x). Если для некоторых к и s cji (x) J(c£J(а;), то аналогично получаем матрицу С&(х) = (42)(х)), у которой с^(х) ф 0 и dege^Or) < ff и т. д. Получаем последовательность эквивалентных матриц А(х) ^^ - ... ~ C(w)(^) таких, что deg Ьц (х) > deg cff (ж) > ... > deg ^ (ж) > 0. (10) Последовательность матриц не может быть бесконечной ввиду неравенств (10), так как убывающая последовательность целых чисел, ограниченная снизу, является конечной. Стало быть, существует такая матрица С^(х) = (с\« (ж)), эквивалентная матрице А(х), у которой с^' (х) ^0и с[г(x)\ci:f (х) при всех г 87
и j. Тогда очевидно, что / с{£\х) О ... О \ 0 Dx =C{X)* (П) О / При этом по теореме 8.VI все элементы dtJ(x) матрицы D(x) делятся на c[i (x). По предположению индукции матрица D(x) эквивалентна некоторой канонической матрице (га — 1 + п — 1</): F(x) = diag(/2(a:),...,/t(rc))(m_i)X(n_i), t = min{ra,n}. При этом вновь по теореме 8.VI c[i (х)\/г(х), i G 2,t. Произведя со строками и столбцами матрицы С(х) те элементарные преобразования, которые приводят матрицу D(x) к виду F(x), получим каноническую матрицу: К(х) = diag(cif (#), f2(x),..., ft(x)) ТПХПч эквивалентную матрице А(х). П Замечание1. Доказательства леммы 1 и теоремы 2 позволяют указать последовательность тех элементарных преобразований, посредством которых матрица К(х) получается из матрицы А(х). Действительно, ввиду доказательства леммы 1 известна последовательность элементарных преобразований, переводящих матрицу А(х) в матрицу С(х) из соотношения (11). Если D(x) = O(m_1)x(n_i), то К(х) = diag(cf2r (х), 0,..., 0). Если же D(x) ф O(m_i)X(n_i), то к ней применяем такой же процесс, который применялся к матрице А(х). Поэтому известной последовательностью элементарных преобразований приведем матрицу А(х) к виду: где Cii (a?)|rfii (х). Если G(x) ф O(m_2)X(n-2)> TO продолжаем дальше аналогично. Ясно, что для более быстрого получения матрицы К(х) 88
на самом первом шаге следует выбирать матрицу В(х) так, чтобы степень многочлена Ьц(х) была наименьшей среди степеней всех ненулевых многочленов агз(х). П р и м е р 2. ж-2-1 0 \ /1 х-2 О А(х) = ( 0 х-2 -1 ~ 2 - ж 0 -1 О 0 х-2 / V 0 0 х-2 10 О О (х-2)2 -1 О 0 х-2 1 О О О 1 (х-2)2 О 0 (х-2)3 1 0 0 1 0 0 1 0 0 х-2 (х - 2)2 2 0 1 0 0 0 1 {х — х 0 0 X 0 0 (х - 2)3 0 -1 -2 2)2 \ = ) = К(х). Теперь покажем, что каждая матрица А(х) € Р[х]ш^п эквивалентна единственной канонической матрице (сравните с теоремами 10.VI и 3.VII). Определение 2. Пусть А(х) £ Р[х]т^п, t = min{m,n} и k E G 1, t. Инвариантным делителем k-го порядка матрицы А(х) называют унитарный наибольший общий делитель всех ее ненулевых миноров А;-го порядка, если такие существуют, и нуль, если все миноры А:-го порядка матрицы А(х) равны нулю (обозначение: d^A)xJx)). По следствию 1 теоремы Лапласа (§ 3.VI) каждый минор k-ro порядка матрицы А(х) есть линейная комбинация ее миноров к — 1-го порядка. Поэтому справедливо соотношение: аА(х) \{х) Утверждение 1. Если А(х), В(х) G Р[х]ш,п, А(х) ~ В(х) ut = = min{m,n}, то при к € 1,£ справедливо равенство crJjx) = dJj) 89
□ В силу теоремы 8. VI всякий общий делитель миноров к-го порядка матрицы А(х) является общим делителем миноров к-го порядка матрицы В(х) и наоборот. Отсюда следует доказываемое утверждение. □ Теорема 3. Для любой матрицы А(х) е Р[х]ШуП существует единственная эквивалентная ей каноническая матрица. □ Пусть матрица А(х) эквивалентна канонической матрице К(х) = = diag(5i(a;),... ,5е(з:)), t = min{m,n}. Ввиду определения 1 и утверждения 1 при £ £ l,t справедливы равенства: <%)(*)=4\х)(*)=ад ■••■■ ад. Следовательно, 6i(x) = d%x)(x), 6e(x)-d^(x)=d<$x)(x), е€Ы, (12) т. е. диагональные элементы канонической матрицы, эквивалентной матрице А(х), определены однозначно через инвариантные делители матрицы А(х). □ ОпределениеЗ. Каноническую матрицу К{х) = diag(5i(x), ...,6t(x))mxn, t = min{m,n}, эквивалентную матрице А(х) € Р[х]т^п, называют канонической формой матрицы А(х) и обозначают К{А{х)). При этом многочлен Si(x) называют %-м инвариантным множителем матрицы А(х) и обознача- ют: Ш = 6%х)(х). Теперь мы можем получить критерий эквивалентности полиномиальных матриц (сравните со следствием 3 теоремы 10.VI и теоремой 4.VII). Теорема 4. Если А(х), В(х) е Р[х]ш,п, то равносильны утверждения: а) А(х) - В(х)- б)К(А(х)) = 1 I г) <*А(Х)(Х) = ^${х){х), leXi,t = min{m,n}. П Импликации а) => г) => в) => б) => а) последовательно доказываются применением: утверждения 1, формул (12), определения 3, теоремы 2 и свойства транзитивности отношения эквивалентности. □ 90
Ввиду теорем 1 и 4 получаем критерии подобия матриц над полем. Следствие. Матрицы А, В е Рщп подобны над полем Р тогда и только тогда, когда для матриц А(х) = Ех — Аи В(х) = Ех — В выполнено любое из условий а)—г) теоремы 4. Пользуясь замечанием 1 и следствием теоремы 4, опишем алгоритм решения задачи о подобии матриц А, В е Рщп и нахождении решения уравнения подобия Х^"1АХ = В. 1. Каждую из характеристических матриц Ех—А и Ех—В приводим элементарными преобразованиями к каноническому виду: Lx(x)(Ex - A)Rx{x) = Кх{х), L2(x)(Ex - B)R2{x) = К2{х). (13) 2. Если канонические матрицы К\(х) и К2(х) не равны, то матрицы Л и -В не подобны над полем Р. 3. Если К\(х) = К2(х), то А « В. Из равенств (13) получаем L2(x)"1L1(x)(Ex - A)R1(x)R2(x)-1 =Ex-B. Решение уравнения подобия ищем по формуле (9), где R(x) = R1(x)R2(x)-1. В качестве важных примеров вычислим канонические формы для некоторых матриц. Утверждение 2. Если А(х) = diag(/i(^),..., ft(x))mxn, t = = min{m, n}, fi(x) — унитарный многочлен, г G 1, t, и (fi(x), fj(x)) = e при i ф j, mo K(A(x)) = diag(e,..., e, /г(х)... Л (яг)). □ Ясно, что d^lJx) = fi(x)... ft(x). Так как многочлены fi(x) — попарно взаимно простые, то по утверждению 9.IX многочлены gi(x) = = Yl fj(x) — взаимно просты в совокупности. Поэтому <rSxMx) = Зфг = (gi(x),...,gt(x)) = е. Тогда <&^{х) = ... = d^x){x) = e и по формулам (12): Утверждение 3. ^слг/ /(ж) € Р[х] — унитарный многочлен и degf(x) =k, то К(Ех - S(f(x))) = diag(e,..., е, f(x))kxk. 91
□ Пусть f(x) = хк - Ck-ixk г - ... - с\х - со. Тогда А(х) =Ех- S{f(x)) = f x 0 ... О -со —еж... О — ci \ 0 0 ... —е х — ск-\ Так как Мл(я.) ( х " * fc _ 1 ) = (-1)|5-1е, то ^^(яг) = е. Поэтому dAfr?(x) = ••• = ^(ж)^) = е* Нетрудно проверить, что d^x)(x) = = \Ех - S(f(x))\ = xs(f(x))(x) = f(x). По формулам (12) К(А(х)) = diag(e,..., е, f(x))kxk. □ § 3. Нормальные формы матриц над полем Теперь укажем некоторые матрицы, которым подобна всякая матрица из РП1П. Определение 4. Матрицу над полем Р вида: N = Б1аё(ЗД(*)), • • •, S(ft(x)))nxn, (14) где fi(x) — унитарный многочлен и deg/г(х) > 0, г G 1,*, называют матрицей в нормальной форме. Утверждение 4. Матрица А Е Рщп подобна матрице N вида (14) тогда и только тогда, когда Ех-А~ diag(e,..., е, Д(а;),..., /t(a?))nxn- П По теореме 1 А « JV тогда и только тогда, когда ^гг — Л ~ £*а: — N. По утверждению 3 при hi = deg fi(x) имеем -N = Diag(EklXklx - 5(/i(x)),..., EktXktx - S(ft(x)))nXn - Diag(diag(e,..., e, fi(x)),..., diag(e,..., e, /t(rr 92
D(x) ~ diag(e,..., e, /г(х),..., ft{x)). Теперь утверждение следует из транзитивности отношения эквивалентности матриц. □ Определение 5. Матрицу N вида (14) называют матрицей в 1-й нормальной форме, если /t(#)|/t+i(#) Для i € li* — 1. Замечание2. Из доказательства утверждения 4 следует, что если в (14) матрица N является матрицей в 1-й нормальной форме, то К(Ех - N) = diag(e,..., е, Л (яг),..., /*(*))- Теоремаб. Каждая матрица A G Рщп подобна единственной матрице N в 1-й нормальной форме. □ Пусть Л - К(Ех ~А)= diag(e,..., е, /i(x),..., ft(t)), где /г(#) — унитарный многочлен, degft(x) > 0, г е ТД и /t(a?)|/t+i(ar), г Е l,t — 1. По утверждению 4 матрица А подобна матрице (14) в 1-й нормальной форме. Пусть N, N* — матрицы в 1-й нормальной форме, А « N и А « Л^;, где матрица iV имеет вид (14), а Тогда по утверждению 4 Ех - А ~ diag(e,..., e,pi(ar),.. .,де(х)) = F(x). Поскольку матрица F(a:) — каноническая, то по теореме 3 F(x) = К(Ех— -A), £ = tn дг(х) = /г(х) при г е T^i. D Определение 6. Матрицу JVi в 1-й нормальной форме, подобную матрице А, называют первой нормальной формой матрицы А и обозначают через Ni(A). Теперь мы можем показать, что если Lp — конечномерное пространство и <р е £(Lp), то пространство Lp либо является циклическим относительно преобразования <£, либо раскладывается в прямую сумму циклических относительно (р подпространств. Теоремаб. Если dimLp = п и <р е £(Др), то существуют такие векторы /?i,..., /?t ^ ^р? * ^ 1 93
□ Пусть а — базис пространства Lp и А = А^{ф). По теореме 5А« « Ni{A) = Т~гАТ, где Т G Р*эП. Тогда 7 = йГ — также базис пространства Lp И Arfv) = М(А) = Diag(5(/i(ar))1...15(/t(ar)))nxn, (15) где deg/j(a:) = ^ > 0, г G l,t. Из равенства (15) по теореме 13.XV следует, что пространство Lp раскладывается в прямую сумму подпространств, инвариантных относительно ^, где dim Lip = deg/«(a:) = ki, г G lTt. Поэтому базис 7 можно записать в виде: а - r^v(1) ^v(1) ^v(2) ^v(2) -v(t) ^v(th 7—I7i i---»7fc1 »7i i---»7fca »---»7i >--->7jfet;> По той же теореме 13.XV где (fi = ср . Тогда по утверждению 23.XV L%p = 2^(7} )- Остается Lip положить Pi = 7} , i G 1,£. D В § 5.XV был указан способ вычисления минимального многочлена линейного преобразования через минимальные многочлены базисных векторов пространства относительно этого преобразования. Другой способ дает Утверждениеб (Фробениус 8). Если A G Рп,п, то П По теореме 5 А « Ni(A), где матрица Ni(A) имеет вид (14) и fi(x)\fi+i(x) ПРИ i G l,i — 1. Так как минимальные многочлены подобных матриц равны, то тпа(х) = га^д)^). По утверждению 16.XV 8 Ф. Г. Фробениус — немецкий математик (1848—1917). 94
Отсюда в силу равенств Xs(fi(x))(x) = fi(x) и утверждения 23.XV получаем mNl(A)(x) = Lfi(s), • - -,ft(x)]. Поскольку fi(x)\fi+i(x), г G l,t- 1, то mA(x) = m^^fr) = Л 0*0- (16) С другой стороны, ввиду замечания 2: ЛГ(Я* - N^A)) = diag(e,..., е, Дф,..., ft(x)). По определению 3 По следствию теоремы 4 К{Ех — N\(A)) = К(Ех — А). Значит, Из равенств (16) и (17) получаем требуемое равенство nu(z) = f£_A(x). D Определение?. Матрицу над полем Р вида ЛГ2 = Dmg(S(9l(x)kl),..., S(9r(x)^))nxn, (18) где Qi(x) — унитарный неприводимый над полем Р многочлен, г G Т7г, называют матрицей во 2-й нормальной форме. Теорема 7. Каждая матрица A G РП)П подобна некоторой матрице N2 во 2-й нормальной форме. □ Пусть каноническое разложение многочлена Ха(х) над полем Р имеет вид: По следствию теоремы 19.XV матрица А подобна матрице i4/ = Diag(i4i,...,4t), где ХАг{х) = fi(x)ki, г G l,t. По теореме 5 Ai « iVi(Ai) и, стало быть, 95
Поскольку характеристические многочлены подобных матриц равны, то Хъ(Аг)(х) = Хлг(х) = Мх)к% г G М- Матрица Ni(At) имеет вид: (x) > 0 и д где deggj(x) > 0 и д^{х) — унитарный многочлен, j G 1,гг. Так как неприводимый над полем Р многочлен, то где kti + ... + кгГг = кг. Таким образом, Ni(At) — матрица во 2-й нормальной форме, г G G 1, £, и, следовательно, Diag(AT1(JAi),..., iVi(Ae)) — матрица во 2-й нормальной форме, подобная матрице А, □ Теорема 7 позволяет уточнить теорему 6. Теорема 8. Если dim Lp = п и ip e £(Lp), то существуют такие векторы /?!,...,/% G Lp, t > 1, w Xv?*^) = 9г(х)кг f где <Р% = V т<р(п\ и9г(х) ~ неприводимый над полем Р многочлен, г G l,t. П Доказательство этой теоремы аналогично доказательству теоремы 6. Нужно только вместо матрицы Ni(A) взять любую матрицу во 2-й нормальной форме, подобную матрице А. □ В § 6.XV было показано, что матрица A G Рп>п неприводима над полем Р, т. е. не подобна над Р никакой полураспавшейся матрице, тогда и только тогда, когда Ха(х) ~ неприводимый над полем Р многочлен. Ясно, что при этом ха(х) = тпл(х). Рассмотрим вопрос о подобии матрицы А распавшейся матрице. Определеннее. Матрицу A G Рп,п называют неразложимой над полем Р, если она не подобна над Р никакой распавшейся матрице. Теорема 9. Матрица A G Рп,п неразложима над полем Р тогда и только тогда, когда ХА(х) = тА(х)=9(х)к, (19) где д(х) — неприводглмый над полем Р многочлен. 96
матрица во 2-й нормальной форме. Ввиду неразложимости матрицы А получаем N2 = S(g(x)k), где д(х) — неприводимый над полем Р многочлен. По утверждению 23.XV xn2(x) = гпдг2(х) = д(х)к. Так как у подобных матриц совпадают соответственно характеристические и минимальные многочлены, то справедливо равенство (19). Обратно, пусть выполнено равенство (19). Предположим, что матрица А разложима: А « Diag(Ab A2) = А', где А\ е Ркхку 1 < к < п. Тогда по утверждению 16.XV тА(х) = тА*{х) = [mAl(x), mA2(x)], (20) и по утверждению 11.XV Ха(х) =Ха1{х)ха2(х), (21) где degx.4,(^) > 1- Отсюда и из (19) следует, что д(х)\хАг(х), г Е 1, 2. По теореме 15.XV каждый неприводимый делитель многочлена ха7(х) делит тАг(х) и, значит, д(х)\тАг(х). Поэтому из равенства: [mAl(x),mA2(x)] = (mAl(x),mA2(x)) и равенств (20) и (21) получаем degтА{х) < deg(mAl (х) • тА2{х)) = degmAl (x)+ + deg гпа2 (х) < deg хах (х) 4- deg ха2 (х) = deg хл (ж) вопреки условию (19). Полученное противоречие показывает, что матрица А — неразложима. □ Рассмотрим теперь вопрос о том, однозначно ли определена матрица во 2-й нормальной форме, подобная матрице А е Рп,п- Т е о р е м а 10. Матрица Л^ во 2-й нормальной форме, подобная матрице А е Pn,n, определена однозначно с точностью до перестановки клеток. □ Пусть каноническое разложение многочлена Ха{х) над полем Р имеет вид: 97
Если Л^2, N'2 — матрицы во 2-й нормальной форме, подобные матрице А, то Ха(х) — Xn2(x) — Хщ(х)- Так как характеристический многочлен распавшейся матрицы равен произведению характеристических многочленов ее клеток и для любого унитарного многочлена f{x) G Р[х] верно равенство Xs(f(x))(z) = /(х), то в матрицах N2 и Щ должны быть клетки вида S(g(x)a), где о G 1, fe. Выпишем, такие клетки: S(g(x)a*),...,S(g(x)a-), входящие в матрицу N2, считая, что ai < п2 < ... < а*, и все такие клетки входящие в матрицу Щ, считая, что Ъ\ < Ь2 < ... < bj. Ясно, что а\ + ... + пг = Ъ\ + ... + bj = к. По следствию теоремы 1 матрица 7V2 (^ тогда и матрица А) подобна матрице (x)a'), А2) = DiagUb а матрица iV^ (а тогда и матрица Л) подобна матрице D'mg(S(g(x)b*),..., 5(р(х)6'), В2) - Diag(Bb где А, = ХаЛя) = ХвЛх) =д(х)к, х) = хв2(х) - gi(x)kl.. .ft(j)^ - f(x). Значит, При этом Так как (p(x)fc, f{x)) = е, то по теореме 19.XV Ai % Ble Поскольку Ai, 5i — матрицы в 1-й нормальной форме, то в силу теоремы Ь А\ = В\. Поэтому i = j и а8 = bs при s e T7i. Аналогично рассуждаем, рассматривая клетки S(gj(x)k3), j G 1, s. 98
Таким образом, набор клеток любой матрицы во 2-й нормальной форме, подобной матрице Л, определен однозначно. □ Определение 9. Матрицу во 2-й нормальной форме, подобную данной матрице А € Рп,п, называют 2-й нормальной формой матрицы А и обозначают через N2(A). В качестве примера вычислим 2-ю нормальную форму сопровождающей матрицы. Утверждение 6. Если каноническое разложение унитарного многочлена f(x) G Р[х) имеет вглд f(x) = gi(x)kl .. .g8(x)k", *)) N2(S(f(x))) = Diag(Sfoi (*)*•),..., S{gb{x П Ввиду теоремы 10 достаточно доказать, что матрица во 2-й нормальной форме N2 = Dmg(S(gi(x)k>),..., S(ga(x)k-)) подобна матрице S(f(x)). По теореме 1 для этого достаточно показать эквивалентность матриц Ex — N% и Ex — S(f(x)). Матрица Ex - N2 = Diag(£x - 5(Л (x)fcl),..., Ex - S(gs (x)k^)) по утверждению З эквивалентна матрице diag(e,.. .9e,gi(x)kl,.. .,g*(x)k9)* которая в силу утверждения 2 эквивалентна канонической матрице diag(e е,/(т)). Значит, К(Ех - N2) = diag(e,..., е, /(*)). (22) Одновременно по утверждению 3 К(Ех - 5(/(х))) = diag(e...., е, /(х)). (23) По теореме 4 из равенств (22) и (23) получаем - S(f(x)). □ 99
4. Жордановы матрицы Теперь мы рассмотрим важный класс матриц над полем, у которых характеристические многочлены раскладываются над этим полем на линейные множители. Определение 10. Пусть Р — поле и г е Р. Жордановоп 9 клеткой порядка к с корнем г называют матрицу kxk Утверждение?. Каноническая форма характеристической матрицы для эюордановой клетки ^Sk(r) имеет вид: ,...,e, (x-r)k)kxk. (24) В частности, Хз*(г)И = тък{г)(х) = (х- г)к. (25) □ Нетрудно вычислить инвариантные делители матрицы Т{х) — = Ех- Отсюда и из формул (12) получаем равенство (24). Из (24) и утверждения 5 следуют равенства (25). □ Следствие. 9?* (г) « S((x — г)к). П По утверждению 3 К(Ех - S((x - r)k)) = diag(e,..., е, (х - r)k)kxk. Ввиду равенства (24) по следствию теоремы 4 матрицы S((x - r)k) и 9() подобны. □ Вычислим степень жордановой клетки. Утверждение 8. Если m E N, 9 К. Жордан — французский математик (1838—1922). 100
С I m-\ m' 0 С 2 m—2 m' Cl m—\ m' 1 rm~l m' (26) П Ввиду равенства 3%(r) = тЕ + 3^(0) и перестановочности матриц г£" и 0>(0) для вычисления матрицы ^^(г)771 можно применить формулу разложения бинома: = rmE + С^гп-1^к(0) + ... + <sk(0)m. (27) Непосредственные вычисления показывают, что верны равенства: /00 е ••• 0 \ 2 _ е 0 •о ) (28) о О 0...0 е \ О 0...0 О О 0...0 0 / Из равенств (27) и (28) следует равенство (26). □ Определение 11. Матрицу G € РП)П называют матрицей в жордановой форме, или жордановой матрицей, если (29) где к\ + ... + ks = п и гь ..., rs — не обязательно различные элементы из Р. ТеоремаН. Матрица А Е Рп,п подобна матрице 0е в жордановой форме тогда и только тогда, когда ее характеристический 101
многочлен ха(%) раскладывается над полем Р на линейные множители. При выполнении последнего условия матрица Э, подобная матрице А, определена однозначно с точностью до перестановки клеток. □ Если А ^ О, где матрица Э имеет вид (29), то Ха{х) = (см. утверждение 7). Обратно, пусть каноническое разложение многочлена Ха(%) над полем Р имеет вид: ХА(х) = (х-Г1)**...(х-ги)г". (30) По теореме 7 матрица А подобна некоторой матрице во 2-й нормальной форме: N2{A) = Diag(S(5l(*)4 • ■ •, S(gm(x)e™))nxn, где g%{x) — унитарный неприводимый над полем Р многочлен, г G 1, га. Так как Ха(х) = Xn2(a){x) = 9i(x)£l . ..gm{x)tm, то ввиду равенства (30) N2(A) = Diag(5((x - n)fc»),..., S((x - r2)fc21),..., S((x - ruf^ )). По следствию утверждения 7 S((x — rt)kiJ) & Qkii (гг), а тогда матрица N2(A) подобна матрице в жордановой форме: 9 - Diag(3fcll (n),..., 3fc21 (r2),..., 3fcebH (ru)). Этой же матрице подобна и матрица А в силу транзитивности отношения подобия матриц. Любая другая матрица ^ в жордановой форме может отличаться от матрицы Э только перестановкой клеток в силу теоремы 10. D Определение 12. Жорданову матрицу Э, подобную данной матрице А Е Рп,п, называют жордановой формой матрицы А и обозначают через Э(А). Опишем алгоритм отыскания жордановой формы матрицы А е Рп,т если известно каноническое разложение (30) ее характеристического многочлена над полем Р. 102
= (El,... jE^) и определим преобразование кр G £(Р^), положив = А. По следствию теоремы 18.XV где Базисом подпространства Кег(у> — гг)<г является фундаментальная система решений 7? — (Сг\,..., С^?) системы линейных уравнений: В базисе 7 = (7ъ • • • ?7и) пространства р(п) матрица Ау(у?) имеет вид = Diag(Ab .. - Ж) = С"1 2. Элементарными преобразованиями приводим каждую из матриц Ex — Ai к каноническому виду: К(Ех - Аг) = diag(e,... ,е, (ж - п)^1,..., (х - п)***, )ихи, где кц + ... + ^гбг = *г и кц < ki2 < ... < къь,, г G 1, гл. По утверждению 3 = diag(e,..., е, (аг - гч)*'1 ,...,(х- Гг)к«>'). По следствию теоремы 4 Поэтому Diag(5((x - По следствию утверждения 7 и транзитивности отношения подобия матриц А « 9(i4) = Diag(Qfcll (n),..., 9fcllbii (rtt)). Замечание 3. Параметры fcy, r» матрицы Э(Л) можно найти и из канонической матрицы К(Ех -А) = diag(*gJ_A(яг),. - •, 4"2-дИ 103
Для этого нужно выписать каноническое разложение над полем Р каждого из инвариантных множителей S^x_A(x): $ех-а(х) = (х~ri)klbl • • • ...(х- ги)к»ь« , $£~1\{х) = {х - n)klbi~l ... {х - ги)*«ь« -х и т. д. до первого неединичного инвариантного множителя. Эти разложения дают параметры матрицы 5s(A) ввиду равенства К(Ех — А) — К(Ех — ^s(A)). Однако удобнее иметь дело с матрицами меньшего размера, что и сделано в пунктах 1 и 2. В ряде задач бывает нужно найти не только жорданову форму матрицы А, но и решение уравнения подобия Х~~1АХ = $s(A). 3, Пользуясь алгоритмом из § 2, решаем все уравнения подобия XrlAiXi - Si. Если D~lAiDi = Si и D = Diag(£>b • • •, Du\ то D-XA^)D - Diag(5n,..., Subv) - Agfa), (31) где S — jD. 4. Теперь можно найти такую матрицу F, что где 0 = (5F. Действительно, ввиду равенств (31) пространство р(п) распалось в прямую сумму циклических относительно преобразования if подпространств: Для нахождения матрицы F нужно найти решения уравнений вида X~1S((x — r)k)X = 9?fc(r). Пусть fl = (<5j, ^(5j)» •••)"" базис одного из подпространств L^{5j) и msJiip(x) — (х — r)k. Система векторов: А = ((</> - F)*-1^), (V - r)k-2(Sj), ■ ■ ■, (V» - F)№), *j) линейно независима, так как в противном случае нашелся бы многочлен степени меньше к, аннулирующий вектор Sj. Стало быть, Л — базис подпространства L(p(5J). При этом из равенств (у? — г)(А$) = Лг-i, г Е G 2, А:, (</? - r)(Ai) = & следуют равенства ip(\i) = АгГ + A»_i, которые означают, что Affi) = %k{r), где ^ = (^ Ь (Oj) Жорданову форму матрицы А можно использовать для нахождения корней характеристического многочлена степени матрицы А. 104
t Утверждение 9. Если А е Рп,п и Хл (х) = П (х — ri)kl — кано- ническое разложение многочлена Хл(х) пад полем Р, то при I G N многочлен хл1 (х) имеет вид: XA*(x) = (x-re1)k>...(x-4)k\ (32) □ По теореме 11 существует такая матрица С Е Рп,п> что С1 АС = = ЩА). Тогда С~1АеС = ЩА)£. Из равенств Хл(х) = П (* - п)^7 = ) и Хл^(^) = Х&(А)*(Х) и того факта, что диагональные элементы матрицы 9?(Л) — это корни многочлена хд(^)> ввиду равенства (26) получаем требуемое равенство (32). П Некоторые приложения жордановых матриц будут указаны также в следующем параграфе. § 5- Стохастические матрицы Рассмотрим класс матриц, имеющих широкое применение в теории вероятностей. Определение 13. Матрицу А = (aZJ)nXm над полем Ж действительных чисел называют неотрицательной (положительной), если все ее элементы неотрицательны (положительны). Пишут: А > О (А > 0). Определение 14. Неотрицательную матрицу S = (sij)nxn назы- п вают стохастической (дважды стохастической), если ]Г] Sij — 1 для г G 1,п (если стохастическими являются матрицы 5 и 5Т). П р и м е р 3. Епхп — дважды стохастическая матрица. Утверждением. Множество стохастических (дважды стохастических) матриц из Rn?n является полугруппой относительно операции умножения матриц. Доказательство осуществляется непосредственной проверкой. Определение 15. Если А е Рп,п, где Р — поле, dl e P(n) \ {О1}, г е Р и Лс^ = d^r, то говорят, что d^ — собственный вектор матрицы Л, принадлежащий собственному значению г. УтверждениеП. Если S — стохастическая матрица из Жп,п, то: 105
а) если xs(r) = 0, где г g С, то \ г |< 1; б) вектор е^ = (1,..., 1) является собственным вектором матрицы S, принадлежащим собственному значению 1. □ а) Если xs(r) — О, то для некоторого ненулевого вектора d^ e С^ имеет место равенство Sd^ = dW. Расписывая это равенство покоординатно, получим г El,n. Пусть dt ~— наибольшая по модулю координата вектора dl. Тогда \dt\ Ф 0, и можем записать соотношения: \г\ = 3=1 3=1 б) Очевидна справедливость равенства Sel = е1 • 1. □ Критерий стохастичности неотрицательной матрицы из Mnn дает Утверждение 12. Z&vrn A e Rn?n ui >0, mo A — стохастичес- кая матрица тогда и только тогда, когда е* = (1,...,1) —ее собственный вектор, принадлежащий собственному значению 1. □ В одну сторону утверждение уже доказано (см. утверждение 11). п Пусть А > 0 и Ае^ = е* • 1. Тогда X] аг? — 1 ПРИ г G 1, п. По определению 13 Л — стохастическая матрица. П Для дальнейшего изучения стохастических матриц нам понадобится понятие предела последовательности матриц. Определение 16. Последовательность матриц (33) = (a где At = (a>ij) G Cn>n, называют сходящейся, если для любых г, j g ———— I v-\ G l,n существует lim a^ = а^. В таком случае матрицу А — (aZJ) называют пределом последовательности (33) и пишут Л = lim At. 1OR
Л е м м а 2. Если А — lim At и В еСпп, то справедливы равенства t—+oo ' Hn^(Af£) - АВ и }^{BAt) = В А. О Пусть Ск = АкВ = (с^), С = АВ = (ctJ) и 6 = max{|6?J|}. Тогда справедливы соотношения: t— < п • b ■ max < a,o — als \\. г,7 II г5 *5|J Так как а%1 — = lim [ to c%2 = lim c[K По определению 16 С = к^ = lim ( t—*oo lim —^OG . Значит, fc—-oo t—*oo Аналогично доказывается и равенство В А — lim (J3^f). □ t—ЯХ) Следствие. Если В е CnXn w | В \ф 0, то предел последовательности (33) существует тогда и только тогда, когда существует предел последовательности А\В, А2В,..., AtB,... (г*лге последовательности ВА\, ВА2,..., BAt,...). Теперь нас будут интересовать условия, при которых для стохастической матрицы 5 существует предел последовательности ее степеней 5*, и свойства этого предела. Определение 17. Стохастическую матрицу называют регулярной, если существует lim Sl:. t—>-ос Утверждение 13. ^слг^ 5 — регулярная стохастическая матрица и lim 5* = Г, то: а) Г — стохастическая матрица; б) Тг5 = Гг u STJ = Г^ npti i, jE lTn. П а) Пусть 5* = (s[3) и Г — (£tj)- По утверждению 9 5* — стохастическая матрица при t e N. Переходя в равенствах: к пределу при < —> оэ, получаем t%\ + ... + tin = 1. Поскольку s = Hm s^ , то iZJ > 0. Значит, Т — стохастическая матрица. > 0 и б) По лемме 2 справедливы равенства: ST = S- lim Sl = lim t—*oo t—>-oo = lim 5< = T. 107
Аналогично показываем, что TS = Т. Из равенств ST — Т — TS и следуют равенства б). □ Получим критерий регулярности стохастической матрицы. Т е о р е м а 12. Стохастическая матрица S регулярна тогда и только тогда, когда 1 — простой корень многочлена ms{x), а остальные его корни в С по модулю меньше единицы. □ Так как многочлен \s{x) над полем С раскладывается на линейные множители, то по теореме 11 существует такая матрица С € С* п, что Поскольку ^s(SY — C~lSlC, t £ N, то по лемме 2 и ее следствию предел lim Sb существует тогда и только тогда, когда существует предел lim Sy Ввиду равенства: предел lim t—>оо * существует тогда и только тогда, когда существует каждый из пределов lim t—*oo , г £ 1, т. Из равенства (26) заключаем следующее. Если \г\ < 1, то lim 9тг(г)* = Okxkt Т&к как ПРИ г 0 для любого s < t справедливы соотношения: Л-s s\ и lim \r\l = 0, а при г = 0 lim t Г (см. равенства (28)). не Если \г\ — 1, но г ф 1, то предела последовательности существует. Действительно, соотношения \rl ~ rl~x\ — \гг^1\ - \г — 1| = = |г — 1) > 0 показывают, что в этом случае не существует предела последовательности гь — диагональных элементов матриц Наконец, если г = 1, то ввиду равенства (26) /1 С} \ О '*•! / 108
когда к = 1, так как С} = t. Итак, предел lim 5* существует тогда и только тогда, когда в мат- t-+ ос рице Э(5) нет клеток с корнями, по модулю равными единице и отличными от единицы, а клетки с корнем, равным единице, имеют первый порядок. Набор жордановых клеток в матрице 9(5) определяется каноническими разложениями над полем С инвариантных множителей 5^ (х) в матрице: К(Ех - S) = Так как 6^(х)\б^1^(х), и по утверждению 5 5^(х) = ras(x), то указанное выше условие существования предела lim SL равносильно тому, t-~>oo что многочлен ms(x) имеет единицу простым корнем и не имеет других корней, по модулю равных единице. □ Рассмотрим свойства предельной матрицы для последовательности степеней регулярной стохастической матрицы. Утверждение 14. Если S — регулярная стохастическая матрица иТ = lim 5*; mo справедливы свойства: а) ранг матрицы Т равен кратности корня 1 многочлена \s(x); б) все строки матрицы Т равны тогда и только тогда, когда 1 — простой корень многочлена Xs{%)- □ а) По теореме 12 жорданова форма матрицы 5 над полем С имеет вид: = Diag(l,..., к где к — кратность корня 1 многочлена xs{%) и | гг | < 1 при г Е 1,га. Тогда О — пт ^> \ ks i — i j~ ^ и rang/ = к. Поскольку 5 = C$?(S)C~l для некоторой обратимой матрицы С, то по лемме 2 Т = С1С~1 и, стало быть, rangT = rang/ = к. б) Если 1 — простой корень многочлена xs(x), TO любой собственный вектор матрицы 5, принадлежащий собственному значению 1, пропорционален вектору е^ = (1 ,1) (см. задачу 16.XV). По утверждению 13 все столбцы матрицы Т пропорциональны вектору е^. Значит, все строки матрицы Т равны. 109
Обратно, если Т{ = Tj при i,j Е 1, п, то rang Г = 1, и по свойству а) 1 — простой корень многочлена \s(x)- П Из утверждений 13 и 14 получаем способ вычисления матрицы Т в случае, когда 1 — простой корень многочлена xs(a:)- Достаточно найти одно ненулевое решение q — (91,.. •, qn) системы уравнений x(S — Е) — — 0. Тогда каждая строка матрицы Т имеет вид ^(<?i qn)i где и — п = ]С ?*• (Проверьте!) г=1 Докажем регулярность положительной стохастической матрицы. Теорема 13. Положительная стохастическая матрица S £ € Мпхп регулярна, и в матрице Т — lim 5' все строки равны. t—*OG □ Пусть d^ = (rfi,... ,dn) — собственный вектор матрицы S, принадлежащий собственному значению г, где | г | — 1: Sdl = dlr. (34) Если \dt\ = max{|di|}, то из равенства (34) ввиду условия S > 0 получаем: = \dtr\ = Jf=l 3=1 Из соотношений (35) получаем равенства: (35) = J^ \stjdj\, 3=1 (36) Первое из равенств (36) означает, что совпадают аргументы комплексных чисел rfi,...,rfn (stj > 0). Второе из равенств (36) означает, что |di| = ... = \dn\ (достаточно вычесть его левую часть из правой). Таким образом, dl = d (I,..., 1) , d е С \ {0}. Ввиду равенства (34) имеем цепочку равенств: Sdl = dlr = откуда получаем г = 1. Тогда а; = eld - и ж — l|ms(;r). 110
Предположим, что 1 — кратный корень многочлена ms{x). Тогда (х — l)2\ms{x). Зададим преобразование кр пространства Ш^п\ положив Аа(<р) — £, где а — некоторый базис Ж^п\ По теореме 11.XV существует такой вектор Ъ^ Е Ш^п\ что mbi^(x) = (х — I)2. Тогда вектор а^ = — (Е — S)b^ отличен от нулевого вектора, и (Е — S)a^ = (Е — S)2b^ = — СМ. Значит, а^ — собственный вектор матрицы 5, принадлежащий собственному значению 1. По доказанному выше а1 = ое^,аеС\ {0}. Но а1 Е R(n). Следовательно, а е К \ {0}. Для вектора /^ = ^6^ справедливо соотношение: e^, (37) П и fi Е М(п^\{0^}. Из равенства (37) получаем: £ Sijfj + 1 = fc, г Е 1,п. Обозначим /^ = min{/i}- Тогда ]Г stjfj + 1 = fe. Вычитая из последнего 71 П равенства равенство ^ s^fi = fe, получаем равенство ]Г S£j(fj — fe) — — — 1, которое невозможно, так как в левой части все слагаемые неотрицательны. Итак, 1 — простой корень многочлена ras(x), а остальные его корни в С по модулю меньше 1. По теореме 12 5 — регулярная матрица, и все строки матрицы Т равны по утверждению 14. □ Следствие. Если стохастическая матрица S Е ЖП)П такова, что для некоторого f G N матрица Se положительна, то S — регулярная матрица, и в матрице Q = lim Sl все строки равны, t—*оо □ Пусть ri,..., гп — все корни (с учетом кратностей) многочлена \s(x) в поле С. По утверждению 9 rf,... ,г£ — все корни многочлена \s*(#) с учетом их кратностей. По теореме среди чисел г\ одно равно по модулю единице, а остальные по модулю строго меньше единицы. Но тогда все числа гг, за исключением одного, по модулю строго меньше единицы, а одно — равно единице, так как XsiX) — 0. Следовательно, 1 — простой корень многочлена Xs(%), и S — регулярная матрица. □ Задачи 1. Покажите, что матрица А Е РПуП подобна транспонированной матрице Ат'. 111
4. Для матрицы С(х) =■ , где (а(х).Ь(х)) = г, укажи- 2. Пусть Р — подполе поля F и Л, Bg Pr?,n- Покажите, что матрицы Л и В подобны над полем Р тогда и только тогда, когда они подобны над полем F. 3. Покажите, что матрица А(х) Е Р[т]П)Г? обратима тогда и только тогда, когда она является произведением элементарных матриц. а(х) О О Ъ{х) те последовательность элементарных преобразований, приводящих ее к каноническому виду. 5. Найдите жорданову форму квадрата жордановой клетки S/,(r), рассмотрев случаи г = 0 и г ^ 0. 6. Выясните, является ли стохастическая матрица 5 регулярной и, если да, найдите предел lim Sf. t—>ос /3 О 3 0\ 0 2 2 2 3 0 0 3 0 2 2 2 1 6 г)5 = 12 0 3 0 3 \ 2 0 2 2 0 3 0 3 2 0 2 2 / 4 4 4 0 \ 4 4 4 0 3 3 6 0 3 3 3 3 7. Докажите, что если S G Жп>п — такая дважды стохастическая матрица, что Se > 0 для некоторого £ е N, то lim S* = - 112
Глава XVII ЕВКЛИДОВЫ ПРОСТРАНСТВА В этой главе для произвольного конечномерного пространства над полем действительных или комплексных чисел вводится ряд геометрических понятий и получаются результаты, обобщающие известные уже читателю из курса аналитической геометрии многочисленные теоремы об углах и расстояниях между векторами, прямыми и плоскостями в декартовом пространстве. § 1. Евклидово вещественное пространство Определение!. Симметричной билинейной функцией на векторном пространстве L над произвольным полем Р называется любая функция Ф: L х L —► Р такая, что для всех сЕ Риа,|9,7 G L выполняются соотношения: а) Ф(ас^З) = сФ(а, /?), ^ свойства линейности б) Ф(а + 3,7) = Ф(#, 7) + Ф(А 7)? J по 1~МУ аргументу, в) Ф(а,/3) = Ф(/5, а) — свойство симметричности. Очевидно, что ввиду условия в) из условий а), б) следует также свойство линейности функции Ф по 2-му аргументу: г) Ф(а,/?с) = сФ(а,/3), д) Ф(7, а + (3) = Ф(7, а) + Ф(7, /3). Из определения симметричной билинейной функции Ф легко выводится также следующее свойство: Vq GL: Ф(а.0) =Ф(0,а) -0. Понятие симметричной билинейной функции на конечномерном пространстве тесно связано со следующим понятием. Определение 2. Матрица А е Рпп называется симметричной, если АТ = А. П р и м е р 1. Пусть Lp — пространство с базисом ei , еп и A G £ Рп,п симметричная матрица. Тогда функция Ф: LxL —> Р, которая на 113
произвольных векторах а— ]Г е^ и j3 — Y1 еф( принимает значение: &1 есть симметричная билинейная функция на Lp. (Докажите!) Мы будем изучать симметричные билинейные функции на пространстве Lm над полем действительных чисел Е следующего специального типа. Определение 3. Симметричная билинейная функция 5 на пространстве Lr называется скалярным произведением, если Va £ L\{6}: S(aya) > 0. Очевидно, что изучаемые в аналитической геометрии скалярные произведения на декартовой плоскости и в трехмерном пространстве удовлетворяют определению 3. Приведем еще два примера. П р и м е р 2. Пусть (ei,..., еп) — базис Lr и функция S: L x L —> Е такова, что для любых а = ^е^щ и (3 — ]Г)е^Ьг из L: Тогда S — скалярное произведение на Lr. (Проверьте!) Обратите внимание на то, что функция S совпадает с функцией Ф из примера 1 при Р = Е и А = Е. П р и м е р 3. Пусть L = С [а, 6] — пространство всех функций со значениями в Е, заданных и непрерывных на отрезке [а, Ь]. Тогда функция 5, определенная условием ъ С[а,Ь): {S{a{x),(3{x)) = I a(x)(3{x)dx, есть скалярное произведение на Lr. (Докажите!) Определение 4. Векторное пространство Z,r с заданным на нем скалярным произведением 5 называется евклидовым 10 вещественным пространством и обозначается через (Lr, 5). 10 Евклид — древнегреческий математик (III век до н. э.). 114
ственньте евклидовы пространства, то они для краткости называются просто евклггдовыми пространствами. При этом обозначение L^ будет постоянно напоминать читателю, что рассматриваются пространства лишь над полем R вещественных чисел. Наличие скалярного произведения позволяет внести в любом (даже бесконечномерном) евклидовом пространстве геометрическую терминологию. Определение 5. Нормой (или длиной) вектора а евклидова пространства (L]&,S) называется неотрицательное число ||а|| — <\/S(a, а). Введенное понятие обладает основными известными из геометрии свойствами длины вектора: VaeL: \\a\\ > 0 и (||а|| = 0) <=> {а = 0), (1) VaeL, VcGK: \\ac\\ = \\a\\ • |с|, (2) V а, в € L: \\а + /3\\ < \\a\\ + \\/3\\ — неравенство треугольника. (3) Свойсва (1), (2) очевидны, а доказательство свойства (3) основано на следующей теореме. Теорем а 1 (неравество Коши—Буняковского и—Шварца 12). Для любых векторов а,/? евклидова пространства (L^^S) справедливо неравенство \\a\\ • \\/3\\ > |5(а,/?)|. П Если а = 6, то утверждение очевидно. Пусть а Ф в. По определению 4 для любой константы oEl справедливо неравенство S(aa + +.5, аа+р) > 0, которое в силу свойств а)—д) симметричной билинейной функции S равносильно неравенству S(a, а)а2 + 25(а, Р)а + 5(/?, /3) > 0. Полагая здесь а = — с; ?^с (5(а, а) т^ 0), получаем эквивалентное ут- верждению теоремы неравенство 5(а,а) 1J В. Я. Буняковский — российский математик (1804—1889). 12 К. Г. А. Шварц — немецкий математик (1843-1921). 115
Следствие. Для любых векторов о, в евклидова пространства (Lr,S) верно неравенство (3). Определеннее. Расстоянием между векторами аи J евклидова пространства (Lr,S) называется величина: р(а,/3) = \\а — дУ||. Углом между ненулевыми векторами а и 3 пространства (L&.S) называется угол ур Е [О,тг], для которого cosv? = и м '■ in. Он обозначает- 11^11 * \\p\\ ся символом (а,/?). Векторы а и 0 называются ортогональными (или S-ортогональными), если 5(а, /3) = 0. В последнем случае пишут также а±д. Заметим, что корректность определения угла между векторами вытекает из теоремы 1, и при таком его определении, очевидно, справедливы известные из средней школы: теорема косинусов |!« - в\\2 = \\a\\2 + Ы\2 - 2||а|| • Ц/911 c^ и теорема Пифагора 13 Замечание! Любое подпространство L\ евклидова пространства (Lr, S) можно рассматривать как евклидово пространство (Х^щ, S\) со скалярным произведением 5i: L\ x L\ —> R, получающимся ограничением функции S: L х L -^ R на подмножество Li x L\. Мы будем писать в этом случае Si = S|Li. Таким образом, по определению. V а,/3 G jti: Si(a,j9) = S(a,0). Очевидно, что для любых векторов cv.^ евклидова пространства (Ljr,Si) их нормы, расстояние и угол между ними те же, что и в пространстве (Lr, S). 13 Пифагор — древнегреческий философ и математик (VI век до н. э.).
§ 2. Ортогональные системы векторов, ортогонализация Определение?. Система ненулевых векторов ai..., а* евклидова пространства (Lr,5) называется ортогональной (или S-ортогональной), если аг JLc*j для любых г, j Е 1, А: таких, что г ^ j. Преимущества, связанные с использованием ортогональных систем векторов при решении различных задач, показывает Утверждение 1. Пусть ot\,..., a* — ортогональная система ненулевых векторов пространства (Lr, 5). Тогда: а) система ai,..., а& линейно независима; б) еа/ш /? = «iai + ... + о^а/е, то а, = с/ —Ц- Алл г е 1, Аг. П Утверждение а) следует из б) при /3 = 0. Утверждение б) следует из соотношений 5(/3, аг) — 5(аг,аг)аг, 5(аг,аг) т^ 0, г Е l,fc. П Следующий принципиально важный результат дает, по сути дела, удобный способ построения ортогонального базиса в любом конечномерном подпространстве евклидова пространства. Т е о р е м а 2. Для любой линейно независимой системы векторов аь ..., <*k евклидова пространства (Lr, 5) существуют эквивалентные ей ортогональные системы векторов. Одна из таких систем /Зь ..., 0k может быть построена по правилам: /3] = аь (4) П Индукция по /г. При fc = 1 утверждение очевидно. Пусть т > 1 и теорема верна для любой системы, состоящей из к < т векторов. Докажем ее для к — т. Так как к — 1 < га, то по предположению индукции система векторов /3],..., 3k~i из (4) есть ортогональная система, эквивалентная системе ai,... >ak-i- Тогда система /?ь ... ,a3*—i линейно независима и потому не содержит нулевых векторов. Следовательно, 5(/Зг,/Зг) / 0 для г е l,fc — 1, и вектор /3^ определен равенствами (4) 117
корректно. Так как для такого вектора h при побом t с 1.А 1 вер- ны равенства S{ ^. ^) = S(oa, i() — с/ /* j ч *М ^- ^) -~ ()- 1() (»пгми /^i,...,/^ ортогональна. Ее эквивалентность ежчеме п\ о/, следует из (4). □ О п редело н и е 8. Процесс построения по форм\ там (4) ори>- гональной системы векторов 3\ %* эквивалентной тшичшо независимой системе с\\ гц, называется процессом орт о г он п пиации последней. П р и м е р 4. В условиях примера 3 построим ортогоналып ю с исчем\ мноточленов в пространстве С[—1,1], эквиваиюнтную сие ie\ie О) - 1. оо = .г. г>з = -^2- По формулам (4) нол\чаем 3\ — 1. Тот да 1 1 ,А) = fdx = 2, S(a2i0i) = I -rdx - 0 и в2 - «2 - %h - •<*• -т -1 Отсюда S(&0) ^ 5() ^ 5(А)=0 и 2 , 0-3- о 1 /% = оз - з^А - -2-А = х- - -. Таким обра юм, искомая система: 3\ - 1, 02 = .г, ^^ = .г2 . 3 а м е ч а н и е 2. В условиях георемы 2 д 1Я чюбот /С 1.А* система ^, /^ есть ортогональная система, эквивалентная системе r>i, с>^. При этом, если система ai,..., ар сама ортогональна, то Зь ~ — аг для ?Glf. (Проверьте!) О п р е д е л е н и е 9. В евклидовом пространстве век юр о со свойством ||о|| = 1 называется нормьрованпым век юром, а орт oi она тт>- ная система нормированных векторов называется ортопормироватюи системой векторов. Т с о р е м а 3. В конечномерном евклидовом про< транс wee существует ортонормированнь/й базис. Любую линейно независимую ортогональную {ортонормироваиную) систему векторов с\\ о/ mtoso пространства можно дополнить до его ортогонапьно/о (ортонорми- роваиного) базиса, □ Если систему rvb с\£ дополнить до базиса аь а? а?7 всего пространства и провести процесс ортогонализации, то но теореме 2 118
получится ортогональная система 3\ Ди '-экшта. юнтная ба nicy нро- с!ранета и потому являющаяся его башеом. При ^ом, согласно замечанию 2. Д = о, для г G \Л. Ортонормированный базис пространства получается из построенного по формулам: 3&п II з утверждения 1 б) следует, что если е\, сп ортонормирован- ный базис пространства (L-.S). то координаты в -ном ба шее ироиз- 77 во 11)Н(но вектора о ~ ^ г?аг G /^ moitt быть получены по формулам ?=1 а, =■ 5(о,г,), 7 € 1, п. 3 а м е ч а н и е 3. Пример 2 показывает, что на конечномерном пространстве L^n всегда можно так задать скалярное произведение, что данный его базис е\,..., еп будет ортонормированным. 3. Ортогональные подпространства. Ортогональное дополнение. Расстояние между многообразиями Известные из геометрии определения перпендикулярности прямых и ирепендикулярности прямой и плоскости распространяются на многообразия произвольного евклидова пространства следующим образом. Оиреде л е н и е 10. Подпространства L] и Lo евклидова пространства (£^,5) называются ортогональными, если для любых а\ € L\ и по Е 1/2 выполняется соотношение S(ai,ao) = 0. Многообразия *)\ -tL\ и 02 + ^2 называются ортогональными, если ортогональны тгорождакнцие их подпросфансгва L\ и L^- Справедливо следующее обобщение известных из курса *ie\ieiпарной геометрии теорем о возможности проведения через данную точку единственного перпендикуляра к данной прямой (на плоскости) или к данной плоскости (в трехмерном пространстве). ОпределениеП. Ортогональным дополнением к подпространству К евклидова пространства (L&, S) называется множество 119
KL = {3eL: Va eK S(o.J) =0}. Читателю предлагается самое юятельно убедиться в том, что К1- нод- прос гранство в Lp. Очевидно, чю это самое большое и з подпространств, ортогональных поднроетранепп К. Т е о р е м а 4. Конечномерное евклидово прострететво (L«. 5) е< ть прямая сумма любого своего подпространства К и его ортогонального дополнения KL : L^ — К -j- KL. LJ Если К = {0} или К - L, то, соответственно. А'1 - L или Л'1 — = {^}, и утверждение очевидно. Пусть dimZ^ — п и diiriАт? — /. f G Ui-1. В силу теорем 2 и 3 в А'т? существует орюнормирован- ный ба зис ei С/, который можно дополнить до ортонормировании! о базиса 6] et,.. -, еп пространства (Lj&.S). Пусть Ы = (ef f j...., f tl )^. Очевидно, достаточно доказать, что А"^ = М. Нетрудно видеть, что вектор a € Lr ортогонален любом> век гору из подпространства А' = {(\ С()^ тогда и только тогда, когда 5(о,е#) -0 для ? еГ7. (5) п Если о — ^3 c?°i- то 5(o',eJ = п? для ?' G l.r?, поэтому условие (5) равносильно условию а\ — ... — в\ — 0. т. е. условию о е i\/. LH Следствие. Для любого t-мерного подпространства К евклидова пространства, (Lr. S) размерности п существует единственное ортогональное К подпространство М размерности п - /: М - К1. П Очевидно, что М С А'х. и так как dim Л/и? = dim AY- ю Л/ — А'х. С Например, если А' - плоскость в трехмерном евклитовом пространстве, проходящая через точку в. то К1- единственная перпендик\ чя})- ная этой плоскости прямая, проходящая через ючку в. Из теоремы 4 следует, что, каково бы ни было подпространство Л евклидова пространства (L^,5). любой вектор af I может бьпь однозначно представлен в виде: a = ,? + -}. je К. о еК1. (6) О пределен и е 12. Векторы /? и 7 в равенстве (6) называются соответственно ортогональной проекцией о на К и ортогональной составляющей о относительно К и обозначаются: О. 120
Oimciiim. что введенные понятия хорошо согласуются с онргде.кчш- ем ума между векторами, поскольку для любых oi.rv2 G L\{6}< если А" = (oi)r, to cos(nbo2)| - jj—п . lla2|l (Проверьте это равенство самостоятельно.) В курсе аналитической геометрии много внимания уделялось вычислению расстояний между основными геометрическими объектами: точками, прямыми и плоскостями. Как уже отмечалось в главе XIII, обощением этих понятий является понятие многообразия в /7-мерном пространстве. О п р е д е л е н и е 13. Расстоянием между многообразиями Р\ и Р2 евклидова пространства (L]^,S) называется величина р(РиР2) =inf{||ni -rv2||: 01 ePi,o2 eP2). Понятие ортогональной проекции позволяет с единых позиций обо- щить многочисленные результаты из аналитической геометрии. Т е о р е м а 5. Пусть для ? G 1. 2 многообразие Рь = иь + А'; задается, вектором, иг и подпространством, Кг конечномерного евклидова пространства (L^.S). Тогда П Выберем произвольно векторы oj € Рь no E Р2- Тогда аг — где /?, € Кг, ? 6 1,2, и верны равенства: Ol -а2 = mi - и2 + (/Зг - 02) = np{Kl+K2)L (щ - + npKl+K2(ui - и2) Л- 0i - Рассмотрим векторы: V = пР(Кг+К2У Ы ~и2)< w = npKi+K2(ui - lf2) + 3\ - ih- Заметим, что v G (A^i + А^)^. w G A^i 4- K2 m cx\ — a2 = v 4- w. Поэтому 121
Вектор v не меняется при изменении век юрой а\ i Р\.<ч ' lJ>> поскольку векторы и\ и г/2 в доказательстве фиксированы. Остаемся заметить, что Oi и с\2 можно выбрать так. что ||oi — ао\\ — \\v\\. Для ^ioj о достаточно подобрать соответствующие векторам а\ и п> век юры 1} 6 G К\ и J2 ^ А'г так. чтобы выполнялось равенство м1 = 6, i. e. равежч по ih ~ Л — flPi<i+K?(vi -f *'2)- Последнее можно сделать ввиду условия npKi+K2{ui + ?/2) € К\ + А'2- Теперь очевидно, что \\v\\ = шш{||гн - -а2||: О! е Рьа2 G Р2}- □ § 4. Матрица Грама системы векторов. Описание всех скалярных произведений 1. Рассмотрим сначала ситуацию, когда Lp - векторное пространство над произвольным полем Р и Ф симметричная бп. пшейная функция на Lp. О п р е д с л е н и с 14. Матрицей Грама 14 системы векторов п\ at? Е Lp относительно функции Ф называется мафица Гф(а) = Очевидно, что матрица Гф(а) симметрична ввиду симмофичносги функции Ф. Удобства, связанные с использованием матриц Грама при изучении симметричных билинейных функций, основаны на следующих ее свойствах. 14 И. Грам — датский математик (1850-1916). 122
Л е м м а 1. Для любых rti, справедливы равенства: , a/, £ Lp и о\ ад., 6i, * Е Р (от Ok) • ГФ(а1 ад- П Доказательство легко осуществляется непосредственным перемножением матриц в левых частях выписанных равенств с использованием свойств линейности функции Ф. □ В частности, отсюда следует, что если с — (ei,...,r7,) базис пространства Lp, то функция Ф одназначно определяется матрицей Гф(с1 гп). Действительно, если для а £ Lp через а? обошачгпь строку координат вектора о в базисе е: ctg = ( ab) . то в силу леммы 1 для любых а.(3 € Lp справедливо равенство: (7) Наоборот, как уже указывалось в примере 1, для любой симметричной матрицы А <Е Рп,п функция Ф. определяемая равенством есть симметричная билинейная функция, и при этом А = Гф(в1 г^). (Докажите!) Таким образом, при фиксированном базисе г*пространства Lp соответствие Ф —> Гф(г1 ,е„) есть биекция множества всех симметричных билинейных функций на Lp на множество всех симметричных матриц из Рл,п- Л е м м а 2. Если система векторов и\ , иь выражается чера базис е\ еп пространства Lp по формуле (и\,..., щ) = (с\, (-п)С7} а-, то справедливо равенство: 123
□ Достаточно заметить, что j-и сюлбец матрицы С1 ecib ulr. а 7-я строка матрицы С1 есть йг£. и для вычисления элемента Ф(м,,?/;) матрицы Гф(^1 ид.) можно применить формулу (7). П 2. Теперь изучим специфические свойства матриц Грама пк чем векторов евклидова пространства (L$*S) относительно функции S. Прежде всего, очевидно, что система векторов oi од. эюго пространства ортогональна тогда и только тогда, когда Г^(а1 ак) диа- гональная матрица, а ортонормировашюсть системы эквивалентна {равенству Г<?(п1 а к) - Ekyk- На основании эгого замечания можно предложить следующий! способ описания всех орюнормированных ба- шсов пространства (Ls.S) по одному базису. О п р е д е л е н и е 15. Матрица С С Шп%п называет ся ортогональной. если она обратима и С"1 = С1. У т в е р ж д е н и е 2. Если с\ сп ортоиормироватшй бал ас евклидова пространства (Lr.5), то система, векторов (и\ ип) - = (ei en)C является ортонормированным базисом этого пространства тогда и только тогда, когда С ортогональная матрица. □ По лемме 2 справедливы равенства: Гф(*/1 ип) - СТГФ(е} еп)С = СТС. Поэтому условие Гф (v \ ип) — Е эквива юнтно равенет ву С[ — С~ х. □ У т в е р ж д е н и е 3. Система векторов и\ ///,- евклидова пространства (1/к, S)линейно зависима тогда и только тогда, когда матрица Fs(wi,..., иь) вырождена. Если система и\ и к линейно независима, то □ Если Ylllibi = 0, то по лемме 1 Г^С^ь • • • Л^к)^ — 0*, где Ь* = hi = I ... I. и при условии 6^ ф 0^ матрица F,9(wi,..., и к) вырожден- пая. Наоборот, если Ts(ii\ ,ЗД) вырожденная матрица, го суше- егвуег вектор />1 € Е^\0^ такой, что Ts(u\ Hk)h[ — О1. Тшда по лемме 1 и так как 5 — скалярное произведение, то J2vtb? — 0. 124
Если система и^ Vk линейно независима, го по теоремам 2 и 3 в существует эквивалентная ей орюнормированная система векюров ед-. Пусть (н\ и^) = (сь ..., ед.)С Тогда по лемме 2 ek)\ ■ \С\ = \С\2 > 0. G С .1 с л г г в и е. Если u\....,vri произвольный базис евклидова 'пространства (L\,S), то столбец координат любого вектора о <l- Lr> (? базисе и есть единственное релиение систелш. лчтеаных уравнении □ По лемме 1 вектор al является решением указанной системы, а по утверждению 3 она разрешима однозначно. □ 3. Полученные результаты позволяют дать описание всех способов задания скалярного произведения на конечномерном пространстве L&. О п р е д о л е и и е 1С. Главным угловым минором порядка к £ 1. п мафицы А £ Rn.n называется минор Л/ 1... к Т е о р е м а 6 (Сильвестр 15). Пусть и^ иГ1 базис пространства Lr и А симметричная матрица из Мп,„. Тогда симметричная билинейная функция S па L^, определяемая условием, Va,/3GLE:5(o^)-o^4, (8) задает па L^ скалярное произведение в том и только в толь случае, если все главные угловые миноры матрицы А = (огу)Г/хг? положительны. □ Заметим, что для любого к G 1, г? верно районеiво: an -"(i\ (9) Поэтому, если 5 скалярное произведение, то по утверждению 3 все главные угловые миноры матрицы А положительны. 15 Д. Д. Сильвестр — английский математик (1814—1897). 125
Наоборот, пусть все павные уюовые миноры матрицы А но юан- тсльны. Докажем индукцией по п. что в таком случае S ска 1ярное произведение. При и = 1 имеем .4 = (<*\\)- 0\\ ^ 0. и \ шерж кчпи» очевидно. Пусть т > 1, и утверждение верно при всех // < ш. Докажем ею при п — т. Рассмотрим подпространство V — (и\ и„-\)~ и на нем симметричную билинейною функцию .9' — S \ Lf. Очевидно, чю Г.9'(Н1 ?/w-l) = Г5'(«/1 ///, - l). и так как в силу (9) в этой матрице все ыавные уыовые миноры но ю- жительны, то по предположению индукции 5 ска inpnoe произведение на L^. По теореме 3 в евклидовом пространстве (1Д. S') сущее\n\c\ ор'юнорхмированный баше с\ <п-\- То1да. 1ак как .9' — S I //. ю Рассмотрим вектор n-l еп = ип -£%г5(г/п,ег). (11) Нетрудно видеть, что система ei еп эквивалентна системе //| ип. и потому она бате Lr. Ич соотношений (10) и (11) лсм ко видпь. что S((п.гг) — 0 для / € 1, п — 1. и потому ...LS(r „.<-„)). (12) Пусть е — иСпхп- Тогда по лемме 2 Г5(^) = Г'ГГ^(/7)Г'. Так как по условию |Гс^(гГ)| = \А\ > 0, то справедливо неравенство |1\(Г)| -= \С]1 л х|Г$(й)1 > 0. Отсюда, ввиду (12), следуем, что 5(rn,rrl) > 0. и * ш п любого вектора а = ]Г] ггог € Ху\{^} верны соотношения: и-1 5(rv, о) - X] «f + r/^ 5(f „. г„) > 0. П г=1 126
§ 5. мзометричность евклидовых пространств IIi георомы б видно, что существует бесконечно много раз шчных ска шрных ирои зведений на ненулевом конечномерном прост ране i во L _. Однако, как показывает следующий результат, с алгебраической ючки зрения все они "одинаковы11. Т е о р е м а 7. Пусть (I/?. S) и (Л/*;, F) евклидовы прострши тьа одной размерности п. Tosda существует изо.морфизм a: L. --> Л/u (о свойством □ Выбором в пространствах (L$*S) и (Mtj4F) ортонормированные базиеы, соответственно, С] , еп и п\ , ип. Зададим отображение гт, положив для о = Y2 ciai'- ti <r(o) = У и,а?. Кик показано при доказательопзе теоремы 10.XIII, а и зоморфи *\ на Л/^. При этом, если iJ = Y1 €$1 € L^. то, как нетрудно увидеть, ). П О и р о д о л е н и е 17. В условиях теоремы 7 изоморфизм <т со свойством (13) называется илометрией евклидовых пространств (L^. S) it (Д/..F). Таким образом, любые два евклидовых пространства одинаковой рашорноети шометричпы. Заметим, что. так как и зометрия "еохраня- (ч " ска 1Ярное произведение, то она "сохраняет " длину каждого век юра п vi и>1 м(»жду любыми векторами. 127
б. Евклидово комплексное (унитарное) пространство На векторном пространство L - над гнием С комплексных чисе i можно ткже определить скалярное прои *ве ^епие, с помощью ко юрою можно ввести на L- и эффективно иеиольюва1ь всю 1еомефичеек\ к> терминологию, *а иск иочением понятия \чла межд\ век юрами. Для экно надо лишь немного измени п> онреде юния 1 и 2. Т1юбы i\ что поясни ib смысл вносимых изменений, напомним о разнице в выражениях модуля действительного и комплексного числа через -ио число: если 2G1, то |^| — V22, если z £ С, то |с| = v7^, где г число, сопряженное к z. О н р с д е л е н и е 18. Эрмитовой 1Ь билинейной фунъциеи на пространстве Lz называется любая функция Ф: L x L -~> С 1акая. чю для всех :GCho,Jo GL выполняются соотношения: а) Ф(а •*,,*) -c<&(a,,i). б) Ф(а + Д7) = Ф(о-7) в) Ф(о./3) = Ф(/3,л). Очевидно, что ввиду в) из а) и б) следуют также свойства: г) Ф(а,/?-г) = гФ(л,/*), Кроме того, функция Ф обладает очевидно свойством: е) V о Е L: Ф(о,о) € М. Для построения примеров эрмитовых билинейных функций ввс\\v\\ Определенно 19. Матрица А = (аи) е Сп,п наилваекя эрмитовой, если Аг = А. т. е. «^ = oJfc для /, j G 1. //. Заметим, что любая симметричная матрица над М является эрмитовой. П р и м е р 5. Пусть е\ ,еп - базис /<:, и Л G С„.п эрмитова матрица. Тогда функция Ф: L x L —> С, которая на произвольных 16 Ш. 'Эрмит францу5гкртй математик (1822-190J). 128
векторах а = ]Г e^i и (3 = ]Г} ефг из L принимает значение: = (аи...,ап)-А Ьп есть эрмитова билинейная функция на Lc- (Докажите!) Определение 20. Эрмитова билинейная функция S на пространстве Lc называется скалярным произведением, если VaE Д{0}: S(a,a)>0 (условие 5(a, a) € R выполнено ввиду свойства (е) из определения 18). П р и м е р 6. Пусть ei,..., еп — базис Lc, и функция 5: L x L —> С п п __ такова, что для любых a = J2 егаг> 0 = 1>2 егЬг из L S(a, (3) = aifei +... г=1 г=1 ... + anbn. Тогда S — скалярное произведение на Lq. (Докалсите это и сравните с примером 2, учитывая замечания перед определением 18.) Определение 21. Векторное пространство Lc с заданным на нем скалярным произведением S называется евклидовым комплексным, или унитарным пространством, и обозначается через (Lc,S). Замечание 4. Дословно так лее, как и в евклидовом пространстве, в унитарном пространстве вводятся понятия: нормы вектора (определение 5); расстояния мелсду векторами (определение 6); ортогональной и ортонормированной систем векторов (определения 7, 9); ортогональных подпространств; ортогонального дополнения к подпространству и ортогональной проекции вектора на подпространство (определения 10 — 12); расстояния между многообразиями (определение 13). При этом оказываются справедливыми теоремы 1 — 5 и утверждение 1, причем их доказательства остаются неизменными за исключением следующих моментов. а) При доказательстве неравенства Коши—Буняковского—Шварца (теорема 1) из неравенства S(aa + /3, аа + /3) > 0 в рассматриваемой ситуации следует неравенство: S(a,а)\а\2 + 5(а,0)а + 5(а,(3)а + 5(/3,/?) > 0. Поэтому здесь нужно выбирать а = — ^> L Тогда из последнего неравенства следует: 129
б) При доказательстве неравенства треугольника (следствие теоре- мы 1) сначала выводится равенство \\а + /3\\2 = \\a\\2 + \\(3\\2 + S(a, /3) + +S{a, /3), а затем используется неравенство 5(а, /3)4-S(a,@) < 2|£(а,/3)|. Соответствующие выкдадки читателю предлагается провести самостоятельно. Замечаниеб. Понятие угла между произвольными векторами а и /3 в унитарном пространстве не определяется. Определение 6 в этом случае теряет смысл, поскольку 5(а, /3) — число комплексное. Замечаниеб. Матрица Грама произвольной системы векторов #ь • • • ? &k унитарного пространства (Lc, S) определяется так лее, как и в евклидовом вещественном пространстве, равенством: Г5(аь..., ак) = (S(cti, aj))kxk. Эта матрица является эрмитовой. Если е±,..., еп — базис L<c, то для любых а, /? G L верно равенство: где 0 — вектор, сопряженный к /?^. Определение 22. Матрица С € Сп называется унитарной, ггл если она обратима и С~х = С . В частности, любая ортогональная матрица над R является унитарной. Аналогом утверждения 2 для унитарного пространства (Lc, S) является Утверждение 4. Если е±,..., еп — ортонормированный базис (L<c, S), то система векторов (ui,...,ип) = (ei,..., еп)С является ор- тонормированным базисом (Lc,S) тогда и только тогда, когда С — унитарная матрица. (Доказательство аналогично доказательству утверждения 2.) Аналоги утверждения 3 и теоремы 6 (для эрмитовых билинейных форм) читателю предлагается сформулировать и доказать самостоятельно. Теорема 7 и определение 17 переносятся на унитарные пространство дословно. Замечание 7. Нетрудно видеть, что скалярное произведение S на пространстве Lr формально удовлетворяет всем условиям определений 18 и 20, поскольку 5(а, /3) Е Ш для любых а, /3 G Lr, и потому 5(/?, а) = 130
= S(/?,a). В связи с этим определения скалярного произведения на L& и Lq можно сформулировать одновременно следующим образом. Определение 23. Пусть Р е {R, С}. Тогда скалярным произведением на пространстве Lp называют функцию S: L x L —* Р такую,что для любых с^Риа,|8,7Е1 выполняются условия: г) если а ^ 0, то £(а, а) > 0. Конечномерное пространство Lp с заданным на нем скалярным произведением S называют евклидовым пространством и обозначают (Lp, 5). Таким образом, мы расширили содержание термина евклидово пространство, включив в него не только евклидовы вещественные пространства (как делали это в §§ 1 — 5), но и евклидовы комплексные пространства. Введенная терминология оказывается весьма удобной и, как следует из результатов этого параграфа, не противоречит первоначальному узкому толкованию термина "евклидово пространство" в §§ 1 — 5. Эта терминология будет широко использована в следующей главе. Задачи 1. Докажите, что а) для любых чисел а±9..., an, 6i,..., bn G К справедливо неравенство Коши: б) для любых непрерывных на отрезке [a,fc] функций f(x) и д(х) справедливо неравенство Буняковского: / Ja г ( г f{xfdx • / g{xfdx > / f(x)g(x)dx J \J 2. Докажите, что для любых векторов а, (3 евклидова пространства u, S) справедливы следующие утверждения: а) Va€R: \\aa\\ = \а\ ■ \\a\\; в) И| • \\p\\ = \S(a,f3)\ &dim(a,0)n < 1; 131
г) \\а + /3\\ = \\a\\ + \\0\\ <=> За е R: (а = fa а > 0); д) \\а ~ 0\\ = \\a\\ + \\0\\ <* За е Ш: (а - /За, а < 0); е) \\а - 0\\ = \\a\\ - \\0\\ ^ За е Ш: (а = fa a > 1). 3. Докажите, что если ei,..., еп — ортонормированный базис евклидова пространства (Lp, 5), то для любого вектора а = Y^i=ieiai € £ верны: равенство Парсеваля 17: ||а|| = Y17=i 1а*12' неравенство Бесселя 18:У к Е 1,п: ||а|| > 5^i=11^|2. 4. Докажите, что в трехмерном декартовом пространстве с обычным скалярным произведением S площадь параллелограмма, стороны которого задаются векторами Qi и аг, равна ^/|rs(c*i,a2)|, а объем па- раллепипеда со сторонами ai,a2,c*3 равен <\/\Г$(&1,&2-><^з)|- 5. В условиях предыдущей задачи покалсите, что если к системе векторов 0:1,0:2,0:3 применить процесс ортогонализации, то получившаяся ситема векторов /?ь/?2,/5з образует прямоугольный параллепипед, равновеликий исходному. 6. Пусть (Lp, S) — евклидово пространство, К — его подпространство с базисом ^i,..., ит и a — произвольный вектор из L. Докажите, что если в результате ортогонализации системы векторов щ,..., иш, а получается система fii,..., /3m, /?m+i, то /3i,..., (Зт — ортогональный базис К, а /3m-|-i = прк±а — ортогональная составляющая а относительно К. 7. В условиях предыдущей задачи докажите, что ортогональная проекция вектора а на подпространство К имеет вид: npKot = где (ci,..., Cm)7" — единственное решение системы линейных уравнений: 8. Пусть ai,..., а* и /3i,... ,/?t — системы векторов n-мерных евклидовых пространств соответственно (£р, 5) и (Jfp, F). Докажите, что 17 М. М. Парсеваль — французский математик (1755—1836), 18 Ф. В. Бессель — немецкий математик (1784—1846). 132
существует изометрия <р: Lp —> Kf> со свойством ^р{аг) = А ДЛЯ г £ тогда и только тогда, когда 9. Докажите, что для произвольного базиса ui,...,un евклидова пространства (Ьр, S) существует единственная система векторов vi,..., г>п такая, что г. если г = ft S{ut,v3) = |п если г При этом vi,..., vn — базис L&. (Говорят, что v — базис, сопряженный к й. Ясно, что и = v тогда и только тогда, когда п — ортонормированный базис.) 10. Пусть iiT, M — произвольные подпространства конечномерного евклидова пространства (Lp, 5). Докажите соотношения: К С М <з> ^к1-^ м±, (к^1- = к, (к+м)1- = к±пм±, {кпм)1- = к±+м±. Какие из этих соотношений верны и в бесконечномерном пространстве? 133
Глава XVIII ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ КОНЕЧНОМЕРНЫХ ЕВКЛИДОВЫХ ПРОСТРАНСТВ Всюду далее в этой главе Р — поле комплексных или действительных чисел, т. е. Р Е {C,R}, и (Lp, 5) — (конечномерное) евклидово пространство со скалярным произведением 5, т. е. (Lp, S) — либо евклидово вещественное пространство (при Р = R), либо евклидово комплексное (унитарное) пространство (при Р = С). Цель этой главы — изучение линейных преобразований пространства (Lp, 5), свойства которых определенным образом связаны со свойствами заданного на Lp скалярного произведения S. Получающиеся при этом результаты оказываются не только интересными с теоретической точки зрения, но и весьма полезными в прикладном аспекте. Так, например, будет показано, что любая симметрическая матрица над R подобна диагональной матрице над R, и будут описаны все изометрические отображения пространства (Lp, S) на себя. § 1. Преобразование, сопряженное к данному. Самосопряженные и изометрические преобразования Определение!.. Линейное преобразование ф евклидова пространства (Lp, S) называется сопряженным к линейному преобразованию (р этого пространства, если Va,/J € LP: S(<p(a),0) = S(a^{fi)). (1) Заметим, что отношение сопряженности преобразований симметрично, поскольку при условии (1) верны равенства S(ip(a),P) = 5(/3,^(a)) = = S((p(0),a) = S(a1ip(P)), т. e. ip — преобразование, сопряженное к ф. 134
П р и м е р 1. Пусть К — подпространство в (Lp, S) и <р — ортогональное проектирование L на К: Va e L: (р(а) = прко.. Тогда (р € £(Lp) и сопряженным к (р будет само (р, поскольку для любых а, /? € L верны равенства: (a),0) = S(npK(a),npK((3)) = Приведенный пример делает содержательным Определение 2. Линейное преобразование ip евклидова пространства (£р, S) называется самосопряженным, если оно сопряжено к самому себе. Укажем один важный класс преобразований, для которых легко описываются сопряженные. ОпределениеЗ. Линейное преобразование ср евклидова пространства (Lp, 5) называется изометрическим или изометрией, если Утверждение!.. Линейное преобразование ср евклидова пространства (Lp, S) является изометрическим тогда и только тогда, когда оно обратимо и сопряжено к преобразованию <р~г. □ Если (р — изометрия, то для любого a G Ь\в: ||<^(а)|| = ||а|| > О, т. е. (р(а) ф в и <р обратимо. (Проверьте!) Тогда для любых a,fieL верны равенства 5(</?(а),/?) = S((p(a)1ip(ip~1(P))) = 5(а,^>~1(/3)), и потому (р~г сопряжено к ср. Наоборот, если ср е £(Lp)* и (р~г сопряжено к <р, то V а,(3 € L: S(<p(a)MP)) = 5(a, v"1^^))) = S(a,0), т. е. (р — изометрия. □ П р и м е р 2. Пусть Р = R, L = £>2 — пространство векторов декартовой плоскости с обычным скалярным произведением и ip — преобразование, осуществляющее поворот любого вектора вокруг начала координат на фиксированный угол и против часовой стрелки. Тогда, очевидно, (р — изометрия. Сопряженным к (р преобразованием будет поворот на угол — ш. 135
Приведенные примеры являются наиболее важными с точки зрения теории, которая будет изложена в данной главе. Прежде всего ответим на вопросы о том, сколько сопряженных преобразований можно построить для данного линейного преобразования и всегда ли они существуют? Соответствующая теорема существования и единственности опирается на следующее полезное в ряде случаев утверждение. Лемма!. Если ei,...,en — произвольный базис евклидова пространства (Lp, S), то преобразования <р, ф G £(£р) сопряжены тогда и только тогда, когда e,)) для i,j e l,n. (2) □ Необходимость равенств (2) для сопряженности преобразований (риф следует из определения 1. Допустим теперь, что они выполне- п п ны. Тогда для произвольных векторов а = J3 ега% и Р = ^2 егЬг из Lp г=1 г=1 справедливы соотношения: г=1 j=l г=1 j=l Следовательно, ^ — преобразование, сопряженное к (р. П Теорема 1. ^слгл (ei,..., еп) = е — ортонормированный базис евклидова пространства (Lp, S), то линейные преобразования (риф этого пространства сопряжены тогда и только тогда, когда (3) □ Пусть Ag(ip) = {агз)пхп,Аё(ф) = (6г^)пхп. Тогда для любых базисных векторов ег и еэ справедливы равенства: t=l 3=1 136
Отсюда, пользуясь тем, что е — ортонормированный базис, получаем равенства: п 8{Ф{е3),ег) = ^2,bS3S(es,e%) = btJ1 8=1 S(e,,ip(et)) = и в силу леммы 1 сопряженность преобразований (риф эквивалентна системе равенств: ) О С 1 Г) т. е. эквивалентна равенству (3). □ Следствие. Для любого линейного преобразования (р евклидова пространства (Lp, 5) существует единственное сопряженное к нему преобразование ф G £(Lp). Это преобразование однозначно определяется из (3). Всюду далее линейное преобразование, сопряженное к данному преобразованию <р G £(Ьр) пространства (Lp,5), обозначается через ср* (согласно следствию теоремы 1 такое обозначение корректно). Теперь равенство (3) молено переписать следующим образом: (4) Замечание1. Важно помнить, что равенство (4) справедливо лишь в случае, когда е — ортонормированный базис пространства (Lp, 5). Если п — произвольный базис этого пространства, то матрицы и А«г((£>) связаны более сложным соотношением: где Т${й) — матрица Грама (см. § 4.XIV). (Докажите это равенство самостоятельно.) Теорема 1 позволяет следующим образом охарактеризовать самосопряженные и изометрические преобразования. Напомним, что матрица A G Рп,п называется эрмитовой, если А = = А . Очевидно, множество эрмитовых матриц над полем действительных чисел совпадает с множеством симметричных матриц. Матрица 137
—Т А € Pn,n называется унитарной, если А = А~х, и ортогональной, если АТ = А~г. В случае, если Р = R, эти понятия совпадают. Следствие. Пусть (Ьр, S) — евклидово пространство с орто- нормированным базисом (ei,..., еп) = е и (р Е £(Ьр). Тогда: а) (р — самосопряженное преобразование в том и только в том случае, если Ag(ip) — эрмитова матрица; б) ср — изометрическое преобразование в том и только в том случае, если А$((р) — унитарная матрица. □ Достаточно воспользоваться равенством (4), заметив, что условие самосопряженности преобразования <р записывается равенством tp* = (р, а условие его изометричности — равенством (р* = ip"1 (см. утверждение 1).П Отметим, что в связи с результатами последнего утверждения при изучении изометрических преобразований употребляется следующая терминология. Определение 4. Изометрическое преобразование евклидова вещественного пространства называется ортогональным, а изометрическое преобразование унитарного пространства называется унитарным. Мы, однако, в целях экономии будем чаще пользоваться общим термином — изометрическое преобразование. В заключение этого параграфа отметим следующие свойства сопряженных преобразований. Утверждение2. Для произвольных линейных преобразований ipuift пространства (£р, S) и для произвольного многочлена f(x) = = со + с\х + ... + стхт G ¥[х] справедливы следующие соотношения: а) (<£*)* = <р; в) f г) /fa)* = ЛV*), где f(x) = Щ + сгх д) С^"1)* = С^*)"1 (если (р — обратимое преобразование). УтверждениеЗ. Если К — подпространство пространства (Lp, S), инвариантное относительно преобразования <р е £(Ьр), то его ортогональное дополнение К1^ инвариантно относительно <р*. Доказательства этих утверлсдений легко получаются с использованием теоремы 1 и равенства (4). (Проведите их самостоятельно.) 138
2. Нормальные преобразования Самосопряженные и изометрические преобразования евклидовых пространств обладают общим свойством, которое позволяет с единых позиций описывать их геометрическое строение. Определениеб. Линейное преобразование ip евклидова пространства (Lp, S) называется нормальным, если <р*<р = <р<р*. Очевидно, что самосопряженные (ср* = ф) и изометрические (ср* = = (р~г) преобразования являются нормальными. Основное свойство нормальных преобразований состоит в следующем. Теорема 2. Если К — подпространство евклидова пространства (Lp, S), инвариантное относительно его нормального преобразования ip, то подпространства К и К1- инвариантны относительно преобразований (р и <р*. При этом преобразование cpi = ip \ К есть нормальное преобразование евклидова пространства К со скалярным произведением Si = S | К и <р\ = ср* | К. □ Пусть (ei,..., ет) — ортонормированный базис К$>. Дополним его до ортонормированного базиса е = (ei,...,, ew,..., еп) пространства Lp. Заметим, что в этом случае К^ = (em+i,..., еп)р (см. доказательство теоремы 4.XVII). Так как по условию <р(К) С К, то по теореме 12.XV матрица преобразования ср в базисе е имеет вид: ^ ), (5) а по теореме 1 справедливо равенство: гг I ВТ О = Mv) =\^т £ у (б) Для доказательства первой части теоремы, очевидно, достаточно показать, что в (5) С = Omx(n_m). Так как tp — нормальное преобразование, то матрицы (5) и (6) перестановочны, и поскольку 139
то справедливо равенство ССТ = ВТВ - ВВТ. (7) Нетрудно проверить, что след (сумма диагональных элементов) мат- гр гр рицы В В-ВВ равен нулю. С другой стороны, если С = (ctJ)mx(n_m), гр то след матрицы СС равен: г=1 э=1 г=1 j=l Поэтому из (7) следует, что Сг3 = 0 для г G 1, га, j Е 1, п — т, т. е. С = = ^тх(п—т)т Для доказательства последнего утверждения теоремы достаточно заметить, что преобразование гр = <р*\К является сопряженным к <pi относительно скалярного произведения 5i, а так как (р*(р = (ftp*, то грф1 =■ (ргф. □ Следствие. Если ip — нормальное преобразование евклидова пространства (Lp, S) и а — его собственный вектор, принадлежащий значению г G Р, то а — собственный вектор преобразования (р*, принадлежащий значению г. □ Так как подпространство К = (а)р инвариантно относительно (р, то по теореме оно инвариантно и относительно у?*, т. е. а — собственный вектор преобразования (р*. Пусть (р*(а) = аг\. Тогда справедливы равенства: а),а) = S{a,tp{a)) = г5(а,а), и так как 5(а, а) ^ 0, то п = г. П Этот результат позволяет следующим образом упростить задачу описания нормальных преобразований. Теорема 3. Если ср — нормальное преобразование евклидова пространства (Lp, S), то либо многочлен х<р(х) пеприводим над Р, либо пространство L раскладывается в прямую сумму инвариантных относительно ср попарно ортогональных подпространств: Lf> = Lip + ... + Ltp (8) 140
таких, что характеристический многочлен каждого из преобразований (fi = (p\Lt9 г Е 1,£, неприводим над Р. □ Докажем теорему индукцией по числу t сомножителей в разложении многочлена Хч>{х) на неприводимые множители над полем Р. Если t = 1, то доказывать нечего. Пусть t = fc > 1, и при £ < А; теорема верна. Выберем неприводимый делитель д(х) многочлена х<р(х)- Тогда по теореме 15.XV g(x)\mip(x), и по теореме 11.XV существует вектор а\ Е Ьр такой, что maii(p(x) = g(x). Пусть L\ = Lv(ai) — циклическое относительно ср подпространство, порожденное вектором ct\. Тогда Li инвариантно относительно <р, и по утверждению 22б).XV характеристический многочлен преобразования (pi = cp\L совпадает с д(х)у и потому неприводим над Р. Рассмотрим подпространство V = L± пространства Lp. По теореме 2 оно инвариантно относительно преобразования (р, причем у/ = ip\Lf — нормальное преобразование евклидова пространства (I/p, S"), где S' = = S\Lf. Так как L = L\ + L', то Хц>{х) — Хц>Ах) ' Х<р'{х)> и многочлен Хч>' (х) раскладывается над полем Р в произведение t — 1 < к неприводимых сомножителей. Если t = 2, то нужное разложение пространства Lp уже получено. Если же t — 1 > 1, то по предположению индукции пространство Lp раскладывается в прямую сумму инвариантных относительно <рг попарно £"-ортогональных подпространств: V = L>2 + . - - + Lt таких, что для каждого из преобразований срг = у/|Х$, г Е 2,t, многочлен X(pi(x) неприводим над Р. Остается заметить, что в таком случае справедливо равенство (8), и подпространства Li, г Е 1, t, удовлетворяют всем утверждениям теоремы 3. (Проверка этого предоставляется читателю.) □ Теперь описание общих свойств нормальных преобразований завершается следующим образом. Теорема 4. Пусть <р — нормальное преобразование евклидова пространства (L^^S) размерности п, и многочлен Xv(x) неприводим над полем Р. Тогда либо п — 1 и(р = г для некоторого г Е Р, либо Р = R, п = 2, и в любом ортонормированном базисе е = (е^ег) пространства матрица преобразования <р имеет вид: где b ^ 0 и а + Ы, а — Ы — корни многочлена Xv(x) в поле С. 141
□ Если п = 1, то утверждение очевидно. Если deg х<р(х) = п > 1> то многочлен Xv(x) неприводим над Р лишь в случае, когда Р = R и п = 2 (см. § б гл. IX). В этой ситуации пусть е = (ei, ег) — ортонормированный базис (Lr, 5) и Тогда Ag((p*) = Ag((p)T, и из условия нормальности (р следует равенство (а Ь \ ( а с \ ( а с \ / а с d )\Ь d )~\Ь d )\с которое влечет за собой равенства: (12) Из (11) следует, что Ь2 = с2, т. е. с 6 {6, —Ь}. При условии с = Ь из (10) следует, что Х^(ж) = ж2 — (а + d)# + ad — Ь2, и х^(х) имеет положительный дискриминант, что противоречит его неприводимости над R. Следовательно, с = —6, и так как 6^0 ввиду неприводимости х^^)) то из (12) следует, что а — d = d — а, т. е. а = d, и справедливо равенство (9). Тогда многочлен Xv?(x) имеет вид х^(х) = ^2 — 2аж + а2 + Ь2, и его корни в С суть а + Ы и а — Ы. □ Теоремаб. Пусть (р — линейное преобразование евклидова пространства (£р,£). Тогда справедливы утверждения: а) еа/ш многочлен Хч>{х) раскладывается над полем Р на линейные множители (в частности, если Р = С), то преобразование (р нормально тогда и только тогда, когда в Lp существует ортонормированный базис, состоящий из собственных векторов преобразования ср; б) если Р = Ш, то преобразование <р нормально тогда и только тогда, когда существует ортонормированный базис е пространства Ьш такой, что 6i^o, ie l,s, (13) 142
(при этом в (13) допускается отсутствие клеток первого порядка, т. е. равенство к = 0, или отсутствие клеток второго порядка, т. е. равенство 5 = 0). □ Если в некотором ортонормированном базисе е пространства Lp матрица Ag(cp) диагональна (т. е. выполнены условия пункта а)) или при условии Р = R имеет вид (13) (т. е. выполнены условия пункта б)), то, как легко проверить, матрица А$(ф) перестановочна с матрицей х = Ag((p*), и потому (р(р* = <р*<р, т. е. <р — нормальное преобразование. Наоборот, пусть ср — нормальное преобразование пространства (Lp, S). Тогда по теореме 3 существует разложение: LF = L1F + ... + Lm t>l, (14) в котором каждое подпространство Ьг инвариантно относительно <р, для (рг = <р | Ьг многочлен х<р%(х) неприводим над Р, и если t > 1, то подпространства Ьг и Ь3 при г Ф j ортогональны. При этом в силу теоремы 2 срг — нормальное преобразование евклидова пространства (1/гр,£г), где St = S | Ьг для г G 1, t. Выберем в каждом из подпространств LtF ортонормированный базис и обозначим через Аг матрицу преобразования <рг в этом базисе. Пусть е = (ei,..., еп) — система векторов L, составленная из выбранных базисов слагаемых Ьг в разложении (14). Тогда, очевидно, е — ортонормированный базис (1/р,5), и по теореме 13.XV: Ae(tp)=Dibg(Au...,At). (15) Остается заметить, что поскольку каждый из многочленов хлг(х) есть неприводимый над Р делитель х<р(х)> то справедливы следующие утверждения: а) если многочлен х<р(х) распадается над Р на линейные множители, то все матрицы Аг в (15) имеют размеры 1х1,т.е.* = п,ие- базис из собственных векторов преобразования <р; б) если Р = R, то по теореме 4 каждая матрица Аг имеет размеры 1x1 или 2x2, причем в последнем случае она имеет вид (9). Поэтому если дополнительно предположить, что слагаемые в (14) удовлетворяют условию dim Lip < dimI,2P < -- < dimLtp, то можно утверждать, что матрица (15) имеет вид (13). □ 143
Определеннее. Если ip — нормальное преобразование евклидова пространства (Lp, £) и е — такой ортонормированный базис Lp, что матрица А^{ф) диагональна или в случае IP = R имеет вид (13), то будем говорить, что е — геометрически нормальный базис преобразования <р, a Ag((p) — матрица в геометрически нормальной форме. Замечание 2. Геометрически нормальная форма матрицы нормального преобразования тесно связана с ее второй нормальной формой: если Аё(ф) — диагональная матрица, то это матрица во второй нормальной форме; если же Р = R и Ag((p) имеет вид (13), то вторая нормальная форма матрицы Ag(ip) имеет вид: / -a2s-b2s bs и N2(Ag((p)) = Ай((р), где U = (б1, . . . , ек, Ck+l, ^(^fc+l)) £H-3j ^(efc+з)? • • • j Доказательства этих утверждений предоставляются читателю. На практике, если характеристический многочлен нормального преобразования <р евклидова пространства (Lp, S) распадается над полем Р на линейные множители, то построение геометрически нормального базиса для Р основывается на следующих рассуждениях. Пусть г\,..., Tt € G Р — все различные собственные значения преобразования (р. Тогда Х<р(х) = (х ~ ri)ni ' • • • • (х — 7*t)nS и по теореме 5 а) верно равенство: Lp = Кет(<р — г{)П1 + ... + Ker(<£> — ft)nt - Пусть для j El,t JJ) JJ) Ul 5 ' • • 5 "fly — произвольный базис пространства Кег (^ — fj)nj. Если к этому базису применить процесс ортогонализации и пронормировать получившуюся систему векторов, то получится ортонормированный базис пространства Кег (ср — fj)nj: В таком случае система PW „(1) я(2) р^> pW есть базис Lp, состоящий из собственных векторов ^, причем это — ортонормированный базис, поскольку верна 144
Теоремаб. Собственные векторы нормального преобразования <р евклидова пространства (Lp, S), принадлежащие различным собственным значениям, ортогональны. □ Пусть ai,a2 £ £р\0 и (р(аг) = аггг для г Е 1,2, где ri,r2 Е Р и ri ^ Г2. Тогда по следствию теоремы 2 <£>*(а2) = ol^V2 и верны равенства: S((p(ai)9a2) = i),a2) = 5(ai,^*(a2)) = 5(а1,а2г2) = r25(ai,a2). Отсюда (n — r2)5(ai, a2) = 0 и 5(ai,a2) = 0. П § 3. Свойства самосопряженных преобразований Полное описание и простую геометрическую интерпретацию самосопряженных преобразований дает Теорема 7. Линейное преобразование <р евклидова пространства (Lp, 5) является самосопряженным тогда и только тогда, когда: а) в пространстве Lp существует ортонормированный базис е, состоящий из собственных векторов преобразования <р; б) все собственные значения преобразования <р — действительные числа. □ Пусть верны утверждения а) и б). Тогда Ag(cp) = diag(ri,..., rn), где ru...,rn E R, и потому Ag(<p) = diag(fb... ,rn) = Ag(<p), т. е. Ag{ip) — эрмитова матрица, и по следствию теоремы 1 <р — самосопряженное преобразование. Наоборот, пусть tp = <р*. Тогда <р — нормальное преобразование пространства (Lp,iS), и по теореме 5 в пространстве L для преобразования (р существует геометрически нормальный базис е. Матрица либо диагональна, либо имеет вид (13). Но последнее невозмож- р но, так как по следствию теоремы 1 А^{ир) = А$((р), а матрица вида (13) при 5^0 такому равенству не удовлетворяет. Следовательно, Ag((p) = diag(ri,..., rn), и для г Е 1, п выполняется условие гг = гг, т. е. гг G R. Таким образом, ср обладает свойствами а) и б). □ 145
Доказанная теорема дает следующую характеризацию самосопряженных преобразований в классе нормальных преобразований. Следствие!.. Линейное преобразование <р евклидова пространства (jLj», S) является самосопряженным тогда и только тогда, когда оно нормально, и все корни многочлена Х<р(х) в поле С являются действительными числами. □ Достаточно сравнить формулировки теоремы 7 и теоремы 5 а). □ Следствие 2. Любая эрмитова матрица А Е Рп,п подобна диагональной матрице D с действительными элементами, причем матрица Т £ 1Р^ п, удовлетворяющая равенству Т~гАТ = D, может быть выбрана унитарной, если Р = С, и ортогональной, если Р = R (т. е. если А — симметричная матрица над Ж). □ Рассмотрим евклидово пространство (Lp,S) с ортонормирован- ным базисом (iti,... ,ип) = йи зададим его линейное преобразование ср равенством Ац(ср) = А. Тогда по следствию теоремы 1 <р — самосопряженное преобразование, и по доказанной теореме в пространстве L существует ортонормированный базис е, состоящий из собственных векторов преобразования <р, причем А${(р) = D — диагональная матрица из Rn,n- Остается заметить, что если Г — матрица перехода от базиса п к базису е, то Т~гАТ = D, и при Р = Ш матрица Г ортогональна (см. утверждение 2.XVII), а при Р = С она унитарна (см. утверждение 4.XVII). □ Отметим, что способ построения матрицы Г в доказанном следствии по сути дела указан в конце § 2. § 4. Свойства изометрических преобразований В утверждении 1 уже показано, что изометрические преобразования евклидова пространства (Lp, S) могут быть охарактеризованы как линейные преобразования со свойством ip* = <р~г. Приведем еще две важных характеризации таких преобразований. Теорема 8. Для линейного преобразования ср евклидова пространства (Lp, S) следующие утверждения эквивалентны: а) (р — изометрия; 146
б) существует базис в\,..., еп пространства Lp такой, что S(<p(ei),ip{e3)) = S(elye3) для всех г, j £ 1,п; в)\/ае1:\\<р(а)\\ = \\а\\. Множество I(Lp, S) всех изометрических преобразований пространства (Lp, S) есть подгруппа группы £(£р)* всех его обратимых линейных преобразований. □ Импликация а) =Ф> б) следует непосредственно из определения 3. п Если выполнено б), то для любого вектора а = ^ егаг верны равен- г=1 ства Ыа)\\2 = г=1 j=l п п ^S{eue3) = S(a,a) = \\af. Следовательно, верна импликация б) => в). Докажем в)^а). Рассмотрим преобразование яр = ip*ocp. Нам достаточно доказать, что яр — 1 — тождественное преобразование. Заметим, что гр — самосопряженное преобразование, так как по утверждению 2 яр* = (<р*°<р)* = (р*оц>** = ср* о(р = яр. По теореме 7 а) в пространстве Lp существует базис е, состоящий из собственных векторов преобразования яр. Пусть яр(ег) = еггг, гг € Р для г G 1,п. Тогда ввиду утверждения в) для г £ 1, п имеем: S(et,et) = Я(^(е,),¥>(е.)) - £((<£>* о (^)(ег),ег) = 5(^(ег),ег) = гг5(ег,ег). Следовательно, г\ = ... = гп = 1 и ^С^) = -Е> т. е. ^ = i. Докажем последнее утверждение теоремы. Пусть <р,яр Е /(i^p, S). Тогда по доказанному выше для любого /3 Е L верно равенство 1 = ||/3||, и потому для любого а £ L верны равенства IK^"1 о || = ||^(а)|| = ||а||. Следовательно, (р~г о яр £ /(Lp,S) и I(L$>,S) — подгруппа в £(Lp)*. □ Полное описание и геометрическую интерпретацию изометрических преобразований дает Теорема 9. Линейное преобразование <р евклидова пространства (Lp, S) является изометрическим тогда и только тогда, когда либо 147
а) в пространстве Lp существует ортонормироваппый базис е такой, что Аё(ф) = diag(rb. • •, гп) (16) и выполняются условия П,...,гпеР, |тч| = 1 для1е 1,п; (17) либо б) Р = R и в пространстве Le существует ортонормированный базис е такой, что = тщ(гъ...,гк,( C0SWlSina;i V...,f coeW. rinW.\\ ( 6\ ' \ -smo;i coscji у у -sino;s coscjs yy v ' и выполняются условия: ri,... ,гл G {1, -1}, ал, ...,we G (0,2тг)\{тг} (19) этом, как и в теореме 56), возможны случаи к = 0 □ Если для у верно утверждение а) или утверждение б), то для со- ответствующего базиса ёГматрица Ag(cp*) = А^(ср) , очевидно, является обратной к матрице Ag(tp), и потому ф* = (р~г, т. е. (р — изометрия. Наоборот, пусть tp — изометрическое преобразование пространства (Lp, 5). Тогда (р — нормальное преобразование, и по теореме 5 для (р в пространстве ip существует геометрически нормальный базис е. Так как е — ортонормированный базис, то условие изометричности (р может быть записано равенством: Ag(ip) = Аёг(<р). (20) При этом по определению 6 возможна одна из следующих ситуаций. а) Матрица Ag(<p) имеет вид (16). В этом случае условие (20), очевидно, эквивалентно условию (17). б) Р = К, и матрица А$(ф) имеет вид (13). В этом случае условие (20) эквивалентно тому, что в (13) ri,..., г* Е {1,-1}, а каждая клетка a* bj \ / 1 удовлетворяет условию: -bj CLj J а? + Щ = 1. (21) 148
Последнее равносильно тому, что а3 = cosu3, Ь3 = sinu^ для подходящего си3 Е (0,2тг), при этом условие Ъ3 ф О из (13) эквивалентно условию U3 ф 7Г ИЗ (19). □ Следствие. Линейное преобразование (р евклидова пространства (Lp, S) является изометрическим тогда и только тогда, когда оно нормально, и все корни многочлена х<р(х) в поле С равны по модулю единице. □ Достаточно сравнить формулировки теорем 5 и 9 и заметить, что (а1 Ь7 равны по модулю единице тогда и только тогда, когда выполняется условие (21). □ Из теоремы 9 видно, что в евклидовом вещественном пространстве размерности 2 нетождественная изометрия при подходящем выборе декартовых координат сводится к симметрии относительно одной из координатных осей или к повороту векторов вокруг начала координат (см. пример 2). В пространствах больших размерностей изометрические преобразования "составляются" из указанных выше простейших преобразований при подходящем выборе осей (и плоскостей). Задачи 1. Докажите, что если tp — нормальное преобразование евклидова пространства (ip, S), то для любого многочлена f(x) E Р[ж] преобразование f((p) также нормально. 2. Докажите, что минимальный многочлен нормального преобразования не имеет кратных множителей в каноническом разложении. 3. Матрица А Е Рп,п называется нормальной, если А А — А А . Докажите, что две нормальные матрицы подобны тогда и только тогда, когда равны их характеристические многочлены. (Покажите, что многочлен тпа(х) не имеет кратных множителей в каноническом разложении и воспользуйтесь этим.) 4. Пусть характеристический многочлен нормального преобразования <р имеет вид х<р(х) = Ых) ' /2(я), где (f1(x)if2(x)) = e. Докажите, что подпространства Кег fi(<p) и Ker/2(v?) ортогональны. (Обратите внимание, что это утверждение есть обобщение теоремы 6.) 5. Пусть минимальный многочлен нормального преобразования (р евклидова пространства (Хр, S) имеет над Р каноническое разложение 149
mv(x) = 9i(x)' •-•' 9t(x). Докажите, что L = Kergi((p) + ... 4- Ker gt(<p) и слагаемые в этом разложении попарно ортогональны. 6. Пусть <р — линейное преобразование евклидова пространства (Lp, S) такое, что многочлен х<р(х) распадается над Р на линейные множители. Докажите, что если любое подпространство М пространства Lp, инвариантное относительно (р, инвариантно и относительно <£>*, то (р — нормальное преобразование. Обратите внимание на то, что это утверждение, обратное к теореме 2 (индукцией по п = dim Lp докажите, что в Lp существует ортонормированный базис, состоящий из собственных векторов преобразования ф). 7. Приведите пример, показывающий, что в условиях предыдущей задачи нельзя отказаться от того, что Р — поле разложения для х<р(х)* (Постройте линейное преобразование евклидова вещественного пространства размерности 2 с неприводимым характеристическим многочленом, у которого матрица в ортонормированном базисе не является нормальной.) 8. Докажите, что произвольное (не обязательно линейное) преобразование (р евклидова пространства (Lp, S) со свойством: Va,(3eL: S(<p(a),<p(J3)) = S(a,0) является изометрией (т. е. линейным преобразованием). (Покажите, что для любых а,/3 G 1ио ЕР верны равенства \\(р(аа) — (р(а)а\\ = 0 и 9. Докажите, что линейное преобразование <р евклидова пространства является нормальным тогда и только тогда, когда оно имеет вид <р — о-ф, где <т — изометрическое преобразование, а ф — перестановочное с а самосопряженное преобразование. 10. Докажите, что две симметричные матрицы А, В Е Кп?п подобны тогда и только тогда, когда они ортогонально подобны (т. е. существует ортогональная матрица Т е Rn,n такая, что Т~гАТ = В). 11. Докажите, что ортогональная матрица A G Мп,п подобна диагональной матрице над R тогда и только тогда, когда А симметрична. 12. Пусть ai,...,am и /?i,...,/?m — две системы векторов евклидова пространства (Lp,5). Докажите, что для существования изометрического преобразования (р этого пространства со свойством (р(аг) = = /?г, г £ 1,ш, необходимо и достаточно, чтобы были равны матрицы Грама Ts{ol\, ..., am) и Fsifiu • • • > An)- (Рассмотрите сначала случаи, 150
когда указанные системы: а) являются базисами Lp, б) линейно независимы.) 13. Пусть ai,..., an_i и /3i,..., /3n__i — ортонормированные системы векторов евклидова пространства (Lp, S) размерности п. Докажите, что существует ровно 2 изометрических преобразования ср со свойством (р(аг) = (Зи г £ 1,п — 1, и бесконечно много других линейных преобразований с этим свойством. 151
Глава XIX КВАДРАТИЧНЫЕ ФОРМЫ Здесь читатель познакомится с важным классом многочленов от п переменных и различными способами их преобразований. В частности, будут показаны приложения теории, развитой в двух предыдущих главах. Излагаемые ниже результаты обобщают и усиливают изложенные в курсе аналитической геометрии результаты о поверхностях и кривых второго порядка в декартовом пространстве. В этой главе изучаются квадратичные формы лишь над такими полями, в которых единица е удовлетворяет условию: е + е ф 0. (1) Таким образом, из рассмотрения исключается, например поле Р = Z2, но рассматриваются все поля вида Р = ZP, где р — нечетное простое, а также поля Q, Е, С. Далее условие (1) используется без дополнительных оговорок. 1. Общие свойства квадратичных форм. Канонический вид Понятие формы и, в частности, квадратичной формы от п переменных над полем Р уже известно читателю из гл. IX (определение 26). Мы дадим здесь несколько иное, более удобное для дальнейшего исследования, определение такой формы. Определение!. Квадратичной формой от п переменных #1,..., хп над полем Р называется любой многочлен f(x) £ Р[х\,..., хп] вида: f(x) = а\\х\ + ai2Xirr2 + - - - + ахпх\хп + a22^i + a2ix2xi + ... + аппх2п, где ctij Е Р для г, j G l,n. Коротко квадратичную форму f(x) записывают равенством: 152
3 а м е ч а н и е 1. Выражение (2) не является, вообще говоря, канонической записью многочлена f(x) в смысле определения 24.IX. Последняя при условии (2) имеет вид: г=1 1<г<3<п Кроме того, согласно приведенному определению, нулевой многочлен является квадратичной формой. Только в этом и состоит отличие определения 1 от определения 26.IX. С квадратичными формами от двух и трех переменных читатель встречался в курсе аналитической геометрии, где было доказано, что уравнение любой кривой (поверхности) второго порядка на плоскости (в пространстве) в случае, если она имеет хотя бы один центр, может быть после параллельного переноса координатных осей записано в виде f{x\,X2) = с (соответственно /(rci,a?2i#3) = с), где / — квадратичная форма над R. Определение2. Матрицей квадратичной формы (2) называется п х n-матрица Bf = (Ьгз)пХп над полем Р, элементы которой определяются равенствами: К = (2е) 1{агз +оД ij e 1,п, (3) (определение корректно ввиду условия (1)). Нетрудно заметить, что В/ — симметричная матрица над Р и наряду с (2) справедливо равенство: /(Ж1, . . . ,Хп) = которое можно записать в векторной форме f(x) = xBfxl, где х = (жь... ,жп), х1 = хТ. (5) Отметим, что согласно замечанию 1 при условиях (3), (4) каноническая запись квадратичной формы f(x) имеет вид: 1<г<э<п Ъ£1~п 1<г<э<п (6) 153
Из введенных определений и равенства (6) легко следует Утверждение!.. Квадратичные формы f{x\,..., хп) и д{х\,... ..., хп) над Р равны тогда и только тогда, когда равны их матрицы. Для любой симметричной матрицы В € Рп,п многочлен /(rci,... ..., хп) = хВх^ есть квадратичная форма, причем В/ = В. □ Доказательство сводится к сравнению канонических записей многочленов f(x) и g(x), выраженных через коэффициенты соответствующих матриц. Выкладки предоставляются читателю. □ Таким образом, существует взаимно однозначное соответствие / —► В/ между множеством всех квадратичных форм / из Р[х\,..., хп] и множеством всех симметричных матриц В € Рп,п- Определение 3. Говорят, что квадратичная форма д(у) = — я{У1-> • • • >2/п) получается из квадратичной формы f(x) невырожденным {линейным) преобразованием переменных, если существует невырожденная матрица С € Рщп такая, что после замены в форме f(x) переменных х±,..., хп по формуле: х1 = Су1 (7) выполняется равенство: i,... ,уп),.. .,хп(уи • - .,уп)) = 9(Уи - • • ,2/п). (8) В этом случае говорят также, что форма д(у) получается из f(x) невырожденной заменой переменных (7). Утверждение 2. При условии (7) равенство (8) выполняется тогда и только тогда, когда Bg = CTBfC. (9) □ Пользуясь векторной записью формы д(у) и равенством (7), получаем /On(у),..., хп{у)) = {уСТ) Bf{Cy^) = y(CTBfC) yi, причем матрица CTBfC симметрична. Отсюда и из утверждения 1 следует, что при условии (8) выполняется (9). Обратное утверждение теперь очевидно. □ Определение! Говорят, что квадратичная форма f(x\,..., хп) эквивалентна квадратичной форме g(yi,..., уп), и пишут f(x) ~ д(у), 154
если f(x) переводится в д(у) некоторым невырожденным линейным преобразованием переменных. УтверждениеЗ. Отношение эквивалентности квадратичных форм рефлексивно, симметрично и транзитивно. □ Симметричность отношения ~ следует из того, что равенство (9) ввиду обратимости матрицы С влечет за собой равенство Bf = HP = (С"1) BgC~1^ и потому в силу утверждения 2 из / ~ g следует g ~ /. Доказательство остальных свойств предоставляется читателю. □ Определениеб. Рангом квадратичной формы f(x) называется ранг ее матрицы Bf. Его обозначают символом rang/. Утверждение^ Если квадратичные формы f(x) и д(у) над полем Р эквивалентны, то их ранги равны. □ Достаточно воспользоваться равенством (9) и условием \С\ ^ 0. □ Далее читатель увидит, что обращение утверждения 4 верно не всегда, например, оно верно, если Р = С, и не верно, если Р = R. Замечание 2. Квадратичная форма f(xi,...,xn) может не зависеть (зависеть лишь формально) от некоторого переменного xs из Ж1,...,жп, т. е. ее каноническая запись (6) в виде многочлена может удовлетворять условиям: bss = 0, 2bis = 2bsj = 0 для г £ 1, s - 1, j € s + 1, п. Это ввиду равенств bis = bSi, г G 1,п, и условия (1) эквивалентно равенствам fese = biS = 0, г G 1,п, т. е. эквивалентно тому, что в матрице Bf 5-я строка и 5-й столбец — нулевые. Наоборот, если т > п, то квадратичную форму f(xi,...,xn) можно считать (формально) формой от т переменных xi,..., жп,..., жт, рассматривая вместо нее форму /(rci,..., хп,..., хт) = f(xu ..., хп) + 0:4+1 + ... + 0а4, т. е. приписывая к матрице Bf т — п нулевых строк и столбцов. Используя это обстоятельство, мы будем в дальнейшем говорить об эквивалентности квадратичных форм f(x\,..., хп) и g{yi,..., ут) и в случае, когда п < т, имея в виду эквивалентность формы g(yi,..., ут) и указанной выше формы /(xi,..., хп,..., хт). П р и м е р 1. Форма д{у\,У2) = у\ + 2у\уъ + у\ над R эквивалентна форме f{x\) = #i, поскольку невырожденная замена переменных / У1 \ ( 1 -1 \ / XI \ I ) ~ \ п 1/1 ) ПРИВ°ДИТ к равенствам: У2) = Ы - х2)2 + 2(хг - х2)х2 + xl 155
Наоборот, для того чтобы получить из формы f(x\) форму д{ух,У2)-> надо записать f{x\) в виде f{x\) = х\ + 0х% (уравнять число переменных) и произвести обратную невырожденную (!) замену ( I = Определеннее. Квадратичная форма /(#i,..., хп) над полем Р называется канонической, если она имеет вид: 1, . . . , Хп) = (т. е. если Bj — диагональная матрица). Таким образом, каноническая форма f(x) — это такая квадратичная форма, для которой стандартная запись в виде (4) совпадает с ее канонической записью (6) как многочлена над Р. Следующий фундаментальный результат обобщает известные из курса аналитической геометрии утверждения о возможности приведения центральной кривой или поверхности второго порядка к "главным осям". Теорема 1. Любая квадратичная форма f(x\,..., хп) над полем Р (в котором 2е ф 0) эквивалентна некоторой канонической квадратичной форме. □ Индукция по п. При п — 1 сама форма / является канонической. Пусть т > 2, и теорема верна для всех квадратичных форм от п < т переменных. Рассмотрим случай, когда п = т. Если /(rci,..., хп) — нулевой многочлен, т. е. в (4) все коэффициенты Ьгз равны нулю (см. замечание 1), то / = 0х\ + .. . + 0ж^ — каноническая форма. Допустим теперь, что f(xi<...,xn) ф 0. Тогда возможны две ситуации. 1. В равенстве (4) Ьъг ф 0 для некоторого г Е 1,п. Предположим, что 6ц ф 0 (случай, когда 6ц = 0 и Ьгг ф 0 для г > 1 рассматривается аналогично). Выделим в форме / все слагаемые, содержащие переменное х\: очевидно, что, пользуясь равенствами Ь\г = Ьг\ для г Е 1,п, ее можно записать в виде: u • - -, хп) = bnxj + 26i2#ix2 + ... + 2blnx1xn + h{x2,..., xn), где fi(x2,...,xn) — квадратичная форма от переменных х2,...,хп. Теперь нетрудно увидеть, что верно равенство: ,... >хп) = £-(6iia?i + b12x2 + ... + ЪХпхп)2 + /2(я?2, • • • ,яп), (Ю) 156
где , • •., хп) = /х(ж2,..., хп) - — (Ь12х2 + ... + Ьыхп)2 011 — квадратичная форма от х2,. • • >хп. Рассмотрим квадратичную форму: д(уи - • •, Уп) = т—Уг + /2(2/2, • ., уп). 0ц (11) Ввиду равенства (10) форма р эквивалентна форме /, так как переводится в нее невырожденной заменой переменных: у1 = 6ц &12 О е о о (12) Так как /2(2/2? • - •, Уп) — форма от п — 1 < т переменных, то по предположению индукции существует невырожденная замена переменных: переводящая форму /г в некоторую каноническую форму: Отсюда и из равенства (11) следует, что форма д переводится невырожденной заменой переменных Уг \ Уп в каноническую форму: ( е 0 ... О О а О 21 Oil (13) 157
Остается заметить, что так как форма д переводится в форму / заменой (12), то / переводится в д заменой ж* = С~гу^ и переводится в каноническую форму (13) невырожденной линейной заменой переменных X* = ( е 0 ... О О а zK 2. В равенстве (4) Ьъг = О для всех г € 1,п. Тогда форму / можно записать в виде /(#i,... ,хп) = 5Z 2Ъгэхгх3, и поскольку / ф О, то 1<г<3<п в этом представлении хотя бы один из коэффициентов Ъъз (г < j) отличен от нуля. Для упрощения выкладок допустим, что Ь\2 ф 0 (остальные случаи рассматриваются аналогично). Тогда, как нетрудно видеть, невырожденная замена переменных xi=yi+ J/2, х2 = У1- У2, хг =уг, г € 3, п, переводит форму / в форму д(у) = 2Ь12у\ - 2Ьу2у\ + Y, 2Ъ'гзугу3. 1<г<з<п Ввиду условия bi2 ф 0 форма д удовлетворяет условиям пункта 1 и, как там показано, эквивалентна некоторой канонической форме. Следовательно, той лее форме эквивалентна и исходная форма /. □ ЗамечаниеЗ. Для квадратичных форм над полем Р, в котором 2е = 0, понятие эквивалентности вводится аналогично с помощью определений 3 и 4. Однако для таких форм уже нельзя ввести запись вида (5) с симметричной матрицей В/, и для них не верна теорема 1. Например, форма f(xi,X2) = х\ • Х2 над полем Р = Ъъ не эквивалентна никакой канонической форме в смысле определения 6. (Покажите!) Более того, любая такая каноническая квадратичная форма f(x) = Ь\х\ +... + bnx^l над Z2 эквивалентна форме у\ь поскольку f(x) = (Ъ\Х\ + ... + Ъпхп)2. В связи с этим для квадратичных форм над указанными полями понятие канонической формы вводится иначе, более сложно. Например, имеет место Теорема (Диксон 19). Любая квадратичная форма f(x\,..., хп) над полем Ъ%, отличная от нуля (как многочлен), эквивалентна одной 19 А. Л. Диксон — английский математик (1867—1955). 158
и только одной из следующих форм: 2/12/2 + 2/32/4 + ... + 2/2fc-i2/2fc, 2A: < п, 2/12/2 + 2/32/4 + •. • + У2к-\У2к + 2/2Л+И 2fc + 1 < п, 2/12/2 + 2/32/4 + ... + У2к-\У2к + Уг+ у\, 2fc < п. Доказательство этой теоремы выходит за рамки нашего курса. § 2. Квадратичные формы над полями действительных и комплексных чисел 1. Над полями Ш и С любая квадратичная форма эквивалентна форме, еще более простой, чем каноническая. Теорема 2. а) Любая ненулевая квадратичная форма f(xi,..., хп) над полем С эквивалентна форме вида h(zu...,zn) = zf + ... + z*. (14) При этом г = rang/. б) Любая ненулевая квадратичная форма /(a?i,... ,xn) w«(? полем Ш эквивалентна форме вида = z\ + ... + zl - zl+1 - ... - z%+q. (15) этом p + q = rang/ г/ в (15) могут отсутствовать слагаемые со знаком плюс (р = 0) или минус (q = 0). □ В силу теоремы 1 форма f(x) эквивалентна канонической форме: д(уи. • - ,Уп) = div? +. ■ - + с2пУп5 (16) где коэффициенты di лежат соответственно в С или в Е. Если rang/ = г, то по утверждению 4 rangp = г и в (16) имеется ровно г коэффициентов с^, отличных от нуля. Перенумеровывая, если надо, переменные г/i,..., уп (что является невырожденной линейной 159
заменой переменных) молено добиться выполнения соотношений: rfi ф О,... ,dr ф О, dr+i = ... = dn = 0. В случае а) в поле С существуют элементы ci,..., сг такие, что с? = = dj, i G ТУТ. Тогда невырожденная замена переменных 11 ,_ 2/1 = —21, . . . , Уг = — 2г, Уг+1 = 2г+1, • • • , Уп = Zn, (17) сг сг очевидно, переводит форму (16) в форму (14). В случае б), перенумеровывая, если надо, переменные j/i,..-jj/n5 можно добиться того, что в (16) rfi >0,...,dp >0, dp+i <0,...,dp+q <0, dp+g+i =... = 6^ = 0, где р, § G No, p + 9 = г. В поле R молено выбрать элементы ci,..., сг, удовлетворяющие условиям: с? = db ..., Ср = dp, с^+1 = -dp+i,...,Ср+9 = -dp+q. Тогда замена переменных по формуле (17) переводит форму (16) в форму (15). □ Следствие. Квадратичные формы над полем С эквивалентны тогда и только тогда, когда их ранги равны. Определение 7. Квадратичные формы (14) и (15) называются нормальными квадратичными формами соответственно над полями комплексных и действительных чисел. 2. Из теоремы 2 а) следует, что любая квадратичная форма над С эквивалентна единственной (с точностью до обозначения переменных) нормальной квадратичной форме (определяемой параметром rang/). Аналогичное утверждение верно и для квадратичных форм над R. ТеоремаЗ (закон инерции Сильвестра). Если квадратичная форма f(x) G R[#i,... ,хп] эквивалентна двум нормальным формам: ■ - - ,tfo) = У? + • • - + i£ - 2/^+1 ----- Уз+t и h(zi,..., zn) = zx + ... + zp — zp+1 то справедливы равенства р = s, q = t. 160
□ Поскольку по теореме 2 б) s + t = rang / = р + q, то достаточно доказать, что s = р. Предположим, что s Ф р и для определенности 5 >р. Согласно утверждению 3 формы ри/i эквивалентны. Пусть форма д переводится в форму h невырожденной линейной заменой переменных у^ = Cz^. Тогда по утверждению 2 Bh = СтВдС. (18) Рассмотрим векторное пространство jLr с базисом (ei,...,en) = e и зададим на нем симметричную билинейную функцию Ф, определив ее матрицу Грама равенством: Гф(е) = Вд = Diag(£5, -#t, О), (19) где Ек — единичная к х fc-матрица. Заметим, что система векторов и = = (г/i,... ,ип) = ёС также есть базис jLr и в силу леммы 2.XVII и равенств (18) и (19) ее матрица Грама относительно функции Ф имеет вид: ТФ(и) = СтГФ(е)С = СтВдС = Bh = Diag(£7p, -Eq, О). (20) Рассмотрим в Xr подпространства i^f = (ei,..., ев)к и М = (г*р+ь • • - , ^п)м- Так как $ > р, то верны соотношения: dim(KnM) = dimii: + dimM-dim(i(r + M) > 5 + (n-p)~n = s-p > 0. Следовательно, в пространстве КпМ содержится ненулевой вектор а. Но тогда, с одной стороны, так как a G К, то координаты а в базисе е?имеют вид а*$ = (ai,...,ав,0,...,0) ^ б, и в силу (19) Ф(а, а) = агГФ(е)(4 = о? + ... + а* > 0. (21) С другой стороны, так как а е М, то 5ц = (0,..., 0, Ьр+1> • • • > &п), и в силу (20) Ф(а, а) = ЙвГФ(а)4 = -Ь*+1 - ... - b2p+q < 0. (22) Противоречивость неравенств (21) и (22) доказывает невозможность условия s Ф р. □ 161
Теперь корректно Определеннее. Положительным и отрицательным индексами инерции квадратичной формы / над полем R называются соответственно число р слагаемых с коэффициентом +1 и число q слагаемых с коэффициентом —1 в нормальной квадратичной форме (15), эквивалентной /. Следствие. Квадратичные формы над полем R эквивалентны тогда и только тогда, когда совпадают их положительные и отрицательные индексы инерции. 3. Как видно из доказательства теоремы 3, свойства квадратичных форм тесно связаны со свойствами симметричных билинейных функций. Определение 9. Говорят, что квадратичная форма f{x\,..., хп) над полем Р и симметричная билинейная функция Ф на векторном пространстве Lp размерности п ассоциированы, если для некоторого базиса (ei,..., еп) = е пространства Lp выполняется равенство Гф(ё) = Bf\ говорят также, что / и Ф ассоциированы в базисе е пространства Lp. Определение 10. Квадратичная форма f(x\,..., хп) над полем действительных чисел R называется положительно определенной, если для любого ненулевого вектора а = (ai,..., ап) над R значение формы / на векторе а, определяемое равенством /(а) = аВ/а^, положительно. Утверждение 5. Для квадратичной формы /(sci,..., хп) над полем R следующие утверждения равносильны: а) форма f положительно определена; б) ассоциированная с f симметричная билинейная функция Ф на пространстве Lu размерности п есть скалярное произведение; в) положительный индекс инерции формы f равен п. □ Эквивалентность утверждений а) и б) доказывается следующим образом. Пусть / и Ф ассоциированы в базисе е = (ei,..., еп) пространства jLr. Тогда для любого вектора a G Z/r верны равенства: Ф(а,а) = ЗёГФ(ё)а1 = а?В fal = f(Sg), и поскольку {а$: a G L} — Rn, то положительная определенность формы / эквивалентна условию: VaeL\6: Ф(а,а) > 0. Доказательство эквивалентности утверждений б) и в) основано на том, что условие а) равносильно положительной определенности нормальной 162
квадратичной формы (15), эквивалентной форме /. Дальнейшая его детализация предоставляется читателю. □ Теорема4 (Сильвестр). Квадратичная форма /(#i,..., хп) над полем R положительно определена тогда и только тогда, когда все главные угловые миноры ее матрицы В/ положительны. □ Достаточно воспользоваться эквивалентностью утверждений 5 а), 56) и теоремой 6.XVII. □ 4. Как уже было отмечено, теорема 1 переносит результаты, полученные в курсе аналитической геометрии для квадратичных форм от 2-х и 3-х переменных над полем R, на квадратичные формы от п переменных над произвольным полем со свойством (1). Однако в аналитической геометрии были получены результаты более сильные, чем в теореме 1. А именно: там было доказано, что квадратичная форма от 2-х или 3-х переменных может быть переведена в каноническую не просто некоторой невырожденной линейной заменой переменных, а такой заменой, которая соответствует повороту плоскости или пространства (т. е. ортогональному преобразованию). Следующая теорема дает аналогичное усиление результатов теоремы 1 для квадратичных форм от произвольного числа п переменных над R. Определение 11. Назовем квадратичные формы /(хъ..., хп) и g(yi,... ,Уп) над R ортогонально эквивалентными, если существует ортогональная матрица С £ Rn,n такая, что замена переменных х^ = = Су*- переводит форму / в форму д. Теорема 5. Любая квадратичная форма /(xi,..., хп) над R ортогонально эквивалентна некоторой канонической квадратичной форме. □ Так как В/ — симметричная матрица над R, то по следствию 2 теоремы 7.XV существует ортогональная матрица С Е Rn,n такая, что Так как С~г = Ст, то отсюда ввиду утверждения 2 следует, что замена переменных х^ = Су^ переводит форму / в каноническую форму 9(Уи • • •,Уп) = nyl + ... + rny2. □ Этот результат позволяет доказать следующее важное при решении некоторых прикладных задач утверждение Теорема6(о паре форм). Если f(x\,..., хп) и д{х\,..., хп) — квадратичные формы над R, причем f положительно определена, то существует невырожденная линейная замена переменных, переводящая одновременно f в нормальную, a g — в каноническую форму. 163
□ По теореме 2 б) существует невырожденная замена переменных x^ = UyK (23) переводящая / в нормальную форму /i(y), которая по утверждению 5 имеет вид fi(y) = yj + ... + у%- Та же замена (23) переводит форму д{х) в некоторую квадратичную форму дг(у). По теореме 5 существует ортогональная матрица С £ Rn,n такая, что замена у1 = Czl (24) переводит д\ (у) в каноническую форму. Но замена (24) переводит форму fi(y) также в нормальную форму /г (г) = z% + ... + z%, так как в силу ортогональности матрицы С: Bh = CTBhC = СТЕС = СТС = Е. Таким образом, замена х^ = UCz^ переводит форму / в нормальную, а форму д — в каноническую. □ Задачи 1. Докажите, что квадратичные формы /(#1,...,хп) и д{у\^..., уп) над полем Р эквивалентны тогда и только тогда, когда на векторном пространстве Lp размерности п существует симметричная билинейная функция Ф, ассоциированная с f(x) и с д(у). 2. Покажите, что для квадратичной формы /(xi,.. .,хп) над Р и симметричной билинейной функции Ф на пространстве Lp с базисом е = (ei,..., еп) следующие утверждения эквивалентны: а) f(x) и Ф ассоциированы в базисе е\ б) Va,/3 G LP: Ф(а,/?) = ±(f(3e + fe) - f{ae) - /(Д,)); в) VaeLp: Ф(а,а) = /(а^). 3. Подсчитайте число классов эквивалентных квадратичных форм от п переменных над полями СиМ (сначала подсчитайте число классов форм данного ранга г € 0, п). 4. Квадратичная форма /(#ъ..., хп) над Е называется отрицательно определенной, если для любого a € Мп\0 справедливо неравенство /(а) < 0. Докажите, что для /(xi,..., хп) следующие утверждения эквивалентны: 164
а) / отрицательно определена; б) отрицательный индекс инерции / равен п; в) в матрице Bf все главные угловые миноры нечетного порядка — отрицательны, а четного порядка — положительны. 5. Докажите, что квадратичные формы /(ал,..., хп) и д(уи • • •»Уп) над Е ортогонально эквивалентны тогда и только тогда, когда \Bf (х) = = Хвд(х). 6. Докажите, что ортогонально эквивалентная квадратичной форме /(#i,..., жп) над К каноническая квадратичная форма г\у\ +... + гп?/2 определена однозначно, с точностью до перестановки коэффициентов 7*1,..., Гп. 7. Пусть Р — поле из q элементов, 2 { q, и а; — циклический образующий группы Р*. Докажите, что любая квадратичная форма f{x\,..., хп) над Р эквивалентна канонической форме вида: и, 5, г g о~п, 5 + г < п. Выведите отсюда верхнюю оценку числа классов эквивалентных квадратичных форм в P[xi,..., хп]. 8. Докажите, что над полем Z3 форма f(x) ~ x\ + x\ эквивалентна форме 2у\ + 2у| (этот пример доказывает, что в условиях предыдущей задачи параметры s и t в форме р(у), эквивалентной /(х), определены неоднозначно). 9. В условиях задачи 7 докажите, что форма f(x) = х\ + х% не эквивалентна форме д(у) = у? +CJJ/2- (Предположив, что f(x) переводится в д{у) невырожденной заменой х^ = I , 1 у^, покажите, что выполняется одно из противоречивых соотношений: иа = d2, где а ф 0 или с<; = Ь2.) 10. Квадратичная форма /(rci,..., хп) над полем Р называется падающейся, если она представима в виде произведения двух линейных форм: f(x) = {aixi + ... + апжп) • (6io:i + ... + bnxn). 165
Докажите, что: а) если форма / распадается, то rang/ < 2; б) форма / над полем С распадается тогда и только тогда, когда rang/ < 2; в) форма / над полем R распадается тогда и только тогда, когда либо rang/ < 1, либо rang/ = 2 и положительный индекс инерции / равен отрицательному индексу инерции (т. е. / ~ у\ — у%). 166
Глава XX ЭЛЕМЕНТЫ ТЕОРИИ КОЛЕЦ В предыдущих главах довольно подробно были изучены: кольцо целых чисел, кольца вычетов, кольца матриц и кольца многочленов. В этой главе будут изложены основы общей теории колец. § 1. Подкольца и операции над ними Аналогом понятия подгруппы в группе является понятие подкольца в кольце. Напомним (см. определение 19.111), что непустое подмножество S кольца R называют подкольцом, если оно замкнуто относительно операций сложения и умножения, заданных на Д, и само является кольцом относительно этих операций (обозначение: S < (Д, +,•)> или S<R). С примерами подколец читатель уже неоднократно встречался. Заметим, что во всяком кольце Д, отличном от нуля, имеется, по крайней мере, два подкольца — нулевое и само кольцо R. Эти подкольца называют несобственными, а все остальные подкольца кольца R называют собственными. Для того чтобы, пользуясь определением, узнать, является ли данное подмножество S кольца R подкольцом, нужно проверить для S условие замкнутости относительно операций сложения и умножения и все аксиомы кольца. В действительности, проверка того, что S является подкольцом, более проста. Утверждение!.. Непустое подмножество S кольца R является подкольцом тогда и только тогда, когда выполнены условия: 2€S(sls2eS), Vsi,52 €S(ss gS) т. е. когда S — подгруппа группы (R, +) и подполугруппа полугруппы (Я, •). □ Если S — подкольцо кольца Д, то по определению кольца выполнены условия (1). 167
Обратно, пусть S Ф 0 и выполнены условия (1). В силу первого из них S — подгруппа группы (Д, +) (см. утверждение 4.XI) и, в частности, множество S замкнуто относительно операции сложения. Второе из условий (1) означает замкнутость S относительно операции умнолсения. В силу определения 1.Х5 — подполугруппа полугруппы (Л, •). Так как в кольце R справедливы законы дистрибутивности умножения относительно сложения, то эти законы выполнены и в S. Значит, (£, +, •) — кольцо. □ П р и м е р 1. Опишем все подкольца кольца Z. Ввиду результатов § 3.XI все подгруппы группы (Z, +) исчерпываются множествами raZ, т G No. Так как каждое из этих множеств удовлетворяет условиям (1), то это — все подкольца кольца Z. Если R — конечное кольцо, то проверку того, является ли его подмножество подкольцом, молено еще упростить. Утверждение 2. Непустое подмножество S конечного кольца R является подкольцом тогда и только тогда, когда S замкнуто относительно операций сложения и умножения, заданных на R. □ Условие V 51,52 € S(S!+S2 £ S) в силу конечности группы (Д, +) равносильно тому, что S — ее подгруппа (см. следствие утверлсдения 4.XI). Остается применить утверждение 1. □ Для подколец, так же как и для подгрупп, имеет место следующее утверлсдение (докажите его в качестве упражнения). Утверждение 3. Если S — подкольцо кольца R, а Т — подкольцо кольца S, то Т — подкольцо кольца R, га. е. отношение "быть подкольцом" транзитивно на любом множестве колец. Если S — подкольцо кольца Д, то нулевые элементы Os и Оя этих колец совпадают (как нейтральные элементы группы (i?, +) и ее подгруппы (S, +)). Вопрос же о единице подкольца S кольца Д с единицей ед решается не однозначно. А именно, 5 может не иметь единицы, может иметь единицу es = ед и может иметь единицу е# ф е#. П р и м е р 2. Указанные выше три ситуации осуществляются, например для кольца матриц К2,2 и его подколец: 168
Рассмотрим случай, когда J? — кольцо без делителей нуля. Утверждение 4. Если R — кольцо без делителей пуля с единицей ел и S — его ненулевое подкольцо с единицей es, тпо es — ед. □ Так как ед — единица кольца R и es G R, то е^ед = es- Поскольку es — единица кольца £, то eses = es- Тогда eseR = eses и es{eR — es) = = 0. Так как es ф 0 и в R нет делителей нуля, то es = ед. □ Как было замечено в § З.Ш, кольцо, не имеющее делителей нуля, может не содержать единицу (например, таковым является кольцо 2Z). Если же R — конечное кольцо, то наличие хотя бы одного ненулевого элемента, не являющегося делителем нуля, обеспечивает существование в R единицы. Утверждение 5. Пусть R — конечное кольцо, содержащее элемент а ф 0, не являющийся делителем нуля. Тогда R — кольцо с единицей, и любой элемент из R\{Q), не являющийся делителем нуля, обратим. □ Если с, Ь G Ли са = Ьа, то (с — Ь)а = 0 и с = Ь, так как элемент а не является делителем нуля. Значит, все элементы из Ra = {га \ г € R} различны. Тогда \Ra\ = \R\, и ввиду конечности множества R имеем Да — R. Аналогично показываем, что aR = R. Из равенства Ra = R следует, что существует такой элемент е± Е R, что е\а — а. Пусть Ь — произвольный элемент кольца R. Обозначим с = Ъе\. Тогда са = Ье\а = Ьа и, следовательно, с = Ь. Таким образом, Ъе\ = b для любого элемента Ь Е R. Аналогично, из равенства aR = R выводим существование такого элемента е% G Д, что еф — Ь для любого элемента b G R. Тогда е\ = = e2ei = в2 и R — кольцо с единицей е = в\ — в2- Для любого элемента d G Л\{0}, не являющегося делителем нуля, как и выше, показываем, что dR = Rd = R. По утверждению 6.Ш тогда d G R*. □ Следствие. Конечное ненулевое коммутативное кольцо R является полем тогда и только тогда, когда в R нет делителей нуля. 169
Рассмотрим некоторые операции над подкольцами данного кольца. Так как подкольца Аи В кольца R являются, в частности, подгруппами абелевой группы (J?, +), то их сумма А + В = {a + b\ a e A, b E В} есть подгруппа группы (i?, +). Однако эта сумма может не быть подкольцом. Пример 3. В кольце матриц Рг,2 над полем Р рассмотрим подкольца: Множество А+В = < I 1 > не замкнуто относительно умножения: и , п ( 0 0\ / О Ь \ при условии ао ф 0 справедливо соотношение I n ) I n П / = = ( h ) ^ ^ ~*~ ^' ^начит' А + В — пе подкольцо кольца Рг,2- § б В § 3 будут указаны условия, при которых сумма подколец является подкольцом. Рассмотрим теперь пересечение подколец данного кольца. Утверждение 6. Если {Sa \a G Л} — произвольное семейство подколец кольца R, то Т — f] Sa — подкольцо кольца R. □ Утверждение 6 является следствием утверждения 1. □ Утверждение б показывает, что корректно Определение!. Пусть S — подмножество кольца R. Подкольцом кольца Я, порожденным подмножеством 5, называют пересечение всех подколец кольца i?, содержащих S ( обозначение: [£]#). По аналогии с соответствующими утверждениями для подполугрупп и подгрупп (см., например, теорему 3.XI) докажем Утверждение?. Если S — непустое подмножество кольца R, то [S]r есть множество всех элементов кольца R, имеющих вид: п г = Л а*5^ • • • 5*г*> где n G N, аг G Z, А;г G N, stt E S. (2) □ Обозначим через Т множество всех элементов кольца Д, имеющих вид (2). Так как [S]r — подкольцо кольца Л, содержащее S, то [S] r D Т. Поскольку разность и произведение любых двух элементов из Г являются элементами из Г, то по утверждению IT — подкольцо кольца 170
R. Ясно, что Т D S. Тогда по определению 1 Т D [S]r и, стало быть, T = [S)R.n П р и м е р 4. Если а Е Д, то [а] — множество всех элементов вида: ... + спап, п Е N, QGZ. § 2. Характеристика кольца Введем для колец понятие, тесно связанное с понятием экспоненты группы. Определение2. Характеристикой кольца R называют такое наименьшее t £ N, что если такие числа t существуют. В противном случае говорят, что кольцо R имеет пулевую характеристику. Пишут: Char R = t, Char R = 0. Ясно, что если exp(i?, +) < оо, то характеристика кольца совпадает с экспонентой группы (Д, +) (см. определение 5.XI). П р и м е р 5. CharZ = 0; CharZ/n = n. Если г £ R, то через ord r будем обозначать порядок г как элемента группы (Д, +) (аддитивный порядок элемента г). Утверждение 8. Пусть R — кольцо с единицей е. Тогда Chari? = orde, если orde < оо, и ChariZ = 0, если orde = оо. Если, кроме того, R — кольцо без делителей нуля, то либо Char R = 0, либо CharjR — простое число. □ Для любых t € N и г Е R имеем tr = t(er) — (te)r. Поэтому если ord e = t € N, то tr = 0 для любого г G Л и, следовательно, Char R <t. Кроме того, ord e < Char R. Значит, Char R = t. Если же orde = оо, то ясно, что Char Л = 0. Пусть теперь в R нет делителей нуля. Если Chari? = 0, то доказывать нечего. Пусть Char Л = п Е N. Если п = П1П2, где щ Е N, 1 < щ < п, то справедливы равенства пе = (niri2)e = (n\e)(ri2e). Так как Chari? = orde = п, то п\е Ф 0, пге ф 0, и условие пе = 0 противоречит тому, что в R нет делителей нуля. Значит, Char Л — простое число. □ Следствие. Если R — кольцо с единицей и без делителей нуля, a S — его подкольцо с единицей, то Char R = Char S. 171
□ По утверждению 4 es = е#. Остается применить утверждение 8. □ Формула разложения бинома (а + Ъ)п верна для элементов любого коммутативного кольца. Для колец простой характеристики при некоторых показателях п она приобретает особенно простой вид. Утверждение 9. Если R — коммутативное кольцо и Char R = p — простое число, то для любых элементов а,Ь £ R и любого t G N справедливо равенство: □ По аналогии с доказательством теоремы З.П можно доказать формулу разложения бинома: г=0 Коэффициент С1 = — ~—t% является целым числом. При И г! 1 < г < р имеем (р,г) = 1. Тоща по свойству взаимно простых чисел (р, г!) = 1 и из равенства г! Сгр = р(р — 1)... (р — г + 1) получаем р \ С^, т. е. Ср = риъ для некоторого иг Е N. Так как Char Л = р, то при 1 < г < р имеем Српр~гЬг = риъар~гЬг — 0. Стало быть, (а + Ь)р = ар + №. При t > 1 утверждение доказывается t — 1-кратным возведением последнего равенства в степень р. □ § 3. Идеалы и операции над ними Среди подколец кольца особую роль играют подкольца, называемые идеалами. ОпределениеЗ. Идеалом кольца R называют любое его подкольцо J, удовлетворяющее условию: \fiel, Vr£R(ireI, ri€l), (3) т. е. выдерживающее умножение на элементы кольца R (обозначение: J<(jR,+,«), или I<R). 172
Понятие идеала кольца есть аналог понятия нормального делителя группы. В любом ненулевом кольце R есть, по крайней мере, два идеала — нулевой и само кольцо R. Эти идеалы называют несобственными. Все остальные идеалы кольца R называют собственными идеалами. П р и м е р 6. Если R — коммутативное кольцо и a Е Я, то aR < R. (Проверьте!) В частности, в силу примера 1 все подкольца кольца Z являются его идеалами. Имеются кольца, в которых нет собственных идеалов. П р и м е р 7. Пусть Р — поле и /<Р, / ф 0. Для элемента г G /\{0} в Р существует обратный элемент г~х. По условию (3) е = гг"1 € I. Тогда для любого элемента г £ Р (опять по условию (3)) г = re e J. Стало быть, Р С I и Р = J. Таким образом, в поле нет собственных идеалов. Наиболее типичной является ситуация, когда в кольце R некоторые собственные подкольца являются идеалами, а некоторые — нет. Пример8.В кольце многочленов Р[х] над полем Р подкольца вида f{x)P[x] являются идеалами (см. пример 6), а все ненулевые подкольца, содержащиеся в Р, и, в частности само поле Р, не являются идеалами. (Проверьте!) Заметим, что отношение "быть идеалом" (как и отношение "быть нормальным делителем") не всегда транзитивно на множестве подколец данного кольца (подгрупп данной группы). Пример 9. В кольце Ъ^[х] подкольцо 2Z4[#] многочленов, имеющих коэффициенты 0 или 2, является идеалом. Подкольцо 2Z4 является идеалом кольца 2Z4[x]. Однако подкольцо 2Z4 кольца Z4[x] не является в нем идеалом. (Проверьте!) Рассмотрим операции над идеалами и подкольцами. Утверждение 10. Если I — идеал, a L — подкольцо кольца R, то: г) I + L — подкольцо кольца Щ б) I (1L — идеал кольца L. □ а) Ясно, что I+L — подгруппа группы (Д, +). Пусть i\+ti, гг € I + L. Так как справедливы равенства («1 + ii)(i2 + (2) = hi2 + ii£2 + h%2 + Ы2 = is + £3, где гз = iii2 + £\i2 + ^1^2 G / и 4 = t>\t<2 € L, то по утверждению 1 I + L — подкольцо кольца R. 173
б) По утверждению 6 InL — подкольцо кольца R. Так как InL С L, то J П L — подкольцо кольца L. Если £ £ Lni £ InL, то i£ £ Lni£ £ I. Значит, г^ € InL. Аналогично проверяем, что £г £ InL. Следовательно, InL — идеал кольца L. □ У т в е р ж д е н и е 11. Если /, J — идеалы кольца R, то I + J — идеал кольца R. □ По утверждению 10 а) I + J — подкольцо кольца R. Если г + j £ £l + Jnr£R, то справедливы соотношения (г + jf)r = ir + jr £ I + J. Аналогично r(i + j) £ I + J. Значит, I + J — идеал кольца iZ. □ Утверждение 12. Если {/а|# € Л} — произвольное семейство идеалов кольца R, тоТ = f) IQ — идеал кольца R. Доказательство осуществляется непосредственной проверкой с учетом утверждения б и предоставляется читателю. Из утверждения 12 следует, что корректно Определение 4. Идеалом, порожденным подмножеством S кольца Л, называют пересечение всех идеалов кольца i?, содержащих S (обозначение: (S)r). Так как идеал кольца R является его подкольцом, то из определений 4 и 1 следует включение [S]r С (5)я, которое может быть как строгим, так и не строгим. П р и м е р 10. Если а £ Z, то [a]z = {р)ъ — aZ. В поле Q очевидно [N]Q = Z и (N)Q = Q, а тогда [N]Q % (N)Q. Утверждение 13. Если R — коммутативное кольцо с единицей е и S — непустое подмножество из R, то (S)r есть множество всех элементов вида: г — ]Р 5гП, где к £ N, Si £ S, п £ R. (4) □ Обозначим через Т множество всех элементов вида (4). Так как идеал (S)r содержит 5, то по определению 3 (S)r D Т. к Покажем обратное включение. Пусть г £ Л, t\ = ]Г s^ £ Т и г=1 I *2 = е 4riG T- Тогда *i — *2 = sm + ... + skrk + si(-ri) + ... + s'e(-r'e) £ Г. 174
В силу коммутативности кольца R имеем: к г=1 Таким образом, Г — идеал кольца R. Поскольку в R есть единица е и se = s для s € S, то S С Г. Тогда по определению 4 справедливо включение (S)R С Г. Поэтому (£)д = Т. □ Замечание1. Обратите внимание на отличие вида (4) элементов идеала (S) r от вида элементов подгруппы (F) группы (G, +), порожденной подмножеством F (теорема 3.XI): где Сг е Z (!). Определение 5. Идеал / кольца R называют главным, если существует такой элемент s e R, что / = (s)r (говорят, что элемент s порождает идеал /). Коммутативное кольцо R с единицей называют кольцом главных идеалов, если все его идеалы главные. Теорема!.. Кольцо Z, произвольное поле Р и кольцо многочленов Р[х] являются кольцами главных идеалов. П По утверждению 13 главный идеал коммутативного кольца R с единицей имеет вид: (s)R = sR. (5) Как показано в примере 6, идеалы кольца Z имеют вид raZ, m e No, т. е. Z — кольцо главных идеалов. Ввиду примера 7 идеалы поля Р — это 0 = QP и Р = еР, где е — единица поля Р. Значит, Р — кольцо главных идеалов. Пусть / — идеал кольца Р[х]. Если / = 0, то J = 0Р[х] — главный идеал. Если / ф 0, то среди его ненулевых элементов возьмем многочлен i(x) наименьшей степени. Покажем, что J = i(x)P[x]. Произвольный многочлен j(x) £ J разделим с остатком на г{х): j{x) = i(x)q(x) + r(x), degr(x) < degi(x). Так как r(x) = j(x) — i(x)q(x), то r(x) G /. Если r(x) ф 0, то получаем противоречие с выбором элемента г (ж). Значит, т{х) = 0 и j(x) G г(х)Р[ж]. Стало быть, I С г(гг)Р[х]. Поскольку i(x) С I, то г(х)Р[ж] С I. Итак, / = i(x)P[x], и Р[х] — кольцо главных идеалов. D 175
Из равенства (5) следует, что для многочленов f{x),g(x) E Р[х] включение f(x)P[x] С д(х)Р[х] справедливо тогда и только тогда, когда д(х) | f{x). Поэтому (f(x))P[x] = (д(х))Р[х] тогда и только тогда, когда многочлены f(x) и д{х) ассоциированы. Отсюда получаем Следствие. Если 1<Р[х\ и I =£0, то существует единственный унитарный многочлен, порождающий идеал I. □ Если I = (/(#))р[х] и f*(x) — ассоциированный с f(x) унитарный многочлен, то / = (f*(x))p[x]. Остается заметить, что ассоциированные унитарные многочлены равны. □ Заметим, что не всякое коммутативное кольцо с единицей является кольцом главных идеалов. Пример 11. В кольце Z^x] идеал, порожденный множеством S = {2, х}, не является главным. (Покажите!) § 4. Простые кольца По аналогии с определением простой группы введем определение простого кольца. Определеннее. Кольцо R называют простым, если оно ненулевое и в нем нет собственных идеалов. Пример 7 показывает, что произвольное поле является простым кольцом. Пример 12. Если R — кольцо простого порядка, то оно простое кольцо, так как в группе (Л, +) нет даже собственных подгрупп. Задача описания всех простых колец (как и простых групп) является весьма сложной. Однако она легко решается в классе коммутативных колец. Теорема 2. Коммутативное кольцо R ф 0 является простым тогда и только тогда, когда оно поле или кольцо простого порядка с нулевым умножением. □ Примеры 7 и 12 показывают, что поля и кольца простого порядка являются простыми кольцами. Пусть R — простое кольцо. Если R — кольцо с нулевым умножением (см. определение 12.111), то группа (Л, +) — простая, так как любая ее подгруппа является идеалом. (Проверьте!) По теореме 30.XI \R\ — простое число. 176
Пусть теперь R — кольцо с ненулевым умножением. Если г £ Я, то в силу примера 6 rR<R. Так как R — простое кольцо, то rR = 0 или Если rR = 0 для любого элемента г £ Я, то R — кольцо с нулевым умножением, что противоречит условию. Значит, существует такой элемент г £ Я, что rR = Я. (6) Легко проверить, что множество / = {д £ Я | гд = 0} — идеал кольца Я. Стало быть, I = R или / = 0. В первом случае получаем rR = 0 вопреки равенству (6). Поэтому / = 0, и, следовательно, элемент г не является делителем нуля. Из равенства (6) следует, что гх = г для некоторого элемента х £ Я. Пусть Ъ £ Я и хЪ = с. Из равенств гхЬ — гЪ = гс получаем г(Ь — с) = 0, и, следовательно, b = с. Значит, хЪ = Ъ для любого элемента Ъ £ Я. Поскольку Я — коммутативное кольцо, то х = е — единица кольца Я. Тогда для любого элемента г £ Я\{0} получаем rR Ф 0 и, значит, rR = Я. Отсюда следует, что существует такой элемент г1 £ Я, что тг1 = е. Это и означает, что Я — поле. □ Следствие1. Коммутативное кольцо Я Ф 0 является полем тогда и только тогда, когда Я — простое кольцо с ненулевым умножением. Следствие 2. Коммутативное кольцо Я с единицей является полем тогда и только тогда, когда Я — простое кольцо. Примеры некоммутативных простых колец дает Утверждение 14. Если Р — поле ип £ N, то кольцо матриц Рп,п — простое кольцо. □ Пусть / — ненулевой идеал кольца Pn,n, A = (aifj)nxn £ 1\{Опхп} и аы Ф 0. Тогда для любого г £ 1, п справедливы соотношения (проверьте!): ?(М) . аы . E(bi) = E(i,i) e j Поэтому Е = £*1Д) + ... + 1?(п'п> £ /, и, следовательно, I = Рщп. □ В классе конечных колец простые кольца описываются утверждением, которое мы приведем без доказательства: конечное ненулевое кольцо Я является простым тогда и только тогда, когда Я — либо конечное поле, либо кольцо матриц над конечным полем, либо кольцо простого порядка с нулевым умножением. 177
§ 5. Конгруэнции и идеалы колец. Факторкольца Напомним, что бинарное отношение р на полугруппе (М, *) называют конгруэнцией, если р — отношение эквивалентности, согласованное с операцией *, т. е. удовлетворяющее условию: Ш2,тгъ тг2 £ M(mipm2,тп^рт^ => (mi * т'1)р(т2 * тпг2)) (определение 5.Х). В главе XI были рассмотрены конгруэнции на группе и установлена их тесная связь с нормальными делителями этой группы. Рассмотрим аналогичные вопросы для колец. Определение?. Бинарное отношение р на кольце (Я, +, •) называют конгруэнцией, если р — отношение эквивалентности, согласованное с операциями + и •. Если р — конгруЭНцИЯ на кольце Л, то на фактормножестве R/p={[r]P\reR}, где [г]р = {а € R \ арг}, определены индуцированные операции (определение 6.Х): Ир + ЩР = [а + Ь]р, [ар] • [6]р = [аЬ]р. При этом по следствию утверждения 5.Х (R/p, +) — абелева группа и (R/p, •) — полугруппа. Утверждение 15. Если р — конгруэнция на кольце (Д, +, -), то алгебра (R/p, +, •) является кольцом. □ В силу сказанного выше остается проверить справедливость законов дистрибутивности. Цепочка равенств (Ир + Ир) • [сР] = [а + Щр - [с)р = [(а + Ь)с]р = [ас + Ьс]р = = [ас]р + [Ьс)р = [а]р • [с]р + [Ъ)р - [с]р доказывает справедливость одного из них. Аналогично проверяется и другой закон дистрибутивности. □ Определеннее. Если р — конгруэнция на кольце R, то кольцо R/p называют факторкольцом кольца R по конгруэнции р. 178
Таким образом, по конгруэнциям на кольце R можно строить, исходя из кольца Д, новые кольца. Поэтому естественно возникает задача об описании всех конгруэнции на кольце R. П р и м е р 13. Если га Е N, то по теореме 2. V отношение = (га) на кольце Z, заданное условием: (а = 6(га))^(га|а-Ь), (7) является конгруэнцией. Факторкольцо Z/ = (га) — это кольцо вычетов Z/ra кольца Z по модулю га. Ясно, что условие (7) можно записать в виде: (а = Ь(т)) <=> (a-be raZ). Обратим внимание на то, что raZ — идеал кольца Z. Как мы сейчас увидим, возникновение в примере 13 идеала raZ, связанного с конгруэнцией = (га), было не случайным. Определение 9. Пусть / — идеал кольца R. Говорят, что элементы а, 6 Е R сравнимы по идеалу I, если а — Ь Е /. При этом пишут а = 6(1), или apib. Теорема 3. а) Если I — идеал кольца R, то отношение сравнимости pi no идеалу I является конгруэнцией на кольце R; б) Если р — конгруэнция на кольце R, то класс [0]р является идеалом кольца R и р есть отношение сравнимости по идеалу I = [0]р. □ а) Легко проверить, что р/ — отношение эквивалентности. Пусть а = а\{1) и Ъ = 6i(/), т. е. а — а\ Е / и Ь — Ь\ Е i*. Соотношения и пЬ — СЬ\Ъ\ — ОЬ — п\Ь + CL\b — CL\b\ = (п — CL\)b - показывают, что (а + 6) = (a± + 6i)(/) и ab = ai&i(/), т. е. р/ — конгруэнция. б) Пусть ij E [0]p, т. e. i рО и j рО. Так как (-j) p (-j), то (-j) рО, (г- —j)pQ и г — j E [0]p. Значит, [0]p — подгруппа группы (Д, +). Если г Е Е Л, то справедливы соотношения грг, (гг) рО и (гг) рО. Следовательно, г г, гг Е [0]р и I = [0]р — идеал кольца R. Ясно, что apb <=$> а — b e [0]р 4Ф a = Ь(/). □ 179
Определение 10. Если / — идеал кольца R, то факторкольцом кольца по R идеалу I называют факторкольцо кольца R по конгруэнции = / (или pi). Его обозначают через R/L Учитывая результаты гл. XI, нетрудно увидеть, что кольцо (Л//, +, •) — это факторгруппа (R/I, +), элементами которой являются смежные классы а + / и на которой операция умножения задана равенством: (a + I)(b + I)=ab + L (8) Утверждение 16. Если R — коммутативное кольцо (кольцо с единицей е), то для любого идеала I кольца R факторкольцо R/I коммутативно (содержит единицу е + 7). □ Доказательство очевидно в силу равенства (8). □ Замечание2. Обозначим через K(R) множество всех конгруэнции на кольце R и через £(R) — множество всех идеалов кольца R. Зададим отображения (р: K(R) -» £(R) и ip: £(i?) —► K(R), положив (в обозначениях теоремы 3) где р € K(R), I e £(Д). Тогда по теореме 3 и (ф о ф)(р) = ф(ср(р)) = ф(1) = р. Значит, <р о <ф = ££(#) и <ф о ср = 6k(r)- По утверждению 4.1 (р и <ф — биекции. Таким образом, существует взаимно-однозначное соответствие между множествами K(R) и £(R). Теорема 3, в частности, позволяет описать все конгруэнции на кольцах Z и Р[х], где Р — поле. П р и м е р 14. По теореме 1 все идеалы колец Z и Р[х] имеют вид, соответственно, raZ = (m)z, где m £ No, и /(#)Р[х] = (/(#))р[ж], где f(x) € -РЭД. По определению 10 факторкольца колец Z и Р[х] имеют вид Z/mZ = Z/(m)z = Z/m и Р[х]//(х)Р[х] = Р[х]/(/(х))Р[х]. Кольцо вычетов Z/m было подробно изучено в главе V. Кольцо P[x]/f(x)P[x] также принято называть кольцом вычетов кольца Р[х] по модулю f(x) и обозначать через P[x]/f(x). Рассмотрим подробнее это кольцо. 180
По определению 10 элементами кольца P[x]/f(x) являются классы [а(х)]Пх) = а(х) + f(x)P[x]. Если f(x) = 0, то Р[х}/0 = Р[х], поскольку a(x) — b(x) G 0-Р[ж] тогда и только тогда, когда а(х) = Ь(х). Пусть f(x) = / € P\fO}. Тогда / • Р[х] = Р[х) и для любых многочленов а(х) и 6(х) справедливо соотношение а(х) — Ъ(х) 6 / • Р[х]. Значит, P[x]/f = [0]/ — кольцо из одного элемента. Пусть теперь deg f(x) = n > 0. Произвольный многочлен Ь(х) G Р[ж] разделим с остатком на f(x): b(x) = f(x)q(x) + r(x), degr(rr) < п. Тогда b(x) — r(x) = f(x)q(x) € f(x)P[x]. Это означает, что в любом классе [b(x)]f(x) € -PM/ZOe) содержится многочлен, имеющий степень строго меньшую, чем п — deg/(x). Более того, в классе [Ь(з;)]/(х) такой многочлен только один, поскольку разность двух различных (!) многочленов, имеющих степени, меньшие п, не делится на /(х). Таким образом, при условии deg/(x) = п > 0 множество P[x]/f(x) описывается следующим образом: гх"-1]^* в Р, i e 0,n-l} . (9) В частности, если \Р\ < сю, то \P[x]/f(x)\ = |Р|П. Излолсенная выше конструкция построения новых колец как фак- торколец данного кольца позволяет указать и способы построения полей. Напомним, что в главе V было построено поле Z/p, где р — простое число. Утверждение 17. Если Р — поле, f(x) € Р[х] и deg/(ж) > 0, то равносильны утверждения: а) многочлен f(x) неприводим над Р; б) P[x]/f(x) - поле. Па)^б) Пусть [a(x)]f(x) e P[x]/f(x) и [a(x)]f{x) ф [0]/(ж). В силу равенства (9) можно считать, что deg а(х) < deg/(ж). Поэтому f(x) \ а(х). Тогда по свойству неприводимых многочленов (/(ж),а(ж)) = е. Значит, для некоторых многочленов u(x),v(x) E Р[х] справедливо равенство u(x)f(x) + v(x)a(x) = e. Поэтому в кольце P[x]/f(x) справедливы равенства: [u(x)f{x) + v(x)a(x)}f{x) = [u(x)}f(x)[f(x)]f(x)+ 181
Поскольку [/(х)]/(ж) = [О]/(Х), то [v(x)]f(x)[a(x)]f(x) = [е]/(ж), и, следовательно, [v(x)]f(x) — [a(x)]jL)' Стало быть, P[x]/f(x) — поле. б) => а) Если f(x) = g(x)h(x), где g(x),h(x) Е Р[х] и 0 < degp(x), deg/i(x) < deg/(x), то в кольце P[x]/f(x) справедливы соотношения [<>]/(») = [/(*)]/(*) = \9(z)]f(x)[h(x)]nx), [g(x)]fix) ф [0]/(х), [Л(х)]/(ж) ф Ф [0]/(я.), противоречащие условию б). Значит, многочлен f(x) неприводим над полем Р. □ Утверждение 17 позволяет получать поля с числом элементов р*, где р — простое число и t € N. Действительно, если Р = Z/p и /(х) — неприводимый над Р многочлен степени £, то в силу равенства (9) число элементов в поле P[x]/f(x) равно р1. Пример 15. Многочлен f(x) = х2 + х + е € Z/2[x] неприводим над полем Z/2. Поэтому поле Z/2[x]/f(x) состоит из четырех элементов. В силу равенства (9) Z/2[x]/f(x) = {[0}т, [е)т, [х]т, [х + e]f(x)} . Выпишите таблицы слолсения и умножения в этом поле. § 6. Гомоморфизмы колец Согласно определению 4.Х гомоморфизм <р кольца (Л, +, •) в кольцо (L, +,•) — это такое отображение ip: R —> L, при котором для любой операции * G {+, •} выполнено условие: Va, Ь е Щср(а * 6) = (р(а) * (р(Ь)). В главах X и XI было показано, что всякий эпиморфизм полугрупп и групп сводится к некоторому естественному эпиморфизму и некоторому изоморфизму. Рассмотрим соответствующую ситуацию для колец. Из утверждения 5.Х и следствия утверждения 4.Х получаем Утверждение 18. Если р — конгруэнция на кольце R, то отображение щ: Я -> Л/р, определенное равенством <po(r) = [r]p, r £ R, является эпиморфизмом колец. 182
ОпределениеП. Эпиморфизм щ, определенный в утверждении 18, называют естественным эпиморфизмом кольца Д на факторкольцо R/p. Если / — идеал кольца Д, то по определению 10 R/I = R/pi. Поэтому отображение ip: R —♦ Д//, при котором ф(г) = r+I = [r]Pj, является естественным эпиморфизмом. Для произвольного гомоморфизма колец <р: R —» L обозначим: Кекр = {г £ R | cp(r) = 0L} и назовем Кепр ядром гомоморфизма (р. Утверждение 19. Если <р: R —> L — гомоморфизм колец, то Кег ф — идеал кольца R. При этом ср — мономорфизм тогда и только тогда, когда Кег <р = Or. □ Ясно, что Кег (р — это ядро гомоморфизма групп ip: (Д, +) —» —> (L, +). По теореме 25.XI Кег^? — подгруппа группы (Д, +). Пусть а € 6 Kerv? и г Е Д. Тогда ср(аг) — (р(а)(р(г) = 0ь<р(г) = Ох,. Значит, ar G G Кег^. Аналогично показываем, что га £ Кег<^. Следовательно, Кег^? — идеал кольца Д. Второе утверждение теоремы справедливо ввиду следствия теоремы 25.XL □ Теорема4 (об эпиморфизме). Если <р: R ~> L — эпиморфизм колец, то R/ Кег ср ~ L и существует изоморфизм колец г: R/ Кег tp —> —♦ L, при котором коммутативна диаграмма (10) R/Ker <p где (ро — естественный эпиморфизм. □ Доказательство теоремы 4 получается непосредственно из доказательств теорем об эпиморфизме полугрупп и групп (см. теоремы 2.Х, 26.XI). Достаточно лишь учесть, что отношение сравнимости по ядру Кег (р на кольце Д совпадает с используемой в полугруппах и группах 183
сравнимостью по конгруэнции р, и заметить, что построенный в теореме 26.XI изоморфизм групп т: R/ Кег (р —> L является в рассматриваемом случае изоморфизмом колец. □ Следующие теоремы аналогичны соответствующим теоремам для групп. Теоремаб (об образах и прообразах). Пусть <р: R —> L — гомоморфизм колец. Тогда справедливы утверждения: а) если А — подкольцо кольца R, то <р(А) — подкольцо кольца L и б) если В — подкольцо кольца L, mo (р г(В) — подкольцо кольца R, <р-г{В) D Кетср и Ч>{Ч>~\В)) = Я ГИД); в) если J — идеал кольца L, mo cp 1(J) — идеал кольца R; г) если I — идеал кольца R, то <р(1) — идеал кольца ip(R). При условии теоремы 5 обозначим через П^(Л) множество всех под- колец кольца Л, содержащих Кег у?, и через П(£) — множество всех подколец кольца L. В силу утверждений а) и б) теоремы 5 можно задать отображения а: И(р(К) —> П(£) и /3: П(Ь) —* Пу,(Д), положив а(А) = <р(А), р(В)=<р-1(В) (11) для А £ Пу(Д) и Б € П(Хг). Теоремаб (о соответствии), ifc/ш ср: R —* L — эпиморфизм колец, то отображения а и /3, определенные равенствами (11), сушь взаимно-обратные биекции. Кроме того, при отображениях а и /3 сохраняется отношение "быть идеалом" и отношение включения (из А\ < А следует а(А{) < а(А), а из Вг < В следует (3(В{) < /?(#)). Теорема7 (первая теорема об изоморфизме). Если <р: R —> L — гомоморфизм колец, то для любого подкольца А кольца R справедливо соотношение A/AnKercp9i(p(A). Следствие. Если I — идеал кольца R и А — подкольцо кольца R, то имеет место изоморфизм колец A + 1/I^A/AnI. Теорема8 (вторая теорема об изоморфизме). Если (р: R-+ L — эпиморфизм колец и I — идеал кольца R, то имеет место изоморфизм колец 184
Следствие. Если I и J — идеалы кольца R и I С J, то имеет место изоморфизм колец R/J 91 R/lfj/I. Доказательство теорем 5, 7, 8 и следствий теорем 7 и 8 аналогичны доказательствам соответствующих утверждений для групп и предоставляются читателю. Доказательство теоремы 6 также предлагается провести самостоятельно (используйте, в частности, утверждение 4.1). В качестве примера применения теоремы об эпиморфизме колец получим результат, который будет использован в следующей главе. Замечание 3. Если Р и F — поля с различными единицами ер и ер у то для колец многочленов от одного переменного над Р и F следует использовать различные обозначения (например, Р[х] и F\x], где х = (0, ер, 0,...) и х = (0,е/г,0,...)). Однако чтобы не загромождать формулировки и доказательства лишними символами, мы будем использовать в следующем утверждении обозначения Р[х] и F[x]. Такие же обозначения будем применять в теоремах 8.XXI, 12.XXI и 2.XXIL Утверждение 20. Пусть а: Р —> F — изоморфизм полей, и п отображение о1 \ Р[х] —> F[x] для любого многочлена а(х) = J г=0 € Р[х] определяется равенством: г=0 Тогда: а) а1 — изоморфизм колец; б) если f(x),g(x) G Р[х], то f(x) | g(x) тогда и только тогда, когда af(f{x)) | a'(g(x)); многочлен g(x) неприводим над Р тогда и только тогда, когда многочлен crf{g(x)) неприводим над F; в) для любого f(x) € Р[х) имеет место изоморфизм колец P[X}/f(x)^F[x]/a'(f(x)). (12) □ а) Пусть f(x) = /о + ... + fmxm и д{х) = д0 + ... + дехе - произвольные многочлены из Р[х]. Очевидно, что cr'(f(x) + д(х)) = = cr'(f(x)) + а'(д(х)), т. е. сг' — гомоморфизм относительно операции 185
сложения. Поскольку справедлива цепочка равенств (г \ \ a'(f(x)g(x)) = </ £ ЕЛЛ-^ М = то и1 — гомоморфизм колец. Ясно, что а1 — эпиморфизм и Кегс/ = Ор. Значит, а' — изоморфизм колец. б) Так как а' — изоморфизм колец, то обратное отображение (сг')"1: F[x] —^ Р[х] — также изоморфизм колец. Поэтому справедлива импликация (д(х) = f(x)h(x)) «. (а'(д(х)) из которой и следуют утверждения б). в) Пусть <£>: J^fx] —> ^[^/^'(/(х)) — естественный эпиморфизм. По теореме об эпиморфизме колец имеем коммутативную диаграмму: р[х] "—"F[x] ' где т — изоморфизм. Так как справедливы равенства: то Кег((/? о сг') = {t(x) € Р[х] : 0"'(/(я))|сг'(*(х))}. Тогда по утверждению б) Кег(сроа') = {i(x) G РОД : / Таким образом, г и есть требуемый изоморфизм (12). □ 186
Рассмотрим пример возможного применения теоремы о соответствии. П р и м е р 16. Опишем идеалы кольца Z/m. Рассмотрим естественный эпиморфизм tp: Z —> Z/m. Ясно, что Кекр = mZ. Тогда по теореме 6 каждому идеалу кольца Z/m ставится в соответствие единственный идеал кольца Z, содержащий mZ. А так как включение mZ С nZ равносильно делимости п | т, то все идеалы кольца Z/m исчерпываются его подмножествами вида п • Z/m, где п £ N и п | т. В частности, отсюда, учитывая следствие 2 теоремы 2, можно получить известное утверждение: Z/m — поле тогда и только тогда, когда m — простое число. § 7. Разложение кольца в прямую сумму В некоторых случаях изучение кольца молено свести к изучению его собственных идеалов. Определение 12. Кольцо R называют разложимым, если существуют такие его собственные идеалы Д,...,/^, t > 2, что R = = 1\ + ... + It и сумма 1\ + ... + It является прямой суммой абелевых групп (Is, +). В этом случае пишут R = 1\ + ...+1* и говорят, что кольцо R есть прямая сумма идеалов Is, s G l,t. Если лее таких идеалов не существует, то кольцо R называют неразложимым. Пр им ер 17. Пусть R = < I п l ) «,Ь € Р >, гдеР —поле. Легко л //« о\1 D J/ о о \\ проверить, что л=<(п П1>и2? = <[ » 1 > — идеалы кольца Дий = Л + В. П р и м е р 18. Всякое простое кольцо неразложимо, так как не имеет собственных идеалов. П р и м е р 19. Кольцо Z неразложимо. Оно хотя и имеет собственные идеалы, но любые два таких идеала mZ и nZ, т,п £ {0, ±1}, имеют ненулевое пересечение: mZ П пЪ D тпЪ Ф 0. Примеры разложимых конечных колец дает Утверждение 21. Если R — конечное кольцо и число \R\ имеет каноническое разложение \R\ — р^1.. -Р%к, где к > 1, то в кольце 187
jR существует единственный идеал Is порядка \IS\ = pf8, sG Ц, w кольцо R разложимо: Д = /! + ... + 4. (13) П В абелевой группе (Л, +) по теореме 33.XI существует единственная силовская ps-подгруппа 18 порядка р%*. Она имеет вид: Нетрудно увидеть, что IS<R. Остается заметить, что согласно следствию теоремы 33.XI справедливо равенство (13). D Пусть R — разложимое кольцо и R = h + ... + It (14) — его разложение. По определению 15.XI каждый элемент г кольца R однозначно представим в виде: г = h + ... + iu (15) где is G Js, s € IT*. Элементы is £ Is из равенства (15) называют компонентами элемента г. Если г1 = г\ + ... + i'tJ is E Js, то г + г! = = (h + г'г) + ... + (it + if). Кроме того, справедливо также равенство rr' = hi[ + i2i'2 + ... + iti't, (16) показывающее, что умножение элементов кольца R производится по- t компонентно. Действительно, rrr = Yl We- Так как /s, l£ — идеалы кольца R, то isi\ G /5 П 1^. Поскольку сумма 1\ + ... + It — прямая, то Is П It = 0 при s ф I. Следовательно, isi'e = 0 при s ф £, и справедливо равенство (16). Таким образом, если R — разложимое кольцо и (14) — его разложение, то изучение кольца R сводится к изучению его собственных идеалов is,s £ 1,£, поскольку свойства операций в кольце R определяются свойствами операций в идеалах /s, sGl,t. Замечание 4. В условиях утверждения 21 компоненты is произвольного элемента г G R могут быть найдены следующим обра- зом. Обозначим т3 = -Ц^, s £ l,fc. Так как (jpuPj) = 1 при i 188
(mi,..., rrik) = 1 (аналогичный факт для многочленов доказан в утвер- к ждении 9.IX), и существуют такие ui,...,Uk Е Z, что ^2щтп{ = 1. г=1 Тогда is = usmsr. (Докажите!) Простейшие свойства разложимого кольца описывает Теорема 9. Пусть R — разложимое кольцо и (14) — его разложение. Тогда: а) в кольце R есть делители нуля; б) кольцо R коммутативно тогда и только тогда, когда коммутативно каждое подкольцо Is, s Е l,i; в) R — кольцо с единицей тогда и только тогда, когда каждое кольцо 13 содержит единицу; при этом если е — единица кольца R и е3 — единица кольца Js, s € l,t, то е = ei + ... + е* и I3 = e8R\ г) если R — кольцо с единицей, то элемент г = i\ + ... + it Е R, is E Is, обратим в R тогда и только тогда, когда i8 Е /*, s El3t. □ а) Если rs Е /Д{0}, п Е /Д{0} И5^,то rsn = 0. б) Свойство б) следует из равенства (16). в) Пусть е — единица кольца R. Тогда существуют такие однозначно определенные элементы as E /5J s Е 1, t, что е = а\ + .. .+а*. Для любого элемента bs E Is справедливы равенства Ъ3е = Ъ3а3 = bs и ebs = а3Ь3 = = bs, показывающие, что а3 — единица кольца /s. Наоборот, если е3 — единица кольца Is, s E 1,£, то из равенства (16) следует, что е\ + ... + et — единица кольца R. Очевидно, что esR С 13 и Is = esls С e3R. Следовательно, I3 = esR. г) Свойство г) очевидно в силу равенства (16) и свойства в). □ Замечаниеб. Согласно теореме 9 и утверждению 21 всякое конечное коммутативное кольцо R с единицей однозначно разложимо в прямую сумму (13), где 13 — коммутативное кольцо с единицей, имеющее примарный порядок \IS\ = p%% ps — простое число. К настоящему времени полного описания коммутативных колец примарного порядка (в отличие от примарных абелевых групп) нет. Приведем теперь конструкцию, аналогичную конструкции внешней прямой суммы абелевых групп. Пусть i?i,..., Rk — кольца, к > 1. На декартовом произведении R = = Ri х ... х Rk определим операции + и •, положив (аь ..., ак) + (Ьи..., Ьк) = (ai + Ьъ..., ак + Ък), 189
Т е о р е м а 10. Множество R является кольцом относительно операций, определенных равенствами (17). Для каждого s Е 1, к кольцо R содержит подкольцо R8, изоморфное кольцу Rs, и R — R\ +... + Rk- П Тот факт, что алгебра (Л, +, •) является кольцом, доказывается непосредственной проверкой. Обозначим R8 = {(0,..., 0,6S, 0,..., 0) | Ь8 Е -Rs}> s Е 1, к. Легко проверить, что Rs — подкольцо кольца R, изоморфное кольцу Rs при соответствии Ъ3 —* (0,..., 0, Ь5,0,..., 0). Кроме того, Rs<RnR = Ri + .,.+ Rk- (Проверьте!) □ Определение 13. Кольцо R, построенное в теореме 10, называют внешней прямой суммой колец i?s, s £ 1, fc, и обозначают: R = Ri®...@Rk. Простейшие свойства кольца R в силу разложения R = Ri +... + Rk и изоморфизма Rs = Rs, s E 1, fc, получаются из теоремы 9. В качестве важного примера рассмотрим кольца вычетов. Т е о р е м а 11. Если п Е N, п = п\П2, щ > 1 и (ni,ri2) = 1, то имеет место изоморфизм колец: Ъ/п ^ Z/ni ф Z/n2. (18) П Зададим отображение ср: Ъ/п —> Ъ/п\ @ Z/n2, положив ^(Ип) = = (Ипп Nna)- Пусть * Е {+, •}• Равенства Wn * [b]n) = <р([а * b]n) = ([а * 6]П1, [а * Ь)П2) = = (Wn, * Mm, Wna * Ипа) = (Иш, Wna) * (Mm, Mn2) = показывают, что ip — гомоморфизм колец. Если ([a]ni,[°]na) = = ([°]ni,[°]na)) too = 0(ni), a = 0(п2), и так как {пъп2) = 1, то [а)п = [0]п. Значит, tp — инъективное отображение. Поскольку |Z/n| = = |Z/ni ф Z/ri2|, то ^ — искомый изоморфизм колец. П Следствие. £"слгх п = р"1.. .p^fc — каноническое разложение числа п Е N, то гиееет место изоморфизм колец: z/n ^ z/p?1 е... © z/p£\ В заключение параграфа докажем кольцевой аналог того факта, что конечные циклические группы одинакового порядка изоморфны. 190
Утверждение 22. Если R\ и R2 — такие кольца с единицами, что \R\\ = I-R2I и (Яг,+) — циклические группы, то кольца R\ и i?2 изоморфны (в частности, если \R%\ = m, то R% = Z/m). П По условию (jRi,+) = (а) и (#2,+) = (Ь), где orda = ordb = t. Пусть ег — единица кольца R%, г = 1,2. Тогда е\ = sa и а2 = иа для некоторых s,и Е 0,£ — 1. Кроме того, из равенств а = eia = $а-а = sua следует, что su = l(t), и поэтому (s,£) = 1. Значит, элемент ei = 5(2 также порождает группу (R\,+): (jRi,+) = (ei), так как ordei = \Ri\ (см. теорему 2.XI). Аналогично получаем, что (J?2j+) = (ег). Следовательно, каждый элемент кольца Ri однозначно представим в виде кег, где к G 0,t- 1, г G 172. Теперь ясно, что отображение <р: i?i —► i?2, определенное равенством <p(kei) = кв2, есть биекция. Для любой операции * € {+, •} при любых к,£ Е Q,t — 1 выполняется равенство где гДга) — остаток от деления т на t. Поэтому нетрудно проверить, что ер — изоморфизм колец. □ § 8. Замена подкольца изоморфным ему кольцом В предыдущих главах неоднократно встречалась следующая ситуация: имеются кольца А и В, кольцо В содержит подкольцо А, изоморфное кольцу Л, но не содержит самого кольца Л, т. е. A <}L В, но существует мономорфизм <р: А —> В такой, что <р(А) = А < В. В такой ситуации мы говорили, что будем рассматривать кольцо А как подкольцо кольца В, "отождествляя" элемент а £ А с соответствующим ему элементом <р(а) е А. Так было сделано в главе IV, когда каждый элемент а поля R действительных чисел отождествлялся с элементом (а, 0) поля С комплексных чисел. При этом было замечено, что отображение <р: R —► R = = {(а, 0) | а Е М}, заданное правилом <р(а) = (а, 0), является изоморфизмом. Аналогичный прием был использован при построении кольца мно- 191
гочленов R[x] над кольцом R с единицей. Каждый элемент а кольца R отождествлялся с многочленом ах° (см. замечание 3.DC). Нестрогость подобных рассуждений очевидна: заменяя часть элементов кольца В элементами кольца А, мы получаем новое множество С = (B\cp(A)) U А, на котором не определены кольцевые операции. Приведем способ определения операций на множестве С, при котором С превращается в кольцо, изоморфное кольцу В и содержащее А в качестве подкольца. Утверждение 23. Пусть <р: А —> В — мономорфизм колец и АпВ = 0. Тогда существует такое кольцо С, что: а) А < С; б) существует изоморфизм колец ф: С —► В такой, что ф(а) = = <р(а) для любого а € А П Пусть С = (В\<р(А)) U А, Зададим отображение ф: С —» В по правилу с, если с е С\А. Очевидно, что ф — биекция. Пусть * — операция сложения или умножения на кольце В. Зададим на С операцию *, положив Усъс2 еС(с1*с2=гр-1{<ф(с1)*гР(с2))) . (19) Из равенства (19) следует, что для любых элементов ci, c2 G С справедливо равенство: ip(ci*c2) = ip{ci) * ф(с2). Значит, ф — изоморфизм алгебры (С,+,т) на кольцо (В, +, •). Следовательно, (CjT,"7") — кольцо (см. теорему 6.III). Справедливость утверждений а) и б) очевидна. □ Теперь ясно, что при построении поля С комплексных чисел и кольца многочленов R[x] над кольцом R на самом деле была использована конструкция, указанная в утверждении 23. Задачи 1. Пусть R — кольцо. Его подмножество C(R) = {г € R | Va e R(ra = аг)} 192
называют центром кольца R. Покажите, что C(R) — коммутативное подкольцо кольца R. 2. Опишите все подкольца кольца Z/ra. 3. Для ненулевого кольца R, содержащего элемент, не являющийся делителем нуля, найдите C(Rn,n), n € N. 4. Пусть R — подкольцо коммутативного кольца Л7, Rf — кольцо с единицей е, R — кольцо с единицей ед = е и а\,..., ап Е R. Покажите, что [Д, аи ...,ап] = R[ai, ...,an} = {r'€R'\r' = f(au... ,an)J(x) € R[x]} (кольцо R[ai,..., an] введено в § 8.IX). 5. Опишите вид элементов идеала (5)#, если R — коммутативное кольцо без единицы и S С R. 6. Опишите вид элементов идеала {S)r, если R — некоммутативное кольцо с единицей и S С R. 7. Покажите, что совокупность всех многочленов из кольца Р[ж], где Р — поле, имеющих корнем данный элемент а € Р, является идеалом в Р[х]. Каким элементом из Р[х] порождается этот идеал? 8. Покажите, что если R — простое кольцо с единицей, то кольцо матриц Лп,п — также простое кольцо. (Покажите, что всякий идеал кольца Rnin имеет вид Vn>n, где V — некоторый идеал кольца Л.) 9. Идеал М кольца R называют максимальным, если М ф Rn для любого идеала / кольца R из соотношений М С I С R следует / = М, или I — R. Покажите, что если J < R и J ^ R, то J — максимальный идеал тогда и только тогда, когда R/J — простое кольцо (используйте теоремы 5 и 6). Если R — коммутативное кольцо с единицей, то J — максимальный идеал тогда и только тогда, когда R/J — поле. 10. Докажите, что факторкольцо кольца главных идеалов является кольцом главных идеалов. 11. Идеал / кольца R называют простым, если / ф R и для любых а,Ь € R из ab € / следует а £ I или b € I. Покажите, что если J < R и J Ф R, то J — простой идеал тогда и только тогда, когда R/J — кольцо без делителей нуля. 12. Покажите, что если R — конечное коммутативное кольцо с единицей, то его идеал является максимальным тогда и только тогда, когда он простой. Покажите, что это верно и в случае, когда R — область целостности, т. е. кольцо без делителей нуля, являющаяся кольцом главных идеалов. 193
13. Докажите, что кольцо Ъ/т неразложимо тогда и только тогда, когда т = рк, где р — простое число. 14. Пусть I и J — идеалы кольца R. Покажите, что если / + J = Д, то 15. Пусть каноническое разложение многочлена f(x) над полем Р имеет вид f(x) = gi(x)kl . ..gt{x)kt. Покажите, что P[x]/f(x) £* P[x]/<7i(*)fel ф ... ф P[x}/gt(x)k*. Укажите разложение кольца P[x]/f(x) в прямую сумму идеалов. Докажите, что P[x]/f(x) — неразложимое кольцо тогда и только тогда, когда t = 1. 16. В условиях предыдущей задачи пусть \Р\ = g, deg/(x) = га и deggi(x) = 77ij, г € 1,4. Покажите, что (обратите внимание на то, что \(P[x]/f(x))*\ — это количество таких многочленов h(x) G Р[х], что (f(x)1h(x)) —ей degh(x) < degf(x), т. е. получен аналог формулы для функции Эйлера 20). 17. Приведите пример разложимого кольца примарного порядка с единицей. 18. Докажите, что идеал / кольца Z[x] максимален тогда и только п тогда, когда / = (/(#),р), где р — простое число, a f(x) = Yl aix1 — г=0 п такой многочлен, что Y1 гр(аг)хг ~~ неприводимый многочлен в Z/p[rr]. i=0 19. Докажите, что идеал / кольца Z[x] простой тогда и только тогда, когда он либо максимален, либо порождается простым числом, либо порождается примитивным неприводимым многочленом из Z[x]. 20. Элемент / кольца R называют идемпотентом, если /2 = /. Докажите, что кольцо R с единицей е разложимо тогда и только тогда, когда оно содержит идемпотент /, / 0 {0, е} и / Е C(R) (см. задачу 1). 20 Л. Эйлер — родился в Швейцарии, проработал в Санкт-Петербурге более 30 лет (1707-1783). 194
Глава XXI ОСНОВЫ ТЕОРИИ ПОЛЕЙ Читателю уже известны конкретные примеры полей. Это числовые поля С, R, Q, {а + Ъу/р | а, Ъ € Q}, р — простое число, и нечисловые поля — поля вычетов Z/p и P[x]/f(x), где р — простое число и f(x) — неприводимый над полем Р многочлен. В настоящей главе будут рассмотрены общие свойства полей, классификация полей и строение некоторых из них. § 1. Подполя и расширения полей Напомним (определение 19.111), что подмножество L поля Р называют подполем, если L замкнуто относительно операций, заданных на Р, и само является полем относительно этих операций. Пример!..В любом поле Р есть хотя бы одно подполе — само поле Р. В поле С бесконечно много подполей — все числовые поля. В поле Z/p нет других подполей, кроме него самого, так как в группе (Z/p, +) нет собственных подгрупп. Получим критерий того, чтобы подмножество поля было его подполем. Утверждение1. Подмножество L поля Р, содержащее хотя бы один ненулевой элемент, является подполем тогда и только тогда, когда выполнены условия: 6)V*« где £~г — элемент, обратный к элементу £ в поле Р. D По утверждению 1.ХХ условие а) равносильно тому, что L — под- кольцо поля Р. Ввиду коммутативности поля Р кольцо L коммутативное. Поэтому выполнение дополнительно условия б) равносильно тому, что L — поле, т. е. тому, что L — подполе поля Р (обратные элементы в Р и в L к элементу £ Е L совпадают, так как (2Д{0}, •) < (Р\{0}, •)). □ Следствие!.. Отношение "быть подполем" транзитивно на любом множестве полей. 195
Следствие2. Пересечение любого семейства подполей поля Р является его подполем. Доказательство этих следствий очевидно и предоставляется читателю. Для конечного подмножества L поля Р указанный в утверждении 1 критерий можно существенно упростить. Утверждение 2. Конечное подмножество L поля Р, содержащее хотя бы один ненулевой элемент, является подполем тогда и только тогда, когда выполнено условие: \/еие2 е Ц£г+£2 е Ь,1г12 е L). (2) □ Справедливость утверждения вытекает из утверждения 1 и следствия 1 утверждения 4.XI. □ Определение 1. Поле Р называют простым, если в нем нет подполей, кроме самого поля Р. Пример 2. В силу примера 1 поле Ъ/р простое. Поле Q также простое. Действительно, пусть Т — подполе поля Q. Тогда Т Э 1, и, следовательно, Г содержит любой элемент га Е Z. Если п € Z\{0}, то 1 тм Т э п"1 = -. Поэтому Г Э — и Г = Q. п п Теорема1. В любом поле Р содержится единственное простое подполе. □ Пусть Pq — пересечение всех подполей поля Р. По следствию 2 утверждения 1 Ро — подполе поля Р. В силу следствия 1 утверждения 1 Pq — простое поле. Если Pq — какое-либо простое подполе поля Р, то Ро С Pq, и, так как Pq — простое поле, Pq = Pq. О Определение 2. Если Р — подполе поля Р\ то говорят, что Р1 — расширение поля Р. В частности, по теореме 1 всякое поле является расширением своего простого подполя. Следствие 2 утверждения 1 показывает, что корректно Определение 3. Пусть Р' — расширение поля Р и М — подмножество поля Р1. Пересечение всех подполей поля Р', содержащих Р и М, называют расширением поля Р, порожденным подмножеством М. Его обозначают через Р(М). Пример 3. В поле С расширение поля R, порожденное элементом г е С, совпадает с полем С. Действительно, М(г) — подполе поля С, 196
содержащее R и i. Поэтому Ж(г) содержит все элементы вида а + Ьг, где а,бЕК. Значит, М(г) = С. Рассмотрим некоторые свойства расширений полей. Утверждение 3. Если Рг — расширение поля Р, a L, М, Т — подмножества поля Р1 и ЬэТ, то: а) P(L) D Р(Г); б) P(LUM) = P(L)(M). П а) По определению 3 P(L) — подполе поля Р', содержащее Р и L. Тогда по условию P(L) содержит Р и Г. Поэтому P(L) содержит пересечение Р(Т) всех подполей поля Р', содержащих Р и Г. б) По определению 3 P(L U М) — пересечение всех подполей поля Р', содержащих Р, L и М, a P(L)(M) — некоторое подполе поля Р'? содержащее Р, L и М. Значит, P(L)(M)DP(LUM). (3) По определению 3 P{L){M) — пересечение всех подполей поля Р7, содержащих P(L) и М. По утверждению a) P(LUM) э Р(Ь). Ясно, что P(LUM) D М. Следовательно, P(LuM) — некоторое подполе поля Р', содержащее P(L) и М. Поэтому P(L)(M)cP(LUM). (4) Из включений (3) и (4) получаем требуемое равенство. □ В параграфе 3 мы опишем все простые поля. Предварительно введем одну конструкцию построения полей. § 2. Поля частных Определение 4. Поле Р называют полем частных кольца Д, если: а) существует изоморфное вложение <р: R —> Р; б) каждый элемент поля Р имеет вид <^(а)<^(6)~1, где а е R,b G е R\{0}. П р и м е р 4. По определению 4 поле Q является полем частных кольца Z. В качестве <р можно взять тождественное вложение. 197
Из условия а) определения 4 следует, что если ненулевое кольцо R имеет поле частных, то R — коммутативное кольцо без делителей нуля. Оказывается этого уже достаточно для существования поля частных. Теорема2. Если R — ненулевое коммутативное кольцо без делителей нуля, то для него существует поле частных. □ На множестве М = Rx (Д\{0}) определим отношение: ((Г, з) ~ (rb5i)) <=> (rS! = ns). Ясно, что это отношение рефлексивно и симметрично. Покажем, что оно транзитивно. Пусть (г,s) ~ (ri,$i) и (ri,si) ~ (г2,$2)- Тогда справедливы равенства: ns2 = r25i. (5) Умножив первое из равенств (5) на 52, а второе — на s, получим rs\S2 = = ris$2 и riS2S = r2Sis. Так как R — коммутативное кольцо, то rs2Si = = r2SSi и (r^2 — r2s)s\ = 0. Поскольку s± Ф 0 и Л — кольцо без делителей нуля, то VS2 = T2S и (г, s) ~ (гг^г)- Значит, отношение ~ является отношением эквивалентности, и множество М разбивается на классы [(г, s)]~ эквивалентных элементов. Обозначим R = М/ ~. В дальнейшем, для кратности, класс [(г, s)}^ будем обозначать через -. На множестве R определим операции, положив a b asi +bs a b ab I = ^ —. = # S S\ SSi S S\ SSi Покажем, что операции определены корректно. Так как 5, si E i?\{0} и в R нет делителей нуля, то ssi € Д\{0}. „ а а1 Ь Ь1 Пусть - = -,и — = —, т. е. s s' si s[ as' = a's, bs[ = b'si. (6) a V По определению -тН—т — — . Для доказательства корректности S 8г SfSx asi + bs a!s\ + 6V задания операции сложения нужно показать, что = —V^ , ssi s s\ т. е., что выполнено равенство (asi + bs)sfs[ = (a's'i + bfsf)ssi. (7) 198
Ввиду (6) справедливы равенства asfsisfx = a'ssis[ и bs^ss' = b's складывая которые, получаем равенство (7). Аналогично доказывается корректность задания операции умножения. Теперь покажем, что (Л, +, •) — поле. Ясно, что операции сложения и умножения коммутативны. Для любых элементов s\,S2 Е -R\{0} справедливы равенства — = — si S2 и — = —. Равенства si s2 а 0 _ as _ a a s __ as _ a s s ss s s s ss s' 0 s показывают, что нейтральный элемент по сложению, а по 5 S умножению. _ а —а 0 0 а —а к Равенства —I = — = — показывают, что — = —. Ассоциа- s s ss s s s тивность операции сложения следует из равенств: с _ as\ + bs с _ S2 SS\ 52 И 1 ) = - Н = S\ S2 / S ^1^2 ^1^2 и свойств операций в кольце R. Значит, (R, +) — абелева группа. Читателю предлагается проверить, что операция умножения ассоциативна и дистрибутивна относительно сложения. Значит, (Д, +, •) — коммутативное кольцо с единицей. _ а . О _. fM a s as s Если — Ф —, то а Е fi\iUh и справедливы равенства = — = -, ss s a as s показывающие, что а Таким образом, (i?, +, •) — поле. 199
Определим отображение ц>\ Л —► Л, положив при фиксированном 5 Е R\{0} для любого г G R rs V(r) = у. Легко проверить, что ц> — гомоморфизм колец и Кегу> = 0. Следовательно, <р — изоморфное вложение. Поскольку — = — ' — = <p(riMsi) , 51 5 Si то по определению 4 Л — поле частных кольца Л. □ П р и м е р 5. Пусть Р — поле ий- его ненулевое подкольцо. Рассмотрим множество Т = {ab^1^ Е Л, ft € Л\{0}}. Пользуясь утверждением 1, легко показать, что Т — подполе поля Р, содержащее кольцо R. По определению 4 Г — поле частных кольца R. Нетрудно проверить, что Г — пересечение всех подполей поля Р, содержащих R. П р и м е р 6. Кольцо многочленов Р[х] над полем Р является ненулевым коммутативным кольцом без делителей нуля. По теореме 2 для него существует поле частных: РМ\{0} 1 - Замечание 1. Если R — поле частных кольца R, то в R содержится подкольцо, изоморфное кольцу R. Применив конструкцию, изложенную в § 8.ХХ, получим поле Л, изоморфное полю Л и содержащее кольцо Л. Элементы поля Л имеют вид аЬ™1, где а Е Л, 6 £ Л\{0}. Поле Л также является полем частных кольца Л. Определение 5. Поле Р[х] обозначают через Р(х) и называют полем рациональных функций от переменного х. Поле Р[#ь..., хп] обозначают через Р(#ь... ,хп) и называют полем рациональных функций от переменных х\,...,хп. Рассмотрим вопрос о единственности поля частных для данного кольца. ТеоремаЗ. Пусть ф: R\ —> Л2 — изоморфизм ненулевых коммутативных колец без делителей нуля, Щ — поле частных кольца Ri, tpii Ri —> R'i — изоморфное вложение 21, i = 1,2. Тогда существует 21 Здесь щ, г £ 1,2, — изоморфное вложение, удовлетворяющее определению 4. 200
такой изоморфизм /i: R[ —> Rf2, что /j,((pi(a)) = cp2(ip(a)) для любого элемента а € R\, т. е. коммутативна диаграмма П Зададим отображение ц: R[ —> i?2, положив для a G i?i, Ь Е е ДД{0} 1 1- (8) Элементы ^i(b)""1 и ^(^(Ь))"1 определены, так как ^ — изоморфизм, a (pi, (f2 — изоморфные вложения. Покажем корректность определения отображения \х. Пусть <рг (а) срг (Ь)"1 = <рг (ai)y?i (61)"1. Тогда vi(a)y?i(bi) = — a>ib) = 0 и a6i = aib. Поэтому ^ (а) ф (b±) = ()() (^(«))V2(^(bi)) = V2(^(ai))v>2(^(b)) и (a))if>2 (Ф (b))"1 = v?2 (Ф (ai)) ¥?2 (^ (bi))"1. Значит, M (Vi (a) Vi W1) = M (Vi (ai) Vi (h)'1)- Непосредственной проверкой устанавливается, что \х — изоморфизм полей. При этом tpi(a) = y?i(a6)9Pi(b)~1 и, следовательно, (срг (а)) = & (1> (аЪ)) <р2 (ф (Ъ))-1 = <Р2 (ф (а)). □ Следствие!.. Если R и R" — произвольные поля частных ненулевого коммутативного кольца R без делителей нуля, а ц>\, (f2 — изоморфные вложения 22 R в Rf и R" соответственно, то существует такой изоморфизм /х: R' —> R", что для любого a G R справедливо равенство /x(<^i(a)) = ¥2(0). Следствие 2. Если в условиях следствия 1 ср\ и (р2 — тождественные вложения, то поля R и R" изоморфны над R, т. е. существует такой изоморфизм \±\ R! —► R!1, что /х(а) = а для любого aeR. 22 Здесь <pi, г Q 1,2 — изоморфное вложение, удовлетворяющее определению 4. 201
§ 3. Простые поля Опишем простые поля. Теорема 4. Поле Р ~ простое тогда и только тогда, когда оно изоморфно полю Ъ/р при некотором простом р или полю Q. □ В примере 2 показано, что поля Z/p и Q — простые. Пусть Р — простое поле с единицей е и нулем 0. Зададим отображение (р: Z —> Р, положив <р(п) = пе. Легко проверить, что ip — гомоморфизм колец. По теореме об эпиморфизме колец имеем коммутативную диаграмму где г — изоморфизм. По утверждению 8.ХХ возможны два случая: Char P = 0 или Char P = = р, где р — простое число. Так как Кег (р = {п Е Z | пе = 0}, то в первом случае Кег <р = 0, а во втором — Кег ср = рЪ. Если Кег ср = 0, то Z = cp(Z) С Р. Поскольку Р — простое поле, то ввиду примера 5 оно — поле частных кольца tp(Z). Так как Q — поле частных кольца Z, то по теореме 3 Р == Q. Пусть Кег ip = рЪ. Тогда Z/pZ = Ъ/р — поле и, следовательно, <р(Ъ) — поле. Ввиду простоты поля Р получаем cp(Z) = Р. Значит, Р = Z/p. □ Итак, все простые поля описаны. § 4. Классификация расширений поля Определение 6. Пусть Р — подполе иМ — подмножество поля Р1. Расширение Р(М) поля Р, порожденное М, называют конечным, если М — конечное множество, и — простым, если |М| = 1. 202
П р и м е р 7. Пусть Р(х) = {f(x)g(x)-1 \f(x) € Р[х), д(х) € Р[х}\{0}} — поле частных кольца многочленов Р[х] над полем Р (определение 5). Рассмотрим в поле Р(х) подполе Р и подмножество М = {х}. Простое расширение поля Р, порожденное подмножеством {#}, совпадает, как легко видеть, со всем полем Р(х). Таким образом, введенное в определении 5 обозначение Р{х) согласуется с обозначением, введенным в определении 3. Ввиду утверждения 36) конечное расширение P(mi,...,mn) поля Р можно считать полученным в виде последовательности простых расширений: P(rni,..., тп) = P(mi)(rn2)... (шп). Возможны различные способы классификации расширений полей. Первый способ — классифицировать расширения по минимальному числу элементов, порождающих эти расширения. Второй способ основывается на том, что в ситуации Р С Р' поле Р' можно рассматривать как векторное пространство над полем Р (например правое), взяв в качестве внешней операции умножения внутреннюю операцию умножения в поле Р'. Расширения можно классифицировать по их степеням. Определение?. Если Р'Р — конечномерное пространство, то его размерность называют степенью расширения Р1 надР и обозначают [Р' : Р], а поле Р' называют расширением конечной степени поля Р. Если Рр — бесконечномерное пространство, то говорят о расширении бесконечной степени: [Р' : Р] = ос. Пример8. В силу примера 3 С = R(i). Так как 1, г — базис пространства См, то [С : Щ — 2. Утверждение 4. Если Р' — расширение конечной степени поля Р, то Р' — конечное расширение поля Р. □ Пусть [Р' : Р] = п. Тогда в пространстве Рр существует базис c*i,..., ап. Поле P(c*i,..., otn) содержит все элементы поля Р', и, следовательно, Р' = P(#i,..., ап). □ Позлее (пример 13) будет показано, что конечное расширение может не быть расширением конечной степени. Рассмотрим последовательность расширений полей ("башню полей"). Теорема5(о башне полей). Если Р\ с Р2 С ... С Рп — последовательность полей, то степень расширения [Рп : Р\] конечна тогда и только тогда, когда конечны все степени [Pi : Pi-г], г £ 2, п. При выполнении последнего условия справедливо равенство [Рп : Pi] = j=2 203
□ Пусть [Рп : Pi] < 00. Если при некотором г Е 2, п степень расширения [Рг : Рг-i] бесконечна, то в поле Рг, а значит, и в поле Рп существует бесконечная линейно независимая над Рг-± система элементов. Поскольку эта система элементов линейно независима и над полем Pi, то приходим к противоречию с условием. Поэтому [Рг : Рг-\] < оо для г € 2, п. Обратно, пусть [Рг : Pz_i] = кг < оо для г € 2, п. Проведем доказательство конечности степени расширения [Рп : Pi] индукцией по числу п полей башни. При п = 2 утверждение очевидно. Пусть оно верно при п < £ — 1. Покажем, что тогда оно верно при п = £. По предположению индукции [P^-i : Pi] = ]J кг = т < оо. Значит, г=2 существует базис а = (o?i,... ,am) пространства (P^-i^. По условию существует базис /3 = (/?i,...,/3kt) пространства (Ре)ре_г. Покажем, что система элементов аг/33,1 G l,m, j G l,fc^, является базисом пространства (Ре)рг. Тогда теорема будет доказана, так как будет показано, что [Р£:Р1] = т.ке= {[кг. г=2 Элементы поля Ре имеют вид X) А^> где Ьг е P^_i. Поскольку эле- 771 менты поля P^_i имеют вид Ъг — £] а3агз, где а%3 е Pi, то получаем выражение элементов поля Ре через элементы а3/Зг: Остается показать, что система элементов (Зга3 линейно независима над полем Pi. Пусть гос3)аъз = 0, агз G Рь г£ 1, к£, j € I7m. (9) 771 Так как ]Г Qi^a^ G P^_i при любом г G 1, ке и /? — базис пространства 204
_15 то из равенства (9) следует равенство: atQ>tj =0, 2 Е 1, k£. Поскольку агз Е Р\ и а — базис пространства (P£__i)p1, то агз = 0 при j Е 1,га, г Е l,fa. D Рассмотрим еще один способ классификации расширений полей. Определеннее. Пусть Р', Р — поля и Р' D Р. Элемент а е Р' называют алгебраг/чесигш wad полел* Р, если система элементов а0 = е, а, а2,..., ап,... линейно зависима над Р. В противном случае элемент а называют трансцендентным над полем Р. П р и м е р 9. Пусть Р' D Р и а € Р. Соотношение ea + a(—е) = 0 показывает, что все элементы поля Р алгебраичны над Р. П р и м е р 10. Если Р1 D Р и некоторый элемент а € Р1 транс- цендентен над полем Р, то Р(а) — бесконечномерное пространство над Р. ПримерП. Элемент г Е С алгебраичен над М, так как справедливо соотношение i° • 1 + г • 0 + г2 • 1 = 0. Критерий алгебраичности элемента дает Утверждение 5. Пусть Р' — расширение поля Р. Элемент а Е Р7 алгебрагл'чеп wad P тогда и только тогда, когда а — корень некоторого ненулевого многочлена из Р[х]. □ Элемент а е Р' является алгебраическим над полем Р тогда и только тогда, когда существуют такие различные числа £i,...,in E Е N U 0 и элементы ai,..., an поля Р, не все равные нулю, что ьа,=0. (Ю) Ясно, что равенство (10) справедливо тогда и только тогда, когда а — корень многочлена п Кх) = ^2а3х*> еР[х], который отличен от нулевого многочлена. □ 205
Следствие 1. Пусть Р с Р'. Если элемент а Е Р' алгебраичен над полем Р, то он алгебраичен над любым полем Р\, удовлетворяющим условию Р С Р\ С Р1. Следствие 2. Если Р С Р1 и a Е Р! — алгебраический над Р элемент, то в Р[х] существует единственный унитарный неприводимый над Р многочлен т(х), корнем которого является а. При этом для любого многочлена t{x) Е Р[х]: (t(a)=O)<*(m(x)\t(x)). □ По утверждению 5 множество T={f(x)eP[x]\f(a)=0} содержит элемент, отличный от нуля. Легко проверить, что Т — идеал кольца Р[х]. По следствию теоремы 1.ХХ существует единственный унитарный многочлен гп(х) такой, что Т = (га(ж))р[ж]. При этом для t(x) Е Р[х] справедливо включение t(x) Е T тогда и только тогда, когда m(x)\t(x). Если m(x) = u(x)v(x), где гх(ж), v{x) E P[x], degu(x) < degm(x) и degtj(a;) < degm(x), то и{а) ф 0 и v(a) ф 0, что вместе с условием т(а) = 0 противоречит отсутствию делителей нуля в поле Р\ Значит, т(х) — неприводимый над полем Р многочлен. D Следствие 2 показывает, что корректно Определение 9. Если Р7, Р — поля, Р с Р' и а Е Р' — алгебраический над Р элемент, то единственный унитарный неприводимый над полем Р многочлен, корнем которого является а, называют минимальным многочленом элемента а над полем Р и обозначают через СледствиеЗ. Если Р С Р*\ то элемент а Е Р' трансцендентен над полем Р тогда и только тогда, когда f{a) ф 0 для любого f(x) E П р и м е р 12. Множество Q[x] счетно. Так как ненулевой многочлен из Q[x] может иметь в поле R только конечное число корней, то в R имеется не более чем счетное множество элементов, алгебраических над Q. Поскольку множество R не счетно, то в Ш существуют трансцендентные над Q элементы. Методами математического анализа можно показать, что такими являются, например, число тг и основание натуральных логарифмов е. Элементы из R, трансцендентные над Q, обычно называют трансцендентными числами. 206
П р и м е р 13. Элемент х поля рациональных функций Р(х) транс- п цендентен над Р. Действительно, если f(y) = J2 агУ% € Р[у] ~~~ такой г=0 п многочлен над Р, что х — его корень, то многочлен /(х) = J2 агх% Ра~ г=0 вен нулю. Но тогда ai = 0 при i € 0, п и /(у) — нулевой многочлен. По следствию 3 утверждения 5 х — трансцендентный над Р элемент. Этот пример показывает, что простое расширение поля может быть расширением бесконечной степени (см. пример 10). Определение 10. Расширение Р' поля Р называют алгебраическим, если все элементы поля Рг — алгебраические над полем Р, и трансцендентным, если в Рг существует хотя бы один трансцендентный над Р элемент. П р и м е р 14. В силу примера 13 поле Р(х) — трансцендентное расширение поля Р. Поле С является алгебраическим расширением поля К, так как произвольный элемент а + Ы € С есть корень ненулевого многочлена (х — а)2 + Ь2 G Щх]. Важные примеры алгебраических расширений дает Утверждение 6. Если Р1 — расширение конечной степени поля Р, то Р' — алгебраическое расширение Р. D В векторном пространстве Р'Р по условию нет линейно независимых систем, состоящих более чем из [Рг : Р] элементов. Тогда по определению 8 все элементы поля Р' алгебраичны над полем Р. По определению ЮР' — алгебраическое расширение поля Р. □ Позже будет показано, что обратное утверждение неверно (см. пример 17). § 5. Простые расширения полей Строение простых расширений полей описывает Теорема 6. Пусть Р', Р - поля, Р С Pf и а е Р'. Тогда справедливы утверждения: а) если элемент а трансцендентен над Р, то 207
б) если элемент а алгебраичеп над Р, то Р(а) * Р[х]/таА*)- □ Определим отображение (р: Р[х] —> Р(а), положив <p(t(x)) = t{a) для t(x) G Р[х]. Очевидно, что tp — гомоморфизм колец. По теореме об эпиморфизме колец имеем коммутативную диаграмму: где т — изоморфизм, определяемый соотношением т([/(х)]) = (p(f(x)). По теореме 22.IX (р(Р[х\) = Р[а]. По теореме об образах и прообразах при гомоморфизме колец Р[а] — подкольцо поля Р(а). Так как (р(а) = а для любого а е Р и ср(х) = а, то Р[а] содержит Р и а. Ясно, что Ker^ = {t(x) € Р[х] | t(a) = 0}. а) Пусть элемент а трансцендентен над Р. Тогда по следствию 3 утверждения 5 Кекр = 0. Стало быть, Р[х] = Р[а] С Р(а). В силу примера 5 поле частных Г кольца Р[а] — это пересечение всех подполей поля Р(а), содержащих Р[а], т. е. содержащих Р и а (любое подполе из Р(а), содержащее Р и а, содержит Р[а]). По определению 3 Г = Р(а). В силу определения 5 Р(х) — поле частных кольца Р[х). По теореме 3 изоморфизм Р[х] = Р[а] влечет изоморфизм Р(х) = Р(а). б) Пусть элемент а алгебраичен над Р. Тогда Кепр = (гпа,р{х))р{х]- Так как по определению 9 maip(x) — неприводимый над Р многочлен, то по утверждению 17.ХХ P[x]/maip(x) — поле. Значит, и Р[а] — поле. Поскольку Р[а] содержит Р и а, то Р[а] = Р(а). Окончательно получаем, что Р(а) *< Р[х]/таА*)- п Теорема б позволяет описать вид элементов поля Р(а). 208
Утверждение?. Пусть Р С Р' и a G Р'. Тогда справедливы утверждения: а) если элемент а трансцендентен над Р, то элементы поля Р{о) имеют вид g{a)h{a)"1, где g(x) G P[x), h(x) G Р[х]\{0}; б) если элемент а алгебраичен над Р, то каждый элемент /3 G Р{ос) однозначно записывается в виде /3 = г(а), где r(x) G Р[х] и degr(x) < < deg таур(х). □ а) При доказательстве утверждения а) теоремы б показано, что Р{а) — поле частных своего подкольца Р[ос]^ элементы которого имеют вид t(a), где t(x) G Р[х]. По замечанию 1 элементы поля Р{а) имеют указанный вид. б) При доказательстве утверждения б) теоремы б показано, что Р(а) = = Р[а\- Значит, если /3 € Р(&), то /3 = £(а), где t(x) £ Р[х]. Разделим t(x) с остатком на maip(x): t(x) = д{х)та,р{х) + г(х), где degr(a:) < < deg та,р(х). Так как та^р(а) = 0, то t(a) = г (а). Следовательно, элементы поля Р(а) имеют указанный вид. Если t\(x) G P[x], degti(a;) < degma,p(x) и t\{a) — г(а), то многочлен и{х) = r(x)—ti(x) имеет корень а. По следствию 2 утверждения 5 и определению 9 та,р(х) \и(х). Однако deg^(x) < degmaip(x). Поэтому и(х) = 0ии(х) = г(х). □ Теперь мы мо^кем вычислить степень простого расширения поля, порожденного алгебраическим элементом. Утверждение 8. Пусть Р С Рг и a G Р' — алгебраический над Р элемент. Тогда [Р(а):Р]= deg mQ,P(s), и, в частности, Р{ос) — алгебраическое расширение поля Р. □ Пусть deg maip(x) = п. По утверждению 76) элементы поля Р(сх) линейно выражаются над Р через систему элементов а0 = е, а,..., ап~1. Ввиду утверждения 76) система элементов е, а,..., ап~1 линейно независима над Р и dimP(a)p = [Р(а) : Р] = degmaip(x). По утверждению 6 Р(<у) — алгебраическое расширение поля Р. □ Покажем, что в некоторых случаях простые расширения данного поля изоморфны. Теорема 7. Пусть Р* = Р(а) и Р" = Р(/?), где элементы а и (3 трансцендентны над Р. Тогда поля Р{<у) и Р((3) изоморфны, и существует такой изоморфизм /л: Р(а) —> Р{0), что /л(а) = а для 209
любого а Е Р и /jt(a) = j3 {в частности, поля Р{а) и Р((3) изоморфны над Р). □ Определим отображения т\\ Р[х] —» Р(а) и т2: Р[х] —> Р(/?)> положив ri(t(x)) — t(a) и т2(£(х)) = t(0) для t(x) G P[x). Как и в доказательстве теоремы 6 а), пользуясь трансцендентностью элементов а и (3 над полем Р, получаем Р[х] * п(Р[х)) = Р[а), Р[х] * та(Р[х]) - РЩ. Обозначим ф = т<1 о rfх. Тогда ^: Р[а] —► Р[/3] — изоморфизм колец, при котором ^(а) = а для а G Р и ^(а) = /3. Поскольку Р(а) и Р()б) — поля частных, соответственно, колец Р[а] и Р[уб] и существуют тождественные вложения е\: Р[а] —> Р(а) и 62'. Р[0\ —> Р(/?), то по теореме 2 существует такой изоморфизм ji: P{ol) —> Р(/?), что коммутативна диаграмма Тогда ji(a) = а при a G Р и /jl(o) = /?. П Теорема 8. Пусть для г G Т^ Р/ = Рг(аг) — расширение поля Р%, порожденное корнем аг унитарного неприводимого над Рг многочлена дг(х) G Рг[х]. Если существует такой изоморфизм a: Pi —> Р2, что (^lC^)) = 52{%), то существует такой изоморфизм т: Р{ -+ Р£, что р = а и r(pt\) = OL2 (определение отображения а1 см. утверждение 20.ХХ). □ Ясно, что многочлены д\(х) и д2(х) являются минимальными многочленами соответственно элементов а\ и ot2 над полями Р\ и Рг (см. замечание З.ХХ). По теореме 76) имеют место изоморфизмы: П: Px\x\jgx(x) -> Pi(ai), r2: Р2 при которых Tt([x]9t(x)) = осг и тг([аг]^(ж)) = аг для аг G Рг. Поскольку 52(ж) = cr'(gi(x)), то по утверждению 20.ХХ существует изоморфизм v. Pi[x]/gi(x) -^ Р2[х]/д2(х), 210
при котором v([t(x)]gi{x)) = [v'{t{x))]g2{xy Положив т = т2 о v о r-j"1, получаем изоморфизм r:Pi(ai)->P2(a2). При этом для а € Pi справедливы равенства: т(а) = T2(v(Ti1(a))) = r2(v([a]giix))) = т2([а'(а))д2(х)) = а'(а). Поскольку стг р = <т, то т(а) = ст(а) и г Кроме того, так как а'{х) = ж, то = а. r(ai) = -ъ(?(тг 1(<*i))) = T2(v([x]gi(x))) = т2([а'(х)92{х)]) = a2. □ Следствие. Пусть Pr — расширение поля Р. Если элементы а и ft из Р' алгебраичны над Р и maip(x) — mpfp(x), то существует такой изоморфизм \х\ Р{а) —> Р{Р), что ц(а) = а для а £ Р и /z(a) = /? (в частности, поля Р(а) и Р(Р) изоморфны над Р). Пример 15. Поля Р(а) и Р(Р) могут быть изоморфными и в случае, когда гаа,р(ж) ^ тп/з,р(#)- Например, Q(V^) = Q(2V^), хотя / \ 2 О am ^'r•^ ^2 О т^/о О\ / — ' ^^2\/2 О\ / — Рассмотрим еще некоторые свойства конечных расширений полей. Утверждение 9. Пусть Рг, Р — поля, Р С Р' и элементы ai,..., од G Р' таковы, что аг алгебраичен над полем P(ai,..., аг_1), г G 2, /г, a ai — над Р. Тогда степень расширения [P(c*i,..., од) : Р] ко- нечна. В частности, P(ai,... ,од) — алгебраическое расширение поля Р. □ Рассмотрим башню полей: Р С Р(ах) С ... С Р(аь..., од-i) С Р(аь..., од). По утверждению 3 справедливы равенства P(ai,..., аг) = P(ai,... ..., аг_1)(аг), г G 2, fc. По условию и утверждению 8 [Р(аи... ,аг) : Р(аъ ... ,at-i)] < оо, г £ 2Д, [P(ai) : Р] < оо. Тогда по теореме о башне полей [P(ai,..., а&) : Р] < оо и по утверждению 6 P(ai,..., од) — алгебраическое расширение поля Р. □ 211
Следствие. Степень расширения [Рг : Р] конечна тогда и только тогда, когда Pf — конечное алгебраическое расширение поля Р. □ Доказательство следует из утверждений 6 и 9. □ Опишем вид элементов конечного расширения поля. Утверждение 10. Пусть Р С Р1 и М = {mi,..., тп} — подмножество из Рг. Тогда P(mi,..., тп) — множество всех элементов из Р', имеющих вид /(mi,..., mn)p(mi,...,тп)""х, где /(£), д(х)еР[хи...,хп], 5(ть...,тп)^0. (11) □ Ясно, что множество Т всех различных элементов вида (11) содержится в P(mi,..., mn). Непосредственной проверкой с применением утверждения 1 устанавливаем, что Т — подполе поля P(mi,..., mn), a тогда и поля Р'. Поскольку Т D М и Т D Р, то по определению 3 T = P(mb...,mn). D § 6. Поля разложения многочлена Докажем одну из важнейших теорем теории полей. Теорема 9. Для любого поля Р и любого неприводимого над Р многочлена f(x) Е Р[х] существует такое поле Т, что Т = Р(а), где а еТ — корень многочлена f(x). □ Рассмотрим естественный гомоморфизм lp0:P[x]^P[x)/f(x)=T1, фо{9{х)) = [9(x)]f(x)- Так как многочлен f(x) неприводим над полем Р, то Ti — поле. Покажем, что в Т\ содержится подполе, изоморфное полю Р. Если а, Ь G Р и а ф Ь, то <ро(а) ф <fo{b)i так как в противном случае выполнялось бы равенство [o\f(x) == M/(a;)> означающее, что многочлен нулевой степени а — Ь делится на многочлен /(#), имеющий степень не меньше первой. Теперь ясно, что {[а]/^): а е Р} — подполе поля Ti, изоморфное полю Р. Так как e P[x], degg(x) < deg f{x)} , 212
то Применив к полю Ti конструкцию, изложенную в § 8.ХХ, получаем поле Т, изоморфное полю Т\ и содержащее поле Р: т= Последнее равенство означает, что Г = /() п п Пусть /(ж) = X) Л#г- Тогда /(ЭД/ф) = £ ЛИ}/^. По определению 1=0 г=0 операций в поле Т сначала вычисляем ^(/(И/(ж))) € 7i: г=0 г=0 а затем берем соответствующее значение в поле Т. Так как при изоморфизме полей только нулевой элемент переходит в нулевой, то /(И/(ж)) =: = 0, и, значит, [а?]/(ж) — корень многочлена f(x) в поле Г. D Следствие. Длл любого поля Р и любого многочлена f(x) G Е Р[яг], deg/(x) > 1, существует поле, содержащее поле Р и корень а многочлена f(x). □ Пусть /(*) = /n5i(*)fcl... <?*(*)*• (12) — каноническое разложение f(x) над полем Р. По теореме существует поле Т — Р(а), содержащее поле Р и корень а многочлена gi(x). Ясно, что /(а) = 0. □ Определение!!. Поле Р' называют полем разложения многочлена f(x) € Р[х] над полем Р, если Р' D Р и над полем Р# многочлен /(х) раскладывается на линейные множители. Это определение обобщает определение 18.IX, где рассматривается случай, когда само поле Р является полем разложения многочлена /(*) е Р[х). Т е о р е м а 10. Для любого поля Р и любого многочлена f(x) G Р[х), deg/(x) > 1, существует поле разложения f(x) над Р. 213
□ Пусть многочлен f(x) имеет над полем Р каноническое разложение (12). Обозначим: deggi(x) = £i и МЛ= £ _> Доказательство теоремы проведем индукцией по числу dp(/). Если dp(f) = О, то многочлен f(x) раскладывается над полем Р на линейные множители. Поле Р по определению 11 и является полем разложения f(x) над Р. Предположим, что теорема верна для любого поля Pi и любого такого многочлена д(х) G Pi [ж], что dp1 (д) < к — 1, и покажем, что тогда она верна для любого поля Р и любого многочлена f(x) G Р[х] с условием dp(x) = к. Пусть в разложении (12) deg д± (х) = £\ > 1. По следствию теоремы 9 существует расширение Р(а) поля Р, где а — корень многочлена дх (х). Разложим многочлен f{x) над полем Р{а) на неприводимые множители. Тогда dp(a)(/) < fc, так как над полем Р(а) у многочлена f(x) появляется, по крайней мере, к± новых линейных множителей. По предположению индукции существует такое поле Р' D Р(а), над которым многочлен f(x) раскладывается на линейные множители. Поскольку Р1 D P(ot) D Р, то Р1 — поле разложения многочлена f(x) над Р. □ Покажем, что среди полей разложения многочлена f(x) над полем Р существует "наименьшее". Определение 12. Поле разложения Р' многочлена f(x) G G Р[х] над полем Р называют минимальным, если Р' порождается над Р корнями многочлена f(x). Т е о р е м а 11. Для любого поля Р и любого многочлена f(x) G G P[x], degf(x) > 1, существует минимальное поле разложения f(x) над Р. В любом поле разложения f{x) над Р содержится некоторое его минимальное поле разложения над Р. □ По теореме 10 для многочлена f(x) существует поле разложения Р1 над Р. Возьмем в Рг все корни a?i,...,an многочлена /(#). Тогда поле P(ai,... ,an) по определению 12 является минимальным полем разложения f(x) над Р. □ Покажем теперь, что любые два минимальных поля разложения многочлена f(x) над данным полем Р изоморфны. Этот факт мы получим из более общей теоремы. 214
Т е о р е м а 12. Пусть а: Р\ —♦ Р<± — изоморфизм полей, f(x) = = Е № € Pi[x], <r'(f{x)) = £ сг(/г)хг G ft [ж], Pi - некоторое ми- г=0 г=0 нимальпое поле разложения многочлена f(x) над Р\ и Рч — некоторое минимальное поле разложения многочлена </(/(ж)) над Р%. Тогда существует изоморфизм ср: Р\ —♦ Рг, при котором (р(а) = ст(а) для аеРъ □ Проведем доказательство индукцией по числу dpx(f), определенному в доказательстве теоремы 10. Если dpt(f) = 0, то Pi — единственное минимальное поле разложения f(x) над Pi. В этом случае п f[x) = fn - Yl (x — аг), а» € Pi, и по утверждению 20.ХХ г=1 г=1 Значит, Рз — единственное минимальное поле разложения многочлена a'(f(x)) над Рг. В качестве требуемого изоморфизма ^ можно взять а. Предположим, что теорема верна для любых изоморфных полей Pi и Р2 и любого многочлена f(x) E Pi [ж], для которого dpx (/) < к — 1, где fc> 1. Пусть dp±(f) = fc, а разложение (12) — каноническое разложение многочлена /(ж) над полем Pi, где degpi(x) = i\ > 1. По утверждению 20.XX г=1 — каноническое разложение многочлена af(f(x)) над полем Рг. В поле Pi рассмотрим подполе Pi(ai), где <?i(ai) = 0. Ясно, что dp1(ai)(/) < к. В поле Рг выберем произвольный корень /?i многочлена <7'(sfi(2:)) и рассмотрим подполе РгСА). По теореме 8 существует изоморфизм причем т(а) = сг(а) для a G Pi- Поле Pi является минимальным полем разложения многочлена f(x) над полем Pi(ai), поскольку Pi = Pi(ai,...,an) = P(ai)(a2,... ,an). 215
Аналогично, поле Р% — минимальное поле разложения многочлена a'(f(x)) над полем P2(/?i). Так как dPl(ai)(f) < к и a'(f(x)) = т'(/(х)), то по предположению индукции существует изоморфизм tp: Pi —> Рч-> при котором <£>(7) — = т{у) для 7 £ A(ai). Тогда <^(а) = т(а) = а(а) для a Е Pi. □ Следствие. Пусть Pr u P" — произвольные минимальные поля разложения многочлена f(x) € Р[х] над Р. Тогда поля Рг и Р" изоморфны над Р. Для произвольного поля Р и произвольного многочлена /(х) G Р[х], degf(x) > 1, мы доказали существование поля, содержащего Р и все корни f(x). Представляют интерес поля, в которых содержатся все корни всех многочленов над ними. По определению 19.IX поле Р называют алгебраически замкнутым, если в нем содержатся все корни любого многочлена: f(x) G P[x], degf(x) > 1. П р и м е р 16. Поле С алгебраически замкнуто в силу теоремы Гаусса 23 (см. теорему 15.IX). Приведем без доказательства теорему о существовании алгебраически замкнутых полей. Теорема 13 (Штейниц 24). Для любого поля Р существует его алгебраическое расширение Р, являющееся алгебраически замкнутым полем {алгебраическое замыкание поля Р). Любые два алгебраических замыкания поля Р изоморфны. Опираясь на теорему Штейница, можно привести пример алгебраического расширения поля, имеющего бесконечную степень. П р и м е р 17. Алгебраическое замыкание Q поля Q является расширением бесконечной степени, так как над полем Q существуют неприводимые многочлены любой степени (см. следствие теоремы 18.IX). Задачи 1. Постройте поле частных для кольца 2Z. 2. Покажите, что для любого поля Р его аддитивная группа (Р, +) не изоморфна мультитпликативной группе (Р*, •). 23 К. Ф. Гаусс — немецкий математик (1777—1855). 24 Э. Штейниц — немецкий математик (1871—1928). 216
3. Покажите, что подполе Q(\/2, л/3) поля R есть множество чисел вида а + Ьл/2 + су/3 + d\/6, где а, 6, с, d € Q. 4. Покажите, что Q(\/2, л/3) = Q(V^ + \/3). 5. Покажите, что [Q(\/2, \/3) : Q] = 4. 6. Докажите, что если [Рг: Р] = р, где р — простое число, то в поле Рг нет подполей, содержащих Р и отличных от Р' и Р, и Р' — простое расширение Р. 7. Найдите минимальный многочлен элемента 1-И е С над полем Q. 8. В поле Р(х) рассмотрите расширение Р(ж2) поля Р, порожденное элементом ж2. Покажите, что [Р(ж) : Р(ж2)] = 2, а элемент ж2 трансцен- дентен над Р. 9. Докажите, что любой многочлен /(ж) G Р[ж], где deg/(x) = п > О, трансцендентен над полем Р, а [Р(ж) : Р(/(ж))] < п. 10. Докажите, что всякая рациональная функция f{x)g{x)~x e Р(ж), где (f(x)1g(x)) = е и deg<7(#) > 0 или deg/(x) > 0, трансцендентна над полем Р. 11. Пусть Р С Р' и А(Р) — совокупность всех элементов из Р', алгебраических над Р. Покажите, что А(Р) — подполе поля Р', содержащее Р. 12. Проверьте, что многочлен f(x) = х3 + х + е неприводим над полем Р = GF(2), и постройте поле Р(а), порожденное корнем этого многочлена. 13. Пусть аи (3 — соответственно корни в поле С неприводимых над Q многочленов ж2 + 1 и х2 + 2. Покажите, что Q(a) Щ Q(/?). 14. Пусть Рг — алгебраическое расширение поля Р, а Р" — алгебраическое расширение поля Р'. Покажите, что Р" — алгебраическое расширение поля Р. 15. Для многочлена ж3 — 2 Е Q[x] постройте минимальное поле разложения Г в С. Найдите степень [Т : Q]. 16. Пусть Рг — расширение поля Р, ai,...,an — элементы из Р'. Докажите, что P(ai,..., ап) = P[ai,..., ап] тогда и только тогда, когда элементы ai,..., ап алгебраичны над полем Р. 217
Глава XXII КОНЕЧНЫЕ ПОЛЯ И МНОГОЧЛЕНЫ НАД НИМИ Теория конечных полей (полей Галуа 25) представляет собой хорошую иллюстрацию общей теории полей, так как для конечных полей решение многих задач может быть доведено до конца. Примерами конечных полей служат поля вычетов Z/p, где р — простое число, и ), где многочлен f(x) неприводим над Z/p. § 1. Основные свойства конечных полей Рассмотрим вопрос о возможном числе элементов конечного поля. Теорема 1. ЕслиР — конечное поле, то \Р\ = рг, гдер — простое число utEN. При этом: б) t = [Р : Ро], где Ро — простое подполе поля Р; в) Р является минимальным полем разложения над Ро многочлена хр — х Е РоИ и совпадает с множеством всех его корней. □ Так как Р — конечное поле, то конечно его простое подполе Ро и конечна степень расширения [Р : Ро]. По теореме 4.XXI Ро = Ъ/р для некоторого простого р € N. Отсюда следует, что Char Р = Char Ро = р и|Р|=р*,где*=[Р:Я>]. Остается доказать утверждение в). Поскольку порядок группы Р* равен рг — 1, то ар ~"1 = е для всех а Е Р*. Теперь ясно, что совокупность элементов поля Р является множеством корней многочлена f(x) = х(хр±-1 - е) = xpt -х.П Следствие. Если Р — поле из рг элементов и a G Р, то для любого s G N справедливо равенство оР = а. □ Доказательство проводится индукцией по s и предоставляется читателю. □ 25 Э. Галуа — французский математик (1811-1832). 218
Теорема2. Для любого простого числа р и любого t GN существует единственное с точностью до изоморфизма поле, состоящее из рг элементов. □ Для простого числа р и t G N рассмотрим многочлен F(x) = = хр — х G Z/p[x]. По теореме 12.XXI существует минимальное поле разложения Р' многочлена F(x) над Ъ/р, Так как F'{x) = ргхр ~г — е — = — е, то (F(x)9F'(x)) = e. Значит, многочлен F(x) не имеет в поле Р' кратных корней. Пусть М = {ах,а2,..., otpt} — множество всех его различных корней в Рг. Тогда справедливы равенства с% =аг,ге 1,р*, (1) из которых следует {агаэуЬ = afaf = агаэ, i,j G TjK (2) Ввиду утверждения 9.ХХ и равенств (1) получаем: (а, + a3f = cjf + of = аг + а3. (3) Равенства (2) и (3) показывают, что множество М замкнуто относительно операций сложения и умножения. Поскольку множество М конечно, то по утверждению 2.XXI М — поле. Оно состоит из р1 элементов. Пусть теперь Р\ и Р2 — произвольные поля с единицами соответственно е\ и ег, состоящие из рг элементов (см. замечание З.ХХ). По теореме 1 в) поле Рг является минимальным полем разложения многочлена Ft(x) = егхр — егх е Ро%[х] над простым подполем Р§г поля Р%9 Так как CharPoi = CharPo2 = Р, то по теореме 4.XXI каждое из полей Poi и Д)2 изоморфно полю Z/p. Значит, существует изоморфизм полей a: Poi —*■ -Р02 и изоморфизм колец a*: Pqi[x] —> Р02И, при кото- (т \ т J2 агхг ) = Y2 сг(сьг)хг. Ясно, что ct'(jFi(x)) = F2(x). Поэтому по г=0 / г=0 теореме 12.XXI поля Pi и Рг изоморфны. □ Теорема 2 позволяет при рассмотрении многих вопросов, связанных с конечными полями, фиксировать произвольное поле из р* элементов, которое обозначается в таком случае через GF{jP). 219
В дальнейшем мы будем использовать следующие признаки делимости многочленов и целых чисел. Л е м м а 1. Для любых r,5GNu любого поля Р многочлен д{х) = = хг — е Е Р[х] делит многочлен f(x) = xrs — ее Р[х]. □ Непосредственно проверяется равенство xrs - е = (хг - е)(хг(*-1} + ... + хг + е). □ Л е м м а 2. Длл любых г, 5, a G N wcvio аг — 1 делит число ars — 1. □ Непосредственно проверяется равенство агз - 1 = (аг - 1)(аг(в"х) + ... + аг + 1). □ Опишем подполя данного конечного поля. Теорема 3. Пусть Pi, Рг — конечные поля. Поле Pi содержит подполе, изоморфное полю Р2, тогда и только тогда, когда \Р±\ = |Р2|* для некоторого t E N. При выполнении последнего условия в поле Р\ содержится единственное подполе, изоморфное полю Р2. U Пусть Pi D Т и Г ^ Р2. Тогда \Т\ = |Р2|. Так как |Pi| = |Г|*, где *=[A:T|,To|ft| = |ft|*. Обратно, пусть |Pi| = |Р2|е. Поскольку |Pi| =pj, a |P2| =р2> гДеР15 р2 — простые числа и fc, ^ G N, то имеем равенство р\ = р%. По основной теореме арифметики р\ = р2 = р и к = #. По лемме 2 р^ — 1 \рк — 1. Тогда по лемме 1 хр ~~1 — е \хр ™х — е, и, значит, для многочленов G{x) = хр — х и Р(ж) = жр — х выполнено соотношение G(x) \ F(x). По теореме 1 поле Pi ^- минимальное поле разложения многочлена F(x) над простым подполем Poi. Так как G(x) | F(x), то многочлен G(x) раскладьгоается над полем Pi на линейные множители. Как и в доказательстве теоремы 2, получаем, что корни многочлена G(x) образуют в поле Pi подполе Т, состоящее из ре = = |Р2| элементов. По теореме 2 Г = Р2. Предположим, что в Pi содержится подполе Ti, также состоящее из р£ элементов. Если Т\ ф Г, то многочлен G{x) = хр — х имеет в поле Pi больше, чем ре корней, что невозможно. Значит, Г — единственное подполе поля Pi, содержащее р£ элементов. □ Следствие. В поле GF{pl) для любого d e N такого, что d 11, существует единственное подполе из pd элементов. Этими полями исчерпываются все подполя в GF(pl). 220
Рассмотрим мультипликативную группу поля GF{pf). Через Orda будем обозначать порядок элемента а £ (GFfo*)*,-) — мультипликативный порядок а. Определение!.. Элемент а поля GFffi) называют примитивным, если все ненулевые элементы поля GF{pl) суть степени элемента а, т. е. если (GF(p*)*, •) = (а). Теорема4(о примитивном элементе). В поле GF{pl) существует примитивный элемент. □ Группа (Сг.Р(р*)*, •) — абелева и конечная. По утверждению 2.XI в ней существует такой элемент а, что Orda = expGFijp*)*. Значит, любой элемент Ь £ GFffl)* удовлетворяет соотношению 6Orda = е. Если Orda < \GF{pl)*\ — рг — 1, то многочлен xOrda — e имеет в поле GFip1) больше корней, чем его степень, что невозможно. Поэтому Ord a = рг—1, и (GFip1)*, •) = (а). Ясно, что a — примитивный элемент поля GF(pl). □ Следствие. Поле GF(pf) является простым алгебраическим расширением любого своего подполя. □ Например, оно порождается любым своим примитивным элементом. □ § 2. Неприводимые многочлены над конечными полями Покажем, что над любым конечным полем существуют неприводимые многочлены любой степени п > 1. Теорема 5. Если Р = GFfp*), то для любого п G N существует многочлен f(x) E Р[х] степени п, неприводимый над Р. □ Пусть Р' = GF(ptn) — минимальное поле разложения многочлена F(x) = хр — х G Р[х] над Р (см. теорему 2). По следствию теоремы 4 Р' = Р(а), где а — примитивный элемент поля Pf. Так как элемент а алгебраичен над полем Р, то он — корень некоторого неприводимого над Р многочлена f(x) G Р[х]. По утверждению 8.XXI [Р*: Р] = degf(x). А поскольку [Р' :Р] = п, то deg/(^) = п. □ Опишем корни неприводимого многочлена над конечным полем. Теорема 6. Пусть f(x) — неприводимый многочлен степени п над полем Р = GF(q), q = рг и F = Р(а) — расширение поля Р, 221
порожденное корнем а многочлена f(x). Тогда справедливы следующие утверждения: а) F — минимальное поле разложения многочлена f(x) над Р, причем f(x) имеем в F ровно п различных корней: a,afl o^""1; (4) б) f(x)\x*n -х. п □ а) Пусть f(x) = ]Г) /»#*• Так как /г G Р, то по следствию 1 тео- г=0 ремы 1 /г9 = /г при г £ 0, п. Поэтому для любого s E No справедливы равенства: г=0 г=0 Значит, все элементы вида (4) являются корнями многочлена f(x). Остается доказать, что они различны. Допустим, что ofl* = а4 , где 0 < s < t < п—1. Тогда при г = t—s получаем aqS r —ofl* = {о? — a)q = = 0 и, стало быть, оРг = а, 0 < г < п. (5) п-1 Элементы поля F имеют вид /3 = ]П Сгаг, где сг G Р. Поскольку г=0 с^ = сг при г G 0, п — 1, то ввиду (5) (ЗдГ = (3. Следовательно, все qn элементов поля F являются корнями многочлена хдГ — х, что невозможно в силу условия г <п. Поэтому элементы системы (4) различны. б) Так как [F : Р] = deg/(x) = п, то |F| = <?п, и по теореме 1в) все элементы поля F — корни многочлена G(x) = хдП — х G Р[х]. Поэтому G(x) и f(x) не взаимно просты над полем F, а тогда и над полем Р. Ввиду неприводимости многочлена f(x) получаем f(x) \ G(x). П Следствие1. Если f(x) — неприводимый многочлен степени п над полем Р = GF(q), f(x) фх и а, /3 — его корни в некотором поле разложения над Р, то: а) Orda = Ord/3; б) Orda|gn-1; в) Orda | qr — 1, если 0 < г < п. 222
□ а) Пусть Orda = d. Тогда а — корень многочлена xd — е Е Р[х). Следовательно, (/(x),xd — е) Ф е, и поэтому f(x) \xd — е. Поскольку /(/?) = 0, то Ord/3 < d = Orda. Аналогично показывается, что Orda < Ord/3. б) По теореме 66) f(x)\ (x^"1 — е) х. Ввиду неприводимости многочлена f(x) и условия f(x) Ф х, получаем j{x)\xqn~^ — e. Стало быть, Orda|<?n-1. в) Утверждение в), по сути дела, доказано при доказательстве пункта а) теоремы б. □ Следствие2. Неприводимый многочлен над конечным полем взаимно прост со своей производной. □ Утверждение справедливо ввиду теоремы 6 а) и следствия 2 теоремы 13.IX. □ Минимальное поле разложения неприводимого над конечным полем многочлена является полем разложения одновременно для целого класса многочленов. Утверждение!..В условиях теоремы 6 поле Р(а) является полем разложения любого неприводимого над Р многочлена g(x) G Р[х]у для которого degg(x) \n, и не содержит ни одного корня неприводимого над Р многочлена h(x) E Р[х], для которого degh{x) \ п. □ Если д(х) G Р[х] — неприводимый над Р многочлен степени т, то ввиду теоремы 66) g(x)\xqm — x. Пусть т\п. Тогда по лемме 2 qm — l|gn — 1 и по лемме 1 х9™"1 — е^9"""1 — е. Следовательно, xqTn — x|x^n — х. Таким образом, д(х)\хдП — х и по теореме 1в) Р(а) — поле разложения многочлена д{х). Если неприводимый над Р многочлен д(х) степени т имеет корень 7 Е P{ol)j то [Р(т) : JP] = т. Тогда по теореме о башне полей, примененной к башне Р(а) D Р(*у) D Р, получаем т \ п. □ § 3. Критерий неприводимости многочлена над конечным полем Теорема 5 показывает, что поле из рг элементов можно построить следующим образом. Для простого поля GF{p) существует неприводи- 223
мый над GF(p) многочлен f(x) E GF(p)[x] степени t. Поле GF(p)[x]/f(x) состоит из рг элементов. Однако для применения этого способа следует указать практически удобный критерий неприводимости многочлена над конечным полем. Теорема7 (Батлер 26, 1954). Многочлен f(x) G Р[х] степени п > 0 неприводим над полем Р = GF(pf) тогда и только тогда, когда выполнены условия: а) (/(*),/'(*)) = е; б) уравнение zpt - z = 0 (6) имеет в кольце R = P[x]/f(x) ровно рг решений. □ Уравнение (6) имеет в кольце R по крайней мере рг решений. Это элементы множества: Действительно, [a)pf{x) = [apt]f(x) = [a]f{x). При этом [аг]1{х) ф [а2]/(х), если ai,аг G Р и а\ ф а^ поскольку f(x) \ а2 — а±. Пусть многочлен f(x) неприводим над Р. Тогда по следствию 2 теоремы 6 выполнено условие а). Кроме того, в этом случае R — поле, и поэтому уравнение (6) не может иметь в R более рг решений. Значит, выполнено условие б). Обратно, пусть выполнены условия а) и б). Тогда уравнение (6) не имеет в R других решений, кроме элементов множества Р. Предположим, что многочлен /(х) приводим над полем Р. Тогда п > 1 и существуют такие многочлены /i(x), /2 (х) Е Р[х], что f{x) = h{x)f2{x), l<deg/i(rr)<n, геТД Покажем, что уравнение (6) имеет решение в Д\Р, и тем самым придем к противоречию, доказывающему неприводимость f(x). Из условия а) следует, что (/i(x),/2(#)) = e. Поэтому существуют такие многочлены u(x),v(x) £ Р[х], что u(x)fi{x) + v(x)f2(x) = e. 26 М. Батлер — современный американский математик. 224
При этом можно считать, что degu(x) < degf2(x) (в противном случае, разделим и(х) на /2(0?) с остатком: и{х) = q(x)f2(x) + r(x), и получим r(x)fi(x) + (q(x)fi(x) + v{x))f2(x) = е. Ясно также, что и(х) Ф 0. В кольце R имеем равенство Тогда [u(x)h(z)]2f(x) = [ti(a?)/i(x)]/(a.) • [e-v(x)f2(x)]f{x) = (x) - Hx)fi{x)v{x)f2{x))f{x) = [u{x)fi(x)]m. Следовательно, [ti(a?)/i(x)]J(x) = [u(x)fi(x)]f(x), т. e. [w(x)/i(x)]/(x) — решение уравнения (6) в кольце R. При этом [u(x)fi(x)]f(x) $~P, так как 0 < deg(u(x)fi(x)) < degf(x) 27. D Используя теорему 7, получим практический способ распознавания приводимости или неприводимости многочлена f(x) G GF{pl)[x] над GF(p*). Можно считать, что degf(x) = n > 1. I. Если (/(ж),/'(#)) ^ е, то по теореме 7 многочлен /(ж) приводим над GF&). П. Пусть (f(x),f'(x)) = е. Подсчитаем число решений уравнения (б) в кольце R. Произвольный элемент кольца R можно записать в виде [c(x)]f(x) = = [co + cix+... +cn-ia;n"1]/(x), где с* Е GF(pb). Элемент [c(x)]f(x) является решением уравнения (6) тогда и только тогда, когда справедливо равенство которое можно записать в виде: [Cg* + C?V + . . . + cjfV»-1)**]^) = [Со + . . . 27 Приведенное доказательство теоремы Батлера предложено А. В. Куприяновым. 225
или в виде [со • 0 + С1(хр' - х) + ... + Cn-iOs*1»-1^ - х»-1)]/^, = [О]/(х), (7) если учесть, что с? = с», i € 0, п — 1. Для каждого г € 1, п — 1 существует такой однозначно определенный многочлен QLi(x) = ао,г + OLi^X + . . . + Offi-l,^1*""1 ( что Поэтому равенство (7) можно переписать в виде [со • 0 + ciai(x) + ... + Cn-iOn-ifr)]/^) = [0]/(x). (8) Так как deg/(x) = n, а degajC^) < тг при г G 1,п — 1, то равенство (8) равносильно условию в кольце со • 0 + ciai(x) + ... + Cn_ian_i(x) = 0. (9) Приравнивая коэффициенты при одинаковых степенях х в правой и левой частях равенства (9), получим систему линейных уравнений: г0 • со + ao,ici + ... + c*o,n со + an_i,ici + ... + an_i,n_icn_i = 0, которую запишем в матричной форме: АС1=01, (10) где (0 ao,i ... ao,n-i 0 an_i,i ... an_i>n^ Таким образом, число решений уравнения (6) в кольце R равно числу решений системы линейных уравнений (10), т. е. равно (р*)п^ 226
_ pt(n rang л) pjo теОреме 7 многочлен f(x) неприводим над GFfj)1) тогда и только тогда, когда п — rang А = 1, т. е. rang А = п — 1. Изложенный алгоритм позволяет не только ответить на вопрос — приводим или неприводим многочлен f(x) над полем GF(jpl). Используя его, можно разложить многочлен f(x) в случае приводимости в произведение многочленов меньших степеней. Рассмотрим два случая. Случай I. d(x) = (/(#),/'(#)) Ф е. Если при этом f(x) ф 0, то О < deg/'(x) < п. Значит, 0 < degd(x) < n и f(x) = d(x)fi(x), где 0<deg/i(a:) < п. Пусть f(x) = 0. Из равенств f(x) = ]Г f%x% и f'(x) = £ %f%x%"x = 0 г=0 г=1 получаем, что г/г = 0 при г € 1, п. Следовательно, если j € 1, п и f3 ф 0, то р | j, так как Char GF(pl) — р. Поэтому многочлен f(x) имеет вид: Ввиду равенств (ff J = f3 можем записать: f{x) = h*xp'r + ... + h*aTi + ... + Щ = h{x)p, где h(x) = hnxp + ... + h3xp + ... + h0 и h3 = fv3 , f3 ф 0. Случай II. (f(x),f'(x)) = e. Если многочлен f{x) приводим над GF{pl), то rang A < n — 1, и существует ненулевое решение с^ — (со,... .... сп-\)т системы уравнений (10), где сг фО при некотором г € 1,п — 1. Тогда [с(ж)]/(х) — решение уравнения (6), где с(х) = cq + с\х + ... ... + Cn-io:71"1, 0 < degc(x) < п. ) Теорема8 (Берлекэмп 28, 1967). .Б'слгл Р = GFtf), f(x) € Р[х] — унитарный многочлен и [c(x)]f(x) — такое решение уравнения (6), что 0 < deg c(x) < п, то X{x)Ax)-cl), (и) и существует такой элемент /3 £ Р, что 0 < deg(/(rr), с(х) — /3) < п = deg/(x). Сначала докажем вспомогательное утверждение. 28 Е. Р. Берлекэмп — современный американский математик. 227
Л е м м а 3. Пусть Р — произвольное поле, аДх) G Р[х], г € l,fc г/ ,aj(x)) = е при г ^ j- Если f(x) — такой унитарный многочлен к из Р[х], что f(x)\ П 1 г=1 П Пусть к = 2. Из условия (ai(x),a2(#)) = e получаем равенство x)), (/(х),а2(ж))) = е. Отсюда и из соотношений: (№,ai(x))\f(x), (/( по свойству взаимно простых многочленов следует соотношение (f(x)iai(x))-(f(xU2(x))\f(x). (12) Пусть ) = /(х)иг(х) ), a2(x)) = /(x)u(rr) + а(х)^(а:) Перемножив левые и правые части равенств (13), ввиду условия f(x) | ai(x)u2(x) получим: f(x)\(f(x),ai(x))(f(x),a2(x)). (14) Из соотношений (12) и (14) получаем требуемое равенство f(x) — = (/(x),ai(x))(/(x),a2(x))3 так как /(х), (/(x),ai(x)) и (/(х),а2(х)) - унитарные многочлены. Дальнейшее доказательство проводится индукцией. □ Перейдем к доказательству теоремы. □ По теореме 1 справедливо равенство х*>'-х=Ц(х-а), из которого следует равенство c(x)pt - с(х) = Л (с(х) - а). (15) авР 228
Если а, /3 е Р и а ф /?, то (с(ж) - а, с(х) - /3) = е. (16) По условию [c(x)]y,x4 = [с(х)]/(х). Значит, f(x)\c(x)p —c(x). Учитывая равенство (15), получаем (17) В силу леммы 3 из равенства (16) и соотношения (17) следует требуемое равенство (11), а ввиду degc(x) > 0 существует нужный элемент /?. □ Условие унитарности многочлена f(x) в теореме 8 не ограничивает общности, так как произвольный многочлен f(x) можно записать в виде f(x) = fn • /*(#)> гДе /п — старший коэффициент многочлена /(ж), а /*(х) — унитарный ассоциированный с f(x) многочлен. П р и м е р 1. Выяснить, приводим или нет многочлен f(x) — = х4 — 2 Е GF(3)[x] над GF(3), и в случае приводимости разложить его на множители. Так как (f(x),f'(x)) = (х4 — 2, ж3) = е, то имеет место случай П. Вычислим многочлены од (я), г € 1,3. г = 1. х3 - х = х3 + 2x(f(x)): ai(x) = 0 + 2x + Ox2 + Ire3. 4 6 х - х2 = 2ж2 + 2ж2 = г = 2. Так как х4 = 2(/(ж)), то ж6 = )) = ж2(/(а:)): а2(х) = 0 + Ох + 1х2 + Ох3. г = 3. Так как х5 = 2х(/(х)), то х9 = 4х(/(х)) и х9 = х(/(х)). Значит, х9 - х3 = х + 2х3(/(х)): а3(х) = 0 + 1х + Ох2 + 2х3. Поэтому система уравнений (10) имеет вид f о 0 0 0 2 0 1 0 0 1 0 (M 1 0 2 1 со с2 (18) Легко проверить, что rang Л = 2<п —1 = 3. Следовательно, многочлен /(х) приводим над GF(3). Общее решение системы (18) имеет вид с^ = (co,ci,O,ci)T. Поэтому можно выбрать решение уравнения (6) с(х) = х3 + х. По теореме 8 Дх) = х4 - 2 = (х4 - 2,х3 + х)(х4 - 2,х3 + х - 1)(х4 - 2,х3 + х - 2). 229
Нетрудно проверить, что f(x) = (ж2 + 2х + 2){х2 § 4. Число неприводимых многочленов данной степени Для определения числа неприводимых многочленов данной степени над конечным полем рассмотрим сначала некоторые числовые функции. Определение 2. Функция Мёбиуса29 /i(n) от натурального аргумента п определяется следующим образом: если п имеет каноническое разложение п = р"1.. .p£fc, то 1, если п = 1, = { (-1)*, если ai = ... = ак = 1, О, если За* > 1. Утверждение 2. При любом п G N справедливы равенства: □ При п = 1 по определению 2 /i(l) = 1. Пусть п — р^1 ...р£*. При подсчете суммы ^ м(^) следует рассматривать только делители d d\n числа п, имеющие вид d = 1 и d = pix.. .pi8, где ц G l,fc,i£ Ф im при £ фт. Тогда (-l)3C3k + ... + (-1)Л = (1 - l)k = 0. □ 29 А. Ф. Мёбиус — немецкий математик (1790—1868). 230
УтверждениеЗ (формула обращения Мёбиуса). Если F(n) и f(n) — функции натурального аргумента, связанные соотношением n), (19) d\n то при любом п € N имеет место равенство /(»)• (20) d\n □ Пользуясь равенством (19), запишем левую часть доказываемого равенства (20) в виде d\n и соберем коэффициенты при f(di) для каждого фиксированного d±. Значение /x(d) является одним из коэффициентов при f{d{) тогда и только тогда, когда d \ n и d\ | *|, т. е. когда d\ -j-. По утверждению 2 (d) = J1' ПрИ 37 = -1' т> е- при dl = п' |0, при ^ ф\, т. е. при di ^ п. Таким образом, в сумме (21) остается одно ненулевое слагаемое — 1 • f(n). Этим и доказывается равенство (19). □ Обозначим через Фр((1) число унитарных неприводимых над полем Р многочленов степени d. Утверждение^ Если Р = GF{pl), то при п £ N справедливо равенство d\n П Пусть многочлен f(x) £ Р[х] неприводим над полем Р и deg f(x) = = п. По теореме 6 поле Р(а), где f(a) = 0, является минимальным полем разложения для f(x) над Р и содержит п его различных корней. 231
По утверждению 1 для любого неприводимого над Р многочлена д(х) Е Р[х] степени d, где d | п, поле Р(а) является полем разложения. По теореме 6 оно содержит d различных корней многочлена д(х). Различные унитарные неприводимые над Р многочлены не имеют общих корней в поле Р(а), так как в противном случае они были бы не взаимно просты над Р и совпадали. Значит, в поле P{ot) содержится ]Г} d$p{d) различных элементов: d\n d\n С другой стороны, каждый элемент поля P(ot) является корнем многочлена F(x) = хр п — х и, следовательно, — корнем некоторого унитарного неприводимого над Р многочлена г(х) £ Р[х]. По утверждению 1 degr(rc) | п. Тогда ptn < ]Г] d$p{d), и требуемое равенство доказано. □ d\n Теорема 9. Если Р = GF(p*), то при п Е N справедливо равенство фИ") = -£/Ф0(р*)*- (22) Ud\n П Положим F(n) = (p*)n и f(d) = d$p{d). По утверждению 4 F(n) = = Yl f(d)- Тогда по утверждению 3 d\n d\n откуда и следует формула (22). □ § 5. Некоторые методы построения неприводимых многочленов над конечным полем Один из способов построения неприводимого многочлена данной степени п над полем GF(q), где q=pf, состоит в случайном переборе мно- 232
гочленов вида f{x) = хп + fn-ix71"1 + ... + /о, /, G GF(q), (23) где /о 7^ 0, и проверке их неприводимости на ЭВМ с помощью алгоритма, указанного в § 3. Всего многочленов вида (23) (q — l)qn~1, а неприводимых из них по формуле (22) 1 х—ч и 1 л л. п ф(п) = - > v{d)qd = ~(qn -qpi - qvi - ... + qviv* +...), nf^ n d\n где рг — простые делители числа п. Значит, вероятность успеха, т. е. случайного нахождения неприводимого многочлена, равна Ф(п) Последнее число при достаточно больших п приблизительно равно Я тт п(# ~ 1) — г-. Поэтому, проделав испытании, можно ожидать, что n(q — 1) q найдется хотя бы один неприводимый многочлен. Число операций, нужных при проверке на неприводимость одного многочлена, имеет порядок qn3. Следовательно, общее число операций — порядка (q — 1)п4. Однако имеются различные теоретические методы построения неприводимых многочленов. Изложим один из таких методов. Обозначим Р = GF(q) и рассмотрим отображения а: Р[х] —* Р[х] и т: Р[х] —>• Р[х], определенные формулами: (24) (25) г=0 Ясно, что т(а(х))=ха(а(х)). (26) П р и м е р 2. Если Р = GF{2) и а(х) = е + х + х2, то <т(а(х)) = = е + х + ж3, т(а(х)) —х + х2+х4. 233
Утверждение 5. Для любых д(х), h(x) £ Р[х] и любых а,Ь Е Р, г € N справедливы равенства: а) <j(ag(x) + bh{x)) = aa(g(x)) + ba{h{x))\ б) r(ag(x) + bh(x)) = ar(g(x)) + br(h(x)); в) r(xzh(x)) = r{h{x)Y\ П Равенства а) и б) легко следуют из формул (24) и (25). п г Докажем в). Пусть h(x) = J2 h3x3. Так как Щ = h3, то Щ = h3J и з=о справедливы равенства: Утверждение 6. Если g(x) и h(x) — такие многочлены из Р[х], что g(x) \ h{x), то: a)r(5(x))|r(/i(x)); 6) a{g{x))\a(h(x)). П П а) Пусть h(x) = g(x)v(x), где v(x) = 5Z vt^f • Тогда в силу утвер- г=0 ждения 5 справедливы равенства: r(h(x)) = т(Е^д() г=0 г=0 г=0 г=0 показывающие вьшолнение соотношения а). б) Из соотношения а) и равенства (26) следует соотношение б). □ Следствие. Если многочлен a(h(x)) неприводим над Р, то и многочлен h(x) неприводим над Р. Утверждение?. Если многочлен f(x) G Р[х] неприводим над Р и д(х) € Р[х] — такой многочлен, что (a(f(x)),a(g(x))) ф е, то П Если f(x) \ д(х), то (f(x),g(x)) = e и существуют такие многочлены u(x),v(x) £ Р[х], что u(x)f(x) +v(x)g(x) = е. По утверждению 5а) 234
тогда выполняется равенство a(u{x)f(x)) + a(v(x)g(x)) = a(e) = е. (27) Из соотношений f(x) \ u(x)f(x) и д(х) \ v(x)g(x) по утверждению 66) получаем соотношения: cr(f(x)) | a(u(x)f(x)), а(д(х)) | a(v(x)g(x)). (28) Из соотношений (27) и (28) следует равенство = е, (29) где u\{x),v\{x) € Р[х], означающее, что (a(f(x)),a(g(x)) = e вопреки условию. Полученное противоречие доказывает, что f(x) \g(x). □ Определение 3. Пусть f(x) — произвольный многочлен над полем Р и {ai,... ,ав} — множество всех его ненулевых корней в поле разложения над Р. Через 0(/) обозначим НОК мультипликативных порядков элементов а*: 0(/) = [Ordai,... ,Ordas]. Если f(x) = хе, то полож:им 0(/) = 1. Читателю предлагается самостоятельно доказать, что параметр 0(/) не зависит от выбора поля разложения многочлена f(x). П р и м е р 3. Если f(x) — унитарный неприводимый над GF(q) многочлен и f(x) ф ж, то по следствию 1 теоремы 6 0(/) = Orda, где a — произвольный корень f(x) в поле разложения над GF(q). Ясно, что при этом 0(/) | qn — 1, где п = deg/(x). Теорема 10 (Цирлер 30,1967). Если унитарный многочлен f(x) G € GF(q)[x] неприводим над GF(q) и f(x) Ф х, то все неприводимые над GF(q) делители многочлена cr(f(x)) имеют степень 0(/). □ Пусть 0(/) = t3 fi(x) — неприводимый над GF(q) делитель многочлена a(f(x)) и deg/i(x) = к. По определению 3 все корни многочлена f(x) являются корнями многочлена хг — е е GF(q)[x]. Поскольку f(x) не имеет кратных корней, то f(x) | хг—е. По утверждению 6 б) a(f(x)) | а(х1 — е). Так как а{х1 — ё) = = xqt~x - е, то /i(x) | х9*-1 -ей fx{x) \ xqt - х. По теореме 1 поле GF{ql) является полем разложения многочлена xq — х, а тогда — полем разложения и многочлена fi(x). Значит, поле 30 Н. Цирлер — современный американский математик. 235
GF{qt) содержит минимальное поле разложения многочлена fi(x) — поле GF(qk). Отсюда по теореме 3 следует, что к \ t. По условию f(x) фх,и поэтому (/(х), х) = е. Тогда (a(f(x)),x) = e и из соотношений fi(x) \xqk —xи fi(x) \a(f(x)) следует, что fi(x) \xq ~1 — —е. Поскольку xq ~l — е = а(хк — е), то {a(f{x)),a(xk — е)) ф е и по утверждению 7 f(x) \хк — е. Таким образом, если /(а) = 0, то ак = е и 0(/) | к, или 11 к. Итак, к = L □ Следствие (Орэ-Глизон-Мэрш 31). Еслге многочлен f(x) € G GF(^)[x] неприводим над GF{q), degf(x) = n и f(x) ф х, то многочлен a{f{x)) неприводим над GF(q) тогда и только тогда, когда O(f)=qn-1. □ Если многочлен a(f(x)) неприводим над GF(q), то по следствию утверждения 6 многочлен f(x) неприводим над GF(q). По теореме 10 dega(f(x))=O(f) = q»-l. Обратно, пусть 0(/) = qn — 1. По теореме 10 степень каждого неприводимого над GF(q) делителя многочлена <r(f(x)) равна qn — 1. Поскольку dega(f(x)) = qn — 1, то a(f(x)) — неприводимый над GF(q) многочлен. □ П р и м е р 4. Существуют простые числа вида 2п — 1, например: 22 - 1 = 3,23 - 1 = 7,25 - 1 = 31,27 - 1 = 127 (их называют простыми числами Мерсенна 32). Если унитарный многочлен f(x) £ GF(2)[x], deg f(x) = n>l,2n—1 — простое число и f(x) — неприводим над GF(2), то из 0(/) | 2п — 1 следует 0(/) = 2п — 1. Тогда по следствию теоремы 10 многочлен a(f(x)) неприводим над GF(2). Воспользуемся этим и последовательно построим неприводимые над GF(2) многочлены: f(x) = х2+ + х + е, a(f(x)) = х3 + х + е, cr2tf{x)) = a(a(f(x))) = x7 + х + е, сг3(/(х)) = х127 + х + е. Задачи 1. Опишите подполя поля GF (236). 2. Найдите все примитивные элементы полей GF(5) и GF(22). 3. Сколько примитивных элементов в поле GF(pf)? 4. Докажите, что мультипликативная группа Р* бесконечного поля Р не является циклической. 31 О. Орэ — норвежский математик (1899—1968), А. Н. Глизон, Р. В. Мэрш — современные американские математики. 32 М. Мерсенн — французский математик (1588—1648). 236
5. Пользуясь критерием Батлера, определите, приводимы или нет над полем GF(2) многочлены х2 + е и х3 + х + е. 6. Пользуясь критерием Батлера, определите, приводим или нет над полем GF(3) многочлен х3 + х2 + е. 7. Покажите, что если ni,n2 Е N и (пх,П2) = 1, то ц(пгП2) = 8. Покажите, что для п G N справедливо равенство п = Yl V>(d)i гДе (х) — функция Эйлера. 9. Покажите, что для п G N справедливо равенство d\n 10. Постройте поля из 8 и 9 элементов. 11. Найдите выражение Фр(п) при простом п, Р = GF(q), q = рг. 12. Найдите 0(/), где f(x) = х3 + 2х + 2 G GF(3)[s]. 13. Покажите, что число унитарных многочленов f(x) G GF(9)[a:] степени п таких, что 0(/) = qn — 1, равно ^у> (§п — 1). 14. Постройте неприводимый над GF(2) многочлен степени 31. п 15. Докажите, что если f(x) = ^ fax1 — многочлен степени п над полем GF(q) и 0(/) = qn — 1, то многочлен i iX я- г=0 неприводим над GF(q). 16. Постройте неприводимые многочлены степени т над полем GF(q) в следующих ситуациях: Q т 3 4 3 8 4 5 4 15 5 6 5 24 17. Проверьте, приводим или нет над полем GF(3) многочлен х4 + х3 + х + 2. В случае приводимости — разложите на неприводимые множители. 237
Глава ХХШ ЗАДАНИЕ ГРУПП ОБРАЗУЮЩИМИ ЭЛЕМЕНТАМИ И ОПРЕДЕЛЯЮЩИМИ СООТНОШЕНИЯМИ Один из широко распространенных методов задания различных алгебр основан на использовании их систем образующих элементов и некоторых соотношений между образующими элементами. В данной главе мы познакомимся с этим методом в применении к группам. Любую конечную группу, как и всякий конечный группоид, можно задать таблицей Кэли, т. е. списками всех его элементов pi,...,pn и всех соотношений вида giQj = gk{ij)i hj £ 1, п. В принципе то же самое молено сказать и о задании бесконечной группы: только в этом случае все элементы группы и всю ее таблицу Кэли нельзя выписать в явном виде. Практически всю таблицу Кэли невозможно выписать и для конечной группы, если ее порядок достаточно велик. В связи с этим естественно возникает вопрос: нельзя ли задать группу, указав лишь некоторую (по возможности небольшую) часть ее элементов и некоторую систему соотношений между этими элементами? Прежде чем рассматривать этот вопрос в общем виде, разберем два простых примера. Пример 1. Пусть Сш — циклическая группа порядка га, и д — любой из порождающих ее элементов. Тогда в Сш выполняется соотношение дт = е, и все ее элементы исчерпываются степенями р°,..., дт~1 элемента д. В этом смысле группа Ст вполне определяется одним элементом д и одним соотношением дт = е. П р и м е р 2. Рассмотрим группу движений правильного п-угольника, или группу диэдра степени п (см. § 7.XI). Ее подстановочное представление D(n) является подгруппой симметрической группы Sn и порождается двумя подстановками: /1 2...П-1 п\ (I 2 ... п-1 п\ 9l==\2 3...n I J' 92={п п-1 ... 2 1 ;■ Легко видеть, что в группе D{n) выполняются соотношения: 9г = е, 9J = e, g2gi = 9^92, 520Г1 = 9№- (1) 238
Пользуясь этими соотношениями, любое произведение элементов #i, дг *, 92 > 92Л можно преобразовать к виду: д\д^ fc€0,n- 1, £ € ОД- (2) (Докажите это индукцией по числу сомножителей в исходном произведении.) А так как по следствию 2 теоремы 16.XI порядок D(n) равен 2п, то все произведения вида (2) попарно различны. Следовательно, каждый элемент группы D(n) однозначно представляется в виде (2). Пользуясь соотношениями (1), легко найти и правило умножения элементов из D(ri), записанных в виде (2): если £ = О, , если £= 1, где гп(х) — остаток от деления х на п. Таким образом, группа D(n) полностью определяется системой образующих элементов {pi, 52} и системой соотношений (1). В связи с этим систему (1) называют системой определяющих соотношений группы D(ri) в системе образующих {Рь 92}. В общем случае понятие системы определяющих соотношений группы в заданной системе образующих будет приведено ниже. Здесь же отметим еще, что в принципе группу D(ri) молено отождествить с группой Gn всех выражений вида (2), перемножаемых по правилу (3). Такое представление группы D(n) группой Gn иногда бывает полезным в силу того, что при больших п правило (3) значительно проще правила умножения элементов из D(n), как движений правильного n-угольника, или, как подстановок степени п. В качестве примера воспользуйтесь этим для решения уравнения xg\g2X — g29\ B группе D(n). 239
§ 1. Общая конструкция группы, заданной образующими элементами и определяющими соотношениями Зафиксируем множество букв с индексами А = {a*: i £ I}. Каждой букве щ сопоставим символ а"1 и образуем множество А = {af: i € /, е€{1,—1}}, где а\ = ец, которое назовем алфавитом. Определение!.. Любую последовательность вида составленную из элементов множества А, назовем словом длины к в алфавите А. В целях общности последовательность, не содержащую ни одного члена, будем называть словом длины нуль, или пустым словом. Условимся обозначать: слова — буквами Р, Q, Д, L без индексов и с индексами, пустое слово — буквой е, длину слова Р — через £(Р), равенство слов Р, Q — в виде Р = Q, множество всех слов в алфавите А — через И^(Л). Определение 2. Произведением слов Р, Q назовем слово, обозначаемое через PQ и получающееся путем приписывания к слову Р справа слова Q. Легко видеть, что множество W(A) с операцией произведения слов является полугруппой с нейтральным (единичным) элементом е. Ее называют полугруппой слов в алфавите А. Определение 3. Обратным к слову (4) назовем слово а^к£к ... а~*г. Обратным к пустому слову назовем само это слово. Слово, обратное к Р, обозначим через Р"1. Заметим, что при Р ф е слово Р"1 не является обратным элементом к Р в полугруппе (И^(Л); •). Определение 4. Говорят, что слово Р входит в слово Q, или является подсловом слова Q, если Q = LPR при некоторых (возможно пустых) словах L, R. Если слово Р входит в Q много раз, то говорят о нескольких вхождениях слова Р в Q. В частности, считается, что пустое слово е имеет 240
к + 1 вхождений в слово (4): п • • • а% ~ еаче-' • Слово вида Р£... Р6,, где е € {1,-1}, будем обозначать ради крат- к кости через Рк при е = 1и через Р~к при е = —1. Определение 5. Любую пару (Р, Q) слов Р, Q из W(A) назовем соотношением в алфавите А При этом Риф будем называть соответственно левой и правой частями соотношения (Р, Q). Соотношения вида (а£а~е, е) и (е, af а~е), где £ G {1,-1}, будем называть Зафиксируем произвольное (возможно пустое) множество S соотношений в алфавите А и определим по нему отношение эквивалентности на множестве W(A). Определение б. Элементарным преобразованием слова Р по соотношению (Pi, Qi) назовем замену в Р любого одного вхождения слова Р\ или Qi соответственно словом Q\ или Pi. Если Р, Q € W(A) и Q получено из Р одним элементарным преобразованием по соотношению (Pi,Qi), то будем писать Р —> Q. В этом случае будем писать (Pi,Qi) также Р -± Q, если S — некоторая система соотношений и (Pi, Q\) € S s или (Pi,Qi) — тривиальное соотношение. Из определения видно, что если Р —> Q, то и Q —► Р. Следовательно, корректно Определение?. Слова Р, Q € И^(.А) называют S-жвивалент- ными (и пишут Р ~ Q), а соотношение (Р, Q) — следствием системы s S, если: ЗА; € No, 3Ro,Ri,...,Rk<= W(A): P - Rq -► #i ->... -» i?jt = Q. s s s П р и м e p 3. Для любого слова P G PF(A) и любой системы соотношений S имеем: РР-1 - е, Р~гР - е. (5) 5 5 ' Пусть Р есть слово (4). Тогда РР'1 = а^1 ...аег*а~£к .. .а~£1, и, производя последовательно замены подслов а£*а~^к,..., a^a~£l пустым словом е, мы получим в итоге е. А так как при этом производились элементарные преобразования по тривиальным соотношениям вида 241
(a^at e, e), то согласно определению 7 имеем РР г ~ е при любой системе S (и даже при S = 0). Аналогично доказывается, что Р~гР ~ е. Теорема1. Отношение ~ есть конгруэнция на полугруппе s (W(A;-), а соответствующая факторполугруппа является группой. □ Непосредственно из определения 7 видно, что отношение ~ ре- флексивно, симметрично, транзитивно и обладает свойством: VP, Q,L,R<= W(A): ((Р ~ Q, L ~ Л) =► (PL ~ £Л)). S S S Значит, ~ — конгруэнция на полугруппе слов (W(A);-). Обозначим s класс S-эквивалентных слов, содержащий слово Р, через [P]s> & множество всех классов через W(A)/S. Из следствия утверждения 5.Х получаем: множество W(A)/S с операцией, определенной формулой V[P]s, [Q]s e W(A)/S: [P]s • [Q]s = [PQ]s, есть полугруппа. Легко видеть, что ее нейтральным элементом является класс [e]s, и, как следует из (5), обратным к классу [P]s является класс [Р"1]^. Следовательно, W(A)/S ~ группа. D Определеннее. Группу (W(A)/S; •) из теоремы 1 называют абстрактной группой, заданной системой образующих А и системой определяющих соотношений S, и обозначают в виде (A; S). Заметим, что здесь термин "система образующих группы" использован в несколько ином смысле, чем в главе XI, поскольку элементы щ из А не являются даже элементами группы (Л; S). В действительности эта группа порождается системой ее элементов [о»] 5» i G J, а использование указанного термина оправдывается лишь тем, что иногда, допуская вольность речи, элементами группы (A; S) называют не только классы слов, но и сами слова. Из определений 7 — 8 следует Утверждение!.. Пусть Si, S2 — системы соотношений в алфавите А. Все соотношения системы S2 являются следствиями системы Si в том и только в том случае, когда (A; Si) = (A; Si U S2). □ Если все соотношения из #2 являются следствиями системы Si, то легко видеть, что для любых слов Р, Q € W(A) справедлива импликация: 242
Следовательно, [P]sius2 = [P]su и потому (A; Si US2) = (A; Si). Обратно, пусть выполнено последнее равенство, и (Р, Q) Е S2. Тогда Р € Е [Q]s2 c [Q]sius2 = [Q]su т- е- (Р> Q) есть следствие системы Si. D Определение!). Две системы соотношений Si, S2 называют эквивалентными и пишут Si ~ S2, если каждое соотношение любой одной из них является следствием другой системы. Если системы Si, S2 содержат по одному соотношению, то вместо эквивалентности систем говорят об эквивалентности соотношений, сохраняя то же обозначение Утверждение2. Отношение « на множестве М всех систем соотношений в алфавите А является отношением эквивалентности, причем V Si, S2 e M: Si « S2 ^ (A; Si) = (A; S2>. (6) □ Соотношение (6) является следствием утверждения 1, а тот факт, что ^ есть отношение эквивалентности, легко доказывается с использованием соотношения (6). □ Утверждение 3. Для любых слов L, P, Q, Re W(A) и любых £, <5€{1,— 1} имеют место эквивалентности: а) (Р, Q) « «?, Р); б) (Р, Q) « (L*L-ePR6R-6, Q); в) (Р, Q) « (LPfl, LQB); г) (Р, Q) « (PQ-1, е); д) (Р, д) « (Р-1, Q-1); {s П Эквивалентность а) очевидна, б) следует из (5) при S = 0, в) доказывается соотношениями: LPR -> £<2Д, P~L-1LPAR-1 -» L^LQRR'1 ~ Q; (P,Q) 0 (LPR,LQR) 0 г), д), е) следуют из а), б), в): (Р, Q) « (PQ-1, QQ-1) « (PQ-1, е) ; (Р, Q) » (p-^g-1, P~1QQ-1) » (Q-1, Р-1) « (Р-1, Q-1); (PQ, gP) » ((PQ) -\ 243
(PQ, QP) « (P^PQP-1, P^QPP-1) « (QP ^1 P" (PQ, QP) и (Q^PQQ-1, Q^QPQ-1) « (Q"1^ PQ"1) « Определение 10. Любое соотношение вида (Р, е) назовем приведенным. Из утверждения 3 г) получаем Следствие. Для любой системы соотношений S в алфавите А существует эквивалентная ей система приведенных соотношений в алфавите А. Приведем одно утверждение о связи между группами (A; Si) и (A; S2) доказанное в 1883 г. американским математиком У. Диком. Теорема 2. Если Gx = (A; Si), G2 = (A; S2) и Si С S2> то отображение ср: G\ —> G2, определенное формулой y[P)s€G1:cp([P)Sl) = [P}S2, (7) является эпиморфизмом. Если при этом S2 состоит из приведенных соотношений (Р^, е), j £ J, то ядро эпиморфизма <р совпадает с пересечением Н всех нормальных делителей группы G±y содероюащих множество {[Pj]si: 3 ^ <0- П Определение отображения tp корректно, поскольку из включения Si С S2 очевидным образом следует импликация: Сюръективность отображения (р очевидна, а тот факт, что ср — гомоморфизм, проверяется непосредственно: <p([P]s! • [Q]5i) = ^{[PQlst) = = [PQls2 = [P}s2 • [Q]s2 = ч>(№1) • ч> ([Q]sx). Докажем теперь, что Kery? = H при условии, что S2 = = {(Pj, e): j e J}. Так как Kercp < Gi и [R]Sl G Кекр 4$ R ~ е, то Кепр Э [Pj]su и потому Кекр D Н. Докажем обратное включение. Для этого достаточно показать, что если R = До —> R1 —> ... —► Дл = е, то 5г 52 5*2 [i?]5i € -ff. Докажем этот факт индукцией по к. При к = 0 i?o = е, и утверждение очевидно. Допустим, что оно верно при к = п, и пусть А: = 244
= п + 1. По предположению индукции [i?i]si £ Я, и остается рассмотреть переход До —» Дь Согласно условию он осуществлен по соотноше- нию вида (Р, е), где Р = Pj или Р = af a~e, j € J, i € I, e € {1, —1}. Возможны два случая: 1) До - Д'РД", jRi - Д'Д'', 2) До = Д'#", Д1 ^ Д'РД". В случая 1) Д'РД" ~ Д'РД'^Д'Д", причем [Д'РД'"1]^ € Я, по- S\ скольку [P]s± € Н и Н<(А; Si). Следовательно, [i?o]5i = [R'PR'^Sx • *[-Ri]si ^ ^* Аналогично, в случае 2) получим 1)^ • [fli]Sl € Я. П Рассмотрим прямое произведение двух групп, заданных системами образующих элементов и определяющих соотношений. Теорема 3. Если d = (A; Si), G2 = {В; S2), A = {а{: г € /}, B = {bjij e J}, то <3i ® G2 = (A U В; Si U 52 U К), О Докажем, что искомым изоморфизмом является отображение <р: Gi®G2-> (Л U 5; SiUS2Uiif), определенное формулой: e Gi ® G2: Очевидно, что отображение (р определено корректно. По утверждению 3 е) система Si U S2 U К эквивалентна системе U = Si U S2 U К', где К' = {(at Щ, 6}of) : г € 7; j G J; 5, е € {1,-1}} . Пусть теперь Д — любое слово из W(.A U В). Обозначим через Д^, Rb слова, полученные из Д удалением соответственно всех символов из В, А Очевидно, что RA € W(A), RB € W(B) и Д ~ ДЛДБ. Отсюда 245
следует, что ^(([RaIs^ [Rb]s2)) = [Щи, т. е. (р — сюръективно. Для доказательства инъективности достаточно доказать утверждение: Vi?, L e W(AaJB): (r-^l)=> [Ra ~ LA, RB ~ LB) . \ U / \ Si S2 J Пусть элементарное преобразование R —+ L заключалось в замене подсловаРиз R словом Q, т. е. R = В! PR", L = R'QR". Возможны три случая: 1) (Р, Q) € К'. Тогда Ra = Ьа5 Дв = -^в, и утверждение верно. 2) Р, Q € W(3). Тогда Лл - RfAPR'^ Rb - Л^Лв. la - £W^f i'B = R'bR'b- Отсюда видно, что Лд ~ L^, J?b = ^в» и утверждение снова верно. 3) Р, Q G И^(-В). Этот случай симметричен случаю 2). Таким образом, отображение tp инъективно, и остается лишь проверить, что tp — гомоморфизм. Проделайте эту проверку самостоятельно. □ § 2. Задание произвольной группы системами образующих элементов и определяющих соотношений Пусть G — любая группа, и G\ = {дг: i € /} С G. Определенней. Всякое верное в группе G равенство вида: ИЛИ Qei Q£k _ e /n\ где ii,...,ijb, ji,...jje ^ ^j £ъ-••>£** 5i,...,<Je € {1, —1}, eG —единичный элемент группы G, называют соотношением меэюду элементами множества G% в группе G, или просто соотношением в G. Пусть G\ порождает G, и 5i — произвольная система соотношений между элементами из G\ в группе G. Систему S\ естественно было бы 246
назвать системой определяющих соотношений, если любое соотношение в G является следствием системы S\. Однако так поступить мы не можем, поскольку не определено понятие "следствия системы соотношений в группе G". Для преодоления указанной трудности перейдем от группы G к подходящей абстрактной группе G = (A; S). Выберем в качестве А множество букв {аг: i £ 1} с тем же множеством индексов /, что и для элементов из Gi, а в качестве S — систему, полученную заменой в Si каждого соотношения вида (8) или (9) соответственно соотношением: •••<*. 4-4) или Сопоставим любому слову Р = а}\ ... аЦ элемент Р = д}\ ... gj* группы G, считая ё = eG, и определим отображение ф: G —± G: ) = P. (10) Из построения системы 5 легко усмотреть, что Р —► Q, а потому и Р ~ Q, влечет равенство Р = Q в G. Значит, отображение ^ определено корректно. Утверждение 4. Отображение ф, определенное формулой (10), является эпиморфизмом групп. П Так как Gi порождает G, то любой элемент g из G представим в виде р^1... g^. Следовательно, ф ([аЦ ... af *] s J = 5, и отображение ^ — сюръективно. Тот факт, что ф — гомоморфизм, следует из очевидного равенства PQ = PQ для любых слов Р, Q е М^(А). □ Определение 12. Множество соотношений 5*1 между элементами системы образующих Gi = {gi: г Е /} группы G называют системой определяющих соотношений группы G в системе образующих Gi, если определенное формулой (10) отображение ф группы G = {A; S) в G является изоморфизмом групп. При этом пару (A; S) называют заданием группы G относительно системы образующих Gi, или просто заданием группы G. Говорят также, что группа G задается системой образующих элементов G\ и системой определяющих соотношений S\. Из определения 12 следует, в частности, что пара (A; S) является заданием группы (A; S) относительно системы образующих {[a^s: аг G А}. Теперь можно ответить на вопрос, поставленный в начале главы. 247
Теорема 4. Для любой группы G и любой ее системы образующих G\ = {gi: г Е /} существует задание группы G относительно системы образующих G\. □ Выбрав в качестве S\ пустую систему соотношений в группе G, мы, как и выше, построим по G\ и S\ группу G = (А; 0} и рассмотрим определенный формулой (10) при S = 0 эпиморфизм ф: G —» G. Пусть Кехф = Я = {[Pj]0: j G J}, S' = {(Pj, e) : j E J}, и ^ — отображение группы (А\ 0) в группу (А; 5'), определенное формулой (7) при Si = 0, £2 = S'. По теореме 2 у? есть эпиморфизм и Кегу? есть пересечение всех нормальных делителей группы (А] 0), содержащих Н. А так как Н< (А; 0), то Кекр = Д\ Теперь, применив дважды теорему об эпиморфизме групп, получим коммутативную диаграмму: в которой ipo — естественный эпиморфизм, a Ti, Т2 — изоморфизмы, причем г^гт1 ([P]sf) = Р для любого слова Р Е W(A). Отсюда и из определения 12 следует, что (A; Sf) есть искомое задание группы G относительно системы образующих G\. □ Заметим, что указанная в доказательстве теоремы 4 система определяющих соотношений Sf группы G, как правило, избыточна. Легко видеть, что при построении системы Sr вместо Н молено было бы взять любое множество, порождающее нормальный делитель Н. П р и м е р 4. Группа G = (Z; +) относительно системы образующих {1} имеет задание (ai; 0). Действительно, пересечением всех нормальных делителей группы Н = (ai; 0), содержащих множество 0, является единичная подгруппа, и потому указанный в теореме 4 эпиморфизм ф является изоморфизмом. Для нахождения систем определяющих соотношений конечной группы может оказаться полезным Утверждение 5. Пусть G = {gi,..., дп} — система образующих конечной группы G,A = {ai,..., ап} — множество букв, uS — система 248
соотношений в алфавите А. Если для каждого соотношения (Р, Q) из S в группе G выполняется равенство Р = Q и \ (A; S) | < \G\, то (A] S) есть задание группы G относительно системы образующих G\. D Для доказательства достаточно заметить, что в силу неравенства | (A; S) | < |G| определенный формулой (10) эпиморфизм ф: (A; S) —> —> G является изоморфизмом. П Примерб. Из утверждения 5 легко следует, что рассмотренные в примерах 1, 2 циклическая группа Ст порядка т и диэдральная группа D(n) порядка 2п имеют соответственно задания: (аи (а?\е)); {о,ъа2; (а?,е), (а!,е), (а2аиа^1а2)). (11) Применим утверждение 5 к нахождению задания симметрической группы Sn в системе образующих Gn = {дг: г £ 1,п — 1}, где дг = — (г, г + 1) — транспозиция из Sn. Нетрудно проверить, что для элементов из Gn в Sn выполняются соотношения: а) #2 = е, i G 1, п — 1, е — единичный элемент в Sn; б) 9г93 = 9з9г, h 3 € l,n-l, \i-j\ > 1 (если п > 3); в) дгдг+1дг = ft+i&ft+i, г е 1, п - 2 (если п > 2). Оказывается справедлива Теорема 5. Система а)—в) является системой определяющих соотношений группы Sn относительно ее системы образующих Gn. □ Рассмотрим абстрактную группу Нп = (2?п; Тп), в которой Вп = = {6i,..., 6n-i}, a ?n состоит из трех систем соотношений: аО («?,е), г € 1,п-1; б;) (6гЬ7, Ь^Ьг), г, j G 1,п — 1, |г - j| > 1 (если п > 3); В7) (ЬгЬг+1*>г, Ьг+1^гЬг+1)> * € 1,П —2 (вСЛИ П > 2). Согласно утверждению 5 для доказательства теоремы 5 достаточно доказать неравенство \Нп\<п\. (12) Докажем сначала вспомогательное утверждение. Лемма. Любое слово Р в алфавите Вп Тп-эквивалентно слову вида PiQi, где Pi не содержит буквы bn_i, a Q± = 6n_i6n_2... bn-k. к G 1, n — 1, шш Qi =o= e. П Из соотношений а7) легко следует, что Ь"1 ~ Ъг. Поэтому можно считать, что в исходное слово Р не входят символы б"1, г G 1,п — 1. 249
Если в Р не входит Ьп-ъ т° утверждение леммы верно. Пусть Р - Pibn где Pi не содержит буквы 6n-i- В этом случае утверждение леммы докажем индукцией по длине £ (Рг) слова Рг. При £ (Рг) = 0 оно очевидно. Допустим, что оно верно при всех Рг с условием £ (Р2) < г, и докажем его при £{Р2) = г + 1. Если Р2 = 6n-i - • -bn^t, то утверждение леммы верно. Поэтому будем считать, что Р = Р1ЬП_1...ЬП_АР5, (13) где 5^n — t — 1, 1 < t < n — 1. Будем применять к слову Р различные элементарные преобразования в зависимости от параметра s: 1) при s = п — t заменим в Р подслово bn-tbs пустым словом (по соотношению из а')); 2) при s < п — t — 1 переставим в Р букву Ь3 последовательно с буквами bn-t,..., Ьп-1 (по соотношениям из б')); 3) при s > n — t — 1 переставим Ь3 с буквами 6n_t,..., Ь5-25 в полученном слове Pi Ьп-1 • •. bs+ibsb8-ibsb8-2 - • • bn-tp2 заменим подчеркнутое подслово b3b8-ibs словом bs-ibsbs-i (по соотношению из в;)), а затем переставим bs_i с буквами Ь8+1» • • •, Ьп-i- Во всех случаях мы получим Гп-эквивалентное слову Р слово Р', которое или не содержит 6п-ъ или имеет вид P[bn-iP2, где Р[ не содержит fcn_i, а ^(Рг) < т. По предположению индукции слово Р1 Гп-эквивалентно слову нужного вида. □ Теперь индукцией по п легко доказать, что любое слово Р из W (Вп) эквивалентно слову вида: i • • • bk2-t2 • • • Ьк3Ька^!.. • bka-tai (14) где 1 < к\ < &2 < ... < к3 < п_— 1, 0 < t» < fcj, г £ 1,5, и что число различных слов вида (14) из W {Вп) не превосходит п!. Следовательно, \Нп\ < п!, и заключение теоремы 5 верно в силу утверждения 5. □ Определение 13. Группа G называется свободной группой, а ее система образующих G\ — свободной системой образующих, если для группы G существует задание вида (А; 0) относительно системы образующих Gi. Так как пара (А; 0) является заданием группы (А; 0) относительно системы образующих А = {[oje; a* £ Л}, то {А\ 0) является свободной 250
группой со свободной системой образующих А. Из примера 4 видно, что (Z; +) является свободной группой со свободной системой образующих Заметим, что свободная система образующих свободной группы находится неоднозначно. Так свободной системой образующих группы (Z; +) является не только система {1}, но и {—1}. Докажите это в качестве упражнения. Отметим без доказательства известный из теории групп факт о рав- номощности любых двух свободных систем образующих свободной группы. О большой роли свободных групп в теории групп свидетельствует Утверждение 6. Любая группа является гомоморфным образом подходящей свободной группы и потому изоморфна факторгруппе свободной группы. □ Для любой группы G существует система образующих (например все множество G). Если G = (Gi), то по теореме 4 существует задание (A; S) группы G относительно системы образующих G\. По определению 12 G = (А; 5), а по теореме 2 группа (A; S) является гомоморфным образом группы (А; 0). Следовательно, G есть гомоморфный образ группы (А; 0), и по теореме об эпиморфизме групп G = (А; 0) /i7, где Н — ядро эпиморфизма группы (А\ 0) на G. □ 3. Переход от одного задания группы к другому заданию. Теорема Тице Легко видеть, что для одной и той же группы можно указать много различных заданий с помощью образующих элементов и определяющих соотношений. Система простейших преобразований, позволяющая переходить от любого одного задания группы к любому другому ее заданию, была указана в 1908 г. немецким математиком X. Тице. Определение 14. Преобразованиями Тице задания (A; S) группы называются: I) добавление к S любого следствия системы 5; II) удаление из S любого следствия остальных соотношений; 251
III) добавление к А новой (не содержащейся в А) буквы а с одновременным добавлением к S соотношения (Л, а), где R — любое фиксированное слово из W(A); IV) удаление из А буквы а и из S соотношения (/?, а) при условии, что а и а"1 не входят вйив другие соотношения из S. Иногда при определении преобразований Тице вместо IV берут более общее преобразование: V) удаление из А буквы а и из S соотношения (Д, а), где R £ G W(A \ {а}), с одновременной заменой во всех остальных соотношениях из S каждого символа ае, е £ {1, —1}, на Re. Можно показать, что, взяв IV вместо V, мы по существу не потеряли в общности. Утверждение?. Любое преобразование типа V задания (A; S) 33 можно осуществить с помощью преобразований типа I—IV. □ Пусть а € A, (i?, а) £ 5, Р € W(A). Обозначим через Р слово, полученное из Р заменой каждого символа ае,еб{1, —1}, словом R£. Легко видеть, что Поэтому можно с помощью преобразований I к S добавить все соот- ношения (P,Q), где (P,Q) 6 S \ {(Д, а)}, а затем с помощью преобразований II из полученной системы удалить все соотношения системы S \ {(/?, а)}. Теперь для осуществления преобразования V осталось с помощью преобразования IV удалить а и соотношение (R,a). □ В дальнейшем нам понадобится также Утверждение 8. С помощью преобразований Тице можно перейти от задания (A; S) к заданию (A'; S'), где А! получено из А заменой любой одной буквы а некоторой буквой Ь $ A, a S' получено из S заменой каждого символа ае, е € {1, — 1}, на 6е. □ Для осуществления указанного перехода достаточно с помощью преобразования III к А добавить букву Ь, а к S — соотношение (а, 6), а затем с помощью преобразования V удалить букву а с необходимой заменой соотношений. □ О значении преобразований Тице свидетельствует 33 Здесь и ниже под заданием (A; S) всегда можно понимать задание группы (A; S). 252
Теоремаб (Тице). Пусть G = (А; 5), Я = (В; Т) - абстракт- ные группы, заданные конечными системами образующих элементов и определяющих соотношений. Группы G, Н изоморфны тогда и только тогда, когда задание (A; S) можно перевести в (В; Т) конечной последовательностью преобразований Тице. □ Пусть (В; Т) получено из (A; S) конечной цепочкой преобразований Тице. Докажем, что G == Н. Ясно, что достаточно рассмотреть случай, когда (В; Т) получено из (A; S) лишь одним преобразованием. Если им было преобразование типа I или II, то G = Н по утверждению 1. Пусть использовалось преобразование типа III, и В = A U {а}, Т = S U {(Л, а)}, где а & A, Re W(A). Определим отображение (р: Н —> G, положив У[Р]теН:ср([Р])т = [Р}8. (15) Для доказательства корректности этого определения достаточно показать, что VP,QeW(B): Пусть преобразование Р —> Q осуществлено по соотношению (Pi, <5i) и Р = Р'РхР", Q = P'QiP". Возможны случаи: 1) (Рь Q0 € S, 2) (Рь Qi) = (a?a:-£, е),агЕА, 3) (Pi, Qi) = (a£a-£, e), 4) (Рь Qi) = (Л, 4 В случаях 1)-2) Р = Р'РХР", Q = P'QiP", и очевидно Р -> Q. S В случае 3) Р = PrReR~EP", Q = Р'Р^, иР^^в силу условия ReR~e ~ е (см. (5)). В случае 4) Р = Q, и потому Р ~ Q. Таким об- 5 S разом, у? определено корректно. А так как для Р Е W(A) Р = Р, то ) = [Р]5, и потому <£ — сюръективно. Отображение ц> — инъ- ективно, поскольку из соотношений 5сТ, Р ~ р^ Q ~ Q получаем соответственно: Кроме того, из очевидного равенства PQ = PQ легко следует, что ср гомоморфизм. Следовательно, (р — изоморфизм, и G = Н. 253
Пусть, наконец, (В; Т) получено из (A; S) преобразованием типа IV. Тогда (A] S) можно получить из (В; Г) преобразованием типа III, и изоморфизм G = Н доказан выше. В итоге теорема Тице в одну сторону доказана. Обратно, пусть имеется изоморфизм ip: Н —> G. Докажем, что от (A; S) к (В\ Т) можно перейти конечной последовательностью преобразований Тице. При этом, учитывая утверждение 7 и доказанную часть теоремы Тице, можно считать, что А П В = 0. Обозначим А = {аи. • •, ап} , В = {Ьь..., bm} и (p([bt]T) = [jRJs, где R% G W(A), г G 1, m. Преобразованиями Тице типа III перейдем сначала от задания (A; S) к заданию (iUB;5 Ч±?')> где ^' — = {(^г? R%) : г G 1, га}, что возможно в силу условия А П В = 0. Теперь докажем, что любое соотношение (Р, Q) из Т есть следствие системы SUS',T.e.P ~ Q. Пусть Р - «£•••&£, <2 = &£ •• •&£. Так как V (Мт) = [-Rt]s и ^ — изоморфизм группы Н на G, то имеем: <р (№) = К1 • • • J£l*. v (Ю]т) = [<х • • • л£]я. (16) Из условия (Р, Q) G Г следует, что Р ~ Q, и в Н выполняется равенство [Р]т = [Q]t- Отсюда и из (16) получаем равенство в группе G: [Щ1... R£t*]s = [Щ1... R63ee]s, т. е. эквивалентность Я£ ... Д£ ~ .. R^. Заменив в ней по соотношениям из S' каждое из слов Rt буквой bt,t G l,rn, мы получим искомое соотношение Р ~ Q. Теперь с помощью преобразований Тице типа I мы можем от задания (A U В; S U S') перейти к заданию (A UB;SUSrU Г). Пусть <р {[L3]T) = [a3]s, j G 1, n, где Lj G W{B). Так как tp — изоморфизм, и tp ([Ьг]т) = [Ri]s, то для L3 = б^1 -.. &7fc получим tp ([L3]t) = [R]^ - - - Щ^]в- Следовательно, а3 ~ Щ^ ... Щ*, и потому а3 —> Z^. Таким образом, следствиями си- S SKJS стемы SUS/ являются все соотношения системы Т' = {(a3,L3) : j Е 1, п}, и с помощью преобразований Тице типа I мы от задания (AuB; SuS'UT) можем перейти к заданию (AUB; SUTUS'UT'). В силу симметрии к этому заданию можно перейти преобразованиями Тице и от задания {В\ Г). А так как для каждого преобразования Тице есть обратное преобразование Тице, то преобразованиями Тице можно перевести задание {А\ S) 254
в (В;Т). Осталось заметить, что последовательность необходимых при этом преобразований конечна. □ Рассмотрим практически важное приложение теоремы Тице к построению задания группы относительно одной системы образующих по ее заданию относительно другой системы образующих. При решении этой задачи нам будет удобно произведения элементов из множества #ь..., Xk, х^1,..., х^1 в группе G обозначать в виде Рг (a?i,..., Xk), Q% (xi ? • - -, д?л). Тогда произведение в группе G или слово в некотором алфавите, полученное заменой в P(xi,...,Xk) каждого элемента хгу г G 1, к, соответственно произведением в G или словом Qt, запишется в виде Р (Qi,..., Qk)- При этом следует иметь в виду, что если хг г заменяется произведением или словом с^1.. .с£, то одновременно х~г заменяется на cfr ... с?. Теорема 7. Пусть G\ {pi,... ,pn}, #i = {Ль..., hm} — системы образующих группы G, Si — система определяющих соотношений группыG в системе образующихG\,ueG выполняются соотношения: р* = Р*(Л1,...,Лт), г G1, щ h3 =Qj(gu...,gn), j e 1, т. Тогда система соотношений Т\ в G, полученная заменой во всех соотношениях из Si и во всех соотношениях системы S2 = {h3 = Q3 (plf... ,pn) : j G l,ro} элементадг произведением Рг (hi,..., /гт), г Е 1, n, является системой определяющих соотношений группы G относительно системы образующих Hi. □ Пусть Л = {ai,...,an} и (Л; 5) есть задание группы G относительно системы образующих Gi. Тогда согласно определению 12 отображение if>: (A; S) —♦ G, заданное в (10), является изоморфизмом групп. Следовательно, справедливы соотношения: аг ~ Рг (Qi (аъ..., ап),..., Qm (аъ..., ап)), г е 1, ш. (17) s Выберем множество букв В = {6i,...,6m}, и преобразованиями Тице типа III перейдем от задания (A; S) к заданию (Аи В; Su S'), где S' = {{Ь3, Q3 (oi,..., a»)) : j 6 17 255
Из (17) следует, что а* ~ Р% (Ьь..., 6m)5 г € 1, п, и потому с помощью olio' преобразований Тице типа I можно от задания (А и В; 5 US") перейти к заданию (Л U В;5 U S' U Г'), где Т = {(аиР* (Ьь...,bm)) : г € 17п}. Теперь, преобразованиями Тице типа V удалим из задания (A U В; SUS'U Tf) все буквы о^ЕАи все соотношения системы Т", заменив во всех остальных соотношениях каждый символ а\ словом P/(6i,..., 6т), г G 1, п, г Е {1,-1}. В итоге получим задание (В; Г) группы G. Покажем, что это есть задание относительно системы образующих Н±. Из построения изоморфизма (р группы (A, a; S, (Я, а)) в группу (А; £), осуществленного при доказательстве теоремы Тице (см. (15)), следует, что изоморфизмом группы (A U В; S U S' U Г), или, что то же самое, группы (A U В; S U S"), на группу (A;S) может служить отображение (pi, определенное для любого элемента [Р (а±}..., an, &i,..., bm)]SuS, равенством: Из соображений симметрии следует, что изоморфизмом группы (A U В; 5 U S' U Т') на группу (В;Т) является отображение ц>2, определенное при любом Р € W(A U В) равенством: Следовательно, отображение ipi = Ф^ФгФ является изоморфизмом группы (В; Т) на группу G, причем нетрудно проверить, что ^i ([Ьг]г) == = hi для всех г € 1, ш. Отсюда следует, что ^i ([Ь^1... Ь^]т) = h^ ... Л?* для любого элемента [Ь^1 ...6^]г € (В;Т), и согласно определению 12 (В; Т) есть задание группы G относительно Hi. Остается заметить, что соотношение Р(Pi,...,Рп) = Q (Pi,...,Рп) лежит в Т\ в том и только том случае, когда (Р (6Ь..., fem), Q (&i,..., bm)) € Г. П Примерб. Найти систему определяющих соотношений и задание группы Sn относительно системы образующих: Нп = {Ль Л2}, где Л1 = (1,2), h2 = (1,2, ... п). Воспользуемся заданием группы Sn относительно системы образующих Gn = {pi,...,#n-i} из теоремы 5. Легко видеть, что в Sn выполняются соотношения: 1, hx = ди h2 = gn-i9n-2.-. 256
Тогда по теореме 7 имеем систему определяющих соотношений группы Sn в системе образующих Нп: a") h2(l~1)/i1^-1^(l~1)^i^2"1 = е, t € 1, n-1; б") и2{г- ^2~ ^2%h\h\^ i G 1, n — 2; г") Л2 = Л"(п- Отсюда и из утверждения 3 легко следует, что вместо а")—г") можно взять и более простую систему соотношений: б"') h^tuh^h! = hih^hih2k, к € 2, п - 1; " h\h2h = hih2hih h\h<z; в'") тт) Щ = (Л2Л1Г"1. § 4. Описание конечно определенных абелевых групп В данном параграфе рассматриваются задания групп образующими элементами и определяющими соотношениями, которые применяются к описанию строения конечно определенных и, в частности, конечных абелевых групп. Для описания конечно определенных абелевых групп с точностью до изоморфизма достаточно рассмотреть абелевы абстрактные группы, заданные конечными системами образующих элементов и определяющих соотношений. При изучении таких групп будем пользоваться аддитивной терминологией. Тогда для алфавита А = {ai,..., ап} мно- 257
жество А будет состоять из символов +ai,..., +an, — ai,..., — an, и любое непустое слово в алфавите А запишется в виде: егагг.. .SkQ>ik, где £% € {+, —}, г G 1, fc. Условимся обозначать пустое слово буквой 0, а слово вида: еаг.. .еаг — через шг, где с = efc — числовой коэффици- к ент. В частности 0аг — пустое слово. Вместо +1аг, — 1аг будем писать соответственно +аг, —аг. Легко видеть, что при любой системе соотношений S в алфавите А группа (A; S) коммутативна в том и только том случае, когда все соотношения системы К = {(аг + а3\ а3 + аг); i,j G 1, п} являются следствиями системы S. В связи с этим можно условиться систему К всегда включать в систему определяющих соотношений абелевой группы, выделяя ее в отдельную подсистему. Тогда задание абелевой группы запишется в виде (A; S U К), где S — любая (возможно пустая) система соотношений. Утверждение 9. С помощью соотношений из К и тривиальных соотношений любое слово Р в алфавите А можно преобразовать к единственному каноническому слову вида: ciai...cnan, (18) где с\,..., Сп G Z. При этом сг есть сумма всех коэффициентов перед буквой аг в слове Р. □ Возможность преобразования слова Р к слову вида (18) очевидна. Единственность следует из того, что при указанных преобразованиях слова остается неизменной сумма всех коэффициентов любой буквы аг. □ Из утверждения 9 получаем Утверждение 10. Любая конечно определенная абелева группа имеет задание вида (A; S U К), где А = {ai,..., an}, а система S или пуста, или имеет вид: (cnai...cinan, в), (19) Определение 15. Целочисленную матрицу (сг^)тхп? составленную из коэффициентов системы (19), назовем матрицей задания (A; S U К) группы G и обозначим через Ca,s- В случае S = 0 будем считать CAts = О1хп. 258
Заметим, что матрица Ca,s не зависит от обозначения элементов из А. Поэтому по матрице Ca,s задание (A; S) восстанавливается лишь с точностью до обозначения образующих элементов. Выясним, какие преобразования матрицы Ca,s отвечают преобразованиям Тице задания (A; S U К). Предварительно докажем Утверждение 11. Соотношение (сю1...сЛап,0) (20) является следствием системы S U К тогда и только тогда, когда вектор-строка 7 = (сь • • • ? Сп) является целочисленной линейной комбинацией строк матрицы Ca,s- □ Пусть соотношение (20) есть следствие системы U = SUК, где S есть система (19). Тогда существует цепочка преобразований: cioi ...Cnan^Ro-^Ri-^...-^Rt-в. (21) Используя соотношения из К и тривиальные соотношения, приведем каждое слово R% к каноническому слову R[, г £ 0, £, и выясним, как связаны между собой слова R[ и Д[+1. Если преобразование Rz —► Ri+i осуществлялось по соотношению из К или по тривиальному соотношению, то R[ = Д(+1 по утверждению 9. Если же использовалось соотношение (cjiai...cJnan, в), то в силу утверждения 9 имеем: строка коэффициентов 7г+1 слова Д£+1 получается из строки коэффициентов 7г слова R[ прибавлением или вычитанием j-й строки (с3\,..., cjn) = С3 матрицы Ca,s- Итак, в любом случае 7г+1 = Ъ + eCj, где е € {0,1, —1}. Отсюда и из (21) имеем: 7 + ei^i + • • • + et6H = (0,..., 0), где еь..., et e {0,1, -1}. Следовательно, 7 = — £\Сп — ... — StC3t — линейная комбинация строк матрицы Ca,s- Обратное утверждение очевидно. □ Утверждение 12. Пусть (A; S U К), (В; Т U К) — конечные задания абелевых групп. Задание (В; TUK) получено из (А\ SUK) одним преобразованием Тице типа I—IV в том и только том случае, когда матрица Св,т получена из Ca,s соответственно: V) добавлением строки, являющейся целочисленной линейной комбинацией строк матрицы Сл,5? 259
IF) удалением строки, являющейся целочисленной линейной комбинацией остальных строк; III7) добавлением столбца и строки с 1 на их пересечении и с нулевыми остальными элементами добавляемого столбца; IV) удалением столбца и строки с 1 на их пересечении при условии, что остальные элементы удаляемого столбца нулевые и Ca,s Ф Ф (0,..., 0,1,0 ... О) (в последнем случае удаляется лишь столбец с 1). □ Доказательство осуществляется непосредственной проверкой с использованием определения 14 и утверждения 11. Проделайте ее в качестве упражнения. □ В дальнейшем для краткости будем называть преобразования Ш7, IV7 соответственно расширением и сужением матрицы. Утверждение 13. Любое элементарное преобразование матри- цы Стхп надЪ можно осуществить с помощью преобразований типа r-iv. □ 1) Для умножения строки Сг матрицы С на обратимый элемент S = =Ы кольца Z достаточно добавить к С (между строками Сг и C2+i) строку 5Сг, а затем удалить Сг. 2) Для прибавления строки Сг, умноженной на г Е Z, к строке С3 достаточно добавить к С (между строками С3 и С3+\) строку С3 + гСг, а затем удалить С3 (как линейную комбинацию строк Сг и Сэ + гСг). 3) Для умножения столбца С3 на — 1 достаточно расширить матрицу С до матрицы d /х с\ oi cj+1 ... с* С/ — 1 0 0 110 ... 0 в матрице С к г-й строке, г € 1, т, прибавить (га + 1)-ю строку, умноженную на — сгз, и полученную матрицу сузить путем удаления j-ro столбца и (га + 1)-й строки. 4) Для прибавления к столбцу С\ столбца С^ умноженного на г е Z, г ф j, достаточно расширить С до матрицы С"= ( 0-110 260
в С" к £-й строке, £ е 1, га, прибавить (т+1)-ю строку, умноженную на C£j, после чего (ш+1)-ю строку умножить на — 1, и полученную матрицу сузить путем удаления j-ro столбца и (ш + 1)-й строки. □ Определение 16. Пусть С — матрица над Z, и ее каноническая форма К{С) имеет вид diag(l,...,l,di,...,d5,0,...,0)mxm, где г, s, t e No, г t di,...,d5 € N \ 1. Тогда упорядоченный набор чисел (п — (г + s), di,..., ds) назовем системой инвариантов матрицы С и обозначим через /(С). Утверждение 14. Если матрица С получена из матрицы С с помощью преобразований Г—IV7, то 1{С') — 1(С). □ Достаточно рассмотреть случаи, когда С получена из СтХп одним преобразованием вида V или ИГ. Рассмотрим эти случаи. 1) С получена из С добавлением строки D = С\Т\ + ... + Сштш. При нахождении матрицы К{СГ) можно начать с прибавления к строке D строк Ci,..., Cm, умноженных соответственно на — г\,..., —rm. В итоге строка D заменится нулевой строкой. Отсюда видно, что К{С) отличается от fC(C) одной лишней нулевой строкой. Отсюда и из определения 16 видно, что 1{С) = 1(С). 2) Если С1 получена из С преобразованием типа ИГ, то с помощью перестановок строк и столбцов в матрице С ее можно привести к виду: 1 di d2 dn \ О О / Отсюда видно, что главная диагональ матрицы С будет отличаться от диагонали матрицы С только лишней единицей. Следовательно, 1(С) = = 1{С). П Теорема 8. Пусть G = (A; S U К), Н = (В, Т U К) - абеле- вы группы, заданные конечными системами образующих элементов и определяющих соотношений. Тогда: 261
□ Если G = Я, то по теореме Тице от задания (A; S U К) к заданию (В; Г U К) можно перейти с помощью преобразований Тице, а тогда по утверждению 12 от матрицы Ca,s к Св,т можно перейти с помощью преобразований типа V—IV. Значит, по утверждению 14 I(Ca,s) — = 1(Св,т). Обратно, пусть I(Ca,s) = ЦСв,т)- Тогда в силу определения 16 матрицы JC(Ca,s)>1C(Cb$t) имеют одно и то же число нулевых столбцов, и их главные диагонали могут отличаться лишь числом единиц и нулей. Отсюда видно, что любую из матриц /C(CU,s), /С(Св,г) можно перевести в другую преобразованиями V—IV. А так как в силу утверждения 13 то же верно для матриц С и К{С) при любой матрице С над Z, то от матрицы Ca,s к Св,т можно перейти преобразованиями V—IV'. Отсюда и из утверждения 12 следует, что от задания (A; S U К) к заданию (В; ТиК) можно перейти с помощью преобразований Тице, и по теореме 7 G = Я. □ Из теоремы 8 следует, что корректно О п р е д е л е н и е 17. Систему инвариантов матрицы любого конечного задания абелевой группы G назовем системой инвариантов группы G и обозначим через I(G). Теперь докажем основную теорему о строении конечно определенных абелевых групп. Теорема 9. Любая конечно определенная абелева группа G либо является примарной циклической, либо бесконечной циклической, либо разлагается в прямую сумму конечного числа примарных циклических и бесконечных циклических групп, и такое разложение единственно с точностью до изоморфизма слагаемых и порядка их расположения в сумме. □ Пусть I(G) = (ш, di,..., dp). Из определения 17 и теоремы 8 следует, что группа G имеет задание (A; S U К), где А = {ai,..., аг+т}, S = {((1гаг,0): г £ 1,г}. Отсюда и из теоремы 3 (с учетом примеров 4, 5) получим: G = Gi е... © Gr е нг е... © ят, (22) где G% = (аг; (dtat, в)) — циклическая группа порядка dt, г е 1,г, Н3 = {а3; 0) — бесконечная циклическая группа, j e 1,ш. Разложив в (22) каждую из групп G% в прямую сумму примарных циклических подгрупп, мы и получим искомое разложение группы G. 262
Для доказательства единственности рассмотрим произвольное разложение группы G в прямую сумму примарных циклических и бесконечных циклических групп. С точностью до изоморфизма слагаемых и порядка их расположения такое разложение можно записать в виде: (23) где pi,... ,pv — простые числа, p\ < ... < pv, fcl:7 G N, 1 < кг\ < ... < &ггц, г G 1, v, j'Gl, n2, ra' G No. По разложению (23) построим последовательность групп Gi, G2,... ..., Gri, где Gi — прямая сумма примарных слагаемых из (23), взятых по одному слагаемому максимального порядка для каждого из чисел рг, г G 1, v, С?2 строится аналогичным образом по прямой сумме остальных примарных слагаемых из (23), и т. д. до исчерпания всех примарных слагаемых из разложения (23). Так как G% — прямая сумма циклических групп попарно взаимно простых порядков, то Gz — циклическая группа, и мы наряду с (22) имеем еще одно разложение группы G в прямую сумму циклических групп: G ^ Gi е... е Gri e z е... е z. (24) Если \G%\ = d% для г = 1,..., ri, то по теореме 3 группа G имеет задание (В; TUK), где В = {6Ь ... А1+т/} , Г = {(dA,#) : « G Т^ Так как из построения групп Gx видно, что d%\d%-\^ % G 2, п, то имеем /(G) = (m^ dri,..., di). Заметим, что если бы в разложении группы G отсутствовали примарные слагаемые, то мы бы имели I(G) = (m'). Таким образом, во всех случаях число бесконечных слагаемых в интересующих нас разложениях группы G равно первому числу в наборе /(G), а набор порядков всех примарных слагаемых однозначно определяется каноническими разложениями остальных чисел набора /(G). □ Определение 18. Разложение вида (23) абелевой группы G называется ее каноническим разложением, а соответствующий ему набор чисел (mr, p\xi,... ,Pini,... ,p%lv, - •. ,Pvvnv) — типом группы G. 263
Из теоремы 9 следует, что конечно определенная абелева группа определяется с точностью до изоморфизма своим типом. Замечание!. В частном случае, когда группа G конечна, из теоремы 9 получаются теоремы 1.XII, 2.XII о строении конечных абелевых групп. Теорема 9 помогает решать самые разные вопросы о свойствах абелевых групп. Примером может служить Утверждение 15 (обращение теоремы Лагранжа 34 для абелевых групп). Для любого делителя d порядка конечной абелееой группы G в G существует подгруппа порядка d (см. также следствие теоремы 32.XI). Среди конечно определенных абелевых групп особый интерес представляют группы, у которых в каноническом разложении отсутствуют бесконечные или примарные слагаемые. В первом случае это суть конечные абелевы группы, во втором — так называемые свободные абеле- вы группы. Определение 19. Группа G называется свободной абелееой группой, если она имеет задание (А\ К), где, как и выше, К = = {(ai + aj-iaj +а%)- CLiidj €. А). При этом, если (А; К) есть задание группы G относительно ее системы образующих Gi, то G\ называется свободной системой образующих абелееой группы G. В частности, группа {А; К) является свободной абелевой группой со свободной системой образующих {[а^: а* Е А}. Непосредственно из теоремы 8 следует Утверждение 16. Любые две конечные свободные системы образующих абелевой группы G равномощны. Следовательно, корректно Определение 20. Число элементов в любой свободной системе образующих конечно порожденной свободной абелевой группы G называют рангом группы G. Из доказательства теоремы 9 легко получить полное описание всех свободных абелевых групп конечных рангов. Утверждение 17. Группа G является свободной абелевой группой ранга п тогда и только тогда, когда она является прямой 34 Ж. Л. Лагранж — французский математик (1736—1813). 264
суммой п бесконечных циклических групп, и, в частности, когда G = g Z ф Z ф .., ф Z, п Замечание2. Не следует путать понятие свободной абелевой группы с определенным ранее (см. определение 3) понятием свободной группы. Свободная группа Fn = (ai,..., an; 0) является абелевой только при п=1. Действительно, как следует из утверждения 6 и его доказательства, гомоморфным образом группы 1*2 является любая группа с двумя образующими, среди которых есть и неабелевы (например группа диэдра D(n) при п > 2). Для абелевых групп имеет место аналог утверждения 6: любая абе- лева группа изоморфна факторгруппе подходящей свободной абелевой группы. Точнее, справедлива Т е о р е м а 10. Если G = (A; S U К) — абелева группа и А — = {ai,... ,an} , S = {(Pj,0) : j G l,rn}, mo G изоморфна фактогруппе группы (А; К) по ее подгруппе Н, порожденной системой элементов {[Pj]k- 3 € 1,яг}. При этом изоморфизмом может служить отображение ср: VP € W(A): ^ ([Р]к + Н) = [P)suk. □ Доказывается теорема 10 точно так же, что и теорема 2 при S\ = — К, $2 = S U К. Следует лишь учесть, что в абелевой группе любая подгруппа является нормальным делителем. □ Заметим, что свободная абелева группа может быть задана и несвободной системой образующих. Так, например, свободная абелева группа ранга 1 Z порождается числами 1, 2 и имеет относительно системы образующих {1,2} задание (oi, аг; (2ai, аг)). В связи с этим представляет интерес ТеоремаП. Для любой системы образующих элементов G\ = ~ {ръ - - - ч9п} абелевой группы G эквивалентны утверждения: а) Gi — свободная система образующих абелевой группы G; б) соотношение ... + cngn = 0, (25) где ci,.. .,Сп € Z, выполняется в G лить при с\ = ... = сп = 0. □ Пусть выполняется условие а). Тогда из определений 19 и 12 имеем: существует изоморфизм <р группы F = (ai,... ,an; К) на G, при котором (р([п{]к) = Qu i € 1>п- Следовательно, если в G выполнено 265
равенство (25), то в F верно равенство ci[ai]j^ + ... + Сп[ап]к = Щк> т. е. соотношение s — (с\п\ ... Спап, в) является следствием системы К, и F = (ai,..., an; К U {s}) (в силу утверждения 1). Тогда по теореме 8 для А = {ai,...,an}: 0) = l(CAj{s}). (26) А так как Са,0 = О, то равенство (26) возможно лишь при с\ = ... ... = сп = 0, и утверждение б) доказано. Пусть теперь выполнено условие б). Так как G\ порождает G, то в силу теоремы 4 и определения 12 существуют абстрактная группа F = = (ai,...,an; 5) и изоморфизм <р: F -+ G, при котором <£>([aj]s) — = pi, i G 1, п. Так как С? — абелева, то F — тоже абелева. Следовательно, F = (ai,...,ап; SU К), и, не теряя общности, можно считать, что система S или пуста, или состоит из соотношений вида (eiai... епап, в) при (ei,..., £п) т^ (0,..., 0). Отсюда и из условия б) следует, что 5 = 0, и потому Gi — свободная система образующих абелевой группы G (см. определение 19). □ § 5. О ширине и длине конечной группы относительно заданной системы образующих Введем несколько понятий, связанных с порождением конечной группы G некоторой ее системой образующих G\ = {51, •. • >SVi}- Определение21. Слоем группы G в системе образующих G\ назовем любое из ее подмножеств вида G\, k G No- Так как группа G — конечна, то д~г = дг г ^~\ и потому каждый элемент группы G представим в виде произведения элементов из G\. В связи с этим корректно Определение 22. Длиной группы G относительно системы образующих (?i называется минимальное натуральное число £, при котором выполняется равенство: к=1 266
Определение 23. Шириной группы G относительно системы образующих G\ называется минимальное число слоев в системе образующих C?i, которыми может быть исчерпана группа G. Длину и ширину группы G относительно системы образующих G\ обозначим соответственно через £{G; Gi), d(G; G\). Параметр d(G; G\) легко определить по системе определяющих соотношений группы G в системе образующих G\. Так как G конечна, то любую ее систему определяющих соотношений S\ можно преобразовать в систему определяющих соотношений вида: S = {gll...gltt=e:ieT7m, tzeN, д%3 e Gi} . (27) Для этого достаточно заменить каждое соотношение из Si приведенным соотношением, добавить к полученной системе все соотношения 9% Г = е5 г £ 1>п? и заменить в остальных соотношениях элементы Определение 24. Систему определяющих соотношений вида (27) группы G назовем приведенной системой определяющих соотношений в алфавите Gi, а левые части всех соотношений из (27) определяющими словами этой системы. Теорема12. Ширина конечной группыG относительно системы образующих G± равна наибольшему общему делителю длин определяющих слов любой приведенной системы S определяющих соотношений группы G в алфавите G\. □ Пусть G\ = {pi,...§„}, и5 есть система (27). Обозначим d(G; G\) = di, (*i, ..., tm) = d^ и докажем, что d\ = cfe. Если в группе G между элементами из G\ выполняется соотношение: то от его левой части к правой молено перейти, используя лишь соотношения из 5 и тривиальные соотношения вида g\g~e = е, е G {1, — 1}. Отсюда следует, что к = ^(modefe^ и если к ф ^(modefe), то G\c\G\ = 0. Значит, среди слоев, покрывающих группу G, должны обязательно присутствовать слои GJ1,..., G7^2, где г\,..., г^2 образуют полную систему вычетов по модулю cfe- Следовательно, d\ > с?2. Докажем неравенство d\ < d<z. Так как \G\ < oo и \Gi\ < \Gi+1\ при любом к G No, то найдется такое ко G N, что \G\°\ = |Gi°+1|. А так как 267
n = U 5г^7и> т0 имеем: г=1 г=1 г€& (28) Теперь индукцией по ^ нетрудно доказать, что для любых к > ко, £ £ £ No, g £ С?I выполняются равенства: Gpi = G$g = gGl (29) При £ = 0 они очевидны. Допустим, что они верны для £ = £о, и докажем их для £ = £$ + 1. Используя равенства (28) и равенства (29) при £ = = £о, к = ко + г, мы для любого элемента д = дп.. -д3£о+1 ^11 получим: Аналогично доказывается равенство Gi+io+1 = G\g. Так как соотношения из S выполняются в G, то е £ Gj% г G l,rn. Поэтому из (29) при д = е получаем: G^1* = G\ при любых к > ко, г € 1,п. Это означает, что последовательность GlGlGl ... (30) является периодической, и любое из чисел <i,..., tm является ее периодом. Следовательно, наименьший период г последовательности (30) делит каждое из чисел ti,..., tm, а потому и их НОД d^ Однако легко видеть, что период г совпадает с шириной группы G, и мы имеем dijdb, а значит, и d\ < d>2. В итоге имеем: d\ = d%- □ Из доказательства теоремы 12 легко получить Следствие. Ширина конечной группы G относительно системы образующих C?i совпадает с индексом минимального нормального делителя группы G, по которому G\ содержится в одном смежном классе. □ Выберем такое s > ко, что е Е Gf. Тогда из (29) имеем Gf • Gf = = Gi+S = G\, Gf5 = 5Gf для любого p G G и GJ+1 = Gf -Gi = Gf -дг для любого дг eG\. Отсюда видно, что Gf «G, и Gi содержится в смежном классе Gsg%. Допустим, что существует нормальный делитель Н группы 268
G такой, что Я С Gf и Gi С Нди г Е 1, п. Тогда Gf С (Я&)* = Нд*9 и потому Gf < Я. В итоге имеем: Я = Gf, т. е. Gf — есть минимальный нормальный делитель со свойством G\ С Gfpi, г € l,n. D Пример8. Найти ширину группы диэдра D(n) относительно системы образующих G± = {51, д2}^ указанной в примере 1. Из примера 5 видно, что D(ri) задается приведенной системой определяющих соотношений в алфавите G\i 9\ = е, д\ = е, gig2gig2 = е. ^ ,/т^/ ч ^ ч / Л ,ч flj если п — нечетно, Следовательно, d(D(n); G\) = (n,2,4) = < 12, если n — четно. П р и м е р 9. Найти ширину группы Sn относительно системы образующих G\ = {(1,г): г € 2,п}. Для решения этой задачи воспользуемся следствием из теоремы 12. При п^4 неединичными нормальными делителями группы Sn являются лишь сама группа Sn и знакопеременная группа Ап. А так как все постановки из G\ нечетны, то они лежат в одном смежном классе по подгруппе Ап. Следовательно, в этом случае d(Sn; G\) = [Sn: An] = 2. В группе #4, кроме $4 и А*, есть еще неединичный нормальный делитель К± — группа Клейна 35. Однако нетрудно проверить, что G\ не лежит в одном смежном классе группы S± по К±. Поэтому и в этом случае ширина группы равна 2. Заметим, что задача нахождения длины группы относительно заданной системы образующих решается, как правило, сложнее, чем задача нахождения ширины группы. Однако и при нахождении длины группы в некоторых случаях помогает знание системы определяющих соотношений. П р и м е р 10. Найти длину группы Sn относительно системы образующих Gn = {дъ...,дп-г}, # = (г, г + 1), г G 1,гс-1. Воспользуемся заданием {Вп\ Тп) группы Sn относительно системы образующих Gn, указанным в теореме 5. В ходе доказательства теоремы 5 было, в частности, установлено, что любое слово в алфавите Вп можно с помощью соотношений из Тп преобразовать к слову вида (14). При этом указанная при доказательстве этого факта последовательность элементарных преобразований состоит из преобразований, 35 Ф. X. Клейн — немецкий математик (1849—1925). 269
не увеличивающих длину слова. Следовательно, число вида (14) является самым коротким словом среди всех Тп-эквивалентных ему слов в алфавите Вп. Теперь заметим, что самое длинное слово вида (14) bib2bibsb2b\... bn-\... 62^1 имеет длину ^ ^— • Следовательно, длина группы Нп = (Бп; Тп) относительно системы образующих Вп = {[Ьг]тп: i € 1,п — 1} равна v ^— • А так как Нп = 5П, и существует изоморфизм у: #п —> 5П, отображающий \Ьг)тп Bft, г G 1, п — 1, то Задачи 1. Доказать, что для любых слов Р, Q, jR G Ж(Л) и для любой системы соотношений S в алфавите А: Q s s 2. Пусть G = (A; S), где А = {а, 6, с}, 5 = {(а6,Ьа)}, (ас, со), (6с, с"16)}. а) Доказать, что каждое слово в алфавите А б'-эквивалентно слову вида akbecm, где к, £, m £ Z. б) Является ли группа G коммутативной? в) Является ли группа G конечной? г) Разложима ли группа G в прямое произведение подгрупп? д) Какую подгруппу порождает в ней каждый из элементов Ms, Ms? 3. Отображение р: W(A) —* PF(-A), где А = {oi,..., ап}, определяется индуктивно 270
Доказать, что для любых слов Р, Q € а) р(Р) — несократимо (т. е. не содержит подслов вида а\а~е)\ б)р(Р)~Р; в) если Р — несократимо, то р(Р) = Р; 4. Доказать, что любое слово Р € W(j4) 0-эквивалентно единственному несократимому слову. Указание. Воспользоваться результатом задачи 3. 5. Говорят, что в группе {A; S) разрешима проблема равенства слов, если существует алгоритм, позволяющий для любых слов Р, Q € W(A) узнавать, являются они ^-эквивалентными или нет. Доказать, что в свободной группе G = (ai,...,an; 0) разрешима проблема равенства слов. 6. Доказать, что в конечно порожденной группе G любая система образующих содержит конечную подсистему, порождающую группу G. 7. Доказать, что в свободной группе G = (oi, a2; 0) подгруппа Н, порожденная множеством G\ = {[агЬг]0: г G N} не является конечно порожденной. 8. Доказать, что для г, 5, t € N и d = (r, ts — 1) выполняется равенство (а, Ь; (ar,e), (65,e), (ab, be*)) = (а, Ь; (а<*,е) , (65,е), (об, Ьа*)). 9. Найти задание группы G = Z/m ф Z/n. 10. Найти задания группы А4 B системах образующих: а) А = {аи а2}, где аг = (1,2)(3,4), а2 = (1,2,3); б) В = {Ьь 62}, где б! = (1,2,3), Ъ2 = (1,2,4). 11. Описать с точностью до изоморфизма все группы порядка 8 и найти их задания образующими элементами и определяющими соотношениями. 12. Пусть р — простое число, в — примитивный элемент поля Zp. Доказать, что группа биективных аффинных преобразований (т. е. преобразований вида ( I, а Ф 0) поля Zp имеет задание: \ах + bj 271
относительно системы образующих ( ., Ь ( Л ) • \х + 1/ \их/ 13. Доказать, что группа G = (аи G2, а3, ..., (аь а%) , (а2, изоморфна аддитивной группе рациональных чисел вида Д:, где а £ € Z, к € No. 14. Пользуясь преобразованиями Тице, перевести задание (А; (Р, Q)) в задания: (A; {PQ~\e)) , (Л; (Р"1^"1)). 15. Доказать, что (а, Ь, с; (62,е) , ((Ьс)2,е)) ^ (яг, у, z; (у2,е) , (z2,e)) . 16. Зная задание группы 54 в системе образующих А = {(1,2), (2,3), (3,4)} (см. теорему 5), найти ее задания в системах образующих: В = {(1,2), (1,2,3,4)}, С = {(1,2), (1,3), (1,4)}. 17. Найти длину группы диэдра D(n) относительно системы образующих G\ = {51,52} из примера 2. 18. Найти длину и ширину группы Sn относительно системы всех транспозиций из Sn. 19. Найти ширину и оценить сверху длину группы Sn относительно системы образующих: pi = (1,2), 02 = (1,2,..., п) (см. пример 6). 20. Доказать, что группа G = {а1,а2,аз:> (а£,е), (а£,е), (a3ia21a^1a2a1), (aia3,a3ai), (а2а3,а3а2)) конечна, и оценить ее длину относительно системы образующих {[ai], [a2], 21. Найти ширину и длину абелевой группы <?= (ab...an; (diab0) ,...,(dnan,0), {ага5, а5аг), ij e 1~гг> относительно системы образующих {[ai],..., [an]} . 22. Доказать, что любая конечно порожденная абелева группа является конечно определенной. 272
Глава XXIV ГРУППЫ ПОДСТАНОВОК (ДОПОЛНЕНИЕ) § 1. Подстановочные представления конечных групп Прежде, чем продолжить начатое в главе XI изучение групп подстановок, укажем на некоторые возможности использования групп подстановок для задания и изучения произвольных групп. Эти возможности основаны на переходе от заданной группы к ее изоморфному или гомоморфному образу в симметрической группе 5(П) подстановок некоторого множества П. Определение!.. Подстановочным представлением произвольной группы G называют всякий гомоморфизм tp группы G в симметрическую группу подстановок S(Q) любого конечного множества Q. При этом число |Q| называют степенью представления и обозначают через deg<^. Представление (р называют точным, если <р — мономорфизм, и транзитивным, если группа <p(G) транзитивна на П. Заметим, что иногда и гомоморфный образ (p(G) группы G при гомоморфизме <р: G -+ S(Q) называют подстановочным представлением группы G. Такое двоякое использование одного термина не ведет к путанице, поскольку из контекста обычно бывает видно, о чем идет речь. Из доказательства теоремы Кзли (см. теорему 13.XI) следует, что для любой группы G отображение р: G —> 5(G), сопоставляющее каждому элементу g G G подстановку g из 5(G), определенную формулой: VxeG:g(x)=x-g, (1) является точным подстановочным представлением группы G. Если подстановку g из (1) условиться обозначать в виде ( 1, предполагая, \ х - g J что х пробегает множество G, то можно будет записать (xgy (2) 273
Нетрудно проверить, что точным подстановочным представлением группы G является также отображение р;: G —> S(G), определенное формулой: (3) (Проделайте проверку в качестве упражнения.) Определение 2. Подстановочные представления р и р', определенные формулами (2), (3), называются соответственно левыми правым регулярными представлениями группы G. Заметим, что для неабелевой группы G отображение рп: G - определенное формулой: не является гомоморфизмом, поскольку V5i,P2 e G: p" (gl92) = р" Ы • р" Ы • Установим связь между группами p(G) и p'(G). Определение 3. Централизатором подмножества (в частности, подгруппы) Н в группе G называют множество Zg(H) всех элементов группы G, перестановочных с каждым элементом из Н. Очевидно, что Zg(H) есть подгруппа группы G, содержащая центр группы (Н). Оказывается, имеет место Теорема!.. Централизатор правого регулярного представления группы G в группе S(G) совпадает с левым регулярным представлением группы G. □ Пусть Н = Zs(G)(p(G)) и h Е Н. Тогда при любом g £ G выполняется равенство h-( X ) = ( Х )-h. (4) \ х - g J \ х - g J w Следовательно, Vx,g E G: h(x)-g = h(x-g). Отсюда при х = e получаем: Vgf E G: h(g) = h(e) • g. Значит, h = I ], где go = /г(е), и включе- ние Н С pf(G) доказано. Обратное включение очевидно, поскольку при 274
любых gi,g Е G подстановка h = I I удовлетворяет равенству \ 9imx J (4).D Следствие. Если G — абелева группа, то ZS{G){p(G)) = P(G). Так как degp = degp' = \G\, то практическое использование представлений р, р' для групп G больших порядков затруднительно. Возникает вопрос о существовании для группы более "экономных" представлений, чем р и р'. О том, что группа G может иметь точные подстановочные представления степени, меньшей |G|, свидетельствует П р и м е р 1. Полная линейная группа GL{n, q) над полем Р = GF(q) п-\ наряду с представлениями р,р' степени N = \GL(n,q)\ = П (дп — ql) г=0 имеет точное представление степени qn — отображение ср, сопоставляющее каждому линейному преобразованию д Е GL(n, q) подстановку пространства Р^. В общем случае вопрос о нахождении для группы G точных подстановочных представлений наименьшей степени является сложной и нерешеной проблемой. В теории групп и ее приложениях часто используют подстановочные представления группы G на смежных классах по различным ее подгруппам или на подгруппах, сопряженных с заданной подгруппой. Для определения этих представлений сформулируем три вспомогательных утверждения (докажите их самостоятельно). Утверждение 1. Если пн = {Hgi: г € 1} есть множество всех правых смежных классов группы G по подгруппе i?, то {Ндгд: г G 1} = = пн Щи любом д EG. Утверждение 2. Если Д# = {g^Hgj: j E J} есть множество всех подгрупп группы G, сопряженных с подгруппой if, то ^: j E J} = Д# при любом g €G. 275
Утверждение 3. Отображения <рн, фн группы G соответственно в группы S (пн), S (Дя), определенные формулами: Н°'°)' (5) являются гомоморфизмами (т. е. подстановочными представлениями группы G). Определение^ Отображения срн и фн, определенные формулами (5), называются подстановочными представлениями группы G соответственно на правых смежных классах по подгруппе Н и на подгруппах, сопряженных с подгруппой Н. Укажем простейшие свойства представлений ipH, фн. Утверждение 4. Пусть G — конечная группа и П# = = {Ндг: г G /} — мноэюество всех ее правых смеоюных классов по подгруппе Н. Тогда: а) degcpH = [G: #]; б) <рн — транзитивно на в) Ker<£>H = f] x г) ipH — точно <Ф р| х~~1Нх = {е}; x£G д)Н<С=* Кет<рн = Н, <pH(G) S G/H. П Утверждения а), б) — очевидны, г), д) следуют из в), и остается доказать утверждение в). Из определения отображения срИ имеем: д е Кет<рн <=> Vt в I: Ндгд = Hgt<=>Vie I: g G д~гНдг. Отсюда следует, что Кекрн = f] д~гНдг. г£1 Так как любой элемент х из G представляется в виде hgt где h € Е Я, г G J, то х~гНх — g~lh~1Hhgl = д~гНдг. Следовательно, {\ (6) г£1 и утверждение в) верно. □ 276
Утверждение 5. Пусть G — конечная группа, и Дя = = {д~гНдг: i G J} — множество всех подгрупп из G, сопряженных с подгруппой Н. Тогда: а) йеЕфн = [G: NG(H)]; б) фн — транзитивно на в)Кег^= П Ng^ x€G г) фн точно о П Ng {х^1Нх) = {е}. 3 ж€3 □ Для любых элементов х, у Е G имеем: х'гНх = у^Ну & Нху-1 = ху-гН & ху'1 е NG(H). Значит, число различных подгрупп в G, сопряженных с Я", равно числу смежных классов группы G по подгруппе Ng(H), и утверждение а) доказано. Утверждение б) следует из разрешимости в G уравнения дгх = д3. Докажем в). По определению отображения фн имеем: д е Кегфн & Vz G J: д^д^Нд^ = д~хНдг <* Vz € J: NG {д-гНд%) Э д. Отсюда следует, что Кетфн = Р| No (fli"1^ff*)e Теперь, используя те же соображения, что и при доказательстве равенства (6), получим утверждение в). Заметим еще, что г) следует из в). □ П р и м е р 2. Пусть G — группа подстановок множества 12 = 1,п, А = {i±y..., ik} — орбита группы G, Н = Gtl — стабилизатор точки i\. Тогда по лемме Бернсайда36 (см. теорему 16.XI) имеем: [G: Gtl] = |Д| = = к, т. е. deg(pH = к. Для нахождения ядра представления <рн заметим, чтох~1Сггх = Gx(%1). Отсюда и из утверждения 4 в) получаем: Кет(рн = = f\ Gx(tl) = Ga — группа всех подстановок из G, оставляющих на x£G месте все точки из А. В частности, если Сд = {е}, то представление <рн — точное. Определение 5. Группы подстановок Gi,(?2 соответственно множеств fii, 0,2 называются подстановочно изоморфными, если существуют биекции ф: Ui —> 0,2, <РЛ- G\ —> G2, удовлетворяющие условию: Va € Пь ty e Gi: tp(g)Ma)) = ф(д(а)). (7) 36 У. Бернсайд — английский математик (1852—1927). 277
Используя операцию умножения отображений, условие (7) можно записать в следующем виде: У9 € G\: ф • (р(д) = д-ф, или Уд G G\: <р(д) = ф~*дф. Из последней записи условия (7) хорошо видно, что (р — изоморфизм групп: (р (pi52) = Ф~19\92Ф = Ф~1дгФФ~192ф = <p(gi)<p(g2), что и оправдывает вторую часть термина "подстановочный изоморфизм". Подстановочно изоморфными группами являются симметрические группы 5(Mi), S(M2) при \М\\ = |М2| (см. утверждение 10. III). Нетрудно привести также и примеры изоморфных, но не подстановочно изоморфных, групп подстановок. В частности, любая группа подстановок G степени п при условии \G\ > п не является подстановочно изоморфной своему правому регулярному представлению. Заметим еще, что условие (7) в более наглядной форме означает: если д = Отсюда видно, что подстановочно изоморфные группы по существу отличаются лишь обозначениями подстановок и элементов, на которых действуют подстановки. В связи с этим ясно, что подстановочные представления группы достаточно описывать лишь с точностью до подстановочного изоморфизма образов. Определение 6. Подстановочные представления cpi,(p2 группы G называют подстановочно эквивалентными, если группы cpi(G), <f2(G) подстановочно изоморфны. Обозначение: cpi ~ у>2- Следующая теорема описывает с помощью подгрупп группы G все транзитивные подстановочные представления группы G. Теорема 2. Любое транзитивное подстановочное представление конечной группы G подстановочно эквивалентно представлению срн группы G на смежных классах по подходящей подгруппе Н. □ Пусть а — транзитивное представление группы G подстановками множества 12 = 1,п, и a(G) = Г < Sn. Так как Г — транзитивна, то ее разложение в смежные классы по стабилизатору Гх точки 1 можно записать в виде: Г = ri7i U ... U Г17п, 7г(1) = г, г G 278
Положим Я = а г (Fi) и выберем в G элементы д±,... ,дп так, что a(gi) = 7г> г G 1,п. Следующая цепочка импликаций показывает, что ffpi, ... , Я#п — разные смежные классы из G: g^gj eH^a (g^gj) е а(Н) => 7ГЧ G Г2 => i = j. (1) Так как Kera = iV С Я, то по теореме об эпиморфизме групп: Г = ^ G/JV, Ti ^ Я/JV, и потому [G: Я] = [Г: Ti]. В итоге имеем разложение группы G в смежные классы по Н: G = Нд\ U ... U Ндп. Докажем, что а ~ (рн. Для этого построим отображения: положив Vt е П: Ф(г) = H9i, V7 е Г: ) • Так как а"1 (7) = Ng для некоторого д Е G, ЛГ < G и TV с Я, то определение отображения у? корректно, и остается проверить условие (7). По определению отображений ср, ф имеем: = Нда • а"1^) 7() Покалсем, что смежные классы Hgaa~1(j) и Яр7(а) совпадают, т. е. Я. Для этого достаточно доказать, что а(раа~1(7)5~(^)) € Е а(Я), т. е. 7o7T7(i)(l) = 1- Последнее равенство проверяется непосредственно: § 2. Регулярные группы подстановок Определение?. Группа подстановок G < S(Q) называется регулярной, если для любых a, b £ п в G существует единственная подстановка д, удовлетворяющая условию д(а) = 6. Следующее утверждение указывает некоторые другие определяющие свойства регулярных групп. 279
Утверждение 6. Для любой группы G < S(U) эквивалентны условия: а) G — регулярна] б) G — транзитивна и\/а ей: \Ga\ = 1; в) G — транзитивна и \G\ = |Л|. □ Для доказательства утверждения достаточно убедиться в справедливости импликаций: а) => б), б) => в), в) => а). Первая из них очевидна, вторая следует непосредственно из леммы Бернсайда, третья легко доказывается методом от противного. □ С алгебраической точки зрения класс регулярных групп содержит все конечные группы, поскольку справедливо Утверждение?. Любая конечная группа G изоморфна регулярной группе подстановок множества G. □ Для доказательства этого утверждения достаточно заметить, что правое регулярное представление p(G) группы G является регулярной группой подстановок множества G. Действительно, p{G) — транзитивна в силу разрешимости в G уравнения д\х = §2 при любых 51,52 e G, и \p(G)\ = |G| в силу изоморфизма групп p(G) и G. □ П р и м е р 3. Пусть Q = Ъп = 0, п — 1, и "+" — операция сложения в кольце Zn. Правое регулярное представление Gn группы (Zn; +) состоит из подстановок да = ( ) , а е п. Группа Gn, как и (Zn; +), \ X ~т~ Cl J является циклической группой, она порождается подстановкой: (0,1,...,п-1) = П р и м е р 4. Пусть О = {(ai,..., ап) : щ G GF(2)} — n-мерное векторное пространство строк над полем GF(2), и ф — операция сложения векторов (т. е. покомпонентного сложения по модулю 2). Тогда правое регулярное представление Ег71 группы (Л; 0) состоит из подстановок сга = f I , а € ГК, и является, как и Ег^, элементарной абелевой 2-группой. Следующее утверждение свидетельствует о том, что правыми регулярными представлениями конечных групп исчерпываются все регулярные группы подстановок. 280
Утверждение 8. Любая регулярная группа подстановок G < S(Q) совпадает с правым регулярным представлением подходящей группы (п; *). □ В G элементы можно занумеровать элементами из Q, сопоставив элементу g € G номер а = д(1). Таким образом, \/а € П: да(1) = а. (8) Определим на множестве п операцию *, положив для a, b Ей: а*Ь = дъ(а), (9) и покажем, что формула Va Е Q: <р (да) = а задает изоморфизм (р группы G на группоид (£2; *). Очевидно, что <р — биективно. Кроме того, из (8)-(9), имеем: (да9ь) (1) = 9ь (5а(1)) = 9ь{о) = о. * 6. Следовательно, 9а9ь = 9а*ь, и потому (р(да9ь) = а*Ь = ср(да) * <р(#,). Так как <р — изоморфизм, то по следствию теоремы 5.Ш (Л; *) — группа, и в силу (9) G — ее правое регулярное представление. □ Замечание! Равенство (9) сводит действие подстановки регулярной группы G < 5(0) к соответствующей операции * на Л. Непосредственно из теоремы 1 получаем УтверждениеЭ. Централизатор любой регулярной группы подстановок G < S(u) в группе S(u) изоморфен G и совпадает с G, если группа G абелева. Отметим одно свойство цикловых структур подстановок из регулярных групп. Утверждение 10. Пусть G — правое регулярное представление группы (Q; *). Тогда подстановка g — I ) из G разлагается в произведение |£2|/£ независимых циклов длины £, где £ = Orda. □ Из алгоритма разложения подстановки g в произведение независимых циклов (см. § 8.XI) следует, что длина цикла, содержащего #о, есть наименьшее натуральное число £, удовлетворяющее условию gt (xq) = хо, или, в нашем случае, хо • а? = xq, что равносильно условию £ = Oida. □ 281
§ 3. Кратно транзитивные группы подстановок Определеннее. Группа подстановок G < S(Q), где \Щ > > к, называется к-транзитивной (точно k-транзитивной), если для любых двух наборов а = (ai,..., а/ь), /3 = (6i,..., bk) no к различных букв из Q в G существует подстановка (единственная подстановка) д, переводящая а в /3, т. е. удовлетворяющая условию д(щ) = bi, i G 1, fc, или, короче, д(а) = /3. Из определения 8 видно, что классы 1-транзитивных и точно 1-транзитивных групп совпадают соответственно с классами транзитивных и регулярных групп подстановок. Группы fc-транзитивные при к > > 1 называют кратно транзитивными. Простейшими примерами кратно транзитивных групп являются симметрическая группа подстановок Sn при п > 1 и знакопеременная группа Ап при п > 2. Очевидно, что группа Sn — точно n-транзитивна. Группа Ап при п > 2 точно (п—2)-транзитивна. Действительно, для наборов а = (ai,..., an-2), /3 = = (bi,. -. ,6П_2) в Sn существуют ровно две подстановки, переводящие ав/3,и эти подстановки имеют разную четность. Следовательно, ровно одна из них содержится в группе Ап. Прежде, чем рассмотреть другие примеры, приведем критерии jfc-транзитивности и точной fc-транзитивности. Теорема3. Группа подстановокG < S(fl) (точно) к-транзитивна тогда и только тогда, когда: 1) G транзитивна, 2) стабилизатор Ga группы G хотя бы для одной точки а € П (точно) к — 1-транзитивен, как группа подстановок на множестве п \ {а}. □ Если группа G (точно) fc-транзитивна, то условия 1)—2) проверяются очевидным образом. Обратно, пусть для группы G выполнены условия 1)—2), и а = (ai,...,afc), Р = (&b---»&fc) — любые наборы по к различных букв из Q. По условию 1) в G найдутся подстановки 5ьР2 такие, что pi(ai) = a, 52(^1) = а. Пусть при этом pi (a) = = (а, аз» • • • * ак)» 92(0) = (а, &2> • • *' Ю- По условию 2) в Ga найдется подстановка д$ такая, что рз(^2>- - ^о!к) = (&2,...,?4). Легко видеть, что подстановка д\дъ92 переводит а в /3, и потому G fc-транзитивна. Докажем теперь, что G является точно Jfc-транзитивной, если группа Ga точно (к — 1)-транзитивна. Допустим, что G не является точно к- 282
транзитивной. Используя введенные обозначения, можно считать, что в G существуют две разные подстановки д^дъч переводящие набор а в /?. Тогда д\1д4д2, д\1д$д2 являются различными подстановками группы Ga, переводящими набор (а2,..., ак) в (Ь2,..., bk), что противоречит точной к — 1-транзитивности группы Ga- □ Утверждение 11. Пусть G — к-транзитивная группа подстановок степени п. Тогда: а) порядок группы G кратен числу п(п — 1)... (п — к + 1); б) |G| = п(п — 1)... (п — к + 1) <Ф G точно к-транзитивна. □ Утверждение а) следует из равенства: |G| = п(п - 1)... (п - к + l)|Gei,...,aJ, (10) которое получается последовательным применением леммы Бернсайда к группам G, C?a1,.--,G?a1,...,ofc_i- Утверждение б) легко доказывается индукцией по к с использованием утверждения 6, леммы Бернсайда и теоремы 3. □ Из утверждения 116) и равенства (10) получаем Следствие. Группа подстановок G < S(Q) точно к-транзитивна тогда и только тогда, когда она k-транзитивна, и \Gau...tak\ = 1 для любых различных а±,..., а^ € Г2. Рассмотрим теперь ряд практически интересных примеров кратно транзитивных групп. П р и м е р 5. Пусть G = AGL{n,q) — полная аффинная группа преобразований пространства Рп над полем Р = GF(q). Напомним, что она состоит из всех подстановок х где ф — любое невырожденное линейное преобразование пространства Рп, а а — любой фиксированный вектор из Рп. Группа G транзитивна, так как любой вектор 7 в любой вектор 5 можно перевести подстановкой Аф%а при ф = е, а = 8 — 7. Стабилизатором нулевого вектора в в группе G является, очевидно, полная линейная группа GL(n, q). Она, как группа подстановок на множестве Рп \ {в}, транзитивна. Действительно, если ai,/3i — любые ненуле- 283
вые векторы, то по теореме 4.ХШ существуют базисы пространства Рп: (ai, a2,..., otn), (/?i, /З2,. -., /Зп)- Теперь осталось заметить, что любой один базис пространства Рп в любой другой базис можно перевести с помощью линейного преобразования пространства Рп. Итак, группы G и G$ транзитивны. Тогда по теореме 3 группа G = AGL(n,q) 2-транзитивна и точно 2-транзитивна при п = 1. Если Р = GF(2)y то любая система из двух различных ненулевых векторов Qi, Q.2 линейно независима. Следовательно, в этом случае точно так же можно доказать, что группа GL(n,2), как группа подстановок множества Рп \ {#}, 2-транзитивна, а потому группа AGL(n,2) — 3-транзитивна. Покажите, что при Р ф GF{2) аналогичные утверждения неверны. П р и м е р 6. Полная аффинная группа AGL (I, Zm), состоящая из подстановок вида: Н- Ь ) ' °' Ь является транзитивной на множестве Zm, поскольку для любых с, d G G Zm элемент с переводится в d подстановкой Fi^-C- Так как \AGL (l,Zm) I = т,(р(т), где ур — функция Эйлера, то из утверждения 11 следует, что группа AGL (I, Zm) не может быть 2-транзитивной, если (р(т) ф т — 1, т. е. если т — не простое число. Если же т — простое число, то группа AGL (I, Zm) точно 2-транзитивна, поскольку в ней стабилизатор нуля Нш состоит из подстановок вида ( ), & 6 ZJ^ и может \axj рассматриваться как регулярная группа подстановок множества Ъ*ш. Заметим еще, что множество Gm всех преобразований вида ( ), \х + Ь) Ъ £ Zm, образует подгруппу (и даже нормальный делитель) группы AGL (I, Zm), и AGL (I, Zm) = Gm . #m. П р и м е р 7. Пусть fi = PU {00}, где Р — любое поле, и сю 0 Р. Каждой невырожденной матрице А = I , J поставим в соответствие преобразование дА : Q —> П, определяемое по правилу: 284
если a Е Р, са + d ф О, оо, если а Е Р, са + d = 0, /- - ч ^, если а = оо, с ф О, оо, если а = оо, с = 0. Преобразование дл будем обозначать в виде: Легко проверить, что дА — подстановка множества Q, и множество G={gA:AePl2} является группой. Она называется группой дробно линейных преобразований поля Р. Из (11) видно, что дА(а) при любом фиксированном a G О и подходящих CL)b)C,d G Р может принимать любое значение из fi. Следовательно, G транзитивна. Стабилизатор Goo точки оо в группе G состоит из всех подстановок вида ( , ),а€Р*,ЬЕР, и является точно 2-транзитивным (см. пример 5 при п = 1). Отсюда на основании теоремы 3 имеем: группа G точно 3-транзитивна. По утверждению 11 ее порядок при Р = GF(q) равен: Заметим, что рассмотренные в примере 7 группы входят в серию так называемых проективных линейных групп. В общем случае проективная линейная группа PGL(n,q) степени п над полем Р = GF(q) определяется как группа подстановок множества fin(<?) одномерных подпространств пространства Рп, индуцируемых линейными преобразованиями пространства Рп. При п = 2 группа PGL{n,q) подстановочно изоморфна группе дробно линейных преобразований поля Р из примера 7. При этом биекции яр и ср из определения подстановочно изоморфных групп (см. определение 5) можно задать следующим образом: яр переводит любой элемент а из Р в пространство ((а, 1))р и оо — в ((1,0))р; 285
<р сопоставляет преобразованию дА множества Ри{оо} подстановку множества Qn(q)1 индуцируемую линейным преобразованием с матрицей А в стандартном базисе е± = (1,0), e*z = (0,1) пространства Р2. Докажите последнее утверждение в качестве упражнения. В заключение данного параграфа отметим, что вопрос о построении fc-транзитивных групп подстановок, отличных от симметрических и знакопеременных групп, при больших значениях к является в целом нерешенным. К настоящему времени известны лишь две 4-транзитивные группы (степеней 11 и 23) и две 5-транзитивные группы (степеней 12 и 24). Они были найдены французским математиком Э. П. Матье (1835- 1890) и носят его имя. Примеров А:-транзитивных групп, отличных от Ап и 5П, при к > 6 не найдено. В 1873 г. К. Жорданом доказано, что при к > 6 точно fc-транзитивных групп, отличных от Ап и Sn, не существует, а при к = 4,5 единственными такими группами являются указанные выше группы Матье степеней 11, 12. § 4. Примитивные и импримитивные группы подстановок Определение 9. Подмножество Qi С ft называется блоком группы G < S(u), если VgeG: {д(пг) = пг или д(П1)Пп1=0). Примерами блоков любой группы G < S(Q) являются само множество п и все его одноэлементные подмножества. Эти блоки называются тривиальными. Легко видеть, что в интразитивной группе G любая орбита является блоком. Заметим еще, что если ui — блок группы G и д е G, то д (fii) тоже блок группы G. В зависимости от наличия или отсутствия нетривиальных блоков все транзитивные группы делятся на два класса. Определение 10. Транзитивная группа подстановок G называется примитивной, если она не имеет нетривиальных блоков и им- примитивной — в противном случае. 286
Пример8. Пусть G — подгруппа из 5б, порожденная подстановкой д = (1,2,3,4,5,6). Легко проверить, что она имеет следующие нетривиальные блоки: 111 = {1,3,5}, П2 = {2,4,6}, П3 = {1,4}, fi4 = {2,5}, ft5 = {3,6}. Так как G транзитивна, то по определению 10 она импримитивна. В примере 8 длины всех блоков группы G являются делителем числа 6, т. е. степени подстановок. Оказывается, этот факт не случаен. Однако прежде, чем доказать его в общем случае, дадим ОпределениеП. Система блоков fii,..., Qk импримитивной группы G < S(fl) называется полной системой блоков, сопряженных с блоком fti, если f)i U...Ufifc есть разбиение множества fi, и для любого г € 1, к в G существует подстановка дг такая, что Пг = дг (fli). Утверждение 12. Для произвольного блока Qi любой импримитивной группы G существует полная система блоков, сопряженная с пг. □ Пусть G = {gi,... ,рлт}- По сделанному ранее замечанию множества gz(Qi) являются блоками группы G при всех г € l,iV. Так N как G транзитивна, то (J дг (Oi) = Q. Кроме того, любые два блока г=1 gz(ui), gj(fli) или совпадают, или не пересекаются. Следовательно, выбрав каждый из встречающихся в системе д\ (fii),... ,р# (fii) блоков ровно по одному разу, мы получим искомую полную систему блоков группы G. □ В группе G из примера 8 полными системами блоков являются Следствие. Порядок любого блока импримитивной группы G < S(u) делит число \п\. □ По утверждению 12 для любого блока Q± группы G существует полная система блоков, сопряженных с пг. Так как все блоки системы равномощны, то \Q\ = \Cl\\ • к, где к — число блоков в рассматриваемой полной системе. Следовательно, |Jli| |fl|. □ Наличие у импримитивной группы подстановок G < S(fl) полных систем нетривиальных блоков позволяет строить для группы G подстановочные представления степеней меньших чем |Я|. Утверждение 13. Пусть Q = {fii,..., Qk} — полная система блоков импримитивной группы G. Тогда отображение <р: G —> S(Q), 287
определенное формулой ,<«$ )• является гомоморфизмом. Доказательство осуществляется непосредственной проверкой. Пользуясь утверждением 12, нетрудно описать все блоки любой регулярной группы. Утверждение 14. Если группа G < S(Q) является правым регулярным представлением группы (£2; *), то подмножество fii С fi является блоком группы G тогда и только тогда, когда пг является правым смеоюным классом группы (п; *) по некоторой ее подгруппе. □ Пусть их — правый смежный класс группы (Q; *) по некоторой подгруппе Н. Тогда для любой подстановки да = ( ) из G мно- жество pa(^i) = fii * а будет также правым смежным классом группы (П; *) по подгруппе Н. Следовательно, ga(^>i) ПИ± € {0, fii}, т. е. пг — блок группы G. Обратно, пусть п± — блок группы G, и Qi,..., uk — ее полная система блоков, сопряженных с fix, т. е. п{ = gai (fii) = ill • щ для некоторых ai,..., a& G £2. Выберем блок fis, содержащий единицу е группы (П; *). Если a G П5, то #a(^s) = us • а, и (fis • о Г) П5) э а. А так как fis — блок, то имеем Qsa = п3 для любого а еп8. Следовательно, Qs — подгруппа в G, afii,...,^ - суть все правые смежные классы (О;*) иоп8. □ Следствие. Регулярная группа подстановок G < S(fl) примитивна, если |П| — простое число, и импримитивна, если |П| — составное число. □ Утверждение очевидно, если учесть теорему 32.XI. □ Следующее утверждение показывает, что класс примитивных групп является промежуточным между классами транзитивных и 2-транзи- тивных групп. Утверждение 15. Любая 2-транзитивная группа примитивна. □ Допустим, что 2-транзитивная группа G < 5(П) имеет нетривиальный блок п\. Тогда существуют а,Ь € fii, а ф 6, с £ Q\Qi и подстановка g € G такие, что д(а) = 6, д(Ь) = с. Отсюда имеем p(fii) 7^ ^1 и p(fii) П ili Э Ь — противоречие с тем, что f2i — блок группы G. □ Определение 12. Примитивные, но не 2-транзитивные группы подстановок называют унипримитивными группами. 288
Примерами унипримитивных групп могут служить регулярные группы подстановок простой степени. Они примитивны по следствию утверждения 12 и не 2-транзитивны по утверждению 11 а). Докажем критерий примитивности. Теорема 4. Транзитивная группа подстановок G < S(Q) примитивна тогда и только тогда, когда стабилизатор Ga любой точки аЕП является максимальной подгруппой в G, т. е. в G нет подгрупп Н, удовлетворяющих условию: Ga^H^G. (12) □ Пусть для некоторого а е п в G существует подгруппа, удовлетворяющая условию (12). Докажем, что орбита Н(а) группы Н является блоком группы G. Действительно, если Н(а) П д(Н(а)) Э Ь для некоторых д € G, Ь Е fi, то существуют fti, /12 € Н такие, что Ь = h\{a) = = д(Ь,2(а)). Тогда h,2gh^[1{a) = а, т. е. h^gh^1 € Ga- Отсюда следует, что д € h^Gahi С Н, и потому д(Н(а)) = #(а). Итак, fii = Н(а) — блок G. Покажем, что он нетривиальный. Так как Н ф Ga, то в Н найдется такая подстановка Л, что h(a) = с ф а. Следовательно, Qi Э а, с и |Qi| > 1. Кроме того, ui ф ft, так как, в противном случае, ui = G(a), и, используя лемму Бернсайда и очевидное равенство На = Ga, получим \Н\ = |#(а)| • |#а| = |G(a)||Ga| = \G\ — противоречие с условием (12). Таким образом, Н(а) — нетривиальный блок группы G, т. е. группа G не примитивна. Обратно, пусть G — не примитивна, и а — любой элемент из Q. По утверждению 12 найдется нетривиальный блок Ui группы G, содержащий а. Рассмотрим множество подстановок: Очевидно, что Н — подгруппа в G, содержащая Ga. Так как G тран- зитивна и £1\ ф Q, то Н ф G. А так как \Qi\ > 1, то fix, кроме а, содержит некоторый элемент Ь, и тогда подстановка из G, переводящая а в Ь, содержится вЯ\Со. Таким образом, в G нашлась подгруппа ТУ, удовлетворяющая условию (12). □ Условие примитивности играет важную роль при описании групп подстановок, заданных системами образующих. Об этом, в частности, свидетельствует 289
Утверждение 16 (К. Жордан, 1871). Если группа G < S(Q) примитивная и содержит траспозицию, то G = S(Q). □ Пусть (a, &i) — траспозиция из G, М = {(a, fci), (а, Ь2),. -., (а, fcfc)} — множество всех траспозиций из G, не оставляющих на месте а, и Я = (М). Так как (a,&i) Е Я, то по теореме 4 G = (Ga,H). А так как для любого р Е Ga и любого z'Gl,fe выполняется равенство р"1 (а, Ь*)р = = (щд(Ьг)), то Я < G, и потому G = Ga • Н. Следовательно, каждый элемент из G представим в виде: где д G Ga. Ясно, что такими подстановками букву а можно перевести лишь в буквы а,&1,...,6&, и в силу транзитивности группы G имеем {a,&i,... ,bfc} = fi. Отсюда и из теоремы 20.XI следует, что Н = 5(fi), а тогда и подавно G = 5(fi). □ В заключение данного параграфа укажем еще одно приложение теоремы 4. А именно: из теоремы 4, используя следствие 2 утверждения 4.XI, легко получить Утверждение17. Подстановочное представление ipH(G) группы G на ее правых смежных классах по подгруппе Н является примитивной группой тогда и только тогда, когда Н — максимальная подгруппа группы G. Задачи 1. Описать всевозможные степени транзитивных подстановочных представлений конечной абелевой группы заданного порядка. 2. При каких условиях являются регулярными группами подстановочные представления группы G на смежных классах по подгруппе Н и на подгруппах, сопряженных с Н? 3. Доказать, что если индекс подгруппы Н группы G равен наименьшему простому делителю порядка группы G, то Н < G. 4. Доказать, что нормализатор регулярной группы подстановок Т,2п совпадает с группой i4GL(n,2). 5. Доказать, что группа подстановок G < S(£l) fc-транзитивна тогда и только тогда, когда подстановками из G можно какой-либо один набор к различных букв из Q перевести во все наборы к различных букв из 290
6. Доказать, что для конечного коммутативного кольца R с единицей ипе№ а) группа AGL(n, R) транзитивна; б) AGL(n, R) примитивна <=$> R — поле; в) AGL(n, R) 2-транзитивна <=> R — поле; г) AGL(n, R) 3-транзитивна Ф> R = GF(2); д) AGL(n, R) 4-транзитивна Ф> R = GF(2), n = 2; е) AGL(2,2)^S4; ж) GL(2,2) *± Ss. 7. При каких значениях п группа AGL(n, 2) точно 3-транзитивна? 8. Доказать, что проективная линейная группа PGL(n, q) изоморфна факторгруппе полной линейной группы GL(n,q) по ее центру. 9. Пусть транзитивная группа подстановок G степени п содержит подстановку р, представимую в виде произведения двух независимых циклов длин ni, ^2» где ni + П2 = п и (721,^2) = 1- Доказать, что G примитивна. 10. Выяснить, как изменится класс примитивных групп, если в определении примитивной группы опустить условие транзитивности. 11. Описать все полные системы блоков циклической группы G < < Sn, порожденной подстановкой д = (1,2,..., п). 12. Выяснить, при каком условии будет примитивной группа G = = (а, д), гдеа = (г,^'), 5 = (1,2,...,п). 13. Доказать, что любой нормальный делитель примитивной группы подстановок транзитивен. 14. Установить биективное соответствие между блоками транзитивной группы G, содержащими точку а, и всеми подгруппами группы G, содержащими стабилизатор Ga- (Указание: воспользоваться основной идеей доказательства теоремы 4.) 15. Пусть G < S(fi,), А — орбита группы G, и (р — отображение G в группу 5(А), определенное формулой: Уд € G: <р(д) = р|д, где д\А ~ ограничение д на Д. Покажите, что ср — представление группы G, эквивалентное представлению срн группы G на ее смежных классах по стабилизатору Н = Сд всех точек из А. 16. Для подстановочного представления (р импримитивной группы G на полной системе блоков (см. утверждение 13) найти подгруппу Н < G такую, что (р = срн. 291
Глава XXV ЛИНЕЙНЫЕ РЕКУРРЕНТНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ Линейные рекуррентные последовательности — древнейшие объекты изучения в алгебре и теории чисел. Исторически первыми из них изучались арифметические и геометрические прогрессии. Хорошо известна также последовательность Фибоначчи (см. ниже пример 4), первоначально введенная в 1202 г. в знаменитой "Книге об абаке" итальянским математиком Леонардо Пизанским (Фибоначчи) (около 1180—1240). Свойства этой последовательности до сих пор широко используются в различных областях математики. В частности, они были существенно использованы нашим современником, ленинградским математиком Ю. В. Матиясевичем при решении 10-й проблемы Гильберта зт об отсутствии алгоритма для распознавания разрешимости алгебраических уравнений над Z (диофантовых уравнений, названных так в честь древнегреческого математика Диофанта (3 век до н. э.)). Основы теории линейных рекуррентных, или "возвратных", последовательностей были заложены в трудах английского математика Абрахама де Муавра (1667—1754) и одного из членов Петербургской академии наук, швейцарского математика Даниила Бернулли (1700—1782). Развернутую теорию изложил крупнейший математик XVIII в., петербургский академик швейцарец Леонард Эйлер. Из более поздних работ следует выделить труды российских академиков П. Л. Чебыше- ва (1821—1894), А. А. Маркова (1856—1922) и французского математика Е. Люк£ (1842-1891). В наше время теория линейных рекуррентных последовательностей переживает второй этап интенсивного развития, связанный с различными приложениями дискретной математики. В частности, ее используют при построении помехоустойчивых кодов для передачи информации и при мододелировании на ЭВМ псевдослучайных последовательностей для проведения вычислений методом Монте-Карло. 37 Д. Гильберт — немецкий математик (1862—1943). 292
§ 1. Основные определения. Семейство ЛРП с данным характеристическим многочленом и его базисы Всюду далее R — коммутативное кольцо с единицей е. 1.Определение].. Последовательностью над R назовем любую функцию и: No —» -R, при этом для каждого г £ No элемент и(г) назовем г-м членом последовательности и. Множество всех последовательностей над R обозначим через R°°. Для наглядности, последовательность и £ R°° молено записывать в виде бесконечного вектора гх = КО),гх(1),...,^(г),...). (1) Последовательность (0,0,..., 0,...) будем называть пулевой и обозначать через (0). Определение2. Последовательность и £ R°° называют линейной рекуррентной последовательностью (сокращенно ЛРП) порядка т > 0 над R, если существуют константы /o,/i,.. . ,/m-i £ R такие, что Уг £ No: и{г + т) = fm-Mi + т - 1) + ... + fm(i + 1) + fou(i). (2) В этом случае соотношение (2) называют законом рекурсии ЛРП гг, многочлен F{x) = хт — /т-1Хт~г — ... — fix — /о — характеристическим многочленом ЛРП и, а вектор и(0, т — 1) = (^(0),..., и(т — 1)) — ее wa- чальным вектором. Последовательность (0) считается по определению единственной линейной рекуррентной последовательностью порядка 0 с характеристическим многочленом F{x) = e. П р и м е р 1 {геометрическая прогрессия). Для любых a,q £ R последовательность и = (a, aq,..., aq%,...) есть ЛРП первого порядка с характеристическим многочленом x—qn начальным вектором и(0) = а. П р и м е р 2 (арифметическая прогрессия). Для любых a,d £ R последовательность v £ R°° с общим членом v(i) = а + di, г £ No, есть ЛРП порядка 2 с характеристическим многочленом F(x) = х2 — 2х+е — = (х — е)2 и начальным вектором (a, a + d). 293
П р и м е р 3 (конгруэнтная последовательность). Последовательность w Е Д°°, которая при фиксированных a, g, d Е R задается соотношениями: w(0) = a, w(i + 1) = дгу(г) + d, г Е No, есть ЛРП с характеристическим многочленом F(rr) = (х — е)(х — q) и начальным вектором ги(О,1) = (a, ag + d). Арифметическая прогрессия (пример 2) есть частный случай конгруэнтной последовательности при q = е. Такие последовательности над кольцом R E {Zio«,Z2«} часто используются при моделировании датчиков псевдослучайных чисел на ЭВМ. П р и м е р 4 (последовательность Фибоначчи). Эта последовательность была придумана для решения задачи, называемой "задачей о размножении кроликов". Допустим, что у каждой пары зрелых кроликов через месяц рождается новая пара кроликов, которая еще через месяц достигает зрелости. Сколько всего пар кроликов можно получить от одной зрелой пары за г месяцев? Если обозначить искомую величину через и(г), то нетрудно увидеть что и(0) = 1, и(1) = 1 и u(i+2) = u(i+l)+u(i) для г Е N. Таким образом, и — ЛРП над Z с характеристическим многочленом F(x) =ж2-х-1и начальным вектором ?х(0Д) = (1,1). П р и м е р 5. Последовательность Д, где Д(г) — значение "ленточного" определителя порядка % + 1 над кольцом R: А(г) = ь а 0 0 0 с Ь а 0 с Ь 0 0 с 0 0 ... а 0 ... Ь а 0 0 0 с Ь есть ЛРП с характеристическим многочленом х2 — Ьх + ас и начальным вектором Д(0,1) = (Ь, Ь2 — ас). Этот факт устанавливается путем разложения определителя Д(г) по 1-й строке. Зафиксируем унитарный многочлен F(x) = хт — /m-i^171"1 — ... • • - — /о £ R[x] степени т > 0 и обозначим через Lr(F) семейство всех ЛРП над R с характеристическим многочленом F(x). Тогда непосредственно из определения 2 вытекает 294
Утверждение 1. Любая ЛРПи G Lr(F) однозначно задается своим начальным вектором и(0, га — 1). Если \R\ < ос, то Lr(F) = \R\m. 2. При исследовании свойств ЛРП весьма плодотворным оказывается алгебраический подход, связанный с введением на R°° различных операций. Определение 3. Суммой последовательностей и, v € R°° и произведением последовательности и на константу г Е R называют, соответственно, последовательности w = и + v и z = ru, определяемые соотношениями: Vz Е No: w(i) = u(i) + v{i), Vi E No: z(i) = ru(i). Очевидно, что группоид (i?°°, +) есть абелева группа с нулем (0), и для любых а,6 G R,u,v G R°° справедливы соотношения: (ab)u = а(Ьи), (а + Ъ)и = аи + Ьи, а(и + v) = аи + av, ей = и. (3) В частности, если Р — поле, то определенные выше операции задают на Р°° структуру левого векторного пространства рР°°, имеющего, очевидно, бесконечную размерность. Из определений 2, 3 легко следует Утверждение2. Для любого унитарного многочлена F{x) E € R[x] подмножество Lr(F) С R°° есть подгруппа группы (R°°y+), выдерживающая умножение на элементы из R. Если Р — поле и F(x) Е Р[х] — унитарный многочлен, то Lp(F) — подпространство пространства Р°°. Таким образом, в случае, когда Р — поле, можно говорить о базисе пространства Lp(F). Мы, однако, не будем рассматривать эту простейшую ситуацию отдельно, а введем и изучим аналог понятия базиса пространства для произвольного семейства Lr(F). Определение 4. Для унитарного многочлена F(x) G R[x] степени т > 0 систему последовательностей ui,...,um £ Lr(F) назовем базисом семейства Lr(F), если для любой последовательности и € LrF существует единственный набор констант ci,..., Cm £ R такой, что U = C\U\ + . . . + CmUrn. (4) 295
Доказательство существования и описание базисов семейства Lr(F) дает Утверждение 3. В обозначениях определения 4 система последовательностей щ,...,ит Е Lr(F) есть базис Lr{F) тогда и только тогда, когда составленная из начальных векторов этих последовательностей матрица U = -l) \ ит(0,т-1) обратима над кольцом R. □ Если U — обратимая матрица, то для любой последовательности и Е Lr(F) существует единственный набор (ci,...,^) Е R^ такой, что u(0,m-l) = (Cl,...,cm).[/. (5) Рассмотрим последовательность v = c\U\ + .. -+стит. По утверждению 2 v E Lr(F). Кроме того, очевидно, что v(Q, т — 1) = (с\... Cm)U = = и(0, т — 1). Поэтому в силу утверждения 1 v = щ т. е. справедливо (4). Единственность представления последовательности и в виде (4) следует из того, что (4) влечет (5). Таким образом, г^,... ,ит — базис LR(F). Наоборот, пусть ui,..., ит — базис Lr(F). Определим для каждого к Е 1,га ЛРП е^1 Е Lr(F) с начальным вектором e^(0,m — 1) = Дь, где Ek — к-я строка единичной матрицы ЕтХт- По предположению каждая из последовательностей е% представляется в виде: е£ = Ск1Щ + . . . Но тогда для матрицы С = (cke)mxm справедливы равенства: / ef(0,m-l) \ Следовательно, U — обратимая матрица. □ 296
П р и м е р 6. Определенная выше система ЛРП ef,..., е^ Е Lr(F) есть базис Lr(F). Следствие. Для унитарного многочлена F(x) над полем Р § 2. Умножение последовательности на многочлен. Генератор ЛРП 1. Утверждение 3 позволяет описать все семейство Lr(F) как множество комбинаций лишь т = degF(x) последовательностей из Lr(F). Оказывается, семейство Lr(F) можно описать еще более "экономно" — через одну последовательность специального вида. Определим на R°° внешнюю операцию умножения слева на многочлены из R[x]. Для любых к Е No и и Е R°° положим: хк • и = v, где v(i) = u(i + к) для г Е No- (6) Другимим словами, умножение на хк есть сдвиг последовательности и на к шагов влево или вычеркивание из и первых к членов: хк • (u(0), и(1),...) = (u(fc), u(k + 1),.. .)• (7) т Определение 5. Произведением многочлена А(х) = ]Г} ак% на к=о последовательность и Е R°° называется последовательность А(х)и Е Е R°° вида: т A(x)u = Y,"k(xk-u). (8) к=0 Из (8) легко видеть, что А(х)и = гу, где ги(г) = ^ а^ • и(г + к) для г Е No. (9) fc=0 Утверждение^ Для любого унитарного многочлена F(x) G" Е R[x] верно равенство Lr(F) = {г* € Л°°: F(x) • и = (0)}. (10) 297
□ Если F(x) = е, то по определению 2 Lr(F) = {(0)}, и равенство (10) очевидно. Если degF(x) = га > 0, то при обозначениях определения 2 достаточно заметить^ что для любой последовательности и G R°° F(x)u = v, гдеи(г) = u(i + m)- fm-iu(i + m-l) —.. . — fou(i) ддя г G No. Поэтому условие (2) равносильно условию F(x) • и = (0). □ Основные свойства операции умножения последовательности на многочлен описывает Теорема 1. Для любых А(х), В(х) е R[x] и u,v E R°° справедливы равенства: А(х) - (и + v) = А(х) • и + А(х) • v9 (11) (А(х) + В(х)) • и = А(х) • и + В(х) - щ (12) (i4(a?) • В(ж)) • и = А(х) - (Б(я?) - г/). (13) П Равенства (11) и (12) легко выводятся из определения 5. Для доказательства (13) заметим, что для любых а, Ь Е R и к,£ € No из определений легко следует равенство ахк • (Ьх* • и) = abxk+1 • и. Поэтому, если А(х) = ^2 акхк> В(х) = J2 bexi> т0 из (12) и (11) следуют равенства: к>0 £>0 (А(х) - В{х)) u=[ к,е>о (x) • и) = к>о = А(я?) • (В(ж) • и)). П Следствие1. Длл любого унитарного многочлена F(x) G R[x] семейство Lr(F) выдерживает умножение на многочлены из R[x]. □ Если и е LR(F), А(х) € R[x], то F(x) -(А(х)-и) = (F(x)• Л(х))-и = = Л(х) • (F(x) • ^г) = А(х) • (0) = (0). Следовательно, Л(ж) • u £ LR(F). D Следствие2. Любая ЛРП и над кольцом R имеет бесконечно много характеристических многочленов. □ Если и G Lr(F), то любой унитарный многочлен Н(х) £ R[x] -F(x) является характеристичеким для ЛРП и. □ Замечание 1. Если Р — поле, то отображение а: Р°° —> Р°° по правилу УиеР°°: а(и)=х-и (14) 298
есть линейное преобразование пространства рР°° со свойством: \/А(х) €Р[х], \/и€Р°°: А{и){и) = А(х)и. Поэтому теорема 1 в случае, когда R = Р — поле, есть следствие теоремы 4.XV. Следствие 1 в этом случае означает, что Lp(F) — подпространство пространства рР°°, инвариантное относительно линейного преобразования а. 2. Для унитарного многочлена F(x) E R[x] степени т > О через eF обозначим ЛРП из Lr(F) с начальным вектором е^(0, га — 1) = = (0,..., 0, е) (т. е. последовательность е^ из примера 6). Теорема 2. Пусть F(x) = хт - /m-ix171"1 - ... - /о G R[x], т > 0. Тогда для любой ЛРП и Е Lr(F) существует единственный многочлен Ф(х) G R[x] такой, что и = Ф(х) • eF, deg Ф(х) < m, (15) и этот многочлен имеет вид т-1 Ф(х) = «( (16) D По утверждению 3 система ЛРП eF,xeF,...,xm~1eF €. Lr(F), есть базис семейства Lr(F), так как матрица начальных векторов этой системы U = eF(O,m-l) xeF(O,m-l) xm-1eF(O,m-l) /eF(O,m-l) \ ^ eF(m-l,2m-2) 0 0 0 e eF(m) (17) e eF(m) eF(2m - 2) / обратима над R. Следовательно, существует единственный набор ко- эффициентов R такой, что и — eF + (pi • xeF 299
.. - + <£m-i • xm гег. Теперь очевидно, что Ф(х) = щ + (fix + ... • • • + Vm-i^771"1 ~ искомый единственный многочлен, удовлетворяющий условиям (15). Для вывода формулы (16) заметим, что коэффициенты многочлена Ф(х) удовлетворяют равенству: w(0, т - 1) = (<ро ..., (fm-i) • С Покажем, что обратной для U является матрица: (18) V = ( -Л -/2 -/m-1 k e -h ... -/з ... е 0 0 .... —/m-1 е е \ 0 0 0 / (19) Рассмотрим произведение строки Vs матрицы V на столбец щ матрицы U. Из (17) и (19) сразу видно, что V8 - UJ; = 0, если s > t, и VSU} = е для 5 € 1,га. Остается показать, что если s < t, то Й>£// = 0. Заметим, что Vs = (-fs, -Л+i,..., -fm-u е, 0,..., 0), m-(s-l) Поэтому Отсюда, полагая j = t — 5 — 1, получаем j > 0, K^t1 = eF(j + m) - fm-ieF(j + m - 1) - ... - fseF(j + *), и, пользуясь тем, что j+s = t — 1<ши eF(i) = 0 для г < j + 5, приходим к соотношениям: £# FF-l)-.. .-fseF(j+s)~.. .-/oeF(j) = 0. 300
Следовательно, V = U *, и вектор коэффициентов многочлена Ф(х) находится из (18) по формуле: (<Л), • • •, <Pm-i) = (^(0),..., и(т - 1)) • V. Отсюда и из (19) следует (16). □ Замечание 2. В случае, когда R = P — поле, теорема 2 по сути дела утверждает, что Lp(F) — подпространство пространства Р°°, не только инвариантное относительно преобразования сг, определяемого условием (14), но и циклическое относительно сг, причем eF — вектор, порождающий подпространство Lp(F), т. е. в обозначениях определения 19.XV LP(F) = L°(eF). Определеннее. Многочлен Ф(х), удовлетворяющий условиям (15), называется генератором ЛРП и относительно ее характеристического многочлена F(x). § 3. Минимальный многочлен и аннулятор ЛРП 1. Как уже отмечалось, любая ЛРП над R имеет характеристические многочлены сколь угодно большой степени (следствие 2 теоремы 1). Естественное желание задать ДРП наиболее "экономным" способом приводит к необходимости введения и изучения следующих понятий. Определение?. Характеристический многочлен ЛРП и, имеющий наименьшую возможную степень, называется ее минимальным многочленом, а его степень называется рангом ЛРП и и обозначается через rang гг. Очевидно, что ранг ЛРП определяется однозначно. В то же время, минимальных многочленов у одной ЛРП может быть несколько и даже бесконечно много. Пример 7. В обозначениях примера 1 последовательность и = = (a, aq, aq2,...) при условии а ф 0 есть ЛРП ранга 1 с минимальным многочленом F(x) = х — q. Если при этом элемент а £ R является делителем нуля и аЬ = 0 для Ь Е R \ 0, то минимальным многочленом для и будет также F(x) + Ъ. 301
Однако для любой ЛРП и над полем Р существует единственный минимальный многочлен. Это можно доказать воспользовавшись замечанием 1 и показав, что если и Е Lp(F), то минимальный многочлен ЛРП и есть минимальный многочлен вектора и пространства Lp(F) относительно линейного преобразования <т = a\Lp(F). Нам будет удобнее доказать этот факт, используя Определеннее. Аннулятором последовательности и Е R°° называется множество Ann(u) = {Н(х) Е R[x]: Н(х) • и = (0)}. Очевидно, что Ann(u) — идеал кольца Я[х], а последовательность и Е R°° есть ЛРП над R тогда и только тогда, когда в этом идеале есть унитарные многочлены и минимальный многочлен ЛРП и есть любой унитарный многочлен наименьшей степени из Апп(гх). Теорема 3. Любая ЛРП и над полем Р имеет единственный минимальный многочлен G(x) Е Р[х\, и он удовлетворяет равенству Ann(ii) = P[x]G(x). (20) □ Так как Р[х] — кольцо главных идеалов (теорема 1.ХХ), то существует единственный унитарный многочлен G(x) E Р[х] такой, что выполняется равенство (20). Из (20) следует, что G(x) — характеристический многочлен ЛРП и, на который делится любой другой- ее характеристический многочлен. Следовательно, G(x) — единственный минимальный многочлен ЛРП и. □ В дальнейшем минимальный многочлен ЛРП и над полем обозначается через Ми(х). В общем случае справедлива Теорема 4. Для любого унитарного многочлена G(x) E R[x] и любой последовательности и Е R°° следующие утверждения эквивалентны: а) и — ЛРП с единственным минимальным многочленом G(x)\ б) Ann(u) = R[x] • G{x). □ а) =» б). Так как G(x) • и = (0), то R[x] • G(x) С Ann(tz). Наоборот, пусть Н{х) Е Апп(гб). Разделим Н{х) с остатком на G(x): Н(х) = Q(x) - G(x) + А(х), deg A(x) < deg G(x). Тогда А(х) Е Апп(гх), так как Н{х)и = G(x)u = (0). Следовательно, Gi(x) = G(x) + A(x) — унитарный многочлен из Апп(и) той же степени, 302
что и G(x)j т. е. Gi(x) — минимальный многочлен ЛРП и. Но тогда ввиду условия a) G\(x) = G(x), т. е. А(х) = 0 и Н(х) е R[x] • G[x]. Импликация б) =» а) доказывается так же, как и в теореме 3. □ 2. Укажем некоторые способы построения ЛРП с заданным минимальным многочленом. Утверждение 5. Пусть F(x) € R[x] — унитарный многочлен степени т > О, и € Lr(F) и и(0,т — 1) = (О,...,О,а), где а £ R — элемент, не являющийся делителем нуля. Тогда F(x) — единственный минимальный многочлен ЛРП и. □ Достаточно доказать, что Апп(и) = R[x] • F(x). Так как R[x] x xF(rr) С Апп(гб), то для этого достаточно доказать, что любой многочлен Н(х) £ Апп(и) степени меньшей, чем га, равен нулю. Пусть Н(х) = = ho + h\x + ... + hkxk, hk ф 0, к < т. Тогда последовательность v = = Н(х) • и ввиду условия на и(0,т— 1) имеет ненулевой член: v(m — к — ~1) = hk - и(т — 1) = hk • а Ф 0. Это противоречит условию Н(х) • и = = (о). □ Следствие. Для любого унитарного многочлена F(x) € R[x] справедливо равенство Ann(eF) = R[x] • F(x). Определение 9. Для элемента а € R \ 0 и любого £ € No последовательность а^ G Д°°, определяемая равенствами: aM(i) = 0, для г < <; а^(^) = е; аЩг) = ( J ) " ^"^ Для i > £; называется биномиальной последовательностью порядка f+ 1 с корнем а. Утверждение 6. Для любого а £ R\0 последовательность а№ есть ЛРП с единственным минимальным многочленом G(x) = = (х — а)*+1. Более того, а^ = eG. П Докажем индукцией по £ включение аДО Е Lr((x — a)e+1). При ^ = 0 оно очевидно. Пусть ^ > 0, и а^"1' G Lr((x — а)е). Тогда, ис- /г + 1 \ / г \ ( г \ пользуя известное равенство I . )~\р) = \р i)' полУчз^м (гг — а) • а^ = v, где t;(z) = 0, если г < £ — 1, а если г > ^ — 1, то ~ г) йММ)- а""11(г)' т. е. (ж —а) -о^ = а^""1'. Отсюда, пользуясь предположением индукции, имеем: (ж - а)е+1 ■ «М = (х - а)£ • а^"1! = (0). 303
Остается заметить, что а^(0, £) = (0,..., 0, е) = eG(0, £). □ Простой способ вычисления минимального многочлена ЛРП над полем дает Теоремаб. Пусть и — ЛРП над полем Р с характеристическим многочленом F(x) и генератором Ф(х). Тогда: б) если v = Н(х) • и для некоторого Н{х) е Р[х], то Mv{x) = /гт/ чЦЛуГ / чч- (Н(х),Ми(х)) D а) По определению генератора справедливо равенство и = = Ф(х) • eF, и так как по следствию утверждения 5 Mcf(x) = F(x)> то а) следует из б). б) Достаточно заметить, что по теореме 2 для любого А(х) € Р[аг] справедливы соотношения: А{х). U А(х) -v — (0) <&> А(х)Н(х)и — (0) <з> М (х) I А(х) • ЯУдЛ «► Mu(x) (H(x),Mu(x)) Следствие. Минимальный многочлен ЛРП и € Lp(F) равен F(x) тогда и только тогда, когда генератор и относительно F(x) взаимно прост с F{x). В частности, F(x) является минимальным многочленом для любой ненулевой ЛРП из Lp{F) тогда и только тогда, когда F(x) неприводим над Р. Для линейных рекуррент над кольцом теорема 5 а) может быть обобщена следующим образом. Утверждение?. Если и — ЛРП над кольцом R с характеристическим многочленом F(x) и генератором Ф(х), то Апп(и) = {А(х) Е R[x): F(x)\A(x) • Ф(ж)}. D Так как и = Ф(х) • eF, то по следствию утверждения 5 А(х) - и = (0) ^ А(х) • Ф(х) • eF = (0) <* F(x) \ А(х) - Ф(х). П 304
§ 4. Соотношения между семействами ЛРП с различными характеристическими многочленами Утверждение 8. Для любых унитарных многочленов F(x), G(x) € R[x] справедлива импликация (LR(G) С LR(F)) & (G(x) D Пусть G{x) | F(x). Тогда и € LR{G) => (ЭД • u = (0) => F(x) • и = (0) Пусть £Л(С) С L*(F). Тогда eG e LR(F), F(x) • eG = (0), и по следствию утверждения 5 G{x) \ F(x). D Определение 10. Многочлены F(x)jG(x) £ R[x] называют взаимно простыми, если R[x] • F(x) + i?[x]G(x) = R[x], т. е. A(x)F(x) + +B(x)G(x) — e для некоторых А(х),В(х) € i?[x]. В этом случае пишут С использованием этого определения дословно так же, как и для многочленов над полем (теорема 8.IX), доказывается Утверждение 9. Для любых многочленов F(x), G(x), H(x) E G R[x] справедливы импликации: а) ((F(x), G(x)) = е, (F(x), H(x))) = е =» (F(x), G{x) ■ Н{х)) = е; б) ((F(x), G(x)) = e, F(x) | G(x) ■ Н(х)) =► F(x) | Я(яг); в) ((F(x), G(x)) = e, F(x) | Я(а;), G(ar) | Н{х)) =4- F(ar) • G(x) \ H(x). Теорема 6. Пусть Fo(x),Fi(x) e R[x] — унитарные взаимно простые многочлены и F(x) = Fq(x) ■ F\{x). Тогда LR{F) = LR{FO)+LR{FX). (21) Если R — поле, и последовательность и € Lr(F) представлена в виде и = ио + щ, щ G Lr(Fs), s e 0,1, то (Мио(a:), MU1 (х)) = е, Ми(х) = Мио(яг) • MUl(x). (22) 305
□ По утверждению 8 Lr(Fs) С Lr(F) для s Е 0,1 и по утверждению 2 LR(F)DLR(F0) + LR(F1). (23) Так как по условию Ao(x)Fo(x)+Ai(x)Fi(x) = е для подходящих Ао(#), Ai(x) £ Л [ж], то любая последовательность и Е Lr(F) представляется в виде: и = щ + wi, где txs = Ai^8(x) - Fi-S(x) • и для s Е 0,1. (24) Очевидно, что Fs • us = Al_-s(#) • F(x)ii = (0), т. е. и8 E Lr{F3). Отсюда и из (23) следует равенство Lr(F) = Lr(-Fo) + Lr(Fi). Если г* € G Lfl(jFo) nljj(jFi), то jFe(x)u = 0 для 5 G 0,1, и потому в (24) щ = и± = = (0), т. е. и — (0). Равенство (21) доказано. Если R — поле, и и = uo + tii, u3 G Lr(Fs), s € ОД, то по теореме 3 MMs(x) | Fs(rr), и потому (MU0(x),MUl(x)) = e. Теперь для доказательства второго равенства в (22) остается заметить, что MUa{x) есть минимальный многочлен вектора us E Lr(F) относительно линейного преобразования а = а | Lr(F) (cm. замечание 2), и воспользоваться утверждением 17 б) .XV. □ Для ЛРП над полем первое утверждение теоремы 6 может быть существенно усиленно. Теорема 7. Для любых унитарных многочленов F(x) и G(x) над полем Р справедливы равенства: LP{F) n LP(G) = LP(D)y где D(x) = (F(x), G(x)); (25) LP(F) + LP(G) = LP(H), где Н(х) = [F(x), G(x)]. (26) П По утверждению 8 LP(D) с Lp{F) n Lp(G). С другой стороны, так как D(x) = A(x)F(x)+B(x)G(x) для подходящих А(х), В(х) Е Р[х], то для любой ЛРП и Е Lp(F)nLp(G) справедливы равенства D{x)-u = = A(x)-F(x)u+B(x)'G(x)u = (0) + (0) = (0), т. е. и Е LP(D). Равенство (25) доказано. Из утверждения 8 следует также включение Lp(F)+Lp(G) С Lp(H). Остается заметить, что по следствию утверждения 3 и в силу (25) dim(LP(F) + LP(G)) = dim LP(F) + dim LP(G)- - dim(LP(F) П LP(G)) = degF(x) + deg G(x) - deg D(x) = = degH(x) = dimLP(H). D 306
§ 5. Биномиальный базис пространства ЛРП над полем Все рассмотренные до сих пор базисы пространства Lp(F) не давали способов представления общего члена и{г) произвольной ЛРП и £ Lp(F) в виде просто вычисляемой и записываемой явной функции от параметра г. Опишем важный частный случай, когда такой способ существует. Теорема 8. Пусть многочлен F(x) £ Р[х] раскладывается над полем Р на линейные множители и имеет каноническое разложение вида: F{x) = (x- ai)*1+1 -... • (x - ar)*r+\ ks > 0, для sEl,r, (27) Тогда базисом пространства Lp{F) является система биномиальных последовательностей: (28) (см. определение 9). □ По теореме 6 пространство Lp(F) есть прямая сумма подпространств LP(F) - LF((x - ах)*1+1)+... +LP((x - ar)^+1). Остается доказать, что система последовательностей а|0',..., а[ ** есть базис пространства Lp((x — as)ks+1). Включения ay E Lp((x — as)ks+1) для I £ 0, к8 следуют из утверждения 6. Теперь достаточно заметить, 307
что система из ks + 1 векторов длины к3 + 1: = (0, е, линейно независима над Р, и воспользоваться утверждением 3. □ Следствие 1. При условии (27) если ац,..., аг € Р\0, то базисам пространства Lp(F) является также система сбалансированных биномиальных последовательностей: (28') и для каждой ЛРП и G Lp(F) существует единственный набор коэффициентов ,щ,,2,,г G Р такой, что для каждого г € No выполняется равенство: и{г) = aioaj +ац1 J J агх + ... + aifel ( ^ ) ai + а2о«2 + • • • ... + a2fe2 Г ^ j4 + ... + aroa* 4-.-. + ^^ Г ^ J а*. (29) П Ввиду условия ol\ E Р* любое нетривиальное линейное соотношение между последовательностями (28;) дает нетривиальное линейное соотношение между последовательностями (28), и потому невозможно. Нужные коэффициенты as,e суть коэффициенты в разложении вектора и Е LF(F) по базису (28;): Г kr 5=1 £=0 поскольку по определению а« (г) = I . J а\ для всех г € No- □ 308
По разложению (29) последовательности и можно легко построить ее минимальный многочлен и найти rangw. Мы рассмотрим здесь наиболее простой и важный частный случай (описание Ми(х) в общем случае дано в задаче 26). Следствие2. Если ai,..., аг — попарно различные элементы множества Р \ 0, то для любых ai,..., ar Е P последовательность и Е Р°° элементов вида u(i) = а\а\ + ... + аТагТ есть ЛРП с характеристическим многочленом F{x) = (х — а{) • ... ... • (х — аг). При этом ранг последовательности и равен числу ненулевых коэффициентов среди ai,... , ar и Ми(х) = (:с —ai)£l •.. .-(х-ar)£r, для s Е 1,г eevm as / 0, £s л л если as = 0. П Включение и Е Lp(F) очевидно. Тогда Ми(х) \ F(x), т. е. Ми(х) — произведение некоторых одночленов из (х — ai),..., (х — аг). Упрощая обозначения, допустим, что Ми(х) = (х - аг) •... • (х - at), l<t<r. (30) Тогда по следствию 1 существуют ci,...,q GP такие, что Vi E No: гх(г) = ciaj + ... + c*aj. Отсюда, пользуясь единственностью представления (29), получаем ai = — ci,..., a* = ct, at+i = ... = ar = 0. Остается заметить, что все коэффициенты ci,... ,ct отличны от нуля. Действительно, если, например, ct = 0, то и Е Lp((x — а{) -... • (х — at-i)), что противоречит условию (30). □ Замечание 3. Пусть в обозначениях теоремы 8 га = deg F(x) = — (fci + 1) + ... + (kr + 1). Тогда каждая ЛРП и Е Lp(F) однозначно определяется своим начальным вектором гх(О,га— 1), и, как следует из доказательства следствия 1 теоремы 8, для нахождения коэффициентов aSt£ в разложении (29) достаточно решить систему га линейных уравнений с га неизвестными {xs^ sGl,r, I E 0,fcs}, которая в векторной форме имеет вид: -l). (31) 5=1 £=0 309
Однозначная разрешимость этой системы следует из линейной независимости системы векторов {ai '(0,m — 1): s G 1,г, £ G 0, A;s} (см. теорему 8 и утверждение 3). Пример8. Пусть и — ЛРП над полем Р = Z5 с характеристическим многочленом F(x) = х6 — 2хг + х2 + Зх + 2 и начальным вектором и((М>) = (0,е,е,0,Зе,е). Требуется найти u(1986). Перебором элементов поля Р убеждаемся, что многочлен F(x) имеет в Р корни а\ = е, «2 = 2е, аз = Зе, и его каноническое разложение над Р имеет вид: F(x) = (х- е)3 • (х - 2е)2 • (х - Зе). Следовательно, F(x) удовлетворяет условиям следствия 1 теоремы 8 и последовательность и однозначно представляется в виде: ' и = aioQi + anQj 4-а^щ' + a2oc4 + a2i«2 + Выражение (29) для г-го члена этой последовательности имеет в рассматриваемом случае вид: u{i) = аюе* + ег + = l alo + aui а^ I „ J ег + аго(2е)г + a,2ii(2e)z + азо(3е)г = f * ) ) е + (азо + O2i«) • (2е)г + о3о(3е)г, а система линейных уравнений (31) для определения коэффициентов в этом представлении выглядит следующим образом: е3 «4 0е° е1 2е2 Зе3 4е4 5е5 О О 1 3 10-е е° (2е)° 0-(2е)° 1 2 3 4- 5- () (2е)2 (2е)3 (2е)4 (2е)5 () • (2е)2 (2е)3 (2е)4 (2е)5 (Зе)° (Зе)1 (Зе)2 (Зе)3 (Зе)4 (Зе)5 Хц Х\2 #20 #21 \ #30 / / 0 \ е е 0 Зе 1 е ) После преобразований в арифметике поля Z5 эта система принимает вид: е е е е е е О е 2е Зе 4е 0 0 О е Зе е 0 е 2е 4е Зе е 2е 0 2е Зе 4е 4е 0 е Зе 4е 2е е Зе #11 #12 #20 #21 V #30 / / 0 \ е е 0 Зе \ е / 310
Решая ее, получаем всех г G N справедливо равенство и(г) = = (е,е,е, 2е, 2е,2е), т. е. для 2t)(2e)* + 2(3е)\ Отсюда, при г = 1986 находим гх(1986) = 2е + 4 • (2е)4496+2 + 2 - (Зе)4496+2 = = 2е + 4 • (2е)2 + 2(3е)2 = 2е + е + Зе = е. Замечание 4. Теорема 8 может быть использована для описания общего члена ЛРП и Е Lp(F) и в случае, когда многочлен F(x) не раскладывается над полем Р на линейные множители. В этой ситуации рассматривается поле разложения Q многочлена F(x) над полем Р и каноническое разложение (27) F{x) над Q. Так как и € Lq(F), to можно утверждать, что общий член и{г) последовательности и имеет вид (29), где ase — некоторые коэффициенты из расширения Q поля Р. Следует заметить, однако, что при сделанных предположениях в виде (29) представляется общий член любой ЛРП и е Lq(F). Поэтому дополнительное условие и Е Lq(F) П Р°° накладывает некоторые ограничения на набор коэффициентов aS£ E Q. Смысл этих ограничений в случае, когда Р — конечное поле, можно будет уяснить из результатов следующего параграфа (см. замечание 5). П р и м е р 9. Вычислим над полем Р = Z3 значение определителя d = 2 2 0 0 12 2 0 0 12 2 0 1 0 0 2 2 1 2 12x12 Как отмечено в примере 5, d — есть член Д(11) ЛРП Д над Р с характеристическим многочленом F(x) = х2 — 2х + 2 и начальным вектором Д(0Д) = (2,2). Многочлен F(x) не имеет корней в Р, и потому ввиду условия deg F(x) = 2 он неприводим над Р, а его минимальное поле разложения Q есть Q = GF{Z2). 311
В поле Q многочлен F(x) имеет 2 разных корня: ао и ai, удовлетворяющих соотношению ао + ol\ = 2. По следствию теоремы 8 общий член ЛРП Д имеет вид A(i) = = соаго + c\ol\, где коэффициенты со и с\ находятся из системы линейных уравнений Подставляя сюда значения начального вектора, получаем: со + сг = 2, Пользуясь условием ао + &\ = 2, находим со = с\ = 1 и Д(г) = а^ + а|. В частности, d = А(11) = aj1 + ap. Так как as G GF(32), то o?s = as для 5 е ОД. Поэтому а11 = а%+2 + а?+2 = ag + a?. TaKjcaK a^ = 2as - 2, хо а^ = 2а^ — 2as = as — 1 — 2as = 2as — 1 для s G 0,1. Окончательно получаем: d = (2a0 - 1) + (2ai - 1) = 2(a0 + ai) - 2 = 2. § 6. Представление ЛРП над конечным полем с помощью функции "след" 1. Пусть Р = GF(q) — конечное поле характеристики р и Q = = GF(qm) — его расширение степени т. Определение 11. Следом из поля Q в поле Р называется отображение trp: Q -+ Р, ставящее в соответствие произвольному элементу а е Q элемент trp (a) = a + aq + ... + ctq Функция tip(x) иногда обозначается также через tr-*m(x) (если достаточно акцентировать внимание лишь на мощностях рассматриваемых полей) или просто — через tr(x) (если из контекста ясно, какие поля имеются ввиду). 312
Отметим сразу, что отображение tip определено корректно, т. е. для любого a G Q выполняется включение tip (а) € Р, поскольку очевидно, что tip(a)q = tip(a). Основные свойства функции "след" перечисляет Теорема 9. а) Функция tip есть линейное отобраоюение пространства Qp на пространство Рр; б) если дана башня полей Q = GF(qm) D GF(qk) D Р, то для любого a G Q справедливо равенство trf(a)=trf(trj:(a)); в) если минимальный многочлен элемента а € Q над полем Р имеет вид /лаур(х) = xk — Ck^\xk~x — ... — со, то к\т и trg (a) = —cjb-i. □ а) Для любых a,6 Е Р и а,/? € Q из известного равенства (aa + +(3b)q = a9a + /?96 и определения 11 следует равенство tr^ (aa + /36) = = tr(a) • a + tr(/3) • 6. Следовательно, top — линейное отображение Qp в Pp. Так как dim Рр = 1, то либо tr(Q) = Р, либо tr(Q) = 0. Последнее равенство невозможно, так как оно означает, что все qm элементов поля Q являются корнями многочлена х + xq + ... + xqm степени qm~1. Следовательно, tr(Q) = Р, т. е. tr — отображение Q на Р. б) Из условия и свойств конечных полей следует, что к | т. Пусть т = к • п. Заметим, что справедливо равенство {0,1,...,т — 1} = = {fcs + £: s € 0,п — 1, ^ € 0, к — 1}. Теперь утверждение б) доказывается следующим образом: i=0 ^=0 s=0 €=0 s=0 -E (Ea('"r)' -EKw)*1 -"S"«w) • в) Рассмотрим расширение Р{а) поля Р в Q. Так как [P(a): P] = = deg//ajp(x) = fc, то P(a) = GF(qk) и fc | m, т. е. m = fc • n для подходящего n G N. Поскольку при сделанных предположениях ag = а, то справедливы равенства: О771 \ л*1 ryfc (a) = a + cr 313
Из свойств неприводимых многочленов над конечным полем следует равенство: V>a,p(x) = хк — Ck-ix1*"1 - ... - со = (х — а)(х — ад) •... • (х - ад ), которое дает соотношение trf (а) = а + ад + ... + адк~Х = ск-ъ Отсюда, пользуясь утверждениями б) и а), получаем trf (a) = trf (trf (а)) = trf (па) = п • trf (а) = п • с*-1 = jck-x. D 2. Основной результат, позволяющий описываь любую ЛРП над конечным полем с помощью функции "след", состоит в следующем. Т е о р е м а 10. Пусть Р = GF(q), G(x) — неприводимый многочлен степени т над Р, Q = GF(qm) — минимальное поле разложения G(x) над Р,иа - корень G(x) в Q. Тогда для любой ЛРП и G LP(G{x)k^1)J k G N, существует единственный набор констант ао5 • • • >о>к £ Q такой, что Vt G No: u(i) = trg( ( J ) ? ()?*). (32) Любая последовательность и € P°° eii<?a (32) принадлежит Lp(G(x)kJtl). П Пространство Lp(G(x)A;+1) имеет над Р размерность m(fc + 1) и потому состоит ровно из gm(/c+1) последовательностей. Число различных наборов (ао,..., а/с) элементов из Q также равно gm(fc+1). Поэтому для доказательства теоремы достаточно показать, что любая последовательность вида (32) принадлежит Lp(G(x)k+1), и различным наборам коэффициентов (ао5 • - •»«fc) G Q^fe+1^ соответствуют различные последовательности вида (32). Любая последовательность щ удовлетворяющая условию (32) при некоторых ао,. •., a>k E Q, есть сумма последовательностей и = щ + и\ + ... + Uk, (33) 314
где для £ Е О, к последовательность щ задается равенствами: щ(г) =(\) t4(aea% г е No. (34) Введем обозначения ао = а, а± == ад,..., am_i = aqTn . Тогда по определению 11 , Q/ г\ г i Q г х , ат~г % trp(a^a ) = ае&о + clJ&i + — ~т~а} ^m—i- Отсюда и из (34), пользуясь обозначениями (28') и определением 9, получаем Щ = a£ai£) + ая£а[£) + ... + af'a^ и в силу (33) к тп-1 £=0 s=0 Теперь заметим, что по теореме 6.XXII ао,..., am-i суть все различные корни в Q неприводимого над Р многочлена G(x), т. е. G{x) = (х—ао)-... ... • (х — am-i), и каноническое разложение над Q многочлена G{x)k+1 имеет вид G(x)k+1 ={x — ao)^1 •... • (х — am_i)fc+1. Поэтому из (35) и теоремы 8 следует, что и е LQ(G(x)k+1). Так как, кроме того, и G Р°° ввиду (32), то и € LQ(G(x)k+1) ПР°° = LP(G(x)k+1). Наконец, так как элементы ао,... ,am_i G Q попарно различны и отличны от нуля, то по теореме 8 система последовательностей {а[ :sG0,m-l, £ е 0, к] линейно независима над Q. Поэтому различным набором кэффициен- тов (ао,... ,a/fc) € Q^k+1) соответствуют различные последовательности вида (35). □ Замечание 5. Из доказательства теоремы 10 вытекает следующий способ представления знаков ЛРП и G Lp(G(x)k+1) в виде (32). Так как и £ L,Q(G{x)k+1), то и однозначно представляется в виде т-1 к и = Y^]Ca«*a£€>>гдеа*еQ seQ'™-1' *6ojc. (36) s=o e=o Коэффициенты ase в этом представлении находятся путем решения системы линейных уравнений над Q (см. замечание 3). Из единственности 315
представления (36) и существования для и представления вида (35) следует, что коэффициенты as£ в (36) удовлетворяют соотношениям: для £ е 0, к, (37) а а2 а™"1 аи = аое, а,2£ = а0£1..., аш-и = %£ и искомые коэффициенты ао,... ,а& в разложении (32) суть ао = d == ао1,...,а& = аоА;. Соотношения (37) и представляют собой упомянутые в замечании 4 ограничения на коэффициенты aS£ разложения (36) произвольной ЛРП и € Lq(G(x)Ic'^1), которые накладываются условием и е. Р°°. П р и м е р 10. Пусть и — ЛРП над полем Р = Z5 с характеристическим многочленом (х2 —2х — 2)2 и начальным вектором и(0,3) = = (0,0,0,1). Требуется представить общий член этой ЛРП с помощью функции "след" и вычислить и (37). Непосредственной проверкой убеждаемся в том, что многочлен G(x) = х2 — 2х — 2 не имеет корней в Р и потому неприводим. Пусть Q = GF(52) — минимальное поле разложения G(x) над Р, и а е Q — корень G(x). Тогда согласно теореме 10 общий член и{г) ЛРП и однозначно представляется в виде Для отыскания коэффициентов ао, ai в этом представлении ищем коэффициенты аоо, аоь аю> ап € Q? удовлетворяющие равенству (36), которое в данном случае имеет вид: и = где as = a5", ai0) = (...,о£,. гласно замечанию 5 ао = аоо, « системы линейных уравнений: = aooaj» (0^) + ai1} = (...,т|,...) для 5 G ОД. Со«01 • Коэффициенты а5^ находятся из S0> (ВД (ВД + a10aS0> (ВД + которая в рассматриваемом случае имеет следующую матричную запись: /1 a а2 а о а 2с? 0 \ of а а5 10 2а10 3 За3 а15 За15 ) ' аоо ' aoi аю \ °п / ( °\ 0 0 316
Составим расширенную матрицу системы А = и упростим ее элементарными преобразованиями строк. Вычитая последовательно из 4-й, 3-й, 2-й строки матрицы А предыдущую строку, умноженную на а, получаем (1 а а2 l а3 0 а 2а2 За3 1 а5 а10 а15 0 а5 2а10 За15 0 0 0 1 1 О О а О а2 О а3 О а5 — а а" 2а10-а6 15 -а11 За15-2а11 а10 - а6 а О \ О О 1 Повторяя ту же процедуру с 4-й и 3-й строками В, получаем О 1 0 1 О а а5 — а О 0 а10 - -а2 2а10-2а6 О 0 а15 - 2а11 -1- а7 За15-4аи+а7 О N О О Вычитая из 4-й строки матрицы С 3-ю, умноженную на а5, находим О \ О О Так как а — корень многочлена х2—2х—2, то справедливы соотношения 1 0 0 0 0 а 0 0 1 а5- а10 0 - а -2а6 + с 0 а5 t2 2а10 а15- -2а6 •2аи+а7 а3 = а + 4, а6 = 3, 4 |^ л 7 о а11 = 2а + 1, а15 = 4а + 1, пользуясь которыми матрицу D можно записать в виде: /10 1 0 0 а За+ 2 4а+ 2 0 0 2 а+1 0 0 0 За+ 4 О N О О 1 317
Так как (За + 4)"1 = а, то вычитая из 3-й строки матрицы D ее 4-ю строку, умноженную на а(а + 1), получаем D 1 0 0 0 0 а 0 0 1 За 2 0 + 2 0 4аН 0 ЗаН V2 h4 0 0 2а 1 + 3 \ Теперь, как нетрудно видеть, в исходной системе линейных уравнений выделяется подсистема: 1 1\( 0 2 Д аоо\ = ( 0 а10 ) \ 2а + 3 из которой находим aw = а + 4, аоо = 4а + 1 и ао = аоо = 4а + 1. (Для проверки, заметим, что clq0 = (4а+1)5 = 4а5+1 = 4(4а+2)+1 = а+4 = = о»ю-) Отсюда для отыскания переменных аю, ац получаем следующую систему: / а 4а + 2 \ / а01 \ / -(За + 2)(а + 4) \ / 1 V 0 За + 4; V аи ) \ 1 ) \ 1 Решая ее, находим ац = (За + 4)"1 = а, «oi = а~*1(1 — а(4а + 2)) = = За"1 = 3 • (За + 4) = 4а + 2 = а\г и а2 = аО1 = 4а + 2. Окончательно получаем, что искомое представление знаков ЛРП и имеет вид: и{%) = tr((4a + 1)аг) + г tr((4a + 2)a*) дая г £ No. Теперь значение и(37) можно вычислить следующим образом. Так как а24 = а5'""1 = 1, то а37 = а13 = а3а10 = (а + 4)(3а +1) = 4а. Отсюда ti(37) = tr((4a+l).4a)+37tr((4a+2)-4a) = tr(((4a+l)+2(4a+2))-4a) = = tr(3a2) = tr(a +1) = tr(a) + tr(l). Так как a — корень неприводимого многочлена х2 — 2х — 2, то по теореме 9 в) tr(a) =2и tr(l) = 2. Отсюда ti(37) = 4. Замечание 6. Теорема 10 позволяет вычислить с помощью функции "след" знаки линейной рекурренты не только с примарным, но и вообще с любым характеристическим многочленом F(x) таким, что F(0) Ф 0. Для этого достаточно найти каноническое разложение F(x) и представить исходную ЛРП в виде суммы ЛРП с примарными характеристическими многочленами, пользуясь теоремой 6. 318
§ 7. Периодические последовательности 1. Пусть Q — произвольное множество. Определение^. Последовательность и Е П°° называется периодической, если существуют параметры Л Е No и t Е N такие, что Уг>Х: u(i + t) = u(i). (38) Для наглядности периодическую последовательность м, удовлетворяющую условию (38), можно изобразить графически следующим образом: Заметим, что если и — последовательность над кольцом Я, то условие (38) эквивалентно условию хх(хг-е)и = (0). (39) В дальнейшем этот факт используется без дополнительных оговорок. В частности, отсюда следует Утверждение 10. Любая периодическая последовательность над кольцом R есть ЛРП. Если и G fi°° — периодическая последовательность, то набор параметров (А,£) G No х N, удовлетворяющий условию (38), определен неоднозначно. Для описания всех таких наборов введем Определение 13. Если и G П°° периодическая последовательность, то наименьшее число t G N, для которого существует Л Е No такое, что выполняется (38), назовем периодом последовательности и и обозначим через Т(и). При этом наименьший параметр Л Е No такой, что V г > Л: u(i + Т(и)) = u(i), (40) назовем длиной подхода последовательности и и обозначим через А(и). 319
ТеоремаИ. Если и — периодическая последовательность элементов множества Q, то числа Л G No, t G N удовлетворяют условию (38) тогда и только тогда, когда А>Л(гг), T{u)\t. (41) □ Введем, для краткости, обозначения: К{и) = Ло, Т(и) = to- Пусть М — множество всех различных элементов из fi, встречающихся в последовательности и. Так как и — периодическая последовательность, то М — конечное множество: \М\ < Ло + to- Выберем произвольно поле Р такое, что \Р\ > |М|, зададим инъективное отображение £: М —> Р и определим последовательность и G Р°° условием п{г) = £(u(i)) для г G No- Ввиду инъективности отображения £ очевидно, что для фиксированных Л G No и t G N условие (38) равносильно условию жЛ(х*-е)г1=(0). (42) Отсюда и из условия теоремы следует, что и — периодическая последовательность, причем Т(и) = to, A(u) = Ло, и нам достаточно доказать, что условие (42) равносильно условию: Л > Ло, t0 11. (43) Так как по определению 13 zAo(rcto-e)u=(0), (44) и из (43) следует, что xXo(xto — е) \ хх{хг — е), то из (43) следует (42). Наоборот, допустим, что параметры Л G No, i G N удовлетворяют условию (42), и докажем (43). Заметим, что справедливо равенство: (хх(х* - е), xXo(xto - е)) = xe(xd - e), (45) где £ = ппп{Л, Ло}, d = (£, £0). Действительно, очевидно, что (хх(хг — е), xXo(xto — е)) = х£(х* — —е, xto — е), и так как по определению 14 t > to, то хг — е = хг~~г°(хЬо — -~е) + (х*"*° - е), откуда (хг - e,xto - е) = (ж*"*0 - e,xto - e). Теперь равенство (45) легко доказывается индукцией по t + to- Так как многочлен x£(xd—e) есть линейная комбинация многочленов хх(х* — е) и а;Ло(х*° — е), то из (42) и (44) следует, что x£(xd-e)u=(0). 320
Отсюда по определению параметра to = Т(и) следует, что d > to, a так как d = (t, to) I *o, TO d = to, t0 11, и справедливо равенство #£(ж*° - — e)u = (0). Но тогда по определению параметра Ло = A(u) справедливо неравенство £ > Ло, т. е. верно (43). □ С л е д с т в и е 1. Если и — периодическая последовательность, то А(и) есть наименьшее Л > No, для которого существует t Е N со свойством (38). Следствие2. Если и — периодическая последовательность над кольцом R, то для любого многочлена Н(х) Е R[x] последовательность v — Н(х) • и также периодическая, причем Л(г>) < К(и), T(v) \ Т(и). П Достаточно заметить, что если А(и) = Ло, Т(и) = to? то xXo(xto - е) ■ v = Я(ж) • жЛо(гг*° - е) • г* = (0). □ В качестве важного приложения теоремы 11 докажем Утверждение 11. Если щ v G Я°° — периодические последовательности, то w = и + v — периодическая последовательность, и ЛИ < max{A(u), A(v)}, Г(гу) | [Т(и)9 T(v)]. (46) Лрг« этом: а) еслгх Л(гл) ^ A(v), то A(w) = тах{Л(^), A(w)}; (47) б) еслгх (T(u),T(v)) = 1, то T(w) = [T(u),T(v)}; (48) в) если и и v — ЛРП, для которых можно указать взаимно простые характеристические многочлены, то справедливы равенства (47) и (48). □ Пусть Л = тах{Л(^),Л(гО}, t = [T(u),T(v)]. Тогда по теореме 11 хх (хь — е)и = (0) и хх {хг — e)v = (0) и, следовательно, хх(х* — e)w = (0). Отсюда, опять по теореме 11, следуют соотношения (46). а) Если, например, А(и) < Л(г>), то Л = Л(г>). Допустим, что A(w) < < Л. Тогда многочлен хх~г(хг — е) аннулирует последовательности и и и>, а значит и последовательность v = w — и. Но тогда по теореме 11 Л(г>) < Л — 1, что невозможно. Следовательно, A(w) = Л, т. е. верно (47). 321
б) Пусть (T(u),T(v)) = 1 и T(w) = т. Заметим, что [т,Т{и)\ = г • к, где к = т—Д/ > 1, и так как т|г& и T(u) | тА:, то по теореме 11 (т,Т(и)) хх(хтк - e)w = (0), xA(rrrA: - е)гг = (0). Но тогда хх(хтк - e)v = (0), и по теореме 11 T(v) |rfc, а поскольку (Т(г>),А;) = 1, то T(v) |т. Аналогично доказывается, что Т(и) \ г. Следовательно, T(u)T{v) \ T(w). Теперь (48) следует из (46). в) Пусть и Е LR(F), v € LR(G) и (F(x),G(x)) = е. Тогда w G € 1^я(^ • G) и Хд(^ • G) = Lr(F)+Lr(G). Отсюда, учитывая, что для любых Ai G No, ti G N справедливы соотношения: xXl (x** - e)ti G LR(F), xx' {x^ - e)v G LR(G), получаем VAi G No, «i G N: (zAl(zta - e)w = (0) 4Ф <* (^(rr*1 - е)гх = (0), xXl{xtx - e)v = (0)). Теперь равенства (46) и (47) следуют из теоремы 11. □ Определение 14. Периодическая последовательность и над кольцом R называется чисто периодической, или реверсивной, если Л(г*) = 0, и вырождающейся, если и = (г*(0),..., г*(А — 1), 0,0,..., 0,...) для некоторого A G No- Очевидно, что и — чисто периодическая последовательность тогда и только тогда, когда и G Ьл(хь — е) для некоторого t G N, и гг — вырождающаяся последовательность тода и только тогда, когда и G LR{xx) для некоторого A G No- Единственная одновременно чисто периодическая и вырождающаяся последовательность — нулевая: Л((0)) = 0, Г((0)) = 1. Т е о р е м а 12. Любая периодическая последовательность и G R°° однозначно представляется в виде суммы: u = uo + u±, (49) где щ — вырождающаяся, и\ — чисто периодическая последовательности. При этом A(ti) = A(txo), T(ti) = T(tii). (50) 322
D Пусть А(и) = А, Т(и) = t. Тогда и Е Lr{xx{x1 — e)). Из очевидного соотношения (х, хг—е) = е в силу утверждения 9 а) следует соотношение {хх,хг — е) = е. Отсюда, пользуясь теоремой 6, получаем, что LR{xx{xl - е)) = LR{xx)+LR{xb - e), (51) и последовательность и единственным образом представляется в виде: и = и0 + ии и0 е Lr(xx), u\ G Ья(хг - e). Это и есть искомое разложение (49). Равенства (50) легко следуют из утверждения 11. Пусть имеется еще одно разложение и = vo + vi, где г?о, ^i — соответственно вырождающаяся и чисто периодическая последовательности. Тогда по утверждению 11 Л(г;о) = А(и) = Л, T(v±) = Т{и) = t. Следовательно, vq G Lr(xx), v± G Ьц{хг — е), и ввиду (51) справедливы равенства vo = зд, v\ = щ. П Замечание7. На практике для представления последовательности и G Ья(хх(хь — е)) в виде (49) достаточно подобрать к G N такое, что tk > Л. Тогда хгкщ = (0), и из (49) следует, что rrtA;u = xtku\ = и±. Теперь последовательность щ находится из равенств щ = и — щ = = и — xtk • и. Например, для последовательности и = (0 0 2 2 1 ЗДДО ЗДДО ...) над Z4 справедливы соотношения А(и) = Л = 5, Т(и) = * = 4, t-2 = 8> > Л. Следовательно, щ = х8 • гг = (0 3 1 2 0 3 1 2 ...), зд = и - щ = (0 1 1 0 1 0 0 0 .. .)• § 8. Периодические многочлены. Периодичность ЛРП над конечным кольцом Заметим, что если R — произвольное кольцо, то не любая ЛРП над R периодична, т. е. обращение утверждения 10 неверно. Простейший 323
пример: ЛРП и = (О,1,2,3,...) G Lz((x — I)2). Однако если R — конечное кольцо, то обращение утверждения 10 верно. Доказательство этого факта и методика расчета периода ЛРП над конечным кольцом опираются на следующие результаты. Определение 15. Многочлен F(x) G R[x] назовем периодическим, если существуют параметры Л G No, t G N, такие, что F(x) хх(х*-е). (52) При этом наименьшее t G N, для которого существует A G No, удовлетворяющее условию (52), обозначим через T(F) и назовем периодом многочлена -Р(ж), а наименьшее A G No такое, что F(x)\xx(xT^ — е) обозначим через A(F). Унитарный периодический многочлен F{x) со свойством A(F) = 0 назовем реверсивным. Связь введенных понятий с понятием периодической последовательности устанавливает Утверждение 12. Унитарный многочлен F(x) G R[x] является периодическим тогда и только тогда, когда периодична ЛРП eF € Lr(F). Если F{x) — периодический многочлен, то A(F)=A(eF), T(F) = T(eF), (53) и любая ЛРП и € Lr(F) есть периодическая последовательность, для которой A(u)<A(F), T(u)\T(F). (54) □ Так как по следствию утверждения 5 Ann(eF) = R[x] • F[x], то VA <E No, V* G N: (хх(х* - e)eF = (0)) ^ (Р(х)\хх(х* - е)). (55) Отсюда следуют первая часть утверждения 12 и соотношения (53). Пусть и G Lr(F). Тогда F(x)u = (0), и так как F(x) | хА^(хТ^ - е), то хА^(хТ^ - е)и = (0). Следовательно, и — периодическая последовательность, и по теореме 11 верно (54). □ Следствие!.. Если F(x) G R[x] — унитарный периодический многочлен, то VA G No, V* G N: {Р{х)\хх{хг - ё)) & (Л > A(F),T(F) 11). 324
D Достаточно воспользоваться соотношениями (55), (53) и теоремой 11. □ Следствие 2. Если F(x), G(x) G R[x] — унитарные периодические взаимно простые многочлены, то Н(х) = F{x) • G{x) — периодический многочлен, причем Л(Я) = max{A(F),A(G)}, T(H) = □ Пусть Л = max{A(F),A(G)}, t = [T(F),T(G)J. Тогда по следствию 1 многочлен хх (х* — е) делится на F(x) и G(x), и по утверждению 96) Н(х)\хх(хг — е). Таким образом, по определению 15 Н{х) — периодический многочлен, и по следствию 1 А(Н) < А, Т(х) \ t. Наоборот, так как многочлен х^н\хт^ — е) делится на Н(х) = F(x) • G(x), то по следствию 1 Л(#) > Л и T(F) \ Г(Я), T(G) | Г(Я), т. е. 11 Г(Я). □ Замечание 8. Если Д — произвольное бесконечное кольцо, и F{x),G{x) G R[x] — унитарные периодические, но не взаимно простые многочлены, то многочлен Н(х) = F(x) • G{x) может не быть периодическим. Например, если R — Q, F(x) = G(x) = x — 1, то Н(х) = (х — I)2 — многочлен с кратным корнем 1, и потому он не делит ни одного из многочленов х1 — 1, t Е N. Иная картина имеет место, если R — конечное кольцо. Т е о р е м а 13. Пусть F(x) — унитарный многочлен степени т > О над конечным кольцом R. Тогда: а) F(x) — периодический многочлен, причем если \R\m > 2, то A(F)+T(F)<\R\m-l; (56) б) F(x) — реверсивный многочлен в том и только в том случае, D а) Рассмотрим факторкольцо S = R[x]/F(x) и последовательность над 5: [е]р,[х]Р,...,[х%,.... (57) Так как S — конечное кольцо, |S| = \R\m, то в последовательности (57) есть повторения, т. е. для некоторых Л € No, t G N. Но равенство (58), очевидно, эквивалентно условию Р(х)\хх(х*-е). (59) 325
Следовательно, F(x) — периодический многочлен. Более того, из следствия утверждения 12 и равносильности условий (58) и (59) следует, что A(F) + T(F) = к — наиболее натуральное число такое, что элементы кольца S попарно различны. Поэтому всегда A(F) + T(F) < \S\ = \R\m. Покажем, что если |5| > 2, то к < \S\ — 1. Допустим, что к > \S\ — 1. Тогда к = |5|, и так как элементы (60) попарно различны, то S={[e]F,[x}F,...Ax}kf1}- (61) Поскольку [0]F G 5, то из (61) следует, что [0]F = [ж]^"1, [х]F — делитель нуля в 5, и [е\р — единственный обратимый элемент в S. Но [е — х\р — также обратимый элемент в £, поскольку [е—x]f* [e + x + ... + хк~~г] р = = [е - хк] „ = [e)F. Следовательно, [е - x]F = [e]F, [x]F = [0]F, и ввиду (61) S = {[e]F, [0]F}, т. е. |5| = 2, что противоречит условию. б) Если F(x) — реверсивный многочлен, то xT(F)— e = F(x)-G(x) для подходящего G(x) E R[x]. Но тогда F(0) • (—G(0)) = е, и потому F(0) G Е Л*. Наоборот, так как F(x) имеет вид F(x) = F(0)+xU(x), то из условия F(0) E R* очевидно следует, что (F(x),x) = e, и по утверждению 9 a) (F(rr), хх) = е для любого Л £ N. Тогда так как F(x) \xA^ (хт^ -е), то по утверждению 96) F(x)\xT^ — е, т. е. F(x) — реверсивный многочлен. D Следствие. Если и — ЛРП порядка m над конечным кольцом R и \R\m > 2, mo K{u) + Т(и) < \R\m - 1. Замечание 9. При условии |i?|m = 2 существует единственный пример, опровергающий неравенство (56) и последнее следствие: R = = Z2, F(x) = х, и = (1,0,0,...). В этой ситуации A(F) = А(и) = 1 и T(F) = Т(и) = 1. 326
9. Вычисление периода и длины подхода ЛРП над конечным полем Прежде всего, сведем задачу к изучению минимального многочлена ЛРП. Утверждение 13. Если и — ЛРП над конечным полем, то А(и) = А(Ми(х)), Т(и) = Т(Ми(х)). □ Достаточно заметить, что в силу теоремы 3 V Л G No, V t e N: (хх(хг - е)и = (0)) & (Ми(х)\хх(х* - е)). D Описание параметров A(F) и T{F) для произвольного унитарного многочлена F{x) над конечным полем сводится к построению его канонического разложения и вычислению периодов неприводимых сомножителей. Пусть Р = GF(q), q = pn, р — простое. Как и в гл. XXII (определение 3), для произвольного F(x) e Р[х] определим параметр O(F) как НОК порядков всех ненулевых корней F(x) в его поле разложения над Р и положим O(F) — 1, если F(x) = хе, £ е N. Утверждение 14. Если F(x) G Р[х] — реверсивный неприводимый многочлен степени т, то T{F) = O(F), T(F)\qm - 1 и T(F) \qk - 1 для k E l,m-l. (62) В частности, (T(F),p) = 1. □ Пусть Q — минимальное поле разложения F(x) над P. Тогда Q = GF(qm) (теорема 6.XXII), и если а — корень F(x) в Q, то O(F) = Old а (следствие теоремы 6.ХХП). Так как F(x)\xT(F) — e, то aT(F) ==еи 0(F) | r(F) с друГой стороны, a°(F> = е и {F(x),x°^ - —е) т^ е. Поскольку х°^ —ее Р[х] и F(x) неприводим над Р, отсюда следует, что F(x)|z°(F> - е, т. е. T(F)\O(F) и T(F) = O(F). Так как а е (3*, то Orda|<?m-1, т. е. T(F)\qm-1. Наконец, если T{F)\qk -1, где 1 < к < т, то aq ~г = е и ofl = а, что противоречит теореме 6.ХХП. □ Из (62) вытекает следующий способ вычисления периода реверсивного неприводимого многочлена F(x) G Р[х] степени т > 0. 1. Перебрать все делители t числа qm — 1, не являющиеся делителями чисел q — 1,..., qm~1 — 1. 327
2. Для каждого выбранного t проверить условие: х* = e(modF(x)). (63) Наименьшее из таких £, для которых это условие выполнено, есть T{F). Очевидно, при этом самый большой делитель: t = qm — 1 проверять не надо. Пример 11. Вычислим период многочлена F(x) = х4 + х + 1 над Р = %2* Так как F(x) неприводим, то молено применить описанный выше алгоритм. Поскольку 24 — 1 = 15 = 3-5 и 3|22 — 1, то нужно проверять условие (63) лишь для t G {5,15}. Так как х4 = x + l(modF(x)), то хъ = х2 +x(modF(x)) и хъ ф l(modF(rc)). Следовательно, T(F) = 15. Т е о р е м а 14. Если Р = GF(q) — поле характеристики р, унитарный многочлен F(x) G Р[х] имеет каноническое разложение: = x€d (x)k* •• G (x)k* F(x) = x€d (x)k* •... • G8 (x)k* (64) и k = max{fci,..., k8}, (65) то справедливы равенства: A(F) = £, T(F) = [Tid),... T(G.)] • vc = O(F) ■ pc, (66) где параметр с G No находится из условия: р0-1 <k<pc, (67) m. e. c=]logpk[. П Пусть Я(ж) = Gi(a:)fcl •.. .-Gs(x)k*. Тогда по теореме 13 Н{х) — реверсивный многочлен, и по следствию 2 утверждения 12 A(F) = А(хе) = = £, T(F) = Г(Я). Пусть G(x) = Gi(x) •... • Gs(rc). Тогда очевидно, что O(F) = O(G) = [O(Gi),..., O(G5)], и по утверждению 14 и следствию 2 утверждения 12 [O(Gi),..., O(GS)] = [T(Gi),...,T(GS)] = T(G). Теперь остается доказать равенство Т(Н) = T(G) • рс. Так как G(rr)|xr(G> - е, то в силу (65) Н(х)\(хт^ - е)к и в силу (67) H{x)\{xT(G>> — е)рС'. Отсюда, пользуясь равенством (хт^ — е)рС — = хт^'рС-е, получаем: Т{Н) | T(G)-pc. Более того, так как T(G) | Т(Н) (поскольку G{x) | Н(х)), то Т(Н) = T(G) • pd, где d < с. 328
Заметим теперь, что (T(G),p) = 1, поскольку по утверждению 14 (T(Gi),p) = 1 для г € 1,8. Следовательно, многочлен хт^ — е над Р взаимно прост со своей производной и потому не имеет кратных множителей в каноническом разложении над Р (следствие 2 теоремы 1.IX). Поэтому каждый неприводимый делитель многочлена хт(н^ —е = = (xT(G) — е)р имеет в его каноническом разложении кратность pd, и так как Н{х)\хт^ — е, то ввиду (65) к < pd и ввиду (67) d > с. Следовательно, d = с, т. е. Т(#) = T(G) • рс. П П р и м е р 12. Пусть Р = GF(pn), и а — элемент из Р* порядка £. Вычислим период и длину подхода биноминальной последовательности cJsl. По утверждению 6 ее минимальный многочлен равен (х — а)5+1. Следовательно, по утверждению 13 а^ — чисто периодическая последовательность, и Т(а№) = Т((х — a)s+1). Так как Т((х — а)) = t, то по теореме 14 Т((х — a)s+l) = t • рс, где с =]logp(s + 1)[. В частности, для последовательности а^ = (е, а, а2,...,) справедливо равенство Г(аИ) = orda = t, а для последовательности биноминальных коэффициентов над Р: е^ = ( ( п ) е, I - j е,..., f . J е,... ) — равенство Т(еМ) = pl1°gp(s+1)[. Теми же свойствами обладает сбалансированная биномиальная последовательность а^. П р и м е р 13. Найдем период и длину подхода ЛРП и над Z2 с характеристическим многочленом F(x) = гг8 + ж5 + гг3 + ж2 + х и начальным вектором гх(0,7) = (00001010). По формуле (16) находим генератор и относительно F(x): Ф(х) = х3 + х + 1, и по теореме 5 а) — ее минимальный многочлен: Так как х2+х+1 — неприводимый многочлен над Z2 и Г(гг2 +х+1) = 3, то по теореме 14 A(Mw(rc)) = 1и T(M^(a:)) = 3 • 21 = 6. Таким образом, по утверждению 13 А(и) = 1, Г(ге) = 6. 329
§ 10. ЛРП максимального периода над конечным полем 1. Пусть Р — GF{q), и и — ЛРП ранга га над Р (определение 8). Тогда согласно теореме 13 и утверждению 13 при условии qm > 2 период и длина подхода последовательности и удовлетворяют неравенству А(и)+Т(и) < qm — l. В связи с этим представляет естественный интерес изучение следующих последовательностей. Определение 16. Последовательность и над полем Р = GF(q) называется линейной рекуррентной последовательностью максимального периода над Р, если для некоторого га £ N г/ есть ЛРП ранга т и периода qm — 1. Очевидно, что при q"1 > 2 ЛРП максимального периода qm — 1 есть чисто периодическая последовательность, т. е. ее минимальный многочлен реверсивен. Т е о р е м а 15. Пусть и — ЛРП над полем Р = GF{q) с реверсивным минимальным многочленом Ми(х) = F(x) степени т и qm > 2. Тогда следующие утверждения эквивалентны: а) и — ЛРП максимального периода над Р; б) любая ненулевая ЛРПу £ Lp(F) есть сдвиг последовательности и, т. е. v = xku для некоторого k EN; в) многочлен F(x) неприводим над Р, и его корень а в минимальном поле разложения Q = GF(qm) над Р есть примитивный элемент поля □ а) => б) Так как Т(и) = qm — 1, то все последовательности щхщ...,хт~1и, где г = qm - 1, (68) различны и принадлежат Lp(F) \ {(0)}. Поскольку \Lp(F) \ {(0)}| = = qm — 1 = г, то система (68) исчерпывает все множество Lp(F) \ {(0)}, следовательно ей принадлежит и последовательность v. б) =Ф в) Так как ненулевая ЛРП v E Lp(F) имеет вид v = xku и по условию (Ми(#),#) = е, то по теореме 56) Mv(x) = Ми{х). Таким образом, минимальный многочлен любой ЛРП v G Lp(F)\{(0)} равен F(x), и по следствию теоремы 5 F(x) неприводим над Р. Тогда по утверждению 14 T(F) = O(F) = Orda, и из равенств T[F) = Т{и) = q™ - 1 следует, что а — примитивный элемент поля Q. 330
в) => г) При условии в) по утверждению 14 T(F) = Orda = qm — 1. Импликация г) =Ф- а) очевидна. □ Замечание 10. Если и — ЛРП максимального периода qm — 1 над полем Р = GF{q) и Р < Р' — GF(qt)^ то при t > 1 последовательность и уже не является ЛРП максимального периода над Р', поскольку Т{и) < < qtm - 1. 2. Следующее важное для практических приложений свойство ЛРП и максимального периода г = qm — 1 над Р = GF(q) показывает, что она в некотором смысле хорошо "имитирует" случайную последовательность элементов поля Р, в которой все элементы из Р встречаются с одинаковой вероятностью -. Q Зафиксируем числа ii,..., ir £ 0, г — 1 и элементы ai,...,af ЕРи / и ... гг \ обозначим через 9TW [ ' * ' ) число решений г, г € 0, г — 1, систе- и \ ab...,ar ) мы уравнений: u{i + г'1) = ai, п(г + г2) = аг,. - • ,u(i + ir) = аг. (69) Отметим, что если бы последовательность и была отмеченной выше случайной последовательностью, то при достаточно большом т должно было бы выполняться приблизительное равенство ai,...,Or Оказывается, это равенство (при некоторых ограничениях) выполняется и для ЛРП и. Теорема 16. Пусть и — ЛРП максимального периода г = qm — 1 над полем Р = GF(q) и О < г\ < %2 < -.. < ir < m — 1. Тогда для любых ai,..., аГ Е Р справедливы равенства: Г I -r-l, eevm(ab...,ar)=6. П Так как и — ЛРП ранга m и периода г, то система векторов: и(0, т — 1), и(1, т),..., ti(r — 1, г + т — 2) не содержит одинаковых векторов и нулевого вектора, следовательно, она совпадает с множеством p(m) \ {б}. Теперь легко видеть, что число решений г G 0, г — 1 системы уравнений (69) равно числу ненулевых 331
векторов из p(m), у которых координаты с номерами ii,..., ir равны соответственно ai,..., аг. Это число, очевидно, описывается равенствами (70). □ 3. Согласно теореме 15 задача построения ЛРП максимального периода qm — 1 над полем Р = GF(q) сводится к построению реверсивного многочлена F(x) E Р[х], удовлетворяющего условиям пункта г) этой теоремы. Определение!. 7. Реверсивный многочлен F(x) над полем Р = = GF(q), имеющий степень т и период qm — 1, называется многочленом максимального периода (или примитивным многочленом) над полем Р. Заметим, что ввиду эквивалентности утверждений в) и г) теоремы 15, любой многочлен, удовлетворяющий условиям определения 17, имеет в поле Q — GF(qm) m корней, каждый из которых есть примитивный элемент Q, и число многочленов максимального периода qm — 1 над Q равно —(p(qm — 1) (где ср — функция Эйлера). Построение многочлена максимального периода над полем Р осуществляется, как правило, путем перебора неприводимых многочленов F(x) степени т над Р (см. § 5 гл. XXII) с проверкой условия T(F) = = qm — 1 по следующему критерию. Утверждение 15. Неприводимый многочлен F(x) E Р[х] степени т > 1 является многочленом максимального периода над полем Р тогда и только тогда, когда F(x) фх, и для каждого собственного простого делителя тг числа qm — 1 выполняется условие: х3^ ^e(modF(x)). (71) □ Пусть T(F) = £. Так как F(x) неприводим над Р = GF(q), то t\qm — 1, и условие t < qm — 1 равносильно тому, что для некоторого собственного простого делителя тг числа qm — 1 выполняется соотноше- ITTO __ -| ~—j т. е. не выполняется условие (71). □ Следствие. Если 2т — 1 — простое число, то любой неприводимый над GF(2) многочлен степени т есть многочлен максимального периода. П р и м е р 14. Рассмотрим многочлен F(x) = х3 — х — 2 над Р = = GF(3). Так как F(x) не имеет корней в Р, то он неприводим. Число qm — 1 = З3 — 1 = 26 имеет простые делители 2 и 13. Очевидно, что ^1 х2 ф l(modF(x)). 332
Далее, из сравнений по модулю F(x) находим х^1 = х13 = х-х4 -х8 = х(х2 + 2х)(2х2 + 2) = = 2д;2(2д:2 + 2х + 1) = х4 + х3 + 2х2 = 2 ф 1. Следовательно, х3 — х — 2 — многочлен максимального периода над () П р и м е р 15. Числа 22 - 1 = 3, 23 - 1 = 7, 25 - 1 = 31 - простые. Следовательно, все неприводимые многочлены степеней 2, 3, 5 над GF{2) являются многочленами максимального периода. Например, такими будут h х3+х2 + 1, хъ+х2 + 1. Последний многочлен неприводим, потому что он не имеет корней в GF{2) и не делится на единственный неприводимый над GF(2) многочлен второй степени х2 + х + 1. Как уже отмечалось в примере 4.ХХП, простые числа вида 2т — 1 называются числами Мерсенна. Таковы, например, числа 2Ш — 1 при т G {2,3,5,7,13,17,19,31,127}. До сих пор не известно — конечно ли множество чисел Мерсенна. В 2001 г. с помощью сети из 210000 компьютеров было найдено простое число 213466917 — 1. § 11. Цикловой тип семейства ЛРП с реверсивным характеристическим многочленом над конечным кольцом 1. Пусть R — конечное (коммутативное) кольцо с единицей и F(x) 6 G R[x] — унитарный многочлен. Определим на Lr(F) бинарное отношение ~ условием: 333
V«,w€ LR(F) (u~v&3t€ N0{v = xfu)). (72) Очевидно, что отношение ~ рефлексивно и транзитивно при любом F(x). Утверждение^. Отношение ~ на Lr(F) есть отношение эквивалентности тогда и только тогда, когда F(x) — реверсивный многочлен. □ Достаточно доказать, что реверсивность F(x) равносильна симметричности отношения ~. Пусть ~ — симметричное отношение. Рассмотрим последовательность eF £ Lr{F). Так как по определению eF ~ xeF, то в силу симметричности ~ также и xeF ~ eF, т. е. eF = xt+1eF для некоторого t £ No. Но в таком случае (rrt+1 — e)eF = (0), т. е. по теореме 11 eF — чисто периодическая последовательность. Отсюда по утверждению 12 следует, что A(F) = A(eF) = 0, и F(x) — реверсивный многочлен. Наоборот, пусть F(x) — реверсивный многочлен, гх, v £ Lr(F) и и ~ v, т. е. v = хьи, t £ No- Докажем, что v ~ и. Так как F(x) — реверсивный многочлен, то по утверждению 12 и — чисто периодическая последовательность, т. е. хТ^ • и — и. Выберем к £ N так, что к • Т(и) > t. Тогда для t± = к • Т(и) — t имеем Следовательно, v ~ и. □ Определение 18. Для реверсивного многочлена F(x) £ R[x] классы, на которые семейство Lr(F) разбивается отношением ~, называют циклами семейства Lr(F). Если и, v £ Lr(F) и и ~ v, то говорят, что последовательности и и v лежат на одном цикле. Класс [и] = {v £ Lr(F) : v ~ и} называют циклом последовательности и (или циклом, порождаемым и), а его мощность |Ы| — длиной этого цикла. П р и м е р 16. Для многочлена F(x) = ar +х2 +х +1 над полем Р = = 1л2 множество Lp(F) разбивается на 4 цикла, которые порождаются последовательностями и\ — (00110011...), щ, = (0101...), щ = (111...), U4 = (0) и имеют соответственно вид: [иг] = {(00110011...), [и2] = {(0101...), [из] = {(111...)}; (01100110...), (1010...)}; [и4] = {(000...)}. (11001100...), (10011001...)}; 334
Коротко эти циклы можно изобразить графически следующим образом: Утверждение 17. Пусть F(x) — реверсивный многочлен над R и и Е Lr(F). Тогда длина цикла [и] равна Т(и), и для любой последовательности v G [и] справедливо равенство Апп(г;) = Апп(гх). □ Очевидно, что если Т(и) = £, то [и] = {u,xu1..^xt~1u}^ т. е. |[^]| = t. Если v € [и]9 то v = Xsи для некоторого 5 € N. Поэтому, если G{x) £ Апп(гх), то G{x)v = (0), т. е. Апп(гл) С Ann(u). Обратное включение следует из того, что и Е [v]. О Таким образом, если для реверсивного F(x) € R[x] через Np обозначить количество ЛРП и 6 Lr(F) со свойством Т{и) = £, а через Ср — количество циклов длины t в Lr{F), to Np = t • Ср. Определение 19. Для реверсивного многочлена F(x) над конечным кольцом R цикловым типом F(x) или цикловым типом семейства Lr{F) назовем многочлен с целыми коэффициентами: П р и м е р 17. Пусть Р = GF(q) и F{x) € Р[х] — неприводимый реверсивный многочлен степени т и периода T(F) = т. Вычислим цикловой тип множества Lp(F). Если и (Е Lp(F) \ {(0)}, то по следствию теоремы 5 Ми(х) = F(x) и по утверждениям 13, 14 Т{и) = т, r\qm — 1. Таким образом, множество Lp(F)\{(0)} разбивается на q ~X циклов длины т, и так как [(0)] — цщ^ дайны 1, то цикловой тип Lp(F) имеет вид если г > 1, если г = 1. П р и м е р 18. Если R = Z4 и F(x) = х — 3 € Л[ж], то семейство Lr(F) состоит из 4-х последовательностей t^i = (0), U2 = (2,2...), ?/з = (1? 3,1,3,...), щ = (3,1,3,1, —) и разбивается на 3 цикла: [ui], [щ], [из] = [гц]- Его цикловой тип 335
2. При вычислении циклового типа реверсивного многочлена F(x) Е Е R[x] часто оказываются полезными следующие результаты. Определение 20. Композицией многочленов а(у) — ^ агуг и г>1 Ну) = J2^jVJ наД Z назовем многочлен с(у) = а(у)*Ь(у), определяемый равенствами: S* J2 агьэ(ьз) Для t EN, где (г, j) и [г, j] — соответственно НОД и НОК чисел г и j. Иначе говоря, A (Уг *2/J) • (73) Пусть Zi[j/] совокупность всех многочленов над Z с нулевым свободным членом. Тогда, очевидно, * — внутренняя операция на Zi[y] и справедливо Утверждение 18. Алгебра (Zi[j/], *, +) есть коммутативное кольцо с единицей у. Если для s Е 1,г С^(у) = ^ 4* У* ^ Zi[y], mo t>i I b.r [tl,...,trj=* • • • * W (1) (r) I t /-.ч TjHi • • • ctr У • (^) П Коммутативность операции * и ее дистрибутивность относительно сложения легко выводятся из (73). Поэтому для доказательства ассоциативности операции * ввиду (73) достаточно доказать, что для любых k,£,m G N выполняется равенство: (у* * Уе) *ут = ук* (/ * ут) . (75) Пользуясь определением 20, получаем (ук * Уе) *Ут = (к, £)у№ * ут = ([к, 4 m)(Ar, - ^'т(к Ык'е>т1 - Ыт [к,е,т] ~ [к,е,т] 336
Аналогично доказывается равенство: ™\ к£т откуда и следует равенство (75). Для доказательства равенства (74) ввиду (73) достаточно показать, что для любых *i,..., tr € N справедливо равенство: При г = 2 оно следует из определения 20, а при г = 3 доказано выше. Пусть п > 3 и для г < п равенство (76) справедливо. Тогда при г = п, пользуясь предположением индукции и определением 20, получаем у* •... ♦ у*- = *х' • • • '*г"д;yfr'"*-'l * у*г = [ttj 1*1 r-l], *r T e о р е м a 17. Пусть R — ккже'чпое кольцо, гл F\(x), взаимно простые реверсивные многочлены над R. Тогда F(x) = F\ (x) x х F2(x) — реверсивный многочлен, и его цикловой тип вычисляется по формуле: П Реверсивность F(x) следует из теоремы 136). По определению 19 = Е С?У, где tC{p = N^ - число различных ЛРП и <Е LR(F), t>i имеющих период t. Подсчитаем число Np другим способом. По теореме б каждая ЛРП и G Lr(F) однозначно представляется в виде суммы и = и\ + U2, где us £ Lr(Fs) для s G 1,2. При этом если Т(и) = £, то по утверждению 11 в) Т(щ) = £i, Т(щ) = <2 и [ti, *2] = *• Наоборот, если us G Lr(Fs), s € 1,2, — последовательности, удовлетворяющие 337
трем последним равенствам, то и = и\ + U2 — ЛРП из Lr(F) периода t. Следовательно, Поскольку N^ = taCpf\ то из (77) получаем = Е 4*1 ti,t2€N Отсюда, ввиду соотношения ti • *2 = * • (*ь<2)> следует равенство: которое по определению 20 и означает, что Cf = С^ (у) * Ср2(у)- П П р и м е р 19. Пусть Р = Z2, F(x) = (х2 + х + 1)(гг4 4- х3 + + х2+х+1) G Р[х]. Определим цикловой тип семейства Lp(F). Пользуясь результатом примера 17, получаем, что неприводимые многочлены JFi (х) =ж2 + х + 1и -РЪОе) = х4 + ж3 + а:2 + а; + 1 имеют цикловые типы соответственно = y + Зу5. Так как (Fi(x), F2(x)) = 1, то по теореме 16 = CFl(у) * CF2(у) = у + у3 + Зу5 + Зу15. 3. Теперь задача описания циклового типа произвольного реверсивного многочлена над конечным полем сводится к описанию циклового типа примарного многочлена. Последний выглядит следующим образом. Т е о р е м а 18. Пусть Р = GF(q) — поле характеристики р и G(x) G Р[х] — реверсивный неприводимый многочлен степени т и периода г. Тогда ат -1 y + ^—ут, 338
и для любого к > 1 л=1 * г □ Докажем индукцией по к равенство: CG*(y) = y + J2 9 г-9** У****' ^ где At =]logpt[. Для к = 1 оно совпадает с первым из утверждаемых теоремой 18 равенств и уже выведено в примере 17. Пусть п > 1, и для всех к < п равенство (79) верно. Докажем его для к = п. Рассмотрим в Lp(Gn) подмножество Lp(Gn), состоящее из всех ЛРП и, для которых G(x)n — не только характеристический, но и минимальный многочлен. Тогда очевидны соотношения: LP(Gn) = LpiG71'1) U LUG71), LP(Gn-1) П LUG71) = 0, (80) из которых следует, что \bp\Lr )\ — jjLp^Cjr )\ — \L/p(Lr )\ — q — q v '. Кроме того, так как по утверждению 17 все ЛРП из Lp(Gn), принадлежащие одному циклу, имеют равные минимальные многочлены, то для любой ЛРП и € LUG71) справедливо включение [и]~ С Lp(Gn). Следовательно, LUG71) есть объединение некоторого числа N циклов длины Т(Сп)=т-рх" и \L*(Gn)\ qrnn _qm(n-l) Теперь из (80), очевидно, следует равенство: „гпп _ ~т{п— 1) Отсюда, пользуясь тем, что (79) верно для к = п — 1, получаем равенство (79) для к = п. Для завершения доказательства теоремы остается заметить, что равенство (78) получается из (79) суммированием коэффициентов при 339
одинаковых степениях у, поскольку для слагаемых из (79) справедливы соотношения: (At = 0) & (t = 0), для каждого А Е 1, £ — 1, (At = А) <Ф (А - К logp t < А) и, наконец, § 12. ЛРП над кольцами вычетов В этом параграфе дается описание простейших свойств ЛРП над кольцом вычетов R = Z/M. Указывается методика оценки периодов таких ЛРП и излагаются некоторые сведения о ЛРП максимально возможного периода (при данном ранге га) над примарным кольцом вычетов R = Z/pn, где р — простое. 1. Сведем все задачи к изучению многочленов и ЛРП над примар- ными кольцами вычетов. Пусть каноническое разложение числа М есть М = р™1 •... • р%к. Положим Rs — Z/(p™s) для s € 1, к. Согласно следствию теоремы 11. XX кольцо R = Z/(M) изоморфно внешней прямой сумме R\ ф ... ф i?fc. Причем изоморфизм (р: i?-> /?i0...ei?fc (81) устанавливается следующим образом: если г £ R и г = [а]м — класс элементов, сравнимых с а по модулю М, то <p(r) = (rW,..., г<*>), где г^ = [а)Л8 для s € Tjc. (82) Этот изоморфизм можно продолжить до изоморфизма кольца многочленов ф: R[x] —> Ri[x] ф ... ф Л^М следующим образом: если F(x) e Е R[x] и F(x) = Y, fix\ то г>0 где F(*\x) = J2 ft)xi Для s € t>0 340
Для удобства будем называть элемент г W из (82) и многочлен F^ (х) из (83) компонентой в кольце Rs (в кольце i?s[x]) или просто 5-й компонентой соответственно элемента г и многочлена F(x). Перечислим некоторые важные в дальнейшем простейшие свойства изучаемых разложений колец R и R[x}: — если е = [1]м — единица кольца Д, то ее компонента e(s) = = [1]р£« — единица кольца Rs; — элемент г е R обратим тогда и только тогда, когда все его компоненты г^ обратимы; — многочлен F(x) € R[x] унитарен тогда и только тогда, когда все его компоненты F^ (x) унитарны и имеют равные степени; — многочлен Н{х) £ R[x] делится на F(x) Е R[x] тогда и только тогда, когда F^(x)\H^(x) для s G l,fc. Напомним, что по теореме 12 а) любой унитарный многочлен над кольцом R является периодическим. Утверждение 19. Для любого унитарного многочлена F(x) E £ Z/M[x] справедливы равенства: A(F) = max{A(F<i)),... ,A(F^)}, T(F) = [T(F&),... ,T(F<*>)]. В частности, многочлен F(x) является реверсивным тогда и только тогда, когда все его компоненты F^(x) являются реверсивными многочленами. □ Выберем произвольно А € No и t G N и рассмотрим многочлен Н(х) = хх(хг — е) = exx+t — ехх € R[x]. Его компоненты имеют вид #(*)(х) = e^xx+t - е&хх = х\хг - е^) е Rs[x] для s G ТД. Из сделанных выше замечаний следует, что (^(х)|хл(х* - е)) ^ (F(<s)(x)\xx(xt - е^) для з € ljb). Теперь остается воспользоваться определением 15 и следствием 1 утверждения 12. □ П р и м е р 20. Вычислим период и длину подхода многочлена F(x) = = х5 + 10х4 + 9х + 7 над кольцом R = Z/15. Так как (7,15)=1, то сразу можно утверждать, что F(x) — чисто периодический многочлен, т. е. A(F) = 0. Разложение кольца R на примарные компоненты имеет вид: R ^ R! 0 Л2, где i?i = Z/3, Л2 = Z/5, 341
соответствующие этому разложению компоненты многочлена F(x) таковы: = х5 + х4 + 1 = (х3 + 2х + 1)(х - I)2 e Z/3[ar], =x5 + 4x + 2e Z/5[x]. Многочлен х3 + 2х +1 над полем Z/3 неприводим и имеет период З3 — 1 = = 26. Поэтому r(F«(x)) = [Т(х3 + 2х + 1), Г((х - I)2)] = [26,3] = 2 ■ 3 • 13. Многочлен F^2\x) над полем Z/5 неприводим, и T(F^) = 55 — 1 = = 4 • 11 - 71. Окончательно получаем T(F) = [T^1)), T(jF<2))] = 4 • 3 • •11-13-71. Замечание 11. В условиях утверждения 19 из того, что degF(x) = rra, и многочлен F(x) имеет максимально возможный период среди всех многочленов степени ш над Z/M, вообще говоря, не следует, что каждая его компонента F^s\x) имеет максимально возможный период среди всех многочленов степени m над Z/p™s. Так, в условиях примера 20, если G(x) E R[x] — многочлен степени 5, компоненты которого G^^(x), G^2\x) имеют максимальные периоды над полями соответственно Z/3 и Z/5, то T(GW) = З5 - 1 = 2 • II2, T(G<2)) = 55 - 1 - = 4 • 11 • 71 и T(G) = 4 • II2 • 71. Последняя величина меньше периода многочлена F(x) из примера 20. Заметим теперь, что изоморфизм (81) может быть продолжен до изоморфизма абелевых групп ставящего в соответствие последовательности и £ R°° набор последовательностей: <р(и) = (и«,..., *<*>), ttW gj^,eg ТД, в котором г-й член гг(5) (г) последовательности и^ есть s-я компонента г-ro члена u(i) последовательности и, т. е. Утверждение 20. Пусть и Е R°°, и имеет место изоморфизм (84). Гог(?а справедливы следующие утверждения: 342
а) последовательность и есть ЛРП с характеристическим многочленом F(x) € R[x] тогда и только тогда, когда каждая ее компонента и^ есть ЛРП с характеристическим многочленом F^s\x); б) и — периодическая последовательность тогда и только тогда, когда каждая ее компонента г№ — периодическая последовательнсть. Если и — периодическая последовательность, то А(и) = тах{Л(гх(1)),..., А(и^)}, Т(и) = [Т(и™),..., Г(ы<*>)]. □ а) Достаточно заметить, что <p(F(x)u) = (F^ (х) и^г\... ..., fW(x)v,W), и потому (F(x) - и = (0)) & (F^(x)u^ = (0) для s € ТД). Утверждение пункта б) легко следует из а), если выбрать F(x) = = хх(хг -е). □ Следствие. Для любого унитарного многочлена F(x) £ R[x] имеет место изоморфизм абелевых групп: LR(F) * LRl(F^) 0 ... 0 LRk (F«). Если F(x) — реверсивный многочлен, то цикловой тип Ср (у) семейства Lr(F) (cm. определение 19) может быть вычислен по формуле: CF(y) = CF(i) (у) * ... * CFW (у). (85) П Первое утверждение следствия вытекает из изоморфизма (84) и утверждения 20 а). Равенство (85) доказывается точно так же, как равенство теоремы 17. □ П р и м е р 21. В условиях примера 20 вычислим период ЛРП и G Е Lr{F) с начальным вектором ?х(0,4) = (66011). Начальные векторы компонент и над полями R\ = Z/(3) и i?2 = ^/(5) имеют соответственно вид ^(0,4) = (00011), гЯ(0,4) = (11010). ЛРП и^ над Ri имеет характеристический многочлен F^(x) = = хъ + х4 + 1, и ее генератор относительно F^(x) есть Ф^(х) = х + 2. Отсюда получаем F&Hx) = {Х + 2Х + 1)(Ж " Х) = Т((х3 + 2х + 1)(ж - 1)) = Т(х3 + 2х + 1) = 26. 343
Последовательность ij№ над Лг есть ЛРП с неприводимым характеристическим многочленом F^2\x) = хъ + 4х + 2, и так как и^ Ф (0), то MuW(x) = FW(x), T(v№) = T(F(2)) = 55 - 1. Окончательно находим T{u) = [Г(м(1)), T(u(2))] = [26,55 - 1] = 4 • 11 • 13 - 71. П р и м е р 22. Вычислим цикловой тип Ор(у) множества Lr(F) из примера 20. По следствию из утверждения 20 Cj?(y) = CF(i)(y) * *Ср(2)(у). По теореме 17 справедливо равенство C/r(i)(y) = С&(у) * *С#(у), где С?(#) = ж3 + 2я: + 1, i?(x) = (а: — I)2 — многочлены над J?i = Z/3. Так как (?(#) — многочлен максимального периода 26 над i?i, то Cg(v) = 1 • У1 +1 • У26- Цикловой тип многочлена Н(х), как легко проверить, имеет вид С#(у) = 3 • у1 + 2у3. Таким образом, 2 3 13 CF(i) (у) = (1 • у + 1 • у26) * (Зу1 + 2у3) = Зу1 + 2у3 + Зу26 + 2у Так как F^2\x) — многочлен максимального периода 4-11-71 над R2 = Z/5, то CF(2) (у) = 1 • у1 + 1 • у4 n 71. Окончательно получаем: у2 13 + 2у2 3 13) * (1 у1 + 1 / u CF(y) = (Зу1 + 2у3 + Зу2 13 + 2у2 3 13) * (1 • у1 = 3ух + Зу4 п п + 2у3 + 22/3 4 n 71 + Зу2 13+ + 3.(2-13, 4-11 71)t/l213'4117114-2y2313+ + 2.(2-3-13, 4.1Ы7)-у12313'411171 = = Зу1+22/3 + Зг/213 + 2г/2313+22/431171+6г/4111371+4г/43111371. 2. Всюду далее в этом параграфе будем считать, что R = Z/pn, где р — простое и п > 1. Исследуем, чему равен максимально возможный период ЛРП порядка m над R и как строить такие ЛРП? Очевидно, что для этого надо прежде всего найти максимум периодов унитарных многочленов степени m над Л. Рассмотрим поле R = Ъ/р и естественный эпиморфизм ф: R —> Л, который ставит произвольному элементу г = [а]рп £ R в соответствие элемент ^>(г) = [а]р Ей. В дальнейшем для краткости будем использовать обозначение ф(г) = г. Заметим сразу, что обратимость г в R равносильна условию (а,р) = 1, которое равносильно обратимости г в Л. Для произвольного многочлена F(x) = Ylhx% € Щх] положим F(x) = Ylfixl € Л[х]. Очевидно, что эпиморфизм ф: R —> Л можно 344
продолжить до эпиморфизма ф: R[x] —> jR[x], действующего по закону ip(F(x)) = F(x). При этом реверсивность произвольного унитарного многочлена F{x) £ R[x] равносильна реверсивности его образа F(x). В дальнейшем нам понадобится Л е м м а 1. Если F(x) £ R[x] — унитарный многочлен степени т, и многочлены А(х), В{х) £ R[x] удовлетворяют условию ргА{х) = = jfB(x)(mDdF(x)), гдеО<г<п, то ~А(х) = JB(x)(modF(x)). D Разделим А(х) — В(х) на F(x) с остатком: А(х) - В{х) = Q(x)F(x) + С(ж), degC(z) < т. (86) Тогдар*(А(х)-В(х)) = {ptQ{x))F(x)+ptC(x),HT^KK3KdegptC(x) < m, а по условию F{x)\pl{A{x) — В(х)), то ргС(х) = 0. Следовательно, все коэффициенты многочлена С(х) делятся на рп"~*, и поскольку n —t > 0, то они делятся на р, т. е. С(х) = 0. В таком случае из (86) следует равенство А(х) — В(ж) = Q(rr)F(x). П Пусть теперь F(x) ejl[x] — реверсивный многочлен степени т > 0, и го = T(.F) — период F(x) над полем Л. Тогда хТ° = e(modF(x)), и, вычисляя остаток от деления в кольце R[x] многочлена хТо на F(x), получаем: хто = е +p?7(a:)(modF(x)), degC/(x) < m. (87) Это соотношение слулсит отправной точкой при решении всех задач, связанных с вычислениями периодов многочленов и соответствующих им ЛРП над кольцом R. Основным инструментом, позволяющим его использовать, является Л е м м а 2. Пусть F(x) E R[x] — реверсивный многочлен степени т, и для t,£ £ N выполняются соотношения: х* = е + peA(x)(mod F(x)), deg Д(х) < т. (88) Тогда существует многочлен А\(х) £ R[x] такой, что xtp = e + pi+1A1{x){modF{x)), deg Д^яг) < т. (89) При этом если £+1 < п, то любой многочлен Дх(д;), удовлетворяющий соотношениям (89), удовлетворяет также соотношениям: = Д(х), еслир£ > 2; (90) = А(х)2 + S(x)(mod F(x)), еслгх р^ = 2. (91) 345
□ Из (88) возведением в степень р получаем: = e+( \ \р£А{х)+( I \p2£A(xf+...+ ( Pp Так как ( ^ )р£ = р£+1 и ps£ > p£+1 для s G 2,р, то последнее внение молено записать в виде: сравнение молено записать в виде: xtp = e+p£^1K{x){modF{x)), где ) = А(х) + f 2 ) Р€"1Д(Х)2 + • • ■ + ( р ) ^ К(х Заменяя здесь К(х) его остатком Ai(#) от деления на F(x), получаем (89). Пусть теперь Ai(#) G R[x] — произвольный многочлен, удовлетворяющий условиям (89). Тогда из (89) и (92) следует, что p£+1Ai(x) = = p£'¥lK(x)(modF(x))^ и если £ + 1 < п, то по лемме 1: Аг(х) = K(x)(modF(x)). (93) Если р£ > 2, то в вьфажении (92) для К(х) коэффициенты всех слагаемых, начиная со второго, делятся на р. Следовательно, К{х) = = А(х)у и из (93) и условий deg А(х) < m, deg Ai(a:) < m следует (90). Если р£ = 2, т. е. р = 2, £ = 1, то соотношения (92) имеют вид: xt2 = e + 22K(x)(modF(x)), К(х) = А(х)2 + Д(ж), и из (93) следует (91). □ Т е о р е м а 19. Для любого реверсивного многочлена F(x) € R[x] справедливо равенство: T(F) = T(F) • pk, где k G 0,n-l. (94) Если T(F) = го, mo равенство T(F) = tq • p71"1 выполняется тогда и только тогда, когда многочлен U(x) из соотношения (87) удовлетворяет условию: U(x) ф 0, если р > 2, или р = 2, п = 2; (95) £/(ж)2 + С/(ж) ^ 0(mod F(x)), если р = 2, п > 2. 346
□ Пусть T(F) = т, T{F) = т0. Так как F{x)\xT - е, то F(x)\xT - ё и по следствию 1 утверждения 12 то | т. С другой стороны, из соотношения (87), применяя t раз лемму 2, получаем, что для каждого t G No существует многочлен Ut{x) € R[x) такой, что выполняются соотношения: (x)), degUt(x) < га. (96) Отсюда при t = n — 1 получаем: жТорП = e(modF(x)), т. е. -ей т\търп-г. В совокупности с условием го | т это дает равенство (94). Ввиду (94) условие T(F) = торп~1 равносильно условию г > горп~2, которое опять-таки ввиду (94) равносильно тому, что х тор Последнее в силу (96) равносильно условию С/П_2(ж) ф 0. Теперь остается заметить, что согласно лемме 2 из соотношения (87) вытекают следующие соотношения для многочленов Ut(x) из (96): если р > 2, то U0(x) = Ui(x) = ... = Un-2{x) = 17(х); если р = 2, п = 2, то Uq(x) = Un-2(x) — U{x)\ если р = 2, п > 2, то С70(х) = Щх), ^(я?) = ... = С/П_2(х) - Щх)2+ + U(x)(modF{x)).n Следствие. Для любого реверсивного многочлена F(x) G R[x] степени т выполняется неравенство T{F) < (рт — 1)рп~1. Равенство T(F) = (рт — 1)рп~1 имеет место тогда и только тогда, когда: а) F(x) — многочлен максимального периода tq = рт — 1 над полем И = Ъ/р; и б) для многочлена U{x) из (87) выполняется условие (95). □ Достаточно заметить, что для любого реверсивного многочлена F(x) б R[x] степени т верно неравенство T(F) < рт — 1, а равенство T(F) = рш — 1 означает, что F(x) — многочлен максимального периода. □ Определение21. Реверсивный многочлен F(x) степени т над кольцом R = Z/pn называется многочленом максимального периода, если T(F) = (рт - 1)рп-г. 347
Т е о р е м а 20. Для любого натурального т > 2 в кольце Щх] существует многочлен максимального периода степени т. D Выберем произвольно реверсивный многочлен F(x) € R[x] степени т так, чтобы многочлен F(x) имел максимальный период то = рш—1. Если многочлен U(х) из соотношения (87) удовлетворяет условию (95), то по следствию теоремы 19 F(x) — искомый многочлен максимального периода. Допустим, что условие (95) для U(x) не выполнено. Покажем, что в таком случае многочленом максимального периода будет F\ (x) — __ _ Очевидно, что F\(x) = F(x), и потому для F\{x) выполнено условие а) следствия теоремы 19. Пусть хТ° = е + pUi(x)(mod Fi (x)), deg Ui (ж) < m. (97) Остается показать, что многочлен U\(x) удовлетворяет условию (95). Для этого выразим Ui(x) через U(x). Заменяя в (87) х на х +ре, получаем: (х + ре)Т0 = e+p[/(rr + pe)(modFi(x)). Пользуясь формулой Ньютона 38 (теорема З.П), находим (х + ре)То = хТо +ртъхП}-1 +р2К(х) для подходящего К(х) G R[x]. Из двух последних соотношений имеем: хго = e+p(U(x + ер) - тох™-1 -рК(х))(modF^x)). Отсюда и из (97) получаем соотношение: pUi(x) = p(U(x +pe) - тъх1*-1 - pK(x))(mod Рг(х)), из которого в силу леммы 1 и очевидных соотношений U(x+pe) = U(x), tqxt°~1 = —ехТо~1, рК(х) = 0 вытекает сравнение: Ui(x) = U(x) - ar^-^modТг(х)). (98) В случае р > 2 или р = п = 2 предположение о том, что многочлен U(х) не удовлетворяет условию (95) означает: U(х) = 0(modF(x)). Но тогда ввиду равенства Fi(x) = F(x) из (98) следует, что пг(х) = -ёхт°-г ф 0(modFi(x)), 38 И. Ньютон — английский математик и физик (1643—1727). 348
следовательно, Ui{x) удовлетворяет условию (95). __ В случае р = 2, п > 3 наше предположение означает, что U{x)2 + + U(x) = 0(modF(x)). Но тогда из (98) следует сравнение: Щх)2 + пг(х) = х7"0-1^7"0"1 -e)(modFi(x)), и так как Т(Рг(х)) = т0, то х7"0"1^7"0""1 - е) ф 0(modFi(x)), т. e. Ui{x) удовлетворяет условию (95). П 3. Теперь предположим, что F(x) — многочлен степени т над кольцом R = Z/pn, имеющий максимально возможный период T(F) = — (рт ~~ 1)рп"1^ и дадим описание периодов ЛРП из Lr{F) и циклового типа семейства Lr(F). Заметим, что в кольце R можно выделить строго возрастающую цепочку идеалов: {0} = рп R <pn~1R<...<pR<R (равенство ркR = pfc+1i? при к < п невозможно, так как из него следует равенство pkR = pnR = {0}). Определение 22. Нормой элемента г £ R называется число ||г||, равное наибольшему к € 0,п со свойством г £ pkR. Нормой последовательности и Е Л°° и нормой вектора п(0, т — 1) называются параметры Из определения легко следует, что для любого элемента г £ R справедливы соотношения: (||г|| = 0) ^ (г G Я*), (||г|| =п)^(г = 0). Читателю предлагается самостоятельно убедиться в справедливости следующих фактов. Л е м м а 3. Для любых элементов а, Ь € R верны соотношения: а) ||а+6|| > min{||o||, ||6||>, и если \\a\\ ф ||6||, то \\а+Ь\\ = mm{||o||, ||Ь||}. б) \\а ■ Ъ\\ < \\a\\ + \\Ь\\, и если \\a\\ + \\b\\ < п, то \\а • 6|| = ||а|| + ||6||. в) для любой ЛРП и € Lr(F) верно равенство \u\\ = 349
В дальнейшем нам понадобится также Л е м м а 4. Многочлены F(x), G(x) Е R[x] взаимно просты тогда и только тогда, когда взаимно просты их образы F(x),G(x) над полем R = Ъ/р. _ _ □ Пусть (-Р(х), G{x)) = ё. Тогда существуют многочлены А(х), В(х) Е Е R[x] такие, что A(x)F(x) + B(x)G(x) = ё. Это означает, что в кольце R[x] для подходящего С(х) Е R[x] выполняется равенство A(x)F(x) + +B{x)G{x) = е+рС(х). Так как (е+рС(х))рП~г = е, то е+рС{х) — обратимый многочлен в кольце R[x) и для U(x) = (е+рС(х))"1А(х)1 V(x) — — (е +рС(х))~~гВ(х) выполняется равенство U(x)F(x) + V(x)G(x) = е, т. е. (F(x),G(x)) = e (определение 10). Доказательство в обратную сторону очевидно. □ Теорема21. Если F(x) — многочлен степени т>2 максимального периода (рт — Vjp71"1 над кольцом R, и Е Lr(F) \ (0) и \\u\\ = к, то Т(и) = (рт — 1)рп"к~1. Цикловой тип множества Lr(F) имеет вид: п-1 t=0 П Рассмотрим сначала случай, когда \\u\\ = 0. Пусть Фм(х) — генератор ЛРП и относительно многочлена F(x). Покажем, что (Фи(х), F(x)) = е. Из формулы (16) легко следует, что Фи(х) = Фгг(^) — генератор образа и ЛРП и над полем R относительно характеристического многочлена F(x). Так как ||гг|| = 0, то и Ф (0) и Фгг(#) ф 0. Так как F(x) — многочлен максимального периода над Л, то по следствию теоремы 19 F(x) —^неприводимый многочлен степени т над R. Поскольку Фи(х) ф 0 и 6.щФи{х) < т, то это дает соотношение (Фи(х),Р(х)) = ё, которое ввиду леммы 4 эквивалентно условию (Фи(х),Г(х)) = е. По утверждению 9 б) последнее означает, что для любого t E N условие F(x) | (ж* — е)Фи(х) эквивалентно условию F(x) \хг — е. В силу утверждения 7 это означает, что ((х* — е)и = (0)) <=> (F(x)|x* — е), т. е. Т(и) = T(F) = (pm — 1)рп"1. Таким образом, в случае \\u\\ = 0 теорема доказана. Пусть теперь ||гх|| = к > 0. Заметим сразу, что так как и ф 0, то к < п. По лемме 3 в) имеем равенство ||гг(О, m — 1) || = к. По определению нормы вектора это означает, что все координаты г/(0),..., и(т — 1) делятся нар^, и часть из них не делится нар*+1. Следовательно, найдется вектор г;(0, т — 1) над jR такой, что ||г>(0, т — 1)|| = 0 и и(0, т — 1)=ркх 350
хг;(О, га — 1). Пусть v € Lr(F) — ЛРП с начальным вектором г;(0, т — 1). Тогда, очевидно, справедливы равенства \\v\\ = 0 и и = рк • v. Рассмотрим факторкольцо R = R/pn~kR = Z/pn~~k. Обозначим через v и F(x) образы последовательности v и многочлена F(x) при естественном гомоморфизме Д-^Ли докажем последовательно равенства T(v) = (pm - ljp"-*-1, T(u) = T(S). Очевидно, г; € L^{F) и ||г/|| = 0. Кроме того, так как п — к > 0, то F(x) — многочлен максимального периода (pm — ljp71"*"1 над кольцом R. Действительно, если п—к = 1, то R = Л, -Р(#) = F(a;), и утверждение очевидно; если n — fc > 1, то из соотношения (87) для то = T(F) = рт — 1 следует соотношение: xro = e+ pC/(a)(modF(s)), где С/(х) — образ U(x) над Л. Так как F(x) = F(x) и f/(rr) = U(x), a F(x) — многочлен максимального периода над Л, то для F nU выполнены условия следствия теоремы 19, т. е. F(x) — многочлен максимального периода над Л. Поскольку ||г?|| = 0, то по доказанному выше это означает, что _ T(v) = T(F) = (pm - l)pn~A:~1. Из равенства и = pkv следует, что для каждого t £ N справедлива цепочка соотношений: (х* - е)и = (0) & рк(х* - e)v = (0) & {хг - e)v = = (0)(modpn-k) & (x* -e)v = (б). Это доказывает равенство Т{и) = T(v). Следовательно, Т(и) = (рт — —1)рп~к~1, и первая часть теоремы доказана. Теперь можно утверждать, что возможные длины циклов, на которые разбивается множество Lr(F), суть 1, (рт — 1), (рт — 1) -р,..., (рт — —1) .р71"""1, т. е. цикловой тип семейства Lr(F) имеет вид: п-1 Cf (У) = СУ1 + J2 Ctyiprn~1)pt у (99) где Ct — количество циклов длины (рт — 1)рг в Lr(F). ЛРП и € Lr(F) имеет период 1 тогда и только тогда, когда и = (0), т. е. \\u\\ = п. Таким 351
последова (рт - l)pt образом в (99) С = 1. Равенство Т{и) = (рт - 1)р*, где £ € 0,п- 1, эквивалентно равенству ||гг(О, т — 1)|| = п — t — 1. Количество векторов длины т над кольцом Л, имеющих норму п — t — 1, очевидно, равно |pri~t'~1i?|r71 — |рп~*Д|т = p(t+1)m — ptm. Следовательно, количество последовательностей г/ € Lr(F), имеющих период (рт — 1)р*, равно tm, и они разбиваются на Ct = {{рш - l)ptm/(pm - 1)рь) = циклов. Подставляя найденное значение С* в (99), получаем нужное равенство для Ср(у). П Следствие. Еслг/ гг — произвольная ЛРП над кольцом R = Z/pn с характеристическим многочленом G(x) степени т, то Т(и) < {рт — —Vjp71"1. Равенство Т(и) = (рш — \)рп~1 достигается тогда и только тогда, когда G(x) — многочлен максимального периода надЯ и \\u\\ = 0. □ Первое утверждение вытекает из неравенства Т(и) < T(G) и следствия теоремы 19. Второе — из того же следствия и доказанной только что теоремы. □ Определение 23. ЛРП и порядка m и периода (pm — Vjp71"^1 над кольцом Ъ/рп называется линейной рекуррентной последовательностью максимального периода над кольцом Z/pn. § 13. Распределение элементов на циклах линейных QQ рекуррент °* 1. Пусть и — ненулевая реверсивная ЛРП над полем Р = GF(q) ранга т > 1 и периода т = Т(и) < qm — 1. Обозначим через 9tu(a) количество появлений элемента a € Р на цикле ЛРП щ т. е. на отрезке гх(О, т — 1). Как уже отмечалось в параграфе 10, для того чтобы рассматривать и как имитацию случайной последовательности, необходимо, чтобы относительная частота ии{а) = -Ч1и(а) появления элемента г а на отрезке гх(О, т — 1) была близка к естественной средней величине - q для любого а £ Р. 39Авторы признательны О. В. Камловскому и В. Л. Куракину за помощь при подготовке материалов и оформлении результатов этого параграфа. 352
Здесь мы иллюстрируем возможности применения метода тригонометрических сумм Виноградова 40 для получения оценок величин vu{a) и 9Iw(a) с использованием свойств характеров конечного поля и сумм Гаусса. Утверждение21. Для любого нетривиального аддитивного характера ф (см. § 5.XII) поля Р верно равенство £ * * с€Р\О г=0 П Согласно соотношению ортогональности для характеров группы (Р, +) (см. следствие теоремы 8.ХП) для любого сЕ Р\0 справедливы соотношения: Т-1 Отсюда г=0 ^ с€Р Поскольку ^ — аддитивный характер, то ф{с(и(г)—а)) =' Следовательно, —са). г=0 Так как ф(0) = 1, то сумма слагаемых, соответствующих с = 0, равна r/q. Выделяя это слагаемое отдельно, получим требуемое соотношение. □ Из доказанного утверждения видна необходимость исследования сумм вида Y1 ф(си(г)). Важное их свойство дает г€0,т-1 Утверждение 22. Пусть ф — нетривиальный аддитивный характер поля Р. Тогда 2 т-1 г=0 v€LP{F)\0 т-1 г=0 - г). 40 И. М. Виноградов — российский математик (1891—1982). 353
□ Так как и — реверсивная последовательность периода т, то справедливо равенство т-1 г=0 т-1 7=0 т-1 г=0 Заметим, что система последовательностей v3 = xJu, 0 < j <т—1, есть система попарно различных ЛРП из Lp(F) \ 0, и потому 2 т-1 £ 3=0 т-1 г=0 т-1 т-1 г=0 < v£LP(F)\0 т-1 г=0 откуда следует первое из доказываемых соотношений. Для доказательства второго соотношения заметим, что т-1 2 v€Lp(F)\0 г=0 т-1 где Поэтому достаточно доказать, что S = т#т. Пусть F(x) — минимальный многочлен ЛРП и, тогда по предположению deg F(x) = тпи система последовательностей vq = и, v\ = хи, ..., vm-\ = хш~1и есть базис пространства Lp(F). Отсюда - Е т-1 ^2 ip(aovo(i) г=0 т-1 г=0 т-1 354
где черта означает комплексное сопряжение. Перемножая две последние суммы и пользуясь равенством ф(с) = ^(—с), получим т-1 Е= ~ В силу соотношения ортогональности для характеров при любых фиксированных i,j € 0,г — 1 справедливо равенство а£Р где ^v(i),v(j) — символ Кронекера 41. Отсюда т-1 Слагаемое данной суммы отлично от 0 (и, следовательно, равно 1) тогда и только тогда, когда (vo(i),...,Vm-i(i)) = (vo(j),...,Vm-iU)), т. е. тогда и только тогда, когда (и(г, i + m — 1) = (u(j,j + го — 1). Так как и — ЛРП порядка ш, то последнее равенство эквивалентно условию хги = xJu. Так как 0 < г, j < т— 1, где т — период ЛРП гг, то это условие равносильно условию г = j. Таким образом, г=0 что и требовалось доказать. П Т е о р е м а 22. Пусть по-прежнему и — ненулевая реверсивная ЛРП ранга т и периода г = Т(и) над полем Р = GF(q). Тогда для любого аЕ Р пТП Г 41 Л. Кронекер — немецкий математик (1823-1891). 355
□ Из определения vu{o) следует, что достаточно доказать неравенство 9-1 Используя утверждение 21 и равенство \ф(—ас)\ = 1 для с € Р\0, получаем т-1 с€Р\О г=0 с€Р\О т-1 г=0 Теперь по утверждению 22, примененному к ЛРП си, имеем: с€Р\О По теореме 16, если и — ЛРП максимального периода г = qm — 1, то Я gr если а т^ О, если а = 0. (100) Читателю предлагается самостоятельно вывести из теоремы 22 Следствие. Если для некоторого е > 0 выполняется равенство г = д^+1+е, то 1 q Этот результат, по-сути, указывает нижнюю оценку периода г последовательности и, при которой оценку теоремы 22 можно рассматривать как нетривиальную. 2. Более точные оценки величин ии(а) можно получить, если наложить на характеристический многочлен ЛРП и дополнительные ограничения и использовать более сильный математический аппарат. Так, используя введенные в § 5.ХП суммы Гаусса, сер\о 356
где х>Ф — характеры соответственно мультипликативной и аддитивной групп поля Р, можно более точно описать частоты появления элементов поля Р на цикле ЛРП и с произвольным неприводимым минимальным многочленом F(x) степени га. Нам понадобятся следующие свойства сумм Гаусса. Если е — единица поля Р = GF(q), то , Ф) = x(-e)G(X, ф), G(x, Ф) = x(-e)G(Xf ФУ (101) Читателю предлагается доказать эти равенства самостоятельно. Если характерыХИФ нетривиальны, то |G(x,ф)\2 = q (см. теорему 10в).XII). Пусть 7] — квадратичный мультипликативный характер поля Р, определяемый соотношениями / \ _Г 1, если а £ Р является квадратом, \ — 1, в противном случае. Тогда для любого нетривиального аддитивного характера ф xU), если q = 3 (mod 4). Действительно, так как г\ = rj, то ввиду (101) Gfo, ф)2 = G{V, ф)в{% ф) = ri(-e)G(r), Ф)Щ^Ф) = Теперь равенства (102) следуют из соотношений: = 1(тос14), -1, если 9 = 3 (mod4), (103) которые читателю предлагается доказать самостоятельно. По теореме 10 реверсивная ЛРП и с неприводимым минимальным многочленом F(x) степени т имеет представление функцией "след" вида: tx(i) = tr^(b^), г>0, (104) где в — корень многочлена F(x) в поле Q = GF{qm), и 6 G Q — некоторый элемент, однозначно определяемый начальным вектором ЛРП и. 357
При этом параметр г = Т(и) = T(F) удовлетворяет также равенству г = Ord0 (см. утверждение 14 и пример З.ХХП). Утверждение 23. При заданных условиях для любых элементов а £ Р и нетривиального аддитивного характера ф поля Р справедливо равенство } х- х(в)=1 где суммирование проводится по всем мультипликативным характерам х поля Q = GF(qm) таким, что х(#) = 1, и использованы обозначения: ХР — ограничение характера х wa поле Р; ipQ(x) = ^(ti^1 (х)) — расширение характера ф поля Р на поле Q\ Фа (у) = Ф(^у) — аддитивный характер поля Р. □ Во-первых, отметим, что хР, i/fi и фа — характеры. Это устанавливается непосредственной проверкой с использованием линейности функции "след" для характера ф®. По утверждению 21 ч Т 1 v^ i/ а) = —I— > Ф\—с о a JL~* 4 ч сер\о т 1 ^"^ -т / = 1 у ф ( 4 Ч с€Р\О Т-1 Согласно теореме 9.ХП характер ф® поля Q выражается через его мультипликативные характеры с помощью сумм Гаусса где суммирование проводится по всем мультипликативным характерам X поля Q. Тогда Е ^Q(cWi) = ^ггт Е G&' ^Q) Е 0 Ч 0 г=0 Если х(0) ф 1, то внутренняя сумма, которая после вынесения общего множителя х(с&) вычисляется по формуле суммы геометрической прог- 358
рессии, равна x(cb)(x(0)T - 1)/(х(б) -1) = 0, поскольку х(0)т = Х(0т) = __ ^е^ _ i Если же х(#) = 1? то внутренняя сумма равна тх(сЬ). Отсюда q Е E х- Последнее равенство получается изменением порядка суммирования с использованием определения суммы G(xP,ipa)- П Доказанное утверждение позволяет получать оценки величины (а) более точные, чем в следствии теоремы 22, а иногда — на- Q ходить точные формулы для значений ии(а). Заметим, что согласно утверждению 14 для некоторого делителя d числа qm — 1 справедли- qm - 1 во равенство т = —. d Читателю предлагается самостоятельно проверить, что в случае d = 1 формула утверждения 23 дает равенства (100). Мы покажем в заключение, как эта формула позволяет рассчитать значения ии(а) в случае d = 2 (заметим, что при этом q нечетно). Т е о р е м а 23. Пусть Р = GF(q), q — нечетно и и — реверсивная ЛРП над Р с неприводимым минимальным многочленом F{x) степени т и периода г = T(F) = Т(и) = (qm — l)/2. Тогда справедливы следующие утверждения: если т — нечетно, то 1 Я если т — четно, то П Пользуясь утверждением 23, мы получим соответствующие выражения для параметров УХи{а) = тии(а). 359
Рассмотрим сначала случай а = 0. Тогда в соответствующей формуле из утверждения 23 используется сумма Гаусса G{xp,^q) относительно тривиального аддитивного характера ^о, и согласно теореме 10 а).XII 3, если Хр — нетривиальный характер, 2 — 1, в противном случае. Характеры х, участвующие в сумме, обладают свойством х(#) = 1? откуда х{®%) — 1> * ^ 0* Таким образом, характер х тривиален на подгруппе (в) индекса 2 группы GF(qm)*. Существует точно два мультипликативных характера поля GF(qm) с указанным свойством: тривиальный характер хе и квадратичный характер г). При этом г)р — тривиальный характер поля Р тогда и только тогда, когда GF(q)* С (б), т.е. q — 1 делит (gm — l)/2. Это условие равносильно тому, что 2 делит (qm — l)/(q — 1) = 9m~"1 + ... + q + 1, т. е. тому, что m — четно. Итак, если т — нечетно, то характер г)р нетривиален, G(r?p, ф0) = 0, и по утверждению 23 Если же т — четно, то характер г\р тривиален, G(7}pjip0) = q — 1, и + rfa Так как gm = I(mod4) при четном m, то ввиду (102) Рассмотрим теперь случай а ^ 0. Если 7П — четно, то характер тривиален, и 1 . _ 2q{ l±Q } 2 360
Если же т — нечетно, то Обозначая е = 0, если q = I(mod4), и е = 1, если q = 3(mod4), получаем с учетом (102) Задачи 1. Пусть и — ЛРП над кольцом R с характеристическим многочленом F(x) степени т. Докажите, что если G(x) € R[x] — унитарный многочлен степени к > т, делящийся на F(x), и ЛРП v £ Lr(G) имеет начальный вектор v(0,k — 1) = г/(0, к — 1), то г? € Lr{F) и v = и. (С помощью этого результата легко строить ЛРП v € Lr(G), у которых минимальный многочлен равен заданному делителю F(x) многочлена <ЭД.) 2. Пусть АШХТП — матрица над коммутативным кольцом R с единицей, а^ Е R(m) и Ага^ = (ui(i),v,2(i),..., um{i))T для г Е No. Докажите, что каждая из последовательностей us = (ws(0), ws(l), ...),s€l, m, есть ЛРП над Д, для которой характеристическим будет любой унитарный многочлен F{x) € R[x] со свойством F(A)a^ = 0^. В частности, таков характеристический многочлен Ха(%) матрицы А. 3. В условиях задачи 2 пусть R — поле, М(х) = M^ai(x) — минимальный многочлен вектора а^ относительно Л, и для s € 1, m Ms(x) = = MUs(x) — минимальный многочлен ЛРП щ. Докажите равенство М(х) = [Mi(гг),... ,Mm(x)]. Приведите примеры, показывающие, что возможны как соотношения: М8{х) ф М(х) для всех s e l,m, так и соотношения М8(х) = М(х) для всех 5Gl,m. 4. Докажите, что для любой ЛРП над кольцом целых чисел существует единственный минимальный многочлен. 361
5. Известно, что и — ЛРП порядка га над кольцом R, и дано 2га знаков этой последовательности: вектор г/(0,2га — 1). Докажите, что многочлен F(x) = хш — frn-\xrn~1 — ... — /о будет характеристическим для ЛРП и тогда и только тогда, когда столбец его коэффициентов (/о, /i,..., fm-i) есть решение системы линейных уравнений и(0) и(1) ... и(т - 1) \ / и(т) \ и(1) и(2) ... и(т) и(т + 1) \ и(т - 1) и(т) ... и(2т - 2) J \ и(2т - 1) J Приведите пример, доказывающий, что по 2т — 1 знакам ЛРП и ранга т ее характеристический многочлен не восстанавливается однозначно. 6. Известно, что и — ЛРП порядка т над полем Р. Докажите, что rang и равен рангу матрицы и(0) и(1) ... и{т -I) \ и\\) и(2) ... и{т) А = \ и(т — 1) и(т) ... и(2т — 2) / i...r \ и равен наибольшему г £ 1, га такому, что Ма I 1 1 ф 0. 7. Найдите минимальный многочлен ЛРП и порядка га над полем Р в следующих случаях: 1 2 3 4 5 Р GF(2) GF(2) GF(5) GF(5) Q m 6 6 5 6 4 и(0,2m - 1) (0 10101001011) (0 10111100010) (0 12344440 0) (10311122000 0) (1112 2 3 4 5) 8. Пусть и — ЛРП над кольцом R с характеристическим многочленом F(x) =:Xm- fm-iX171-1 - ... - /о И /0 0 ... 0 /о е 0 /i 0 е /2 0 0 0 ... е /m_i / 362
— сопровождающая матрица для F(x). Докажите, что для любого г G G No вектор гг(г, г + т — 1) = (гг(г), u(i + 1),..., и(г + т — 1)) имеет вид г/(г,г + т-1) = ?/(0,т-1) • S(F)\ и если еА = (е,0,... ,0)Т, то и(г) = = u(0,m — l)S(F)* • е*. Докажите равенство: Апп(м) = {Н(х) £ R[x]: г/(0,га-1) • H(S(F)) = б}. 9. Пусть г/ — ЛРП над кольцом R с характеристическим многочленом F(x) степени га. Докажите, что идеал Апп(г/) порождается многочленом F(x) и всеми многочленами Н(х) = ho + h\x +... + hm-ixm~1 £ £ R[x], удовлетворяющими условию / и(0) и(1) ... и(т - 1) \ / /ю и(1) и(2) ... и(т) h\ и(т — 1) и(т) ... и(2т — 2) J у /im-i / 10. Докажите, что если г/ — ЛРП порядка т над конечным кольцом R, то идеал Апп(и) в Я[ж] порождается конечным числом многочленов. В случае, когда R = Z/iV, докажите, что идеал Апп(гг) может быть порожден не более чем га+1 многочленами и приведите пример, доказывающий, что эту оценку числа образующих нельзя понизить. (Указание: воспользуйтесь результатом задачи 9 и тем, что множество многочленов Н(х) £ Ann(ti) степени меньшей, чем га, есть подгруппа группы ((Z/N)(m\ +). Для примера рассмотрите ЛРП и над кольцом Z/4 с характеристическим многочленом х — е и начальным вектором и(0) = 2е.) 11. Пусть и — ЛРП над полем Р с характеристическим многочленом F(x) степени га, и известен вектор и (i\,..., г^) = (и (ii),..., и (ifc)). Пусть для s £ l,fc А8(х) = Res(xts,F(x)) — остаток от деления х%в на F(x). Докажите, что по вектору u(i\,..., г&) можно однозначно восстановить начальный вектор и(0, га — 1) ЛРП и тогда и только тогда, когда к > га, и система многочленов А\(х),..., Ak(x) имеет над Р ранг га (как система векторов пространства Р[#]). (Указание: решите задачу двумя способами: 1) покажите, что если А8(х) = aSio + a8iix + ... + а8^т^\хт'~1, то и (г8) = a8iou(0) + ... + aSym-\u(m — 1) для s £ 1, fc, и составьте соответствующую систему линейных уравнений; 2) используя результат задачи 8, составьте систему линейных уравнений и (ii,..., ik) = гг(О, га — 1) • (5(F)ne^,..., S(F)lke^) и воспользуй- 363
тесь тем, что минимальный многочлен вектора е1 относительно матрицы S(F) равен F(x).) 12. В условиях предыдущей задачи покажите, что если Р = GF(q) и rang{Ai(x),..., Ak(x)} = г, то существует ровно qm~r различных ЛРП v Е Lp(F) со свойством v{i\,..., ik) = u(i\,..., ifc). 13. Найдите все возможные начальные векторы линейных рекуррент и € Lp(F) по следующим данным: N^ Р F(x) ц(*1,...,п) 1 GF{2) x3+x + l u(3,5,6) = (1,1,0) 2 GF(2) x3 + x + l м(3,4,6) = (1,1,0) 3 GF(2) xs+x + l w(3,4,6) = (1,1,1) 4 GF(2) xe+x6 + x4+x3 + l гг(1,2,4,5,8,10,15) = (0 0 00 0 0 0) Вычислите минимальные многочлены этих ЛРП. 14. Пусть и — ЛРП над кольцом R с характеристическим многочленом F(x) = хт — /т-1Хт~г — ... — /о и генератором Ф(гг), и пусть для каждого г € No Фг(#) = Res(x^(rr),F(x)) — остаток от деления хгФ(х) на F(x). Докажите равенство: т-1 1)--/г/(^^ 8=1 15. Найдите генератор и минимальный многочлен ЛРП и над полем Р с характеристическим многочленом F(x), если F(x) и(0,т-1) 1 GF(2) хв+х2 + х + 1 (1,1,1,0,0) 2 GF(2) x* + x2 + x + l (1,0,0,0,1) 3 GF(2) x5 + x2 + x + l (0,1,0,0,1) 4 GF(5) х4 + 2х3 + Зх2+Ах + 1 (0,1,2,3) 5 ОР(5) х4 + 2х3 + Зх2 + 4х + 1 (0,1,1,3) 6 GF(5) x4 + 2x3 + 3x2 + 4х + 1 (1,2,0,3) 16. Пусть Р = GF(q) и F{x) £ Р[х] — унитарный многочлен степени m с каноническим разложением: F(x) = Gi(x)fcl ..... Gt(x)k\ degGs(x) = ns, для s e M- 364
Докажите, что число ipp(F) линейных рекуррент над Р с минимальным многочленом F(x) вычисляется по формуле: Обратите внимание на то, что это — аналог формулы для функции Эйлера. (Указание: сведите задачу к подсчету числа многочленов Ф(х) Е Р[х] со свойствами deg<fr(#) < m, (Ф(х),^(ж)) = е. Обратите внимание, что это число равно \(Р[х]/ (F(x)))* \, и воспользуйтесь разложением: P[x)/{F(x))*@P[x]/Ga(x)k:) 8=1 17. Докажите, что если F(x) Е R[x] — (единственный) минимальный многочлен ЛРП и Е R°° и F(x) = G(x)-H(x), то G(x) — (единственный) минимальный многочлен ЛРП v = Н{х) • и. 18. Пусть и — ЛРП над кольцом R с характеристическим многочленом F(x) степени т и генератором Ф(х). Докажите, что равенство: LR(F) = {G(x)u: G(x) e R[x],degG(x) < т} выполняется тогда и только тогда, когда (Ф(х),^(х)) = е. 19. Пусть и — ЛРП над кольцом R с характеристическим многочленом F(x) степени т и v = G(x) • и для некоторого G(x) £ R[x]. Докажите, что если (F(x), G(x)) = e, то последовательность и может быть однозначно восстановлена по v, и для этого достаточно иметь вектор v(0,m-l). 20. Пусть в условиях задачи 19 Д — поле, и последовательность и восстанавливается по v однозначно. Докажите, что (G(x),F(x)) = e. 21. Пусть Р = GF(q), F(x) £ Р[х] — унитарный многочлен степени т и G(x) € Р[х]. Известно, что последовательность v получена по закону v = G(x) • и, где и € Lp(F), и дано к знаков ЛРП v: v(i\) = = ai,.. .,v(ifc) = а^. Докаж:ите, что количество различных ЛРП и G Е Lp(F), удовлетворяющих выписанным условиям, равно Qm~r, где ?— ранг системы многочленов Ai(x),..., Afc(rr); As(x) = Res(xtsG(x),F(x)) для s E l,k. При каких условиях для любого набора констант ai,... ...,ajt Е Р существует ЛРП и Е Lp(F), удовлетворяющая заданным равенствам? 365
1 2 3 4 5 6 GF{2) GF{2) GF(2) GF{2) GF{2) GF12) X4 X4 X4 X5 X5 X5 + X + + X + -4— т -4- + X2-\ + X2-\ + X2-\ 1 1 1 -X -x- -X ■f 1 -hi +■ 1 x2- x2- x2- X2- X2- X2n \-x-\ \-x-\ hX-\ hi hi hi hi hi hi 22. В условиях задачи 21 найдите все возможные начальные векторы ЛРП и Е LP(F), если №■ Р F(x) G(x) v(ii,..-,ik) «(1,2,5,6) = (0 0 0 0) v(0,2,5,6) = (0 0 0 0) «7(0,2,4,8) = (1 Oil) v(lf2f3f6) = (llll) t7(0,2,4,8) = (0 10 1) t7(O,4,5) =(0 0 0) 23. Пусть и — ЛРП ранга т над полем Р с минимальным многочленом F{x). Докажите, что для того чтобы последовательность v € Р°° представлялась в виде v = G{x)u для некоторого G(x) £ Р[х] необходимо и достаточно, чтобы она была линейной рекуррентной, удовлетворяющей условию Mv(x) | F(x), и при выполнении этого условия для соответствующего G(x) должно выполняться неравенство degG(x) > >т — rang v. 24. Пусть и — некоторая ЛРП над полем Р, Н(х) Е Р[х] и v = Н(х) х хи. Докажите, что если неприводимый многочлен G(x) £ Р[ж] входит в каноническое разложение многочлена Mv(x) над Р с кратностью к > 0 и кратность G(x) в каноническом разложении Н(х) равна £ > 0, то кратность G(x) в каноническом разложении Ми(х) равна к +£. 25. Найдите минимальный многочлен ЛРП и над полем Р по следующей информации: 2)P = Q, (х- 1)ки = (0,1,2,...), 4) Р = <2F(2), (х + I)2 (х2 + х + 1) и = (0,1,1,0,1,1,...), 5) Р = GF(2), (х + I)2 (х3 + х + 1) (х3 + х2 + 1) и = (00000010000001...), 7) Р = OF(3), (я? 4-1) (ж2 + х + 2) п = (1012202110122021...). 26. Пусть и — ЛРП над полем Р с характеристическим многочленом F{x) = (х — ai)*1*1 • ... • (х — at)kt+1, ai,... ,c*t € Р и аг-^ ay для г т^ j. Докажите, что если разложение гг по биномиальному базису 366
пространства Lp(F) имеет вид: t ks то минимальный многочлен ЛРП и имеет вид: Ми{х) = (я - агГ+1 •...• (rr - где для каждого s Е 1, t = Г -1, если cs,o = csA = ... = cSjfcs = О, s (^ max{jf G 0, ks: cSj Ф 0} в противном случае. 27. Пусть Р — поле, и сг: Р°° —+ Р°° — преобразование, определяемое равенством а(и) = хи. Докажите, что конечномерное подпространство L пространства Р°° инвариантно относительно а тогда и только тогда, когда для некоторого унитарного многочлена F(x) Е Р[х]: L = Lp(F). Таким образом, все сг-инвариантные конечномерные подпространства в Р°° — циклические. (Указание: если и £ L, то и — ЛРП, и при условии Ми(х) = G(x) выполняется включение Lp(G) С L.) 28. Приведите примеры собственных бесконечномерных подпространств в Р°°, инвариантных относительно преобразования а из задачи 27. Докажите, что их бесконечно много. 29. Пусть f(x) G R[x] — многочлен степени &, а Е R и и € Д°° — последовательность вида и(г) = /(г)аг для г G No- Докажите, что и е LR((x - a)fc+1). 30. Докажите, что для любого к Е N последовательность $& G Z°°, определяемая равенствами ^ No, п=0 есть ЛРП ранга А: + 2 и ее общий член выражается в виде полинома от г степени к +1 с коэффициентами из Q. Укажите характеристические многочлены для Sk и указанные выражения для к Е {2,3,4}. Сравните с результатами задачи 11.1. 31. (Задача о размножении кроликов.) Каждая пара зрелых кроликов через месяц рожает новую пару кроликов, которая еще через месяц 367
достигает зрелости. Сколько пар зрелых кроликов можно получить из одной зрелой пары за п лет п G {1,2,3}? 32. Пусть Q — расширение поля Р, и F(x) G Р[х] — унитарный многочлен. Докажите, что Lp(F) = Р°° П Lq(F). Заметьте, что базис ef,..., е£ пространства Lp(F) будет базисом и для Lq(F). 33. Определим произведение последовательностей и и v над полем Р равенством и • v = w G Р°°, где w(i) = гг(г) • v(i) для г G No- Для любого набора подпространств L\,..., Lr из Р°° определим произведение L\ •... .. .• Lr как подпространство в Р°°, порожденное всеми произведениями вида txi •... • гхГ, где и8 G is для s G 1, г. Докажите равенства: + £3) = £1^2 + LiLsy L1L2 = L2L1. 34. Докажите, что для любых унитарных многочленов ...,Fr(rr) над полем Р существует унитарный многочлен F(x) G P[rr] такой, что этот многочлен называется ^ггзб?<жкчг*ей многочленов Fi,... ,Fr и обозначается F(x) = Fi(x)i;...i;Fr(a:). (Укааапгле: покажите, что L = = Lp(Fi) • ... • Lp(Fr) — конечномерное подпространство в Р°°, инвариантное относительно преобразования сдвига а, и воспользуйтесь результатом задачи 27.) 35. Для линейных рекуррент из задач 7, 13, 15 выясните, какие из них являются периодическими и найдите их периоды и длины подходов. 36. Докажите, что период многочлена F(x) — (х — е)2 над конечным кольцом R с единицей равен характеристике этого кольца (т. е. равен ехр(Д,+), или, что тоже самое, порядку элемента е группы (R, +)). Отсюда следует, что (T(F) = |Д|) о (3n G N: R ^ Z/n). 37. Докажите, что если ЛРП и над кольцом J? имеет единственный минимальный многочлен G(x), то она периодична тогда и только тогда, когда для некоторых A G No и t G N выполняется соотношение G(x)\x><(xt — е). При этом наименьшие X и t с указанным свойством суть Л(гх) и Т(и). 38. Элемент с G R называют мультипликатором последовательности и G Д°°, если для некоторого t G N выполняется равенство хги = си. Пусть ЯЯ(и) — множество всех мультипликаторов последовательности и. Докажите, что если 9Я(и) ф 0, то 9Я(и) — подполугруппа полугруппы (Л, •). Приведите пример периодической последовательности и над 368
конечным кольцом, для которой Ш(и) ф 0. Покажите, что если и — чисто периодическая последовательность, то ffl(u) Э е. 39. Пусть и — последовательность над конечным коммутативным кольцом R с единицей, и множество ее мультипликаторов (и) не пусто. Докажите, что: 1) и — периодическая последовательность; 2) и — вырождающаяся последовательность тогда и только тогда, когда Ж(и) Э 0; 3) и — чисто периодическая последовательность тогда и только тогда, когда Ш(и) Э е. (Указание: покажите, что для каждого г € R существует t € N такое, что гг = е — идемпотент, т. е. е2 = е.) 40. Пусть и G R°° — чисто периодическая последовательность с периодом £, удовлетворяющая условию Апп(и) П R = 0. Докажите, что — подгруппа в i?*, и для каждого с Е Ш(и) выполняется равенство сг = е. 41. Пусть и Е R°° — чисто периодическая последовательность. Приведенным периодом или предпериодом и называется наименьшее t £ N, для которого существует с £ R со свойством хги = с • и. Предпериод последовательности и обозначается через Тп(и). Докажите, что если хТп^и = си и Апп(г/) П Л = 0, то Тп(и) |Г(гх), Ш(и) — циклическая подгруппа в R*, порождаемая элементом с, и Т(и) = Гп(гл) • |9Я(г*)| = = Tn(u)-Ordc. 42. Пусть Р = GF(q), и и — ЛРП максимального периода над Р с минимальным многочленом F(x), degF(x) = га. Докажите, что приведенный период и группа мультипликаторов ЛРП и удовлетворяют равенствам: Тп(и) = q ~ , Ж(и) = Р*, a;Vr . w = (-l)mF(0) - и. (Используйте представление ЛРП и с помощью функции "след".) 43. Пусть Р = GF(2) и и е Р°° \ (0) — такая последовательность, что для любого А: € N либо г/ + хки = (0), либо существует £ £ N со свойством и + хки = хеи. Докажите, что либо и = (1 0... 0...), либо и — ЛРП максимального периода над полем Р. 44. Докажите, что если Р = GF(q), то неприводимый многочлен F(x) £ Р[х] степени га является многочленом максимального периода тогда и только тогда, когда выполняются следующие условия: а) (—l)mF(0) — примитивный элемент поля Р; 369
qm - 1 б) для любого простого делителя тг числа N = такого, что q-1 тг f # — 1, справедливо соотношение: 45. Пользуясь методикой, изложенной в § 10, и результатом задачи 44, проверьте, какие из перечисленных ниже неприводимых многочленов F(x) над полем GF(q) имеют максимальный период над этим полем. Вычислите периоды остальных многочленов: GF(q) F{x): GF(2) X4 X4 ж6 ж6 + Ж3 + X2 + 1 + Ж + + Ж + + хъ Л 1 1 -1 GF(3) X2 X2 ж3 ж4 X4 + 1 + ж + 2 + 2ж + 2 + ж + 2 + 2ж + 2 OF(5) ж2 ж2 ж2 ж3 + + + + ж + 2 2ж 2 Зж + + 4 2 GF(7) Ж2 + 1 ж2+ 4 ж2 + ж + 3 46. Докажите, что если F(x) — периодический многочлен над полем Р и его период T(F) делится на некоторое простое число тг Ф char P, то существует неприводимый многочлен G(x) G Р[х] такой, что G(x) \ F(x) и тг | T(G). 47. Пусть Р = GF(q) и £ G N. Докажите, что над Р существует неприводимый многочлен F(x), имеющий период t, тогда и только тогда, когда (g, t) = 1. Покажите, что при условии (#, £) = 1 степени неприводимых многочленов из Р[ж], имеющих период £, равны m = min{A;eN: t\qk -1}. 48. Докажите, что многочлен вида F(xk), к > 1, над конечным полем не может быть многочленом максимального периода. 49. Докажите, что для любого конечного поля Р характеристики р и для любого t E N (t > 2, если р = 2) существует чисто периодическая ЛРП над Р ранга г < t — 1 с периодом t. Приведите примеры, доказывающие, что в общем случае указанная оценка для г не может быть понижена даже при t > 1. Рассмотрите следующие случаи: |Р| 2 3 5 7 t: 3, 5, 11, 13, 19 2, 5, 7, 19 2, 3, 7, 17, 23 2, 5, 11, 13, 17, 23. 370
50. Укажите наименьший возможный ранг ЛРП и над полем GF(q), имеющей период t, и постройте примеры таких ЛРП в следующих ситуациях: q: 2 2 2 2 4 5 5 5 t: 5 10 6 11 9 31 40 248 51. Укажите число различных ЛРП над полем GF(2), имеющих порядок т и период, делящий £, в следующих случаях: т: 45868347 t: 5 5 5 10 10 15 15 15 (Указание: опишите возможные минимальные многочлены таких ЛРП и воспользуйтесь результатом задачи 16.) 52. Пусть F(x) = xm+am^ixm~1+.. .+aix+ao G R[x] — реверсивный многочлен. Двойственным к F(x) называется многочлен F*(x) = F(0)-1xmF f^\ = хт + а^сцх™-1 + ... + а^а^х + % \ Докажите следующие утверждения: б) для любого унитарного G(x) G R[x] условие G(x) | F(x) равносильно тому, что G(x) — реверсивный многочлен и G*(x) \ F*(x); в) многочлен F(x) неприводим над R тогда и только тогда, когда F*(x) неприводим; г) элемент a G R есть корень F(x) тогда и только тогда, когда a G G Л*, и а"1 — корень F*(x); д) если R — поле, и каноническое разложение F(x) над R имеет вид t F(x) = П Gs(z)ks, то каноническое разложение F*(x) над R имеет вид 5=1 S=l е) F(x) — периодический многочлен тогда и только тогда, когда F*(x) — периодический, и в случае периодичности T(F) = T(F*). 53. Пусть и — чисто периодическая последовательность над кольцом R и Т(и) = £. 371
Для каждого г Е No через rt(i) обозначим остаток от деления г на t и определим двойственную к и последовательность и* условием: Vz Е No: и*(г) = u{t - rt(i)). Докажите следующие утверждения: а) если и = (w(0), ге(1), ..., гг(£ - 1), гг(О),...), то и Г(и*) = Т(и); б) реверсивный многочлен F(x) Е R[x] является характеристическим для ЛРП и тогда и только тогда, когда F*(x) — характеристический для ЛРП и*. 54. Реверсивный многочлен F(x) Е R[х] называется самодвойствен- ним, если F*(x) — F(x). Докажите, что неприводимый самодвойственный многочлен F(x) степени т над полем Р = GF(q): а) является многочленом максимального периода тогда и только тогда, когда q = 2 и т = 2 (т. е. F(x) = х2 + х + 1); б) существует тогда и только тогда, когда т — четное число. (Указание: воспользуйтесь результатом задачи 52г).) 55. Вычислите цикловой тип Lp(F) в следующих случаях: F(x) 1 2 3 4 5 6 GF(2) GF(2) GF(2) GF(3) GF(5) GF(5) X4 + X3 + X2 + X + 1 X5 + X2 + X + 1 X6 + X3 + 1 ж5 + Зж3 + x2 + 2x + 1 x4 + 2x3 + 3x2 + 4x + 2 ж3 + Зж + 2 56. Пусть w — конгруэнтная последовательность над конечным кольцом R: w(0) = a, w(i + 1) — cw(i) + Ъ для г € No- Докажите, что T(w) < |Д|, и если с g Л*, то Г(ги) < |Д| - |Л*|, а если с Е Л* и с — е Е Л*, то Т(ги) < |Д*|. Таким образом, для выполнения равенства T(w) = \R\ необходимо выполнение условий с Е Л*, с—е £ Л*. 372
(Покажите, что во втором случае (х — е, х — с) = е, и воспользуйтесь результатами примера 3.) 57. В условиях задачи 56 выведите формулу: w(i) = сга + (е + с + ... + сг~1)6 для г € N и, пользуясь ею, докажите, что если T(w) = |Л|, то b G Л*. (Заметьте, что если Т(ги) = |i?|, то на отрезке последовательности w длины |Л| лежат все элементы кольца J?, и можно считать, что а = 0.) 58. В условиях задачи 56 пусть R = Z/pn, где р — простое и выполнены условия (Ь,р) = 1, с = l(modp), а если р = 2 и п > 2, то с = I(mod4). Докажите, что тогда Т(эд) — рп. Каким будет период последовательности w, если р = 2, п > 3, с = 3(mod4)? 59. В условиях задачи 56 пусть R = Z/N, где N € N. Докажите, что равенство Т(ги) = iV выполняется тогда и только тогда, когда: б) с — 1 делится на любой простой делитель iV, в) А\с — 1, если 4\N. (Указание: используйте разложение R = Z/p™1 ф ... ф Z/p™*.) 60. Вычислите период T(jF) и длину подхода A(F) многочлена F(x) над кольцом R = Z/M в следующих случаях: М: 10 15 30 Fix) Г 37 ~|~ DiC ~\~ 2Я7 ~|~ ЭХ ~\~ О 37 -f~ 637 ~|~ 1437 ~|~ O37 ~|~ О 37 ~f~ 637 ~|~ 1437 ~|~ 2337 -|~ 23 61. Вычислите период и длину подхода ЛРП и G Lr(F) в следующих случаях: R Z/6 Z/10 ж5 + 4ж3 ж5 + 7х4 F{x) + 2х2 + Зх + 1 + 2х2 + 2ж + 1 it(0,m-l) (14140) (13124) (17079) (66141) (61616) 373
62. Постройте многочлен F(x) степени т над кольцом Z/M, имеющий максимально возможный период, и найдите число линейных ре- куррент и G Lr(F), имеющих период T(F), в следующих случаях: М 6 10 15 23 30 т 4,5 4,5,6 3,4,5 2,3 2,3,4 63. Пусть F(x) G R[x] — реверсивный периодический многочлен. Докажите равенство (см. задачи 53 и 54) LR(F*) = {u*:ueLR(F)}. Покажите, что цикловые типы семейств Lr(F) и Lr(F*) равны. 64. Пусть R = Z/pn, р — простое, п > 2, F(x) G R[x) — реверсивный многочлен и T{F) = го- Докажите, что для некоторых I G 1, п и V(x) E G R[x] выполняются соотношения: хТ0 =e+peV(x)(modF(x)), degF(:r) < degF(x), V(x) ^ 0, и в таком случае а) если р£ > 2 или ре = 2, п = 2, то T(F) = т0 • рп~£, б) если р^ = 2, п > 2, то для некоторых £\ G 2, n, Fi(x) G Л[гг] выполняются соотношения: хТо2 = е + 2£lV1(x)(modF(x)), degFi(x) < degF(x), Vx{x) ф 0, и справедливо равенство: T(F) = го • 2n~il+1. 65. Вычислите период многочлена -F(aO над кольцом R = следующих ситуациях: N^ R F{x) 1 2 3 4 5 66. Постройте цом R, если т: 3 Z/2n Z/2n Z/2n Z/2n Z/5n многочлен 4 5 ж5 ж5 ж5 ж5 ж3 -ж-1 - 2ж3 + ж + 1 — 4ж4 + 6ж3 — 4ж2 + ж — 1 - 2ж3 + ж + 3 + 2ж + 1 максимального периода степени m над коль- 2 3 4 2 3 n Z/2n Z/2n Z/3n Z/3n Z/3n Z/5n Z/5n 374
67. Докажите, что если F(x) — многочлен максимального периода над кольцом R = Z/pn, п > 3, то любой унитарный многочлен G(x) Е R[x] со свойством G(x) = F(x)(modp2) также будет многочленом максимального периода над R. 68. Для многочленов из задачи 60 вычислите цикловой тип семейства Lr{F). 69. Вычислите цикловой тип семейства Lr(F) в следующих случаях: R F(x) 1 2 3 4 5 6 7 Z/p» Z/p" Z/5n Z/2n Z/2n Z/10n Z/10n s-(p+l) (* ~ I)2 (ж-2) ж2 + ж + 1 ж2 - ж - 1 (*-7) (х - I)2 70. Опишите цикловой тип семейства Lr{F) в следующих ситуациях: Я F(x) 1 2 3 4 5 6 Z/8 Z/8 Z/2n Z/9 Z/9 Z/36 z2 + ж + 2 ж3 - 2ж2 + re - 1 ж3 — ж - 1 ж3 + 2ж + 1 ж3 + Зж2 + 2ж + 1 ж3 + 27ж2 + 20ж + 19 71. Докажите, что если и — ЛРП максимального периода (рт — ~1)рп~1 над кольцом R = Z/pn, то ее предпериод удовлетворяет равенству: vm — 1 i Ти(и) = ^ --/, 1 < к < п - 1, р-1 причем в случаях р = 2, п > 2 обязательно А; > 2. (Воспользуйтесь тем, что и — ЛРП максимального периода над полем Z/(p), и используйте результаты задачи 42, теоремы 21 и следствия из теоремы 19.) 72. Доказать соотношения (101) для сумм Гаусса 375
73. Пусть Р = GF(q), q — нечетно, и отображение г): Р* —> С* определяется соотношениями , ч __ Г 1, если а Е Р является квадратом, ^ ' "~ \ — 1, в противном случае. Доказать, что 7? — мультипликативный характер поля Р. Он называется квадратичным характером. Доказать, что t] — единственный мультипликативный характер порядка 2, а также единственный нетривиальный мультипликативный характер, тривиальный на подгруппе индекса 2 циклической группы Р*. 74. Пусть г] — квадратичный характер поля GF(q), где q — нечетно. Докажите соотношения (103). 75. Пусть и — реверсивная ЛРП над полем Р = GF(q), ранга т и периода г Е {qm — 1, (qm — 1)/2}, причем q — нечетно в случае г = = (qm —1)/2. Выяснить, насколько точна оценка теоремы 22 в этих двух случаях, т.е. насколько она отличается от точных значений величин vu(o>), указанных в (100) и в теореме 23. 76. Вывести из утверждения 23 формулы (100) для ЛРП максимального периода ранга m над полем GF(q) . 376
Глава XXVI ЛИНЕЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ И ГРАФ ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ КОНЕЧНОГО ВЕКТОРНОГО ПРОСТРАНСТВА Пусть Vp — конечное векторное пространство, т. е. пространство конечной размерности п над конечным полем Р = GF(q). Для произвольного линейного преобразования <р Е £( Vp) и любого вектора a EVp можно построить последовательность a? G V00 вида: d* = (a, rta),..., ¥>'(«),•••)• (1) Определение 1. Последовательность (1) называется линейной последовательностью, порождаемой вектором а и преобразованием (р. П р и м е р 1. Пусть V = Рп — пространство векторов-строк, F(x) = = хп — /п-1Хп~г — ... — /о — многочлен над Р, и <р G £(Рр) — линейное преобразование, матрица которого в единичном базисе е пространства Рр есть сопровождающая матрица для F(x), т. е. /О 0 ... О /о е 0 ... О Ag(<p) = S(F)= 0 е ... О \ 0 0 ... е /n_i / Тогда для любого вектора а = (?х(0),... ,tx(n — 1)) G Pn справедливо равенство <р(а) = aS(F), и линейная последовательность а^ есть последовательность векторов длины п вида: av(i) = </?г'(а) = (w(i),ti(i + 1),... ,u(t + n - 1)) = u(M + n-l), где u — ЛРП с характеристическим многочленом F(x) и начальным вектором гх(О, п — 1) = а. В этой главе дается описание периода и длины подхода произвольной линейной последовательности и изучаются параметры совокупности всех линейных последовательностей, порождаемых данным преобразованием (р. 377
В частности, для случая, когда ср — обратимое линейное преобразование, т. е. подстановка на V, указывается способ расчета цикловой структуры подстановки (р. Из примера 1 видно, что, изучая в предыдущей главе ЛРП над полем Р, мы, по сути дела, изучали частный случай рассматриваемой ситуации (когда Vp пространство, циклическое относительно преобразования ф). 1. Период и длина подхода линейной последовательности Т е о р е м а 1. Пусть V конечное векторное пространство, tp E G £(Vp), и а — вектор из V с минимальным многочленом га<^а(х) = = F(x). Тогда линейная последовательность а^ есть периодическая последовательность и ЛЮ = A(F), Г(а*) = T(F). (2) □ По определению 12.XXV периодичность последовательности оР равносильна существованию параметров Л Е No и t Е N таких, что ) = <р3(а). (3) Последнее условие, очевидно, эквивалентно равенству cpx+t(a) = (рх(а), которое, в свою очередь, равносильно соотношению - е). (4) Так как F(x) — унитарный многочлен над конечным полем, то по теореме 13.XXV он является периодическим, т. е. существуют параметры Л е No и t E N, удовлетворяющие условию (4). Следовательно, а^ — периодическая последовательность. Равенства (2) теперь легко следуют из определений ввиду эквивалентности соотношений (3) и (4). □ Следствие!.. Если в обозначениях теоремы 1 минимальный многочлен преобразования <р есть т^х) = G{x), то для любого вектора а € Vp справедливы соотношения | (5) 378
и существуют векторы a EVp для которых T(a*) = T(G). (6) П Соотношения (5) следуют из (2) и условия F(x)\G(x). В качестве вектора а, для которого выполняются равенства (6), можно выбрать любой вектор а € V со свойством га^а(х) = G(#) (по теореме 11.XV такие векторы существуют). □ Замечание1. Равенства (6) могут выполняться и для такого вектора а €Е V, у которого минимальный многочлен F(x) является собственным делителем многочлена G(x). Соответствующий пример читателю предлагается подобрать самостоятельно. Следствие 2. Если Vp — пространство из qn > 2 элементов, то для любых (р Е £(V) и a G V последовательность а* удовлетворяет условию □ Если F(x) = т^>а(х), то degF(x) = m < п, и по теореме 1 + Т(а(р) = A(F) + T(F). Остается заметить, что по теореме 13.XXV A(F) + T(F) < qm - 1, если qm > 2, и A(F) + T(F) < qm, если qm = 2, причем в последнем случае qm < qn — 1. □ Определение 2. В пространстве V из gn элементов линейная последовательность (1), удовлетворяющая условию Т(а<р) = gn — 1, называется линейной последовательностью максимального периода. Очевидно, что а^ — последовательность максимального периода тогда и только тогда, когда а^би Хф(х) — многочлен максимального периода над Р. При выполнении последнего условия (р — подстановка на V, для которой разложение на независимые циклы имеет вид: § 2. Графы преобразований и их числовые характеристики 1. Наглядно граф можно представить как некоторое множество точек плоскости (вершин), некоторые из которых соединены стрелками (ребрами). Например: 379
Формально граф определяется следующим образом. Определение 3. Графом с множеством вершин Q называется пара объектов Г = (П,Д), где й С О х Q. Множество R называют множеством ребер, или дуг, графа Г. При этом говорят, что (а, Ь) из R есть ребро из вершины а в вершину 6 графа Г. П р и м е р 2. На рисунке изображен граф Г = ({0,1,2,3}, {(0,0), (1,0), (2,3), (3,2)}). В дальнейшем нам понадобятся следующие отношения между графами и операции над ними. Определение 4. Граф Г = (Q', R!) называют подграфом графа Г = (fi, R) и пишут Г' С Г, если ГУ С £1 и Rf С R. Говорят, что граф Г = (Л, R) есть объединение графов Г\ = (Hi, i?i),..., Г* = (£2t, Rt)> если п = пг U ... U ut и R = #i U ... U Rt. Если при этом ut П п5 = 0, то говорят, что графы Г* и Гу не пересекаются. П р и м е р 3. Граф Г из примера 2 есть объединение непересекающихся подграфов: Гх = ({0,1}, {(0,0), (1,0)}) и Г2 = ({2,3}, {(2,3), (3,2)}). Но тот же граф можно представить и как объединение пересекающихся подграфов: Г; = ({0,1,2}, {(0,0), (1,0)}) иГ^ = ({2,3}, {(2,3), (3,2)}), которые изображаются следующим образом: г'г 1 .2 380
Определение 5. Графы Г = (£2, R) и Г7 = (07, R!) называют изоморфными и пишут Г = Г7, если существует биекция т: U —> п' такая, что Va,bGO: (a,6) € Л Ф> (r(a),r(6)) G Я7. Отображение т в таком случае называют изоморфизмом графа Г на Г7. 2. В дальнейшем мы будем предполагать всегда, что О конечное множество, и изучать графы следующего специального типа. Определеннее. Графом преобразования /: О —► £2 множества Q называют граф Г(/) = (fi, i?/), в котором Rf = {(aJ(a):aeU)}. П р и м е р 4. Граф Г из примера 2 есть граф преобразования / q i 2 3 \ f = ( п ^ 9 )ф ^РаФ ^i из примера 3 не является графом преобразования. Не будет графом преобразования, например, и граф Утверждение!.. Произвольный граф Г = (fi, R) есть граф некоторого преобразования /7: Q —> fi тогда и только тогда, когда для каждой вершины а ей существует единственная вершина b G R такая, что (a, b) G Д. □ Соответствующее преобразование / задается условием: /(а) = Ь, если (а, 6) G Д. D Утверждение 2. Граф Г(/7) преобразования /7: П7 —> £}7 лвлл- етсл подграфом графа Г(/) преобразования /: П —> fi тогда и только тогда, когда £У — подмножество множества Q, инвариантное относительно преобразования f (т. е. такое, что f(Q') С П7) г« /|£У = /7. П Если U' С О, /(fi7) С W и /7 = /|П, то для любых a,b e U' справедливы импликации: (a, b) G Rr => /'(а) = 6 =► /(а) = 6 => (а, Ь) G Л/. 381
Поэтому Ry С Л/, и Г(/') — подграф Г(/). Наоборот, если Г(/') с Г(/), то по определению 4 £У С U, Rf> С й/ и по определению 6 для любого а £ Q справедливы импликации: абПЧ (а,/'(а)) е Л/, => (а,/'(а)) € Л/ => /(а) = /'(а) е П'. Следовательно, f(U') сИ'и ДО = /'. □ Утверждение 3. Графы Г(/) г/ Г(/') преобразований соответственно f: п -+ С1 и f: п' -> п' изоморфны тогда и только тогда, когда существует биекция г: Q —» О' гаагсал, 'что Vа Ей: f(r(a)) = г(/(а)) (т. е. г"1 о f о г = /). □ По определению 5 биекция т: п —> Qf является изоморфизмом графа Г(/) на Г(/;) тогда и только тогда, когда V а,ЪеП: (а, 6) е R/О (г(а),г(6)) ЕЛ//, т. е. тогда и только тогда, когда V а, 6 G П: 6 = /(а) 4* т(Ь) = /;(т(а)). Последнее условие, очевидно, равносильно условию на г из формулировки утверждения 3. □ Определение?. Точки a, b G fi назовем связанными преобразованием /: £2 —► fi, или f-связанными, если /г(а) = /^(б) для некоторых i,j G No- В этом случае будем писать а ~ Ь (при этом а ~ а, так как /°(а) = о). Нетрудно видеть, что отношение ~ есть отношение эквивалентности на fi. Замечание 2. Если / — подстановка на Л, и G = (/) — порождаемая ею подгруппа в S(Q), то отношение ~ совпадает с отношением ~, введенным в определении 24.XI. Таким образом, определение 7 есть G обобщение определения 24.XI (для G = (/)) на случай произвольного преобразования /. Определеннее. Граф Г(/) преобразования /: п —> О, называют связным, если любые две его вершины связаны преобразованием /. Заметим, что в частном случае, когда / — подстановка на п, связность графа Г(/) означает, что / — цикл длины |П|. 382
Утверждение^ Для произвольного преобразования /: О —> Q классы Jli,..., Qt, на которые множество О, разбивается отношением ~, инвариантны относительно /. Если fs = f\Qs,s G l,t, то каждый граф Г(/5) связен и r(/) = r(/1)u...ur(/t). (7) □ Так как по определению 7 /(а) ~ а для любого а Е п, то (а G пв) => (/(а) G Пв), т. е. f(Us) С fts. Пусть a,b e Us. Тогда /г(а) = /г(6) для подходящих i,j G No, и так как fa = f\U8, то /](а) = /;?(Ь), т. е. а ~ 6. Следовательно, граф Г(/в) /s связен. Равенство (7) доказывается следующим образом. Для любых а,Ь £ Q включение (a, b) G R/ равносильно условию Ь = /(а). Последнее означает, что а,Ь Еп8 для подходящего 5 G 1, t, и Ь = /в(а), т. е. (а, 6) G i?/s. Следовательно, Л/ = Д/а U ... U Rjt. □ Определение^ В условиях утверждения 3 графы F(/i),..., F(/t) называются компонентами связности графа Г(/). 3. Теперь для описания возможного строения произвольного графа Г(/) достаточно описать его строение при условии, что он связный. Для этого введем следующую классификацию вершин и подграфов графа Определение 10. Вершина а графа Г(/) называется циклической, или регулярной, если Э t G N: /*(а) = а; точкой подхода, если V t G N /*(а) ф а; начальной, если на П не разрешимо уравнение /(ж) = а. Граф называется регулярным, если все его вершины регулярны. Очевидно, что любая начальная вершина в графе Г(/) является точкой подхода, но обратное, вообще говоря, неверно. Регулярность графа Г(/) равносильна биективности преобразования /. п гт^л. к ,/ 01234 \ П р и м е р 5. Граф преобразования / = I . ) имеет вид О 1 383
На рисунке 2, 3, 4 — регулярные вершины графа, О, 1 — точки подхода, О — начальная вершина. Определение 11. Циклом длины t Е N в графе Г(/) = = (fi, Rf) называется любой подграф вида Г(/') = (£У, Д/')> в котором £1' — подмножество множества $7, мощности t, инвариантное относительно /, и /' = /|П — полноцикловая подстановка на £2', т. е. любой подграф вида Очевидно, что вершина а графа Г(/) является циклической тогда и только тогда, когда она принадлежит некоторому циклу в графе Г(/). П р и м е р 6. Граф Г(/) из примера 5 имеет один цикл длины 1 и один цикл длины 2: о Определение 12. Подходом длины £ в графе Г(/) называют любой подграф вида: • —> • —►... —> • —► • п£, (8) в котором ао — начальная точка, ai,,..,a/-i — точки подхода, at — циклическая точка. Если при этом вершина at принадлежит циклу \ / , (9) то подграф (8) называют подходом к циклу (9) из начальной вершины ао, а подграф 384
а0 называют циклом с подходом. Утверждение 5. Если Г(/) — связный граф, то он есть либо цикл, либо цикл с подходами к нему. □ В графе Г(/) есть по крайней мере один цикл. Действительно, если с € Q, то ввиду конечности Q последовательность элементов из Q: периодична. Если А и t соответственно длина подхода и период этой последовательности, то в графе Г(/) есть цикл Из приведенных рассуждений следует также, что любая вершина с Е Я принадлежит либо циклу графа Г(/), либо подходу к циклу. Остается показать, что в графе Г(/) есть лишь один цикл. Действительно, пусть а, 6 — две циклические вершины графа. Тогда /*(а) = а для подходящего t € N, и ввиду связности Г(/) fz(a) = P(b) для подходящих i,j G No- Выбирая А: € N из условия kt > г, получаем равенства а = fkt{a) = /**-*(/*(«)) = /**-'(/'№)) = /**-i+i(6), из которых следует, что а и 6 леясат на одном цикле. □ Важный частный тип графов преобразований описывает Определение 13. Связный граф Г(/) с единственной циклической вершиной а называется деревом с корнем а. Общий вид дерева можно изобразить следующим образом: ... • ••-•• ... V/ о 385
Утверждениеб. Граф Г(/) является деревом тогда и только тогда, когда он имеет единственную циклическую вершину. □ Так как по утверждениям 4 и 5 число компонент связности графа Г(/) не превосходит числа его циклических вершин, то граф с единственной циклической вершиной связен и удовлетворяет определению 13. □ Непосредственно из утверждений 4 и 5 следует Теорема 2. Граф Г(/) произвольного преобразования f конечного множества П есть объединение конечного числа попарно не пересекающихся циклов с подходами. Очевидно, что в случае, когда граф Г(/) реверсивен (т. е. / — подстановка на £2), утверждение теоремы 2 эквивалентно утверждению теоремы 17.XI о разложении подстановок в произведение независимых циклов. 4. В дальнейшем мы будем изучать следующие числовые характеристики графов преобразований. Определение 14. Цикловым типом графа Г(/) преобразования / конечного множества п (или просто цикловым типом преобразования /) назовем многочлен над Z вида в котором Cj' — количество циклов длины t в графе Г(/). Очевидно, что в случае, если / — подстановка на п, то цикловой тип / есть лишь другая форма записи цикловой структуры /. Отметим, что цикловой тип графа Г(/) не определяет его однозначно с точностью до изоморфизма, поскольку в С/ (у) нет информации о подходах к циклам. Очевидно, что цикловые типы изоморфных графов равны. Обратное утверждение, вообще говоря, неверно. Однако если / и д — подстановки, то Для нереверсивных графов важны следующие характеристики. Определение 15. Расстоянием от вершины с графа Г(/) до цикла этого графа назовем параметр А/(с), равный наименьшему £ Е No такому, что fe(c) — циклическая вершина. Степенью вершины 386
с в графе Г(/) назовем общее число сг/(с) дуг, входящих в вершину с и выходящих из нее. гт п т, , * ,/ 0123456 \ П р и м е р 7. Граф преобразования /=( , oo44fic ) имеет вид Его числовые характеристики таковы: А/(0) = 3, А/(1) = А/(2) = 2, А/(3) = 1, А/(4) = А/(5) = А/(6) = 0; <т/(0) = а/(2) = 1, а/(3) = а/(4) = 3, оу(1) = <т/(5) = «7/(6) = 2. Отметим, что в графе произвольного преобразования /: Q —* Q из любой вершины cG fl выходит ровно одна дуга, поэтому число дуг, входящих в с, равно сг/(с) — 1, и начальные вершины характеризуются равенством 0"/(с) = 1. Циклические вершины характеризуются равенством Л/ (с) = 0. Очевидно, что для любой вершины сей длина подхода последовательности с, f(c),..., f (с),... равна А/(с), а ее период равен длине соответствующего цикла в графе. § 3. Декартово произведение графов преобразований и его числовые характеристики 1.Определение 16. Пусть /j: fij —► $7$, i G 1, к, преобразования конечных множеств. Их декартовым произведением называют преобразование / = /i х ... х fk множества fi = £2i х ... х fi^, определяемое условием ..., ак)) = 387
В этом случае граф Г(/) называют декартовым произведением графов Г(Л),..., Г(Л) и обозначают: Г(/) = Г(Д) х ... х Г(Д )• Пример8. Пусть /i и /г — преобразования множеств ui = {0,1,2} и U2 = {0,1,2,3}, описываемые графами, соответственно Тогда граф Г(/х) х Г(/г) имеет вид (0,2) Ml, 3) (0'0) / \ .(0,1) 1) ► (2, 2) (1. 2) -»- (2,1)+— (1,0) (2,0) (0,3) ►(1,4)^ (2,3) Теорема 3. При обозначениях из определения 16 пусть Г(/) = = F(/i) х... х Г(Д) и а = (ах,..., а&) G п. Тогда справедливы свойства: а) Л/(а) = uiBx{Xf1(ai),..., Ад (а&)}, в частности а — чглклг^'ческал вершглка в Г(/) тогда и только тогда, когда щ — циклическая вершина в Г(/г) для г е ТД; б)а/(а) = 1 + (а/1(а1)-1)-(а/2(а2)-1)-...-(сгд(аА;)-1), в частности а — начальная вершина в Г(/) тогда и только тогда, когда хотя бы одна ее компонента щ — начальная вершина в Г(/ё); в) С/(у) = С/а(г/) *... *Сд (у), где * — операция композиции цикловых типов (определение 20.XXV). □ Доказательства утверждений а) и б) предоставляются читателю в качестве упражнений. Доказательство утверждения в) проводится с помощью тех же рассуждений, которые использовались в доказательстве теоремы 17.XXV. □ Полезно заметить, что если Д: Q\ -+ ui единственное преобразование одноэлементного множества fii = {а}, то граф Г(/х) имеет вид: 388
и для любого преобразования /г: ^2 —> ^2 граф Г(/х) х Г(/2) — изоморфен Г(/2). 4. Параметры графа линейного преобразования 1. Пусть ср — линейное преобразование пространства Vp размерности п, и \Р\ = q. Опишем сначала некоторые общие свойства графа Т((р). Теорема 4. а) Если rang <р = г, то в графе Т((р) существует ровно qn — qr начальных вершин, а степень каждой неначальной вершины равна qn~r +1; б) в графе Т{ф) расстояние А^(а) от вершины а до цикла и длина t этого цикла удовлетворяют равенствам ) = Л(т^,а(ж)), t = Т(т^а(ж)); в) граф Г(<р) является деревом тогда и только тогда, когда х<р(х) = □ а) Множество начальных вершин графа Г((р) есть, очевидно, V\p(V) и \V\<p(Y)\ = \V\ - \ip(Y)\ = qn- qr. Если а € (f(V), то число дуг, входящих в вершину а, равно \tp l{ot)\ = б) Параметры Л^(а) и t равны соответственно длине подхода и периоду последовательности оР, поэтому нужные равенства следуют из теоремы 1. в) Вершина в является циклической в любом графе Г (у?) (она принадлежит циклу длины 1). Поэтому согласно утверждению б граф Г((р) — дерево тогда и только тогда, когда в — его единственная циклическая вершина, т. е. тогда и только тогда, когда любой вектор a G V удовлетворяет условию ц>х<е(а\а) = в (см. определение 13). Последнее, очевидно, равносильно тому, что минимальный многочлен каждого вектора а имеет вид х£, т. е. х<р(х) = хп. D 389
П р и м е р 9. Пусть Хч>{х) = тп^(х) = хп- Тогда Г(<р) — дерево с корнем в, и так как rangip = п — 1, то в Г(<^) существует ровно дп — qn~l начальных вершин; в каждую неначальную вершину входит ровно q дуг, и расстояние от каждой начальной вершины до корня в равно п. Множество начальных вершин этого графа есть множество всех векторов a G L со свойством mVja(a;) = хп. Дерево с описанными здесь числовыми параметрами назовем деревом типа Dg(ri). 2. Дальнейшее уточнение строения графа Т((р) основано на следующих результатах. Теорема 5. Пусть пространство Vp раскладывается в прямую сумму подпространств, инвариантных относительно преобразования 1,2, и пусть (р3 = ср V8, 5 6 1,2. Тогда □ Каждый вектор а € V однозначно представляется в виде а = = ai + с*2? где ai 6 V^, с*2 6 1£. Поэтому отображение т: V —► Vi x V£ по правилу т(а) = (ai,a2) есть корректно заданная биекция. Остается заметить, что для любых а, /3 Е V справедливы импликации (а,/3) eR(p^f3 = <р{а) & (А и потому согласно определениям 5 и 16 г — изоморфизм графов Г((р) и ГЫ х Г(^а). П Теперь вспомним, что согласно утверждению 5.XVI пространство Vp раскладьгоается в прямую сумму циклических относительно преобразования ip подпространств: F = Ki+...+VJfe, (10) т. е. подпространств V3, инвариантных относительно (р, и таких, что преобразование <ps = (p\V3 удовлетворяет условию x<pa(x) = m(pa(x)- Более того, разложение (10) можно выбрать так, что либо Х<ра(х) ~ хП*-> либо Х(рз "~ реверсивный многочлен. В таком случае по теореме 5 390
и с учетом примера 9 нам остается научиться описывать строение графа Г(ср) в случае, когда х<^(ж) = т(р(х) = F(x) — реверсивный многочлен. В этом случае по теореме 4 а) граф Т((р) реверсивен, и потому он однозначно, с точностью до изоморфизма, описывается своим цикловым типом Ctp{y). Теорема 6. Если tp такое линейное преобразование пространства Vp, что Хц>(х) = ™>ч>{х) = F(x) — реверсивный многочлен, то цикловой тип графа Т(ср) совпадает с цикловым типом пространства LP(F):C(fi(y)=CF(y). D Рассмотрим преобразование a: Lp(F) —> Lp(F), определяемое правилом: VueLP(F):a(u) = x-u. (11) Как уже отмечалось в главе XXV, а — линейное преобразование пространства Lp(f), и поскольку минимальный многочлен относительно а вектора eF G Lp(F) равен F(x) и degF(x) = dimLp(F), то хЛх) = = та{х) = F(x). D Заметим, что цикловой тип Са(у) графа Г(сг) равен цикловому типу Ср(у) семейства Lp(F), поскольку ввиду (11) очевидно, что вершины и, v из Lp(F) лежат в графе Г(сг) на одном цикле тогда и только тогда, когда одному циклу в Lp(F) принадлежат последовательности и и v. Остается заметить, что Са(у) = С^(у), поскольку справедлива Лемма. Если матрица преобразования <р Е £(Vp) (в каком-либо базисе пространства V) подобна матрице преобразования ф е £(Wp), то Г(<р) = Г(ф). П Из условия следует, что dimVp = dimWp, и в рассматриваемых пространствах можно выбирать базисы е = (ei,..., еп) и / = (/i,..., /п) так, что Mv) = Af(1>). (12) Зададим отобралсение г: V —> W по правилу Va€V:r(a) = /.a£ (т. е. r(a)i= 4)- (13) Очевидно, что г — биекция, и если (р(а) = /3, то /3i = Ag((p)atg, и в силу соотношений (13) и (12) Ф(т{<*)) = /• Afi-ф) ■ r(a)lf = /• Af(1>)alg = = /• ЛеЧ^)4 = № = тЦЗ) = т(<р(а)). 391
Следовательно, по утверждению 3 г — изоморфизм графа Т(ср) на Г(гР). О Суммируя результаты этого параграфа, молено сформулировать следующее утверждение. Теорема 7. Пусть пространство Vp есть прямая сумма циклических относительно преобразования <р Е £(F) подпространств таких, что для s G l,fc преобразование (pa = <p\Va имеет характеристический многочлен вида Тогда граф Г(<р) изоморфен прямому произведению деревьев типов Dq(£i),...,Dq(£k) и реверсивных графов с цикловыми типами Пример 10. Опишем граф линейного преобразования (р пространства У размерности 4 над полем Р = Z/2, матрица которого в некотором базисе е имеет вид /0011' 110 1 0 0 11 ,0 0 11/ Элементарными преобразованиями находим, что канонический вид матрицы хЕ — Ag((p) есть diag(e, e, ж, х(х2 1)). Следовательно, пространство V есть прямая сумма циклических относительно (р подпространств V\ и V2 таких, что преобразования ips = = <p\V8 удовлетворяют равенствам Отсюда по теореме 7 следует, что граф Г(<^) изоморфен прямому произведению деревьев типов £)2(1)> ^2(1) и реверсивного графа с цикловым типом Сх2+х+1(у) = у 4- у3, т. е. прямому произведению графов 392
\ 1 \w \ о \ / \ / \ Следовательно, граф Т(<р) имеет вид • • • W О ( /л Задачи 1. Вычислите длину подхода и период линейной последовательности av, порождаемой вектором а = (0,..., 0,1)т G Р^ и преобразованием tp: р(п) _^ р{п) с матрицей ( 1 О 0 1 О 0 \ О О о О О 1 1 0 0 1 в следующих ситуациях: Р: GF(2) GF{2) GF{2) GF(3) GF(5) n: 3 4 5 4 3 2. В условиях задачи 1 опишите графы T(ip). 393
3. Опишите с точностью до изоморфизма все возможные графы линейных преобразовании (р: р(п) —► Р^ при условиях: Р: GF{2) GF(2) GF(2) GF(3) GF(3) GF(S) n: 2 3 4 2 3 2 4. Вычислите экспоненту и максимальный порядок элемента группы GL(m,pl). 5. Пусть Л — конечное коммутативное кольцо с единицей е и ^: R(m^ —> i?(m) — аффинное преобразование, определяемое условием V^E i?(m): ф(а1) = Аа1 + (З1, где A G Rmym, b^ € R(m\ Докажите, что граф Г(^) изоморфен подграфу графа Г((р) линейного преобразования (р: Д(т+1) -^ Jj(m+1), определяемого условием 6. Пусть Р = GF(q), a E P(m) и ^: Р^ -> Р^т) — аффинное преобразование. Докажите, что последовательность а^ = (а, ^(а)^2(а),...,) удовлетворяет условию Л(а^) + Г(а^) < qm — 1. 7. Вычислите экспоненту и максимум порядков элементов группы АСЬ(т,рг). 394
УКАЗАТЕЛЬ ИМЕН Батлер М. Безу Э. Берлекэмп Е. Р. БернсавдУ Бернулли Д. Бессель Ф. В. БуняковскийВ. Я. Виноградов И. М. ГалуаЭ. Гамильтон У. Гаусс К. Ф. Гильберт Д. Глизон А. Н. ГрамИ. 122174 Грассман Г. ДикУ Диксон А. Л. Диофант Евкщц ЖорданК КамловскийО. В. Канторович Л. В. Клейн Ф.Х. Кэши О. Л. Кронекер Л. Куприянов А. В. 224,225,237 62,85 227 277,280,283,289 292 132 115,129,131 353 218 62,63,77 216,353,356,357, 358,360,375 292 236 130,137,150,161 22 244 158 292 114 100,286,290 352 32 269 75,115,129,131 355 225 Куракин В. Л. 352 КэлиА. 62,63,77,238,273 Лагранж Ж. Л. Лаплас П. С. ЛюкаЕ. Марков А. А. МатиясевичЮ. В. МатьеЭ.П. Мёбиус А. Ф. Мерсенн М. Минковский Г. Муавр А. МэршР.В. Ньютон И. ОрэО. Парсеваль М. А. Пифагор Сильвестр ДД 264 57,89 292 292 292 286 230,231 236,333 31,39,41 292 236 348 236 132 116 125,160,163 Тице X. 251-256,259,262,272 Фибоначчи (Леонардо Пизанский) 292 Фробениус Ф. Г. Цирлер Н. Чебышев П. Л. Шварц К. Г. А. ШтейницЭ. 94 235 292 115,129 216 Эйлер Л. 194,237,284,292,332,365 ЭрмитШ. 128 395
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аннулятор последовательности Базис геометрически нормальный —пространства циклический ЛРП биномиальный —семейства ЛРП —системы векторов Блок группы подстановок Вектор —начальный ЛРП —неотрицательный —нормированный —собственный линейного преобразования матрицы Векторы ортогональные Вершина графа циклическая (регулярная) начальная Генератор ЛРП Гомоморфизм векторных пространств —колец Гомотетия Граф —преобразования —связный —регулярный Графы изоморфные Группа абстрактная —биективных аффинных преобразований —дробно линейных 302 преобразований поля 285 —диэдра 238 144 —подстановок импримитивная 286 10 кратно транзитивная 282 72 fc-транзитивная 282 307 примитивная 286 295 регулярная 279 9 точно ^-транзитивная 282 286 унипримитивная 288 6 —полная афинная 283 293 — проективная линейная 285 33 —свободная 250 118 абелева 264 Группы подстановок 56 подстановочно изоморфные 277 105 Декартово произведение 116 преобразований 387 380 графов 388 383 Дерево 385 383 Делители инвариантные 301 полиномиальной матрицы 89 Дизъюнкция многочленов 368 44 Длина вектора 115 182 — группы в заданной системе 45 образующих 266 380 — подхода в графе 384 381 последовательности 319 382 — слова в заданном алфавите 240 383 —цикла в графе 384 381 ЛРП 334 242 Дополнение ортогональное к подпространству 119 271 Жорданова клетка 100 —матрица 101 396
—форма матрицы 102 Задание группы 247 Заюн инерции Сильвестра 160 —рекурсии 293 Замена переменных невырожденная 154 Замыкание алгебраическое поля 216 Значение собственное линейного преобразования 56 матрицы 105 Идеал кольца 172 главный 175 максимальный 193 несобственный 173 порожденный подмножеством 174 простой 193 собственный 173 Идемпотент 194 Изометрия евклидовых пространств 127 Изоморфизм векторных пространств 16 —графов 381 Индекс инерции квадратичной формы 162 Клетка жорданова 100 Кольцо вычетов кольца многочленов 180 —главных идеалов 175 —линейных преобразований 51 —неразложимое 187 —полиномиальных матриц 60 —простое 176 —разложимое 187 —характеристики нуль 171 Композиция многочленов 336 Компонента связности графа 383 —элемента кольца 188,341 Конгруэнция на кольце 178 Матрица в нормальной форме 92 —в геометрически нормальной форме 144 —в первой нормальной форме 93 —во второй нормальной форме 95 —Грама 122 —дважды стохастическая 105 —жорданова (в жордановой форме) 101 —задания абелевой группы 258 —каноническая полиномиальная 86 —квадратичной формы 153 —квазидиагональная 64 —линейного отображения 48 преобразования 51 в геометрически нормальной форме 144 —неотрицательная 105 —неприводимая 74 —неразложимая 96 —нормальная 149 —ортогональная 124 —перехода от базиса к базису 20 —положительная 105 —полураспавшаяся 57 —приводимая 74 —распавшаяся 64 —регулярная 107 —симметричная 113 —сопровождающая многочлена 73 —стохастическая 105 —унитарная 130 —характеристическая 56 —эрмитова 128 397
Матрицы подобные 53,54 Минор матрицы главный угловой 125 Многообразие векторного пространства 27 Многообразия ортогональные 119 Многочлен, аннулирующий линейное преобразование 60 матрицу 60 —двойственный 371 —максимального периода (примитивный) над кольцом вычетов 347 конечным полем 332 —минимальный вектора относительно линейного преобразования 65 линейного преобразования 63 ЛРП 301 матрицы 63 элемента над полем 206 —периодический 324 —реверсивный 324 —самодвойственный 372 —характеристический линейного преобразования 57 ЛРП 293 матрицы 56 Многочлены, взаимно простые над кольцом 305 Множители инвариантные полиномиальной матрицы 90 Мультипликатор последовательности 368 Неравенство Бесселя 132 —Бу няковского 131 —Коши 131 —Коши-Бу няковского- Шварца 115,129 —треугольника 115,130 Норма вектора 115 —последовательности над примарным кольцом вычетов 349 —элемента примарного кольца вычетов 349 Нуль векторного пространства 6 Область целостности 193 Обращение теоремы Лагранжа 264 Объединение графов 380 Ограничение линейного преобразования 70 Операция внешняя 5 Отношение эквивалентности ЛРП над конечным кольцом 334 Отображение линейное векторных пространств (гомоморфизм) 44 —скалярное (гомотетия) 45 Период многочлена 324 —последовательности 319 приведенный (предпериод) 369 Подграф 380 Подкольцо несобственное 167 —порожденное подмножеством 170 —собственное 167 Подполе 195 Подпространства ортогональные 119 Подпространство векторного пространства В —инвариантное относительно линейного преобразования 69 —корневое 78 —несобственное В —порожденное системой 398
векторов 14 —реверсивная 322 —собственное 13 —Фибоначчи 294 —циклическое относительно —чисто периодическая 322 линейного преобразования 72 Предел последовательности Подслово слова 240 матриц 106 Подход в графе 384 Представление группы левое Поле, алгебраически замкнутое 216 регулярное 274 —Галуа 218 подстановочное 273,276 —простое 196 точное 273 —разложения многочлена транзитивное 273 надполем 213 правое регулярное 274 минимальное 214 Представления группы —рациональных функций 200 подстановочно эквивалентные 278 —частных кольца 197 Преобразование векторного Полугруппа слов 240 пространства линейное 50 Порядок ЛРП 293 обратимое 51 —элемента аддитивный 171 — евклидова пространства мультипликативный 221 изометрическое 135 Последовательность над кольцом 293 нормальное 139 —биномиальная 303 ортогональное 138 сбалансированная 307 самосопряженное 135 —вырождающаяся 322 сопряженное к данному —двойственная 372 преобразованию 134 —конгруэнтная 294 унитарное 138 —линейная 377 —переменных невырожденное 154 максимального периода над —слова элементарное 241 примерным кольцом вычетов 352 —Тице 251 над векторным Проблема равенства слов 271 пространством 379 Прогрессия арифметическая 293 рекуррентная (ЛРП) 293 —геометрическая 293 максимального периода Проекция вектора ортогональная 120 над полем 330 Произведение графов над кольцом вычетов352 преобразований декартово 388 —матриц сходящаяся 106 —слов 240 —периодическая 319 —векторов скалярное 114,129,131 —порожденная — многочлена на вектором и преобразованием 377 последовательность 295,297 399
Пространства векторные изометричные изоморфные Пространство векторное бесконечномерное конечное конечномерное —евклидово вещественное 127 16 5 18 377 18 131 114 комплексное (унитарное) 129 Процесс ортогонализации системы векторов 118 Равенство Парсеваля 132 Разложение каноническое абелевой группы 263 Размерность конечномерного векторного пространства 18 —многообразия 28 Ранг квадратичной формы 155 —ЛРП 301 —свободной абелевой группы 264 Расстояние между векторами 116 многообразиями 121 —от вершины графа до цикла 386 Расширение поля 196 алгебраическое 207 конечное 202 конечной (бесконечной) степени 203 порожденное подмножеством 196 простое 202 трансцендентное 207 Ребро графа 380 Решение опорное системы линейных уравнений 33 Система блоков импримитивной группы подстановок 287 —векторов линейно зависимая (независимая) 7 ортогональная 117 ортонормированная 118 —инвариантов абелевой группы 262 матрицы задания абелевой группы 261 —линейных неравенств 36 однородных неравенств 41 — образующих абелевой группы свободная 264 группы 242 свободная 250 —определяющих соотношений группы 239,247 приведенная 267 Системы векторов эквивалентные 29 —соотношений эквивалентные 243 Скаляр 6 След из поля в подполе 312 — матрицы 140 Следствие системы линейных неравенств 38 уравнений 32 соотношений 241 Слова S-эквивалентные 241 Слово в заданном алфавите 240 —обратное к данному 240 —определяющее 267 —пустое 240 Слой группы в заданной системе образующих 266 Соотношение в группе 246 заданном алфавите 241 приведенное 244 400
тривиальное 241 Составляющая вектора ортогональная 120 Степень вершины графа 386 — подстановочного представления группы 273 —расширения поля 203 Столбец координат вектора 11 Сумма идеалов кольца 174 —прямая 187 —колец прямая (внешняя) 190 —подпространств 15 прямая 15 —последовательностей 295 Теорема Батлера 224 —Берлекэмпа 227 —Гамильтона-Кэли 62 —Грассмана 22 —Дика 244 —Диксона 158 —Минковского 39 —о башне полей 203 —об изоморфизме колец 1 -я 184 2-я 184 образах и прообразах подколец и идеалов 184 эпиморфизме векторных пространств 46 колец 183 —о паре форм 163 —о примитивном элементе 221 —Орэ-Глизона-Мэрша 236 —о соответствии при эпиморфизме колец 184 —Сильвестра 125,163 —Тице 253 —Фробениуса 94 —Цирлера 235 —Штейница 216 Тип конечно порожденной аблевой группы 263 — цикловой графа 386 многочлена 335 семейства ЛРП 335 Точка подхода на графе 383 Точки, связанные преобразованием 382 Угол между векторами 116 Умножение последовательности на константу 295 на многочлен 297 Факгоркольцо по идеалу 180 конгруэнции 178 Факторпространство 26 Форма каноническая полиномиальной матрицы 90 —квадратичная 152 ассоциированная с симметричной билинейной функцией 162 каноническая 156 нормальная 160 отрицательно определенная 164 положительно определенная 162 ——распадающаяся 165 —матрицы жорданова 102 нормальная первая 93 вторая 99 Формула обращения Мёбиуса 231 Формулы преобразования координат 20 Формы квадратичные ортогонально эквивалентные 163 эквивалентные 154 401
Функция билинейная симметричная эрмитова —Мёбиуса —Эйлера 113 128 230 284 Характер поля мультипликативный квадратичный Характеристика кольца Центр кольца 357 171 193 Централизатор подмножества в группе Цикл в графе семействе ЛРП —с подходом Цикловой тип графа преобразования 274 384 334 385 386 семейства ЛРП Число Мерсенна —трансцендентное Ширина группы в заданной системе образующих Элемент алгебраический над полем —примитивный конечного поля —трансцендентный над полем Элементы кольца, сравнимые по идеалу Эпиморфизм естественный векторных пространств колец Ядро гомоморфизма колец —линейного отображения 335 236 206 267 205 221 205 179 45 183 183 45 402
ЛИТЕРАТУРА УЧЕБНАЯ а) Учебники и учебные пособия 1. Алексеев А Б. Теорема Абеля в задачах и решениях. — М.: МЦМНО, 2001. 2. БухштабА. А, Теория чисел. — М.: Просвещение, 1966. 3. Вииберг Э. Б. Курс алгебры. Изд. 3. — М.: Фактория, 2002. 4. Виноградов И. М. Основы теории чисел. — М.: Наука, 1965. 5. Воеводин В. В. Линейная алгебра. — М.: Наука, 1980. 6. Елизаров В. П., Нечаев А. А. Высшая алгебра, ч. ч. I, III. —М., 1976, ч. ч. II, IV.—М, 1977. 7. Ильин В. А., Позняк Э. Г. Линейная алгебра. — М.: Наука, 1984. 8. Калужнин Л. А. Введение в общую алгебру. — М.: Наука, 1973. 9. Кострикин А. И. Введение в алгебру. — М.: Наука, 1977. 10. Кострикин А. И. Введение в алгебру, чч. 1-Ш. —М: Гос. изд. физ.-мат. литературы, 2000; 2002. 11. Кострикин А. И., Манин Ю. И. Линейная алгебра и геометрия. — М.: Наука, 1986. 12. Куликов Л Я. Алгебра и теория чисел. — М.: Высшая школа, 1979. 13. КурошА. Г Курс высшей алгебры. —М.: Наука, 1965. 14. Лидл Р., Пильц Г. Прикладная абстрактная алгебра.—Екатеринбург: Изд- во Урал, ун-та, 1996. 15. Ляпин Е. С, Евсеев А. Е. Алгебра и теория чисел, ч. ч. I, П. — М.: Просвещение, 1974,1978. 16. Мальцев А. И. Основы линейной алгебры. —М.: Гос. изд. техн.-теор. литературы, 1956. 17. ОкуневЛ. Я. Высшая алгебра. —М.: Просвещение, 1966. 18. Скорняков Л А. Элементы алгебры.—М.: Наука, 1980. 19. Скорняков Л. А. Элементы общей алгебры, —М.: Наука, 1983. 20. Узкое А. И. Поля. — М, 1969. 21. Узкое А. И. .Группы и теория Галуа.—М, 1971. 22. Фаддеев Д. К Лекции по алгебре. —М.: Наука, 1984. 23. Шафаревич И. Р. Основные понятия алгебры. —М.; Ижевск: R&C «Dynamics», 2001. 403
б) Сборники задач 1. ИкрамовХ. Д. Сборник задач по линейной алгебре. — М.: Наука, 1975. 2. Ляпин Е. С, Айзенгитсап А. Я., ЛесохинМ. М. Упражнения по теории групп. —М.: Наука, 1967. 3. Проскуряков И. В. Сборник задач по линейной алгебре. — М.: Наука, 1974. 4. Фаддеев Д. К., Соминский И. С. Сборник задач по высшей алгебре. —М.: Наука, 1977. 5. Сборник задач по алгебре (под ред. А. И. Кострикина). — М.: Наука, 1987. 404
ЛИТЕРАТУРА НАУЧНАЯ 1. Биркгоф Г., Борти Т. Современная прикладная алгебра. — М.: Мир, 1976. 2. Ван-дер-Варден Б. Л. Алгебра. — М.: Наука, 1976. 3. ГоренстейнД. Конечные простые группы. Введение в их классификацию. —М.: Мир, 1985. 4. Елизаров В. П. Конечные кольца. — М., 1993. 5. КаргополовМ. К, Мерзляков Ю. И. Основы теории групп. — М.: Наука, 1972. 6. Клиффорд А., Престон Г. Алгебраическая теория полугрупп, т. т. 1,2. — М.: Мир, 1972. 7. Коп П. Универсальная алгебра. — М.: Мир, 1968. 8. КурошА. Г. Теория групп. — М.: Наука, 1944 (изд. 1-е), 1967 (изд. 3-е). 9. Курош А. Г. Лекции по общей алгебре. — М.: Гос. изд-во физ.-мат. литературы, 1962. 10. Кэртис Ч„ РайнерИ. Теория представлений конечных групп и ассоциативных алгебр. — М.: Наука, 1969. 11. ЛамбекИ. Кольца и модули. —М.: Мир, 1971. 12. Лет С. Алгебра. — М.: Мир, 1968. 13. ЛидлР, Нидеррайтер Г. Конечные поля, т. т. 1,2.—М.: Мир, 1988. 14. Линдон Р., Шупп П. Комбинаторная теория групп. — М.: Мир, 1980. 15. ЛяпинЕ. С Полугруппы. — М.: Гос. изд-во физ. маг. литературы, 1960. 16. Магнус В., KoppacA.f СолитэрД. Комбинаторная теория групп. —М.: Наука, 1974. 17. Мальцев А. К Алгебраические системы. —М.: Наука, 1970. 18. Ольшанский А. Ю. Геометрия определяющих соотношений в группах. — М.:№ука,1989. 19. Плоткин Б. И. Группы автоморфизмов алгебраических систем. — М.: Н^ка, 1966. 20. Погорелое Б. А. Основы теории групп подстановок. — М., 1985. 21. Прасолов В. Многочлены. —М.: МЦНМО, 1999. 22. Фукс Л. Бесконечные абелевы группы, т. т. 1,2.—М.: Мир, 1974,1977. 23. ХоллМ. Теория групп. —М.: ИЛ, 1962. 405
ОГЛАВЛЕНИЕ Предисловие 3 Глава XIII. Векторные пространства 5 § 1. Определение векторного пространства. Базис пространства 5 § 2. Подпространства векторного пространства ... 12 § 3. Изоморфизмы векторных пространств 16 § 4. Конечномерные пространства 17 § 5. Подпространства конечномерного пространства 20 § 6. Факторпространства и многообразия 25 Задачи 29 Глава XIV. Системы линейных неравенств 31 § 1. Некоторые свойства систем линейных уравнений 32 § 2. Системы линейных неравенств и сведение их к системам линейных уравнений 35 § 3. Критерий совместности системы линейных неравенств 38 § 4. Системы однородных линейных неравенств . . 41 Задачи 42 Глава XV. Линейные преобразования векторных пространств 44 § 1. Линейные отображения векторных пространств 44 § 2. Линейные преобразования векторных пространств 50 § 3. Собственные векторы, собственные значения и характеристический многочлен линейного преобразования 55 § 4. Многочлены, аннулирующие преобразование. Минимальный многочлен 59 § 5. Минимальный многочлен вектора относительно линейного преобразования 65 § 6. Инвариантные подпространства. Циклические подпространства 69 § 7. Разложение пространства в прямую сумму инвариантных подпространств 75 Задачи 80 406
Глава XVI. Подобие матриц над полем 82 § 1. Критерий подобия матриц над полем 82 § 2. Каноническая форма полиномиальной матрицы 86 § 3. Нормальные формы матриц над полем 92 § 4. Жордановы матрицы 100 § 5. Стохастические матрицы 105 Задачи 111 Глава XVII. Евклидовы пространства 113 § 1. Евклидово вещественное пространство 113 § 2. Ортогональные системы векторов, ортогонализа- ция 117 § 3. Ортогональные подпространства. Ортогональное дополнение. Расстояние между многообразиями 119 § 4. Матрица Грама системы векторов. Описание всех скалярных произведений 122 § 5. Изометричность евклидовых пространств . . . 127 § 6. Евклидово комплексное (унитарное) пространство 128 Задачи 131 Глава XVIII. Линейные преобразования конечномерных евклидовых пространств 134 § 1. Преобразование, сопряженное к данному. Самосопряженные и изометрические преобразования . 134 § 2. Нормальные преобразования 139 § 3. Свойства самосопряженных преобразований . . 145 § 4. Свойства изометрических преобразований . . . 146 Задачи 149 Глава XIX. Квадратичные формы 152 § 1. Общие свойства квадратичных форм. Канонический вид 152 § 2. Квадратичные формы над полями действительных и комплексных чисел 159 Задачи 164 Глава XX. Элементы теории колец 167 § 1. Подкольца и операции над ними 167 § 2. Характеристика кольца 171 § 3. Идеалы и операции над ними 172 § 4. Простые кольца 176 § 5. Конгруэнции и идеалы колец. Факторкольца . 178 407
§ 6. Гомоморфизмы колец 182 § 7. Разложение кольца в прямую сумму 187 § 8. Замена подкольца изоморфным ему кольцом . 191 Задачи 192 Глава XXI. Основы теории полей 195 § 1. Подполя и расширения полей 195 § 2. Поля частных 197 § 3. Простые поля 202 § 4. Классификация расширений поля 202 § 5. Простые расширения полей 207 § 6. Поля разложения многочлена 212 Задачи 216 Глава XXII. Конечные поля и многочлены над ними 218 § 1. Основные свойства конечных полей 218 § 2. Неприводимые многочлены над конечными полями 221 § 3. Критерий неприводимости многочлена над конечным полем 223 § 4. Число неприводимых многочленов данной степени 230 § 5. Некоторые методы построения неприводимых многочленов над конечным полем 232 Задачи 236 Глава ХХШ. Задание групп образующими элементами и определяющими соотношениями 238 § 1. Общая конструкция группы, заданной образующими элементами и определяющими соотношениями 240 § 2. Задание произвольной группы системами образующих элементов и определяющих соотношений 246 § 3. Переход от одного задания группы к другому заданию. Теорема Тице 251 § 4. Описание конечно определенных абелевых групп 257 § 5. О ширине и длине конечной группы относительно заданной системы образующих 266 Задачи 270 Глава XXIV. Группы подстановок (дополнение) . . 273 § 1. Подстановочные представления конечных групп 273 § 2. Регулярные группы подстановок 279 § 3. Кратно транзитивные группы подстановок . . . 282 408
§ 4. Примитивные и импримитивные группы подстановок 286 Задачи 290 Глава XXV. Линейные рекуррентные последовательности 292 § 1. Основные определения. Семейство ЛРП с данным характеристическим многочленом и его базисы 293 § 2. Умножение последовательности на многочлен. Генератор ЛРП 297 § 3. Минимальный многочлен и аннулятор ЛРП . . 301 § 4. Соотношения между семействами ЛРП с различными характеристическими многочленами . . . 305 § 5. Биномиальный базис пространства ЛРП над полем 307 § б. Представление ЛРП над конечным полем с помощью функции "след" 312 § 7. Периодические последовательности 319 § 8. Периодические многочлены. Периодичность ЛРП над конечным кольцом 323 § 9. Вычисление периода и длины подхода ЛРП над конечным полем 327 § 10. ЛРП максимального периода над конечным полем 330 § 11. Цикловой тип семейства ЛРП с реверсивным характеристическим многочленом над конечным кольцом 333 § 12. ЛРП над кольцами вычетов 340 § 13. Распределение элементов на циклах линейных рекуррент 352 Задачи 361 Глава XXVI. Линейные последовательности и граф линейного преобразования конечного векторного пространства 377 § 1. Период и длина подхода линейной последовательности 378 § 2. Графы преобразований и их числовые характеристики 379 409
§ 3. Декартово произведение графов преобразований и его числовые характеристики 387 § 4. Параметры графа линейного преобразования . 389 Задачи 393 Указатель имен 395 Предметный указатель 396 Литература учебная 403 Литература научная 405 410
Уточнения к материалам первого тома учебника "Алгебра11 стр. 6 33 57 71 77 83 87 89 93 94 96 98 99 114 125 133 строка: в — сверху, н — снизу 4в 13в 5н Табл. 4 пересечение СТр. Vk и столбца 0 5н бн 4в Зн 5н 4н 2н 8в 16в, 19в 14в 4в 7н Напечатано А. Вилес акп изоморфизмами 0 Б. Адамаром z = 0 = оо + сцк + о>2к Н- ... на т элемент ат <р(тг,т2) = m(mod m) т\а -6и d\a — b (mod 264) R (&*) fzi Следует читать Уайлс Э. А* изоморфными 1 Ж. Адамаром х = 0 = оо + агк + а2к2 + ... HaZ элемент [а]т (р(ггыт2) = 6(mod m) т|ожо — Ъ и d\axo — b (mod 624) R z 411
135 135 138 140 6в Зн Зв 1н А. Г. Вандермонда Р * ...* А *.. .* 141 144 144 151 151 151 151 152 152 156 157 177 181 7н 9н 11н 18в 6н 2н 1н 1в 13в 8н 5в Юн (а, 4в в зна- ( менателе ненулевая А. Rn S" s А41,...,лг Aitl,...,Aitt if*f> € К) R» +(ап + Ьп); пЬп хт~пЬ(х) + .. .)Ь(х)+ ai — ati+i •... • (ац — ап) (Л I) А. Т. Вандермонда pn *.. .* Ai * ... * нулевая pn pn 5' S' ..., Air ■••' Ait Rn " + .. .Щх)+ - ai+i) •... • (an - an) 412
186 7н теоремы 4.IV теоремы 5.IV; 192 Зн ЕЕ (Ыхк)(ЬехеУ) Е Е ((акхк)(Ъехе))' fc>0£>0 192 2н 193 13н ={х- ot)k~lg{x)+ = к(х - а)к-гд(х)+ jgg Jjj fix) = (х Oti)kl . f(x) = f (x Cti)kl 204 Зв »xri*si /п+8" . xri*Sl • • • xTn~*~Sn 205 Юн, 9н :ti,...,tn GNg :(ti,...,tn)GNJ 212 4н, Зн xr£f8n -< и a^+/3n ж^л+5п ^ и <n+^n n n 213 7b 213 225 227 256,257 257 257 258 265 265,266 267 12b 13b 3h 7b, 3b 14b Юн 2н 3b 4h, 3b 18b (Xj Сг Hi ((Л (mi, : <p(a) = e • • • © Gt © • • • © Ht m2,...,mt) £)(3) Я1 0 • • (8) Я4 a 413
269 269 269 269 270 272 287 292 295 296 300 302 303 303 305 308 324 325 14н 13н 12н 12н 12в 12в 8в 8в 13н 1н 1в 11н, 12н 8н 6н 1н 12н 6н слева Зв Dn \Dn\ = |£>з|= и D3 = \D4\ = и DA- (g.h)(a) = h(a) mod pi = 0 ден v[a,h] a Д. Ж. Томпсон П2 Э 0102 Dn Dz = 5"з, a Da = h->g-i9h exp £ < из 186 — парная Din) \D(n)\ = \D(3)\ = и Z?(3) = |£>(4)| = и £>(4)- (ff • ^)(") = 9(") mod gi ф 0 Лея [а, Л] а Дж. Томпсон С(Р1)+...+с?(л -"2, 0102 ^ -"2 £>(3) == S3, a £>(4) ord|< из 1 86 — п-арная 414
Учебное издание ГЛУХОВ МИХАИЛ МИХАЙЛОВИЧ, ЕЛИЗАРОВ ВИКТОР ПАВЛОВИЧ, НЕЧАЕВ АЛЕКСАНДР АЛЕКСАНДРОВИЧ АЛГЕБРА том п Научный редактор Б. А. Погорелое Заведующая редакцией Т. А. Денисова Корректор Е. Н. Клитина Компьютерная верстка М М Королевой, О. Ю. Самариной Издательство «Гелиос АРВ». Издательская лицензия ЛР № 066255 от 29.12.1998 г. 107140, г. Москва, Верхняя Красносельская ул., 16. Тел./факс: (095) 264-44-39, e-mail: info@gelios-arv.ru Адрес в Internet: www.gelios-arv.ru Формат 60x84/16. Объем 26 п. л. Бумага офсетная. Тираж 3000 экз. Заказ № 1490. Отпечатано с готовых диапозитивов в ОАО "Чебоксарская типография №1" 428019, г. Чебоксары, пр. И. Яковлева, 15.