Текст
                    Ё-С-ЛЯПИН, А-Е-ЕВСЕЕб
АЛГЕБРА
ТЕОРИЯ
ЧИСЕЛ

Е. С. ЛЯПИН, А. Е. ЕВСЕЕВ АЛГЕБРА И ТЕОРИЯ ЧИСЕЛ Часть И. ЛИНЕЙНАЯ АЛГЕБРА И ПОЛИНОМЫ Допущено Министерством просвеще- ния СССР в качестве учебного посо- бия для студентов физико-математи- ческих факультетов педагогических институтов MOCICBA «ПРОСВЕЩЕНИЕ» 1978
517.1 Л97 Ляпин Е. С. и Евсеев А. Е. Л97 Алгебра и теория чисел. Ч. П. Линейная алгебра и полиномы. Учеб, пособие для студентов физ.-мат. фск. пед. ин-тов. М., «Просвещение», 1978. 448 с. Настоящая книга является второй частью пособия авторов для студентов пединститутов (первая часть была издана в 1974 г.). Боль- шая часть материала принадлежит отделу математики, называемому высшей алгеброй. Изложение строится на базе теории основных числовых систем, из- вестной читателю из первой части пособия. 60602-844 103(03)-78 28-78 517.1 © Издательство «Просвещение», 1978 г.
ОГЛАВЛЕНИЕ Предислсвие 5 Глава I. Системы линейных уравнений § 1. Элементарный способ решения систем линейных уравнений ... 7 § 2. Координатные векторные пространства....................... 18 § 3. Ранг матрицы ........................................... 28 § 4. Разрешимость систем линейных уравнении.................... 35 § 5. Однородные системы линейных уравнений..................... 43 Глава II. Определители § 1. Понятие определителя ..................................... 48 § 2. Разложение определителей ................................. 58 § 3. Преобразования определителей ............................ 64 § 4. Использование определителей в вопросах линейной зависимости векторов ....................................................... 75 § 5. Решение и исследование систем линейных уравнений с помощью определителей .................................................. 83 Глава III. Системы линейные неравенств § 1. Исходные положения теории линейных неравенств................ 88 § 2. Разрешимость систем линейных неравенств...................... 99 § 3. Неотрицательные решения систем линейных уравнений.......... 105 § 4. Задачи линейного программирования........................... 109 § 5. Теорема двойственности . . ............................... 114 § 6. Симплекс-метод ............................................. 121 Глава IV. Линейные пространства § 1. Исходные понятия теории линейных пространств............. § 2. Линейные выражения систем элементов линейного пространства. § 3- Линейные подпространства ...................... ....... § 4. Изоморфизмы линейных пространств ........................ § 5. Линейные отображения .................................... § 6. Евклидовы пространства .................................. § 7. Ортогональные базисы .................................... § 8. Ортогональные разложения ................................ § 9. Линейные алгебры ........................................ 128 137 140 146 150 157 166 171 175 Глава V. Действия с матрицами § 1. Линейные пространства матриц ............................ 179 § 2 Умножение матриц ......................................... 183 3
§ 3. Деление квадратных матриц .................................. 192 § 4. Определители квадратных матриц ............................. 197 Глава VI. Преобразования § I. Умножение преобразований ................................... 202 § 2. Обратимые преобразования ................................... 208 § 3. Линейные преобразования .................................... 213 § 4. Автоморфизмы ............................................... 223 § 5. Инвариантные подмножества .................................. 232 § 6. Инвариантные подпространства линейных пространств .... 237 Глава VII Комплексные полиномы одного переменного § 1. Комплексные функции ........................................ 249 2. Комплексные полиномы ....................................... 255 § 3. Деление с остатком полиномов................................ 2С2 § 4. Корни полиномов ............................................ 270 Глава VHI. Алгебраические уравнения § 1. Исходные понятия теории уравнений . ....................... 277 § 2. Алгебраические уравнения низших степеней.................... 282 § 3. Разрешимость алгебраических уравнений....................... 291 § 4. Сравнения с одним неизвестным .............................. 297 Глава IX. Разложение полиномов на множители § 1. Кольца полиномов над полем................................ 316 Ь 2. Свойства делимости полиномов ............................... 321 § 3. Неприводимые полиномы ..................................... 333 § 4. Неприводимые полиномы над полем всех комплексных чисел . . 343 5. Неприводимые полиномы над полем всех вещественных чисел . . 347 § 6. Неприводимые полиномы над полем всех рациональных чисел 35Э Глава X. Дробно-рациоиальные функции § 1. Задание дробно-рациональных функций ........................ 357 <> 2. Действия с дробно-рациональными функциями................. 362 § 3. Разложение дробно-рациональных функций на сумму простей- ших ...................................................... 366 § 4. Значения дробно-рациональных функций ....................... 373 § 5. Простые расширения числовых полей........................... ЗэО § 6. Конечные расширения числовых полей.......................... 388 Глава XI- Полиномы от нескольких переменных § 1. Понятие полинома от нескольких переменных................... 392 § 2. Свойства полиномов от нескольких переменных................. 492 § 3. Симметрические полиномы .................................... 413 § 4. Системы уравнений с несколькими неизвестными................ 424 § 5. Результант и исключение неизвестного........................ 432 § 6 Квадратичные формы........................ 438 Литература ........................ 446
Предисловие Настоящая книга является второй частью пособия для студен- тов пединститутов (первая часть: Ляпин Е, С., Е в с е е в А. Е. Алгебра и теория чисел. г1. I. Числа М., «Просвещение», 1974) Большая часть материала принадлежит отделу математики, на- зываемому высшей алгеброй. В основном он распадается на два раздела. Первый посвящен линейной алгебре. Сюда входит теория систем линейных уравнений и связанная с ней теория определите- лей. Теория линейных пространств служит основой рассмотрения систем линейных уравнений. Рассматривается также ряд свойств линейных пространств, представляющих самостоятельный интерес и используемых в других областях математики. Излагаются начала алгебры матриц и общей теории преобразований. Во второй части изучаются полиномы и алгебраические уравнения. Кроме того, затрагиваются некоторые естественным образом примыкающие к этому вопросы теории чисел Излагаемый материал в той или иной степени связан с вопросами, обычно считающимися принадле- жащими к элементарной математике. Он помогает уяснить их более ясно и глубоко. Именно эго определяет во многих случаях выбор точки зрения и подходы к изучаемому материалу. В основе излагаемых теорий лежит теория основных числовых систем. Подразумевается, что она известна. Наиболее подходящим источником для этого, естественно, является первая часть данной книги. Делаются ссылки на ее материал или подразумевается само собой разумеющееся знание читателем соответствующих вопросов. В частности, для основных числовых систем используются обозна- чения, принятые в первой части. Впрочем, надо отметить, что читатель, знакомый с основами теории числовых систем по изложению других каких-либо книг, как правило, не будет испытывать затруднений при чтении настоя- щей книги. Как это было сказано и в отношении первой части, изложение данной второй части не привязано жестко к какой-либо одной опре- деленной программе. Возможны различные варианты построения программы курса алгебры, существенно отличающиеся как выбо- ром материала, так и последовательностью в его изучении, гак же 5
и в отношении способов подхода и точек зрения. Данная книга может быть использована при обучении по различным программам. В ка- честве одного из возможных вариантов имелась в виду программа объединенного большого курса «Алгебра и теория чисел», введен- ного не так давно в учебные планы математических факультетов педагогических институтов. Отбор материала в значительной мере определяется равнением на эту программу, и это объясняет, на- пример, отсутствие в книге некоторых обычных разделов курса алгебры (интерполяция, линейные алгебры и др.). Имея в виду разнообразие и изменчивость программ, авторы предусмотрели возможность перестановки отдельных разделов. Кроме того, можно ожидать, что иногда те или иные разделы, не- сколько более специальные или трудные, не будут вовсе изучаться в той или иной конкретной ситуации. Построение книги предусмат- ривает такую возможность. Разделы, в отношении которых нет уверенности, что они всегда будут изучаться, обособлены так, что на них не опирается изложение основных разделов. Можно надеяться, что книга окажется полезной и в работе учителей математики средней школы. В изложении всякого раздела математики всегда важную роль играют ссылки на предшествующий материал. То, что читатель обычно не в состоянии все время держать в памяти полностью все прочитанное ранее, является обычно источником значительных трудностей при изучении математики. В связи с этим обращается особое внимание на указание того, какие из предыдущих разделоз используются в каждом данном рассуждении. Постоянно делаются соответствующие ссылки. Для этой цели весь текст книги разбит на небольшие кусочки, занумерованные по следующему принципу: X, 3.5 означает пятый пункт третьего параграфа десятой главы. В пределах одной главы при ссылках номер этой главы обычно спускается. Ссылки на первую часть осуществляются в виде: Ч. IV, 2.3 (третий пункт второго параграфа четвертой главы кни- ги Е. С. Лялину, А. Е. Евсеева «Алгебра и теория чисел». Часть I. Числа. М., «Просвещение», 1974). Принятый в книге способ изложения в большой степени основы- вается на многолетнем спыте преподавания в Ленинградском педа- гогическом институте им. А. И. Герцена. Учтен также опыт неко- торых других педагогических институтов и университетов, резуль- таты различных обсуждений и отдельные замечания различных мате- матиков. 3 ряде мест изложение близко примыкает к изложению в книге Е. С. Ляпина «Курс высшей алгебры». Изд. 2-е. М., Учпед- гиз, 1955. Авторы
Г ла на I. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ § 1. Элементарный способ решения систем лилейных уравнений 1.1. Термин «уравнение» встречается в математике на каждом шагу. Ему соответствует весьма широкое и не всегда отчетливо очерченное понятие. Имеются различные подходы к этому понятию. Некоторые виды уравнений рассматриваются уже в школьном курсе математики Изучение уравнений занимает важнее место и в курсах высшей математики. При этом здесь понятию уравнения придается уже значительно большая широта. Появляются так называемые дифференциальные уравнения, интегральные уравне- ния, функциональные уравнения, в которых неизвестными явля- ются уже не числа, а функции. Приходится рассматривать уравне- ния и еще более общей природы, в которых неизвестными являются элементы множеств самого различного характера. Хотя смысл понятия уравнения в общих чертах более или ме- нее ясен, не так просто придать ому достаточную четкость. Пусть дано некоторое множество Л1. Имея в виду то, какую роль оно будет играть у нас з дальнейшем, назовем сто областью значений неизвестного. Пусть также формулировано некоторое свойство Р, которым обладают некоторые из элементов множества М (не исключаются и крайние случаи, когда все элементы из М обладают этим свойством или, наоборот, пи один из элементов им не обладает). Задание свойства Р определяет подмножество М’ с М, состоящее из всех элементов множества М, обладающих свойством Р (как отмечено, возможно, в частности, и Mr = М и М’ = 0). В случае, когда задача состоит в том, чтобы в каком-то смысле в явной форме выявить и описать элементы из АГ, формулировку свойства Р, рассматриваемую как способ задания множества , обычно и называют уравнением. Если ввести какое-либо обозначе- ние для общего элемента из Л1, например х, тс при формулировке Р относительно х элемент х будет называться неизвестным. Про урав- нение говорят, что оно есть уравнение относительно неизвестного х. Смысл сказанного заключается в том, что само задание Р и 7
М, хотя в принципе определяет М’, но иногда непосредственно не дает достаточно ясного представления о том, какие же именно эле- менты составляют М'. Совокупность рассуждений и операций, приводящих к выяснению этого, обычно называют процессом реше ния уравнения Термин «решение» применяется также к самим элементам из М', каждый из которых называется решением (одним из решений) дан- ного уравнения Если a t М' (т. е. элемент а обладает свойством Р), то говорят также, что значение неизвестного х, равное а, представ- ляет собой решение уравнения, что и записывают в виде равенства х — а. Если ЛГ не пусто, то говорят, что уравнение разрешимо. Если М‘ — пустое множество (т. е. уравнение вовсе не имеет решений), то уравнение называют неразрешимым. Надо иметь в виду, что при таком общем подходе к понятию уравнения область значений неизвестного и тем самым природа решений могут быть самыми разнообразными. Вовсе не обязательно, чтобы речь шла о числах. Способ задания свойства Р, определяю- щего М‘, также может быть весьма разнообразным. Он может иметь вид некоторой формулы, состоять в словесном описании и т. п. Важно также помнить, что задание уравнения заключается не только в формулировке свойства Р, но обязательно должно сопро- вождаться указанием на область значений неизвестного. Однако следует указать, что в алгебре больше всего рассмат- ривают уравнения более специального вида и порой ограничивают сам термин «уравнение» более узким смыслом. Об этом будет сказа- но в дальнейшем. 1.2. Пример. Рассмотрим такое свойство чисел: удвоенный квадрат числа равен самому числу. Взяв в качестве области значений неизвестного множе- ство всех целых чисел N', мы получим уравнение. Так как в М лишь одно целое число 0 обладает указанным свойством, то наше уравнение разрешимо и имеет единственное решение. Рассматривая это уравнение, несущественно, запишем ли мы его в виде бо- лее привычной для задания уравнения формулы 2х1 2 = х или ограничимся словесным описанием. Если в качестве области значений неизвестного взять множество всех ра- циональных чисел Q, то задание того же свойства чисел приведет к другому урав- нению (которому соответствует та же самая формула). Это новое уравнение будет разрешимо. Но теперь его решение не единственно. Оно обладает двумя решения- ми: х = 0 и х — —. 2 Взяв в качестве области значений неизвестного множество всех натураль- ральных чисел .V*, мы получим неразрешимое уравнение2. 1 В настоящее время для системы целых чисел широко используется другое обозначение: Z 2 Для системы натуральных чисел широко используется и обезначение N. 8
1,3. Указанному в 1.1 подходу к понятию уравнения может быть дано обоснование, основанное на"некотсрых первоначальных идеях и понятиях современной математической логики. Формулировку свойства Р, о котором шла речь в 1.1, можно назвать высказывательной (пропозициональной) формой относи- тельно множества М. Если вместо х (или другого значка или бук- вы, использованной в формулировке высказывательной формы) под- ставить тот или иной конкретный элемент а из М, то мы получим высказывание, которое или истинно, или ложно. Оно истинно, когда а действительно обладает свойством Р, и ложно, когда а свойством Р не обладает. Например, высказывательными формами относительно множе- ства натуральных чисел являются' «х больше 5», «2х — четное чис- ло», «2х делится на х + 1» и т. п. При подстановке вместо х тех или иных натуральных чисел мы получаем высказывания, которые могут быть или истинными, или ложными. Теория высказываний — исходная, основная часть специаль- ной области математики — математической логики. С ней можно ознакомиться по многочисленным книгам, посвященным математи- ческой логике. О первоначальных свойствах и обосновании поня- тий можно прочитать в книге Л. А. Калужнина «Введение в об- щую алгебру». М., «Наука», 1973. Используя понятие и термин высказывательной (пропозицио- нальной) формы, мы можем понятие уравнения, приведенное в 1.1, трактовать как высказызательпую форму относительно множе- ства М, рассматриваемую с точки зрения задачи об отыскании элементоз из М' cz М, которые превращают данную высказыва- тельную ферму в справедливое (истинное) высказывание, 1.4. При весьма широком подходе к понятию уравнения, рас- смотренному выше, нет нужды давать особое определение системы уравнений с несколькими неизвестными. Тс, что говорится об п неизвестных х1( х2, ..., х„, означает просто, что областью значений неизвестного является множество, элементами которого являются последовательности, состоящие из п элементов. В качестве неиз- вестного тогда оказывается последовательность (xlt х2, ..., х„). Что касается того, задано ли само изучаемое свойство в виде одной формулы (или словесного описания) или в виде совокупности формул, в принципе совершенно не существенно. Обычная прак- тика подчеркивать последний случай термином «система уравнений» удобна и не вызывает возражений. Решение в этом случае записы- вают в виде последовательности элементов (с^, а2, .... ал) или в виде системы равенств: Xj = alt ха = a2, .... хл = aft. С некоторым отклонением от изложенного принципа часто гово- рят о каждом из х1( х2, ..., хп как об отдельном неизвестном. Обыч- но это бывает удобно. Но необходимо твердо помнить, что решением следует называть только последовательность (аъ аг, ..., ага) или 9
систему равенств хх = а1( х2 ~ сс2, .... хп = ап, но не отдельное aft. 1.5. Во всякой теории уравнений того или иного вида всегда важную роль играет понятие эквивалентности уравнений. Пусть даны два уравнения (в частности, две системы уравне- ний), у которых неизвестные обозначены одинаковым способом. Эти уравнения называются эквивалентными или равносильными, если всякое решение каждого из них является решением и для другого, т. е. множества решений этих уравнений .совпадают. Очень часто исследование уравнения и нахождение его решений облегчается тем, что для данного уравнения удается отыскать эк- вивалентное ему уравнение, которое поддается более простому изучению. 1.6. Системой линейных уравнений с п неизвестными xit х2, ..., хп называется система соотношений следующего вида: «1Л + ацх2 4- ... + alrlxn = blt a2lXl 4~ Я22Х2 4" ••• + а2,1ХП ~ ^8» П*6) + ат2х2 + ... 4- атнхп =- Ьт (где аг/, bt — некоторые числа), определяющая в множестве все- возможных последовательностей чисел (an а2,.... ач) такие последова- тельности, для которых в результате подстановки вместо каждого xt соответствующего а, (/ = 1, 2, ..., п) оказываются справедли- выми получающиеся числовые равенства. Таким образом, областью значений неизвестного является мно- жество последовательностей чисел (а1т а2, .... а„). Впрочем, как это было уже отмечено выше, термин «неизвестное» применяют и к отдельному xf. Заданные числа а/;, участвующие в (1.6), называются коэффи- циентами при неизвестных, а — свободными членами. Отметим, что при записи коэффициентов запятая между обоими индекса- ми — i (указывающим номер уравнения) и j (указывающим, при каком неизвестном стоит этот коэффициент) — обычно опускается. Таким образом, а23 означает не а с индексом 23, но а с двумя ин- дексами’ 2 (номер уравнения) и 3 (указывающий, что коэффициент стоит при х3). Решением указанной системы уравнений является такая после- довательность чисел (а,, а2, ..., ап), для которой справедливы равенства, получающиеся из системы уравнений после замены символов X] на аищ + а12а2 + ... + = Ьх, ^21^1 4~ ^22^-2 4~ ••• 4" = b2, fhuP1! 4* йт2а2 4" ••• 4" ^т‘ Решение можно записать также в виде системы равенств; — ОС*, Х% — ССз> • хт — сьп» 10
1.7. Стедует иметь в виду, что в данной и последующей главах, говоря о числах, мы имеем в виду любые комплексные числа. Одна- ко теория по существу не изменилась бы, если бы мы решили огра- ничить себя употреблением лишь чисел из какого нибудь числового поля (например, вещественными числами). 1.8. Причины, по которым системы линейных уравнений особен- но важны, заключаются в том, что необходимость рассмотрения таких систем постоянно встречается как в самой алгебре, так и в тех областях, где алгебра находит свое применение (смежные мате- матические дисциплины: математический анализ, геометрия, а также прикладная математика, физика, геодезия, техника и т. д.). Более подробному и глубокому изучению системы линейных уравнений будут подвергнуты в нашем дальнейшем изложении. Сейчас мы ознакомимся с одним элементарным приемом решения систем, называемым методом последовательного исключения неиз- вестных, а также методом Гаусса, по имени немецкого математика К. Ф. Гаусса (1777—1855), который, помимо ряда чрезвычайно глубоких и плодотворных теоретических исследований, занимался и прикладными численными расчетами. В некоторых из них прихо- дилось иметь дело с системами линейных уравнений. Впрочем, следует отметить, что излагаемый ниже прием решения систем линейных уравнений на самом деле применялся уже и рань- ше, правда, лишь для случая систем, в которых число неизвестных равно числу уравнений. 1.9. Исходными соображениями для рассматриваемого метода являются следующие. Если в исходной системе линейных уравнений заменить одно из уравнений новым, получающимся из него умножением всех членов на одно и то же, отличное от нуля число, то, очевидно, полученная новая система будет эквивалентна исходной. Пусть в исходной системе линейных уравнений (1.6) одно из уравнений заменено новым, которое получается, если к данному уравнению прибавить почленно какое-нибудь другое из уравнений, входящих в систему, умноженное на произвольное число. Если для определенности записи считать, что взяты первое и второе уравнения (в конце концов уравнения в системе, очевидно, можно записывать в любом порядке), то речь идет о переходе от систем (1.6) к повой системе: («п + Xc2J) Xj + (а12 + Ха22) х2 + ... -Ь (а1п + лй2л) хп — bj+Xhg, й21х, + а?2х2 + ... + а2пхп = Ь2, (1.9) ат& + ftm2x2 + ... + атпх„ = Ьт. Легко убедиться, что системы (1.6) и (1.9) эквивалентны. Действительно, пусть (ось аг, ..., а„) есть решение систему (1.6). Подставим в (1.6) вместо знаков неизвестных х числа a.j (j = 1,2, ..., п), получим справедливые равенства. Прибавив И
к первому из этих равенств второе, умноженное па А, получим си- стему равенств, означающую, что (а1( а2, а„) является реше- нием систем!,I уравнений (1.9). Аналогично пусть ф1( р2, (3„) есть решение системы (1.9). Подставим в нее вместо х,- числа Р, (i = 1, 2, ..., п), получаем систему равенств, Вычитая из первого равенства второе, умножен- ное на X, получаем систему равенств, означающую, что (Рх, р2, .... р,;) является решением системы уравнений (1.6). Про переход от (1.6) к (1.9) говорят, как о прибавлении к пер- вому уравнению второго, умноженного на Л. Если А = —А’, то говорят о вычитании из’первого уравнения второго, умноженного на А*. 1.10. Сперва мы должны остановиться на нескольких тривиаль- ных случаях, Возьмем одно произвольное линейное уравнение сххх + с2х2 + ... + спхп = d. Коэффициенты и d в нем могут иметь различные численные значения. В частности, некоторые из них могут равняться нулю, Если сх = с2 = ... = сп = d = 0, т. е. уравнение имеет вид 0 = 0, то, очевидно, всякая последовательность чисел (ах,а2, ...,ая) будет решением такою уравнения. Поэтому изо всякой системы линейных уравнений такое урав- нение, если оно туда входит, можно выбросить. Полученная система будет эквивалентна исходной. • Отметим, что если среди чисел с,, d есть отличные от нуля, то уже не всякая последовательность будет его решением. Действи- тельно, если d Ф 0, то решением не будет последовательность (0, 0, ..., 0). Если d = 0, но какое-то ck=£ 0, то решением не будет, например, последовательность, у которой k-й член равен 1, а все остальные равны нулю. Если сх = с.2 = ... — сп — 0, но d=^= 0, то уравнение 0 =d нс может быть удовлетворено ни при каких значениях неизвестных. Всякая система, в которую входит такое уравнение, будет тем самым неразрешимой. 1.11. Переходим к рассмотрению произвольной системы линей- ных уравнений. При этом благодаря сказанному выше мы можем считать, что в каждом уравнении среди коэффициентов при неиз- вестных есть отличные от нуля. Предположим, для простоты обозначений, что в первом урав- нении ап =/= 0 (разумеется, рассуждения не изменятся, если аи = 0, но какой-нибудь другой аи отличен от нуля; кроме того, всегда можно так перенумеровать неизвестные, чтсбы первым неизвест- ным считалось одно из тех, у которого в первом уравнении коэффи- циент отличен от нуля). Пользуясь преобразованием 1.9 (которое применяем последова- тельно п — 1 раз), вычитаем из каждого i-ro уравнения, начиная 12
со второго (t = 2, 3, m), первое, умноженное на —. Получаем ан систему, эквивалентную исходной: «1Л 4" ^12^2 4” &13Х3 4~ ... 4~ @LnXn = &1, ^£2^2 4* ^23^3 4~ •••4” В ^2’ Язг *2 4“ aj3^3 4“ ••• 4* азп Ха ~ ^з> 041) a'mi *2 + <3^3 + - + ~ Ьт (коэффициенты при хг уничтожаются, так как а„ — — • ап = О, : = 2, 3, ..., /л). Повторим те же преобразования уже для т — 1 уравнений (кроме первого) системы (1.11). Предположив, что О, гы* чтем из каждого i-ro уравнения, начиная с третьего (» = 3, 4, ...,т), второе, умноженное на —2. Получим новую систему, эквивалент- с'22 ную предыдущим: аИ^1 ~Ь ^12-^2 4" Oj3X3 4" ... -J- Пул. хп = Ьу, а'22х2 4- «23^3 4- ... + а'2п хп = Ь2, аЗЛх3 + ... 4- а;13х3 4-... + а;пхп = ь;п. Опять проделаем то же самое преобразование уже для послед- них уравнений. Продолжаем так далее. В процессе таких преобра- зований могут получиться уравнения вида- 0 = 0. Такие уравнения мы просто откидываем согласно сказанному в 1.10. Могут также получиться уравнения вида 0 = d, где d есть постоянная, отличная от нуля. Получившаяся система не может иметь решений. Благодаря эквивалентности в этом случае заключаем о неразрешимости и исходной системы. Если в результате последовательных преобразований не полу- чится «противоречивых» уравнений последнего типа, то после при- менения наших преобразований т — 1 раз (а может быть, в от- дельных случаях и меньшего числа раз) мы получим систему k линейных уравнений (/г т, k /г), эквивалентную исходной и имеющую вид: 13
cnxi 4- Ci2-t2 + с„хя 4- ... + clhxh + ... + clnxn = dY (cu =И= 0), C?2X2 4” ^23-^3 4“ ••• 4“ ^2kXk 4" ••• 4* C&iXn ~ d-2 (С22 0)» ^33Х3 4" ••• 4~ СзкХк "Ь •••4" СзцХП ~ $3 (-33 0)> СПкХк 4~ ••• 4* Скпхп ~ dk =/= ( (В точности такой вид может быть получен изменением нумерации неизвестных: если ее не производить, то может случиться, что запись i-ro уравнения будет начинаться не с члена, содержащего именно х;, но с какого-нибудь другого.) Систему полученного вида называют трапецеидальной, а иног- да (чаще всего при k = п) треугольной. Она разрешима. В случае k = п она имеет единственное решение, в случае k < п количество решений бесконечно. Действительно, придадим неизвестным xh+l, xh+2, •••» хп произвольные численные значения: хк+1 ~ аЛ+1> Xk±2 ак |-2> •••• хп — (если k — п, то таких неизвестных нет). После этого из последнего уравнения найдем вполне определенное значение для xk: хк — ая — -------(df, — • — cknrxrd- ckk Положив xt, — at (i = k, k 4- 1, .... n), из предпоследнего уравнения найдем значение xh_x= аЙЛ. Продолжаем так далее. После того как определятся хг — а2, хз = •••» хп = из первого уравнения найдем значение для хр xi = “1 = — № — ДЛ — • • • — Получившаяся система чисел (ан а2, ..., ая), очевидно, будет решением сцстемы, ибо все уравнения удовлетворяются при этих значениях неизвестных. При k = п решение единственно, ибо все значения неизвестных х получаются вполне определенными. В случае й< п неизвестным xft+1, xh+2, ..., хп можно придавать произвольные численные значения; следовательно, количество всех решений бесконечно. При k < п описанным выше способом может быть получено любое решение (£1( 52, ..., £„) рассматриваемой системы. Действи- тельно, полагая xft+1 = gft+I, xft+2 = ^ft+2, ..., xn = мы получаем треугольную систему k линейных уравнений с k неизвестными х,, х2> •••, xk • Полученная система имеет единственное решение, которое может быть найдено указанным выше способом. 11осколь- ку такое решение единственно, мы неизбежно получим хх = ?1( — ?2> •••> хп ~ 14
1.12. Пример ы. 1) Рассмотрим следующую систему линейных уравне- ний: х4 — х2 ~Н х3 — 2х4 — Зх3 — 2, 2хг + х2 — 2х3 — Зс4 — 5х3 — 4, 3%1 + Зх2 + х3 — Зх4 — 8х3 = 2. Строим для этой системы эквивалентную, вычитая из второго уравнения первое, умноженное на 2, и из третьего — первое, умноженное на 3: *i — х2 + х3 — 2х4 — Зх5 - 2, Зха — 4х3 + х4 -г х6 = О, 6х2 — 2х3 + Зх4 + х5 = —4. Получившуюся систему опять преобразуем, вычитая из третьего уравнения второе, умноженное на 2: Х1 — + х3 — 2х4 — Зх0 = 2, Зх2 — 4х3 4- х4 + х, = О, 6х3 + х4 — х5 = —4. Мы получаем трапецеидальную систему. Общее выражение для решений этой системы (их бесконечное количестве) получится, если мы будем считать, что неизвестным х4 и хь приданы произвольные численные значения: х4 = р, х5 = т. Из последнего уравнения сразу находится выражение для х3: 6х3 + о — т = —4, 1 1 2 3 6^6 3 Подставляя выражения для х3, х4, х0 в предпоследнее уравнение, находим выражение для х2: 4/1 1 2\ 1 1 5 1 8 = + Та~?т = -7а“7т~Т- Наконец, из первого уравнения находим выражение для х4: (е 1 Я \ / 1 1 2 \ —?-7т-?г(_^о + ^-т) + 2о+ 3т + 2 = 29 49 16 = — О + — т + —. 18 18 '9 Таким образом, обшее выражение решения нашей системы имеет вид: 29 49 16 Х1= 18а+18Т+ 9’ 5 1 8 х2 = — да — 9Т—д’ 1 1 2 Хз==-1о + Тт-Т х4 = а, х5 = т. 1S
Если придавать а и т различные численные значения, то будем получать различные конкретные решения нашей системы. Например, при о = 0 и г — 0 получаем решение: При а ~ ) и т = 2 получаем- 1,13. Отметим, что второе из уравнений системы (1.11) в под- робной записи имеет вид: «и1^ + («2з ——«]3^з+ ••• + (агп — — а1П\хп = \ Оц / \ ви ! \ ап ! -=b2-c^bv «и Оно может быть получено также и следующим способом. Нахо- дим из первого уравнения выражение хл через остальные неизвест- ные х2, х3, .... х„; v __ °И flls v а1П v I Л1 — Л2 Л3 • • • лп "Т • °11 °П °11 °11 Подставив во второе уравнение вместо хг это выражение, мы полу- чим для второго уравнения преобразованный вид, как раз совпа- дающий с видом написанного выше уравнения, являющегося вто- рым уравнением системы (1.11). То же относится и к последующим уравнениям системы (1.11). Так же и последующим преобразованиям можно придавать вид или вычитания уравнений, или замен некоторых неизвестных их выражениями через другие неизвестные. 1.14 Среди систем линейных уравнений особое место занимают системы линейных однородных уравнений, называемые также и однородными системами линейных уравнений. Это есть системы линейных уравнений, у которых все свободные члены равны нулю: an*i + а12х2 + ... + с1пхЛ = О, а31Х1 4- а22х2 4- ... + а2пхп = О, ап1х1 + ат2х2 4- ... 4- От„Хп = 0. Такая система всегда разрешима, так как она, очевидно, обладает следующим решением: xL = 0, х2 — 0, ..., х„ = 0. Эго решение называется нулевым. Во многих вопросах пред- ставляет интерес существование ненулевого решения, т. е. такою 16
решения, в котором хотя бы'одно из неизвестных имеет значение, отличное от нуля, 1.15. 1 рапецеидальная система линейных однородных уравне- ний с п неизвестными, состоящая из k уравнений, в случае k = п имеет единственное решение, которое является нулевым. Если k < п, то, как мы знаем (1.11), некоторым неизвестным можно при- давать произвольные значения. Следовательно, в этом случае среди решений системы имеются и ненулевые. 1.16. Методом 1.11 систему линейных однородных уравнений можно привести к трапецеидальному виду. При этом все уравнения полученной треугольной системы опять будут однородными линей- ными (при вычитании из одного однородного линейного уравнения другого однородного линейного опять получается уравнение одно- родное линейное). Числе уравнений получившейся системы не пре- восходит числа уравнений исходной системы, поэтому если их первоначально было меньше п (число неизвестных), то и в полу- чившейся трапецеидальной системе их опять будет меньше п. Отсюда благодаря 1.15 сразу вытекает следующее полезное след- ствие ' Если в системе линейных однородных уравнений число уравнений меньше числа неизвестных, то система, помимо нулевого решения, имеет и ненулевые решения. 1.17. Изложенный нами способ исследования и решения систем линейных уравнений совершенно элементарен. Он вполне применим для рассмотрения несложных систем. Последовательность вычислений может быть оформлена в виде различных схем, и тогда вычисления могут производиться и для сравнительно больших систем с громоздкими коэффициентами. Кстати, потребность в рассмотрении систем линейных уравнений с большим числом уравнений и неизвестных (несколько десятков) нередко встречается в различных прикладных вопросах математи- ки, имеющих значение для решения технических задач. Ввиду большой сложности соответствующих вычислений естественно воз- никает вопрос о выработке наиболее удобных и совершенных вы- числительных методов. Желающим ознакомиться с этими методами можно указать книгу Д К- Фадеева и В. Н. Фадеевой «Вычисли- тельные методы линейной алгебры». М., Физматгиз, 1963 (чтение этой книги можно начать после изучения материала, изложенного в последующих разделах настоящей книги, посвященных линей- ной алгебре). Упомянем, не останавливаясь на этом подробнее, что при техни- ческих расчетах вычисления производятся всегда приближенно с той или иной степенью точности, и тогда возникают специфиче- ские вопросы о степени возможной погрешности и т, п. Что касается теоретических вопросов, то для их исследования рассмотренный выше метод малопригоден, ибо мы не получили каких-либо удобных формул и не вскрыли причин, отчего же зависит, когда система разрешима, а когда нет. Мы имеем только 17
указание па последовательность выкладок, которые можно провести в каждом отдельном случае, но не имеем общей картины и не уло- вили общей закономерности. Это не является случайностью или нашим упущением. Дело в том, что более глубокий теоретический анализ систем линейных уравнений уже не может быть проведен одними элементарными способами. Здесь необходимо введение ряда довольно сложных понятий и сравнительно громоздких рас суждений. Это будет осуществлено в последующем изложении. 1.18 Оканчивая параграф, остановимся на одном важном об- стоятельстве. Пусть все коэффициенты при неизвестных и свободные члены системы уравнений (1.6) принадлежат какому-нибудь число- вому полю Р (Ч. VI, 2.6) (важный случай, когда Р есть поле всех вещественных чисел /?). Приводя нашу систему к трапецеидально- му виду способом 1.11, мы, как легко видеть, получаем систему, все коэффициенты которой опять будут принадлежать к Р. Если эта система имеет единственное решение, то его компоненты, как следует из способа их получения, окажутся числами из Р. Если же количество решений бесконечно, то части неизвестных мы можем придавать произвольные численные значения. Если их брать из Р, то и оставшиеся компоненты получаемого решения также оказы- ваются принадлежащими Р. И количество таких решений будет бесконечно. § 2. Координатные векторные пространства 2.1. Линейное уравнение вполне определяется последователь- ностью, состоящей из коэффициентов при неизвестных и свобод- ного члена (обозначения для неизвестных, очевидно, совершенно не существенны). Поэтому естественно, имея целью дальнейшее изучение систем линейных уравнений, рассмотреть свойства после- довательностей чисел. В первую очередь для этих последовательно- стей мы рассмотрим свойства, связанные с теми операциями, кото- рые соответствую-' использованным в § 1 преобразованиям систем линейных уравнений: умножение уравнений на числа и сложение их. Следует отметить, что изучение последовательностей чисел с точки зрения указанных операций оказывается весьма полезным не только в теории систем линейных уравнений, но и во многих других областях математики как в алгебре, так и за ее пределами. 2.2. Определение. Рассмотрим совокупность всевозмож- ных последовательностей (сп а2> ач)> состоящих из п комплекс- ных чисел. Эту совокупность, рассматриваемую вместе с операция- ми сложения: (аь и2, ..., ап) -|- ((?,. ..., Ь„) = = (й] + Ьх, а2 + Ь2, .... ап + ЬЭ} и умножения на числа А (а1( а2, .... о„) = (Аах, Ка2, .... Аа„), .8
будем называть tv мерным координатным комплексным секторным пространством (или, короче, п-мерным координатным пространст- вом) и обозначать его через Vm. Его элементы, т. е. последователь- ности из п чисел, будем называть п-мерными векторами или коротко п-векторами. (Обычно числовой множитель X в произведении пи- шется слева, но, разумеется, его можно писать и справа: «Л = Х«.) Число п называется размерностью векторного пространства. В обозначении иногда п опускается, если ясно, о каком У(л) идет речь. Обычно компоненты n-вектора записывают слева направо и он приобретает вид строки, состоящей из п чисел: (а1( а2, ..., а„). В некоторых случаях удобно бывает записывать эти компоненты сверху вниз, и n-вектор приобретает вид столбца, состоящего из п чисел: Следует отметить, что в математической литературе для Vm иногда употребляют также название «арифметическое пространст- во». В то же время термину «векторное пространство» придают более широкий смысл (о чем будет сказано ниже). 2.3, В некоторых случаях из всего множества n-векторов У(л> оказывается необходимым выделить векторы, компоненты кото- рых принадлежат той или иной числовой области. В частности, особого внимания заслуживает множество всех н-векторсв, ком- поненты которых вещественны. Такие п векторы часто называют вещественными. Множество их обозначим через V^’. Это мпожест во, рассматриваемое относительно операций сложения и умножения векторов на вещественные числа, называется п-мерным координат- ным вещественным векторным пространством. 2.4. При п = 1, 2, 3 координатные вещественные векторные пространства имеют хорошую геометрическую интерпретацию, которая, в частности, объясняет и употребляемые в общей теории термины. Приходится принимать во внимание, что термин «пространство» употребляется в современной математике в различных смыслах. Понятие пространства, изучаемого в школьном курсе стереометрии и в курсе аналитической геометрии, используемого в курсе мате- матического анализа, соответствует результатам деятельности лю- дей и наблюдениям над окружающим реальным миром. Задача его аксиоматического с пределения сложна, и здесь мы не можем ее даже затрагивать. Мы будем называть его пространством евкли- довой геометрии или трехмерный евклидовым пространством. Соответственно плоскость, понимаемую в обычном смысле, можно назвать двумерным евклидовым пространством. Прямую — од- номерным евклидовым пространством. Впрочем, здесь никакой 19
путаницы не будет возникать и при употреблении терминов «плоскость» и «прямая», поскольку ни в каких других смыслах они не будут употребляться в пределах настоящей книги. Как известно, задание в трехмерном евклидовсм пространстве декартовой системы координат приводит к тому, что между всеми его точками, с одной стороны, и всевозможными тройками вещест- венных чисел, с другой стороны, устанавливается взаимно одно- значное соответствие. Оно состоит в том, что точке М сопоставляет- ся тройка вещественных чисел (а, Ь, с), где а есть абсцисса точки М в данной системе координат, b — ордината и с — аппликата Мож но говорить, что тройка (а, Ь, с) определяет или задает точку М и что, в свою очередь, эта тройка изображается точкой М. Но можно, и это часто бывает удобно, просто отождествлять точки с соответ- ствующими тройками вещественных чисел, считая, что мы имеем дело с двумя видами задания одного и того же предмета. При та- ком подходе можно рассматривать как множество точек про- странства евклидовой геометрии. При изучении трехмерного евклидова пространства важную роль играет понятие вектора. Векторы, рассматриваемые в гео- метрии, мы будем называть геометрическими векторами, чтобы не смешивать их с элементами произвольных координатных прост- ранств. Впрочем, имеет место очевидная связь между этими понятиями. Зафиксируем в трехмерном евклидовом пространстве некоторую течку О. Каждый геометрический вектор можно изобразить направ- ленным отрезком, имеющим начало в точке О. В результате между всеми точками и всеми геометрическими векторами устанавливает- ся взаимно однозначное соответствие, при котором геометрическо- му вектору соответствует точка, являющаяся концом направлен- ного отрезка, изображающего данный геометрический вектор и имеющего начало в точке О. Если в трехмерном евклидовом пространстве ввести декартову систему координат, имеющую началом координат точку О, то согласно сказанному выше устанавливается взаимно однозначнее соответствие между всеми геометрическими векторами и тройками вещественных чисел. Благодаря этому У'ц можно рассматривать и как множество всех геометрических векторов трехмерного евкли- дова пространства. Целесообразность и естественность этого опре- деляется следующим обстоятельством. Для геометрических векто- ров известным образом определено действие сложения. Легко ви- деть, что оно совпадает с действием сложения троек вещественных чисел, являющихся элементами Уд'. Пусть трем геометрическим векторам и2, и3 соответствуют указанным выше способом тройки (Ср с:), (а2, Ьг, с2), (а3, Ь3, с3). Если для геометрических векто- ров имеет место + «2 — я3, то, как без труда доказывается в аналитической геометрии, для соответствующих троек выполняется (а,, &1, <j) + (fl-г, Ь2, с2) = bs, c.j) согласно правилу сложения 20
этих троек как элементов У«'. Так же обстогт дело и с операцией умножения на вещественное число. Геометрическому вектору )и1 (X 6 R) соответствует тройка (Хяу, Х^, XcJ, являющаяся резуль- татом умножения на X тройки (e1, blt сх), рассматриваемой как элемент Аналогично обстоит дело и с геометрическими векторами дву- мерного и одномерного евклидовых пространств (т. е. с векторами на плоскости и на прямой). Так что координатное вещественное векторное пространство У#’ можно рассматривать как множество геометрических векторов плоскости, на которой введена декартова система координат. В дальнейшем геометрические аналоги при изучении коорди- натных пространств У(в)и могут быть весьма полезны для уяснения смысла и характера проводимых рассуждений. В связи со сказанным отметим, что теория координатных вектор- ных пространств при любом п и их обобщений, о которых будет сказано дальше, первоначально и возникла как некое обобще- ние геометрии плоскости и трехмерного евклидова пространства. Это обобщение намечается в неявной форме уже у Гаусса. К сере- дине XIX века рассуждения в n-мерном пространстве делаются обычными. Рассмотрением множеств векторов, компоненты которых при- надлежат к той или иной заданной числовой области, мы займемся в последующем. В ближайшее время у нас не будет причин обращать специальное внимание на то, к каким классам чисел принадлежат компоненты векторов. Мы будем иметь дело с векторами, компонен- тами которых могут быть любые комплексные числа. 2.5. Отметим ряд свойств операций сложения векторов и умно- жения их на числа в Vм, которые будут использованы при даль- нейшем изучении пространства У(л>. Справедливость этих свойств легко проверяется непосредственно на основании определения опе- раций в У(,) (2.2). Обозначаем « = а2, .... ап), ч) — (Ьъ Ь2, ..., 6П), w — = (сп с2, .. .. ся) произвольные и-векторы, X и р— произвольные комплексные числа. I) Коммутативность сложения: и + v = V + и, 2) Ассоциативность сложения: (« + ©) + w = и + (и + и>). 3) Обратимость действия сложения: для любых и, я ( У(л* всегда найдется такой х 6 И"', что и 4- х = Ф (х обычно назы- вается разностью векторов v и « и обозначается: х = v — и). 4) Ассоциативность умножения на числа: X (ри) = (Хр)«. 5) Свойство дистрибутивности относительно сложения чисел: (X + р)» = Хи + pw. 6) Свойство дистрибутивности относительно сложения векто- ров: X (и + f) = Xu 4- X©. 7) Свойство единичного множителя: 1и = и. 21
2.G. n-вектор, все компоненты которого равны нулю, будем называть нулевым вектором и обозначать 0Л = (0, 0, 0). Впрочем, часто значок п мы будем опускать, поскольку обычно и без него бывает ясно, из какого 0" взят данный зектор. Непосредственно видны следующие свойства нулевого вектора: и 4- 0 = и, и — и = 0, Ou = О, Х0 = 0, 0 — и = (—1)и (здесь и — произвольный вектор из I/1'1, 2 — произвольное число). Систему векторов я,, и2, будем называть ненулевой,если среди векторов а,, я2, .. , а,п есть отличные от нулевого. 2.7. Определение. Говорят, что п-вектор ъ выражается линейно через n-векторы ult и2, ..., ит, если существуют такие числа Л2, ..., Хт, что V — Kjllt + ^2Й2 + ••• + \п№яг п-векторы иА. и.г, ..., и„ называются линейно зависимыми между собой, если существуют такие числа а1, а2, ..., ат, из которых не все равны нулю, что <*i«i + а.2я2 + ... + атя„ = 0. Ниже мы увидим, что оба эти понятия связаны между собой. Если л-векторы u,lt и2, ..., ит не являются линейно зависимыми между собой, то они называются линейно независимыми между собой. Это означает, что соотношение »i«i + а2яе 4- ... + а1Пит = 0 выполняется только при а2 = а2 = ... = а1П = 0. 2.8. Теорема. Если векторы и1У и2, .... и,„ t V’1' (га#?2) линейно зависимы между собой, то один из них выражается линейно через другие. Если же эти векторы между собой линейно независимы, то ни один из них не может быть выражен линейно через другие. Доказательство. 1) Предположим, что я1э и2, .... ип между собой линейно зависимы: а]и1 + а.2я2 + ... + атит = 0, где некоторый коэффициент аЛ отличен от нуля. Тогда 22
2) Теперь предположим, что и2, .... ит между собой линейно независимы. Линейное выражение одного из них через другие в этом случае невозможно, так как из равенства И/г = ₽1М1 + ••• + -Ь Рй+1«,г+1 + ••• + очевидно, получилась бы линейная зависимость: ₽i«i + ... + + (—1) «А + ₽*+1аА+1 + ... + Pmam = 9 (коэффициент при uh отличен от нуля). 2.9. Укажем ряд простейших свойств, связанных с линейной зависимостью и линейным выражением п-векторов. 1) Система, состоящая из одного n-вектора и, будет линейно зависимой тогда и только тогда, когда и является нулевым векто- ром: и = 0. 2) Если n-вектор v линейно выражается через п-векторы ult иг, ... ит: V = ajttj + a2u2 + ... + атит, то, добавляя произвольный n-вектор w к исходной совокупности векторов, мы получаем совокупность векторов ип «2, .... ит, w, через которые с тоже линейно выражается: о = ai«i + а2«2 + ... -|- а„,«го + Ом 3) Пусть каждый из n-векторов иг,..., ит линейно выражает- ся через п-векторы • ••. а каждый из них в свою очередь линейно выражается через п-векторы wltw2, ...,40^ Тогда каждый из векторов «!, и2,..., ит линейно выражается через w2, ...»wz. Действительно, используя линейные выражения «/ = = p.jW1 + p.2w2 + ... + pyzwz, достаточно подставить выражение каждого Vj через w2, .... wz в выражение и,. 4) Пусть п-векторы «1( «2, ..., ит между собой линейно неза- висимы. Если для какого-нибудь п-вектора ® векторы V,«2, ..., ит линейно зависимы между собой, то v линейно выражается через «!, «2, ..., ит. (Обратное утверждение справедливо согласно 2.8 при любых «х, »2, ..., ит.) Действительно, если av + + a2a2 + ••• + amttm — где среди коэффициентов есть отличные от нуля, то обязательно a =#=0 (иначе «!, и2, ..., ит между собой линейно зависимы), и поэтому Мй1 + (_Д1ка+ ... +(_ ^\ит. \ a / \ a / \ а / 2.10. При м е р. Пусть и — (ах, а2> аз) и = (^i« ^2» ^з) — векторы из v<s3) (т. е. имеющие вещественные компоненты). Как мы уже говорили (2.4), их можно рассматривать как геометрические векторы в трехмерном евклидовом пространстве, в котором задана прямоугольная декартова система координат. 23
Если и и v линейно зависимы аи + Р р = 0, то такая зависимость, как легко видеть, выполняется и при некоторых веществен- ных коэффициентах а и р. Она означает, что компоненты и пропорциональны компонентам р (отбрасываем неинтересный случай, когда н = 0 или V— 0). Это соответствует тому, что «и рассматриваемые хак геометрические векто- ры, являются коллинеарными. Пусть векторы и и v линейно независимы между собой Рассматривая их как геометрические векторы, поместим их начала в начало системы координат. Тем самым определяется плоскость. Множество всех векторов из выража- ющихся линейно через и и ч> с вещественными коэффициентами, состоит из векто- ров, которые можно считать геометрическими векторами, компланарными указанной плоскости. Отметим, что соотношение линейной зависимости в V-./ по существу есть прямое естественное обобщение известного важного отношения между геометри- ческими векторами обычного трехмерного евклидова пространства. 2.11. Четыре достаточных условия линейной зависимости. 1) Если, среди векторов и2, и2, ... , ит € У(Л) один является нулевым, то иг, м2, ..., ип линейно зависимы. 2) Если часть из векторов иг, «2, •••» ит линейно зависима, то и все векторы системы аг, »2,..., ит между собой линейно зависимы. 3) Если каждый из векторов и1г и2,ит может быть выражен линейно через векторы т>2, £ ^(л)> число которых I меньше т, то uif и2, ..., ит линейно зависимы. 4) Если каждый из векторов иъ и2,...,ит может быть выражен линейно через векторы ©2. С V'n>, которые между собой линейно зависимы, то и их, и2, .... ит линейно зависимы. Доказательство. 1) Если uk = 0, то имеет место сле- дующая линейная зависимость: 0«! + ... 4- Ой,;,! + la,, + 0и^+1 4- ... + 0«m = 0 (коэффициент при uk отличен от нуля). 2) Если имеет место линейная зависимость а, и. + а и, + ... + а, и, = 0, ,'1'1 2 '2 1 s S то имеет место и линейная зависимость Ml + р2«2 + ... + РпАп = 9. где = ah, если ын входит в число векторов ..., и = 0 для прочих uk. 3) Пусть т > I и 4" 2 4" ... и2 = 0.21®I -Г ^22®2 + ••• + а2Г ®Г» «т — ат1^1 4“ ап.2®2 4‘ ••• 4“ I- 24
Умножим эти равенства соответственно на Xj, Х2, .... 1т и сло- жим их. При этом в качестве Хх, к2, лт возьмем ненулевое реше- ние следующей системы линейных уравнений: ап\ + «21Х2 -|- ... + amXXm = О, a12X.j 4- а22Х2 4- ... + ат2\п = О, «1Д1 + а2/^2 + ... + amZ лт = О (так как т > /, то ненулевое решение существует согласно 1.16). При таком выборе чисел мы получаем равенство: 4* А2К2 4- ... + ^т11т = 0®1 + 0®2 4- ... + 0vl — 0, 4) Если векторы ох, v 2, ...,Vm.линейно зависимы, то один из них, пусть для определенности ®го, выражается линейно через остальные Vm ~ МЧ + ^2® 2 + ••• + Ч»-1®/»~1- В линейное выражение векторов их, и2,.... ит через vx,v2, ...,vm подставим вместо Ont сумму lxvx 4 12т»24- ... + m_x. Сгруппиро- вав слагаемые с одинаковыми Vi , получим систему линейных выра- жений векторов «х, «2, .. , ит через ®х, ч)г, ..., Так как т > т — 1, то согласно предыдущему пункту отсюда вытекает линейная зависимость их, «2, ..., ит. 2.12. Определение. Говорят, что векторы их, иг, ..., иг, принадлежащие некоторой совокупности п-векторов М cz У<“>, образуют базис этой совокупности, если выполнены следующие два условия'. 1) Векторы их, «2, ..., иТ линейно независимы между собой. 2) Всякий вектор из М может быть линейно выражен через »х, «2, ..., иГ. Благодаря 2.9 (4) условие 2) в определении базиса можно заме- нить следующим условием: 2’) Для всякого V £М векторы V, их, и2, ..., иг линейно зависимы между собой. Определяя базис при помощи условий 1) и 2'), о базисе говорят как о максимальной (по включению) линейно независимой системе. 2 13. Из определения базиса непосредственно вытекает, что линейное выражение каждого вектора с £ М через векторы базисз единственно. Действительно, наличие двух различных между собой линейных выражений V = &!«! 4- а2и2 4- ... 4- <хгиг, ® — Р1И1 + р2й2 + + Рг»г привело бы к линейной зависимости векторов базиса: О = (ах — pj) их 4- (а2 — ₽2) »2 4- ... 4 (а, — ?г) «г. 2.14. Лемма, п-векторы ех = (1, 0, 0, .... 0), е2 = (0, 1, 0.0), .... еп = (0, 0, 0,..., 1) 2Ь
образуют базис координатного пространства V''’). (В дальнейшем мы иногда будем называть этот базис главным базисом координатно- го пространства У("'.) Доказательство. Если среди чисел alt а2, ал име- ются отличные от нуля, то «1^1 + <Мг + ••• + «яеп = = (а,, 0, 0) Д (0, а2, 0) Д ... Д (0,0, ..., а„) = = (а,, а2, ..., а,) У= В Следовательно, е1( е2, .... еп линейно независимы. Для любого ю — (Ръ р2.....р„) G V'n) мы имеем его линейное выражение через ех, е2, ..., еп- <о = ₽!<?! + + ... -Д &пеп. 2.15. Т е о р е м а о базисах. Во всякой ненулевой совокуп- ности векторов (2.6) Л1 с V(n) имеются базисы. Все базисы совокупности М состоят из одинакового количества векторов. ' Всякие линейно независимые между собой векторы из М могут быть включены в некоторый базис совокупности М. Всякие линейно независимые между собой векторы из М в коли- честве, равном числу векторов в базисе, сами образуют базис М. Доказательство. 1) Пусть иъ и2,.... и* — произволь- ные линейно независимые векторы из М (такие совокупности в М существуют, например совокупность, состоящая из одного ненулевого вектора). Рассмотрим последовательности линейно не- зависимых векторов из М, включающие эти векторы: иг, я2, ..., в?, u*+i> •••> (такие есть, например сама последовательность «I, и2, .... Uk). Благодаря 2.11 (3) длина т всякойтакой последова- тельности не превосходит и, так как все «• согласно 2.14 сража- ются линейно через п векторов в1г е2, .... еп. Поэтому среди таких последовательностей найдутся имеющие максимальную длину. Пусть «j, «2, ..., иъ, пк+1, ..., ит одна из них. Составляющие ее секторы линейно независимы по выберу. При любом ю Е М последовательностью, nlt иг, .... ит состоит из линейно зависимых между собой векторов, поскольку количе- сгво ее векторов т Д- 1 > т. Следовательно, a]t п2, .... ит образуют базис М (2 12), содер- жащий исходные векторы иъ «2, ..., я*. Этим рассуждением мы доказали одновременно первое и третье утверждения теоремы 2) Пусть «!, и2, .... иГ и о,, ю2, .... ю <. являются базисами сово- купности М. Соотношение г <ь невозможно ввиду 2.11 (3), по- скольку линейно независимые Юр ю2, .... юк выражаются линейно через «ь «2, ..., иг. Аналогично невозможно и s < г. Следователь- но, г = s. 3) Пусть Ир «2, ..., иг есть некоторый базис М и ю2, ..., — произвольная совокупность линейно независимых между собой X
векторов из М. Согласно доказанному в первой части эти векторы могут быть включены в некоторый базис М: Vlt е2, vr, сг+1..... 4)^. Если предположить, что т > г, то мы получили бы два базиса разной длины г и т, что по доказанному во второй части невозмож- но. Следовательно, т — г, т. е. Vj, <О2, .... сами образуют базис совокупности М. 2.16. В связи с доказанной теоремой делается естественным следующее определение. Определение. Количество векторов в базисе совокупности М а называется рангом совокупности М. Ранг М будем обозначать через rang М. Если М состоит из одного нулевого вектора, то ранг Л4 считает- ся равным нулю. Таким образом, ввиду 2.15 всякая совокупность к-векторов обладает рангом, и ранг определяется единственным образом, независимо от выбора базиса. 2.17. Из теоремы 2.15 вытекает, что базисами множества М а: У</” являются максимальные по количеству векторов сово- купности линейно независимых между собой векторов из М. Все такие совокупности состоят из одинакового количества векторов, равного рангу Л4. 2.18. Как следует из 2.14, ранг самого координатного прост- ранства V*”’ равен его размерности п. Отметим, что V(n) содержит различные базисы. Их даже бес- конечно много, поскольку, например, для всякого базиса д2, ..., ип и всякого числа А =/= 0 совокупность Xttj, к2, , тоже, очевидно, образует базис У(п>. 2.19. Пример. Обозначим через М множество всех таких л-всктороз (&. ъа. 1„-1. 1п), У которых + 2$а -Г ••• + (« — 1) + П%п = 0. Определим ранг М. Рассмотрим п — 1 векторов, очевидно, принадлежа- щих М: «2 = (2, —1, 0.. 0, 0), и3 = (3, 0, —1, .... 0, 0), ал-1= (л — 1, 0, 0, .... —1, 0), «„=(«, 0, 0, ..., О, —1). Они линейно независима, поскольку у вектора, являющегося суммой а2и2 + ава8 + ... + али„ при аА Ф 0, A-я компонента (fe = 2, 3, ..., п) равна —О- И потому он отличен от Q. 27
Для произвольного d С М можно получить его линейное выражение * = (L 5г...1л-1. 5м) = = ( 25г— 3®з—... —(п — 1)5л—i °5л- 51 > 5з> •••• 5л-1> 5л) — ~ (—5.) Иг + (—5s) ч» ~Ь ~Ь (—Вл-1) ял—1 + ( 5«) ип Таким образом, векторы и2, и2. ип образуют базис совокупности .И, ранг которой оказывается равным п — 1. 2.20 Из 2.15 легко вытекает следствие, характеризующее соот- ношение рангов в связи с отношением включения. Следствие. Если М 'ст М о. У(п), то rang ЛГ rang М. Действительно, п векторы базиса множества М.' линейно неза- висимы. Следовательно, по 2.15 они включаются в некоторый базис множества М. Поэтому количестве п-векторов в последнем не меньше чем rang М'. § 3. Ранг матрицы 3,1. При рассмотрении системы линейных уравнений совершен- но безразлично, как обозначены неизвестные. Тем самым всякая такая система вполне определяется таблицей, состоящей из коэф- фициентов при неизвестных и свободных членов. В связи с этим естественно рассматривать прямоугольные таблицы чисел. Определение. Прямоугольная таблица тп чисел (а11а12 ••• а1п а21а22 ••• °2л •• ^тп называется матрицей (или, полнее, (т, п)-матриией). Числа а1у, входящие в эту таблицу, называются элементами матрицы, при- чем элемент а., называется (г, /)-элементом. Если все элементы матрицы А являются числами из некоторого множества чисел М, то гозорят, что А есть матрица над М. Если т = п, то матрица А называется квадратной порядкап. В квадратной матрице А последовательность элементов ап, а22, ..., ат называют главной диагональю. Если в квадратной матрице порядка п все недиагональные эле- менты равны нулю (а,. = 0 при i =/= /): то такая матрица называется диагональной. 28
Матрица, все элементы которой равны нулю, называется ную- вой. Если т = 1, то матрицу (Яцй12 ... ^1д) иногда удобно бывает рассматривать как л-вектор. При п == 1 мат рицу удобно рассматривать как /л -вектор. 3.2. л-векторы = (Л11> й12> •••> а1п)> «2 = (^21» ^22> ••• > называются строками матрицы А. т-векторы называются столбцами матрицы Л. Строки и столбцы называются рядами матрицы. 3.3. Матрицу А можно рассматривать как последовательность ее строк, т. е. последовательность, состоящую из л-векторов ult и2, .... ит. Одновременно А можно рассматривать как последовательность ее столбцов, т. е. последовательность, состоящую из /и-векторов *1, v2..... Изучение взаимоотношения между этими двумя подходами со- ставляет одно из направлений теории матриц, которым мы сейчас займемся. Надо отметить, что общая теория матриц весьма обшир- на, глубоко развита и связана со многими математическими направ- лениями. В дальнейшем мы рассмотрим некоторые из этих связей. 3.4. Определение. Следующие преобразования называ- ются элементарными преобразованиями матрицы: 1) Умножение какого-нибудь ряда на число, отличное от нуля. 2) Перестановка местами двух параллельных рядов. 3) Присоединение нового ряда, целиком состоящего из нулей. 4) Исключение ряда, целиком состоящего из нулей. 5) Прибавление к одному ряду другого, параллельного ряда, ум- ноженного на какое-либо число 29
3.5. Лемма. Если от матрицы А можно пепейти к матрице А’ при помощи одного из элементарных преобразований, то и от матрицы А' можно перейти к матрице А при помощи некоторо- го элементарного преобразования. Доказательство. 1) Если А' получается из А путем ум- ножения некоторою ряда на число Ку=0, то А, очевидно, может бить получена из А' путем умножения того же ряда на число —. 2) Если А' получается из А путем перестановки некоторых двух рядов, то А может быть получена из А' путем повторной пере- становки тех же рядив. 3) Если А' получается из А путем присоединения нулевого ряда, то А получается из А' путем исключения этого нулевого ряда. 4) Если А' получается из Д путем исключения некоторого ну- левого ряда, то А получается из А' путем присоединения этого исключенного нулевого ряда. 5) Если А' получается из А путем прибавления к некоторому ряду другого ряда, умноженного на 1, то А может быть получена из А’ путем прибавления к первому из этих рядов второго, умно- женного на (—л). 3.6. Теорема. При помощи элементарных преобразований каждая ненулевая матрица может быть приведена к диагональному виду с ненулевыми диагональными элементами. Доказательство. Пусть в матрице А отличен от нуля элемент ау. Переставляя местами строчки и столбцы (преобразова- ние 2)), можно преобразовать се в матрицу А', у которой этот эле- мент будет стоять в первой строке и первом столбце: а'п = о(/ 0. /ап а,2 ... Щп \ А' = I а-2\ ... o2n I \<J/nl ®л12 ... атп/ Прибавив ко второй стрске матрицы А' первую, умноженную «21 „ «31 на — — , затем к третьей первую, умноженную на — —, и т. д. «и аи (преобразование 5)), мы, очевидно, приведем А' к виду /Иц а.2 ... й\п ч / 0 а22 ••• \ I 0 аз2 ... азл Г 0 ат2 ... amt. Далее прибавим ко второму столбцу первый, умноженный на «12 . а1з — —, к третьему столбцу первый, умноженный на ——, и т. д. «п «п 30
В результате мы приведем матрицу к виду: Если в А" имеются строки или столбцы, целиком состоящие из нулей, то мы их выкинем (преобразование 4)1. Повторив аналогичную последовательность преобразований, отнесенных к совокупности элементов a,t (i, j 2), мы приведем пашу матрицу к виду: А'"= Яц О О О О 0 ... О \ а22 0 ... О я» w О Я33... Яз9 О с43... \0 0 я'з... где ан 0, а22 =£ О Продолжая так далее, мы, очевидно, получим диагональную мат- рицу с ненулевыми диагональными элементами. 3.7. Пример Приведем к диагональному виду при помощи элементарных преобразований следующую матрицу: (О 2—12 3 \ 1-12 1 0 1 1 1 13 3 • О 2 5 1—2/ 1 0 0 0 0\ /1 0 0 0 0\ /1 0 0 0 О' /10 0 0 2 -1 2 3 1 0 20 0 о 1 1020001 0 2 0 0 0 0 О 0 I- 10 0 6 —1 —5 1, 1 0 0 6 0 0 1, 10 0 6 О 9 6 —1 —5/ \ Здесь первая матрица получена из исходной в результате перестановки местами первых двух строк. Вторая матрица получена из предыдущей в резуль- тате прибазлепия к третьей строке первой, умноженной на (—1), и так далее Если к окончательно получившейся матрице применить еще первое преобра- зование, то ее можно привести к диагональному виду, в котором все диагональные элементы разны единице. 31
3.8. Во многих вопросах важна следующая характеристика матрицы, которая впервые была введена и использована англий- ским математиком Сильвестром Дж. Дж. (1814—1897). Определение. Число г называется рангом матрицы А, если ранг системы строк матрицы А и ранг системы столбцов матрицы А оба равны г (2.1G). Употребляется обозначение rang А — г. Очевидно, rang .4=0 только для нулевых матриц. 3,9. Согласно 2.15 определен ранг системы строк всякой мат- рицы и ранг системы ее столбцов. Если бы они оказались различ- ными, то такая матрица не обладала бы рангом в смысле определе- ния 3.8. Однако мы увидим, что этого не бывает. Тем самым вся- кая матрица обладает рангом (и притом, согласно 2.16, определяе- мым единственным образом). 3.10. Лемма. Ранг диагональной матрицы порядка п с нену- левыми диагональными элементами равен ее порядку п. Доказательство. Для матрицы саи 0 ... 0 \ д __ /0 а.-2 ... 0 \ .0 0 ... апп у которой ahk 0 (k = 1.2, ... , и), п-векторы («и. 0, ... , 0) = вп^, (0 , #22* ••• > 0) = *^22^2» 0, 0, ... , агг) — апп еп благодаря 2.14 линейно независимы Следовательно, ранг системы ее строк равен п. Аналогично и ранг системы ее столбцов равен п. 3.11. Лемма. Пусть матрица А' получается из матрицы А при помощи некоторого элементарного преобразования. Тогда ранг системы строк матрицы А‘ не превосходит ранга системы строк матрицы А. Тоже и для столбцов. Доказательстве. 1) Если одна из матриц А или А" является нулевой, то и вторая матрица нулевая. Утверждение леммы в этом случае справедливо. Будем считать, что А и А’ обе ненулевые. Обозначим через г ранг системы строк = (а11< а12> •••• )» и2 — (^21> ^22> •••> ^2п)» w,7i ат2< •••» °m?) матрицы А. за
Пусть s > г. Нам надо показать, что всякие s строк к,,, и^, .... матрицы А" линейно зависимы. Рассмотрим всевозможные случаи. 2) А' получается из А умножением одной из строк матрицы А на число X =й= 0. И/,, , •••, »zs являются одновременно строками и для А (может быть, одна из них умножена на X, и так как s > г, то они линейно зависимы). 3) А' получается из А умножением р-го столбца матрицы А на число X =0; 0. И(1 = (Я/,1, ..., (Xfl|,p), ..., ».'s = («у... Соответствующие строки матрицы А uh = (ащ......ailP, .... aiin), = (\......... •••> ai2n)> И/s = %,......а,.р линейно зависимы: “Ь ^2И"г + ••• + Uis — Из этого равенства, учитывая выражения для u'k и uk, непосред- ственно следует: Xjtt, ~г Х2и + Хи — 0. 1 % ‘s 4) А' получается из А перестановкой двух строк. Векторы и[, и\ , ..., «' являются строками и для Л, и потому они линейно зависимы. 5) А' получается из А перестановкой двух столбцов. Строки ui t «, , ..., ui матрицы А линейно зависимы: XjB^ + Х2«( + ... + Х5и,5 = Q. Отсюда непосредственно следует выполнение соотношения Xj»' + X2«G + ... 4- Хл«'5 = 0. 6) А' получается из А присоединением или исключением нуле- вого ряда (строки или столбца). Векторы и\, , ..., и' являются строками и для А, или отличаются некоторой р-й компонентой, равной нулю, или со- держат 0. Во всех этих случаях они линейно зависимы. 2 Заказ 653 33
7) А' получается из А в результате прибавления к одной строке другой строки, умноженной на X. Векторы и\, и, , ..., и\ выражаются линейно через строки матрицы А, которые в свою очередь выражаются линейно через г векторов Так как з > г, то согласно 2.11 (3) и'( , и', .... и\ линейно зависимы. 8) А' получается из Л в результате прибавления к р-му столбцу <?-го столбца, умноженного на X. = («щ. •••. («ц₽ + ла.,19).ац„), u'h = .... (а,-.р + Ха,:<7), а,.п), u't = (ац1, .... (а р + Ха, ?), .... а,?„). Из линейной зависимости для з строк матрицы А \Ui, + X2«i2 -р ... + X5itis = 0 непосредственно следует выполнение соотношения с теми же коэф- фициентами и для рассматриваемых векторов; Х]М + Х2« + ... + Х„« 3.12. Следствие. Пусть матрица А' получается из мат- рицы А при помощи некоторого элементарного преобразования. Если А обладает рангом, равным г, той А' имеет ранг, равный г. (Коротко говоря, ранг матрицы не меняется при элементарном преобразовании.) Доказательство. Пусть гх есть ранг системы строк мат- рицы А'. Согласно 3.11 rt г. Но благодаря 3.5 в свою очередь и А может быть получена их А' при помощи некоторого элементарного преобразования. Поэтому согласно 3.11 имеем г < гР Следовательно, гх = г. Совершенно аналогично для г2, равного рангу системы столб- цов матрицы А', можно получить: г2 = г. Отсюда следует, что г = гх = гй есть ранг матрицы А'. 3 13. Теперь мы можем доказать справедливость высказанного в 3.9 утверждения. Теорема. Всякая матрица обладает рангом. Доказательство. Если матрица А нулевая, то rang А = 0. Если матрица А ненулевая, то согласно 3.6 при помощи элемен- тарных преобразований ее можно привести к диагональной матри- це А’ с ненулевыми диагональными элементами. Согласно 3.10 А' обладает рангом. Отсюда благодаря 3.12 следует, что и А обладает рангом, по- скольку благодаря 3.5 А в свою очередь может быть получена из А’ при помощи элементарных преобразований. 3.14. То, как была доказана теорема 3.13, указывает на способ нахождения ранга для той или иной конкретной матрицы. При лом.ощи элементарных преобразований так, как это делалось в 3.6, 34
заданную матрицу следует привести к диагональному виду с от- личными от нуля диагональными элементами. Порядок полученной диагональной квадратной матрицы благодаря 3.5, 3.10 и 3.12 будет равен рангу исходной матрицы. Впрочем, учитывая естественное желание экономить вычисле- ния, нет необходимости доводить матрицу до диагонального вида. Достаточно привести ее к виду ап й12 а13 а1/г а1п 0 ^22 °23 ••• aZk ••• й2л в 0 а33 ... a3k... а3п \0 0 0 ... акк... а;т/ где ati ф 0 (i = 1, 2, ..., k), или отличающемуся от него располо- жением строк и столбцов. Ранг такой матрицы равен k. Это следует хотя бы из того, что ее можно привести к диагональной форме С ненулевыми диагональными элементами, отнимая от последующих столбцов сперва первый столбец, умножаемый на соответствующие множители, потом второй и т. д. § 4. Разрешимость систем линейных уравнений 4.1. Используя понятия и полученные в предыдущих парагра- фах свойства векторов и матриц, мы можем вернуться к изучению систем линейных уравнений. Для системы линейных уравнений а11х1 + а12-Ч + ••• + а1пХ,1 — ^1» a2lXi + аг2ха 4- ... -Ь а2пхп = й2, ......................................... (4.1) @mlxl "4" ^rt2x2 4" ••• 4" ЛппХп — Ьп матрица, составленная из коэффициентов при неизвестных (411 ^12 ••• \ Й21 #22 ••• ®2’ I #п2 называется матрицей системы (4.1). Добавив столбец свободных членов, получаем матрицу называемую расширенной матрицей системы (4.1). Очевидно, расширенная матрица системы вполне определяет систему линейных уравнений (с точностью до несущественного обозначения неизвестных). 2* 35
4.2. Столбцы расширенной матрицы системы (4.1) будем обо- значать- Соответствен но строки расширенной матрицы системы (4.1) будем обозначать: «2, •••> 11т- Столбцы, строки, так же как и решения системы, будем рас- сматривать как векторы соответствующих размерностей. 4.3. То, что вектор W = (otj, а2, .... а„) является решением систем линейных уравнений (4.1), по определению означает вы- полнение равенств: аиа1 + ui2 «г+ ••• + а?лал — а2,а1 + «22а2 + ••• + а2лал = &г> + ат^г + -• + атпап = Ьт. Но эти равенства можно трактовать как следующее соотношение между m-векторами, являющимися столбцами расширений матри- цы системы В: a,Vj + a3tf2 + ... + anvn = Vo. Таким образом, возможна нижеследующая точка зрения на си- стему линейных уравнений (4.1). Система линейных уравнений (4.1) разрешима тогда и только тогда, когда в расширенной матрице системы последний столбец ч>0 выражается линейно через остальные столбцы: х\,г>2, ..., г>л Решением системы является всякая последовательность коэффи- циентов такого линейного выражения. 4.4. Вопрос о разрешимости систем линейных уравнений рас- сматривался различными математиками. Решение вопроса было за- вершено в результате исследований немецкого математика Л. К р о- нскера (1823—3891). Теорема Кронекер а—К а п е л л и. Система линей* пых уравнений (4.1) «1Л + а12х2 + ... 4- а1пхп =- a-JCi + a22x2 + ... + а2пхп = Ь2, OmlXi ат2Х2 4" ••• 4" &тпХп — разрешима тогда и только тогда, когда ранг ее матрицы равен рангу расширенной матрицы. rang А — rang В. 35
Доказательство. 1) Пусть система (4.1) разрешима. о,,, v , ..., — базис системы столбцов матрицы А, г = rang А. Так как столбец свободных членов выражается линейно через 5Д, О2, •••> (4.3). тс 0О будет выражаться линейно и через <Д, ..., •о1 . Поэтому эти линейно независимые векторы образуют базис системы столбцов матрицы В. Следовательно, rang В — г. 2) Пусть rang А = rang В = г. Vi., ...,v — базис системы столбцов матрицы А. Так как число линейных независимых векторов e(i, , ..., о, равно рангу системы столбцов матрицы В, то согласно 2.15 эти векторы образуют базис для системы столбцов матрицы В. Отсюда следует, что выражается линейно через vti, v . Но тем самым о0 выражается линейно через t>2, .... Фл. Согласно 4.3 это означает разрешимость системы (4.1). 4.5. Вопрос о количестве решений разрешимой системы линей- ных уравнений выясняется сравнением ранга А (равного рангу В) с числом неизвестных. При этом следует иметь в виду, что, очевид- но, всегда rang А п. Теорема. Если в разрешимой системе линейных уравнений с п неизвестными (4.1) rang А — rang В = и, то система (4.1) обладает единственным решением. Если rang А = rang В < п, то система (4.1) обладает бесконечным количеством различных решений. Доказательство. 1) Пусть rang А = rang В = п и iV = (а1( а2, .... ), w' = (а', а2, ..., ап) — два решения систе- мы (4.1); 4- а2<н2 + ... + ал®л = а,'®1 + а?2 + - + <®л = Вычитая, получаем: («1 — a-J) «j + («2 — 4- ... 4- (ая — ая) V„ = 0. Так как rang А = п, то между векторами f1( v2> •••> не может быть линейной зависимости. Поэтому в полученном равенстве должно выполняться условие: 04 — а, — 0, а2 — а' = 0, ..., ал — а» = О- Таким образом, всякие два решения системы совпадают, т. е. опа обладает единственным решением. 2) Пусть rang А = rang В — г< п. Тогда между векторами vlf ®2, ..., v„ должна иметь место линей- ная зависимость: МЧ 4- Х2с2 4- ... + = 0. 37
Пусть •&' = (a,, a2, an) — некоторое решение системы (4 I). Согласно 4.3 <xxVt + a2o2 + ... + anV« = ®0. Умножив первое соотношение на произвольное число ц и при- бавив его ко второму, получим: («1 4- pAt) Ok + (a2 + цХг) О2 + + («„ + |^й) = ®э- Это означает, что (cq 4- а.л 4- р^2, • ••> «/,4* M^„) также является решением. Так как р — произвольное число, а среди чисел X, имеются отличные от нуля, то мы получаем бесконечное множество различных решений системы (4.1). 4.6 Особо отметим важный случай, когда в системе линейных уравнений число уравнений равно числу неизвестных: ^1А + а14х2 4- ... 4- а1пхп = Ьи a2lXl "Г ^22-^2 +... + &2п%п ................................... (4.6) + о„а^2 + ••• + аппх> = Ьп- Следствие Есливсистеме (4.6) rang А — п, то система (4.6) разрешима и имеет единственное решение. Доказательство. Так как rang В п и rang В rang A = «, то rang А = rang В = п. Согласно 4.5 в этом случае система разрешима и имеет единственное решение 4.7. Следствие. Если в системе (4.6) rang А <п, то система (4.6) или неразрешима, или имеет бесконечное множество различных решений. Доказательство. Если rang В ф rang А, то система (4.6) согласно 4.4 неразрешима. Если же rang В = rang А <п, то система согласно 4.5 разрешима, но количество ее решений беско- нечно. 4.8. Определение. Линейное уравнение cixl 4- с2х2 4- ... 4- cnxn — d (4.8) называется линейным следствием системы линейных уравнений (4.1), если (п А- 1)-вектор (с1г с2, ..., ся, d) выражается линейно через строки расширенной матрицы системы уравнений (4.1). Другими словами, можно сказать, что линейное уравнение яв- ляется линейным следствием системы (4.1), если оно может быть получено в результате слежения уравнений системы (4.1), умножен- ных на те или иные численные множители. Приведенное понятие линейного следствия является частным случаем более общего понятия следствия, которое будет введено позже (XI, 4.8--4.10). 4.9. Непосредственно ясно, что всякое решение системы (4.1) будет решением и для уравнения, являющегося линейным следст- вием этой системы. 38
Отсюда следует, что если добавить к системе линейных уравне- ний несколько новых линейных уравнений, являющихся линей- ными следствиями системы, то получившаяся система будет экви- валентна исходной. Исключив из системы линейных уравнений некоторые уравне- ния, являющиеся линейными следствиями остальных, мы получим систему, эквивалентную исходной. 4.10. Рассмотрим случай, когда система (4.1) разрешима (и по- тому rang А = rang В = г). Для простоты обозначений вполне можно считать, что именно г первых строк в матрице В образуют базис системы всех ее строк. Тогда остальные строки выражаются через них линейно. Согласно 4.9 отсюда следует, что в нашем слу- чае система (4.1) эквивалентна системе: + ai2x2 +•••+ Wn = ^i, fl»!*! + а22х2 + ••• Н- ^2пХп — Ь2, ....................................... (4.Ю) + аг2*2 + ••• + агпхп — Ьг. 4.11. Так как система (4.10) разрешима и ранг ес расширенной матрицы равен г, то и ранг ее матрицы должен равняться г. Можно считать, что первые г столбцов образуют базис системы столбцов матрицы системы (4.1С), а тем самым и ее расширенной матрицы. Если мы придадим неизвестным хг+1, хг+2, ..., хя произвольные численные значения xr+1 = <r+1, хг+2 = if+2, ..., хп = tn, то из си- стемы (4.10) получим новую систему с г неизвестными х1( х2, ..., хг: аиХ1 4” °12*2 ... 4" dirXr = (^1 ai(r-f aln^n)t a21xl 4" ^25X2 4* ••• + Й2гхг — (b2 й2(г+1Л+1 ••• a2n^n)« ..................................................... (4 11) artXi + ar2x, + ... + arrxr = (br — ar(r+1)tr+l — ... — ariltT). У этой системы ранг матрицы равен г. Поэтому согласно 4.6 она обладает единственным решением = Т1, х2 = у2, •••> хг — уг- Учитывая то, как связаны между собой системы (4.10) и (4.11), заключаем, что вектор (у1( у2, yr, tr+1, tri.2, ..., tn) является решением системы (4.10). Легко видеть, что всякое решение системы (4.10) (alt а2, ..., ап) может быть получено указанным способом. Для этого в качестве произвольных значений для неизвестных хг+1, хг+2, ..., хп следует взять xr+1 = ar+1, xr+2 = ar+2, ..., хп = an. В получившейся после этого системе (4.11) вектор (ай а2, ..., аг) будет, очевидно, ее реше- нием При этом это ее единственное решение, что следует из 4.6. Поэтому, решая (4.11), мы обязательно придем именно к этому решению (ап а2, .... а.), которое совместно с принятыми ранее 39
значениями неизвестных xr+1 = a,+i, хг+2 = аг+2, ..., хп = ая и составит исходное произвольное решение системы (4.10) (04, а2, .... аг, аг11, а„). Остается напомнить, что системы (4.1) и (4.10) в рассмотренном случае эквивалентны. Таким образом, проведенные рассуждения дают способ сведения задачи об описании всех решений произволь- ной системы к случаю системы, описанному в (4.6). Коротко напомним, что этот способ состоит в том, что мы сперва отбрасываем т — г уравнений, которые являются линейными след- ствиями из оставшихся г уравнений (4.8) (какие это будут по номеру уравнения, в общем случае зависит от нумерации уравнений в си- стеме). Затем придаем произвольные численные значения т — г неизвестным, выбирая их так, чтобы ранг матрицы коэффициентов у оставшихся неизвестных равнялся г. В результате мы получим систему из г линейных уравнений с г неизвестными, у которой ранг матрицы равен г. Эту систему и следует решить тем или иным спо- собом (в дальнейшем будет описан еще один такой способ). В ре- зультате этого мы и получим произвольное решение исходной си- стемы, в котором значения неизвестных зависят от произвольных значений, которые мы придали части из этих неизвестных. 4.12. Пример. Рассмотрим систему линейных уравнений: х, + 2х2 -г х3 + 2х4 = а, 2х( + 4х2 — Зх3 — х4 = 0, 3xj + 6х2 — 2х3 + х4 = —1. Здесь а может принимать то или другое значение. Свойства нашей системы будут зависеть от того, каково значение а. Принято говорить, что система зависит ог параметра а. Рассмотрим матрицу системы и ее расширенную матрицу: /1 2 1 2\ /1 2 1 2 а\ 4=24-3-1, 24-3-1 0 \3 6 —2 1) \3 6 -2 1 — 1) При помощи элементарных преобразований получаем: /12 1 2\ rang А = rang : С 0 —5 —5 = rang \0 0—5—5/ = 2, /12 12а /1000 rang В = rang I 0 0 —5 —5 —2а 1= rang I 0 —5 —5 —2а \0 0 —5 —5 (—1 — За)} \0 0 0 (—1 — а) /1 ° ° \ = rang I 0 —5 С I. \0 0 (—1 — а)/ Если —1 — а =/= 0, т. е. а #= —1, то rang В = 3. В этом случае rang А -£ rang В и, значит, система неразрешима. В случае а = —1 мы имеем rang А = rang 5=2. Система разрешима и имеет бесконечное множество различных решений. 40
Найдем общее выражение для решений нашей системы линейных уравнений в случае а = —1: Х4 4* 2х2 4" Х3 4 2х4 — 1, 2х4 + 4х2 — Зх3 — х4 — О, Зх; 4- бх2 — 2х3 + х4 = —1. Полученная система разрешима, причем ранги ее матрицы и расширенной матрицы равны двум. Для матрицы, составленной из коэффициентов первых двух уравнений, имеем: “>ng (J I 4) = rang (J § _* _|) = 2. Отсюда следует, что наша система эквивалентна системе, состоящей из пер вых двух уравнений: Xi+2xa+ х3+2х4=—1, 2xj + 4хг — Зхг — х4 — 0. В матрице этой системы надо выбрать два столбца, линейно независимых между собой Таксвыми не являются два первых столбца, ибо + Можно взять второй и третий столбцы, поскольку для матрицы, составлен- ной из их коэффициентов, имеем: 45 Д).. rang (*_;)-2. Согласно 4.11 неизвестным xt и х4, коэффициенты которых не входят в вы- бранную матрицу, можно придать произвольные численные значения: = tt, х4 = /4. Получаем новую систему: 2х2 + х3 = —1 — tx — 2Г4. 4х2 — Зх3 "= —2/х | /4. Мы знаем, что у этой системы матрица имеет ранг, равный двум. Поэтому си- стем । имеет единственное решение. Вычитая из второго уравнения первое, умноженное па два, получаем: 2х2 + х3 = —1 — 4 — 2/4, — 5х3 = 2 + 5/4. 2 3 11 Поэтому х3 = -- — tt, хг = --— J Л— Общее выражение для всех решений исходной системы линейнь’х уравнений имеет вид: Здесь параметры и /4 могут принимать любые численные значения. При любых их значениях мы будем иметь решение системы, и всякое решение может быть получено таким способом. 4.13. Смысл и значение введенного в 4.8 понятия линейного следствия из системы линейных уравнений выясняется благодаря следующему обстоятельству. 41
Теорема. Пусть система линейных уравнений (4.1) разре- шима. Для того чтобы всякое ее решение было решением и для урав- нения + с2х2 + ... + спхп = d, (4.13) необходимо и достаточно, чтобы уравнение было линейным следст- вием системы (4.1) 6 смысле определения 4.8, Доказательство. В 4.9 уже было сказано, чю всякое решение системы (4.1) является решением линейного следствия этой системы. Пусть теперь уравнение (4.13) таково, что всякое решение си- стемы (4.1) является решением и для пего. Покажем, что это урав- нение есть линейное следствие из (4.1) в смысле определения 4.8. Поскольку система уравнений (4.1) разрешима, ранг се матрицы равен рангу ее расширенной матрицы: rang А = rang В — г. Для простоты обозначений будем считать, что г первых столбцов матрицы В образуют базис системы ее столбцов. Все решения си- стемы (4.1) могут быть получены согласно рассуждениям, проведен- ным в 4.10 и 4.11. При г == л система (4.1) имеет единственное реше- ние. При г<л она имеет бесконечное множество решений, кото- рые получаются при задании произвольных числовых значений неизвестным xr+1, xf+2, ..., хп. Рассмотрим матрицу, полученную из матрицы В добавлением одной строки, состоящей из коэффициентов при неизвестных и сво- бодного члена уравнения (4.13): (Оц -^12 ^1П ^1\ #21 #22 ••• #2П ^2 1 Umnb т 1 <?i с2 ••• сп d / Столбцы этой матрицы обозначим: Столбцы w2, ...,Wr линейно независимы между собой (ввиду линейной независимости соответствующих столбцов В). Столбец и>в через них линейно выражается. Действительно, при г — п для решения системы (4.1) (aIt <х4, .... аг_), являющегося решением и уравнения (4 13), имеем w0 = + a2w2 + ... + <xnw„. Если же г < и, то, полагая хг+1 = хг42 = ... = хп =0, находим некоторое радение системы (4.1) (32, ..., 0, 0, ..., 0), которое является решением и уравнения (4.13). Поэтому w0 = + ••• + + fW 42
Покажем, что при г < п всякий столбец wk(k — г 4- 1, г -4- 2, , п) тоже линейно выражается через w2, wr. Полагая A'r+i = 0, xr+2 =0, хк = 1,хп =0, мы найдем некотороереше- нис (у,, у2, уг, 0, 0, 1, 0) системы (4.1), а значит, и (4.13). Следователь!.о, у1ад1 + y2w2 + ... + yrWr + W:t = w0. По- этому w.-;выражается линейно через w0, Wj, w;, .... wr, а значит, и через и*,, w2, ..., wr. Мы показали, что первые г столбцов матрицы С образуют базис системы ее столбцов и, значит, rang С = г. Так как rang В — г, то среди строк матрицы В существуют г линейно независимых. Эти строки будут образовывать базис и в системе строк матрицы С. Поэтому интересующая нас последняя строка матрицы С линейно выражается через них, а значит линейно выражается через строки матрицы В. 4.14. Непосредственно из доказанной теоремы вытекает важное свойство, характеризующее эквивалентность систем линейных уравнений. Две системы линейных уравнений эквивалентны тогда и только тогда, когда всякое уравнение каждой системы является линейным следствием другой системы. § 5. Однородные системы линейных уравнений 5.1. Как мы уже отмечали, однородная система линейных урав- нений йцХ1 + о12х2 4- ... + ах.хп =0, + а22х.г + ... + аглХл = 0, ................................. (6.1) Cm i*i + ат2Х2 + ... + ат.,х 1 = 0 всегда разрешима, поскольку она обладает нулевым решением Вопрос заключается в том, когда система имеет сверх того еще и ненулевые решения. 5.2. Очевидно, у однородной системы всегда rang В = rang А. Теорема. Для того чтобы однородная система линейных уравнений (5.1), помимо нулевого решения Qn, обладала еще и не- нулевыми решениями, необходимо и достаточно, чтобы rang А < п. Доказательство необходимости Если система (5.1) имеет нулевое решение, то число ее решений больше одного (имеются и нулевое решение, и ненулевые решения). Поэтому со- гласно теореме 4.5 ранг матрицы А ее коэффициентов должен быть меньше числа неизвестных. Доказательство достаточности. Если ранг матрицы А меньше числа неизвестных, то согласно 4.5 система уравнений 43
имеет белее одного решения. Следовательно, среди решений, по- мимо нулевого, должны найтись и отличные от него решения 5.3. Из 5.2. непосредственно вытекает следствие, которое, впрочем, ранее мы уже получили независимо. Следствие. Если число уравнений в однородной системе ли- нейных уравнений меньше числа неизвестных, то система, помимо нулевого решения, обладает еще и ненулевыми решениями. 5.4. Для однородной системы линейных уравнений (5.1) обо- значим через М множество всех ее решений. Теорема. Если W, на' С М, тс w + w' С М и при любом числе к С М. Доказательство, w — (az, а2, ..., а„), w' = (а/, aj, ..., аг>). Так как w, w’ С М, го для столбцов матрицы А си- стемы (5.1) f>2, ..., v„ имеем: + «2^2 + + ar,V,l = a'lVx + + ... + a'nV = в. Складывая эти равенства, получаем: («! 4- ар -|- (а2 + а2) г>2 + ... + (а„ +а') ©„ = 0, что означает: W = (a, + a', a2 -b a', ..., an + an) £ M. Аналогично, умножая первое из равенств на X, получаем: (XaJ Ч)1 4- (Xa2) v2 4- ... + (Ха.) = 9, г. е. Xw = (Xalt Ха2, ..., Xarl) £ М. 5.5. Пусть однородная система (5.1) обладает ненулевыми решениями, т. е. М есть ненулевая совокупность. В М существуют базисы (2.15). Возьмем один из них: w1, w2, .. , wz. Всякий вектор у С М выражается линейно через векторы этого базиса у = Xzw, 4- X,w2 4- ... + Xzwz. С другой стороны, согласно 5.4 из wlt w.2, .... wl М следует, что всякое линейное выражение Х,®^ 4- X2w2 4- ... 4- Xzte>z при- надлежит М. Таким образом, совокупность всех решений однородной системы линейных уравнений (5.1) состоит из всех векторов вида XjWj 4- X2w2 4- ... 4- Xzwz. Всякий базис W,. w.2, ..., w. совокупности всех решений одно- родной системы линейных уравнений (5.1) называется ее фундамен- тальной системой решений. 5.6. Теорема. Для совокупности решений М однородной системы линейных уравнений (5.1) с п неизвестными имеет место rang М = п — rang А, где А —матрица системы (5.1). 44
Доказательство. Как и в 4.10, 4.11, будем для про- стоты обозначений считать, что (а11а12 ••• а1г\ а21П22... а2г I = rang А = г. arlar2 ••• агг/ Согласно рассуждениям 4.11 неизвестным хг+1, хг+2, ...,хп мож- но придавать любые значения. Поэюму найдутся такие п—г реше- ний системы (5.1), которые имеют вид: «1 = (ап, а12, .... а1г, 1, 0........0), К2 ~ (^21» ^22» •••» 0С2г, 0, 1, ..., 0), ип—г — (<Х(Л_гц, <Z(n—r)2i <Х(П—г)г, 0, 0, ..., 1). Векторы «J, и2, матрицы ип_г линейно независимы, так как ранг ап а12 ... alr 1 0 ... 0 а21 а22 ... а2г 0 1 ... 0 Г)1 «(П— Г)2 ••• &(П—Г) Г 0 0 ... 1 согласно 3.14 равен п — г. С другой стороны, для любого <о = (Y1, у2, .... ул) £М, оче- видно, имеем: w = © —?г+1 «1 —уг+2 к2 —... — уп un_r = (6j, S2, ...,6r,0,0, ...,0). Так как о, иъ «2,..., un_r 0 М, то согласно 5.4 и wg М. Соглас- но 4.11 при фиксированных числовых значениях хг+1, хг+2, ..., хп существует единственное решение системы (5.1); вуесть решение системы (5.1), такое, что хг+1 = хг+2 = ... = хп — 0. Нулевое решение обладает таким же свойством. Следовательно, w есть ну- левое решение. Из w = 0 вытекает V = yr+] + уг+2 «2 + ... + уп ип-г. Мы показали, что ult и2, .... м„_г образуют базис множества векторов М. Следовательно, rang М — п — г. 5.7. Помимо того, что оно представляет интерес само по себе, изучение однородных систем линейных уравнений полезно и для выяснения того, что представляет собой система всех решений произвольной системы линейных уравнений. 45
Сопоставим произвольной разрешимой системе йи х, 4* ^12 х2 4~ ... 4~ Хп а2) *1 + а22 х2 4- ... + а2п хп = Ь2, (4.1) ат1 Х1 + х2 4" ••• 4" ^тпхп ~ однородную систему с такими же коэффициентами при неизве- стных Оц Х1 4" ЙГ2 Xi 4* ... 4" й1п хп — о, Я21 Х1 4“ fl22 Х% 4- ... 4- Й21 хп — О, ........................................... (5-1) ат1 Х1 + апЛ х2 4- ... 4- а,пп Хп = О- Пусть у есть некоторое произвольное фиксированное решение системы (4.1). Теорема. При любом решении г однородной системы (5.1) сектор у + г является решением системы (4.1). При этом всякое решение си- стемы (4.1) представимо в таком виде при данном у и каком-то Z, являющемся решением однородной системы (5.1). Доказательство, fj, £>2, ..., г»(1 — столбцы матрицы А, являющейся матрицей системы линейных уравнений (4.1) и одно временно матрицей однородной системы (5.1); — столбец сво- бодных членов системы линейных уравнений(4.1); у = (<Xj, а2, ...,ап) и потому cxj «4 + а2 v.2 4- ... 4- <*п Если z = П>1, р2, ..., ₽„) есть решение системы (5.1), то Pi® 1 4- Ра 4* ••• + Р« = Е>. Складывая это равенство с предыдущим, получаем: (а2 + pL) t>j + (а2 + р2) г2 + ... + (а„ + рп) = ©0, что означает, что у + z = (04 4 Pi, а2 4- Рг, •••< 4- РД является решением системы (4.1). С другой стороны, пусть s — (y1( у2) ..., у,,) есть произвольное решение системы (4.1): Ti®i 4- 4- ... 4- = ®э. Вычитая из этого равенства раьенсгво OjVj 4- 4- ... 4- 4- получаем: (“Vi — »i) 4- (Y-2 — а2) ®2 4- .. 4 (Т« — ап) 46
Но это означает, что z = (ух — а„ уг — а2, у„ — а„) яв- ляется решением системы (5.1). Для $ получаем выражение: « = (Vi,?2, = (»i, а2, .... а„) + (ух — аг, у2 — а2, Ь — а„) = у + г. 5.8. Пусть у есть некоторое произвольное фиксированное ре- шение системы линейных уравнений (4.1), a wx, w4, ..., w, — базис совокупности решений соответствующей однородной системы (5.1). Благодаря 5.5 и 5.7 всеми решениями системы (4.1) являются век- торы, представимые в виде у + XjiOj 4- ?.2w2 ~Ь ••• + ^lwl при любых числах Х2, ..., Xz. При этом каждое решение представимо в таком виде (при фикси- рованных у, w2, .... 12)i) единственным образом. Действительно, иначе мы очевидным образом получили бы линейную зависимость между векторами wx, w2, ..., Напоминаем, что I — п — г, где г = rang А (5.6). 5.9. Пример. Рассмотрим однородную систему Xj + 2х2 + х3 + х4 + х3 = О, Xi — х2 — Зх3 — 5х4 — х5 = О, х, + 5х2 + 5х3 + 7х4 + Зх6 — 0. Она имеет ненулевые решения (5.3). Находим ранг матрицы системы: /1 2 1 1 1\ /I 2 1 1 1\ rang I I —1 —3 —5—1 = rang 0—3 —4—6—2 1 =• V 5 5 7 3/ \0 3 4 6 2/ Следовательно, ранг совокупности всех решений данной однородной системы равен трем (5.G). Наша система эквивалентна системе хх + 2х2 + х3 + х4 + х5 = 0, Xi — х2 — Зх3 — 5х4 — х6 = 0, которую представим в виде х4 + 2х2 = — х3 — х4 — х6, х4 — х2 = Зх3 + 5х4 + х5. Находим общее выражение для решений системы: 5 1 4 2 *1 = —а+3₽ + —у, х2 = — — а — 2Р ——у, х3 = а, х4 = 0, х5=? о о о о (здесь параметры а, р, у могут принимать любые численные значения). Фундаментальную систему решений составляют векторы: /54 \ "Р 11 °’ °} /1 2 «2 = (3, -2, 0, 1, 0), «з = -Г. - 0, 0, 1 \ U О 47
Г лав a II. ОПРЕДЕЛИТЕЛИ § 1. Понятие определителя 1.1. При изучении систем линейных уравнений в предыдущей главе мы видели, что в случае, когда система линейных уравнений разрешима, нахождение всех ее решений по существу сводится к решению системы линейных уравнений, количество которых совпа- дает с числом неизвестных и равно рангу матрицы системы (1, 4.10, 4.11). Этот случай можно считать основным при отыскании всех решений системы линейных уравнений. Матрица такой систе- мы является квадратной. Исследование структуры решений таких систем приводит к некоей числовой характеристике квадратных матриц, которую удобно использовать для составления явных фор- мул, по которым находятся решения системы линейных уравнений. Остановимся сначала на простейших случаях. 1.2. Рассмотрим систему двух линейных уравнений с двумя неизвестными: «1-Т + Ьху = с1( а2х + Ь2у = с2. Ее можно решать приведением к трапецеидальному виду (1, 1.11), считая для определенности Ьх =& 0. Второе уравнение умножим на (—&.) и прибавим к нему первое, умноженное на Ьг. Получим си- стему, эквивалентную исходной (1, 1.9): ахх + Ьху = с1( (ахЬ2 — агЬх)х = схЬ2 — с2Ьх. Если ахЬ2 — и2Ьх =£ 0, то система имеет единственное решение: д._«1*2 - Ctbl у ._ «1«2 - «2( 1 «1*2 — «2*1 ’ «1*2 — «2*1 Заметим, что в случае Ьх = 0 (но при общем условии ахЬ2 — — а2Ьх 0) тоже можно пользоваться этими формулами. 48
Выражения, стоящие в знаменателе и числителях полученных формул, вычисляются через элементы матриц .'-1^1. ."Vi \ одинаковым способом: каждое из них равно разности между произ- ведением элементов, стоящих на одной диагонали {главной диаго- нали), и произведением элементов, стоящих на другой диагонали. В связи со сказанным для произвольной квадратной матрицы второго порядка , и11 а12^ \<?21 ^22/ выражение, найденное указанным способом, заслуживает особого внимания. Оно называется определителем этой матрицы (а также определителем второго порядка) и обозначается: I ^121 к йп а22 — а12 а21- I “21 “22 I Используя введенное обозначение, мы можем решения рассмат- риваемой системы двух линейных уравнений с двумя неизвестными при условии i I О | ^2^2 представить в виде: I <А I I а/i | х = 1 с^21 у = ’a2<-2' |аА|’ |аА| I агЬг I . а<А I 1.3. Пример. Рассмотрим систему уравнений 2х — у = О, —4% + Зу = 1. |Л~И=б-4=2 Так как определитель отличен от нуля, то система имеет единственное решение 1.4. Аналогично обстоит дело и с системой трех линейных уравнений с тремя неизвестными ape + feiy + qz = dlt а2х Ь2у 4- c2z = d2, а3х + Ьяу + с3г = ds. 49
Решая эту систему приемом, аналогичным примененному в 1.2, нетрудно показать, что при 01^9^3 01^3^2 4" 02^3^1 02^1^3 “1" 03^К2 --- 03^2^1 ® система имеет единственное решение: ___ dib2c3 — dxb3c2 4- d2b3r 1— d2bxc3 {- d,3&iCg — d3b2cx ^1^2^-S U1b3C2 4~ ^2'-ЬС1 4" ^gbxC2 — й3Ь.уСу у____ <hd2c3 — axd^,2 4~ °г^зс1 a2dic3 ~P a%d^c2 — a3d2cx йхЬ2с3 --— d^bp2 4* ^2b3cx — a2b{Cg 4- a3bxc2 — ,t3b^cx г _ aib,d3 — fliMa 4- a^sdi — + aj>id.i — a3fe2rfi 41^2^3 01^3^2 4- U2b3Cx O2blC3 4- 4ZgZ?|C2 U3h2cx В этих формулах знаменатели и числители являются выражения- ми одинакового характера, найденными с помощью матриц fll^tcl \ /^Дс, \ \ /0)М1 02^2^2 1> ^2^2^2 I’ I 02^2^2 1> I 02^2^2 03^30.3'' ' ^З^З^Я 03^3^3 03^3^4 Как и в 1.2, естественно ввести в рассмотрение общий способ нахождения такого выражения для произвольной квадратной мат- рицы третьего порядка ап Ои а,3 0?1 П22 ^23 0;и азг азз Указанное выражение называется определителем этой матрицы (а также определителем третьего порядка) и обозначается: 0Ц °12 а13 ^21 ^22 ®23 ~ ^11 ^12 ^33 ^11^32023 4~ 021^32013 021012033 4* 031 ^32 033 4" 031й12023 031022^13- Используя это обозначение, мы можем решения рассматриваемой системы трех линейных уравнений с тремя неизвестными при ус- ловии представить в виде: d2b2c.j, х __ d3b3c3 a.blcl й2Ь2с2 л3&$с3 axbxCi а 03^3^3 ajdiCj аз^з-з a55iCi 112^2^2 а3^3^3 «1*1^1 a-2b>d2 a3b3d3 ахЬхсх a3b3c3 1.5. Пример. Рассмотрим систему уравнений х — у 4" Зг = 2, х - г= 1, 2х — у — г = 0. 50
Гак как определитель 1 —1 3 1 0 -1 2 —1 — 1 = 0 — 1 — 3 — 1 + 2 — О = — 3 отличен от нуля, то система имеет единственное решение. Применим формулы 1.4. Вычислим сначала необходимые определители третьего порядка: 2—1 3 1 0 -1 О —1 —1 = 0 — 2 — 3 — 1 + 0 — 0 = -6, 1 2 3 1 1 —1 2 0—1 = —1—0+04- 2 — 4 — 6 = —9, 1 1 2 —1 2 О 1 —1 О = 0+ 1 — 2 — 0 — 2 — 0 = —3. Окончательно получаем: —6 —9 —3 х = —~ = 2, у=—- = 3, г =— = 1. —3 — 3 —.3 1.6. Аналогичные рассуждения можно провести и при рас- смотрении системы четырех линейных уравнений с четырьмя не- известными, системы пяти линейных уравнений с пятью неизвест- ными и т. д. Выкладки при этом будут становиться все более гро- моздкими, но характер результатов будет оставаться тем же. Поэто- му вполне естественно провести более подробное исследование тех алгебраических выражений, которые сопоставляются при упомя- нутых рассуждениях квадратным матрицам. 1.7. Указанные выше соображения лежат в основе общего по- нятия определителя и го порядка. Идею общего понятия опреде- лителя можно проследить в работах многих математиков вплоть до XIX века Окончательное оформление этого понятия и сам тер- мин «определитель» принадлежат французскому математику О. К о- ш и (1789- ’.857). 1.8. Рассматривая полученные ранее выражения для опреде- лителей квадратных матриц второго и третьего порядков, так же как и для более высоких порядков, если проводить аналогичные рассуждения, мы можем подметить в общих чертах способ выра- жения определителя через элементы соответствующей квадратной матрицы. Этот способ сводится к тому, что определитель равен сумме всевозможных произведений элементов матрицы, взятых по одному из каждой строки и каждого столбца матрицы, причем всякое произведение в этой сумме снабжено некоторым знаком, т. е. дополнительным множителем +1 или —1. Закон, определяю- щий, при каких членах этот множитель равен +1, а при каких он равен —1, сравнительно сложен. Этот закон может быть задан различными по виду, но по существу эквивалентными способами. Мы выберем способ, связанный с некоторой знакопеременной ха- рактеристикой вещественных /г-векторов. 51
1.9. Говорят, что в вещественном п-векторе (С1, с.,, ..., сп) (ct 6 Я". I — 1, 2, п) пара компонент ск, р составляет инверсию, если k < I, но ск > с,. Другими словами, инверсию в данном /г векторе составляют всякие две различные компоненты, большая из которых располо- жена левее яругой. Количество инверсий в данном п-векторе (т. е. количество пар ch, ct, составляющих инверсию) будем обозначать через «/ (Сц С2, Сп)- Заметим, что J fo, с2, ..., с„) = 0 тогда и только тогда, когда Ci с2 Сп. 1 10. Рассмотрим произвольный вещественный п-вектор с по- парно различными компонентами (С1, сг....сп). Будем считать знаком данного вещественного п-вектора число sign (ci, с2, ..., с„) = (—1)/(с- ...........сп) (sign — сокращение слова signum — знак). Заметим, что для последовательности, состоящей из одного ве- щественного числа, ее знак равен +1: sign (с,) = (—1)° = 1. 1.11. В связи с введенным понятием отметим следующее свой- ство: От произвольного вещественного п-вектора (с}, с2, ..., сп) с попарно различными компонентами можно перейти к п-вектору, не содержа- щгму инверсий, произведя в исходном п-векторе в точности J (Cj, с2, ..., сл) перестановок пар соседних компонент. Это можно осуществить следующим образом. Возьмем сначала в исходном n-зекторе (clt с2, сп) наименьшую по величине ком- поненту ср (1 <С р п). Меняя ее р — 1 раз местами с соседними слева компонентами, поместим ср на первое место. В результате получим и-вектор (ср,сисг, ..., ср_1, ср+1, .с„). Затем проводим ана- логичные рассуждения относительно (п — 1)-вектора, образованно со числами q, с2, ..., cp_t, ср+1, ..., сп. Продолжая так далее, мы окончательно получим п-всктор, не содержащий инверсий. При этом, как легко видеть, будет проведено в общей сложности столько перестановок пар соседних компонент, сколько инверсий содер- жится в исходном п-векторс, и это количество равно J (q, с2, ..., сп). 1.12. Пример ы. 1) В векторе (5, 7, 1,6, 3) всевозможные инверсии со- ставляют следующие шесть пар компонент: (5, 1), (5, 3), (7, 1), (7, 6), (7, 3), (6, 3). Следовательно, sign (5, 7, 1, 6, 3) = (—1)G = + 1. Указанные в i.ll перестановки пар соседних компонент проводятся следую- щим образом. Переставляя число 1 два раза, получаем (1, 5, 7, 6, 3). Затем, пере- 52
ставляя число 3 три раза, получаем (1, 3, 5, 7, 6). И наконец, переставив число 3 с числом 7, получим вектор (1, 3, 5, 6, 7), не содержащий инзерсий. 2) Для произвольного натурального числа п вектор (1, 2, п) не содержит инверсий, поэтому sign (1, 2.. п) = (-1)» = +1. 3) В п векторе (п, п — 1, 2, 1) всякие две различные компоненты состав- ляют инверсию. Поэтому количестзо инверсий в данном п векторе совладает с числом всевозможных сочетаний из п компонент по две, т. е. равно С2 = п(п—1) ~ 2 Следовательно, н(л— sign (n, п — 1, ..., 2, 1) = (—1) 2 . 1.13. Отметим еще одно важное свойство. Если в вещественном п-векторе с различными компонентами поменять местами две какие-нибудь компоненты, то n-вектор из- менит знак на противоположный: sign (сх, с2, ..., ck, ..., ct, ..., с„) = (—1) • sign (cn c2, .... ct, ..., Ck, ..., cn). Сначала рассмотрим случай, когда переставляемые компоненты ck и с; являются соседними, т. е. I = k + 1. Количество инверсий в n-векторе (q. с», ..., ck, ск+1, ..., сп) отличается лишь на единицу от количества инверсий в (сь с2, ..., ck+1, с,,, ..., сп). Действительно, всякая пара компонент с;, с- (i =£ j), отличная от ск, a.k+i и от сА+1, ск, или составляет инверсию одновременно в обоих векторах, или не составляет. Что касается .пары с-., с!г+1 в первом векторе и пары сл+1, се — во втором, го одна из них составляет инверсию, а другая не составляет. Согласно определению 1.10 знаки двух таких векто- ров противоположны. Рассмотрим общий случай. От вектора (сь с2, ..., ск, ..., ct, ..., сп), где k < I, мы можем перейти к вектору (сь с2, ct, ..., с4, ..., с„) при помощи последовательной замены местами соседних компонент. Компоненту с, меняем местами с cAfl, затем с ck+2 и т. д. Произведя I — k — 1 перестановок соседних членов, мы песта, вим рядом сА и cz. Поменяем их местами. Затем аналогичным прие- мом, меняя местами лишь соседние члены, поместим с, на k-e место. В результате мы получим нужный нам n-вектор, произведя в общей сложности 2 (/ — k—1) + 1 перестановок соседних компонент. Так как каждая такая перестановка меняла знак п-вектора па противоположный, то знак полученного в итоге п вектора отли- чается от знака исходного n-вектора дополнительным множителем 1.14. Из 1.13 вытекает следующее свойство. Пусть в двух вещественных п-векторах с различными компонен- тами (ах, а2, ..., ап), Ь2, ..., Ьп) 53
одновременно осуществлена одинаковая перестановка компонент, т. е. получены новые п-векторы («V \........%). \......\). где s]( s2, sn — некоторая перестановка чисел 1, 2,п (другими словами, s1( s2, .... St — это все те же числа 1, 2, .... п, но только расположенные в своем порядке). Тогда sign (а„ а2, .... ап) sign (blt Ь.г, ..., br) = sign («s_, as, ... , aif)x X sign (b_г .......................bSn). Действительно, от «-вектора (йь а2, аг>) к «-вектору (щ , as, ..., as ) и одновременно от «-вектора (blt b2, .... Ь„) к «-вектору (tc, bs, ..., bs ) можно перейти путем последовательных переста- новок одинаковых по номеру компонент. В результате (благодаря 1.13) оба новых /г-вектора или будут иметь одновременно те же знаки, что и исходные « векторы (если количество указанных пе- рестановок членов в каждом /г-векторе четное), или же их знаки будут иметь одновременно дополни тельный множитель (—1) (ес- ли количество упомянутых перестановок нечетное). В обоих случа- ях произведение знаков наших «-векторов не изменится. 1.15. Знакопеременная характеристика вещественного «-век- тора нужна нам для того, чтобы с ес помощью дать общее опреде- ление определителя квадратной матрицы любого порядка п. Анализируя рассмотренные ранее определители квадратных матриц второго и третьего порядков (так же как и более высоких порядков, если их получить аналогичным способом), мы можем в общих чертах подметить природу закона, определяющего знаки в соответствующих выражениях определителей. Знак каждого произ- ведения, входящего слагаемым в выражение определителя, зави- сит только от номеров строк и столбцов матрицы, определяющих сомножители произведения. При перемене этих номеров знак ме- няется. Тщательное рассмотрение природы этого изменения могло бы навести на мысль с тем, что оно может быть описано при по- мощи введенного ранее понятия знака вещественного «-вектора, который гоже меняется от изменения расположения компонент в «-векторе. Ограничившись этим замечанием, не будем вдаваться в большие подробности и сразу дадим требуемое определение, для которого сделанное замечание носит лишь наводящий характер. 1.16. Определение. Определителем (или детерминантом) квадратной матрицы п-го порядка /й11 °12 ••• а1п\ /] = | ^21 322 ••• a2l I on2 апп, называется сумма всевозможных произведений оа. а .... а, 4'1 44 п п 54
каждое из которых содержит сомножителями элементы матрицы А, взятые пс одному из каждой строки и по одному из каждого столбца (т. е. последовательность номеров строк i2> •••> и последова- тельность номеров столбцов jlt j2, ..., jn суть некоторые переста- новки чисел 1, 2, и), а коэффициент о определяется следующим образом: ст = sign (i,. i2, .... z„) • sign (/„ /2, ..., /ч). Для определителя матрицы А используются обозначения: /а11 й12 ain \ аи а,2 ••• Фп det A, det| °21 ^22 " а^п !, ®21 °22 а'2я 'flni *^Ч2 ••• апп ' ап\ апг апп (det — сокращение слова determinant — определитель). Часто вместо термина «определитель квадратной матрицы п-го порядка» употребляют более короткий: определитель п го порядка, понимая, что соответствующая матрица задается в самом обозна- чении определителя. В этом случае элементы матрицы А называют элементами самого определителя, а строки и столбцы матрицы А называют строками и столбцами ее определителя. 1.17. Необходимо сразу же отметить, что для любой квадрат- ной матрицы А п-го порядка ее определитель, как число, пред- ставленное указанным в определении 1.16 способом, задается одно- значно. Действительно, указанная в определении определителя (1.16) сумма единственным образом определяется указанием всех ее сла- гаемых. Нам следует убедиться лишь в том, что в каждом слагаемом этой сум . ы ста. .а. ... а, t tifi i2j2 ln т коэффициент о не зависит от порядка следования сомножителей а,,, а,. , ..., а; 12 2 lnftl Имеем: о = sign (iJ( i2, .... Q • sign (/lt j2, .... jn). При изменении порядка следования сомножителей происходит одинаковая перестановка компонент в n-векгоре (/1( /2, ..., 1п) и в п-векторе (Д, /,, ..., /„). Согласно 1.14 произведение знаков полу- ченных n-векторов остается прежним. Следовательно, о не зависит от расположения сомножителей. 1.18. Среди различных способов расположения элементов в произведениях, сумма которых составляет определитель (1.16), особо укажем на следующий. В произведении п элементов, взятых по одному из каждой стро- ки и по одному из каждого столбца матрицы А, множители удобно располагать по номерам строк, т. е. в порядке возрастания номеров строк. Тогда всякое произведение примет вид: тМ,а21г - 55
гДе /1» /г» •••» /л — некоторая перестановка чисел 1, 2, .... п. Так как sign (1, 2, п) — +1, то в нашем случае знак произведения определяется коротко: с = sign (Ji, /2, .... /„). Разумеется, сомножители можно располагать и по номерам столбцов. Это приводит к заданию произведения в виде оа . а „ ... а, ... »г2 ‘пп’ где о = sign (/1, i.{, .... i„). 1.19. Выразим определитель п-го порядка через его элементы (1.16), располагая сомножители в каждом произведении по номе- рам строк (1.18). Тогда каждое из произведений, сумма которых составляет весь определитель, задается последовательностью но- меров столбцов jt, /,г, .. , jn, т. е. некоторой перестановкой чисел 1, 2, ..., п. Следовательно, количество слагаемых в общем выраже- нии определителя л-го порядка совпадает с числом всевозможных перестановок чисел 1, 2, ..., п, которое, как мы знаем (Ч. I, 8.10), равно п\. 1.20. Пример. Вычислим на основании определения 1.16 определитель 0 10 4 п _ 0 2 0 3 и~ 560 8• 0 9 7 11 Сомножители в слагаемых определителя выбираем в порядке возрастания номе- ров строк. При этом нулевые слагаемые опускаем Если из первой строки возьмем сомножителем число 1, то из второй строки мы должны взять число 3, из треть- ей — число 5, из четвертой — число 7. Значит, одно из слагаемых нашей гуммы имеет вид: щ • 1 • 3 • 5 • 7, где щ = sign (2, 4, 1, 3) = (—1) J 1V-’-3) = (—I)3 = —1. Выбирая из первой строки сомножителем число 4, мы приходим к слагаемому о2 • 4 • 2 • 5 • 7. где 01 = sign (4, 2, 1, 3) = +1. Окончательно получаем: D = _ (1 . 3 . 5 7> + (4 2 • 5 • 7) = -105 + 280 = 175. 1.21. Посмотрим, совпадают ли выражения для определителей второго и третьего порядков, найденные согласно определению 1.16, с выражениями, полученными ранее (1.2, 1.4). Для определителя второго порядка, вычисляемого по опреде- лению 1.16, имеем: |«nfli2| = sign (1,2)- an-a22 + sign (2, 1) • а1Гаа =ацо22 —о12о21. I #21 #22 I Получили го же самое выражение, что и в 1.2. 56
Определитель третьего порядка, вычисляемый по определению 1.16, равен: йп аи а13 а21 а22 о23 fl31 а32 а33 о, = sign (1, 2, 3) = +1 о3 = sign (2, 1, 3) = — 1, оа = sign (3, 1, 2) = +1, Таким образом, сказывается = c1aJla22a33 4* ага>»а»*°зз 4* стза12а-лазз 4" ата12а2заз1 4" 4- ^6^13^21^32 4" aea13a22a31’ о2 = sign (1, 3, щ = sign (2, 3. Щ = s’gn (3. 2> 2) = -1, 1) = +1, 1) = —1. flllfll2°13 а21а22а23 ~ а11а22азЗ — ^11^23^32-- а12а’1а33 4“а12а23а31 4“ ^13^21^82 а31Я32аЭЗ ---fl13a22a31- Результат совпал с полученным ранее в 1.4. 1.22. Мы можем рассматривать матрицы, состоящие из одного элемента: А = (а). Вполне ясно, что понятие определителя, при- мененное к такой матрице, приводит к определителю, равному эле- менту этой матрицы (определителю первого порядка): |а| = са, о = sign (1) • sign (I) — 4-1- 1.23. Вычисление определителей достаточно больших порядков непосредственно на основании одного лишь определения 1.16, как правило, связано с весьма громоздкими выкладками. В даль- нейшем мы укажем ряд приемов, основанных на свойствах опре- делителей, позволяющих упростить процесс вычисления определи- телей произвольных порядков. Однако уже сейчас мы можем рас- смотреть и некоторые общие случаи. Пусть, например, в квадратной матрице произвольного порядка содержится ряд (строка или столбец), целиком состоящий из нулей. Тогда определитель этой матрицы равен нулю, поскольку всякое слагаемое, входящее в состав определителя, должно иметь сомно жителем один из элементов этого нулевого ряда и, значит, обращается в нуль. 1.24 Если в квадратной матрице все элементы, стоящие по одну сторону главной диагонали, равны нулю, то такая матрица назы- вается треугольной. Другими словами, треугольными являются матрицы вида /йп0 0 ... О \ /a,Aavlai3 ... а1п \ | А21(7220 ... О 1 I О О22й23 а2л 1 I аз1аз2а33 ••• О I, 10 0 Пдз ... а3п I. \ап1ап,апз ... апп/ \Ь 0 0 ... апп / Определители таких матриц тоже называют иногда треугольными. Позже мы увидим, что к такому виду может быть сведено в опре- деленном смысле вычисление всякого определителя. Теорема. Определитель треугольной матрицы равен произ- ведению диагональных элементов. 57
Доказательство. Рассмотрим треугольную матрицу А, у которой все элементы, расположенные выше диагонали, равны ну- лю, т. е а;1 — 0 при i < j (для второго типа треугольной матрицы рассуждения аналогичны). Выразим определитель det А через элементы матрицы А (1.16). 'Ге произведения, входящие слагаемыми в состав определителя, которые содержат сомножителем хотя бы один нуль, лежащий вы- ше диагонали, будут заведомо равны нулю, и мы можем эти сла- гаемые не учитывать. Остаются лишь произведения вида «4*2/, - ап.п (сомножители располагаем по номерам строк), где /\ 1, /2 2. п. Так как /1( /2, ..., jn — попарно различные натуральные числа (они образуют перестановку чисел 1, 2, ..., п), то jt = 1, = 2, ..., jn = п. Следовательно, о — sign (1, 2. п) — 1 и рассматриваемый определитель состоит из одного произведения: det A =anai2 ... апп. 1.25. Обратим внимание на следующее обстоятельство. Вводя понятие матрицы, мы в качестве ее элементов брали произвольные числа. Поэтому для квадратной матрицы ее определитель есть число, специальным образом £ ыражающееся через элементы матрицы (1.16), Разумеется, можно рассматривать матрицы как таблицы с эле- ментами произвольной природы, не обязательно числами. Однако, чтобы можно было говорить в этом случае об определителе квадрат- ной матрицы в соответствии с определением 1.16, необходимо, что- бы с элементами матрицы можно было производить действия сложе- ния и умножения и чтобы для всякого элемента был определен эле мент, ему противоположный Например, такую общность можно получить, если в качестве элементов матрицы брать элементы про- извольного кольца. Тогда и определитель такой квадратной матрицы будет тоже элементом тоге же кольца. В практике и различных приложениях теории матриц и определителей часто приходится рассматривать матрицы и определители, элементами которых являют- ся, например, функции. При изучении определителей (так же как и матриц) мы не будем добиваться наибольшей общности в исходных понятиях. В наших рассуждениях вполне достаточно считать, что элементы рассматриваемых матриц и определителей являются чис- лами. Однако полезно иметь з виду, что все рассуждения в процессе наших исследований сохраняются и при достаточно широких об- общениях в исходных понятиях. § 2. Разложение определителей 2.1. В различных приемах вычисления определителей исполь- зуется возможность выражения определителя n-го порядка (n > 1) через определители более низких порядков, образованные по опре- деленному правилу при помощи данного определителя. 68
Пусть дапа квадратная матрица «-го порядка (п > I): /ailGl2 а1П А = | Л21а22 ••• ат ''ап1ап2 апп Вычеркивая в этой матрице произвольную i-ю строку и произволь- ный й-й столбец и не нарушая порядка оставшихся элементов, мы получаем квадратную матрицу порядка п — 1. Определитель этой матрицы называется минором матрицы А. соответствующим элементу, стоящему в i-й строке и /?-м столбце матрицы А, т. е. элементу aih. Обозначая этот минор через Mih, имеем- аи ••• ai(i'4-i) ••• а1П = a(i-1)(*+1) а(<+1)(4-1) " а(1Ч-1)п °л! ••• an(k-t) ап<' + 1) Минер , умноженный на = (-!)'«-Л1/й, называется алгебраическим дополнением элемента aih в матрице А (или—в определителе этой матрицы). 2.2. Пример. Для матрицы I 1 7 2\ 4—1—1 2 —5 \ 3 4 О/ алгебраическими дополнениями ее элементов являются: Аи = (-П’М • | \ | = 20, 412 = (-1)1+2- | “J -51 _15, 4I3= (-1)1+» X х|-34|=-10' Л21 = (—1)2+!-| 7 2|=8, 422 = (-1/+2.|U|=-6, 4М = (-1)2+3. ЦJ|=17, = 17, Х81 = (-1)3+| • | з _51 = -39, 432 = (-1)312 • [ _] _j| = 3, 433 =(-!)«+» X х|—1 2 ] = 2.3. Как следует непосредственно из определения, алгебраи- ческое дополнение элемента зависит от элементов соответствую- щей квадратной матрицы (являясь функцией от элементов матри- цы). Важно, однако, подчеркнуть и впоследствии иметь в виду, что алгебраическое дополнение Aik элемента atk не зависит от эле- ментов матрицы, стоящих в i-й строке, а также от элементов, стоя- щих в 6-м столбце. Другими словами, если квадратные матрицы 59
отличаются друг от друга лишь элементами ьй строки и А-гс столб- ца, то алгебраическое дополнение (/, &)-го элемента в одной матрице совпадает с алгебраическим дополнением (i, /г)-го элемента в другой матрице. 2.4. В связи с построением новых матриц и определителей из элементов какой-нибудь заданной матрицы очень важно все время иметь в виду, что, как правило, мы используем обозначения элементов, в которых индексы показывают номера строк и столб- цов, определяющих места элементов в исходной матрице. Во вноьь построенной матрице или определителе эти индексы могут уже не соответствовать новому расположению элементов. В таких случаях номера строк и столбцов надо определять непосредственно, уже не пользуясь лишь внешней формой обозначения элементов 2.5. Рассмотрим минер Mit, соответствующий элементу а1к квадратной матрицы А порядка п (2.1) Так как М1к получен в результате вычеркивания i-й строки и k-ro столбца, то элемент apq не обязательно будет находиться в р-й строке и q-м столбце определителя М1Ч.. Именно, он будет находиться в определителе Мт в строке с номером р', где р' = р. если р< I, и р‘ — р — 1, если р > i (очевидно, р Ф i, так как i-я строка была вычеркнута). Аналогично арч содержится в определителе М,-, в столбце с но- мером q , где q = q, если q < k, и q' = q — 1, если q > k. Минор М{к, как определитель (n — 1)-го порядка, является суммой произведений вида о'аЧ1 a h ... а^._} а^..^ ... а^. Хотя р и не есть номер строки, в которой apq содержится в Mik, множители этого произведения расположены в порядке возраста- ния номеров строк. Покажем, что знак а' определяется так: o' = sign (Л, /2, ..., /._р /<+1, ..., /,). Это следует из того, что число инверсий в (;\, /2, ..., )\_1г /|+1, .... /„) равно числу инверсий в (/”, .... /;_р /;+р .... /'), где /' суть номера столбцов в Л1а, содержащих соответствующие элементы. Действительно, пусть jr<jt. Если jr и jt одновременно меньше k, то /' = jr < jt = /'. Если jr и jt одновременно больше к, то /; = /7— 1 <jt— 1 - Наконец, если /7 < ^ < Л> то ir — !r< it— 1 ~ ir 2.6. Лемма. Пусть п-вектор (/ь /7, 1п) (п > О образует некоторую перестановку чисел 1, 2, ..., п и для некоторого номера i имеем /,. =₽ k Тогда sign(/\, /2, .... j,, jt+v .... /„)-= = (~1)‘+* • sign (Д, /2...д+1.......... /„). 60
Доказательство. В «-векторе (А. /2./(-1. /'. /;+1» -- /„) компоненту /; = k переставим на последнее место при помощи п — i последовательных ее замен местами с соседними компонен тами (без изменения порядка следования других компонент). Со- гласно 1.13 мы приобретем в результате дополнительный множитель (—!)«-»: sign (л, ;2. /(, //Ч1, .... /„) = (-l)nH sign (/1( /2, • ••, Л-i. /г+1> •••» in< к)- Используя определение знака вещест венного п-вектора (1.10) и учитывая, что среди чисел Д, /2, ..., it-i’ ii+i’ in содержится в точности п—k чисел, больших k, получаем: sign (Д, Д jt , /г+1, .... Д) = (-. sign (А. /г. -.А-.. Л+1, in) • (- !)""*= (—• sign (/„ Д /z_„ Л+„-./„) = (-D,+* • sign (Д, Д, ..., Л+1. •••. in)- 2.7. Теорема об алгебраическом дополне нии. Алгебраическое дополнение Alk элемента а1к квадратной матрицы п-го порядка / °11 ••• а1(Л—1) alk а1(Л-И) ••• Я1л а(1-ш ••• aa-\)k ац-w-и) •” аа-1)л ап а<(л-1) aik •" atn C(-+D(fe-i) aa+\)k а«+1)(Л-Н) ••• a«+i)„ a«l ••• ^n(k— 1) ®nk an(h+l) ••• ^nn равно определителю квадратной матрицы п-го порядка, получаемой из матрицы А заменой самого элемента alk числом 1, а всех осталь- ных элементов i-й строки и k-го столбца — нулями. Доказательство. Обозначим через D тот определитель «-го порядка, о котором говорится в теореме: °и ••• а1(л—1) 0 ai(/i+1) ... ахп 0 D = 0 .. 0 1 0 ... 0 au+i)i • а(.+1)(/г-1) 0 й(1 + 1)(/г+1) а(1+1)м аШ ••• an(k-l) 0 Ол(Л+1) ••• апп Выразим определитель D через его элементы (1.16), распола- гая сомножители в каждом произведении, сумма которых соста- вляет определитель, по номерам строк (1. i8). При этом, конечно, можно оставлять лишь те произведения, у которых из Ай строки сомножителем берется единица (произведения, содержащие сомно- жителями другие элементы i-й строки, равны нулю, и в сумме их 61
можно не учитывать). Поэтому определитель D оказывается равным сумме всевозможных произведений вида oaiZ1 %•, - «(‘-1)'/-! • 1 • ^‘+1)/^ - где с = sign (л, /2..k, ji+1, .... /„), /г = k. Как было показано в 2.5, Mitt есть сумма тех же произведений (исключение множителя 1 не существенно), но взятых с другим знаком: ° а|/, и2/2 ”• a(I-I);i+i a('+D д+1 ••• где о' = sign (ji, /2, ..., /г+1, ..., /„). Благодаря лемме 2.6 о = (—1)'+* sign (Л, /г. /z+1, /(+1, .... /„) = (-1)'+* • о*. Таким образом, каждое слагаемое определителя D отличается от соответствующего слагаемого минора Mik сомножителем (—1)/+А. Поэтому D = (_1) i+k. Mlk = Aik. 2.8. Значение понятия алгебраического дополнения состоит в том, что вычисление значения самого определителя можно в из- вестном смысле свести к вычислению алгебраических дополнений некоторых его элементов. А они являются уже определителями на единицу меньшего порядка и более простого вида, чем исходный определитель. Сказанное осуществляется на основании ниже следующей теоре- мы. Указанный там способ представления определителя обычно называется разложением определителя по соответствующему ряду. Теорема о разложении определителя. Определи- тель квадратной матрицы А п-го порядка равен сумме произведений всех элементов любого ряди на свои алгебраические дополнения, напри- мер: det А — alkAlk + a2hAik + ... 4- ankAak. Доказательство. Представляя определитель det А в виде суммы всевозможных произьедений элементов матрицы А, взятых по одному из каждой строки и по одному из каждого столб- ца (1.16), сгруппируем эти слагаемые, соединяя вместе произве- дения, содержащие один и тэт же элемент £-го столбца. В каждой группе вынесем этот общий множитель за скобки. Мы получаем следующее выражение для нашего определителя: det А — alkB1 4- a.2kB2 + ... -t- апкВп. Здесь каждое Bt является в свою очередь некоторой суммой про- изведений элементов матрицы Л. Важно отметить, что В, не зави- сит ни от элементов i-й строки, ни от элементов k-ro столбца матри- ца А (ведь в каждое из произведений, из которых получилось В;, не входят другие элементы из i-й строки и k-vo столбца, кроме а1к, который вынесен за скобки). Благодаря этому значение В. не из- менится, если мы на время в нашем равенстве положим все элементы 02
i-й строки и k-ro столбца матрицы А равными 0, за исключением элемента а1я, который положим равным 1. В результате этого слева в кашем равенстве мы вместо опреде- лителя матрицы А, очевидно, получим алгебраическое дополне- ние Л* (2.7), а справа все слагаемые, кроме одного, обратятся в пуль: Aik = 0 + ... + 0 + 1 • В, +0 + ... + 0. Мы показали, что В, = Alk (i = 1, 2, ..., и). Подставляя най- денные выражения для Bt в полученное выше выражение для det А, получаем требуемое равенство: cet А = + a2kA2h + ... + ankAnk. Мы получили разложение по столбцу. Рассуждение для разложе- ния по строке вполне аналогично. 2.9. Следствие об определителе, в котором все элементы ряда представлены в виде суммы. Если в квадратной матрице п-го порядка все элементы какого-нибудь ряда представлены в виде суммы двух слагаемых, то определитель этой матрицы равен сумме опре- делителей двух новых матриц п-гс порядка, у которых все элементы, кроме элементов указанного ряда, такие же, как и в заданной матри- це, а указанный ряд в одной из матриц состоит из первых слага- емых элементов указанного ряда, а в другой матрице — из вторых слагаемых. Другими словами, если, например, (аи ••• «цд-н (^и "Ь ciац*+1) •" ain \ а21 ... a.2,k_i} (b2l + с^ «2ц-Н) "• а'-” | «п • °7i(fe-l) ** cnf) ••• ann ) (all blR a (ft+i) a\n \ a21 a2[k-1) «2(fe-f-l) ”• a2n I 1) ••• ^nn) («11 ... «|(fe_|) Clfi ai(*+l ••• «In \ «21 «2( -1) C2h «2(H-D fl2« I anl Un'k-l) Сп’г az.(*+D •” a'-nJ TO det A = det At + det A2. Доказательство. Прежде всего заметим, что для всех трех матриц элементы k-ro столбца имеют одинаковые алгебраиче- ские дополнения. Используя разложения определителей рассмат- риваемых матриц но k-му столбцу, получаем нужнее соотношение: Ф1Ь + си)Л1Л+ (b2h + c2h)An -Ь ... + Cnk) А-nk — (bikAlk+ b2kA2k+ ...+ ^nk^nk) + (ciMih + Сг1Л2;1+ ... A-cnkAnk). b3
2.10. С л е д с т в и е о замене ряда. Сумма алгебраиче- ских дополнений элементов какого-нибудь ряда квадратной матрицы п-го порядка А, умноженных на числа ?.1( Х2, ..., Х,г, равна определи- телю матрицы А', которая получается из А путем замены данного ряда новым, составленным из чисел Zt, К2, Лл, например: т~^2'4гл+---+^Ллл —— ЙП ••• al(fe—1)'-1с1(н+1) ••а1л °21 ••• a2(k—1) ^-£а2(Ы 1) anl ••• an(k-\)Ktan(k+l) “-ann Доказательство. Прежде всего отметим, что алге- браические дополнения элементов /г-го столбца у исходной матри- цы Л и у построенной матрицы А' одинаковы. Раскладывая опре- делитель матрицы А* по й-му столбцу, мы сразу получаем, что он равен указанной в формулировке следствия сумме. 2.11. Примеры. 1) Разложим определитель D = 9 0 0 5 10 0 2 0 8 5 7 0 3 12 по первой строке: 0 0 2 1 0 0 О II сс т 8 5 7 + 5 • (-1)1*-4 • 0 8 5 3 1 2 0 3 1 (нулевые слагаемые не записываем). Затем каждый из полученных определите- лей третье-о порядка тоже разлагаем по первой строке: 0=9-2- ||f| — 5-||||=||^1-(13 — 5) = (-7) 13 = -91. 2) Определитель I 1 + адх 1 + ад2| I 1 + ад 1 + ад4; путем неоднократного применения к нему следствия 2.9 можно представить в виде суммы четырех определителей: 11 + ад 1 + ад21 = 11 11 । I (ад) 11 > 11 (ад?) I _ । (адо (ад?) I 11 + ад. 1 + а2аг | | 1 1 | “ | (адг) 1 | + | 1 (ад2) | | (а2сц) (а2а2) '• Среди полученных определителей первый и последний, очевидно, равны нулю. Поэтому исходный определитель оказывается равным | (ад) 1 I + 11 (ад) | = — fl2ai + °2 ~ Ъ02 = (а1 ~ а^“- § 3. Преобразования определителей 3.1. Вычисление определителей произвольного порядка зна- чительно облегчается, если пользоваться теми или иными преоб- разованиями матриц. Конечно, при этом необходимо установить, как меняется определитель квадратной матрицы ст изменения са- мой матрицы. При совершении преобразования квадратной матри- 64
цы говорят также, что преобразование совершалось и над опреде- лителем этой матрицы. 3.2. В качестве первого свойства отметим равноправие строк и столбцов квадратной матрицы при вычислении ее определителя. Всякой квадратной матрице (и11Л14 ••• а21а2а ••• й2п ••• апп можно сопоставить матрицу, полученную из Д заменой всех строк соответствующими по номеру столбцами. Полученная матрица, которую обозначим через Д*, называется транспонированной к А (наравне с Л* для транспонированной матрицы часто употреб- ляв! ся и другое обозначение Д'): /аПа21 ••• ащ Д* =| ®12®22 ••• &П2 \а1пагп ... апп Вполне очевидно (Д*)* = Д, т. е. матрицы А и А* взаимно транс- понированы. Часто и про определитель матрицы Д* говорят, что он транспо- нирован по отношению к определителю матрицы А. Преобразование 1 (транспонирование). Определитель матрицы, транспонированной к данной квадратной матрице, равен определителю данной матрицы. Или, коротко, при транспо- нировании квадратной матрицы определитель ее не меняется: det Д* <= del А. Доказательство. Согласно определению 1.16 опреде- литель det Д есть сумма всевозможных произведений вида оа, а.. ... а, . , Ч а ЧЧ £п п где последовательности номеров строк !\, (2, .... („и номеров столб- цов л, /2, ..., /„ образуют перестановки чисел 1, 2, ..., п, а = sign (tr, i2, ..., i„) • sign (/-, /2, .... /„). Спределитель det Д* представляется в виде суммы таких же произведений, но с той лишь разницей, что 1ь i2, ..., in являются уже номерами столбцов, а /\, /2, .... /„ — номерами строк тех же элементов в матрице А*, и поэтому знак с* рассматриваемого про- изведения, входящего в состав det Д*, равен: о* = sign (Л, /2, .... /„) • sign (4, i2, .... i„). Так как о* = о, то det А и det А* состоят из одних и тех же слагаемых, а потому det Л = det Д*. 3 Заказ 853 65
3.3. Благодаря 3.2 можно говорить, что строки и столбцы опре- делителей равноправны. Другими словами, всякое свойство, до- казанное для столбцов произвольного определителя, справедливо и для строк. Так же и наоборот. Действительно, транспонируя произвольную квадратную мат- рицу, мы не меняем ес определителя, но строки ее становятся столб- цами. Поэтому всякое свойство, доказанное для столбцов произ- вольных определителей, оказывается справедливым и для строк. Благодаря отмеченному обстоятельству мы в дальнейшем, при изучении определителей, формулируя то или иное свойство и для строк, и для столбцов (для краткости называя их, как обычно, рядами), доказывать его будем обычно только для столбцов. Спра- ведливость его для строк будет непосредственно следовать из доказанного выше. Впрочем, благодаря полной симметрии между строками и столбцами в определении определителя доказательство какого-либо свойства для строк всегда оказывается совершенно аналогичным доказательству для столбцов и может быть без труда повторено независимо. 3.4. Преобразование 2 (умножение ряда па число). Если в квадратной матрице все элементы какого-либо ряда умножить ни число X, то и определитель этой матрицы тоже умножится на %. Или коротко: общий множитель всех элементов любого ряда опре- делителя можно вынести за знак определителя. Другими словами, если, например, /ап ... а11г ... а1п \ /ап ... (1йи) ••• а1я \ / = | ••• аги а2п I Д'= | а21 ••• ••• агп ' \дя1 ... апк ... апп / \йл1 ... (ХанА) ... апп/ то det Д' = % • det Л. Доказательство. Разлагая определители обеих матриц но 4-му столбцу (предварительно заметив, что алгебраические до- полнения элементов 4-го столбца у данных матриц одинаковы), получаем: det А — a1kAlh -)- aikAik ... +• &цкАпк, det Д' == (Xaik)Alk + (ka,ik)Aik + ... + (Ka,lk)Arlk = — К (а1Итй + + ••• + anAnkd — • det Д. 3.5. Пример. Свойства рассмотренных преобразований, гак же как и последующих преобразований, облегчают вычисление определителей. Рассмот рим, например, следующий определитель седьмого порядка; 0 1 2 3 4 5 6 —2 0 2 4 6 8 10 —G —3 0 3 6 9 12 D = —12 — 8 —4 0 4 8 12 —20 —15 —10 —5 0 5 10 —30 —24 —18 —12 —6 0 6 —42 —35 —28 —21 —14 —7 0 66
Вычисление такого определителя непосредственно с помощью определения определителя потребовало бы громадных вычислений (71 = 5040 слагаемых!). Вместо этого мы применим сначала второе преобразование, вынося за знак опре- делителя из второй строки общий множитель — число 2, из третьей строки 3, из четвертой 4, из пятой 5, из шестой 6, из седьмой 7. Обозначая ный определитель через D', имеем: вновь получен- D -- (2 • 3 • 4 • 5 • 6 • 7) • D'= ЗО4С • О —1 —2 -3 — 4 —5 —б 1 О —1 — 2 -3 —4 —5 2 1 О —1 —2 —3 —4 3 2 1 О -1 —2 -3 4 3 2 1 О -1 —2 5 4 3 2 1 О —1 8 5 4 3 2 1 0 Умножим все строки определителя D’ на —1, а затем транспонируем полученный определитель. В результате мы, с одной стороны, получаем тот же самый опреде- литель О', а. с другой стороны (бла-одаря первому и второму преобразованиям), мы должны получить новый определитель, отличающийся от О' множителем (—1)’ = —1, т. е. — D’ = D'. Отсюда следует, что D’ — 0. А значит, и 0 = 0. Легко заметить, что рассуждения, аналогичные проведенным для D', могут быть осуществлены для любого определителя, у которого (такие определители называются кососимметрическими) и порядок которою есть не- четное число. Всякий такой спрсделитель оказывается ьавным нулю. 3.6. Преобразование 3 (перестановка параллельных рядов). Если в квадратной матрице поменять местами два парал- лельных ряда, оставив остальные на своих местах, то определитель полученной матрицы равен определителю исходной матрицы, умно- женному на —1. Или коротко: при перестановке параллельных рядов меняется знак определителя. Если, например. /аи ... ... аи ... а1п Л =| аМ "• йНг ••• °21 ••• агп \оя, ... апь ... а,а ... апп . /ап ... alt ... a,k ... ain Л'= I а21 a2l ••• a2h ••• a2n ... anl ... ank ... ann. н k I, to det A’ — —det A. Доказательство. В матрицах А и А" одинаковые по номеру строки состоят из одних и тех же элементов, но по-разному расположенных (меняются местами k-я и l-я компоненты). Г1оэтому определители det А и det Л' представляются в виде суммы одина- ковых произведений вида ^,«24 - ап,п (сомножители располагаем по номерам строк), по входящих в соста- вы det А и det Л' с разными знаками. В состав det А произведение указанного вида входит со знаком о = sign (А. /2, .... /„). Чтобы найти знак о', с которым рассматриваемое произведение входит в состав del Л', нужно в n-векгоре (/1( /2, ... , /„) поменять два номера, один из которых равен k, а другой I. а* 67
Знак при нашем произведении согласно 1.13 изменится на про- тивоположный, т. е. о' = —о. Следовательно, все произведения, в сумме составляющие det Л, входят в состав det А1 с противоположным знаком. Поэтому det А' = —det А. 3.7. Следствие об определителе с двумя пропорциональными рядами. Если квадратная матрица имеет два пропорциональных ряда (т. е. один из них от- личается от другого числовым множителем), то определитель этой матрицы равен нулю. Другими словами, если, например, в матрице /ап ... alh ... й1( ... а1п \ Д —I а21 a2k а21 ^2.1 I \uni .. ank ... а.:1 ... оПЛ г имеет место ait = kaik (i = 1, 2, ..., n), ft =+ /, то det А = 0. Доказательство. Вынося из /-го столбца общий мно- житель К, мы получаем матрицу А' (у которой ft-й и /-й столбцы одинаковы), такую, что det А = X det А" (3.4). Переставляя ме- стами ft-й и Ли столбцы в матрице А', мы не меняем матрицу А', но, с другой стороны, знак ее определителя должен измениться на противоположный (3.6), т е. det А' — —det А'. Следовательно, det А' = 0, и поэтому det А = 0. 3.8. Примеры. 1) Вычислим определитель 12 3 4 5 6 7 8 Щ Я 2 b b b t> Представляя элементы второй строки в виде суммы 5 = Ц-4, 6=2+4, 7=3+4, 8=4+4, мы можем представить определитель D в виде суммы двух определителей (2 9): Каждый из полученных определителей имеет по две пропорциональные строки. У первого определителя первая строка просто равна второй, а у второго опреде- 5 о , лителя последняя строка отличается от второй множителем —. Значит, оба опре- делителя равны нулю. Поэтому и D = 0. 2) Вычислим определитель n-го порядка (n > 1) D = 1 1 1 ... 1 1 0 2 2 ... 2 2 0 0 3 ... 3 3 0 0 0 ... (п — 1) (п - 1) (л —1) (п — 1) (п — 1) ... (п — 1) п 68
Представляя элементы последней строки в виде суммы п — 1 = (п — 1) + 0, я = (я — 1) + 1, мы разложим D в сумму двух определителей (2.9): 1 1 1 ... 1 1 О 2 2 2 2 О 0 3 ... 3 3 О 0 0 ... (я — 1) (я — 1) („ _ 1) (Л - 1) (П - 1) . . . (я - 1) (я - 1) 111. 1 1 0 2 2 2 2 + 0 0 3 3 3 0 0 0 - 0-1) (л - 1) 0 0 0 0 1 В первом определителе два последних столбца одинаковы, поэтому он равен нулю. Второй определитель имеет треугольный вид и, значит, он равен произве- дению диагональных элементов Следовательно, D = 1 • 2 ... • (я — 1) • 1 = (я — 1)! 3.9. При помощи 3.7 мы можем вывести из теоремы о разложе- нии определителя (2.S) еще одно полезное свойство. Следствие из теоремы о разложении опре- делителя. Сумма произведений элементов произвольного ряда квадратной матрицы на алгебраические дополнения соответствую- щих элементов другого параллельного ряда равна нулю. Например, для матрицы I а,л ... alh... аХ1 ... а1П А — I °2i ••• °2Л ••• °2Z ••• агп Йл1 ••• йлй ••• ®л/ ••• йлл где k I, имеет месте: alk^U + a2k^2l + ••• + ank^nl — 0. Доказательство Интересующая нас сумма равна определителю матрицы, полученной из А заменой I го столбца эле- ментами й-го столбца (2.10). Но такой определитель равен нулю, как имеющий два пропорциональных ряда (3.7). 3.10. Теперь перейдем к рассмотрению преобразования, по- жалуй, наиболее полезного при вычислении определителей. Преобразование 4 (сложение параллельных рядов). Определитель квадратной матрицы не изменится, если к какому- нибудь ее ряду прибавить другой параллельный ряд, умноженный на произвольное число Л. 09
Если, например, / аи ... ... Яц ... а1л / = I ^21 " a"zh " а-1 " ап1 ••• апК — ат ••• апп Й11 • • • alh • • • (aiz + ^alfe) • • • aln a2l • • • a2k • • (a2l + ^°2&) • • • агп A' = \йЯ1 • • • UnR . . . (llni -f- • • • &nn И ^ /, TO det A' — det A. Доказательство- Определитель det А' можно пред- ставить согласно 2.9 в виде суммы определи!елей двух матриц, одна из которых совпадает с матрицей Л, а у второй Л-й и /-й столб- цы пропорциональны Определитель зтсрсй матрицы равен нулю (3.7). Следовательно, det А' — det Л. 3.11. Рассмотренные выше преобразования квадратных матриц в связи с гычислением их определителей изучались нами раньше в общем случае для произвольных (не обязательно квадратных) матриц в связи с вычислением рангов матриц (I, § 3). Мы видели, что вычисление ранга матрицы сводилось к приведению матрицы к диагональному виду (или к виду I, 3.14). Проследим за определителями квадратных матриц, получаю- щихся в процессе приведения данной квадратной матрицы к диа- гональному виду. Это поможет нам получить один удобный способ вычисления определителей. 3.12. Пусть нам дана квадратная матрица n-го порядка / апа1г ... а1я А = I a21fl22 ••• а2л ап1ап2 ••• апп С помощью элементарных преобразований матриц (I, 3.4) — перестановки параллельных рядог (элементарное преобразова- ние 2)) и прибавления к одному ряду другого параллельною ряда, умноженного на какое-нибудь число (элементарное преобразова- ние 5)), — будем приводить матрицу А к диагональному виду так, как указано в доказательстве теоремы I, 3.6 (можно ограничиться и видом I, 3.14). При выполнении указанных преобразований мы будем получать квадратные матрицы того же порядка п. Благодаря 3.6 и 3.1С определители этих матриц будут или совпадать с определителем матрицы А, или отличаться от него знаком. 70
Если в процессе выполнения преобразований встретится мат- рица с пулевым рядом, то ее определитель, а значит, и определи- тель матрицы А окажутся равными нулю. Если же нулевого ряда не встретится, то в результате мы с помощью двух указанных выше элементарных преобразований приведем матрицу А к тре- угольной матрице (1.24) и-го порядка с ненулевыми диагональными элементами. Определитель такой матрицы равен произведению диагональных элементов. Что касается определителя самой мат- рицы А, то он, как уже сказано, или равен полученному опредсли- .тслю, или отличается от него лишь знаком Указанный выше процесс, проведенный с целые вычисления определителя матрицы А, называют приведением определителя det А к треугольному виду. Этот процесс осуществляется в соот- ветствии с упомянутыми преобразованиями, проводимыми над мат- рицами. 3.13. Пример. Вычислим следующий определитель, приведя его к тре- угольному виду: 3 3 2 0 —4 1 —4 7 5 0 5 2 0—5 2 3 1 3 2 0 0 1—4 7 0 0 5 2 —2—5 2 3 13 2 0 0 1—47 0 0 5 2 0 1 6 3 13 2 0 0 1-4 7 0 0 5 2 0 0 10—4 13 2 0 0 1-4 7 0 0 5 2 0 0 С- -а Здесь второй определитель получен из исходного при помощи вычитания третьего столбца из первого. Затем к четвертой строке полученного определите- ля прибавили первую строку, умноженную на 2, и так далее. 3.14. Как уже отмечалось, вычисление определителей высоких порядков непосредственно на основе определения (1.1G), как пра- вило, чрезвычайно громоздко. С ростом порядка определителя число слагаемых растет с не- вероятной быстротой (и это естественно для числа п!, равного со- гласно 1.19 количеству слагаемых определителя n-го порядка). Существуют различные общие приемы, основанные на свойствах определителей, позволяющие производить вычисления определи- телей с небольшой затратой сил. Укажем наиболее распространен- ные из таких приемов. . Один из приемов состоит в том, что вычисляемый определитель выражают через другие определители меньших порядков. Эти последние в свою очередь выражают через определители еще мень- ших порядков и т. д., пока не сводят вес к определителям вто- рого порядка, которые вычисляются непосредственно. Указанное снижение порядка осуществляется на основании георемы о разложе- нии определителя (2.8). Другой прием заключается в том, что при помощи тех или иных преобразований рассматриваемый определитель приводят к такому 71
определителю, величина которого известна. Важнейшим опре- делителем такого типа является треугольный определитель (1 24) Можно указать также равный нулю определитель с пропорциональ ными параллельными рядами (3.7), и б частности определитель с нулевым рядом (который, очевидно, пропорционален любому ря- ду). В практике встречаются и другие заранее известные опре- делители, к которым свидится вычисление целого ряда определи- телей. Особенно отчетливо рассматриваемый прием проявляется при приведении всякого определителя к треугольному виду (3.12). Наиболее распространенным можно считать способ вычисления определителей, использующий одновременно оба указанных выше приема. Он особенно удобен при вычислении определителей не очень больших порядков, причем в случае, когда не заметно какой- либо удобной закономерности в строении определителя (иначе обычно целесообразнее выбирать способ, связанный с этой зако- номерностью). Поступают следующим образом. В произвольном ряду определителя с помощью какого-нибудь ненулевого элемента (лучше всего брать ±1) обращают все другие элементы этого ряда в нуль (так, как при приведении к треугольному виду). Затем раз- лагают определитель по этому ряду, Такое разложение дает лишь одно ненулевое слагаемое, т. е. выражает наш определитель через новый определитель, порядок которого на единицу меньше поряд- ка исходного определителя. К полученному определителю снова можно применить аналогичные рассуждения. Отметим, наконец, еще один прием. Он состоит в том, что исход- ный определитель опять-таки при помощи преобразований и раз- ложений приводят к определителю, связанному каким-либо удоб- ным образом с исходным. Получаемая зависимость и позволяет вычислить определитель. Например, нередко удается выразить определитель, заданный при помощи какой-нибудь летке формули- руемой закономерности, через определитель, заданный при по- мощи этой же закономерности, но имеющий меньший порядок. Полученная зависимость позволяет найти значение рассматрива- емого определителя при помощи индуктивного рассуждения. 3.15. Примеры. 1) Вычислим определитель 2 4 3 6 3 2 2 1 1 3 о = С 7 2 -1 4 1 1 —2 0 —2 11 10 4 & 17 При помощи элемента а23 = 1 получим нули во второй строке. Для э~ого при- бавим к первому столбцу третий, умноженный на —2, ко второму — третий, умноженный на —2, к четвертому —третий, умноженный на —1, к пятому — третий, умноженный на —3. Получим: —4 —2 3 3 -6 0 0 1 0 0 D = 2 3 2 —3 —2 5 5 —2 2 4 3 2 4 4 5 72
Разложим определитель по второй строке: D = (- 1)г+3 • —4 —2 3 -6 2 3—3—2 5 5 2 4 3 2 4 5 Аналогичным образом, преобразуя и разлагая получаем: получающиеся определители, —4 2 3 —6 2 1 —3 —2 5 0 2 4 3—1 4 5 -8 0 9 —2 2 1—3—2 5 0 2 4 5 9 1 3 —53 9 —29 —5 2 —2 0 1 0 = —(—1)3+3 -5 5 —29 —1 —2 = -39. 2) В качестве примера вычисления определителя с помощью приема вто- рого типа (3.14) рассмотрим вычисление определителя 1 -г ад 2 + ак 3 + aj ... п + Я1 1 + 3j 2 + а2 3 + а2 ... я 4~ а3 1 + а, 2 + а3 3 -|- з3 ... я + а3 1 + ап 2 + ап 3 + ап ... п + ап порядок которого п произволен. Здесь аг, аг. а3, ... , а„ —любые числа. Если n = 1, то Dj = 1 + аг Если п = 2, то по правилу вычисления определителей второго порядка имеем: D2 — |} 2 + с2 I ~ ~ + ai) — ai ~ ал Пусть л > 3. Тогда вычтем из каждого столбца, начиная со второго, пер- вый столбец. Получим: 1 + зг 1 2 ... п — 1 1 + а2 1 2 ... я — 1 1 + а3 1 2 ... я — 1 1 + а„ 1 2 .’..'я — 1' Полученный определитель имеет пропорциональные столбцы, и, значит, он разек нулю: Dn = 0 (я — 3, 4, 5, ...). 3) Сведи определителей, величина которых известна и к которым прем преобразований иногда удается привести различные другие определители, сле- дует указать так называемый определитель Ван-дев-Монда. Он встречается в различных вопросах, в которых находит свое применение теория определителей. Для всякого порядка п — 2, 3, ... определен определитель Ваи-дер-Монда, имеющий следующий вид: 1 1 1 ... 1 1 31 #2 «3 ... зл—1 ая 9 2 2 2 „2 Vn(at, at, . : Сп) = а1 С2 а3 ••• ап—1 ап о" 2 а"’ -2 п-1 “3 °" -1 дП- а2 -1 ап~! а3 - аПаГ1 Вычисление этого определителя производится в соответствии с последним из указанных в 3.14 приемов вычисления определителей. 73
Именно, мы постараемся выразить V„ через Vn_4. Для этого из последней л-й строки вычтем (п — 1)-ю, умноженную на alt затем из (п — 1)-й вычтем (п — 2)-ю, умноженную на и т. д. и, наконец, из второй — первую, умножен- ную на av В результате получим: Vn а2......... а„) = 11 1 ... 1 1 О а» — О] а3 — at ... a„_t — at ап — ar О a^ — ata2 al — а,а3 ... o2_j — a,an^t а%—atan n „П—2___ „ П—3-П—2___n „n~Z nn~2__ n лл—3 nn~2 n nn—3 U a2 —ala2 a3 —ala3 an— 1 alan- 1 an —alan n „n—1 „ „л—2 „n—1 „ „1—2 „n—1 „ „п—2 „П—1 „ „1—2 0 a2 —ala2 a3 ala3 •" an— 1 — а1ал-1 °n —ala,i Разложим определитель по первому столбцу и вынесем общие множители а2 — ах, а3 — av ..., ап — at из столбцов за знак определителя: 1 1 ... 1 1 а2 а3 ... an-t ап Vn (at, а2, , а„) = (а2— at)(as—ai) ... (ап—ax) • аГ3 «Г3 а"-2 а""2 • <4 «Г3 • СМ 2 Получившийся справа определитель порядка п — 1 имеет то же строение, что и исходный определитель, и может быть обозначен через V„-t (а2, а3.....ап). Таким образом, для любого п > 2 получаем соотношение: Va (oi, а...... ап) = (а2 — а4) (а, — ах)... (а„ — а4) V п_г (аг, а3, .... а„). (Соотношения подобного типа называются рекуррентными.) Пользуясь этим соотношением, вычисляем Уп при малых значениях л: I* 1 I Vj (fli, fl2) — J I — — ^1» (ах, а2, а3) = (а2 — aj (as — aj • V2 (a2, a3) = (a2 — aj (a3 — at) (a3 — a2), («I, a2, a3, o4) = (a2 — oj (a3 — aj (a4 — at) • V3 (a2, a3, at) = f| (аг—a7). Докажем по индукции, что вообще V„ (alt a2, .... an) = П (ai ~ aj) (n = 2- 3- 4- •••)• K/<i<n Справедливость этого равенства для п =2 уже проверена. Теперь предполо- жим, что доказываемое равенство справедливо для л — 1 (л > 2), и покажем, что отсюда вытекает его справедливость для л. Действительно, используя полу- ченную выше зависимость для V„, получаем: V„ (ai, а3.. ап) — (а2 — а4) (а3 — о4) ... (ап — а4) • (аг< аз> •••> ап) — = (аа — at)(a3— ... (ап — aj • Ц (at — aft = П («i — aft. 74
§ 4. Использование определителей в вопросах линейной зависимости векторов 4.1. При рассмотрении вопросов, связанных с линейной за- висимостью n-вскторов, следует иметь в виду следующее свойство. Пусть заданы какие-нибудь п-векторы: = (а11, й12» •••, aJrt)> О2 = (С2Х, а22, •••> ^2л)» ®тп = ®гп2> •••» ^тл) • С помощью этих /г-векторов можно образовывать системы, со- стоящие из А-векторов (k п) по следующему правилу. Берем k каких-нибудь натуральных чисел, не превосходящих п: А < !г < < !k- Выделяя в каждом из рассматриваемых /г-векторов k компонент с номерами /ъ /2, ..., )к, составляем из выделенных компонент /г-векторы: «! =(«!-.» “1/? «2=(а2Л, а2/., .... а2/д), В отношении линейной зависимости между исходной системой n-векюров и построенной системой ^-векторов устанавливается следующая связь. Если uit tl2, ..., ит линейно зависимы между собой, то и векторы «J, »2> •••> ит тоже линейно зависимы между собой. Действительно, соотношение «i«i + а4и2 + ... 4- атит = 0„ означает, что ад, 4- a2a2J 4- ... 4- amamJ = О при всяком / = 1, 2, ..., п. Следовательно, при любом выборе /2, .... Д для построенных ^-векторов и!, и'2, .... и‘п имеет место; ах»; + а2»; + ... + ати’т = 0h. Обратнее утверждение, конечно, может оказаться неверным. Например, для произвольных линейно независимых между собой n-векторов «х, и2, ..., ит (количество которых согласно I, 2.17 не превосходит п: т^п) всякая система ^-векторов и[, и’2, ... , яп, построенных указанным выше способом при помощи выделения k компонент у исходных векторов при k < т, является согласно I, 2.17 линейно зависимой. 75
4.2. Напомним, что вопрос о линейной зависимости н-векторов 1'1 = (й11. й12> •••> а1п)< W. = (^21’ ^22» Поп), 1*т — Vlml< •••> ^тгг) может быть выяснен при помощи вычисления ранга матрицы й11й12 ••• а1.п °21а22 ••• а2п 'йт1^т2 ••• @,пп Из определения ранга матрицы (I, 3.8) следует, что векторы «1, и8, .... ит будут линейно зависимы между собой тогда и только тогда, когда rang А < т. 4.3. В случае, когда количество n-векторов совпадает с п, вопрос о линейной зависимости их решается при помощи опреде- лителя матрицы, составленной из этих п-зекторов. Т е о р е м а. Пусть для векторов «1 — (й111 а12, •••> Qln)> U2 — (а21> Й22> •••> fl2rt)> составлена квадратная матрица /anai2 а1п А. = I а21а22 й2л &пп Если det А = 0, то rang А < п, т. е. векторы щ, и2.ип линейно зависимы между собой. Если det А У=0, то rang А =п, т. е. векторы uL, иг, ..., ип линейно независимы между собой. Доказательство. 1) Если матрица А является диаго- нальной с ненулевыми диагональными элементами, то rang А = п (I, 3.10) и det А = апа12 ... апп=£0 (1.24). 2) Если матрица А содержит нулевой ряд (например, строку), то rang А < п (система строк линейно зависима) и det А — 0 (1.23). 3) При помощи элементарных преобразований, состоящих в перестановке параллельных рядов и прибавлении к одному ряду другого параллельного ряда, умноженного на какое-нибудь число (I, 3.4), матрица А может быть приведена согласно 3.12 к матрице А', имеющей один из рассмотренных выше видов, т. е. матрица А' или диагональная, или обладает нулевым рядом. При этом rang А’ = = rang А и det А' = ±det А (3.12). Так как для А' доказываемое 76
утверждение справедливо, то оно оказывается справедливым и для матрицы А. 4.4. Пример. Выясним, при каких значениях а векторы (1,2. а, 0), (а, 1, 0 а), (0, а, 2, 0), (1, —2, 2, 1) будут линейно зависимыми. Для этого следует найти все такие а, которые обра- щают в нуль определитель 1 2 а 0 а 10а 0 а 2 0 1—221 Вычитая из первого столбца последний и затем производя необходимые раз' ложения, находим значение нашего определителя: D = 1 2 а 0 0 10а 0 а 2 0 0-221 1 0 а а 2 0 —2 2 1 _2 11 = 2а2 + 4а + 2. Только одно число обращает D в нуль: а = —1. 4.5. Из 4.3 непосредственно следует, что произвольный опре- делитель обращается в нуль тогда и только тогда, когда его строки линейно зависимы между собой. Благодаря равноправию строк и столбцов определителя (3.3) такое же утверждение справедливо и в отношении столбцов определителя. Полезно обратить внимание на то, что частными случаями этого являются рассмотренные ранее определители с пропорциональными параллельными рядами, в том число содержащие нулевой ряд. 4.6. Примеры. 1) Пусть система, состоящая из n + 1 линейных урав- нений с п неизвестными «11*1 + «12*2 + ••• + «1Л*Л = К, «21*1 4“ «22*2 4“ 4“ «?Л*Л ^2’ «л1*1 4“ «л2*2 4” •••4" апп*п — Ьп, 1 а(л-Н)1*1 + «(«+1)2*2 4- ••• 4" а(п4-1)п*л = *л+1> разрешима. Расширенная матрица системы В квадратная (п + 1)-го порядка. Наличие решения системы означает, что последний столбец матрицы В линейно выражается через другие столбцы. Следовательно столбцы матрицы В линейно зависимы, и поэтому согласно 4.5 det В = 0. 2) На основании 4.5 может быть получено удебное правило для нахожде- ния базисов в n-мерном координатном пространстве: п-векторы «1 = («11 ’ «12..«1л)’ и2 = (a2j, а22, •••, «ал)» 11П (ап1> аЯ& •••’ «Лл) образуют базис в У1л1 тогда и только тогда, когда они линейно независимы, что благодаря 4.5 означает: «11 «12 ••• «1Л «21 «22 ••• «2Л 0 «гл апг ••• апп 77
4.7. К понятию ранга матрицы, а значит, и к понятию ранга системы п-векторов может быть осуществлен подход на основе рас- смотрения определителей, которые могут быть составлены по опре- деленному правилу из элементов данной матрицы. Определение. Пусть в матрице 'а11 а12 ••• а1л й21 а22 ... ain ^ml ^m2 ••• ^тп' выделено k каких-нибудь строк с номерами < t2 < . . < ik и k каких-нибудь столбцов с номерами L <h < ••• < /л- Определи- тель квадратной матрицы k-го порядка, составленный из элемен- тов, стоящих на пересечении указанных строк и столбцов ai,i, ащ,_ алЦ а‘2.', аШ, " а,Л aik!\ aik’\ ••• aikjk называется минором k-го порядка матрицы А. Про этот минор говорят также, что он сформирован при помощи выделенных строк и столбцов. Разумеется, матрица может иметь много различных миноров одного и того же порядка. Легко видеть, что для всякой (т, п)- матрицы и натурального числа k (k т, k п) можно сформиро- вать различными способами С^г • Ckn ее миноров k-ro порядка. Заметим, что всякий минор, соответствующий какому-нибудь элементу квадратной матрицы п-ro порядка (всмысле 2.1), является минором (п — 1)-го порядка в смысле предыдущего определения, в формировании которого принимают участие все строки и все столбцы данной матрицы, за исключением той строки и того столб- ца, в которых стоит выделенный элемент. 4.8. Пример. Для матрицы 1 2 —2 — 1 \ —2 —4 4 2 ' 3 6 10 5/ можно различными способами составить четыре минора третьего порядка. В формировании каждого из них участвуют все три строки ма-рицы А и какие- нибудь три ее столбца. Так как первая и вторая строки матрицы А пропорциональ- ны, то все ее миноры третьего порядка равны нулю. Рассмотрим миноры второго порядка. Количество их намного больше, чем миноров третьего порядка. Для матрицы А можно составить С| • = = 3 • 6 = 18 миноров второго порядка. Найдем среди них ненулевые. Если в формировании минора второго порядка участвуют первая и вторая строки, то благодаря пропорциональности этих строк всякий такой минор равен пулю. Сле- довательно, надо выделить первую и третью строки матрицы А Выделяя первый и второй столбцы, а также третий и четвертый, мы получаем миноры второго ло- 78
рядка, очевидно, равные нулю. Остаются лишь четыре минора второго порядка, которые отличны от нуля: Миноры первого порядка — это сами числа, составляющие матрицу Д. 4.9. Ранг матрицы может быть установлен на основе рассмот- рения ее миноров, отличных от нуля. Теорема о ранге матрицы. Ранг ненулевой мат- рицы /а11 а13 а1п \ Л __I -*31 °33 ••• a2,t I ''^ml^rr.2 ®1яп' равен наибольшему из порядков отличных от нуля миноров этой матрицы. Доказательство. Пусть rang А = г. Для простоты обозначений можем считать, что базис системы строк матрицы А образуют ее первые г строк. Поэтому ранг матрицы тоже равен г. Значит, в матрице А’ найдутся и г линейно независи- мых между собой столбцов. Минор л-го порядка матрицы А, со- ставленный при помощи г указанных столбцов и первых г строк, отличен от нуля согласно 4.5 (поскольку его столбцы линейно не- зависимы). Всякие k строк матрицы А при k > г линейно зависимы между собой. Поэтому всякий минор &-го порядка матрицы А имеет бла- годаря 4.1 линейно зависимые строки и, следовательно, равен нулю (4.5). 4.10. Доказанная теорема дает основание для еще одного часто используемого определения ранга матрицы. Рангом ненулевой матрицы называется наибольший из порядков отличных от нуля миноров данной матрицы. Другими словами, натуральное число г является рангом мат- рицы А, если найдется хотя бы один отличный от нуля минор г-го порядка матрицы А, а все ее миноры более высоких порядков равны нулю. Сразу же отметим, что если равны нулю все миноры k-ro по- рядка матрицы А, то rang Я < k. Действительно, всякий минор /-го порядка матрицы Л при I > k можно путем разложения по какому-нибудь ряду представить в виде суммы определителей (/ — 1)-го порядка, а эти последние можно спять разложить, и так продолжать до тех пор, пока исходный определитель /го по- 79
рядка не представится в виде суммы определителей й-го порядка. Все последние определители являются минорами нашей матрицы. Поэтому они равны нулю. Следовательно, равен нулю и всякий минор /-го порядка матрицы А. 4.11. Пример. Ранг матрицы /1 2—2 —1\ А = — 2 — 4 4 2 \ 3 6 10 5/ па основании рассуждений, проведенных в примере 4.8, равен двум. 4.12. С помощью ненулевых миноров матрицы удобно выяснять вопрос о линейной независимости рядов матрицы. Теорема, Пусть какой-нибудь минор k-го порядка матрицы А отличен от нуля. Тогда строки (столбцы) матрицы А, участвующие в формировании этого минора, линейно независимы между собой. Доказательство. У рассматриваемого минора строки линейно независимы между собой благодаря 4.5. Но тогда согласно 4.! линейно независимы и те строки матрицы А, которые целиком содержат строки минора, т. е. которые участвуют в формировании этого минора. Рассуждения относительно столбцов аналогичны. 4.13. Следствие Пусть в матрице А ранга г выделен отличный от нуля минор г-го порядка. Тогда строки матрицы А, участвующие в формировании этого минора, образуют базис систе- мы строк матрицы А, а столбцы матрицы А, участвующие в фор- мировании минора, образуют базис системы столбцов матрицы А. 4.14. Приме р. Найдем з соответствии с 4.13 различные базисы системы векторов Vj = (1, —2, 3), t>2 = (2, —4, 6), да, = (-2, 4, 10), t>4 = (—1, 2, 5). С помощью э"их векторов составим матрицу: / 1 2 —2 —1\ А = —2 -4 4 2 1. \ 3 6 10 5/ Наши векторы входят в матрицу в качестве столбцов. Разумеется, можно рас- сматривать матрицу, в которой данные векторы являются строками. 3 примере 4.8 эта матрица рассматривалась. Было установлено, что rang А = 2 и найдены все ее отличные от нуля миноры второго порядка. Беря столбцы, участвующие е формировании зтих миноров второго порядке, мы соглас- но 4.13 находим базисы системы наших векторов: {^1, ®з}. {®i. {®2- {₽s> 4.15. Покажем, что указанным в 4.13 способом могут быть найдены все базисы системы строк матрицы и все базисы системы ее столбцов Другими словами, если в матрице А ранга г выделено г линейно независимых строк и г линейно независимых столбцов, то минор r-то порядка матрицы А, сформированный при помощи выделенных строк и столбцов, отличен от нуля. 80
В доказательстве для простоты обозначений будем считать, что указанными г линейно независимыми строками и г линейно независимыми столбцами матрицы А являются г ее первых строк и г ее первых столбцов. Рассмотрим матрицу, составленную из г первых строк матрицы А: (аи а12 ••• а1г а1(г+1) ••• а1П \ °21 а22 ••• а2г °2(г+1) ••• Й2Н I аг1 аг2 arr ^г(Г+1) агп Ранг ее равен г. Каждый столбец матрицы А линейно выражается через первые г ее столбцов. Поэтому то же самое имеет место и для столбцов матрицы А'. Следовательно, г первых столбцов матрицы А' линейно независимы (ведь через них линейно выражаются все г столбцов из произвольного базиса системы столбцов). Согласно 4.5 интересующий нас определитель отличен от нуля: аи а12 ••• air ^21 ^22 ••• ^2г аП аг2 агг 4.16. Пример ы. 1) Найденные в примере 4.14 базисы системы векторов = (1, -2, 3), ц2 = (2, -4, 6). = (—2, 4, 10), Фд = (—1, 2, 5) исчерпывают все базисы этой системы. 2) Для нахождения базисов системы векторов ur = (1, 2, 1, 2), и2 = (—3, —2, 1, —2), «з = (—1, 4, 5, 4) составим матрицу, строками которой служат эти векторы: /1 2 1 2\ .4=1-3-21 - 2 . 1 4 5 4/ В этой матрице второй столбец равен четвертому, а также равен сумме первого и третьего. Поэтому всякий минор третьего порядка матрицы А равен нулю. Сре- ди миноров второго порядка, очевидно, есть отличные от нуля. Более того, любые две строки матрицы А могут участвовать ч формировании какого-нибудь отлично- го от нуля минора второго порядка. Фиксируя первый и второй столбцы, мы при помощи любых двух строк матрицы А, очевидно, составляем ненулеьой минор. Следовательно, любые два вектора из щ, и2, и3 образуют базис системы этих векторов. 4.17. Следующая теорема оказывается полезной при нахожде- нии ранга матрицы с помощью ее отличных от нуля миноров. Теорема. Пусть В есть некоторый отличный от нуля ми- нор k-го порядка матрицы А\ г — rang A (k г). Тогда для любо- го натурального числа s, такого, что k s г, существует от- личный от нуля минор s-го порядка матрицы Л, в формировании которого участвуют все строки и столбцы, участвующие в форми- ровании минора В. Доказательство Для определенности можем считать, что минор В сформирован при помощи k первых строк и k первых 81
столбцов матрицы А. Тогда согласно 4 12 k первых строк матрицы А линейно независимы между собой, Их можно включить в некоторый базис системы строк матрицы A (I, 2.15), а значит, и в систему, состоящую из s линейно независимых между собой строк. Пусть для простоты рассуждений это будут s первых строк матрицы А. Составим матрицу из этих строк; ( а11 й12 ••• ° Ik al<k+l) ••• а1ц \ Й21 й22 ••• a2k Й2(Й41) "• Й2Л СА1 ak2 ••• akk ah(k+l) ••• а1гп ' us2 ... Go.e ... Gsn / Ее ранг равен s. Поскольку минор В отличен от нуля, первые k столбцов матри- цы А' линейно независимы между собой (4.12). Значит, их можно включить в некоторый базис системы столбцов матрицы А’ (I, 2.15). Этот базис состоит из s столбцов матрицы А'. Минор матрицы А', сформированный при помощи этих s столбцов и всех з строк, име- ет линейно независимые между собой столбцы. Согласно 4.5 он отличен от нуля. Построенный минор s-ro порядка матрицы А' является также и минором матрицы А. В его формировании уча- ствуют все строки и столбцы матрицы А, которые использованы при формировании минора В. 4.18. Следствие. Пусть в матрице А найден отличный от нуля минор r-го порядка В, такой, что всякий минор (г + 1)-го порядка, в формировании которого используются все строки и столбцы, сформировавшие минор В, равен нулю. Тогда rang А = г. Доказательство. Имеем: г rang А (4.10). Если пред- положить, что г < rang А, то согласно 4.17 в матрице А должен найтись отличный от нуля минор В (г + 1)-го порядка (г < г + + 1 <1 rang Л), в формировании которого участвуют все строки и столбцы матрицы А, сформировавшие минор В. Однако это про- тиворечит условию. Следовательно, г = rang А. 4.19. Следствие 4.18 удобно использовать при нахождении ран- га матрицы с помощью ее отличных от нуля миноров. В заданной матрице А выбираем какой-нибудь отличный ст нуля минор М. Конечно, выгоднее, чтобы его порядок k был по возможности большим, но в крайнем случае можно начать вычисле- ния и со случая k = 1 или k = 2. Далее вычисляем все минеры (fe + 1)-го порядка матрицы А, в формировании каждого из кото- рых участвуют все строки и все столбцы, сформировавшие минор М, Про такие миноры можно говорить, что они содержат М (их также называют минорами, окаймляющими Л4). Если все эти миноры равны пулю, то согласно 4 18 имеем: rang А = k. Если же среди этих миноров (k + 1)-го порядка мы обнаружим отличный от нуля, то применяем к нему рассуждения, аналогичные предыдущим. Продолжая так дальше, мы в результате получим отличный от 62
нуля минор г го порядка, такой, что либо в формировании его участвуют все строки или псе столбцы матрицы А, либо всякий содержащий его минор (г + 1)-го порядка равен нулю. В обоих случаях rang А = г. § 5. Решение и исследование систем линейных уравнений с помощью определителей 5.1. При изучении произвольных систем линейных уравнений задача нахождения всех решений системы (в случае, когда она разрешима) по существу сводится к нахождению решения такой системы п линейных уравнений с п неизвестными, у которой ранг матрицы системы равен п (I, 4.10, 4.11). Согласно 4.3 определитель матрицы этой системы отличен от нуля. Свойства определителей дают удобный способ решения такой системы. Идея такого подхода принадлежит швейцарскому матема- тику Г. Крамеру (1704—1752), именем которого называется и само правило решения указанных систем линейных уравнений и используемые при этом формулы. 5.2. Пусть задана система п линейных уравнений с п неизвест- ными (I, 4.6): цпХ1 + а12х2 + ... + alnxn >= h|( Й21Х1 4~ a22*2 4" ••• 4" ditlXn — b2, anlXt 4- fln2x2 4- ... 4- annxn = b. и пусть D — определитель матрицы этой системы, называемый про- сто определителем системы D = aL1 °J2 ••• ° 1л ^21 ^22 ••• ^2л ЙЛ1 ЯЛ2 Опп Благодаря 4.3 следствие I, 4.6 означает справедливость следую- щего утверждения Теорема Крамера. Если в системе (I, 4.6) определи- тель системы D отличен от нуля, то система (I, 4.6) разрешима и имеет единственное решение. 5.3. Сразу же укажем формулы для нахождения решения рас- сматриваемой системы (I, 4.6) в случае, когда D =£ 0. Обозначим через Dk (k = 1, 2, ..., п) определитель n-го порядка, полученный из Ь заменой k-ro столбца столбцом, состоящим из свободных членов: ап аи ^21 ^22 йЩ-1) al(fe+D а2р— 1) ^2 й2(Н-1) а®п ап1 йл2 йл(*-1) йл(Н-1) "• апп 83
Тогда при условии D 0 единственное решение системы (I, 4.6) находится по формулам: Di D, Г)„ __ 1 y ________ “ V ___ 1 ~~* 1 Лп « • • • « Л м —~ • 1 D 2 D * D которые называют формулами Крамера. Докажем это утверждение. Пусть (<Xj, а2, .... ал) есть решение системы (I, 4.6), т. е. имеет место: 011112 уа 22 Покажем, что а. = —. Имеем: («1ЙЦ + «2«12 + ••• + ала1л) °12 ••• а1п (а!й21 4" ос 2fl22 4- ... 4- а„Й2п) й22 ••• U2n Я1л а2л 0пяЛ2 апп («10,11 + а 2ЙЛ2 4- ... 4- алали) 0П2 ••• Олп Согласно 2.9 полученный определитель равен сумме определи- телей, в которой все слагаемые, кроме первого, равны нулю (эти определители имеют по два пропорциональных столбца). Следовательно, («1й11) а12 ••• а1п Di = («1й21) й22 • ' • °2л = аг • D («1^Л1) ^Л2 •• ^ЛЛ Аналогичные рассуждения, проведенные для произвольного i — = 1,2, ..., п, показывают, что Dt = а( D, т. е. “z = -о (l = 1( 2’ л)' 5.4. Пример. Решим следующую систему пяти линейных уравнений с пятью неизвестными: 2х, 4- хг + х3 — 2х4+х8 = 1, 5xt 4- 2х2 — х3 — х4 — х5 = О, 4х, — х2 — Зх8 — 2х4 — О, 2xi + х3 + 6х8 — х4 = О, 6xj — 4х2 — Зх4 ~ 0. Прежде всего вычислим определитель этой системы: 2 1 1 —2 1 5 2 —1 — 1 -1 D - 4 —1 —3 —2 0 - —51. 2 1 6 —1 0 6 —4 0 -3 0 84
Так как определитель системы отличен от нуля, то система разрешима и имеет единственное решение. Это решение находим по формулам Крамера. Сна- чала вычислим определитель: £>i 111—21 О 2—1—1 —1 О —1 —3 —2 О 0 16—10 0—4 0—3 О = -51. г Dt ~51 . Следовательно, х, =---- =-----= 1. 1 D —51 Затем найдем определитель: О „ Dt Следовательно, х2 = Аналогично находим: £>; D3 D. 0. —51 = 0, £>4 = —102, — 2 x — — 3 _ 2, x5 - D - 3. Db = —153 Следовательно, х3 = 5.5. Если система n линейных уравнений с п неизвестными является однородной, т. е. свободные члены ее зсе равны нулю, то условие существования у нее ненулевых решений благодаря I, 5.2 и 4.3 может принять следующую форму. Для того чтобы однородная система п линейных уравнений с п неизвестными, помимо нулевого решения, обладала еще и ненулевы- ми решениями, необходимо и достаточно, чтобы определитель системы D был равен нулю. 5.6. Пример. Выясним, при каких значениях а, b система ах3 + Ьх2 + х3 = 0, xt + ahx2 + х3 — 0, Xi + Ьх3 + ах3 = 0 имеет ненулевые решения. Вычислим определитель системы: a b 1 1 ab 1 1 b а a b 1 (1 — a) b (а — 1) 0 (I — а2) 6(1 — а) 0 = b • (1 — а)2 • (а + 2). Искомыми значениями а, b явдяются те, при которых определитель D обраща- ется в нуль; 6 6 = 0 (а любое), а — 1 (Ь любое), а = —2 (Ь любое). 85
5.7. Рассмотренный в 5.2 и 5.3 случай дает оснозание к исполь- зованию определителей для исследования и решения произвольной системы линейных уравнений (I, 4.1): + а12х2 + ... + а,пхп = blt а21хх а32х2 + ... + а2Пхл = Ь2, W: + ^т2^2 +... + ^тп^п — Условие разрешимости этой системы означает согласно 1, 4.4 совпадение рангов матрицы системы и ее расширенной матрицы: ЙХ1 ЙХ2 а1п А — ( а21 ^гг " ^"-г‘ ,, в = Й11 а12 ащ 1<,1 Й21 й22 ••• а2П Ь2 йтХ йт2 йтл ,йтХ йт2 •• ^тп^т' Вычисление рангов матриц А и В может быть произведено, по- мимо использования элементарных преобразований матриц (I, 3.14), способом, основанным на рассмотрении отличных от нуля миноров этих матриц (4.19). При этом следует иметь в виду, что всякий минор матрицы А является также и минором матрицы В. В случае совпадения рангов матриц (rang А = rang В — г) система уравнений (I, 4.1) разрешима. Все ее решения могут быть найдены следующим образом Выделим какой-нибудь отличный от нуля минор г-го порядка матрицы А. Для простоты обозначений будем считать, что этот минор сформирован при помощи г первых строк и г первых столбцов матрицы А: D = ЙХХ й12 ••• Й1Г Й21 й22 ••• а2г а2г у^О. аП аг2 ••• агг Согласно 4.13 строки матрицы В, использованные при формиро- вании минора D, т. е. в нашем случае г первых строк матрицы В, образуют базис системы строк в В. Согласно I, 4.10 исходная си- стема эквивалентна системе й11^1 1' ЙХ2-Ч ... 4" й21^х 4~ о22х2 И- ... 4~ а2пхп = Ь2, anXi + апх2 + ... + агпхп = Ьг. В случае г — п мы получаем систему рассмотренного в 5.2 вида, которая имеет единственное решение, вычисляемое по форму- лам Коамера (5.3). Оно является единственным решением и для исходной системы. В случае г < п, придавая неизвестным xr+1, хг+2, .... хп про- извольные численные значения хг+1 = аг+1, хг+2 = аг+2, ..., хп — =• а„, мы приходим к системе линейных уравнений с неизвестными х1( х2, ..., хг, которые определены единственным образом и могут 86
быть найдены, например, по формулам Крамера. Таким обпазом, выражая xlt х2, хг через хг+ъ хг_2, .... хп, мы при любых зна- чениях хг+1, хг+2, хп получаем некоторое решение исходной си- стемы и согласно I, 4.11 указанным способом можем получить любое ее решение. 5.8. Пример. Рассмотрим систему: х, + 2х2 + х3+ х4 = 1, 2х4 4 4х2 — х3 4- 2х4 — х5 — —4, Xi 4- 2х2 — 2х5 4- х4 - - х5 = —5, х4 4- 2х2 4- х3 4- 2х4 4- х5 = —1, 4х4 ф- 8х2 4- х3 4- 4х4 — х5 = —2. Используя элементарные преобразования матриц, находим ранг расширен- ной матрицы системы: (12 11 0 1х 2 4-12-1-41 12—21—1—51=3 12 12 1 —1 / 4 8 14—1 —2/ В процессе вычисления замечаем, что ранг матрицы системы тоже равен 3. Поэтому система разрешима и имеет бесконечное множество решений. Ищем их согласно 5.7. Выделяем какой-нибудь отличный от нуля минор 3-го порядка а матрице системы, например сформированный при помощи 1, 2 и 4-й строк и 1, 3 и 4-го столбцов: D = 1 1 1 2—12 1 1 2 Исходная система уравнений эквивалентна системе; *1 + хз +• *4 = 1 — 2х2, 2х, — х3 4- 2х4 = - 4 — 4xs 4- хБ, *1 + х, 4- 2х4 = — 1 — 2х3 — хе. Неизвестные х4, х3 и х4 выразим через х2 и хб согласно 5.7: 1 хт=---- 1 х* 3 (1 - 2х2) (—4 — 4х2 4- х8) (—1 — 2хг — х8) (1 - 2ха) (- 4 — 4х2 4- х») (—1 - 2х2 — х8) 1 (1 - 2х2) —1 (—4 — 4хг 4- х3) = —2 -- х8. 1 (—1 — 2х2 — х8) 1 4 2 = 1 — 2хг 4- ~х8, 2 3 1 = 2 — — х8, О 1 —1 I 4 3 1 1 2 1 1 2 1 1 2 2 Общее выражение имеет вид: для решений исходной системы линейных уравнений 4 1 Xi = 1 — 2а — 3, х2 = а. х3 = 2 — —Р. х4 = —2 — Р, х3 = р. 3 о Здесь параметры а и ft могут принимать любые численные значения.
Глава HI. СИСТЕМЫ ЛИНЕЙНЫХ НЕРАВЕНСТВ § 1. Исходные положения теории линейных неравенств 1.1. Наряду с системами линейных уравнений значительное место в математике отводится изучению систем родственного вида — линейных неравенств с естественным ограничением областью веще- ственных чисел R. Интерес к изучению таких систем объясняется возможностью их использования для решения различных математи- ческих задач. Важную роль в этом играют геометрические со- ображения ввиду возможности задания и изучения выпуклых много- угольников и многогранников при помощи систем линейных нера- венств. Особо следует указать на использование линейных нера- венств в практических задачах по отысканию наиболее выгодных вариантов. Большой интерес к теории линейных неравенств в по- следние годы связан с открытием широких возможностей примене- ния их в экономике. Начало систематического изучения линейных неравенств можно отнести к концу прошлою столетия. Первыми в этом направлении можно считать результаты немецкого математика Г. Минковского (1864—1909), изложенные им в книге «Геометрия чисел» (1896 г.). В дальнейшем изучение систем линейных неравенств привлекало многих видных математиков, таких, как Г. Вейль, А. Хаар, Г. Ф. Вороной и другие. Значительный вклад в развитие этой тео- рии внесли советские математики. Здесь в первую очередь следует отметить работы С. Н. Черникова. В его книге «Линейные нера- венства» (1968 г.) дается систематическое изложение современной теории линейных неравенств. 1.2. Определение. Системой линейных неравенств с п неизвестными xlt х2, .... хп называется система соотношений виса °JJX1 + + ••• + ainxn ^1» и.г1хх + а22х2 + ... + attlxn < Ь2, "Г" &т2Х2 ••• *Ь Ut иХа i. bm 88
(где a[jt bt f P), определяющая в множестве последовательностей вещественных чисел (alt а2, ал) такие последовательности, чпю в результате замены х на a (j = 1, 2, ..., п) оказываются справед- ливыми получающиеся числовые неравенства. Числа aif называются коэффициентами при неизвестных, а Ь, — свободными членами. Если Ь, = 0 для i = 1, 2, т, то система линейных неравенств называется однородной. Можно рассматривать также линейные неравенства, использую- щие знак аххг + а2х2 + ... + апхп Ь. Вполне ясно, что, изменив знаки у всех чисел at и Ь, мы должны изменить знак неравенства на противоположный: —rijX, — а2х, — ... — апхп —Ь. Можно рассматривать системы линейных неравенств, в которых используются противоположные знаки неравенств. Благодаря ска- занному выше их всегда можно записать с использованием одного и тою же знака неравенства. Трактуя понятие уравнения в широком смысле (1, 1.1), можно было бы о системе линейных неравенств говорить как о некотором специальном типе уравнений. 1.3. Решением системы линейных неравенств (1.2) называется та- кая последовательность вещественных чисел (аь а2, .. .. а„), для которой оказываются справедливыми числовые неравенства, полу- чающиеся из системы (1.2) в результате замены каждого Xj на ар а-ааг + н/2а2 + ... + aiaa„ < bt (i = 1, 2, .... m). Говорят также, что значения х, = alt х2 = a2, ..., хп=ап удовлетворяют системе (1.2). Если при этом все числа а,- неотрицательны: а. X? О (j — 1, 2, ..., п), то решение lo^, а2, ..., an) называется неотрицательным. Если система линейных неравенств имеет какие нибудь решения, то она называется разрешимой, а если не имеет вовсе никаких ре- шений. то — неразрешимой. Как и в теории линейных уравнений, две системы линейных не- равенств называются эквивалентными, или равносильными, если всякое решение каждой из них является решением и для другой. Другими словами, множество решений одной из них совпадает с множеством решений другой. При установлении эквивалентности двух систем линейных не- равенств обычно используются общие свойства неравенств для ве щественных чисел. 1.4. Наравне с системами линейных уравнений и системами ли- нейных неравенств рассматривают также «смешанные» системы, в которых встречаются как линейные уравнения, так и линейные неравенства Тем самым, ограничиваясь областью вещественных
чисел R, можно говорить об общих системах линейных соотноше- ний: уравнений и неравенств (причем могут фигурировать также соотношения строгого неравенства). Впрочем, всякое уравнение ад -|- ад + ••• + апхп = h (ак b (: R ) можно заменить парой неравенств (и это иногда оказывается очень удобно)- алХг + а2х2 + ... + апхп < о, —ад! — ад2 — ... — апхп —Ь. Тем самым всякая «смешанная» система линейных соотношений мо- жет быть при желании сведена к системе линейных неравенств. 1.5. Для систем линейных неравенств с двумя и с тремя неиз- вестными можно указать наглядную геометрическую интерпрета- цию. Рассмотрим сначала одно линейное неравенство с двумя неизве- стными, которое запишем в виде (а и b одновременно не равны 0): ах + by + с 0. Возьмем плоскость с фиксированной прямоугольной декартовой си- стемой координат. Если под х, у понимать координаты точки на этой плоскости, то данное неравенство определяет на плоскости некоторое множество точек, координаты которых удовлетворяют этому неравенству. Нетрудно выяснить, каково это множество точек. Рассмотрим уравнение: ах -f- by с — 0. В случае b ф 0 запишем его в виде: у — kx + И (k — —h — ——1 \ b b) Как известно, в рассматриваемом случае уравнение определяет па плоскости некоторую прямую, не параллельную оси Оу. В случае b > 0 исходное неравенство можно записать в виде у kx + h, и, значит, точки плоскости, определяемые этим неравенством, лежат по одну сторону от указанной прямой («ниже» этой прямой) и на самой прямой (рис. 1). Рис. 1. Рис. 2.
Рис. 3. В случае b < 0, записав исходное неравенство в виде у kx 4* h, мы видим, что и на этот раз все точки, определяемые им, лежат по одну сторону от соответствующей прямой («выше» этой прямой) и на ней (рис, 2). Пусть b — 0. Тогда наше неравенство запишется в виде: х < /г или х h (h = —- \ а Уравнение х = h определяет на плоскости некоторую прямую, па- раллельную оси Оу. При /i=0 это бу дет сама ось Оу. Поэтому наше неравенство определяет множество точек плоскости, лежащих по одну сторону от этой прямой: или «слева» от нее, или «справа (включая каждый раз и точки самой этой прямой) (рис. 3). Таким образом, неравенство ах 4- by 4- с < 0 определяет на плоскости одну из двух полуплоскостей, определяе- мых прямой с уравнением ах 4- by + с = 0, т. е. множество точек, лежащих по одну сторону от этой прямой и на самой прямой. Рассмотрим теперь систему линейных неравенств с двумя неиз- вестными: aYx 4- Ьху 4- Ci 0. а.2л + Ь2у 4- с2 < 0, атх 4- Ьту 4- ст < 0. Множество точек плоскости, определяемых этой системой, состоит из тех точек, координаты которых удовлетворяют этой системе. Значит, это множество есть пересечение тех полуплоскостей, кото- рые определяются неравенствами данной системы. Нетрудно ви- деть, что это множество является многоугольной выпуклой обла- стью на плоскости (выпуклость означает, что вместе с любыми двумя точками из этого множества все точки отрезка, соединяюще- 91
го их, тоже лежат в этом множестве). При помощи соответствующей системы линейных неравенств мы, как легко видеть, можем полу- чить любой выпуклый многоугольник. Эта область может не быть ограниченной. Она может быть и пустой или же быть «вырожденной» в прямую, луч, отрезок, точ- ку. Аналогичные рассуждения могут быть проведены и для систем линейных неравенств с тремя неизвестными. В этом случае речь поила бы о выпуклых многогранных областях в пространстве. 1.6. Примеры. 1) При помощи системы линейных неравенств зададим треугольник с вершинами в точках, заданных своими координатами: А (—2, 0), В (1, 3). С (4, 0) (рис. 4). Находим уравнения прямых, на которых лежат стероны треугольника: (АВ)-. х — у+2= 0, (ВС): х+у — 4=0, (ЛС): у=0. Для задания в виде линейных неравенств тех полуплоскостей, пересечение ко- торых образует данный треу-ольник, оуководствуемся тем, что координаты каж- дой вершины должны удовлетворять неравенству полуплоскости, образованной противоположной стороной: х — у + 2 > 0, х + у — 4 0, У >0. 2) Система кера венств х — у + 3 0, —х -Ь у — 3 < 0, х + 2у > 0 определяет на плоскости луч (рис. 5). 92.
Рис. 6. 3) Многогранная область, определяемая системой линейных неравенств -х - г + 1 > О х > О У>0 У<2 г О, представляет собой треугольную призму (рис. 6). 1.7. При изучении систем линейных неравенств мы будем ис- пользовать системы линейных уравнений, рассматриваемые в обла- сти вещественных чисел /?. Как мы отмечали (I, 1.7), при изуче- нии систем линейных уравнений можно было бы ограничиваться числами из какого-нибудь числового поля, б частности поля ве- щественных чисел /?. Теория от этого по существу не изменилась бы. В наших дальнейших рассуждениях в пределах настоящей гла- вы мы будем рассматривать системы линейных уравнений и исполь- зовать результаты предыдущих глав (относящиеся к изучению си- стем линейных уравнений) исключительно с указанным ограниче- нием относительно поля вещественных чисел /?. 1.8. Между системами линейных неравенств и системами ли- нейных уравнений устанавливается следующее соотношение. Произвольной системе т линейных неравенств с п неизвестны- ми: е1Л Т й12*2 ••• + air,xn &т> ЯщХ} "К &22Х2 4“ “Г ®мХп ^2> @mlXl &т2Х2 ••• “Ь ^цппХп сопоставим систему т линейных уравнений с п + т неизвестными: Оцлу + а12х2 + ... + а1пхп + хп+1 = Мт + а22х2 -)- ... + агпхп 4- x4i2 — b?, ит1х1 + W» + ••• + атЛ + Х„ == Ьт , n-j-m т' 93
Теорема. Если (v.x, а2, • ••> ял . с&л+п ал+2, • ••» «л+лг) кть Ре‘ шение указанной системы линейных уравнений и ал+1 О, аям °» .... ай+т то (а1( а2, а„) — решение исходной системы линейных неравенств. При этом всякое решение системы линейных неравенств может быть получено указанным образом. Доказательство. 1) Если a i«i + а/2а2 + ••• + а1па, + ая+( = &„ а,+; > О, то ааа^ 4- а(2а2 + ... + ainan < bt (i = 1, 2, .... т). 2) Пусть теперь (01( р2, .... 0Л) есть какое-нибудь решение системы линейных неравенств, т. е. a.iPi + а/2§2 4- ... + aZrp„ bt (i = 1, 2, ..., т). Обозначая ₽л+( = bi — (aiiPi + а«2рг + ... + а<„3п) > °. пат у чаем, что фг, ₽2...0, , 0„+1, 0я+2, ..., 0я+лг) является реше- нием построенной системы линейных уравнений. 1.9. Пример. Рассмотрим систему линейных неравенств 2xt — хе 1, —х4 + х2 < 0. Построим соответствующую систему линейных уравнений: 2х. — х2 + xs =1, —xt + х2 + х4 = 0. Находим общий вид решений этой системы: Xj = 1 — х3 — х4, х2 = 1 — х8 — 2х4, где х9 и х4 могут принимать произвольные численные значения. Отсюда получаем общий вид решений заданной системы линейных неравенств: (1 — а— 0, 1 — а — 20), где а > 0, 0 > 0. 1.10. В теории линейных неравенств ряд глубоких результа- тов связан с понятием, родственным понятию линейного следствия для линейных уравнений. Наибольшее значение оно приобретает в применении к однородным линейным неравенствам. Рассмотрим однородное линейное неравенство ел + с2х2 + ... + х„ < 0 и однородную систему линейных неравенств «11^1 + W2 + - + а’пх„ < °. а21х4 + а22х2 + ... 4- а2пхп 0, ^mlxl I* ^п.2^2 4" ••• 4* 94
Нас будет интересовать случай, когда Л;вектор и — (сь с2, .. , сп) линейно выражается через n-зекторы и, = (аЛ, ал, ..., o/rt): » = Yi«i 4 ?2«2 + ... + утит (уг £ Я; « = 1, 2, т). Если при этом все у, могут быть выбраны неотрицательными: У/ > 0 (t = 1, 2, m), то неравенсгво с£хх 4 с2х2 4 ... 4 с, хп< О будем называть не- отрицательным линейным следствием данной однородной системы линейных неравенств. 1.11. Пусть неравенство 4 с2х2 4 ... 4 cnxn^.Q есть не- отрицательное линейное следствие однородной системы линейных неравенств (1.10). Тогда всякое решение (ах, а2, .... ап) этой си- стемы будет решением и для данного неравенства. Действительно, из того, что а(1а£ 4 д<2а2 4 ... 4 а1паГ[ < 0, yz > 0 (i = 1, 2.m), получаем: 4i + c2a2 + ••• + Cn'x,! = - (ан?! 4- а2,у.2 4 ... 4 amlym)ai 4 4 4 «22?2 4 ••• 4 am2Ym)“2 4 + («471 4 a-^2 + - + am„ym) an = = 2 + ^«2 + ••• + 4Л < °- 1=1 1.12. Лемма. Если всякое решение системы неравенств «1Л 4 altx2 4 ... 4 aLnxn < 0, а2рсх 4 «22х2 4 ... 4 агпхп < О, a-nixi 4 Wi 4 ... 4 ^тп^п 0 является решением неравенства 4 е^х2 4 ... 4 хл 4 то всякое решение соответствующей однородной системы линейных уравнений ацХ1 4 «12*2 4 ... 4 ainxn = 0, «21Хх 4 «22х2 4 ••• 4 «2,хл -- 0, «т1Х1 4 «тгХ2 4 4 etmnxn — 0 является решением уравнения 4- ел 4 ... 4 спхп = 0. Доказательство. Пусть (ах, а2, ..., а„) есть решение указанной системы линейных уравнений. Тогда и (—ах, —а2, ... ..., —ап) тоже является решением этой же системы. Оба этих 95
решения, очевидно, служат решениями и для исходной однородной системы линейных неравенств, а значит, и для выделенного ли- нейного неравенства: qa, + qa2 + ... + сп ап < 0, — — e2at _ _ с„а, < 0. Из этих соотношений получаем требуемое равенство: qcq + с2а2 + ... 4~ сп ап = 0. 1.13. Сопоставляя лемму 1.12 с теоремой о линейных следстви- ях для уравнений (I, 4.13), приходим к следующему выводу. Следствие. Если всякое решение однородной системы ли- нейных неравенств является решением однородного линейного не- равенства (1.10), то п-вектор (q, с2, ..., q) линейно выражается через п-вектсры (ап, ai2, ..., ain), i = 1, 2, .... т. 114. Теорема Минковского. Для того чтобы вся- кие решение однородной системы линейных неравенств Й1Л + а12х2 + ... + а1пх„ < 0, a2ixi 4* а22х2 + ... + а2Пхп С 0> «щЛ + flm2x2 + ... + атпхп < 0 являлись также решением неравенства qxx 4- с2х2 4- ... 4- с„хп < 0, необходимо и достаточно, чтобы это последнее неравенство было не- отрицательным линейным следствием данной системы. Доказательство Мы уже показали, что всякое реше- ние однородной системы линейных неравенств является решением любого однородного линейного неравенства, являющегося неотри- цательным линейным следствием данной системы (1.Н). Пусть теперь всякое решение данной системы является решением неравенства qxi 4- qx2 4- ... 4- qx, < 0. Согласно 1.13 существует линейное выражение n-вектора и = (q, cs, ..., q) через n-векторы = (aiY, at2, ..., а1п): и = у.«1 4- ?2и2 4- ... -I- тт«,п(У/ € R; 1 = 1, 2, ...» т). Запишем эго соотношение в развернутой форме: «п?1 + a2i?2 + ... 4- ат1ут = q, «пТг 4- а22?2 4- ... + Лт2?т = сг, + а2пуг 4- ... 4- атпУт = сп. Пам следует показать, что при этом можно выбрать неотрица- тельными числа ух, у2, .... ут.Очевидно, можем считать, что среди чисел atj есть отличные от нуля. Рассуждаем по индукции относительно т. 96
Пусть т = I. Среди коэффициентов a]lt а12, .... о1л возьмем отличный от нуля, например ап > 0. Тогда « вектор (—1, 0, 0, ... .... 0) является решением исходной системы, состоящей при т = 1 из одного неравенства «1Л + Д12-Ч + — + < 0, а значит, он будет решением и неравенства + с2х2 + ... + с„хп < 0. Поэтому —Cj 0, т. е. 0. Из соотношения аиу! = с2 полу- чаем: Пусть теперь т > 1, и наше утверждение о существовании не- отрицательных коэффициентов линейного выражения справедливо во всех случаях, когда однородная система линейных неравенств имеет меньше, чем т, неравенств. Предположим, что в нашем случае во всяком линейном выраже- нии n-вектора а через «z (t = 1,2, .. .. т) содержатся отрицатель- ные коэффициенты. Возьмем тогда такое линейное выражение, которое содержит наименьшее возможное число s отрицательных коэффициентов- « = Т1«1 + ?2«2 + - + VA + V,+1«*+1 + - + Vm«m. где Yi < 0, у2 < 0,..., у5 < 0, yJ+1 > 0....?т > 0 (1 < s < т). Рассмотрим однородное линейное неравенство: dxx} + d2x2 + ... + dnxa 0, где di=cz—।a-iiVt — аз1?з— ••• — = anYi au+i)iYjn ~Ь а(.ч enti+з 4" + ••• + ат1Тт. d2~C2---a22?2---аз2?3-- ••• -= a12?l + аиИ)2?5| 1 + ai5t2>2Yi|-2 + -f- ... (- ят2ут, 4~ ... Clnnym- Другими словами, п-вектор w = (dlt d2, .... d„) есть сумма: W = УМ + ?J+J«,+1 + yf+? us+i + ... + ymum. Построенное линейное неравенство обладает следующим свой- ством Всякое решение (аъ а2, .... ая) исходной системы линейных неравенств является решением и для него Действительно, имеем: dM + <*2а4 + ... + а„ап =- (см + см + ... + сла,) — — (а2м + а22а2 + ... + а„ая )у2—(а3м + а32а2 + ... Д- а3,а„ )у2- — ... — (asla, + а52а2 4- ... + а,гая )?я, 4 Зак»э 853 97
При ЭТОМ + С-2а2 + ••• 4" £лал ибо (alt а2, ..., а„), будучи решением системы линейных неравенств, по условию должно быть решением неравенства, указанного в формулировке теоремы. Кроме того, ала^ 4- а,2а2 + ... + а,лал О, у(- <0 (t = 2, 3, .... s). Следовательно, dj»! + d2a2 + ••• + dna4 0. Рассмотрим систему линейных неравенств, полученную из ис- ходной в результате замены всех коэффициентов первого ее вера- венстьа на противоположные: а11Х1 aL2X2 ~ ••• — °1Л*ч 9’ a2ix} 4 я22х2 4- ... 4- d2nxr, С 0> «ml*l 4- ^т2Х2 + + ^тЛ Ввиду 1.11 всякое ее решение тоже будет решением для djX] + d?x2 4" ••• 4- da хп С, поскольку «-вектор w — (d1( d2, ..., dn) линейно выражается с не- отрицательными коэффициентами через —«1; и2, ..., ит: w = (—71) (—»i) 4- ?5+1«5+1 + ?5+2»5+2 + ... 4- утат. Таким образом, решением неравенства 4- d2x2 4* ••• 4~ dn хп 0 сказывается всякое решение системы, состоящей из т — 1 нера- венств «гЛ "1" d22x2 4- ••• 4- агпхп 0, a3iXi 4- «32*2 4- ... 4- азпх„ О, Wi + «412*2 + ... 4- Дл„хл < О (всякое решение этой системы является решением одной из двух си- стем, рассмотренных выше, получающихся добавлением к этой системе одного из неравенств: йцХ, 4- «12х2 4- ... 4- ахпхи О или —anXi — а)2х2 — ... — а1пхп < 0). Согласно индуктивному предположению найдутся неотрица- тельные вещественные числа у', yJ( .... ул(, такие, что W = |2«2 + ?>з + ••• 4- у>т. Для n-вектора и получаем линейное выражение; « = 4- у3«3 4- ... 4- ysu5 4- w = = 0«1 4- (у2 4- ?;)и2 4- (Уз 4- уэ)«з 4- ••• 4- (ys 4- у>^4- + 4- y'+2«i+2 + ••• 4 7да«т- 98
Отрицательные коэффициенты могут находиться лишь среди (Ь + Т2)> (Тз + Тз)> № + ?'). и, значит, количество их меньше, чем s. Это противоречит выбор)' s. Значит, в действительности и может быть линейно выражен через ttj, а2, ..., ит с неотрицательными коэффициентами. § 2. Разрешимость систем линейных неравенств 2.1. С помощью теоремы Минковского (1.14) получим условие разрешимости общей системы линейных неравенств. Этот резуль- тат известен как теорема А. Д. Александрова и Фань Цзи. Как показал С. Н. Черников (1964 г.), по существу он равносилен тео- реме Минковского. Удобнее всего его формулировать в виде усло- вия неразрешимости системы линейных неравенств. Теорема. Система линейных неравенств anxi 4- 4* ••• 4- я1лхл frj, «ал + а22х2 + ... + а2пхп < Ь2, + ат2х2 + ... + атпхп < Ьт неразрешима тогда и только тогда, когда существуют неотрица- тельные решения системы: СиУ1 + <4:5’2 + ... + ат1ут = О, Я12У1 + а22у2 + ... + ат2ут = О, + afnyt + ... + а„ут = С, Mi + Ь2у2 4- ... + Ътут < О Доказательство. 1) Пусть исходная система линей- ных неравенств разрешима, т. е. при некоторых хг — а1( х2 = а2,... .... х„ = ал : «0^1 4" а12а2 + ... + а,„ал < blt й21а1 + а22а2 4" ... 4 02лал Ь2, атЛ 4* ят2а2 4- ... 4- п,ллал Ьт Тогда для произвольных неотрицательных значений yt = Pi О, Уг — Рг 0. •••. Ут — Pm 0, при которых удовлетворяются пер- вые п уравнений второй системы, указанной в формулировке тео- ремы, имеем.: APi 4- Ь$2 4- ... 4- 'апР1 4- Я21Р2 4 ... 4- Ят1рт)а1 + 4- (a^Pi 4- О22Р2 4- ... 4- ятгРт)а2 4- 4- («щР1 4* й2ЛРг 4- ... 4" «тлРт)ат = °. т. е. значения yj = рп у2 = р2, ..., ут = рт не удовлетворяют по- следнему соотношению рассматриваемой системы. Значит, эта си- стема не имеет неотрицательных решений. 4* 93
2) Пусть теперь система линейных неравенств (первая из си- стем, указанных в формулировке теоремы) неразрешима. Рассмотрим вспомогательную однородную систему п линейных неравенств с п + 1 неизвестным: ^11^1 ’!* ^12^-2 4~ •• Ь ^1ПХ1 ^1^Л41 ' 1 ^21-Xj 4* ^22-^2 Ч* ••• Ч~ ^2Л'^П ^2-^л+1 О, ат1х1 + ат2х2 + ••• + ^тпХп ЬтХп+1 О" Во всяком ее решении (<zt! аа, ап , ап+1) должно иметь место ая+1 0> иначе при ая+1 > 0 мы имели бы решение исходной си стомы линейных неравенств: / «1 «2 .. , ап \ \ а>1+1 аЛ+1 пл-ч / Значит, всякое решение вспомогательной однородной системы линейных неравенств является решением неравенства хп+1 Согласно теореме Минковского (1.14) существует линейное вы- ражение с неотрицательными коэффициентами (л Ч- 1)-всктора w — (0, 0, ..., О, 1) через (п 4- 1)-векторы то, = (ал, ai2, ain, —Ь); o’ 3= ViWi 4- у2то2 + ... 4- ymwm, Y; 0 (i = 1, 2, .... tri). В развернутой форме это соотношение показывает, что (Yi, у2, ., ..., у,„) есть неотрицательное решение интересующей нас системы: OljlYl 4- агу?2 + ••• + Gm;Ym = 0 (/ = 1, 2, ..., п), flYi 4- Мг + -• 4- = —1 < 0. 2 2. Как легко видеть, в формулировке теоремы 2.1 мы могли бы последнее неравенство второй системы заменить уравнением Mi Ч* М2 4- - 4- ьтут = с при произвольном с < 0 (и в частности, удобно брать с ——1). Тем самым вопрос о разрешимости общей системы линейных не- равенств сводится к вопросу о существовании неотрицательных ре- шений у системы линейных уравнений. 2.3. Пример. Для системы линейных неравенств *14- хг 4- хз < 1. 2xj + 2х2 — хэ —1, —Х1 — х2 4- л3 < 0, *1 — х2 — х, < 2 построим систему линейных уравнений: У1 4- 2у2 — уз 4- У4 = 0, У1 4- 2у2 — Уз — у, — С, У1 — Та 4- Уз — У4 = 0, Л — 4- ?У4 “ —1. 100
Она имеет единственное решение: 1 2 У1 = - Т- У» = Т’ Уз = 11 У< = °- □ о Следовательно, исходная система линейных неравенств разрешима. Например ее решением является: Хх = —2, Л2 =1, х3 = —I 2.4, В свою очередь вопрос с существования неотрицательных решений произвольной системы линейных уравнений (рассматривае- мой в R) может быть сведен к вопросу о разрешимости некоторой системы линейных неравенств. Теорема. Система линейных уравнений auxi + а1,х2 + ... + а1пхл = fc>lt a2ixi + 6 2 2-4 4- ... + = Ь2, W1 + + - + атпхп = Ьт (atj, bj 6 R) имеет неотрицательные решения тогда и только тог- да, когда неразрешима система: а11У1 4* а21У‘Л 4“ ••• 4~ ^т[Ут 0> «12У1 4* а?2Уг 4- ••• 4- втзУп О» а1пУ1 4" а2пУг 4* ... 4- йпг.Ут о, ^1У1 4* Ь2у, 4- ... 4- Ьтут < 0. Доказательство. 1) Пусть система линейных уравне- ний имеет неотрицательное решение (а,, а2, .... art), т. е. a,i«i 4- ai2a2 4- ... 4- ainan = bt (i = 1, 2. ..., tn), аг 0, a2 0, ..., a„ 0. При произвольных вещественных значениях У1 = Р1, У2 = Рг, •••> У'П — удовлетворяющих первым п неравенствам второй системы, учиты- вая неотрицательность чисел ajt получаем соотношение, показы- вающее, что при этих значениях неизвестных не удовлетворяется последнее неравенство системы: ^1Р1 4" ^гРг 4- ... + brnfin = — (а11Р1 + а21Рг 4~ ••• 4“ fin.lPm)®! 4- 4" (а1гР1 4* а22р2 4- ... 4- am2pftj)a2 4- 4- (<!,,$( 4- a2np2 4- ••• 4- %лР«)ал 0. Значит, никакие значения уь у2, .... ут не удовлетворяют рассмат- риваемой системе. 2) Наоборот, пусть неразрешима система линейных неравенств 101
(вторая система в формулировке теоремы). Тогда неразрешима и система: —апу5 — амУа — ~ < О, —*^12У1 — ^2гУ2 ^гп^Ут 6, —О1лУ1 — ^2пУ‘1 ... — ССппУт 0> ^1У, + ^аУ« + ••• + ЬтУт —1- Согласно 2.1. найдутся неотрицательные вещественные числа Yu У2. •••» У«, y„+i, такие, что —аиУ1 — а12?2 — ••• — Я'тУп + byyn-f-\ — О, —^21УI — ^"22^2 &2пУп ~Т ^2?п+1 = 0. —^п-лУ1 — Я-пгТг — ••• (^ггпУп 4~&>пУп+1 — — Т-,+1 < 0. Так. как в нашем случае yn+i > 0, то числа _П_ Уг _ _ . У» Ул+1 У«+1 Ти+1 неотрицательны и образуют решение интересующей нас системы линейных уравнений. 2.5. Стоит обратить внимание на то, что теорема 2.4 останется справедливой, если во -,сех линейных неравенствах второй систе- мы все знаки неравенств заменить на противоположные. Действи- тельно, если (|1( Е2, ..., |т) есть решение какой-нибудь одной из этих систем линейных неравенств, то (——12, ..., —!«-.) будет решением другой. Значит, разрешимость любой из этих систем означает разрешимость другой. 2.6. Результаты теорем 2.1 и 2.4 в определенном смысле взаим- но двойственны. Результат исследования общей системы любой из этих теорем можно применить к системе частного вида другой, и в итоге получим нужный вывод. Условие неразрешимости общей системы линейных неравенств (2.1) мы применяли в доказательстве теоремы 2.4 (вторая часть доказательства) к сис.еме неравенств частною вада для получения неотрицательного решения общей системы линейных уравнений. Можно поступить и наоборот Условие существования неотрица- тельного решения общей системы линейных уравнений (2.4) при- меним к системе частного вида, участвующей в теореме 2.1: °пУ1 + а21Ув 4" ••• + ат\Ут ~ о» а1гУ1 4“ а2гУ? 4* ••• 4~ ат?Ут = 0> ^1пУ1 4“ О2лУг 4“ ••• 4“ атпУт — 0, О.У1 4” Ь2у2 -Г ... 4* Ьп.Ут = с (с < 0), 102
Это условие приводит к неразрешимости системы: апх1 4" ai2xz 4* ... 4* a,nxn т i’jXni-i О, алх, + + ... 4~ U^Xsx 4” ^2Хл+1 О, ^гг!х1 4' О-т2х2 4- ... 4“ Я/нпХп 4" ЬтХп+1 О» схп+\ < 0. Но отсюда вытекает неразрешимость системы anXi 4- а12х? 4- ... 4- ainxn < Ьъ ^-21Х1 ”Т~ й22^"2 4” ... 4” @2пхп ^2* Пт 1X1 4* Й712-Ч 4~ ••• 4~ ^тп^п ^/н, так как для всякого ее решения (ofj, а9, ..., а„) мы получили бы решение предыдущей системы: (—а1( —а2.........— <хп, 1). 2.7. В заключение параграфа затронем вопрос о неотрицатель- ных решениях систем линейных неравенств. Системе линейных неравенств апхг 4- «12*2 4- ... 4- а]пхл < Ьъ a21Xi 4- а22х2 4- ... 4- airtxn < bt, OtnlX} 4" drn2X2 4* ••• 4~ @тпХп ^71 сопоставим систему: й11У1 4" ^21Уг 4” ••• 4" йт1Уп> 0, Й1»У1 4“ й2гУг 4- ••• 4- ^тгУт 0, й.пУ1 4 ймУг 4” ••• 4“ йтпУт о, ^1У1 4- ^гУг 4- ••• 4” Ьпут < 0. Теорема. Имеет место одна из двух возможностей: 1) либо существуют. неотрицательные решения первой системы и не существует неотрицательных решений второй системы, 2) либо, наоборот, существуют неотрицательные решения второй системы и не существует неотрицательных решений первой системы. Доказательство. 1) Пусть (а17 а2, а..) — неотри- цательное решение первой системы. Тогда для произвольных не- отрицательных значений ух = рь у2 = р2, ..., ут = рт, удовлетво- ряющих первым п неравенствам второй системы благодаря aklaj 4- ai2a2 Д- ... 4- a,„a„ < fei, £. > 0 (i = 1, 2, ..., m). получаем, что последнее неравенство не удовлетворяется: &1Р1 + ^2?2 4- ... 4" Ьп.Рт (йиР1 4- й?1Рг 4- ... + 4- 4- (й12р1 4- Я22Р2 4* ... 4* ИтгР»()«2 4- 4- 4- й?пРа 4- ••• 4~ отп$т)а.п 0. 103
Значит, вторая система не имеет неотрицательных решений. 2) Пусть теперь первая система не имеет ни одного неотрица- тельного решения. Тогда ввиду 1.8 не имеет неотрицательных реше- ний и система линейных уравнений: 3" Ц|2^2 4” 4* ЪпХп 4” == ^1» ^21'^1 4" ^22-^2 4" ••• "Ь ^2П^П 3” %11+а ~ -J- ат?Х2 4“ ... 4* атпХп 4- Хп^-т — Ьт> Из теоремы 2.4 следует разрешимость системы: 4” я21у2 4" • •• 4- О, °12У1 4- й22у2 4* ... Н~ о-п1У,п О, О1«У1 4- Д%У{ 4* ••• 4" «тпУш У) > о. Уг > 0. Ут Ь^У] 4~ ^гУг 4* ... 4~ ЬтУv <. 0. А это и означает, что интересующая нас система линейных не- равенств (вторая в формулировке теоремы) имеет неотрицательные решения. 2.8. Для системы 0цХ1 4- а12-Ч 4- ... 4- аь,хп Ь,, 4- «22^2 4- ... 4- a2l,xn Ьг, QrpiX-y 4“ Цт2*Х2 4- ... 4“ UrnnXn Ьт составим систему: M’i -I- <Wi 4- ... 4- cmlyOT < 0, а1гУ1 4- а22У2 4- ... 4- ат2ут < 0, а\пУ\ 4- йгпУг 4- ... 4- аппут 0, ^1У1 4- Ь2у2 4- ... 4- bmym > 0. Неравенства первой системы можно записать в виде Х^2Х2 ... “- НщХп ~“~Ь[ (1 = 1,2, а неравенства второй — в виде -Й1/У1 — «2,У® — ••• — amjym >0 (у = 1,2........n), -Mi - ^2У2 — ... — bmym < 0. Применяя затем теорему 2.7, получаем аналогичное утверждение для исходных систем. Следствие. Имеет место одна из двух возможностей-. 1) либо первая система имеет неотрицательные решения, а вторая не имеет-, 2) либо вторая система имеет неотрицательные решения, а первая не имеет. 104
§ 3. Неотрицательные решения систем линейных уравнений 3.1. В теории линейных неравенств и в ее приложениях выделя- ется вопрос о нахождении неотрицательных решений произвольной системы линейных уравнений (рассматриваемой ч области веще- ственных чисел): Wi + «12*2 + ... + ainxn = Ьи «21*1 + 0*22*2 + ... + а^пХп = b2. (3.1) flml*14" От2*2 4" ••• 4" атпхп ~ ^т- При рассмотрении этого вопроса мы ограничимся случаем, когда система разрешима и имеет бесконечное множество реше- ний. Это означает согласно 1, 4.4, 4.5, что для матрицы системы и ее расширенной матрицы (Оц Oj2 ••• 0|т \ / Оц G12 ... в1п by \ O21 О22 ... О2л I _____ I 021 О22 ... О2<1 Ь2 | ат1ат2 атп / \aml flm2 ... Gmn bmJ имеет место: rang А = rang В = г < п. 3.2. В системе столбцов матрицы А выделим какой-нибудь ба- зис Неизвестным, не соответствующим столбцам выделенного базиса, придадим значения, равные нулю: *h = 0 (k=£ i‘i, i2, ..., ir). В результате мы получим систему линейных уравнений с неизвест- ными xt , xit .... х!г, которая согласно I, 4.5 имеет единственное решение. Таким образом, для выбранного базиса, определяемого последо- вательностью номеров столбцов »!, i2, ..., ir, существует единствен- ное решение системы (3.1) (а„ аа, .... ап), 165
в котором = 0 при k Ф i1( t2, ir. Это решение называется базисным, соответствующим выделенному базису. Иногда такие решения называются опорными. Конечно, в базисном решении могут оказаться равными нулю и некоторые из а,, а,*, ..., atr. Например, в однородной системе линейных уравнений нулевое решение является базисным. 3.3. Так как всякая линейно независимая система столбцов матрицы А может быть включена в некоторый базис системы всех ее столбцов, то решение системы (3.1) будет, базисным (соответ- ствующим некоторому базису} тогда и только тогда, когда столбцы матрииы А, соответствующие ненулевым значениям неизвестных в этом, решении, линейно независимы между собой. 3.4. В связи с рассмотрением базисных решений системы (3.1) отметим следующее свойство. Выделим какие-нибудь г столбцов матрицы А, например Vlt .... »г. Если V,, гг2, ..., vr есть базис системы столбцов матрицы А, то согласно II, 5.7 можно получить соотношения Х1 — 41(r+l) Хг+1 - ^Кг+2) Хг+2 ••• д\пХ,„ х2 = d2 — ^2(г+1) Хг+1 — ^2(г4 2) хг+2 — ••• — d2nXn, хг = dr -- xr+l — ^r(r+2) xr + 2 — dr„X„, которые при произвольных численных значениях xr+1, xr+i, ... . ... Хп определяют решения системы (3.1). Верно и обратное утверждение: если имеются соотношения указанного вида, которые при произвольных численных значениях х,+1, хг+2, .., хп определяют решения системы (3.1), то Р2, ... ..., vr — базис системы столбцов матрицы А. Так как rang А = г, то нам достаточно показать, что всякий столбец матрицы А линейно выражается через первые г ее столб- цов. Полагая х,+1 = хг42 = = хп =0, получаем решение (dt, d2, .... dr, 0, 0, ..., 0) системы (3.1), т. с. dtvt + d2v2 -г ... + drVr = р0- Полагая хг^г = 0, .... х^г = 0, xs = 1, х7т1 = 0, ..., хп — 0, полу- чаем решение системы (3.1): (alt a2, ..., ar, 0, ..., 0, 1, 0, ..., 0), т е. a,®, + ал>2 + ... + art>r + = <Э0 (/ = k + 1, k + 2, .... n). Так как т>0 линейно выражается через ©х, v2, ..., vr, то каждый столбец V, линейно выражается через v,, о2, ...,vr. Отметим, что из указанных соотношений при хг+1 = хгЬ2 = ... ... = х, = 0 получаем базисное оешение, соответствующее базису г2, ..., г»..: (dx, d2, .... dr, 0, 0, ..., 0). 3.5. Нахождение всевозможных базисных решений системы (3.1) согласно 3.2 сводится к нахождению всех базисов в системе столб- цов матрицы А, а последнее может быть осуществлено в соответ- 106
ствии с 11, 4.13, 4.15 с использованием отличных от куля миноров r-го порядка матрицы А. Важно отметить, что, поскольку количество различных базисов в системе столбцов матрицы А конечно, тем самым и количество базисных решений системы (3.1) тоже конечно. 3.6. Теорема Если система линейных уравнений ;3.!) имеет неотрицательные решения, то она имеет также и неотрица- тельные базисные решения. Доказательство. Если система (3.1) однородная, то в качестве неотрицательного базисного решения можно взять ее нулевое решение, которое, как мы отмечали в 3.2, является ба- зисным. Рассмотрим случай, когда система (3.1) не является однородной. Можем считать, что свободные члены в этой системе неотрицательны: bt 0; I = 1, 2, ..., т (это всегда можно получить, меняя знаки в левой и правой частях того или иного уравнения системы). Доказательство проводим по индукции относительно количе- ства неизвестных п в системе (3.1), учитывая, что 0 < rang Л = = г < п. В случае п =2 имеем г = 1. Поэтому система (3.1) эквива- лентна одному из своих уравнений, например первому: ^11^1 “Ь а^х.^ = bk 0). Так как существует неотрицательное решение этого уравнения duai + °i2a2 = blt <%! 0, a2 0 и hr > 0, то по крайней мере один из коэффициентов au, а12 дол- жен быть положительным, например an >0. Тогда , 0) есть \<2П / неотрицательное базисное решение, соответствующее базису, со- стоящему из одного первого столбца матрицы А. Пусть теперь п > 2 и и = (a1t a2, ..., a„) — какое-нибудь неотрицательное решение системы (3.1). Сначала рассмотрим случай, когда среди а1( а2, ..., ап ьслъ равные кулю, например а-, =0. Тогда (av а2, ..., «„-J есть не- отрицательное решение системы, получающейся из (3.1) удалением членов, содержащих хп: 4~ ^12^2 ~Ь ••• 4“ ^к'!—1) —1 — bi, ^2i-^i 4~ ^22^2 4~ • •• 4~ а.^п—и хj = Ь2 amlxl 4" 4" ... 4- am(n—v Хп—1 = bm. Если эта система имеет единственное решение, то rang А = п — — 1, т. е. и — 1 первых столбцов матрицы А образуют базис си- стемы ее столбцов и, значит, (а3, а2, ..., а, Jj, 0) есть базисное реше- ние, соответствующее этому базису. 107
Пусть построенная система имеет бесконечное множество реше- ний. Согласно индуктивному предположению для нее найдется неотрицательное базисное решение (fij, ра, ^л_2). Тогда (рп Р?! •••> Pn-i> 0) будет неотрицательным решением исходной системы (3.1), притом согласно 3.3 базисным решением, поскольку столб- цы матрицы А, соответствующие ненулевым значениям неизвестных в этом решении, линейно независимы между собой. Теперь будем считать, что в решении (alt а2, ..., а„) системы (3.1) все cij > 0; j = 1, 2, ..., п. Так как rang А = г < п, то для столбцов матрицы А имеем линейную зависимость- XjV, + 4- ... -j- = О. Другими словами, вектор W — (Х1( 12, ..., А„) есть ненулевое ре- шение однородной системы линейных уравнений, соответствующей (3.1), т. е. получающейся из (3.1) обращением свободных членов в нуль. Пусть Xj #= 0. Можем считать, что > 0 (иначе изменим знаки одновременно у всех X,,). Обозначим: Р = max —-, -i, .. at a2 p = h. > 0. Тогда согласно I, 5.7 является решением системы (3.1). Оно неотрицательное > X \ 1 =-^1. Поэтому к найденному решению и — — W системы (3.1) можно применить рассуждения уже рассмотренного случая. 3.7. Теорема 3.6 позволяет в каждом конкретном случае уста- новить, существуют ли неотрицательные решения данной системы линейных уравнений или нет. Для этого достаточно найти базисные решения системы, количество которых конечно (3 5), и установить, существуют ли неотрицательные решения среди них. Если среди всевозможных базисных решений системы линейных уравнений нет ни одного неотрицательного, то согласно теореме 3.6 система во- все не имеет ни одного неотрицательного решения. 3.8. Пример. Рассмотрим систему х! + х2 — *3 — *4 — Е 2х( — х2 + х3 — х4 = 0, Х1 — х2 + х3 + 2х4 = —2.
Она, как легко убедиться, разрешима, причем rang А = rang 3=3. В ее матрице /1 1 —1 _1\ А = 2 — 1 1—1 \1 —1 1 2/ вгорсй и третий столбцы пропорциональны. Поэтому существует всего лишь два базиса системы ее столбцов, один из которых состоит из первого, второго и чет- вертого столбцов, а другой — из первого, третьего и четвертого. Для нахождения соответствующих базисных решений придаем поочередно значение, равное нулю, сначала неизвестному х3, а затем х2. Получаем две системы * 1 + *2 — х4 = 1, 2*1 — х2 — х4 — О, xi — х2 + 2х4 = —2, * 1 “• *з — х4 = 1, 2xt + хв — х4 = О, * 1 + х3 + 2л4 = —2. Решая их, находим базисные решения исходной системы: / 1 А \ 7 ’ 7 ’ Среди них нет неотрицательных. Поэтому исходная система вовсе не имеет неотрицательных решений. § 4. Задачи линейного программирования 4.1. Теория линейных неравенств тесно связана с одним из мо- лодых разделов математики — линейным программированием, за- нимающимся разработкой общих методов сравнения различных вариантов решений экономических задач. Это направление иссле- дований гозникло в конце 30-х годов нашего столетия. Первыми здесь были работы советского математика Л. В. Канторовича. Наиболее интенсивно это направление развивается начиная с 50-х годов. В настоящее время линейное программирование является одним из основных математических методов в экономике. 4.2. Многие вопросы экономического характера приводят к математической формулировке основной задачи линейного програм- мирования. Рассмотрим лишь один из вариантов такой задачи, называемой задачей об использовании ресурсов Пусть некоторое предприятие имеет ресурсы видов R2, ... ..., Rm (это могут быть различные виды сырья, оборудования и т. п.), находящиеся соответственно в количествах blt b2, .... Ьт условных единиц. Перед предприятием стоит задача выпускать продукцию видов Тг, Т2, .... Т„ так, чтобы доход от выпуска про- дукции был наибольшим. Известно, что для производства одной единицы продукции вида Т= необходимо использовать a:j единиц ресурса и при этом доход равен су. Требуется спланировать вы- пуск количества единиц х,- продукции каждого вида Тj так, Чтобы общий доход был наибольшим. (Разумеется, рассматриваемая задача условная, в ней не учитываются все факторы, влияющие на выпуск продукции.) 10Н
Математическое оформление этой задачи состоит в следующем. Общее количество каждого ресурса 7?г, затраченного на производ- ство всевозможных видов продукции, равно ailXl + а12Х2 + ... + Й/лХП. Оно не должно превосходить имеющегося в наличии количества Ь. единиц ресурса anxi + ai2x2 + ... + ainxn < bt (i = 1, 2, ..., m), Доход от выпуска всей продукции равен: .S — CjXi 4* <е2Х2 4" ••• 4" йпхп* Для системы линейных неравенств, указанных выше, каждое ее неотрицательное решение (Р4> <х2, ..., (Хп) соответствует допустимому выпуску продукции каждого вида, При этом доход от выпуска всей этой продукции равен значению S при хх = х2 — а2, ..., хп = ап, т. е. Ci«i + с2а2 + ... + с„а„. Среди неотрицательных решений указанной системы линейных неравенств требуется найти такое, при котором значение 5 при- нимает наибольшее значение. Условие неотрицательности решений системы линейных нера- венств может быть оформлено в виде дополнительных неравенств Xj 0 (; == 1, 2, ..., /г), включаемых в рассматриваемую систему. 4.3 Основная задача линейного программирования в общем виде имеет следующую формулировку. Пусть даны система, состоящая из нескольких линейных нера- венств и уравнений, рассматриваемых в области вещественных чисел: + ... + ащхп ^.bi ({ = 1, 2, ..., s), /а «ихг 4- ak2x2 + ... + Щпхп = b* (k = s+ 1, s + 2....s + f), ' ; и выражение вида: f (xlt x2, .... X,,) = CjX! 4- c2x2 4- ... 4- Cnxn (cf £ R), которое можно рассматривать как функцию от хь х2, ..., хп. Для всякого решения (аь а2, ..., ап) системы (*) определяется значение этой функции f (alt а2, .... а„) = Cjaj 4- с2а2 4- ... + Слап, 1оворят, что функция f = f (xn х2, ..., хп) рассматривается на множестве решений системы (*). Задача нахождения решения системы (*), при котором функ- ция /, рассматриваемая на множестве решений этой системы, принимает наибольшее значение (max f) или же наименьшее зна- чение (min /), называется общей задачей линейного программиро- вания. 110
Говорят также, что задача состоит в максимизации (или мини- мизации) функции / на множестве решений системы (*)• Про ука- занное в определении решение системы (*) говорят, что оно мак- симизирует (или минимизирует) функцию f. Задачи максимизации и минимизации взаимно связаны соотно- шением —min f = max (—f). Поэтому в общих исследованиях можно ограничиться каким-ни- будь одним случаем, При поставленной задаче линейного программирования соот- ношения системы (*) называются ограничениями данной задачи, а каждое решение этой системы называется допустимым. Решение системы (*), максимизирующее (или минимизирующее) функцию /, называется оптимальным решением данной задачи ли- нейного программирования, а соответствующее значение функции f, т. е. max / (или min /), называется оптимальным значением за- дачи. Если задача имеет оптимальное решение, то она называется раз- решимой, а если не имеет, то — неразрешимой. 4.4. Вообще говоря, оптимальные решения для поставленной задачи линейного программирования не всегда существуют, а если существуют, то не обязательно определены единственным образом, их может быть даже бесконечно много. Отсутствие оптимального решения связано с тем, что множество значений функции f для всевозможных решений системы (*) мо- жет быть не ограничено сверху или снизу. 4.5. Пример. Рассмотрим систему линейных неравенств х — 2у < О, 2х — > > О, х + у > 3 Поставим задачу максимизации ча множестве ее решений функции f (х, у) = х + у. 3 Эга задача неразрешима, поскольку произвольные х = у у) — удовлетворяют системе, но с увеличением этих значений х и у значения функции неограниченно возрастают. Задача минимизации функции f — f (х, у) не множестве решений данной системы разрешима. Действительно, значения I (х, у) не могут быть меньше, чем 3, а значение, равное 3, она принимает, например, при х = 1, у = 2, что со- ставляет решение данной системы. Значит, (1, 2) есть оптимальное решение зада- чи г min f = 3. Легко видегь. что существуют и другие оптимальные решения задачи миш- мизации функции ft х= а, у = 3 — а (1 < а < 2). 4.6. Среди задач линейного программирования особое место за- нимают такие, в которых рассматриваются лишь неотрицательные 111
решения системы (*). Обычно в систему ограничений (*) не вносят соответствующих соотношений Xj 0 (/ = 1, 2, п), но особо оговаривают это обстоятельство' при постановке задачи. В этом случае, говоря о допустимых и оптимальных решениях задачи, имеют в виду лишь только неотрицательные решения системы (*). Для таких задач линейного программирования наиболее ха- рактерны два типа задания ее ограничений. В одном случае все ограничения системы (*) имеют вид нера- венств аах1 + а,2х2 + ... + ainxn 6, (с = 1, 2, т). При такой форме задания системы ограничений задача линейного программирования, состоящая в максимизации (или минимиза- ции) функции на множестве неотрицательных решений этой систе- мы, называется стандартной. Если же все ограничения имеют вид уравнений + ••• + а-цХп =bi(i — 1, 2, ..., т), го соответствующая задача называется канонической. 4.7, Стандартная и каноническая задачи легко могут быть пре- образованы одна в другую. Пусть задана стандартная задача линейного программирования. Для системы линейных неравенств, являющейся системой ее огра- ничений (4.6), построим при помощи добавления новых неизвестных хп+1, Хп+2, ..., хп+т систему линейных уравнений; й11х1 4~ °12х2 4" ••• 4* а1пхп + Хп-Н = bJt п^.х, 4" a22x2 4- ••• 4- U'2nXn 4~ х^ч-2 — Ь2> ат1х1 + ат2х2 4- ••• 4” OmnXfi 4" хт+т = Ьт. Благодаря 1.8 для всякого неотрицательного решения этой си- стемы ((Xi, СС2, ..., ОС;, ОСпл-1, 0СП4-2, ..., Ctn+m) получаем неотрицательное решение (ах. а2, ..., cQ исходной систе- мы линейных неравенсгв, причем всякое ее неотрицательное реше- ние может быть получено указанным образом. Значения функции f не зависят от хп+\, хп+-2, .... х„+т- Поэтому мы можем заменить исходную систему линейных неравенств по- строенной системой линейных уравнений. Тем самым мы получаем каноническую форму для нашей задачи. Пусть теперь задана каноническая задача линейного программи- рования. Заменим каждое уравнение системы ее ограничений (4.6) anXi 4- al2x2 |- ... + атхп = &/ двумя линейными неравенствами. o.'iXj + ai2x2 + ... 4- <i(nxn —~OnXi — 0/2X2 — — ainXn —Ь/ 112
(i = 1, 2, ..., tri). В результате мы получим систему линейных неравенств, эквивалентную данной системе линейных урав- нений. Тем самым наша зада- ча приобретает стандартную форму. 4.8. Задачи линейного про- граммирования имеют нагляд- ную геометрическую интерпре- тацию в случае п — 2, 3 Пусть ограничения задачи линейного программирования за- даны в виде неравенств anx 4- а12у < ftp д21х 4- а22у < Ьг, @mlX &т2У 'С и на множестве решений этой системы требуется максимизировать функцию / (х, у) = с2х + с2у. Данная система линейных неравенств определяет согласно 1.5 на плоскости с фиксированной прямоугольной декартовой системой координат некоторую многоугольную область М (рис. 7). Рассмотрим па плоскости семейство прямых, заданных уравне- ниями f (х, у) — с, т е. CjX 4- с2у = с для всевозможных с С R. Эти прямые при различных значениях с параллельны между собой. Можно считать, что мы имеем дело с одной прямой, которая при изменении с перемещается параллельно себе па плоскости (при с = 0 она проходит через начало координат). С увеличением значения с прямая или «поднимается» (при с2 > 0) или «опускается» (при с2 < 0)- В первом случае (с2 > 0) наиболь- шее значение функции f определяется точкой касания А: координа- ты хд, уА этой точки дают оптимальное решение нашей задачи. Во втором случае (с2 < 0) оптимальное решение дают координаты Хв, Ув точки В Если нам потребовалось бы максимизировать функцию / на мно- жестве не всех, а лишь неотрицательных решений данной системы линейных неравенств, то мы должны были бы ограничить область Л4 первой координатной четвертью и вместо точки R взять точку С. 4.9. Пример. Рассмотрим систему линейных неравенств х 4- 2у > 3, Зх — у > 2. х + у < 6. ИЗ
На множестве ее неотрицательных ре- шений требуется максимизировать функцию I (х, у) = х — у. Многоугольная область W, сгрсделяе мая данной системой неравенств с до- полнительным условием неотрицатель- ности решений, изображена на рис. 8. Прямая, заданная уравнением х — у= = с, образует с осью Ох угол, по вели- л _ чине равный —. С возрастанием с прямая «опускается». Оптимальное решение соответствует прохождению прямой через течку D (6, С): х = 6 у = 0, max f — 6. _ Если снять ограничение неогрица- ”ис- °- тельными решениями, тс найденное ре- шение, как непосредственно видно на рисунке, не давало бь: наибольшего зна- чения функции f. Для минимизации функции f нужно взять прямую, проходящую через точку С (2, 4): х = 2, у = 4, mln f = —2. Рассмотрим функцию g (х, у) = х + у. Прямая, заданная уравнением х + у = с, образует с осью Ох угол, по величине Зл равный —. С возрастанием с эта прямая «поднимается». Для максимизации функ- 4 ции g на множестве неотрицательных решений данной системы линейных нера- венств следует взять отрезок СО. Координаты любой точки этого отрезка макси м изи рукх- g: х= а, у = 6 — а (2 а 6), max g = 6 Если снять ограничение задачи неотрицательными решениями системы то и некоторые другие точки прямой, проходящей через точки С и D, будут определять оптимальные решения задачи, но значение max g = 6 останется прежним. Задача минимизации функции g имеет оптимальное решение, соответствую- щее прохождению прямой через точку В (1, 1): х = 1, у = 1, min g= 2. § 5. Теорема двойственности 5.1. В теории линейного программирования важной оказыва- ется возможность для всякой задачи линейного программирования составить другую задачу, связанную с первой, но имеющую в определенном смысле противоположный характер. При этом раз- решимость каждой из них имеет место лишь в случае разрешимо- сти другой и, более того, их оптимальные значения совпадают. Мы ограничимся рассмотрением стандартной задачи линейного программирования. 5.2. Пусть дана стандартная задача линейного программиро- вания, которую назовем задачей (I), состоящая в максимизации функции / (-^1» й-2» *’•» ^2-^2 T" ••• Ч" СцХп 114
на множестве неотрицательных решений системы «1Л + °.2Л2 + ... + й|Л < ^1. агЛ | а?2х2 + ... + а2Пхп />2, (П &т1%1 “Ь ^7и2^2 ~Ь ••• + йт Хп '<• Ьгц. Исходя из этой задачи, сформулируем другую стандартную за- дачу линейного программирования, которую назовем задачей (II), состоящую в минимизации функции ё (У1. У 2..Ут) = Ml + Й2у2 + ... + Ь^ут на множестве неотрицательных решений системы ^пУ1 + а2\Уг 4* ••• + а.-п\Ут clt «12У1 + а22у2 + ... + ат2уда > сг, (2) атУ1 + «2Пу2 + ... + атгут сп. Задачи (I) и (II) называются двойственными друг другу. Ана- лизируя их, мы легко подмечаем характер взаимной связи между ними. Матрицы, составленные из коэффициентов при неизвестных систем (1) и (2), взаимно транспонированы. Сами соотношения этих систем записаны при помощи знаков неравенства противопо- ложного смысла. Свободные члены каждой из систем выступают в качестве коэффициентов функции в другой задаче. И наконец, если в одной из задач вопрос состоит в максимизации функции, то в дру- гой — в минимизации. 5.3. Имея целью установить равнозначность взаимно двой- ственных задач (!) и (II), предварительно установим необходимые в дальнейшем соотношения между ними. Лемма. Пусть («1( а2, ..., ал) — какое-нибудь неотрицатель- ное решение системы (1), (рь р2, ..., рт) — какое-нибудь неотрица- тельное решение системы (2). Тогда f (04, а2, ..., ап) < g (рь р4, ..., pj. Доказательство. Имеем числовые неравенства; ^11^1 ~Ь ^12^2 4" • •• 4* ^1» <4iai + аг2а2 4- ... + а„а„ Ь2, «т1«1 + ^/п2®^2 + ... 4- ^тп^п Ьт. Умножая на неотрицательные числа ...» $т и почленно складывая, получаем: т т S (а,^ + а/2а2 + ... + airlaj р,< = g (р,, ре, .... р^), r=i 1=1 115
или, что то же самое: X flva/Pi g (Pi. Ps, ...» pm). i, i Имеем также: О11Р1 Т Л21Р2 + ••• + amlPm > G. OjsPi + O22P2+ ••• + “m2p.7i> <-’2, Я1лР1'+ д;'лРа + ... J- ^wiPm Cn* Умножая на неотрицательные числа аь а2, .... ап и почленно скла- дывая, получаем: л п Г (с(/р! + ааур8 + ... 4-a^/PJa, > S ср, = / (аъ а2, .... а..), /=1 /=1 пли, что то же самое; S °оР<«у >/(«!, «2..... а„). Ц I Сопоставляя полученные числовые неравенства, приходим к тре- буемому соотношению: / (“1. а2..<М <g(Pi, Рг, PJ- 5.4. Следствие. Пусть (alt a2, ..., a„) — неотрицатель- ное. решение системы (1), (Р,, р2, ..., рт) — неотрицательное реше- ние системы (2). Если f (“i. a2..“„)=- g (pi, p2, .... pm), mo (a,, a2, ..., a,J — оптимальное решение задачи (I), а (рь Р2, ... ..., Pm) —оптимальное решение задачи (II). И следовательно, / (аь а2, ..., an) — g (рг, р2, .... Рт) есть оптимальное значение кик задачи (I), так и задачи (II). Доказательство, Для произвольного неотрицатель- ного решения (£1( £2, ..., |г.) системы (1) благодаря 5.3 имеем: / (Si, U U < £ (Pi. Р2......Pm) = f («1. «2, “J- А это и означает оптимальность решения (an a2, ал) задачи (I): шах / = / (а1( а2... ал). Аналогично и для произвольного неотрицательного решения (’ll. Лг, •••. Ди) системы (2) имеем g (’ll. Ъ...Пт) > Z («I» а2. aJ = g(Pi. Р2. Рт). что означает оптимальность решения (Р1( р2, ..., Р^) задачи (II): filing = g(Pi, Рь .... Pm). 5.5. Пример. Пусть дана стандартная згдача максимизации функции / (*1. х2, ха, х4) = —х2 + xs — л* 116
на множестве неотрицательных решений системы *1 — + х3 - х4 < 2, •Ч — *з < —1- Двойственной по отношению к ней является задача минимизации функции g (Уп Уз) = 2ух - у2 на множестве неотрицательных решений системы У1 + Уз > 0. — У1 > -К У1 — Уз > 1. — У1 > — 1- Непосредственно видно, что =0, х2 — 0, л3 = 2, х4 = С будет допустимым решением системы ограничений первой задачи. При этом со- ответствующее значение функции / равно: / (0, 0, 2, 0) = 2. Также видно, что у, = 1, у2 = 0 есть допустимое решение системы ограни- чений второй задачи, причем g (1, 0) = 2. Согласно 5.4 найденные решения в каждой задаче являются оптимальными. При этом max / = min g = 2. 5.6. Лемм а. Если какая-нибудь из двойственных задач линей- ного программирования (I) или (II) имеет оптимальное решение, то система ограничений другой задачи имеет неотрицательные ре- шения. Доказательство. Пусть (а4, а2, ..., ал) есть оптималь- ное решение задачи (1), т. е. 0, а2 0, ..., ая 0. 0,i«i + а/за2 + ••• + а.пап < b, (i = l, 2, ..., т), max f = f (а1( а2, ..., а,7) = схау + с2а2 + ... + спа.п. Предположим, что система (2) не имеет неотрицательных решений. Благодаря 2.8 найдутся неотрицательные числа у1( у2, .... у , такие, что 0,171 + 0 2Тз + ••• + 0,п7л С 0 0=1, 2, .... т), 0171 + 027? +• ••• + 0i7n > О- Тогда значения •«1 = «1 + 71 > 0, *2 = + 7з > 0, •••, Хп = а.п + 7„ > 0 удовлетворяют системе (1): 0,1 («1 + 71) + 0,2 (а2 + 7г) + ••• + ain (а, + у„) = = (0ц“1 + 0.заз + - + а.па«) + (0(17i + 0,27? + ••• + 0^7-.) < (1 = 1, 2, ..., т). п?
Однако соответствующее значение функции f оказывается в этом случае больше, чем max f: f («1 + Yi. аг + Ya. • ••, <Xn + Tn) = = q (a, + Yi) 4- c2 (a2 + Yz) + - + Cn (a„ 4- yn) = (c^ 4- -r c2a2 4- ... 4- cna„\ 4- (cph + c2y2 4- ... 4- c„yn) > Cjat + + c2a2 + ... + c„a,t = f (alf a2, ..., an). Полученное противоречие означает, что в действительности, при наличии оптимального решения задачи (I) мы имеем также и неотрицательные решения системы (2). Совершенно аналогично с использованием 2 7 доказывается и второе утверждение леммы. 5.7. Теорема двойственности. Если система огра- ничений одной из задач (I) или (II) не имеет неотрицательных реше- ний, то обе задачи (I) и (II) неразрешимы. Если и система ограничений задачи (I) и система ограничений задачи (II) обе имеют неотрицательные решения, то обе задачи (1) и (11) имеют оптимальные решения и оптимальные значения их совпадают: max f = min g. Доказательство. Первое утверждение теоремы выте- кает непосредственно из леммы 5 6 Будем рассматривать случай, когда системы (1) и (2), являю- щиеся системами ограничений задач (I) и (11), обе имеют неотрица- тельные решения. Для доказательства теоремы нам достаточно показать существование неотрицательного решения следующей системы т + га линейных неравенств с т 4- п неизвестными *г...хп, уъ у2, .... ут: аахг Б а12х2 -г ... + ainxn < Ь, (i = 1, 2.гаг), О1Д1 4- а2,у2 4- ... 4- amiym Cj(j = 1, 2.. га), которое к тому же было и решением неравенства qq 4- сгхг 4- ... 4- СпХ„ 4- Ь2уг 4- ... 4- Ьтут. Если мы найдем такое решение (alt а2, ..., а,„ ръ рг................. рт), то для неотрицательных решений систем (1) и (2) («1, .....an) и (Pi, р2, .... PJ будет выполняться / (cq, а2, ..., а„) > g (Р1( р2.р„). Вместе с неравенством противоположного смысла (5.3) это приво- дит к равенству / (oq, а2, .... ап) = g (рп р2..рт), и тогда применение 5.4 завершает доказательство теоремы. Н8
Предположим противное требуемому, т. е. что для рассматри- ваемой системы, которую запишем в виде: ajXt 4- а2х2 + ... + ainxn < bt (г = 1, 2, .... т), —aijyl — a2jyi — ... — amJym^.—Cj(j=l, 2, .... п), —«Л — c-ix2 — • •• — Сг.хп + 7?1у1 + Ь2у2 4- ... + bmy„ О, кс существует неотрицательных решений. Тогда на основании тео- ремы 2.7 найдутся неотрицательные вещественные числа I». •••, Im, ’ll, *1г, *Ь У, для которых выполняются следующие п 4- >п + 1 числовых нера- венств: О1Л + a2ila + ... + аЛ15от — ст? > О, «12?1 'Ь «22^2 4” ... 4- ^п2^пг <-зУ О, О1Л + «2Л^г 4- ... 4- атп1т — спу О, —«нЪ — ад, — ~ «iTln 4* btf О, «21*11 -- «22*12 -- ... -- «24*1’1 4- Ь2у О, —«mi’ll — «012*12 ••• «тл*]п 4" Ьту О, Mi 4- b£2 4- ... 4- bnlm — c^t — с2т]2 — ... — c„p„ < 0. Для числа у 0 рассмотрим две возможности: у = 0 и у > > О — и покажем, что каждая из них приводит к противоречию. Это и завершит доказательство теоремы. Пусть у — 0. Взяв какое-нибудь неотрицательное решение («j, а2, ..., а„) системы (1), получаем: Mi 4- b2l2 4- ... 4- bmlm £ («,!«•! 4- а,./х2 4- ... 4- = <=1 = («1Д1 + 4" ... 4“ «т;тт) 0. /=1 Взяв затем какое-нибудь неотрицательное решение (ри р2,... .... рд,) системы (2), получаем: «i*li 4- с2п2 4- ... 4- с„т]п < С S («1/₽1 + «2/Р? 4- ... 4- «,4/Рт) П/ = = S («и*)1 4- «:2’|2 4- ... 4- «<В*1П) Pi < о. /=1 119
В результате приходим к неравенству, которое противоречит по- следнему из соотношений, определяющих выбор чисел • •• •... U. !)ц !h. .... ГЫ. У- Mi + Ms + - + ЬгЛп > -vh + ^2 + + зд. Пусть теперь у > 0. В этом случае из системы соотношений, определяющих выбор чисел |2, ..., Ьт, т)1} т]2, у, получа- ем, что (-1-, ..., —'(есть неотрицательное решение системы (2), \ у У У ) а /к, ..., 2k (— неотрицательное решение системы (1). Но \Y V У ! тогда согласно 5.3 ... — + + ... 4-frm-. У У У У У У т. е. С1Л1 + с2112 + - + с-ДЬ < Mi + Ь,12 + ... + Ьт1т, что опять-таки невозможно. 5.8. Рассмотрим общую задачу максимизации функции I (х„ х2, .... х„) = + сах2 + ... + спхп на множестве всевозможных (не только неотрицательных) решений системы: Он*: + °1Л + — + дьЛ, < by, a2ixi + а22х2 + ... 4- й2,1Хп Ьг, ат1х1 + #/и2^2 +... + ОтпХн Ьт. Эту задачу можно преобразовать в стандартную следующим обра- зом. Введем новые неизвестные х'., х. (j = 1, 2, .... т) и поставим задачу максимизации функции f = Су (х( — Х() + С2 (х; — х") + ... + С„ (х'п — х'п) на множестве неотрицательных решений системы: а.у (х; — xj) + g12 (х' — х2) + ... + aln (x'it — x"n) < by, ^2i (-^i ^|) т а22 (х2 Х2) -|- ••• “Ь Ч2п (xn Xf) 5^ i'2, ат1 (x’l — <) + Om2 + ••• + « — x’n) < bm. Если (?;, g2, ..., Vp l2’ •••’ ееть неотрицательное решение этой системы, то, очевидно, (|( — 1J, |2 — £*, ..., • , ? — В’) будет решением системы ограничений исходной об- щей задачи. Верно также и обратное- если (у,, у2, .... уп) есть реше- ние для системы ограничений общей задачи, то, представляя каж- >20
дое Уу в виде разности двух неотрицательных чисел (что можно еде- лать многими способами) уу = =1, 2, . ., п), мы полу- чаем неотрицательное решение' (£', •••> С) последней системы. При этом значения максимизируемых функций для соответствующих решений совпадают. Благодаря сказанному мы можем исходную общую задачу за- менить сформулированной стандартной задачей. 5.9. Теперь исходя из задачи (5.8) поставим каноническую за- дачу минимизации функции g (У1, Уг. Ут) = Ml + Ml + - + ЬтУт на множестве неотрицательных решений системы ОцУ! + «2. У 2 + +ат1Ут = с1. а12У1 + °2?Уг + ••• + атеУт — С2> а\п У1 + ОглУг + ••• + Оп,пУт — Сп. Эту задачу мы можем в соответствии с 4 7 преобразовать в стан- дартную, заменив каждое уравнение указанной системы двумя не- равенствами: О1/У1 + %У2 + - + atn!ym < cj, { 2 -Я1/У1 — а2;Уг — - — ат/Ут < — 9 ’ ’ "" 5.10. Сопоставляя стандартные задачи, полученные в 5.8 и 5 9, видим, что они взаимно двойственны в смысле 5.2. К ним мож- но применить теорему двойственности 5 7. Следст вие. Если какая-нибудь из задач (5.8) или (5.9) имеет оптимальное решение, то и другая задача тоже имеет опти- мальное решение и их оптимальные значения совпадают. § 6. Симплекс-метод 6.1. Для решения задач линейного программирования приме- няются различные общие методы. Наиболее известным является симплекс-метод, применяемый при решении канонической задачи (4.6) и представляющий собой алгорифм, позволяющий через ко- нечное число определенных вычислительных операций найти оп- тимальное решение или установить, что задача неразрешима. 6.2. Пусть дана каноническая задача максимизации функции / (Xi, х2..........х..,) = 4^1 + с2х2 + ... + спхп на множестве неотрицательных решений системы ОцХ1 4~ а1гх2 ... 4- Пых,, — ®2iX] 4“ а22х2 -|- ... ~Ь а2пхп — b2, «т1*1 + <W2 + - + ЯтпХп = Ьт- 12)
Как и в 3.1, ограничимся случаем, когда эта система разрешима и имеет бесконечнее множестве решений, т. е. rang А = rang В = = г < /t? г > 0. 6.3. Пусть система (6.2) имеет неотрицательные решения. Среди них должны находиться и базисные (3.6). Возьмем какое- нибудь неотрицательное базисное решение этой системы. Не огра- ничивая общности рассуждений, можем считать, что соответствую- щий базис системы столбцов матрицы А состоит из г ее первых столбцов Ф1( г»2, ..., ъг. Тогда согласно 3.4 можно найти выражения х1У х2 хг через хг+1, хг+2, ..., хпу которые запишем в виде: Xi + C?i(r+1) xf+1 + ^1(г.|-2) 2 "Ь ••• 4* d\nXn — c/j, X? "Ь ^2tr-H) ^r + 1 +rf2(r+2>-’Cr+2+ ... 4" d2nXn = ^2’ Хг + ^г(г+1) *г+1 4" ^r(r+2)-^f+2 4~ ... + d,„xn — d,. Придавая хг+1У xr+2, ..., хп произвольные численные значения, мы получаем всевозможные решения системы (6.2). При хН1 = «= хг+2 = ... = хп = 0 получаем исходное неотрицательное ба- зисное решение (d1; d2, ..., dfy 0, 0, .... 0) и, значит, г/х 0, d2 о. .... аг > о. Ввиду сказанного полученную систему соотношений можно рас- сматривать как систему ограничений данной канонической зада- чи 6.2. В этом случае, подставляя выражения л1( х2, .... хг через хг+1, хг+2у •••. хп в запись функции f, получаем для нее выражение, которое запишем в виде: I + ег+1Диг+1 + ен 2хг+2 + ... + е»хп = ес. 6.4. Пусть при выбранном неотрицательном базисном решении системы (6.2) для данной канонической задачи система ее ограниче- ний и выражение функции f представлены в указанном в 6.3 виде. Из различных возможных случаев особо выделим следующие два. Теорема. 1) Если ег+1 0, ег+2 0, •••. «л 0, тс (dt, d2, ..., dr, 0, 0, ..., U) есть оптимальное решение канонической задачи 6.2, а ее оптимальным значением является max f = е0. 2) Если найдется ek < 0 (г + 1 k п), такое, что dkk 0, d2k 0, .... drk 0, то множество значений функции f на множестве неотрицательных решений системы (6.2) не ограни- чено сверху, и, значит, каноническая задача неразрешима. Доказательство. 1) Для любого неотрицательного решения (alt а2, ..., а„) системы (6.2), используя ег+1 0, ег+2 0, ..., еп 0, получаем / (otj, об2, ..., <хп) — е0 ег+2осЛ^_2 —— ... £пС&л <СО = / №,d2, ...,dr! о, о, ...,0), и, значит, max f — f (dt, d2, ..., dr, 0, 0, ..., 0) = e0. 2) Пусть теперь ek < 0 при некотором k (rf 1 n) и 0, d,.( 0, ..., dr/{ 0. 122
Возьмем произвольное вещественное чисто Л е0. Полагая в соотношениях (6.3) хг+1 = 0....... хй_, =0, xk =» е° S 0, ек xk+i — •••» ~ получаем некоторое решение системы (6.2). Оно неотрицательное, поскольку для всякого i = 1, 2, .... г имеет / £ - \ место X) = dt — dlk d,. Для найденною пеотрицатель- \ «л / ного решения значение функции f оказывается равным о: Так как 5 может быть сколь угодно большим вещественным числом, то функция f не ограничена сверху 6.5. Идея симплекс-метода состоит в следующем. Исходя из произвольного неотрицательного базисною решения системы (G.2) по определенному правилу строятся новые неотрицательные ба- зисные решения системы (6.2) до тех пор, пока не встретится такое неотрицательное базисное решение, при котором имеет место один из двух указанных в теореме 6.4 случаев, дающих ответ на вопрос данной канонической задачи. Получение нового неотрицательного базисного решения из дан- ного осуществляется по следующему правилу. Пусть взято неотрицательное базисное решение системы (6.2), соответствующее какому-нибудь базису системы столбцов матри- цы .4, например состоящему из первых г ее столбцов. При этом для сооюошений, полученных в 6.3, для поставленной канониче- ской задачи не выполнен ни один из двух случаев, рассмотренных в теореме 6.4, т. е. найдется ей < 0 (г + 1 Л п) и среди dlk, d2k, ..., drk есть положительные. Для всевозможных dl/t > 0 составим дроби — и среди них вы- dik берем такую, которая имеет наименьшее значение (вообще гово- ря, таких дробей может быть несколько, мы берем одну из них): р = ^>0 (1<р<г). Коэффициент dph называют разрешающим элементом. Из pro соотношения (6.3) выразим xh через хг+1, .... хр, хй+1, ..., х„. Хь — dP __dp(r+i) r dpii-D 1 у у “рЛ apk dpk dpfi dpk __ __ dpn у dpk Подставляя это выражение хк в остальные соотношения (6.3), мы получаем систему аналогичных выражений xlt х2........ х lt xh, Хр+и •••» х, через хг^.к, хг+2> ..., х^_х, хр, х^-ц, ..., хп. 123
Из способа нахождения этих выражений видно, что при любых значениях xr<M, хг+2...xft„lt хр, хк¥1, хп соответствующие значения хь х2, .... xp_lt xh, хр+1, ..., хг таковы, что вместе они со ставляют решение системы (6.2). Согласно 3.4 получаем новый ба- зис системы столбцов матрицы А: ©1( Ф2, ..., ©р_1( Фк, ®p+i» •••. Не- соответствующее базисное решение получаем, полагая хг+1 = О, хг^_2 *= 0, ..., х^_ 1 = 0, хк — р 7^ 0, xk+i — 0, ...» хр 0, и тогда *т = dt — dlkp > О, х2 — d2 — d2„p > О, хр-\ — d?-i — Фр-нхР О, хр = dp — dphp => О, xp+i — dp+i — dipil)hp О, х; = d, — drkp 0. (Полученное базисное решение неотрицательно, поскольку каждое d, неотрицательно, и при dlk > 0 имеем р т. е. хг = d( — ' du, — dtp > 0.) Отметим, что значение функции f при полученном базисном ре- шении, равное е0 — ehp, благодаря ек < 0 и р 0 не меньше, чем значение при исходном базисном решении, ранное е0. G.6. Указанный в 6.5 процесс проводится так, что получающиеся неотрицательные базисные решения соответствуют различным между собой базисам системы столбцов матрицы А. Может быть показано, что это всегда осуществимо при определенном способе выбора на каждом этапе разрешающего элемента. А так как коли- чество базисов системы столбцов матрицы А конечно, то процесс не может быть бесконечным, и мы получим один из случаев, рас- смотренных в теореме 6.4. Из сказанного вытекает, что если каноническая задача разреши- ма, то одно из неотрицательных базисных решений системы ее ограничений является ее оптимальным решением. 6.7. Вычисления, осуществляемые в соответствии с описанным симплекс-методом, удобно проводить при помощи таблиц, называ- емых симплекс-таблицами, в которые вносят коэффициенты членов исходных и получающихся соотношений указанного в 6.3 вида. В соответствии с 6.5 при замене хр на х* коэффициенты членов р-го соотношения (исключая член х„, заменяемый на Хд) умножаются на —. Для получения любого другого i-ro выражения нужно к коэффициентам исходных членов (исключая первый член х,) при- бавить коэффициенты полученного р-го соотношения, умноженные на —dtk. Для получения коэффициентов выражения, содержащего 124
функцию f, нужно произвести аналогичное сложение с домпоже- нием коэффициентов р-гс соотношения па —е*. 6.8. Пример. Рассмотрим каноническую задачу максимизации функции / («1. Х2, Х3, Х4, Х3, Х8) = 3 Х4 — х4 + х5 — хе на множестве неотрицательных решений системы *1 + Ч = 3> х4 — 2х4 + хв = О, —х, — х5 + х6 = —1. Эта система разрешима; ранг ее матрицы равен 3. В качестве базиса системы столбцов матрицы системы можно взять первый, второй и третий столбцы, соот вег ствующяе неизвестным х4, х2. х8. Соответствующее базисное решение неотрица- тельно. Находим: Xj = —х6 + хв + 1, х2 = 2х4 — хв, х3 = ХБ — х0 + 2, / = —х4 — 2х5 + 2х„ + 3. Эти соотношения запишем в виде 6.3: Х1 + х5 — хв = 1, х2 — 2х4 Ь хв = О, х3 — хь + хв = 2, f + Х4 + 2х6 — 2хв = 3. Дальнейшие вычисления проводим с использованием симплекс-таблиц, в кото- рых выделяем выбираемые разрешающие элементы. Неизвестные, соошетствующие базисным столбцам в каждом базисе системы столбцов матрицы исходной систе- мы, обычно называют базисными. Базисные неизвестные *1 х2 *3 х4 Хь л'е Свободные члены «1 1 0 0 0 1 -1 1 *2 0 1 0 —2 0 0 *3 0 0 1 0 -1 1 2 f 0 0 0 1 2 —2 3 Базисные неизвестные ! *1 х2 *з х4 х6 хв Свободные члены А 1 1 0 —2 1 0 1 Х<1 0 1 0 —2 0 1 0 *3 0 — 1 1 IJLI -1 0 2 f 0 2 0 -3 2 0 3 125
Базисные неизвестные *> Х4 Свободные члены Х1 1 0 1 0 0 0 3 0 0 1 0 —1 1 2 *4 0 2^ _ 2 2^ 2 1 ~ 2 0 1 f 0 _1_ 2 3_ 2 0 2 0 6 В результате получаем базис, состоящий из первого, четвертого и шестого столбцов матрицы исходной системы уравнений, такой, что соогзстствующсс ба- зисное решение неотрицательно и имеет место первый из двух случаев, рассмот- ренных в теореме 6.4. Значит, поставленная каноническая задача разрешима, ее оптимальным решением является (3, 0, 0, 1, 0, 2), а оптимальным значением: max f = 6. 6.9. При помощи канонической задачи с использованием симп- лекс-метода может решаться вопрос о нахождении неотрицательных решений системы линейных уравнений aaxi + ai2x2 + ... + атх^ = b! (i = 1, 2....т). При этом, не ограничивая общности рассуждений, считаем, что все Ьг О (ибо одновременно можно менять знаки в левой и правой частях уравнений). Вводя новые неизвестные х„+1, хп+2, .... х„+т, строим новую систему линейных уравнений: а,Л + ai2x2 + ... + ainx,t + xn+i =-- bt (i = 1, 2, ..., m). Легко устанавливается связь между решениями этих систем. Рассмотрим каноническую задачу максимизации функции / “ %п+1 Хп-^-2 ••• Xn-f-m на множестве неотрицательных решений построенной системы. Учитывая, что значения функции f неположительны, приходим к следующему. Исходная система линейных уравнений имеет неотрицательные решения тогда и только тогда, когда поставленная каноническая задача имеет оптимальное решение и max f = 0. В этом случае оптимальное решение задачи обязательно имеет вид у2, ... .... уп, 0, 0, ..., 0), где (Vj, у2, ..., у„) есть неотрицательное решение исходной системы. Для решения указанной канонической задачи можно применить симплекс-метод, взяв в качестве исходного базис, состоящий из последних столбцов второй системы (соответствующее базисное ре- шение неотрицательно). Полученное оптимальное решение (Ti, Уг, .... Т.н 0, 0, ..., 0) будет согласно 6.6 базисным. Ввиду 3.3 для 126
исходной системы уравнений решение (у,, уг, у.,) тоже будет базисным. 6.10. Каноническая задача может быть использована при вы- яснении вопроса о разрешимости и нахождении решений системы линейных неравенств общего вида а,!*) + х,2х2 + ... + а,пхп < bt (i = 1, 2, ..., m). Исходя из данной системы построим систему линейных уравнений: + «г/У2 + ••• + amjym = 0 (/ =1,2,. ., п), Mi + Мг + - + bmym — ym+i = -1. Из 2.1 следует, что первая система разрешима тогда и только тогда, когда во всяком неотрицательном решении второй системы Ут+i 1- Одним из таких решений является (0, 0, .... 0. 1) Рассмотрим каноническую задачу минимизации функции f У п+1 на множестве неотрицательных решений построенной системы ли- нейных уравнений. Благодаря сказанному выше приходим к сле- дующему. Исходная система линейных неравенств разрешима тогда и только тогда, когда поставленная каноническая задача имеет опти- мальное решение и min f — 1. Чтобы найти решение исходной системы неравенств, заменим в соответствии с 5,10 данную каноническую задачу обшей задачей максимизации функции g = — гп+х со значением max g — 1 на мно- жестве всех (не только неотрицательных) решений системы: + + ... + а.„гп +&А+: < 0 (i = 1, 2, ..., т), гп+1 • Разрешимость этой задачи, равно как и предыдущей, означает разрешимость исходной системы линейных неравенств. Для ее оптимально о решения (бп 62, ..., 6,1+|) благодаря max g — 1 должно выполняться — ё„+| — 1, т. е. б„+1 — — 1, и поэтому (5П 6г, ..., 5Л) оказывается решением исходной системы. Для решения указанной общей задачи линейного программиро- вания ее можно перевести в каноническую, сначала придав ей стандартный вид способом 5.8, а затем использовав 4.7. В резуль- тате мы получим каноническую задачу максимизации функции g — = — (а' — г'+1) со значением max g — 1 на множестве неотрица- тельных решений системы: «д « — <) Д ai2 (?; — /')+ ... + а,,, (г'п — + bt (zn'+l — г ^) + 4- t{ = 0 (i = 1, 2, .... т), ~ IZn+l 2л+1) + ^,+1 ~ Для ее оптимального решения (г', г', .... z’n, г' , г", z", ... ..., г”, гДр llt t2, ..., tm, tm+1) решением исходной системы будет (zj - z;, г2 - z2...г^гп). 127
Глава IV. ЛИНЕЙНЫЕ ПРОСТРАНСТВА § 1. Исходные понятия теории линейных пространств 1.1. При рассмотрении координатных векторных пространств мы не случайно выделили в I, 2.5 семь их важных свойств. Дело в том, что эти свойства служат основанием для того, чтобы сформули- ровать более общее понятие, играющее важную роль почти во исех областях современной математики. Определение. Пусть L есть некоторое непустое мно- жество и Р — некоторое числовое поле. В L определено действие, называемое сложением, согласно которому каждой паре элементов и, v £ L сопоставляется третий элемент из L, обозначаемый через и + с. Также определена операция умножения элементов из L на тесла из Р, согласно которой каждой паре, состоящей из эле- мента и 6 L и числа. X С Р, сопоставлен элемент из L, обозначае- мый через Хи (или иХ). Если при этом выполнены нижеследующие семь свойств, то L, рассматриваемое вместе с указанными двумя операциями, назы- вается линейным пространством над Р. 1) Коммутативность сложения', и + v = v + и. 2) Ассоциативность сложения, (и + v) + w — и + (и 4~ ш). 3) Обратимость действия сложения: для любых и, v С L всегда найдется такой, х € L, что и + х — v (х называется разностью между v и и и обозначается х — и — и). -4) Ассоциативность умножения на числа из Р: X (ри) = (Хр) и. 5) Свойство дистрибутивности относительно сложения чисел. (X 4- р) и — Хи + ри. 6) Свойство дистрибутивности относительно сложения эле- ментов из L: X (и + о) = Хи + Хо. 7) Свойство единичного множителя: 1и — и. Следует иметь в виду, что в литературе определенное таким образом линейное пространство часто называется векторным про- I2&
странством, а его элементы — векторами. Однако мы, как услови- лись выше, будем употреблять эти термины только в случае линей- ного пространства, рассмотренного в § 2 первой главы К понятию линейного пространства в общем виде подошел в своих работах немецкий математик Г. Г р а с м а н (1809—1877). В оконча1ельной современной форме оно было сформулирована итальянским математиком Дж. Пеано (1858—1932). 1 2. Рассмотренное в § 2 главы I координатное комплексное векторное пространство является частным случаем введенного понятия. У<п) есть линейное пространство над полем всех комплекс- ных чисел Z1. Если ограничиться рассмотрением векторов из У(Л), имеющих лишь вещественные компоненты, а умножать их лишь на веществен ные множители, то мы получим линейное пространство над полем вещественных чисел R, называемое (см. I, 2.3) п-мерным коорди- натным вещественным векторным пространством. Взяв произвольное числовое поле Р, мы можем рассматривать совокупность всех n-вектороз, компоненты которых принадле- жат Р. Если эту совокупность рассматривать относительно опе- раций сложения п векторов и умножения их на числа из Р, то она оказывается линейным пространством над Р. Это линейное про- странство будем называть п-мерным координатным векторным пространством над Р и обозначать его через i' р Как мы увидим в дальнейшем, эти линейные пространства игра- ют особую роль. При Р = Z имеем: У1?' — У(Л). Если Р — Rr то Уд’ есть упомянутое выше координатное вещественное векторное прост- ранство размерности п. Некоторые подмножества координатного векторного простран- ства У(Л) оказываются линейными пространствами. Например, благодаря I, 5.4 совокупность всех решений произвольной заданной однородной системы линейных уравнений оказывается линейным пространством. Множество геометрических векторов пространства евклидовой геометрии, рассматриваемое вместе с известными операциями сло- жения векторов и умножения их на вещественные числа, как легко видеть, образует линейное пространство. Его называют линейным пространством геометрических векторов. Как мы видели в I, 2.4, фиксируя декартову систему координат, мы можем трактовать это линейное пространство как У*д. В некоторых разделах математики приходится рассматривать бесконечные последовательности чисел (аь а2, а., ...). Как и для конечных последовательностей, для них определяются действие сложения и операция умножения на числа. При этом опять-таки можно брать любые числа или ограничить компоненты последова- 1 Широко используется также обозначение С. 5 Заказ 553 129
тсльностей каким-либо числовым полем Р, соответственно и умно- жение последовательностей осуществлять лишь на числа из Р. Без труда проверяется выполнение свойств 1.1 ив этом случае. Следовательно, мы опять имеем линейное пространство. Очень часто бывает нужно рассматривать не любые последо- вательности, по удовлетворяющие некоторым дополнительным ус- ловиям, относящимся к свойству сходимости тех или иных свя- занных с ними бесконечных рядов. Наиболее простое требование состоит в сходимости ряда, со- стоящего из всех компонент последовательности (с^, а2, аз» •• ): «1 + + а3 + ... . Так как сумма сходящихся рядов является сходящимся рядом и в результате умножения сходящегося ряда на число получается ряд также сходящийся, то мы получаем линейное пространство. Рассмотрим вещественные функции, заданные на некотором промежутке Е вещественной оси, которые дважды дифференциру- емы. Пусть р (х) и q (х) — произвольные функции, заданные на Е. Выделим те из наших функций у =f (х), которые удовлетво- ряют соотношению, у" + р (х)у + q (х)у = О (соотношения подобного рода называются дифференциальными урав- нениями). Без труда проверяется, что совокупность вещественных функций, которые удовлетворяют этому соотношению, будет ли- нейным пространством над полем R относительно обычных дей- ствий сложения функций и умножения их на числа. Если в качестве частного случая взять р (х) = 0, q (х) = 1, то элементами соответствующего линейного пространства оказы- ваются функции sin х и cos х. И вообще всякая функция вида f (х) = a sin х + b cos х при любых a, b £ R. Соответствующий подход к системам функций играет важную роль з теории дифференциальных уравнений. Примеры важных линейных пространств, появляющихся в различных областях математики, можно было бы приводить почти неограниченно. 13. При изучении линейных пространств постоянно приходится использовать простейшие свойства, вытекающие изосновных свойств, входящих в определение 1.1. В частном случае векторного про- странства Vм справедливость соответствующих свойств непо- средственно основывалась на том, как осуществляются в I/’4* ос говные операции согласно самому их определению. В случае общего линейного пространства соответствующие свойства требуют вывода (хотя большей частью и очень простого), основанного на выполне- нии основных свойств из 1.1. Остановимся сначала на свойствах сложения. В произвольном линейном пространстве £ существует единст- венный элемент 0, такой, что и + 0 = и при любом и С £. 139
Действительно, для элемента 0 = с — с, определенного для произвольного с £ L, имеем: и + В = и + (с — с) = ((и — с) + + с) + (с — с) = (и — с) 4- (с + (с — с)) = {и — С) + с = и. Если элементы 6' и 0' из Z, обе обладают указанным свойством, то О' + 0’ = 0', 0" + О' =0’ и, значит, 0' — 0*. (В частности, и — Н = 0 ДЛЯ ВСЯКОГО и £ £.) Элемент 0 называется нулевым элементом в L. При необходи- мости в записи нулевою элемента указывается линейное прост- ранство, относительно которого проводятся рассуждения- 0 = Q,. Сходство с обозначением 0Л в Vin': (I, 2.6) не случайно, поскольку 0V("> = Эл • Элемент 0 — и (и С Е) называется противоположным элемен- ту и и обозначается- —и = 0 — и (т. е. и + (—и) = 0). Для всякого и £ L противоположный ему элемент определен единственным образом. Действительно, если и' и и" — элементы, противоположные и, то и' — и' + 0 = и’ -) (и + и") = (и' + и) +«'’=0 4- и" — и". Из соотношения (—и) + и —- 0 вытекает, что по отношению к — и элемент и является противоположным, т. е. и = —(— «). Отмесим также, что —(и + v) = (—и) + (—v) при любых и, v ^L, поскольку (и + v) + ((—и) + (—о)) = (и + (—и)) + (п4- + (—и)) =0 + 6 = 0. Разность между произвольными элементами « и о из L может быть выражена в виде и — и = и + (—и) (и тем самым разность и — v определена единственным образом, т. е, операция вычитания в линейном пространстве однозначна). Действительно, и — V = (и — v) + 0 = (и — о) + (и + (— о)) = ((« — и) + и) + + (—и) = U + (—D). Заметим, что проведенные выше рассуждения в отношении свойств сложения в линейном пространстве по существу повторяют рассуждения, проведенные в Ч. VII, § 2 в отношении произволь- ных групп. 1.4. Отметим некоторые свойства, связывающие нулевой и противоположные элементы в линейном пространстве L с опера- цией умножения на числа из Р в L I) 0« =0 при любом и £ L. Действительно, Си + Си = (0 + + 0)« = Си. Поэтому Си = Си — Си — 0. 2) ХО = 0 при любом X £ Р. Действительно, Х0 = X (00) = = (X 0)0 = 00=9. 3) Если Х« = 0 (и £ X, X £ Р), то или X = 0, или и — С. Дей- ствительно, если X + 0, то u = 1и=(—-Х^м = — (Хи) = —0 = 0. \Х I X ' ' X 4) (—1)и — —и при любом и £ L. Действительно, и + (—I)u = = (1 + (—1))и = Си = 0 и, значит, (—1)и является элементом, противоположным «. 5* 131
1.5. Теория линейной зависимости, изложенная б § 2 первой главы для п-векторов, без труда переносится на любые линейные пространства. Определение. Говорят, что элемент v линейного про- ипранспгва L над полем Р линейно выражается через элементы их, и 2, ит f L, если су ществуют такие числа Х1( л2, ...,Ат £ Р,что V = XjUj + ^-2ц2 + ••• + ^тит- Выражение, стоящее в правой части, называют линейной комби- нацией элементов их, и2, ...» ит. Элементы их, и2, ..., ит называются линейно зависимыми между собой, если существую^ такие числа осп сс2, •••> am € Р, из которых не все равны нулю, что otjUj И- а2ы2 + ... + атит = 9д. В этом случае про систему, состоящую из элементов и,, u2, .... ит, говорят, что она линейно зависима. Если элементы и}, и2, ..., ит не являются линейно зависимыми между собой, то они называются линейно независимыми между со- бой, а сама система, состоящая из этих элементов, называется линейно независимой. Это означает, что соотношение + а2Ма + ••• + a,n«m = °L выполняется только при 04 = а2 = ... == ат =0. Систематическое исследование свойств линейной зависимости в линейных пространствах было начато и осуществлено немецким математиком Г. Грасманом (1809—1877). 1.6. Так же, как и в первой главе (I, 2 8, 2.11), доказывается справедливость в произвольном линейном пространстве L следую- щих свойств. Теорема. Если элементы и}, иг, ..., ит £ L (т 2) линей- но зависимы между собой, то один из них выражается линейно че- рез другие. Если же эти элементы между собой линейно независимы, то ни один из них не может быть выражен линейно через другие. Четыре достаточных условия линейной зависимости. 1) Если среди элементов их, и2, ..., ит £ L один является нулевым, то ult и2, ..., ит линейно зависимы. 2) Если часть из элементов их, и2, ..., ит С L линейно зависима, то и все элементы системы их, и2, .... между собой линейно за- висимы. 3) Если каждый из элементов их, и2, ..., ит £ L может быть вы- ражен линейно через элементы о1( У2, .... vt g L, число которых I меньше т, то их, и2, ..., ит линейно зависимы. 4) Если каждый из элементов их, и2, ..., ит £ L может быть вы- ражен линейно через элементы vlt и2, .... vm, которые между собой линейно зависимы, то и их, и2, ..., ит линейно зависимы. 132
Также и ряд простейших свойств, связанных с линейной зави- симостью и линейным выражением, рассмотренных нами в I, 2.9, оказывается, очевидно, справедливым и в произвольных линей- ных пространствах 1.7. Понятие и основные свойства базисов переносятся в теорию произвольных линейных пространств. Определение. Говорят., что элементы ии иг, .... и, из подмножества М линейного пространства L образуют базис Л'!, если выполняются следующие два условия-. 1) Элементы и1, и2, иг линейно независимы между собой. 2) Всякий элемент из М может быть линейно выражен через th, и2, ..., иг. В определении базиса условие 2) может быть заменено, так же как и в 1, 2.12, условием 2’) Для всякого v с М элементы и, иЛ, ut, ..., иг линейно зави- симы между собой. Определяя базис при помощи условий 1) и 2'), о базисе говорят как о максимальной (по включению) линейно независимой системе. Разумеется, каждый элемент из М может быть выражен линейно через данный базис лишь единственным образом. Следует, однако, иметь в виду, что в произвольном линейном пространстве не каждое множество имеет базис. 1.8. Пример. Покажем, что в линейном пространстве всех бесконечных последовательностей чисел из псля Р (1.2) не существует базиса. Действительно, предположим, что элементы «2, ..., ип этого линейною пространства образуют его базис. Тогда (п + 1) элементов V, = (1, 0, 0, ...), о2 = (0, 1, 0, ...). vn = (0, 0, .... О, 1, 0, ...), »л+1= (°- О,..., О, 1,0,...), МЙ выражающихся линейно через а2...'должны были бы быть согласно 1.6 линейно зависимы между собой. Однако если хотя бы одно из чисел а, (. Р от лично от нуля, то «1»1 + o2v2 + ••• + + ... )- ал+1я/!+1 = (Oj, а2.а;.вя+1, 0, 0, ...)=£ =# (0, 0, .... О, ...) = 0. 1.9. В том случае, если подмножество линейного пространства обладает базисами, для них вполне аналогично тому, как это было сделано в I, 2.1,5, доказывается справедливость основных свойств базисов. Теорема о базисах. Если подмножество М линейного пространства L обладает базисами, то они обладают следующими свойствами. Все базисы М состоят из одного и того же количества элементов. Всякие линейно независимые между собой элементы из М мо- гут быть включены в некоторый базис совокупности М. тзз
Всякие линейно независимые между собой элементы из М в коли- честве, равном числу элементов в базисе, сами образуют базис М. 1 10. Аналогично I, 2.1G вводится понятие ранга. Определение. Если подмножество М линейного про- странства L обладает базисом, то количество элементов в базисе называется рангом М: rang М. Если М — нулевое подмножество, т е. содержит единственный элемент 0, то ранг М считается равным нулю. Если линейное пространство L само обладает рангом (т. е существуют базисы всего линейного пространства L), то L называется конечномерным, а его ранг — размерностью L. Б соот- ветствии с термином «размерность» употребляют обозначение: diin L = rang L. Термин «размерность» и соответствующее обозначение dim L употребляются в литературе чаще, чем «ранг» L. Но его не при- нято относить к произвольному подмножеству М ст L. Поэтому нам будет удобнее придерживаться термина «ранг» и обозначения rang и в том случае, когда речь идет о самом L. Если линейное пространство не имеет ранга, то его называют бесконечномерным и говорят, что его размерность бесконечна. 1.11. Теорема. Для того чтобы подмножество М линейного пространства L обладало рангом, необходимо и достаточно су- ществование такого числа s, что всякие s элементов из М линейно зависимы между собой. При этом rang М < s. Доказательство. 1) Если М обладает рангом, рав- ным г, то в качестве указанного s можно взять любое число, боль- шее г, поскольку благодаря 1.6 всякие $ элементов, выражаясь линейно через г элементов базиса, будут сами линейно зависимыми между собой. 2) Если М состоит только из нулевого элемента (нулевая сово- купность), то rang М = 0 и 0 < s для любого s. Пусть М — ненулевая совокупность, обладающая числом s с указанным свойством. Пусть г — наибольшее из натуральных чисел, таких, что в М существует последовательность ult и2, ... .... иг линейно независимых элементов, тогда как всякие r+ 1 элементов из М линейно зависимы. Очевидно, г < s. Для любого v С М имеет место линейная зависимость а0о + + а2п2 + ... + агыг = 0. а0 =/= 0, так как иначе ии и2, ..., и, оказались бы линейно зависимы- ми Отсюда получается линейное выражение и через ии и2, .... иг. Следовательно, ы1( и2, .... иг является базисом М При этом. rang М = г < $. 1.12. Следствие. Если подмножество М линейного про- странства L имеет ранг и М' <= Л1, то и М’ имеет ранг, причем rang М' rang М. 134
Дейегвительно, применяем к Л-Г теорему 1.11, беря в качестве s = г + 1, где г = rang М. 1.13. Если использовать обц.ее понятие поля (Ч. VII, 3.10), то по аналогии с определением 1.1 легко строится более общее понятие линейного пространства над произвольным (не обязатель- но числовым) полем. Более того, в качестве Р можно брать даже и не поле, но произвольное кольцо (также не обязательно числовое). Такие образования также рассматриваются в современной мате- матике. Все же наиболее важными и чаще всего используемыми являются линейные пространства над числовыми полями, как они были определены в 1.1, причем главным образом для случаев, когда Р является полем всех комплексных чисел или полем всех вещественных чисел. 1.14 Пример. Если в множестве всех n-векторов из У*я> (компонентами которых являются любые комплексные числа), помимо сложения, рассматривать операцию умножения на любые комплексные числа, то получающееся линейное пространство над Z, как мы знаем, имеет ранг, равный п Если мы будем рассматривать то же самое V*”' относительно умножения лишь па вещественные числа, то. как легко видеть, мы получим линейное про- странство над R. По его ранг будет уже иным, а именно 2п. Действительно, это линейное пространство над R обладает следующим базисом: <?!=(!, о, 0 0), <?2=(0,1, Q 0)............ £„=(0,0,0 1), е\ = (i, 0, 0 0), е2 = (0. i, 0 0)......... е'п = (0, 0, 0, .... i). Произвольный вектор и = (а. + а2 + &2(........ а„ 4 bni) [a,.. bk € R) выражается линейно через указанные векторы U = <1)61 4’ а2₽г 4" ••• 4* 4* + i>2 ^2 4” •" 4" Ьпеп. Сами эти векторы линейно независимы, поскольку aifi 4- 4* ••• 4- 4* bJel + ьге2 4* ••• + Ьпеч = = (в) 4- bii, Oj 4* V, •• . ап 4- V), и равенство этого вектора с нулевым вектором 0 имеет мес~о лишь тогда, когда все ак и Ьк равны нулю. Можно также рассматривать наше множестве У*4* как линейное пространст- во над Q, если в качестве основных операций взять сложение и умножение на рациональные числа Покажем, что в этом случае получающееся линейное пространство над (? вовсе не обладает рангом. Предположим, что оно имеет ранг, равный т. Тогда всякие его т-р 1 эле ментов должны быть линейно зависимы между собой. Возьмем следующие т 4- 1 его элементов: «о= (1,0. 0....0), «1 = (я, 0, 0,.... 0), tf2 = (л2, 0, 0, .... 0). ита= = (лт, 0, 0, .... 0). Здесь л — известное трансцендентное число. Линейная зависимость этих век- торов означает, что при некоторых а0, а,, а2,.... ат С Q, из которых не все равны нулю, имеет место: 4- 4- «2«2 4- ••• 4- ат»т = ® 135
Но. выполнив соответствующие действия, получаем, что левая часть равна век- тору («0 4- а,л + а2л2 + ... + а,„лт, 0, 0, ..., 0). Так как число л трансцендент- но, то первая компонента этого вектора не может равняться нулю, поскольку вге а, рациональны. Следовательно, этот вектор не равен нулевому вектору О = (0, 0, (1, .... С). 1.15. В некоторых случаях понятию линейной зависимости и другим, связанным с ним понятиям бывает полезно придать не- сколько более широкий смысл. Пусть М есть произвольное (может быть, бесконечное) подмно- жестве линейного пространства L. Говорят, что v £ L вы р а ж а- е т с я линейно через/И, если v выражается линейно через некоторые и±, иг, .... ит С Л4. Говорят, что М линейно за- вис и м о, если в /И найдутся линейно зависимые между собой элементы ut, и2, .... ит £ М. Соответственно можно несколько шире трактовать понятие ба- зиса. Пусть М сд М' L. М (которое можег быть и бесконечным) назовем базисом М', если М линейно независимо и всякий эле- мент v £ М' выражается линейно через М. В случае, когда М конечно, мы имеем понятие базиса (конечно- го) в известном нам ранее смысле (1.7). 1.16. Ошетим, что относительно числового поля Р для про- извольного непустою множества М всегда существует линейное пространство L над Р, в котором Л! является базисом (сели М бесконечно, то в смысле 1.15). Искомое L может быть получено как множество формальных выражений вида AjUi 4- Xtua 4- ... -J- (и, С М, Л; б Р\ i = 1, 2, ..., k), причем два выражения, отличающиеся слагаемыми вида Ou,-, а также порядком следования слагаемых, считаем различными обо- значениями одного и того же элемента из L. Естественно вводятся операции. Пусть W = XjUj 4’ Х2И2 4" ••• + w + ^2U2 + ... + (ввиду возможности дополнения сумм слагаемыми вида 0иу-, мы гожем записать и ш, и w’ в виде сумм, в которые входят одни и те же «!, и2, ..., uft $ Л1). Полагаем: w 4* w' = (?•] 4- Х])»! 4~ (Х2 4- Xg)u2 ... 4* (^h "Е ^)ий, pay = ([aXJIZj 4- (цА2)«2 + ••• + (И б Р)- Без труда проверяется, что L есть линейное пространство над Р относительно определенных выше операций и что М есть базис (может быть, бесконечный в смысле 1.15) этого линейного про- странства. 133
§ 2. Линейные выражения систем элементов линейного пространства 2.1. При изучении линейных пространств часто встречается необходимость рассматривать линейные выражения элементов одной из систем через элементы другой системы. Определение. Пусть каждый из элементов vlt ц2, ... ..., vm линейного пространства L выражен линейно через элементы Uj, «2...ип £ L: У1 = allUl + fl12U2 “I" , У2 — a21Ul 4* ^22^2 + •• + a2nUn , vm = amlul + атги2 + ... 4- атпип . Матрица коэффициентов этих выражений (пи п12 ... ain а21 а22 а2'1 ®ml ^тг ^тп называется матрицей линейного выражения элементов vly vt, ... .... v„ через элементы ци иг, .... ип . 2.2. Если элементы ulf и2, ..., ип линейного пространства L линейно независимы, то для элементов vlt v2, ..., v„, выражающих- ся через них линейно, матрица линейного их выражения через u1( и2, ..., ип определяется единственным образом. Действительно, существование двух таких различных матриц, очевидно, означа- ло бы наличие линейкой зависимости между ult и2, . ., ип. Если и2, .... ип линейно зависимы, то для указанных р1( о2> •••> vn существует несколько матриц линейного выражения их через ulr н2, ..., ип. Действительно, к правым частям заданных линейных выраже- ний элементов vlt v2, ..., vm через иъ и2, ип можно, не нарушая равенств, прибавить линейную комбинацию элементов ulf и2, ... ..., ип , являющуюся левой частью их линейной зависимости. Оче- видно, внешне вид линейных выражений изменится и матрица ли- нейного выражения станет иной. 2.3. Пусть заданы элементы ult и2, ..., и„ линейного простран- ства L. Всякая (т, п)-матрица . а11 а\2 ••• ^1П Д = ' а21 й22 а-2П ^ini ••• ^тп' является матрицей линейного выражения некоторых элементов Vj, и3, ..., vm С L через и2, ..., ип. Последовательность таких элементов цХ1 v2 и,„ определяется при помощи и2, и„ и 137
матрицы Л единственным образом. Указанными элементами, оче- видно, являются: V1 = а11и1 + С12И2 + ••• + й1пип , о2 = апих + u22u2 -ь ... + atnun , ~ “Ь “Ь ^rnn^rt • То, что каждую матрицу можно рассматривать как матрицу линейного выражения, оказывается весьма существенным и в даль- нейшем будет неоднократно использоваться. 2,4. Здесь и далее будем все время считать, что vlt v2, ..., vm являются элементами некоторого линейного пространства L, вы- раженными линейно через ult и2, .... иа € L с матрицей линейного выражения А. Нас будет интересовать вопрос о возможности обратного ли- нейного гыражепия, т. е. линейного выражения ых, и2.ип через Р1, и2, ..., vm. 2.5. Лемма, rang (oj, о2, ..., v„,} rang {ult и2, .... u, }. Доказательство. Для простоты обозначений можно считать, что мх, и2, .... иг есть базис системы их, м2> •••> ип (таким образом, г = rang {ult и2, ..., и„ }). Из того, что все v{ линейно вы- ражаются через и1( и2, .... ип , следует, что они могут быть выра- жены линейно и через и,, и2, ..., иг. В частности, и s элементов (s — rang {t>1( о2, ..., и1П}), образующих базис системы и1( о2, ... ..., nm, выражаются линейно через указанные г элементов. Но тогда согласно l.G s г. 2.6. Теорема. Для того чтобы элементы их, ut, .... ип могли быть линейно выражены через vlt v2, .... vm, необходимо и достаточно, чтобы rang {u1( и2, ..., ип } = rang {р1( v2.и,Д. Доказательство необходимости. Пусть все кг линейно выражаются через их, о2, ..., vm. По предыдущей лемме rang {и1( V,, ..., vm} rang {иъ и.. и„}. Но по этой же лемме из линейного выражения ult и2, , и„ через их, и2, ..., v„, следует rang {ult и2, ..., ип } < rang {рь ог, .... vm}. Следовательно, эти ранги равны. Доказательство достаточности. Пусть rang {«j, и2. ..., ип} = rang fo, v2, .... vm} = r. В системе u1( u2, ..., un , vX) o2, ..., vm все элементы могут быть выражены через г элементов, образующих базис системы их, и2, ... ..., ип . Возьмем какой-либо базис системы и2, ..., vm, также со- стоящий из г элементов. Эти г элементов линейно независимы и число их равно рангу всей системы ux, и2, .... ип , о1( и2, .... vm. Согласно 1.9 они образуют базис этой системы. Поэтому элементы ц1( и2, .... ип могут быть выражены линейно через них и уж тем самым через элементы системы v.>, v,n. 13Я
2.7. Остановимся на важном частном случае, когда элементы «1, «2, ..., ип линейно независимы. В этом случае, с одной стороны, rang {«ц и2, .... ип } = п. С другой стороны, имеем следующее. Лемма. Ранг системы о1( и2, ..., vm равен рангу матрицы А линейного выражения этих элементов через линейно независимые ult и2, .... . Доказательство. Обозначим rang А = г. Для про- стоты обозначений можно считать, что первые г строк матрицы А образуют базис для системы всех ее строк. Из линейного выражения ult v2, ..., vm через ult и2, ..., ип не- посредственно видно следующее. Если й-я строка матрицы А явля- ется суммой первых г строк с коэффициентами А1( Х2, ..., "Кг, то vk будет равен -ф Х2и2 -ф ... + Хгог. Если мы покажем, что vlt v2, ..., vr линейно независимы, то тем самым докажем, что эта совокупность является базисом для vlt v2, ..., vm и потому rang {ulf v2, .... vm} = r = rang A. Если бы указанные элементы были линейно зависимы, то один из них выражался бы линейно через остальные. Пусть для опре- деленности записи vr = ajUj -ф a2v2 -ф ... -ф af_iVr_i. Подставим в это равенство вместо всех vL их линейные выраже- ния через и,, м2, .... ип . Так как между ult и2, ..., ип нет линейных зависимостей, ю для каждого ui коэффициент при и; в левой части (т. е. ari) должен равняться коэффициенту при и; в правой части: ari = -ф a2a2j -ф ... Ф ar_1a(r_1)z. To, что это имеет место для всех i = 1,2, ..., п, означает, что в матрице А r-я строка равна сумме строк с номерами 1, 2, ..., г— 1, умноженных на a1( а2, ... ..., аг-1. Но это противоречит тому, что первые г строк должны быть линейно независимыми между собой. 2.8. Из 2.6 и 2.7 непосредственно вытекает следующее. Следствие. Пусть ult и2, .... ип линейно независимы. Для того чтобы эти элементы могли быть выражены линейно через Uj, v2, ..., vm, необходимо и достаточно, чтобы /аП °12 ••• ат \ rang! Й21 °22 " | = п. ••• 2.9. Ссобо важную роль играет вопрос о возможности линейно- го выражения одной системы элементов через другую, когда в обеих системах число элементов одинаково. Согласно полученному выше это зависит от свойства матрицы линейного выражения. Определение. Квадратная матрица А порядка п назы- вается неособенной, если rang А = п. 139
А называется особенной, если rang А < п, 2.10. В ближайших параграфах мы не будем пользоваться поня- тием и свойствами определителей. Однако в свое время они нам спять понадобятся. В связи с этим укажем, что благодаря II, 4.3 определение 2.9 равносильно следующему. Определение. Квадратная матрица А порядка п назы- вается неособенной, если det А -у= 0. А называется особенной, если det А = 0. 2.11. Теорема. Пусть элементы t\, v2, ..., v„ линейного пространства L линейно выражены через линейно независимые между собой элементы ult и2, ип £ L с матрицей линейного вы- ражения А (которая тем самым является квадратной матрицей порядка п). Если А неособенная, то Vj, v2, ...» vn линейно независимы и все ии и2, .... и„ могут быть выражены через них линейно. Если А особенная, то vlt v2.линейно зависимы и невозмож- но выразить линейно все ult и2, ..., ип через vlt v2, ..., vn . Доказательство. I) Если А неособенная, т. с rang А = — п, то согласно 2.8 ult иа, ..., ип выражаются линейно через и2, .... vn . В этом случае с1( о2, ..., vn не могут быть линейно за- висимы, так как иначе согласно 1.6 линейно зависимыми оказались бы и «1, и2, ..., ип. 2) Если А особенная, т. е. rang А <п, то согласно 2.8 ии и2, ..., ип не могут быть выражены линейно через v2, .... vn Ранг системы v2, и2, ..., vn , согласно 2.7 равный рангу А, меньше п, и потому эти элементы линейно зависимы между собой. § 3. Линейные подпространства 3.1. При изучении того или иного линейного пространства вни- мание привлекают те его подмножества, которые сами являются линейными пространствами над тем же полем. Определение. Непустое подмножество L' линейного про- странства над полем Р называется линейным подпространством (причем слово «линейное» здесь нередко опускают}, если выполнены условия: 1) Для любых и, v Е L' имеет место и А- и £ L". 2) Для любых и £ L‘ и К £ Р имеет место Ей 6 L’. Эти условия можно характеризовать как условия замкнутости L‘ относительно операций сложения и умножения на числа из Р. 3.2. L' — линейное подпространство линейного пространства L относительно операций сложения и умножения на числа из Р, определенных во всем L, само оказывается линейным пространст- вом над Р. Действительно, в L', как легко видеть, выполняются все семь свойств из определения 1.1 (свойство (3) выполнено, поскольку v — и ~ v А- (—1)и, причем (—1) £ Р). 140
Очевидно и обратное, если L' — такое подмножество L, что относительно операций в L око само является линейным простран- ством над Р, то тем самым должны быть выполнены оба условия 1) и 2) из 3.1. Само L является своим подпространством. Нулевое подмноже- ство, состоящее из одного элемента 0, тоже подпространство. В связи с 1.10 ранг подпространства можно называть его раз- мерностью. Если линейное пространство L конечномерно, то благодаря 1.12 всякое его подпространство L' тоже конечномерно, причем rang L‘ rang L. Если при этом L* =/= L, то, очевидно, rang L' < < rang L. 3.3. Теорема. Пусть {ЬЛ есть некоторая совокупность подпространств линейного пространства L. Пересечение их L' = п ч является линейным подпространством. Доказательство. L’ не пусто, ибо 0 принадлежит всем 1^, и потому 0 £ L*. Пусть и, v С L' и X f Р\ и, v € Li для каждого L%. Но 7„g — подпространство, поэтому « + о 6 и Хи С L^. Так как и + v и Хи содержатся в каждом L&, то и + v и Хи содержатся з их пере- сечении L". 3.4. Определение. Для непустого подмножества At линейного пространства L назовем линейной оболочкой множества Л1 линейное подпространстве, являющееся пересечением всех подпро- странств, содержащих М На время условимся обозначать линейную оболочку At через Л1. Легко видеть, что линейная оболочка существует для всякого McL. Подпространства, содержащие М, всегда существуют. Например, одним из них является само L. Что касается пересече- ния всех этих подпространств, то оно согласно 8.3 само является подпространством, а следовательно, будет линейной оболочкой множества М. Всякое подпространство, содержащее М, содержит М. Тем самым, сравнивая подпространства при помощи отношения вклю- чения, можно сказать, что М есть минимальное подпространство, содержащее М. М является подпространством тогда и только тогда, когда М = М. 3.5. Теорема. Линейной оболочкой непустого подмножества М линейного пространства L является совокупность всевозможных элементов, представимых в виде: “А + а,иа + ... + a„v„, где ри v2, .... vn 6 М, ax, аг, .... ал Е Р, п— любое натуральное число. 141
Доказательство. Обозначим множество элементов, представимых указанном виде, через М''. По определению ли- нейной оболочки М = П Ъ > где каждое L. является линейным £ * подпространством и содержит М. Отсюда следует, что произволь- ный элемент из М': w — + a2v2 + ... + anvn должен при- надлежать L.. Но тогда си будет принадлежать и пересечению всех L*. Следовательно, М' с М. Но М', как легко видеть, само является линейным подпро- странством L Оно содержит Л1, поскольку и = lu С М' для лю- бого и 6 М. Следовательно, ЛГ дэ М. Таким образом, М' = М. 3.6. Из теоремы 3.5 следует, что если L обладает базисом, то линейной оболочкой базиса будет само L. Благодаря теореме 3.5 естественны следующие названия для М, употребляемые наравне с термином «линейная оболочка»- подпро- странство, порожденное множеством М\ подпространство, натяну- тое на элементы из М. 3.7. Согласно сказанному в 1.2 множество всех решений ка- кой-либо однородной системы линейных уравнений с п неизвестными сказывается линейным подпространством пространства 1/<л). Пусть даны две однородные системы линейных уравнений (I) и (2) с одними и теми же неизвестными. Система (3) получается из объединения систем (1) и (2). Непосредственно видно, что линейное подпространство, состоящее из всех решений системы (3), равно пересечению линейного подпространства решений системы (1) и линейною подпространства решений системы (2). 3.8. Множество всех чисел числового поля Р является линей- ным пространством над Р, если его рассматривать относительно обычного действия сложения и операции обычного умножения па числа. Линейной оболочкой множества, состоящего из одного числа О, очевидно, будет это же самое множество, состоящее из одного чис- ла 0. Если М ед Р и среди чисел, входящих в М, есть отличные от нуля, то линейная оболочка М совпадает с самим Р. Действитель- но, пусть a б М, а =Л 0. Для любого В Е Р имеем: В = j аЕЛП a Q М, (— Е Р' Следовательно, М = Р. \ а ) 3.9. Пусть Mlt Мг, .... Мп—некоторые непустые подмноже- ства линейного пространства L над полем Р. Под суммой Мг + + Л12 + ••• + Мп Обычно понимают совокупность всевозможных элементов L, представимых в виде Ui + иг -J- ... -|- ил, где и^^ Е (k = 1, 2, ..., п). Теорема. Если Llt L2, ..., Ln являются линейными подпро- странствами линейного пространства L, то их сумма -f- L2 -f- ... ... -j- Ln есть линейное подпространство L. 142
Если при этом все Lt конечномерны, то и их сумма + Lt 4- ... ... + есть конечномерное линейное подпространство, причем rang (Lt + L2 4- ... + Ln) < rang L2 4- rang L2 + ... + rang Ln. Доказательство. 1) Пусть и, v £ Lr 4- L2 + ... 4- Ln и X g P. По определению и = Ui 4- U2 4- ... + un, V = 4- V2 + ... + v„, где u(> Oi Li (1=1, 2, ..., n). Но тогда u 4* о = («1 4- »i) + (m2 4- v2) -I- ... 4- («„ + vn), где Ui 4* v, £ Li (t = 1, 2, ..., n), поскольку Lt есть подпростран- ство. Lu — (Luj) 4" (Lu2) 4* ••• H* (Lun), где Lut C Lt (i = 1, 2, ..., ri), поскольку Lt — линейное подпро- странство. Следовательно, и 4- v, Lu £ Lt 4- L2 4- ••• + L„. Lr 4- L2 4- ... ... -J- Ln оказывается подпространством. 2) Пусть каждое Lk имеет ранг. Возьмем в Lh какой-либо базис «Л1, •••♦ ukrk (6=1,2, .., п). Каждый элемент из Lt 4- L2 4- ... ... 4- Ln выражается линейно через элементы ик1, число которых равно гг 4- г г + ••• + гп- Согласно 1.6 всякие элементы из LT 4- 1 L2 4- ... 4- Ln, взятые в количестве, превышающем это число, будут линейно зависимы. Благодаря 111 отсюда следует, что 4- 4- L2 4- ... + Ln обладает рангом, не превышающим г2 4- г2 4- ... ... 4- гп. 3.10 Теорем а. Пусть L{ и Lt — два конечномерных под- пространства линейного пространства L. Тогда rang Li 4- rang L2 = rang (£, П L?) + rang 4- L.J. Доказательство. To, что Ll Q L2 и Lt 4- L2 имеют ран- ги, следует из 1.12 и 3.9. Возьмем какой-либо базис Т, П L2: zi, zt> • ••» zd Согласно 1.9 его можно дополнить и до базиса ва Zln Z2, ..., Zd, Uj, u2, ..., Up, и до базиса L2. Zj, z2, .... zd, v2, v2, ..., Og. Покажем, что zx, z2, za, ux, u2, ..., up, »1( v2, vf является базисом для 4~ L2. Каждый элемент из L1 4- L2: w = w1 4- w2 (о»! 6 Llt w2 C L2) — выражается линейно через указанные элементы, поскольку элемен- ты и w2 так выражаются. Предположим линейную зависимость: а1гг + ••• + ac.zd + PiHi + ••• + + Yiai + ••• + ~ ® 143
Так как г1( г2, ..., zd линейно независимы, то среди чисел или должны найтись числа, отличные от нуля. Будем считать, что не все нули. Из указанного равенства следует оц£1 4- ... + “А + PjUj + ... + ^pUp = (—Ti)Vi + ... + (— Левая часть равенства является элементом из Llt а правая — из £?. Следовательно, эти элементы принадлежат L2 f| £?. Но вся- кий элемент из L2 П £2 должен выражаться линейно через zlt z2, ..., zd. Поэтому (-'?1)У1 + ••• 4" (-Vq)Vg = ^1Z1 4- ^2*2 4’ ••• 4" ^dZd> что противоречит линейной независимости элементов ol( v2, ... .... vq, zlt z2, ..., zd, образующих базис L2. Мы доказали, что rang (£t 4- £2) = d 4* p 4* <7. Так как к то- му же rang L2 = d 4- p, rang L2 = d 4* q, rang {Lr p, L2) = d, 10 мы имеем требуемое равенство. Отметим, что предыдущее рассуждение сохраняется и при 1.2 0 ^2 = 9- В этом случае d = 0, а элементы z1( z2, ..., zd от- сутствуют. 3.11. По определению суммы линейных подпространств £х + 4- £2 + ... + Ln всякий элемент v из этой суммы выражается в виде в = i*i -г «2 4- ••• 4- «м € Л). Особого внимания заслужи- вает случай, когда такое выражение для каждого v единственно. Выяснение того, когда это имеет место, связано со следующим по- нятием. Определение. Пусть Ьг, L2, Ln являются подпро- странствами линейного пространства L. Их сумма £х 4- £2 4* ... ... 4- £п называется прямой, если Lk П (^-j 4- ••• 4- tfe-i 4- Ifc+i 4- ••• 4- = & для всякого J? = 1, 2, ..., п. 3.12. Теорема. Пусть Llt L2, .... L п— подпространства линейного пространства L. Для того чтобы каждый элемент суммы L' = L2 4- £2 4- ••• 4- Ln обладал лишь единственным линейным выражением вида w = их 4- «2 4- ... 4- Un (и, € Li, I = 1, 2. n), необходимо и достаточно, чтобы сумма была прямой. Доказательство необходимости. Пусть ука- занная единственность имеет место. Предположим, что сумма не является прямой. Тогда для некоторого uh f Lh имеет место1. uk — ui 4- ••• 4- 4- Ufe+i 4- ••• 4- «л #= О» где Ut 6 £,. Но это означало бы, что для uft имеется два различных выражения рассматриваемого вида: uk ~ Си, 4- ... 4" О^г—v 4~ lUfc + 0ийтХ 4- ••• 4- uh ~ 4* ... + 't* 4- lUftH 4* ... 4" lwrt. 144
Доказательство достаточности. Пусть рас- сматриваемая сумма является прямой. Предположим, что для некоторого элемента из L' существуют два различных выражения рассматриваемого вида: = th. 4" иг + ••• т Un — uj + и‘2 + ... + ип (и(-, Е Lr, i = l, 2, ..., п). Если uk ф u'k, то мы имеем: (Ufe — Мд) = (uj — Uj) + ... + (Uk_x — M/i-l) + (wi+i — — UA4 1) + ••• + (u'n — Un) 0, где левая часть принадлежит Lk, а правая Lx •(- ... + Lk_{ + 4 Lk+\ + ... 4- Ln. Но это противоречит определению прямой суммы. 3.13. Следствие. Пусть и1, и2, ..., ип — некоторые эле- менты линейного пространства L и £ъ Lt, .... Ln — их линейные оболочки. Для того чтобы L являлась их прямой суммой L = Lj + L2 4~ ••• 4* Ln, необходимо и достаточно, чтобы совокупность ии и2, ..., и„ была базисом L. Доказательство. Элементы из Lt имеют вид Lu, (Л f б Р, i = 1, 2, .... п). Каждый элемент v 6 L обладает единственным выражением v = XjUj + l2u2 4- ... 4~ К,ип тогда и только тогда, когда ut, и2, ..., ип есть базис. Но согласно 3.12 это имеет место тогда и только тогда, когда рассматриваемая сумма Lj + L2 + ... + Ln прямая. 3.14. Теорема. Пусть Ьъ Л2, ..., L п — конечномерные под- пространства линейного пространства L. Для того чтобы сумма L" = Li 4- L2 4“ 4- Ln была прямой, необходимо и достаточно, чтобы rang £' = rang + rang L2 + ... + rang Ln. Доказательство необходимости. Пусть сум- ма прямая. Как непосредственно следует из определения L" = Li 4- (А2 + ... -j- Ln). Так как Lt Q (L2 + ... -J- Ln) — 0, то согласно 3.10 имеем: rang L' = rang + rang (L2 + ... + Ln). Повторяя то же рассуждение для L2 + ... f Ln (эта сумма так- же, очевидно, является прямой) и продолжая так далее, через п — 1 шагов получим требуемое равенство. Доказательство достаточности. Обозначим rang Lt = d. Пусть rang L' = + ra + ... 4- rn. 145
В каждом Li выделим базис: • ••, vlr (i = 1, 2, п). Из определения суммы подпространств следует, что каждый элемент из U выражается линейно через совокупность всех v(/. Если бы совокупность всех v,, была линейно зависимой, то некоторое соб- ственнсе подмножестве этой совокупности, состоящей из гг 4- г2 + ... ... + гп элементов, было бы базисом L' и мы имели бы rang L' < t\ + г2 + ... -г гп. Так как это не так, то совокупность всех иц оказывается бази- сом L'. Отсюда следует, что каждый элемент из L' представим в виде и,_ + и2 + ... + ип, где и, 6 Lt (t = 1, 2, ..., п), единствен- ным образом. Поэтому согласно 3.12 рассматриваемая сумма долж- на быть прямой. 3.15. Если L' есть подпространство линейного пространства L и и £ L, то множество и + L' (т. е. совокупность всевозможных элементов, представимых в виде и + о, где v Е L') называется многообразием, связанным (или, как еще говорят, паоаллельным) с L". 3.16. Так как подпространство L' содержит нулевой элемент О, то и — и + В принадлежит к многообразию и + L’. Оказывается, что выбор элемента и из многообразия не существен. Если w Е и + L’, то w 4- L' = и + L". Действительно, w = и + и, где и Е L'. Поэтому для любого v Е L' имеем; w 4- и = и + v 4- v' Е и 4~ L'. Мы получили: ш + + L' с и 4- L'. Но вполне аналогично и и + L" ст w 4* L', поскольку и = w -г (—о), (—и) Е Е\ Следовательно, имеет место равенство. 3.17. В свое время (1, 5.7) мы показали, что множество всех решений общей системы линейных уравнений с п неизвестными со- стоит из n-векгоров вида и + V, где и — одно произвольное фик- сированное решение, а в качестве V берутся всевозможные решения однородной линейной системы, имеющей те же коэффициенты при неизвестных. Но совокупность всех решений однородной системы является подпространством координатного векторного простран- ства V(nt. Таким образом, совокупность всех решений исходной системы линейных уравнений оказывается многообразием, связан- ным с этим подпространством. § 4. Изоморфизмы линейных пространств 4.1. Пусть линейнсе пространство L над Р конечномерно (т.е. имеет ранг). Фиксируем некоторый его базис: иг, и2, ..., ип. Каж- дый элемент v Е L обладает единственным представлением в виде: v = ajtzi + а2«2 + ... + апип (а„ аа, ..., ап Е Р). Таким образом, каждому элементу из L сопоставляется после- довательность чисел из Р: (<хь а2, ..., а„). Этот n-вектор, который обозначим через v — (ан а2, .... а ), является элементом коорди- натного векторного пространства 1/(£’ (1.2). 146
При заданном базисе линейного пространства L указанный п- вектор р вполне определяет элемент & £ L. Можно сказать, что о представляет собой форм]' задания элемента v или даже просто является обозначением элемента v Принято говорить, что выбор базиса в L задает систему ко- ординат з L. Компоненты «-вектора V, соответствующего элементу v £ L, называют координатами в данном базисе или при данной системе координат. 4.2. Множество геометрических векторов в обычном трехмер- ном евклидовом пространстве представляет собой линейное про- странство над R. Если ь трехмерном евклидовом пространстве зафиксировать не- которую точку О, то между множеством всех геометрических векторон и множеством всех точек пространства устанавливается известным образом взаимно однозначное соответствие. Выбрав в пространстве какую-либо систему декартовых координат, мы, со- поставляя каждой точке тройку ее координат, получаем взаимно однозначное соответствие между множеством точек пространства и множеством всевозможных троек вещественных чисел. В резуль- тате мы можем получить взаимно однозначное соответствие между множеством всех геометрических векторов и множеством всех троек вещественных чисел. Это соответствие есть не что иное, как частный случай соответствия 4.1, в котором в качестве базиса взяты три геометрических вектора единичной длины, направленных по осям координат. 4.3. Возвратимся к общему случаю 4.1. Представление эле- ментов из L n-векторами обладает следующим важным свойством. Пусть для Vi £ L (i — 1, 2, 3): fj**= («р, а|£), ••• • 4°)’ т. е. + • • • + a«hin. Непосредственно видно, что если в L имеет место «1 + Щ то в V‘p для соответствующих векторов выполняется: -I- v2 = v3. Гак же из Uj = Хи2 следует, что в V'p = kv2. Таким образом, задание элементов конечномерного линейного пространства L п-векторами из позволяет просто и удобно совершать над ними основные операции линейного пространства. 4.4. Проведенные рассуждения естественно подводят к введе- нию понятия изоморфизма линейных пространств. Оно иснозыва- 147
ется на той же идее, которая лежала в основе понятия изоморфизма алгебраических систем, рассмотренного в Ч. VII, § 4. Идея заклю- чается в том, чтобы сопоставить и связать между собой системы, так сказать, одинаковые в отношении действий и отношений в них заданных. 4.5. Определение. Линейные пространства L и L* над одним и тем же полем Р называются изоморфными, если существует такое взаимно однозначное соответствие между множеством эле' ментов L и множеством элементов L', при котором выполняются следующие условия. 1) Для соответствующих пар элементов X х', у ** у', z — г' (х, у, z с L; х‘, у', / 6 £') из того, что в L выполняется х 4- у — 2, следует, что и для соот- ветствующих элементов в L' выполняется х' 4- у' = /, и наоборот (согласно Ч. VII, 4 2 это означает изоморфизм L и L' относительно сложения). 2) Для соответствующих элементов х — х‘, у *+ у' (х, у б L\ х', у' L*) и любого числа к £ Р из того, что в L выполняется Хх = у, следует, что и для соответствующих элементов в L' выполняется У.х' — = у', и наоборот Указанное взаимно однозначное соответствие называется изо морфизмом линейных пространств L и I/ Отметим, что заключительные слова «и наоборот» в каждом из двух условий определения в сущности не обязательны к могут быть опущены. Легко показать (аналогично Ч. VII, 4.3), что требования, которые они выражают, автоматически вытекают блаюдаря вза- имной однозначности из предшествующих этим слонам требований. Изоморфные линейные пространства с точки зрения двух основ- ных операций (сложение и умножение на числа из поля Р) ничем не отличаются. Отличие между ними может состоять лишь во внутренней природе и обозначении их элементов, что с точки зрения общей теории линейных пространств совершенно несуще- ственно. Отвлекаясь от этих различий, можно рассматривать изоморфные между собой линейные пространства как одно и то же пространство. 4.6. Непосредственно видно, что всякое линейное пространство изоморфно само с собой. Если L изоморфно с L', a L' с L”, то L будет изоморфно с L". При изоморфизме L и L' нулевые Элементы их соответствуют друг другу: 0д ♦♦ Од-. Это следует из того, что Од = Ou и 0д- = = Ou' при любых и б. L и и б L'. Отсюда вытекает следующее. Пусть ult u2, .... un £ L линейно зависимы ад 4- a2u2 + ... + a„u., = Од. 149
Тогда и соответствующие им элементы и\, «4....и'п 6 L' будут линейно зависимы, причем они связаны линейной зависимостью с такими же коэффициентами: оегИ1 + а2«2 + ... + = дс- Если v выражается линейно через щ, и2, .... ип: V — + 62U2 + ... 4- PflUn, то и соответствующий элемент v' будет выражаться линейно через соответствующие ti\, щ, ..., ип с теми же самыми коэффициента- ми: о' = Р1«1 4~ + ... + Рп“л Из сказанного следует, что при изоморфизме базису соответ- ствует базис. Ранги изоморфных линейных пространств равны (или оба не существуют). Для совокупности элементов, составляю- щих линейное подпространство линейного пространства, совокуп- ность соответствующих при изоморфизме элементов также состав- ляет линейное подпространство изоморфного линейного простран- ства. В сущности вес эти свойства, так же как и многие другие, мож- но заменить одним утверждением, что при изоморфизме соответ- ствующие элементы и обоих линейных пространствах связаны оди- наковыми соотношениями, выражающимися через две основные опе- рации линейных простоанств. 4.7. Рассмотренное в начале параграфа введение системы координат в конечномерном линейном пространстве представляет собою частный, хотя и очень важный, случай изоморфизма. Теорема. Всякое, конечномерное линейное пространство L над числовым полем Р, имеющее ранг, равный п, изоморфно коорди- натному векторному пространству V{p размерности п над по- лем Р (1.2). Доказательство Выбрав в L систему координат, т. е. фиксируя некоторый базис щ, uit .... ип, мы устанавливаем спо- собом, описанным в 4.1, взаимно однозначное соответствие между L и согласно которому для v = а., и, + a2u2 + ... + a:tun имеем; о = («I, ae, ..., ая) € Vp’. Как мы уже показали в 4.3, это соответствие обладает свой- ствами, указанными в 4.5, т. е. является изоморфизмом. 4 8 На основании свойств изоморфизма (4.6) из теоремы 4.7 вытекает справедливость следующего утверждения. Следствие. Все линейные пространства над Р, имеющие един и тот же ранг, изоморфны между собой. 4.9. Если стать на ту точку зрения, что изоморфные линейные пространства представляют собой в сущности одно и то же ликей- 149
ное прсстранство, то теорема 4.7 означает, что координатными еск- торными пространствами V'p* исчерпываются все конечномерный линейные пространства. При данном Р ранг (размерность) про- странства вполне его определяет (с точностью до изоморфизма). 4.10. Как мы уже обращали внимание, У^1 можно трактовать как множество точек пространства евклидовой геометрии, в ко- тором фиксирована некоторая декартова система координат. Так как rang У^’ — 3, то его подпространство U может иметь ранг, равный 0, 1, 2, 3. При rang L“ — 0 L‘ состоит из одного нулевого элемента, т. е. есть точка, являющаяся началом координат О. При rang L’ = 1 Г изоморфна с У^’; тем самым L’ является множе- ством точек, образующих прямую, проходящую через О. При rang L‘ = 2 L' есть плоскость, проходящая через 0, при rang L' — — 3 L" есть все пространство. 4.11. Между изоморфными линейными пространствами суще- ствует, разумеется, не единственный изоморфизм. В частности, вве- дение системы координат в конечномерном линейном пространстве, осуществляемое выбором базиса, зависит от выбора этого базиса. Вопросом с том, как меняются координаты вектора при изменении базиса, мы займемся позже. § 5. Линейные отображения 5.1. Во всех областях математики чрезвычайно важную роль играет понятие отображения множеств. Оно тесно связано с поня- тиями соответствия и отношения. Определение. Отображением множества М в множест- во М1 называется такой закон <р, согласно которому каждому элемен- ту х С М ставится е соответствие некоторый определенный для него элемент х' £ М', который обозначается х’ = <рх и называется образом элемента х при отображении <р. Часто при записи образа ставят скобки: х' = <р (х). Иногда знак отображения <р пишут справа: х' — х<р. Для подмножества S с М через <р5 (или <р (S)) принято обо- значать совокупность всех элементов вида <р (х), где х £ S ! 5.2. Примеры. 1) Рассматриваемая в курсе математического анализа функция / (х), заданная на множестве вещественных чисел Е, есть не чю иное, как огобоажение множества Е в множество всех вещественных чисел Для вся- koi о вещественного числа а € £ его образом является b = f (а) — значение дан- ной функции при значении независимого переменного, равного а. В согласии с при- нятой нами системой обозначений мы могли бы записать и без скобок: b = fa. 2) Сопоставление каждому целому числу его квадрата есть отображение множества целых чисел У само в себя, при котором <рл = п- Согласно введенным обозначениям мы имеем. <р {2, 3, 9} = {4, 9, 81), q> {1, —1} = {1} и т. п. 3) Сопоставление каждому конечномерному линейному пространству L (т. е линейному пространству, обладающему рангом) числа, равного его рангу (rang £), есть не что иное, как отображения класса всех конечномерных линейных пространств в множество всех целых неотрицательных чисел. 150
4) Сопоставление каждой квадратней матрице /а11 аи д = I ам °»а ••• Яат \ал1 апг алп суммы его диагональных элементов ап + «22 + ... + апп есть отображение множества квадратных матриц в множество всех комплекс- ных чисел 5.3. При отображении <р множества М в множество ЛГ вполне возможно, что для некоторых х, у С М может оказаться х у, ко фх = <ру. Имеются ли такие пары элементов в М или пет, — крайне важно для характеристики отображения ф. Важно также знать, имеет ли место ф-И = ЛГ, т. е. для всякого ли элемента х £ С М' найдется такой х С М, что х’ — фх. В общем случае это не «сегда так. Определение. Отображение ф множества М в множест- во М’ называется взаимно однозначным (или инъективным), если при х=£у (х, у Е М) всегда <рх #= фу. Говорят, что <р есть отображение М на М' (или чти ф сюръ- ективно), если у-М = М', т. е. для каждого х'Е М' найдется такой х 6 М, что х' = фх. 5.4. Пример ы. 1) Функция f (х) = х3 есть взаимно однозначное отобра- жение множества на себя, поскольку для а b (a, b € R) имеем о3 #= Ь3 и для всякого с € R найдется такое г € R, что г3 = с. 2) Функция f (х) = |х|, ставящая в соответствие каждому вещественному числу его модуль, будет отображениемна множество всех вещественных неотри- цательных чисел. Но ее же можно рассматривать как отображение R в себя. Только тогда уже нельзя будет сказать о ней, чтс она осуществляет отображение R на /?, ибо для а € Rs не найдется такого г € R, чго f (?) = а, т. е. | ?| — а Рассматриваемое отображение не взаимно однозначно, ибо |а|= | —а], хотя а =£ —а при всех а € й, отличных от нуля. 3) Отображение из примера 5.2 (2), очевидно, не взаимно однозначно и не является отображением «на» 4) Оба отображения из 5-2 (3), (4) являются отображением «на», но не вза имве однозначны. 5.5. Пусть дано взаимно однозначное соответствие между эле- ментами множеств М и М'. Оно определяет отображение М в М', согласно которому <рх — х (х £ М, х' <г ЛГ)» если х и х' соответ- ствуют друг другу при данном соответствии. Очевидно, ф оказы- вается взаимно однозначным отображением М. на М . Обратно, если дано некоторое взаимно однозначное отображе- ние ф множества М на множество М', то оно определяет взаимно однозначное соответствие .между этими множествами, согласно которому х 6 М соответствует х' £ЛГ: х *-> х', если имеет место фХ — х'. 151
5.6. Пусть М и ЛГ являются какими-либо алгебраическими системами или линейными пространствами и между ними установ- лен некоторый изоморфизм. Взаимно однозначное соответствие между ними определяет указанным в 5.5 способом взаимно одно- значное отображение М на ЛГ. Это отображание называют изо- морфным. Впрочем, учитывая указанную в 5.5 взаимность, часто изоморфное отображение называют просто изоморфизмом, не де- лая в стонах различия между изоморфизмом как взаимно одно- значным соответствием и изоморфизмом как взаимно однозначным отображением. 5.7. Изоморфизм между линейными пространствами L и L" (над одним и тем же полем Р) определяет рассмотренным в 5.5 и 5.6 способом отображение L в L', согласно которому элемент из L отображается в тот элемент из который ему соответствует при изоморфизме. Это отображение обладает указанными ниже свой- ствами. 1) <р есть отображение L на все L'. 2) ф взаимно однозначно. 3) Для любых и, v (z L: ф (ц + v) = ф (и) + Ф (и). 4) Для любых и 6 L, X g Р: ф (Хи) = А (фи). 5.8. Сохранив некоторые из указанных условий и отказавшись от других, мы получаем более общее понятие. Определение. Отображение ф линейного пространства L над числовым полем Р в линейное пространство L' над тем же по- лем Р называется линейным, если выполнены условия: 1) Для любых и, v б L: Ф (и 4- и) = ф (и) + ф (о). 2) Для любых и € Р, X € Р: Ф (Xu) = X (фи). Следует иметь в виду, что линейное отображение определяется и рассматривается только в том случае, когда оба линейных прост- ранства являются линейными пространствами над одним и тем же нолем. Необходимость выполнения этого условия мы обычно даже не будем особо оговаривать, как само собой разумеющееся. Оба условия, указанные в определении, очепидне, могут быть заменены одним: Ф (Хи + pt>) = X (фи) и (фо) для любых и, v С Р; А, ц £ Р. Эго соотношение распространяется по индукции на линейные комбинации с любым числом слагаемых1 Ф (Xi«i + Х2и2 + ... + Xmum) == Aj (ф^) фХ2 (фи2) + ... + Хт(фит) (и( € Ц \ Е Р). Линейные отображения называют также линейными оператора- ми. Их изучение является важной областью современной матема- тики, имеющей многочисленные приложения в различных ее раз- делах и в областях применения математики в других науках. 152
5.9. При меры. 1) Рассмотрим отображение ф координатного векторного пространства \№ в координатное векторное пространство где п т, согласно которому <р(а„ а2, .... ая)= (qp а2, .... ат). Без труда убеждаемся, что ф является линейным. Если при этом т = п, то оно соответствует тождественному изоморфизму V'p' с самим собой Если т < п, то это не так: ф не взаимно однозначно. Некоторые различные векторы из 1^' отображаются в один и тот же вектор из V'pn): <F («1, ct2. а,п а’т^...а'п) = ф (а,, а2, ..., ат, а^ + 1.«*). 2) Отображение L в L', при котором фи = 6^, при любом и $ L, очевидно, является линейным. 3) Пусть X — некоторое фиксированное число из поля Р. Отображение ф линейного пространства L над полем Р в себя, согласно которому при любом и € L фи = Хи, как легко проверить, является линейным. Если X 0, то эго отображение явля- ется изоморфным. Соответствующий ему изоморфизм при X =/= 1 отличен ст три виального, при котором каждый элемент соответствует сам себе. 4) Пусть и0 — некоторый фиксированный элемент линейного пространст- ва L. Рассмотрим отображение ф пространства L в себя, согласно которому три = и + и0 при любом и € L. Выясним, когда ф является линейным. При и0 = &[ это, очевидно, так, посжольку и + 0^= и, и мы имеем тожде- ственное отображение L на себя. Если и0 0д, то отображение ф линейным не будет. Действительно, ф («о + "о) = («о + «с) + «о = Зи0. ф«е = u0 + u0 = 2и0 Так как u0 =# 0£, то имеет место Зи0 =# 4иэ. и потому Ф (и0 4- и0) ф фио + фи0. 5.10. Пусть <р есть линейное отображение линейного простран- ства L в линейное пространство L' (оба над одним и тем же нолем Р). Из самого определения легко вытекает выполнение свойств. 1) <р0л = От,-. Действительно, <р (Qi.) = <р (08J = 0 (<pOt) = 2) Если ult и2, ..., ит— линейно зависимые элементы L, то (pult <р«2, ..., <рит являются линейно зависимыми в L'. Действительно, из + Х2и2 + ... 4- ктип = 0;, вытекает: (ф«1) + Х2 (<ри2) + ... + Хт (<рыт) = 9д-. 5.11. Линейное отображение <р не обязано отображать L па все L'. Также <р не обязано быть взаимно однозначным Поэтому сово- купность элементов из L. отображаемых на Од-, может содержать, помимо Од, и другие элементы. Определение. Для линейного отображения tp линейного пространства L в линейное пространство L' множестве tpL (т. е. 153
совокупность всех таких и' £ L', что и — <ри при некотором и с L ) называется областью значений отображения ф. Совокупность всех таких и С L, что <ри = 0ь>, которую мы будем обозначать че- рез Кназывается ядром отображения ф. (Для области значений и ядра ф часто используют обозначе кия: im ф и ker ф.) Ранг q>L (конечный или бесконечный) называется рангом ото- бражения ф. Ранг ядра (который также может быть конечным или бесконечным) называется дефектом отображения и обозначается через def <р. 5.J2. Теорема. Пусть ф есть линейное отображение ли- нейного пространства L в линейное пространство L'. Ядро ото- бражения K<f является линейным подпространством L, а область значений ф, т. е. фА, является линейным подпространством L'. Доказательство 1) Пусть и, v Е Это означает, что <рм = фу = 0//. Тогда ф (и + V) Ь= фи + ф» — 0£- + 0L- = 0Д.’, Ф (Хи) = X (фи) = Х8/.' — 0ls т. е. и + v, ku Е К<?- 2) Пусть и', v'£ ф/., т. е. при некоторых и, v $ L имеет место: и’ — ери, v' = фу. Тогда и + у' = фи + фГ = ф (и + и) £фА, Хи' = X (фи) ф (Хи) Е фЬ. 5.13. Благодаря 5.10 7СФ— ядро отображения обязательно со- держит нулевой элемент 0£. Если оно не содержит других элемен- тов, то линейное отображение ф оказывается взаимно однознач- ным. Действительно, в этом случае, если и=Л v (u, v Е L), то и--Оь и ф (и—у)=/=0ь>. Но ф (и — v) = ф (и + (—1)о) = = фи + (—1)фо = фи — фп, и потому фи У= фУ. Тем самым при линейные пространства I, и фА ока- зываются изоморфными. 5.14. Теорема. Пусть ф есть линейное отображение ко- нечномерного линейного пространства L в линейное пространство L'. Тогда сумма дефекта отображения и ранга отображения (5.11) равна рангу L: def ф 4- cang (<pL) = rang L. Доказательство. K<t, будучи подмножеством L, имеет конечный базис zn za, ..., z> (k = def ф). Благодаря 1.9 его можно дополнить до базиса L: 21, ?2..zk, уъ у2, .. , у, (k + s = rang L). Покажем, что фуп фу2, .... (?у3 является базисом фА. Это и до- кажет требуемое соотношение, поскольку s = rang (ф£). Пусть «1 (ФУ1) + ог3(фу2) 4- ... 4- а, (фу^) = eL,. 154
Тогда ф («1У1 + <х2у2 + ... + CCjQ = 0LS т. е. а^! 4- а2у2 + ... + asys $ Кч. Этот элемент, как и всякий элемент из Кц., выражается линейно через гх, г2, ..., г*: а1У1 + а«Уг 4» ••• + ~ Р1г1 + ₽22г + ••• + РаА- Ввиду линейной независимости элементов уг, у2, ..., yi( zlt za, ..., Zk это возможно лишь при at = а2 = ... = а, — 0. Линейная независимость фуъ фу2, .... <pys доказана. Возьмем произвольный элемент фи из q>L. Так как и = YA + У 2^2 + + У Л + 61?! + 62Уг + ... + то фй = Yi (ф?!) + у2 (ф^) + ... -ь у 1г (фЛ*) 4- д1(ф?1) + + 6,(фУ2) + ... 4- б, (<pys). Но <fz± — (pz2 = ... — ф2/г = 0L-. Отсюда вытекает требуемое ли- нейное выражение для фи. 5.15. Обозначим через Ф совокупность всех линейных отобра- жений линейного пространства L над полем Р в линейное простран- ство // над тем же полем Р. В Ф можно ввести действие сложения, полагая ф 4- ф = £ (ф, Ф, ё С Ф), если ери 4- фи = для всякого и С L. Определяется и операция умножения элементов из Ф на числа из Р: — ф' (ф, ф'£ Ф; X С Р), если X (фи) = ф'и для всякого и £ L- Без груда проверяется, что сумма линейных отображений и про- изведение линейного отображения на число являются линейными отображениями. Относительно этих операций Ф само оказывается линейным пространс твом над тем же полем Р. 5.16. Пусть два линейных пространства L и L' нал полем Р конечномерны. Зафиксируем в каждом из них базис: и1( и2, .... ит для L и и,, и2, ..., и для L'. Пусть ф — некоторое линейное отображение L в L'. Каждый элемент w из L единственным образом представим линейно через базис: w = ajUj 4- а2«2 4- ••• 4- ^тит- Так как фйУ = аг (фИл) 4- а2 (фи2) 4- ••• 4- (ф«,Л 1Ь5
то ф будет вполне определено, если определены фип <ри2, фит. Эта элементы мы можем выразить линейно через и{, и2, и'п: ФК1 — ЯцМ) 4’ Я12«2 + ••• atnUn> Ф«2 = a21uj + ами2 + ... + айпи'п, " aml^i ~Ь amt^j 4” ••• 4* &ninUn. Из этого следует, что при заданных базисах в L и L' матрица коэффициентов /йц di2 #lrt\ I d2i @22 ••• I 4ф и I I \amlami ••• amnf вполне определяет линейное отображение ср С другой стороны, если нам задана произвольная (лг, ^-матри- ца с элементами, являющимися числами из Р: (Сц Oja •• . Я2| ^22 ••• ^2Л | ат1 ат2 arr.nf то для нее можно построить линейное отображение <р L в L', кото- рому эта матрица будет соответствовать указанным выше образом: /I — 4ф. Это отображение строится следующим образом Для произволь- ного элемента из L: w = у^ 4- у2ы2 + ... + утит — полагаем фю = у! + а12«2 + ••• + + + Ya («21«1 + ^22^2 + ... 4" й2пЧп) 4" + Ут (amlU\ + + ... Т amnu'n). То, что так определенное отображение <р является линейным, проверяется без труда. При этом для w = Uk имеем у* = 1, а про- чие у; = 0. Поэтому ФМг = аыи\ + а^и'2 + ... + aknUr. (k = 1, 2...... tn). Это означает, что матрица ДФ, соответствующая построенному линейному отображению, совпадает с А. Таким образом, между линейными отображениями L в U и всевозможными (/п, /г)-матрицами, элементы которых принадлежат Р, установлено взаимно однозначное соответствие. При этом соответ- ствие таково, что по матрице легко восстанавливается линейное отображение, ей соответствующее. 156
Следует, однако, помнить, что описанное соответствие устанав- ливается после того, как в L и L.' выбраны базисы. Если в этих линейных пространствах выбраны иные базисы, то с их помощью получится новое соответствие между Ф и совокупностью (т, л)- матриц над Р. О том, как связаны между собой матрицы, соот- ветствующие одному и тому же линейному отображению при раз- личных выборах базиса, будет сказано дальше. § 6. Евклидовы пространства 6.1. Важным примером линейного пространства является ли- нейное пространство геометрических векторов. Общее понятие линейного пространства исторически сформировалось как некото- рое его естественное обобщение. Операции сложения вехторсв и умножения их на числа, а также и основанные на них поня- тия линейной зависимости, базиса и т. п., играют важную роль в теории геометрических векторов, Основываясь на этих понятиях, может быть получено много важных свойств. Однако теория гео- метрических векторов не сводится к тому, что может быть построе- но только лишь на указанном основании. 3 теории геометрических векторов важную роль играют такие понятия, как длина вектора, угол между векторами, скалярное произведение векторов. Естест- венно возникает вопрос о возможности перенесения этих понятий в произвольные линейные пространства так, чтобы получившаяся тео- рия обобщала теорию геометрических векторов, включающую и результаты, связанные с этими понятиями Это существенно обо- гатило бы теорию общих лилейных пространств. Ниже мы пока- жем, что это действительно может быть сделано. Правда, мы будем рассматривать линейные пространства только над полем Р всех вещественных чисел, другими словами — вещественные линейные пространства. Аналогичную, но более общую теорию для линейных пространств над полем комплексных чисел мы затрагивать не бу- дем. Отметим также, что в связи с поставленной задачей нас будут интересовать в основном лишь конечномерные линейные простран- ства. Изучением соответствующих вопросов специально для беско- нечномерных пространств занимается особая математическая дис- циплина — функциональный анализ. 6.2. Наиболее естественно к понятиям длины и угла в веще- ственных линейных пространствах подойти при помощи следующе- го понятия. Определение. Говорят, что в вещественном линейном пространстве L введено скалярное умножение, если для всякой пары элементов и, v из L однозначно определено вещественное число, на- зываемое скалярным произведением этих элементов и обозначаемое обычно через (и, и), так, что выполняются следующие, свойства' 1) (и, V) = (и, и) для всяких и, и б £; 2) (и -+ v, w) = (и, ы) + (v, w) для всяких и, v, w С Г; 157
3) (Хц, v) = X (u, v) для всяких u,v £ A, X £ R; 4) для всякого ненулевого элемента и из L его скалярный квадрат положителен: (и, и) >0. Вещественное линейное пространство, рассматриваемое вместе с введенным в нем скалярным умножением, называется евклидовым линейным пространством или. как чаще говорят, просто евклидо- вым пространством. Такое название естественно, поскольку приведенное понятие, является естественным обобщением по отношению к соответствую- щему понятию из области евклидовой геометрии. Совокупность геометрических векторов пространства евклидовой геометрии обра- зует, как мы уже огмечали, линейное пространство. При этом в нем для векторов определено скалярное умножение по следующему правилу. Скалярным произведением двух векторов считается чис- ло, равное произведению длин этих векторов, умноженному на ко- синус угла между этими векторами. Известно, что при этом выпол- няются свойства 1) — 4). Говоря об евклидовом пространстве геометрических векторов, обычно имею! в виду именно это скаляр- ное умножение. В связи со сказанным выше отметим, что элементы и общих евклидовых пространств часто называют векторами. Обратим внимание на то. что из самого определения не видно, всякое ли конечномерное вещественное линейное пространство может быть превращено в евклидово, сколько скалярных умноже- ний и насколько отличающихся друг от друга может быть в нем введено. Эти вопросы мы выясним в дальнейшем. Всякое линейное подпространство евклидова пространства можно рассматривать как евклидово пространство, в котором ска- лярное умножение определено согласно исходному скалярному умножению во всем пространстве. 6.3. В связи со свойством 4) определения 6.2 отметим, что ска- лярное произведение нулевого элемента 0 евклидова пространства на произвольный элемент х этого пространства равно нулю: (0, х) = (00, х) = 0 • (0, х) = 0. В частности, (0, 0) — О Нулевой элемент оказывается единственным элементом евкли- дова пространства, скалярный квадрат которого равен нулю. 6.4. Исходя из определения 6.2 и используя рассуждения по индукции, легко получить правило нахождения скалярного про- изведения двух линейных комбинаций элементов евклидова про- странства («!«! + а$иг 4- ... + апип, 4- + ... т = = a,Pi + oj,ps (U!,us) + ... + а,.Рт а Здесь о, — элементы евклидова пространства; а., ₽, £ R (< = I, 2...п: j =1,2, ..., т). 158
6.5. Координатное вещественное векторное пространство VW может быть превращено в евклидово пространство следующим естественным образом. Скалярным произведением вещественных п-векторов и = (а1( аг, .. , ап), о = (&п Ь2, .... Ьп) будем считать вещественное число, равное сумме произведений соответствующих компонент: (Я, о) = -у- а2Ь2 + + й.пЬп. Легко проверяется выполнение свойств 1)—4) определения 6.2. С помощью введенного скалярного умножения превраща- ется в так называемое п-мерное координатное евклидово простран- ство. Мы уже,?отмечали, что Ий можно рассматривать как множе- ство геометрических векторов пространства евклидовой геометрии, в котором фиксирована некоторая прямоугольная декартова си- стема координат. Пусть геометрические векторы и «2 заданы в координатной форме при помощи троек вещественных чисел (оь blt сг) и (п2, Ь2, сг). Известно, что скалярное произведение данных векторов, определенное в 6.2, может быть выражено через их ко- ординаты следующим образом: («1( и2) = + ЬгЬ2 + сгс2. Благодаря этому пространство вместе с введенным выше скалярным умножением можно рассматривать как евклидово про- странство геометрических векторов. Тем самым скалярное умножение в произвольном , вве- денное по указанному выше правилу, можно считать естественным обобщением скалярного умножения геометрических векторов. 6,6. Покажем, что пооизвольное конечномерное вещественное линейное пространство L может быть превращено в евклидово про- странство. Это может быть сделано, например, следующим спо- собом. Пусть и1( иг, ..., ип — базис L (п = rang L), Для произвольных элементов из L: и = артх + а2и2 + ... + a„wn, v = 0^ + 02u2 + ... + 0„un (а„ 0, e R) скалярное произведение можно определить, полагая (и, и) = а,0! + 0^0., + ... + а„0„. Легко убедиться в справедливости свойств 1) — 4) определения 6.2 для введенного таким образом скалярного умножения. 159
Таким способом может быть, в частности, построено и то скалярное умножение в 0$, которое определено в 6.5. Для этого в 0^ следует взять главный базис (!, 2.14): 6?Х = (1, 0. ..., 0), е2 = (0, 1, ..., 0), ..., еп = (0, 0, ..., 1) Как мы увидим в дальнейшем, всякое скалярное умножение 5 конечномерном вещественном линейном пространстве L может быть задано указанным выше способом при некотором специально подобранном базисе. 6.7. Указанный в 6.6 способ позволяет в одном и том же веще- ственном линейном пространстве с помощью различных его бази- сов вводить различные скалярные умножения. Покажем, что их даже бесконечно много. Исходя из произвольного базиса вещественного линейного про- странства Иц «2, ..., ип, можно получать базисы вида: ки\, и2, ..., и:, где X £ R, X 7^ 0. При этом для различных X такие базисы, очевид- но, различны. Введем для нового базиса скалярное умножение согласно 6.6. Так как щ — — (XirJ + 0tz2 + ... 4- 0ил, то ска- А лярный квадрат (un «J равен —. Для различных положительных X X2 эти значения различны, а значит, различны и сами скалярные умно- жения, превращающие наше вещественное линейное пространство в различные евклидовы пространства, В дальнейшем, однако, мы увидим, что евклидовы пространства, построенные на базе конечномерных вещественных линейных пространств одинаковой размерности, отличаются друг от друга несущественно, и в определенном смысле их можно будет считать одинаковыми. 6.8. В евклидовых пространствах при помощи скалярного ум- ножения вводятся понятия, обобщающие известные геометрические понятия длины вектора и угла между векторами. Для всякого элемента и евклидова пространства его длиной (или нормой) называется неотрицательное вещественное число, которое будем обозначать через ||и||, равное арифметическому зна- чению корня из скалярного квадрата (и, и): Hull ь. УЦГи). Согласно 6.3 только нулевой элемент имеет нулевую длину. Заметим, что длина вектора в геометрии точно таким же обра- зом выражается через скалярное произведение. 6.9. Докажем следующее важное соотношение для произволь- но
них элементов евклидова пространства, называемое неравенством Коши — Буняковского\ l(u,0KIIMI- М- Оно может быть представлено и в другой, равнозначной форме: (u, y)s (и, и) • (v, V), Если v — нулевой элемент, то требуемое соотношение имеет место, поскольку обе части неравенства равны нулю. В дальнейшем считаем, что элемент и ненулевой. При любых вещественных числах X и ц имеем: (ku + ру, Хп 4- 0. Учитывая 6.4, приходим к соотношению: X2 (и, и} + 2Хр, (и, v) + р,2 (у, у) > 0. Полагая здесь X = (v, у), р. = —(ы, у), получаем: (у, у) • ((«, и) (у, у) — («, у)2) 0. Так как (у, у) > 0, то мы получаем требуемое соотношение: (u, и) • (у, у) — (и, у)2 > 0. 6.10. Для ненулевых элементов и и и евклидова простран- ства углом между ними называется такое неотрицательное веще- ственное число <р, что Так как неравенство Коши — Буняковского приводит к соотно- шению _ 1 < (и' < 1 ii-tiii-iivii ’ то для всяких ненулевых элементов евклидова пространства угол между ними всегда определен, и притом единственным образом. Это понятие угла соответствует тому понятию угла между векто- рами, которое употребляется в геометрии. Использование понятий длины и угла в общей теории евклидо- вых пространстз приводит к обобщению многих известных из гео- метрии результатов. 6.11. Примеры. 1) Покажем, что для произвольных ненулевых эле- ментов и, v евклидова пространства обращение угла между ними в нуль или л означает, как и в геометрии, линейную зависимость и и р. То, чго угол равен одному из значений 0 или л, очевидно, выражается равенстьом: |(и, о)| = || и || • || о II, или, что то же самое: (и, v)a = (и, «) • (о, v). Если и и v линейно зависимы, например и — av, то мы получаем это соотно- шение: (и, t>)a — (av, о)а = аа (о, р)а = (av, av) • (v, и) = (и, и) • (v, v). 6 Заказ 653 161
Если же и и v линейно независимы, го о =/= 0, и, следуя рассуждениям, про- веденным в доказательстве неравенства Коши — Буняковского (6.9), мы видим, что Ла -j- цо 0 при л = (v, v) > 0, но тогда (ku + uv, Хи -Ь ро) > 0, и строгие неравенства получаются во всех последующих соотношениях и, в частности, (и, и) (v, о) — (и, о)2 > 0. 2) Используя неравенство Коши — Буняковского, для произвольных эле- ментов евклидова пространства можно получить важное соотношение, называ- емое неравенством треугольника: ||«+о|| < II и || + || о||. Действительно, (и 4 V, и + о) = (и, и) + 2 (и, о) + (о, о) (и, и) + + 2 у (и~д /(7^1 + (в, v) = II « II2 + 2 || и || - Н + || v I!2 = (|| и || + II v II)2 Применяя неравенство треугольника к геометрическим векторам, мы при- ходим к известному в геометрии соотношению: длина всякой стороны треуголь- ника не превосходит суммы длин двух других его сторон. Если применить неравенство треугольника к элементам п-мерного координат иого евклидова пространства (6.5), то мы падучим известное раньше (Ч. IV, 9.20) соотношение для вещественных чисел: ’У(«1 + />()2 + (<?2 + Ьг)2 4- ... + (ап + bn)2 С |Л а( 4* «2 + + а% + + + Z>2 + ••• 4~ 6.12. Аналогом условия перпендикулярности служит, очевид- но, следующее о&щее понятие. Определение. Элементы и и и евклидова пространства называются взаимно ортогональными, если их скалярное произве- дение равно нулю: (и, v) = 0. Отметим, что для взаимно ортогональных элементов и и v при всяких вещественных числах а и Р элементы аи и Р’л тоже взаимно ортогональны: (аи, ₽р) = ccj3 (и, и) — 0. 6.13. П р и м е р ы. 1) Бо всяком евклидовом пространстве нулевой эле- мент ортогонален к любому элементу и никакой другой элемент таким свойством ие обладает. 2) В 4-мернсм координатном евклидовом пространстве (6.5) векторы иг (2, -3, 1, 0), иа = (1, 0, —2, 1), и3 = (1, 1, 1, 1) попарно ортогональны. Действительно, («1, «5) = 2 - 1 + (-3) 0 + 1 • (-2) + 0 • 1 = 0 и аналогично (иь Из) = 0, (и2, и3) = 0. 3) Если элементы и и v евклидова пространства взаимно ортогональны, то (и + V, и+ о) = (и, и) + 2 (и, о) + (о, о) — (и, и) + (о, и), т. е. II и 4- t>il2= II и ||2 + Holl2. Последнее соотношение, примененное к геометрическим векторам, приводит к известной теореме Пифагора, квадрат длины гипотенузы прямоугольного тре- угольника равен сумме квадратов длин его кгтегов. 162
4) Определителем Грама системы элементов ип евклидова про- странства называется определитель: («1. Ч) («1, Ua) — («1» «я) р _ (и», uj (и«, «,) ... (и2, Ид) («я. и») (и„, и2) ... (и„, ип} Пусть ut, иг, .... ия линейно независимы. Покажем, что тогда D 0. Для этого достаточно показать, что п-векторы = (0*1. U1), («1, uj..... («1, ил)). = (t«2, иО, (н2, и2).....(ujt u„)), ®я = ((«я> »1). («л- «а). (“я. “я» линейно независимы. Соотношение «1^1 + а2тх + ... + = 0Д (а, € R} означает выполнение равенств: (а^г + я2йт + ... + чпип, ’ «0 = 0, (<*!«! + а2и2 +-... + <хлия, uj = 0, (<Mi -н a,u, + ... + a„un, un) = 0. Умножая эти равенства соответственно на a1( a2.an и почленно складывая, получаем: («!«! + a2u2 + ... -+- апип, + asu2 + ... + алил) = 0, и, значит, + а2и2 + ... + авмл есть нулевой элемент евклидова простран- ства Так как ut, иг, .... ип линейно независимы, то at = а2 = ... = а„ — 0. Нетрудно видеть, что для линейно зависимых элементов ut, u2. ип их определитель Грама равен нулю. 6Л4. В евклидовых пространствах особую роль играют такие системы элементов и1( иг, .., ит, которые состоят из попарно орто- гональных элементов, т е. (иг, «у) = 0 при i Ф j Такие системы на- зываются ортогональными. При этом считается, что отдельный элемент тоже образует ортогональную систему. В дальнейшем пас будут интересовать ортогональные системы, не содержащие нулевого элемента (понятно, что добавление нуле- вого элемента или удаление его не меняет ортогональности си- стемы). Теорема. Если ненулевые элементы ult u.t, .. .. ит евклидова пространства попарно ортогональны^ то они линейно независимы между собой. Доказательство Пусть при некоторых вещественных числах at, a2, .... ат имеет место: «А + а3и2 + ... + атит = О. Умножая скалярко обе части равенства на ut, получаем: «1 («1- «() + яг (и„ + ... + а^, ut) + ... + ut) = = (0, щ) = 0. 6* 164
Учитывая, что (Uk. ut) = 0 при k ф i, имеем: а, («/. «<) = 0. Так как uf У- 0, то (ы0 и) > 0 и, значит, а1 = 0 (I — 1, 2, т). 6.15, При изучении евклидовых пространств представляет ин- терес вопрос о возможности построения различных ортогональных систем. Теорема. Если ненулевые элементы евклидова пространства щ, и2, ..., и5 образуют ортогональную систему и элемент v не вы- ражается линейно через них, то при вещественных числах х _0д_!О). у = 1 2, ... , s) 1 (щ, «а система, состоящая из s 4- 1 элементов щ, и2, .... «.< и w =* V + Х1«1 — А2иг 4* ... + будет ортогональной. При этом элемент w ненулевой. Доказательство. Учитывая попарную ортогональность ut, и2, ..., и,, получаем: (к.', Uj) = (у + hUl 4* ^2«2 + ... + \и„ и,) = (У, Ui) + + (Щ, «() + ... + ^1 (щ, U.) 4- ... 4- \ (us, щ) = (у, М<) + 4- Л, (у,., щ) = (и, щ) + • (uh Ui) = О (i = 1, 2, .... s)- L 1“«» Так как v не выражается линейно через щ, и2, .... us и в выра- жении w через у, щ, и2, .... и, коэффициент при v отличен от нуля, то w — ненулевой элемент. б. 16. Следствие. Пусть в системе линейно независимых между собой элементов ееклидова пространства ult и2, ит эле- менты щ, и2, .... us (s т) образуют ортогональную систему. Тогда существует ортогональная система, состоящая из ненулевых элементов уп у2, .... vm, в которой и, = и. при i — 1, 2, ..., s и каждый элемент Vk линейно выражается через щ, ut, ..., щ \k — = 1,2,.., т). Доказательство. Рассуждаем по индукции относитель- но т (при фиксированном s). Случай т — s очевиден. Пусть т > s. Предположим, что для щ, и2, ..., ит^.х существу- ет указанная в формулировке следствия ортогональная система ненулевых элементов у1( у2, .... ym_j. Она линейно независима. Элемент ит не выражается линейно через vltv2,..., (иначе ит выражался бы линейно через «j, и2, .... мт-1). Применяя теорему 6.15,j находим ненулевой элемент Vm = U-n + ^1У1 + + ..• + ?-от-1Ут_1( взаимно ортогональный со всеми элементами vir уа, .... ит_2. 164
6.17. Рассуждения, проведенные в 6.16 и 6.16, приводят к одному общему способу построения ортогональной системы нену- левых элементов исходя из произвольной линейно независимой системы элементов евклидова пространства. Этот способ называется процессом ортогоналплации и состоит в следующем. 3 произвольной линейно независимой системе и:, п2, .... ит берется ортогональная подсистема, состоящая из ult и2, ,. , и, (s т). В частности, всегда можно взять один элемент их (случай s = 1). Процесс ортогонализации состоит в построении указанным в 6.1G способом ортогональной системы ненулевых элементов v,, «2, ..., vm, в которой vt = ut при i = 1, 2, ..., s, а каждый элемент vt (i > s) выражается через и, и в виде °l = Ut + + X2VS + ... + где (/ = 1,2, .... f-1). (О/. Vj) Благодаря 6.15 коэффициенты Ху обеспечивают ортогональность vt со всеми элементами vlt и2, ..., t»^. 6.18. Примеры. 1) Применим процесс орюгснализации к векторам: «1=П, 0, 1, 0, 1), «2 = (1,-1, 1, —1, 1), и3= (2, 1, 0, 2, 1), и4 = (0, 0, 1,0,0). Эти векторы, как легко видеть, линейно независимы между собой, но не образуют ортогональной системы (уже и «2 не окалываются взаимно ортогональными). Полагаем: от s= иг. Вектор ф2 ищем в виде о2 = а2 + Хог, где X находим из условия ортогональ- ности оа и тр (u2, t>j) 4* X (о^, — 0, 3 4" X 3 = 0, X = —1. Получаем: о2 = иа — г>1 = (0, —1, 0, —1, 0). Далее ищем оа в виде о3 = аа 4- ЩО! + р2оа,'где щ и д2 находятся из условия ортогональности О3 с ot и с ог: («з-«1) + Pi (®и ®т) = 0. 3+р! -3=0, щ=—1, 3 («3- ®з) + Р-2 (о2, ®г) = 0. —3 4- На • 2 = 0, и2 = —. Получаем: 3/1 1 \ о3 = и3 4-(-1) ®i 4-—о2 = 11,-у, —*’7’ °]- Аналогично ищем о4 = м4 4- *iOt 4- v2o2 4- v3o„ где (Ut, Oi) 4- Vi (olt ot) = 0, 1 4- vt • 3 = 0. Vj = — -i-, О («4, ®2) 4- vs (o2, o2) = Q, 0 4- v2 • 2 = 0, v2 = 0, 5 2 («4. fs) 4- v3 (o8, os) = 0, — 14-v,.— = 0, Vj=- А Э IG5
Получаем: /К 2 fl 14 1 1\ ®4 = ®4 + \ 3 / 1 + 5 ~\15' ~ 5 ’ 15’ 5 ’ ~ 3 )' Получили ортогональную систему т>2, ®3, причем = Ui- § 7. Ортогональные базисы 7.1. При изучении евклидовых пространств особый интерес представляют базисы, являющиеся ортогональными системами. Такие базисы называются ортогональными. Теорема об ортогональных базисах. Вся- кое конечномерное евклидово пространство L обладает ортогональ- ными базисами. При этом всякая ортогональная система ненулевых элементов из L может быть включена в некоторый ортогональный базис L. Всякая ортогональная система ненулевых элементов из В в количестве, равном рангу L, образует базис L. Доказательство. Прежде всего следует иметь в виду, что всякая ортогональная система ненулевых элементов линейно независима (6.14), и поэтому количество элементов в каждой такой системе не превосходит ранга L (1 9). Если же количество элементов в такой системе равно рангу L, то согласно 1.9 она является бази- сом L. Это доказывает последнее утверждение теоремы Возьмем 1. L произвольную ортогональную систему, состоя- щую из ненулевых элементов и1( и2, ..., us. Такие системы суще- ствуют, например состоящие из одного любого ненулевого эле- мента. Благодаря линейной независимости этой системы мы можем включить ее согласно 1.9 в некоторый базис L: и,, и2, .... us, и,+1, ... ..., иЛ (и = rang L). Благодаря 6.16 элементы иг, и2, .... us могут быть включены также в ортогональную систему ненулевых эле- ментов, в количестве, равном п: и,, и8, ..., us, pr+l, .... и„. Как мы показали выше, такая система является ортогональным базисом L. Этим рассуждением мы доказали справедливость двух первых утверждений теоремы. 7.2. При построении и использовании ортогональных базисов особенно удобно бывает брать элементы, длина которых равна единице. Элемент и евклидова пространства называется нормированным, если его скалярный квадрат равен единице: (и, и) = 1. Другими словами, это означает, что элемент и имеет длину, равную единице (6.8) 7.3. Для всякого ненулевого элемента и евклидова простран- ства элементы Ли при А — ± . - (знак радикала обозначает V (и, и) >bt
арифметический корень) являются нормированными. Действи- тельно, (7и, 7и) — 7? (и, и) = —?— • (и, и) = I (и, и) Других же нормированных элементов среди элементов вида ли, где а 6 7? (т. е. в линейной оболочке элемента и), не существу- ет. Действительно, если (otu, аи) = 1, то а2 (и, и) = 1 и, значит, а является одним из указанных выше чисел. Переход от элемента и к элементу - и обычно называют нормированием элемента и. 7 А. Среди ортогональных базисов евклидова пространства удобно брать такие, все элементы которых нормированы. Такие базисы называются ортонормированными. Другими словами, базис мь и2, .... и„ евклидова пространства будет ортог.ормированным, если скалярное произведение базисных элементов находится по правилу: 7.5 В евклидовом пространстве геометрических векторов орто- нормированиые базисы состоят из всяких трех взаимно перпенди- кулярных векторов, имеющих единичную длину. С их помощью, как известно, вводится прямоугольная декартова система коорди- нат. 7.6. Учитывая, что нормирование ненулевых элементов не влияет благодаря 6.12 на их взаимную ортогональность, мы на основании теоремы 7.1 приходим к следующему важному выводу. Следствие. Всякое конечномерное евклидово простран- ство L обладает ортонормированными базисами. При этом, всякая ортонормированием система элементов из L может быть включена в некоторый ортонор мированный базис L. Всякая ортонормированная система элементов из L, в количе- стве, равном рангу L, образует базис L. 7.7. В n-мерном координатном евклидовом пространстве (6.5) главный базис, состоящий из и-аекторов ех = (1, 0, .... 0), ег = (0, 1, .... 0), ..., еп = (0, 0, ..., 1), является ортонормирсванным. Действительно, согласно введен- ному в 6.5 скалярному умножению скалярное произведение базис- ных элементов (eit е^) находится в соответствии с 7.4. 7.8. Ортонормироваиные базисы очень удобны для задания произвольного элемента евклидова пространства в координатной форме относительно данного базиса (4.1). Пусть «!, и2, ..., ип — ортонормириванный базис евклидова пространства. Тогда координаты в этом базисе произвольного HJ7
элемента i£> нашего пространства равны скалярному произведению элемента w на соответствующие базисные элементы. Действительно, если w = а1и1 4- а2и, + ... 4* апип, то (w, и,) = (ад + а2и2 + ... + апип, щ) = = а2 (иь + ... + a, (щ, щ) + ... + а.. (u„, u() = = at • 0 + ••• -Н а,- • 1 + ••• + • 0 = (i = 1, 2, ..., п). 7.9 Пример. В четырехмерном координатном евклидовом простран- стве (6.5) векторы «t = (1, 0, —1, 0), «, = (1, 1, 1, 1), и3 = (-1, 1, —1, 1), «4 = (0, 1, 0, —1) попарно ортогональны и, слсдовательнс, образуют ортогональный базис всего пространства. Нормируя ьсе векторы (7.3) мы получаем оргопормированный базис: /1<2 У2 \ /1 1 1 1\ /11 1 Ц 1 \ 2 2 / 2 \ 2 2 2 2 / 3 \ 2 2 2 2/ I /2 ]/2 \ v. = (О, — , 0, — — . 4 V ’ 2 2 ) Найдем разложение вектора ъ> = (—2, 1, 0, 1) по этому базису. Для этого сначала найдем согласно 7.8 координаты а/ в этом базисе: (w, 9t) = (-2) -^4-1 • 0 4-0 - + 1 • 0 = -/2. (W, 92) = (_2).|4-1-“+0.-’-+1.^ = 0, (w Vs) = (_2). (_-!)+1.1 + 0 (-j)+ii = 2- /2 / /2 \ (а>, ®4) = (—2) • 04-1 • . о -Ь 1 .(--^1 = 0. Окончательно получаем: w — (—}<2) ®j 4- 2яя. 7.10. Наиболее характерное свойство ортонермированных ба- зисов связано с удобным способом выражения скалярного произ- ведения элементов через свои координаты в данном базисе. Теорема. Пусть элементы uJt u2, .... ип евклидова про- странства L образуют базис. Если этот базис является ортонормированным, то скалярное умножение в L осуществляется по следующему правилу. Для про- извольных элементов из L и = 4- а2«2 4- ... 4- ая «л , v = 4- + ••• + Ря «« их скалярное произведение равно сумме произведений соответствую- щих координат: (и, V) = a.pj 4- а2р2 4- ... 4- *68
Обратно, если скалярное умножение в L осуществляется по ука- занному правилу, то базис щ, и2, ип является ортонормирован- ным. Доказательство. J) Пусть щ, и2,..., ип образуют орто- нормированный базис. Для нахождения скалярного произведения (и, о) используем правило скалярного перемножения двух линей- ных комбинаций (6.4). При этом учитываем правило нахождения скалярных произведений базисных элементов из ортонормирован- ного базиса (7.4). (и, v) =(a1u1 + a2u2+ ... + апип, psu2-f- ... +P„w.) = = ajp! (йь щ) 4- агр2(и2, и2) (-..• + се^п(ип, и п) = = а1р1 + аврг + ... + апрп. 2) Пусть теперь имеет место указанное в формулировке теоремы правило нахождения скалярного произведения для произвольных элементов данного евклидова пространства. Применяя это пра- вило к базисным элементам = 0«! + ... 4- 1щ 4- ... 4- 0нл, и}= 0^4- .. -|- 1«, 4- ... 4-0ил, мы приходим к требуемому (7.4) соотношению- (щ, и.) =Я’ если /’ ' (1, если i = у. 7.11. На основе доказанной теоремы выясняется особая роль скалярного умножения, вводимого в вещественном линейном про- странстве с помощью произвольного базиса согласно способу, ука- занному в 6.6 (скалярное произведение двух элементов равно сум- ме произведений соответствующих координат). Поскольку во вся- ком конечномерном евклидовом пространстве можно выбрать орто- нормированный базис (7.6), мы приходим на основании теоремы 7J0 к следующему выводу. Следствие. Скалярное умножение в любом конечномерном евклидовом пространстве может быть при помощи надлежащего выбора базиса определено способом, указанным в 6.6. 7.12. Идея изоморфизма, неоднократно рассматриваемая нами раньше, может быть распространена и на евклидовы пространства. При этом следует иметь в виду, что, с одной стороны, всякое евкли- дово пространство является обычным линейным пространством, а с другой стороны, необходимо учитывать заданное в нем скаляр- ное умножение. Определение. Евклидовы пространства L и L' называ- ются изоморфными, если существует такое взаимно однозначное соответствие между множеством элементов L и множеством эле- ментов L', которое является изоморфизмом линейных пространств L и L' (« смысле 4.5) и при котором для соответствующих эле- ментов х — л', у -► у' (г, у £ L; х', у' £ L') 169
скалярные произведения равны: (х, у) = (х', у'). Указанное взаимно однозначное соответствие называется изо- морфизмом евклидовых пространств L и L'. Изоморфные евклидовы пространства с точки зрения двух ос- новных операций (сложение и умножение на вещественные числа) и операции скалярного умножения ничем не отличаются друг от друга. Различия между ними могут заключаться лишь во внутрен- ней природе и обозначении их элементов, Кгк обычно, такие раз- личия несущественны с точки зрения общей теории евклидовых пространств. Поэтому изоморфные между собой евклидовы про- странства можно не различать. Изоморфизм евклидовых пространств обладает, очевидно, свой- ствами, указанными в 4.6 для общих линейных пространств. 7.13. Введение системы координат з конечномерном евклидо- вом пространстве при помощи ортонормированного базиса пред- ставляет собой важный случай изомоофизма. Теорема. Всякое, конечномерное евклидово пространство L ранга п изоморфно п-мерному координатному евклидову простран- ству (6.5.). Доказательство. Выберем в L какой-нибудь ортонор- мирозанный базис (7.6): ult иг, .... ип. Способом, описанным в 4.1, установим взаимно однозначное со- ответствие между L и v = aj«! + а2«2 4- ... + ап и„ , и — о = (а1( а2, .... ап) С В 4.3 было показано, что это соответствие есть изоморфизм в смысле 4.5 линейных пространств L и Vr*- Покажем, что это соответствие сохраняет также и скалярное произведение. Это и завершит доказательство. Пусть v = ajKj + а2и2 + ... 4- ия ** == (а,, а2...ап), № = P.U! 4- ₽2«2 + ••• 4- Ряая-> w = (Pt, р2, .... р„). Согласно 7.10 имеем: (v, w) = atPt 4- а,р2 4- ... 4- апа„, Но согласно 6.5 имеем также: (о, w) = а1Р14- «2Р? + ... + а, Ря • И, значит, (v, w) = (о, W). 7 14. Следствие. Все евклидовы пространства, имеющие один и тот же ранг, изоморфны между собой. (70
7 .15. Не делая различий между изоморфными евклидовыми пространствами, мы на основании теоремы 7.13 приходим к тому, что координатными евклидовыми пространствами различных раз- мерностей исчерпываются все конечномерные евклидовы простран- ства. Ранг (размерность ) евклидова пространства вполне его опре- деляет (с точностью до изоморфизма), § 8. Ортогональные разложения 8.1. Понятие ортогональности можно распространить на под- множества евклидова пространства. Определение. Подмножества М и М' евклидова про- странства называются взаимно ортогональными, если всякие два элемента, один из которых лежит в М, а другой — в М', взаимно ортогональны (6.12). Для обозначения ортогональности подмножеств используют запись: М ' М'. Сразу же отметим, что пересечение взаимно ортогональных подмножеств не может содержать ненулевых элементов, поскольку из принадлежности элемента и к обоим таким подмножествам должно следовать (и, и) = 0 и согласно 6.2 и — нулезой элемент. 8.2, Для взаимно ортогональных подмножеств М ± М', евкли- дова пространства всякие два элемента и = 1л + hx2 + ... + lnxn , V = пл+ ЧЛ + ••• + W™. где С М, yf С М'-, Ег , т),С R (i = 1, 2, .... п; j = 1, 2, ..., in), будут взаимно ортогональными. Действительно, используя правило нахождения скалярного произведения двух линейных комбинаций (6.4), получаем: («. 0 =2 5; П;(*| . У/) -= °- Поэтому взаимно ортогональными оказываются линейные обо- лочки подмножеств М и М’ (3.5). Случай, когда одно из этих мно- жеств состоит из одного элемента, а другое — из двух, можно рас- сматривать как обобщение известной в геометрии теоремы: если прямая перпендикулярна двум пересекающимся прямым, то она перпендикулярна и плоскости, проходящей через эти прямые. 8.3. В ближайшее время нас будет интересовать вопрос о раз- ложении евклидова пространства в сумму своих взаимно орто- гональных подпространств, Так как пересечение взаимно ортого- нальных подпространств евклидова пространства состоит из од- ного нулевого элемента (8.1), то мы приходим к справедливости следующего утверждения. В евклидовом пространстве сумма любых его взаимно ортого- нальных подпространств -) Lt является прямой. «I
8.4. При изучении зон роса о возможности разложения евкли- дова пространства в сумму своих взаимно ортогональных подпро- странств важную роль играет следующее общее понятие Определение, Для произвольного подмножества М евкли- дова пространства L совокупность всех элементов из L, взаимно ортогональных со всяким элементом из М, называется ортогональ- ным дополнением М. Оно обозначается через Л41. Ортогональное дополнение М L не пусто, поскольку 0t£ Л11- Из самого определения вытекает, что М J_A4X. Также, очевид- но, получаем: /И с: (Ж1)1. На основании 6.3 имеем: L~ — Ql, Of = L. 8.5. Лемма. Для любого подмножества М евклидова прост- ранства L его ортогональное дополнение Af является подпростран- ством L. Доказательство. Для любых и, v С М1 линейная ком- бинация Хи 4- ри при всяких вещественных числах X и р снова принадлеткит Alг, так как она ортогональна с любым элементом х С М: (У.и + pv, х) = X (и, х) 4~ р (п, х) = X • 0 + р • 0 =0. 8.6. Теорема. Всякое конечномерное евклидово пространство I, разлагается в прямую сумму любого своего подпространства L' и его ортогонального дополнения: L — L' + Доказательство. Сумма L' 4- (L')x согласно 3.3 явля- ется прямой. Очевидно, можем считать, что L' — ненулевое под- пространство. Выберем в L' ортогональный базис (7.1): u!,u2, ...,ufe (k = rang Д). Покажем, что всякий элемент v £ L содержится в сумме L. 4- + (Д)х. Если v не выражается линейно через ult и2, .... uk (т, е. не принадлежит L'), то согласно 6.15 найдется элемент w = v + X1u1 + Х2и2 + ... + ортогональный с каждым из элементов ulf u2, .... uk. Благодаря 8.2 элемент w оказывается ортогональным и к L', т. е. w £ (L')l- Значит, v = ((—^1)иг + (—Х2)и2 4- ••• + (—Хл)иь) + £ L' 4- (Е')1. 8.7. Учитывая 3.14, из теоремы 8.6 получаем соотношение для рангов произвольного линейного подпространства L' и его орто- гонального дополнения в конечномерном евклидовом простран- стве L: rang L' + rang (X')1 = rang L. 8.8. Всякое представление евклидова пространства в виде 1.72
суммы двух своих взаимно ортогональных подпространств имеет вид, указанный в 8.6. Теорема. Если евклидово пространство L представлено в виде суммы двух своих взаимно ортогональных подпространств. L — Lx + L2, то L2 — L{. Доказательство. Благодаря взаимной ортогонально- сти Lx и L2 имеем: L2 cz Lx . Пусть теперь и € Li. Как всякий элемент из L, и может быть представлен в виде суммы: U — И] + и2 («1 € ^1. € ^г)- Для элемента ых —- и — и2 благодаря взаимной ортогональности элементов их и и, а также их и и2 имеем: («1, Ux) = (Uj, и — u2) = (ult и) — w2) = 0. Поэтому ux — Ql, и, значит, и = и2 С L2. Мы получили: £/ о: L2. Учитывая справедливость обратного включения, получаем требу- емое равенство: L2 = Lf. 8.9. Из теорем 8.6 и 8 8 получаем, что всякое подпростран- ство L' конечномерного евклидова пространства само является ортогональным дополнением к своему ортогональному дополнению: 8.10. Свойства ортогональных дополнений удобно использо- вать при задании подпространств n-мерных координатных вектор- ных пространств з виде пространств решений однородных систем линейных уравнений. В наших рассуждениях мы будем ограничиваться полем всех вещественных чисел R.. Говоря об п -мерном координатном вещественном векторном пространстве Уд’, мы считаем его евклидовым в смысле 6.5. Пусть L’ — подпространство координатного пространства Г£’: L' является линейной оболочкой некоторой системы своих п-векторов: И1 = («и, 012, •••, о1к), «2 = (а21, а22, .. , а2Л), ~ (ofX, as2, ..., aStt). В качестве этих векторов можно взять какой-нибудь базис L' (и тогда s л). Очевидно, ортогональное дополнение (£')х со- стоит из всех вещественных решений системы уравнений: on*i + <*12*2 + ••• + о1Лхи = О, o2|%i + а22х2 + ... + агпхп — О, Oji*i + as2x2 + ... + ainxn = 0. 173
Аналогичным образом можно и само подпространство L', являю- щееся согласно 8.9 ортогональным дополнением (Z/)x, представить в виде пространства естественных решений некоторой однородной системы линейных уравнений. На этом этапе рассуждений удобно брать базис (L')\ т. е. фундаментальную систему решений построен- ной выше однородной системы линейных уравнений. 3.11. Пример. Обозначим через М подмножество координатного про- странства Ид’, состоящее из векторов вида (а, а. а-f р.р.Р) (а,0 € 7?) Очевидно, М является подпространством Нетрудно также убедиться в том, что векторы »!= (1, 1, 1,0,0), и3 = (0, 0, 1, 1, 1) образуют базис М. Ортогональное дополнение М1 подпространства М может быть задано в виде пространства вещественных решений системы уравнений: xi 4 хг + х3 = 0, *з 4 xi 4 х5 = 0. Находим фундаментальную систему решений этой однородной системы линей- ных уравнений способом, указанным в 1,5.6, придавая переменным *lf х4, х5 необходимые численные значения (по очереди одной из них придаем значение, равное единице, а двум другим — нулю). t>!= (1, —1, 0, 0, 0), ©2 = (0. 1, —1, 1, 0), р,= (0, 1, —1, 0, 1). Следовательно, подпространство М состоит из всех вещественных решений одно- родной системы линейных уравнений: хг — ха = 0> ха — х3 + х4 = 0, хг — хя + х5 = 0. 8.12. В конечномерных евклидовых пространствах, естествен- ным образом обобщая известные геометрические понятия, вводится понятие проекции элемента на подпространство. Для всякого подпространства // конечномерного евклидова про- странства L имеем разложение L в прямую сумму (8.6); L = L' 4 (L')1. Поэтому всякий элемент х из L допускает единственное пред- ставление в виде суммы х — х 4 х", где х' е L'.x" С (Г)" (3-12). Слагаемое х' называется ортогональной проекцией (или просто проекцией) элемента х на подпространство L Благодаря взаимной ортогональности подпространств L' и (L')1 (8.9) мы здесь же получаем, что х" есть проекция х на подпро- странство (L')L. 174
Для проекций выполняются следующие свойства, имеющие из- вестные аналоги в евклидовой геометрии. Проекция на подпрост- ранство суммы двух элементов равна сумме их проекций. Проек- ция произведения числа на элемент равна произведению этого числа на проекцию элемента. Справедливость этих утверждений вытекает из того, что для элементов X = х' + х", у = / 4- у" (х\ у’ $ Г; х", у" е (Г)1) имеет место: X + у = (х' + у’) + (х” + у"), x' + y'eL', x" + y"€(L')i, Хх = (lx') + (lx"), lx' C L’, lx\ (L')1, (I e R). 8.13. Пример. Пусть L' — подпространство конечномерного евклидо- ва пространства L и элементы ult иг, ..., ик образуют базис L. Проекцию х' произвольного элемента х € L на подпространство L' можно найти следующим способом. Имеем: х = х + х" (х' С L', х" € (Д')1)- Поэтому (х, ид — (х', ид при любом i — 1, 2, ..., k. Найдем коэффициенты разложения х' по базису: х' = ctjUt + a2u2 + ... + акик. Умножая скалярно обе части равенства на ui (i = 1, 2, .... k), получаем систему соотношений: (“i- ид Щ + (uj, u2)a2 + ... + (uj, ик)ак = («2, x), (u2, ujaj + (u2, u2)a2 + ... + (u2, ик)ак = (u2, x), (uft, wl)a1 + (uk, u2)a2 + ... + (uk, uk)ak = (uk, x). Эту систему можно рассматривать как систему уравнений с неизвестными at, a2, ..., ак. Определитель этой системы, являясь определителем Грама для ли- нейно независимых элементов ult и2, .... ик (6.13, пример 4), отличен от нуля. Следовательно, система имеет и притом единственное решение, которое и дает нам коэффициенты искомого разложения. § 9. Линейные алгебры 9.1. В ряде важных случаев в линейном пространстве, помимо действий сложения и умножения на числа, естественным образом определяется еще одно действие, обычно называемое умножением, которое нельзя игнорировать при изучении всей системы. Напри- мер, в линейном пространстве геометрических векторов можно рас- сматривать векторное произведение векторов. При изучении функ- ций нельзя без потери многих важных свойств ограничиться изу- чением только действий сложения и умножения на числа, не вво- дя в рассмотрение умножение функций. По мере дальнейшего изу- чения математики количество таких примеров будет увеличиваться. 9.2. Определение. Линейное пространство А над число- вым полем Р, в котором, помимо сложения и умножения на числа из Р, определено новое действие, называемое умножением, согласно которому каждой паре и, и £ А сопоставляется третий элемент — их произведение u-v (А, называется линейной алгеброй над Р, >75
если умножение связано со сложением в А и умножением на числа из Р следующими соотношениями': 1) и • (у 4- w) = (u-vj + (u-w), (v + w) и = (v и) +(и» • u), 2) X (и • v) — (ku) • ti — и (Xv) (X £ P) Для линейной алгебры А базис линейного пространства, на ос- нове которого построена эта линейная алгебра, называется базисом самой линейной алгебры, а размерность линейного пространства — размерностью линейной алгебры. Если умножение в линейной алгебзе ассоциативно, то линейная алгебра называется ассоциативной. Если умножение коммутатив- но, то линейная алгебра называется коммутативной. Единицей ли- нейной алгебры А называется такой ее элемент е, что и • е = = е • и — и при всяком и б А. Ассоциативную линейную алгебру над Р можно рассматривать одновременно и как линейное пространство над Р и как кольцо (Ч. VII, 3.2). Легко видеть, что в произвольной (не обязательно ассоциатив- ной) линейной алгебре сложение и умножение связаны свойствами, которые имеют место и в произвольных кольцах (Ч. VII, 3.5, 3.6). 9.3 Отметим, что в соответствии с 1.13 можно рассматривать линейные алгебры над произвольными, не обязательно числовыми полями. 9.4. Пусть А — линейная алгебра над Р. Для произвольных х, у б А, а, (3 б Р выполняется (ах) • (Ру) = а [X • (Ру) J = а СР (х у)] = ар (х • у). Поэтому для произвольных линейных комбинаций « = а^ + а2х2 + ... + а,х„ , о = Р1У1 + 0»У» + ... + ... + Pmym (ар р, бР; х(, у/А) их произведение может быть найдено по правилу: И • V = очр! (х: • ух) + ахр2 (* • у2) + ... + а„рт (х„- уJ = = у^- н i 9.5. При изучении линейных алгебр важным является то, что умножение в них определяется умножением базисных элементов. Если в линейной алгебре А над Р фиксирован некоторый базис их, м2, ..., ип, то для произвольных элементов и = а^ + а2а2 + ... + ал , v = + р2и2 + ... + р„ ип (а(, М Р) имеем: и • v = а1р1 (М1 • + а^г • и2) + ... + алр„(ыя • «„) = = 2 аЛ (“<“/)• i,i 176
Тем самым умножение в А полностью определяется системой, состоящей из п2 произведений и, • Uj(i, j = 1, 2, .... n). Многие важные свойства умножения в А определяются, ввиду сказанного выше, исходя из свойств умножения базисных элемен- тов. Так, если умножение базисных элементов коммутативно (u wf = = UjU), то все умножение в А коммутативно. Если при умножении базисных элементов выполняются соотношения ассоциативности ((и,и;)аЛ = (ujuh)), то и все умножение в А ассоциативно. Если элемент е С А обладает свойством единичного элемента при умноже- нии на базисные элементы (uze = eut = и,), то е есть единица в А. В свою очередь базис произвольного линейного пространства удобно использовать для введения действия умножения, превращаю- щего линейное пространство в линейную алгебру. Пусть L — ли- нейное пространство над Р и ии и2, .... ип— его базис. Зададим произвольным образом систему из п2 элементов vkl (k, I = 1, 2, ... ..., п) в L. Тогда в L может быть введено действие умножения по следующему правилу, превращающее L в линейную алгебру так, что uh • ut = vkt при всяких k, I (согласно предыдущим рассужде- ниям такое умножение в L единственно). Для произвольных эле- ментов из L: и = + а2«2 + ... + апип, и = 0^ 4- Р2н2 + ... 4- (а*. М-Р). их произведение полагаем равным: и • ц = (ajpj) vn 4- + ••• + (a„₽a) vnn = V k. i Легко проверяется, что так определенное действие умножения в L связано со сложением и умножением на числа из Р соотношениями, указанными в определении линейной алгебры. При этом для базис- ных элементов = Ouj + 4* Oufe-i 4- luk + 0uft+1 4* ••• 4- 0u„, = Ouj + ... 4" 0мг_х 4- l«z 4- Otzz+X 4- ... 0un имеем: uk • ut = (1 • l)yftz = vkl. Вполне аналогичным образом проводятся рассуждения и в случае бесконечного базиса. 9.6. На линейные алгебры естественным образом распространя- ется понятие изоморфизма. Две линейные алгебры над одним и тем же числовым полем назы- ваются изоморфными, если существует изоморфизм соответствую- щих линейных пространств, который является одновременно изо- морфизмом относительно действий умножения. Вполне ясно, что с точки зрения изучения действий сложения, умножения на числа и умножения изоморфные линейные алгебры можно не различать. 17?
9.7. В заключение остановимся на одном важном свойстве ли- нейных алгебр с единицей. Пусть А — ненулевая линейная алгебра над Р с единицей е. Так как е, очевидно, ненулевой элемент в Л, то он линейно незави- сим, и поэтому равенство ае = 0е (а, 0 £ Р) возможно лишь при а = 0 Тем самым соответствие ае —> а (а £ Р) взаимнооднозначно. Используя свойства действий з линейной алгеб- ре, получаем: ае 4- 0в = (а + 0)?, X (ае) = (Ха)е, (ае) • (ре) = (а0)е (а, 0 Д € Р)- Поэтому указанное взаимно однозначное соответствие обладает свойством изоморфизма относительно сложения, умножения на числа из Р и умножения. Кроме того, умножение элемента ае 6 А на произвольный элемент и € А приводит к тому же результату, что и умножение а на и: (ае) • и = а (е • «) = аи. В связи со сказанным оказывается возможным и часто удобным производить отождествление элементов ае (а € Р) из Л с а, пола- гая ае = а и тем самым считая Р а: А. 9.8. Примеры. 1) Если рассмотреть линейную алгебру над полем всех вещественных чисел с базисом, состоящим из двух элементов 1 и i, в которой умножение базисных элементов задается при помощи таблицы I 1 I « 1 I 1 I » i | 1 | —1 то мы получим систему всех комплексных чисел, 2) Рассмотрим четырехмеркую линейную алгебру над полем всех веществен- ных чисел с базисом е, i, j, k и таблицей умножения базисных элементов е i i k е i k i ~e k —i i i -k —e • k k i —i ~e Эта линейная алгебра называется алгеброй кватернионов. Она некоммута- тивна (например, ij --/= ji) и, как легко проверить, ассоциативна Можно пока- зать, что всякое уравнение их: = v и хи — v, тде и — ненулевой элемент, раз- решимо в этой линейной алгебре (такие линейные алгебры называются алгебра- ми с делением). Алгебра кватерриопов была введена в рассмотрение з середине XIX веча английским математиком У. Р. Гамильтоном (1805—18G5) в связи с ис- следованиями векторного исчисления в пространстве евклидовой геометрии. Помимо ряда приложений за пределами алгебраической науки, алгебра кватер, няснов играет особую роль в изучении ассоциативных линейных алгебр с деле- нием. Может быть показано, что она является единственной (с фчностью до изоморфизма) некоммутативной ассоциативной линейной алгеброй с делением конечной размерности над полем ьсех вещественных чисел. 178
Г лава V. ДЕЙСТВИЯ С МАТРИЦАМИ § 1. Линейные пространства матриц 1.1. Мы уже имели дело с матрицами. Понятие и некоторые простые свойства матриц оказались полезными для решения не- которых задач. Но большая, содержательная, глубокая теория матриц возникает лишь после того, как определяются действия над матрицами. Получающаяся в результате этого теория не толь- ко представляет собой важную часть современной алгебры, но на- ходит многочисленные важные применения и во многих других ма- тематических дисциплинах, а также в областях других наук, где используются математические методы. Определение действий между матрицами, начало их исследо- ваний и тем самым основание фундамента теории матриц было осу- ществлено английским математиком А. Кел и (1821—1895 ). В на- стоящее время имеется целый ряд книг, специально посвященных изложению теории матриц. В этой главе мы затронем лишь самые первоначальные понятия и свойства этой теории. В дальнейшем мы еще не раз вернемся к рассмотрению свойств матриц, связанных с действиями над матри- цами. 1.2. Можно избрать несколько подходов к определению дейст- вий с матрицами и изучению их свойств. Мы будем исходить из той роли, которую играют матрицы при линейных выражениях эле- ментов одной системы некоторого линейного пространства через другие элементы этого же пространства. О такой трактовке матриц мы гозорилн в § 2 гл. IV. Материал этого параграфа будет систе- матически использоваться в настоящей главе. В течение последующего изложения L будет обозначать неко- торое линейное пространство, которое большей частью удобнее будет считать пространством над полем всех комплексных чисел Z Вполне можно было бы вести рассуждения, взяв за основу ли- нейное пространство над произвольным числовым полем. Но ча- ще всего это только отвлекло бы нас от основной линии рассуж- дений. 179
1.3 Определение. Для произвольных {т, п)-матриц А и В /ап а12 • •• °1Л\ /Ьц Ь12 ... Ь1п\ Д — | «21 «22 «2» |, В = I ^21 “ | <ат1От2 ••• атп' '^тФтг ••• (,гаи/ матрица /(«и 4 Ьц) i,a12 4- Ь12) ... (а1п + Ь1п) \ С =1 («21 + Ь21) (а22 4- Ь22) ... (аг„+ Ь2Ч) | Ч«ж1 + ^ml) («m2 4* Ьт2) ... (итп + bmnV называется их суммой: А± В = С. 1.4. Смысл действия сложения матриц становится особенно яс- ным, если рассматривать матрицы как матрицы линейного выраже- ния (1 2), Пусть даны две системы vlt v2, ..., vm £ L и и', o', ..., v'ni(L, причем каждый из их элементов выражается линейно через и1( «2, .... и„: 1’1 = «и«1 4- «12«2 4- ... 4- «1п«„, «г = а21и2 4- «22«2 4- ... 4- а2пип, vm — amlul + ttm2«2 4- ... 4- amhun , «i = b2lu2 4- &12«2 4- ... + binun, «2 = ^2i«i 4- Ь22и2 4- ... 4- Ь2пип, «« = ^mi«i + Ьт2и2 4- ... 4- Ьтпич. Тогда элементы (и2 4- (о2 + «о), •••> + v'm) очевидным обра- зом также выражаются линейно через ut, и.2, ..., и„: (^1 4- о.) = («п 4- Ьц)«1 4- («и 4- Ь1г)«г 4- ... 4- («1п 4- bin)u„, (о2 4- о2) = («21 4- Ь21)и1 4- («22 4* Ь22) и2 4- ... 4- («гл 4- Ь2Г) ип, («ш + «га) = («ml + ^ml)«l + («m2 4* t>m2)u2 4* ... 4- (атп 4* ^тЛ)«л- Для трех систем «1. «2. .... «га, «2.Ут1 («1 4- «;), («2 4- о2), .... («т + О выпишем соответствующие матрицы линейного выражения этих элементов через u2, .... uft. Для первой системы это будет: («П «12 «1Л \ «21 «22 •• «2Л | «ml «m2 ••• 180
для второй: /Ьп Ь12 ... 61п \ В = I ^S1 ^'22 | '^ml Ьт2 ... &шл/ и для третьей: /(“и + Ьи) (“12 + &12) ••• (Щп + ^1») \ С = I ~г ^21) (“22 + &гг) ••• (а2п + ^гч) | Ч“Ж1+ bml) (аи2+ bm2) ... (атп + Ьт„) / Оказалось, что С есть сумма матриц Л и В. Таким образом, сло- жение двух матриц линейного выражения систем и2, ..., vm и Vp vv ..., ит дает матрицу линейного выражения системы, эле- менты которой получаются путем сложения соответствующих элементов исходных систем: («i + (v2 + v’2), .... (ит + v'm). 1.5. Определение. Произведением матрицы (“11 “12 ••• “)ч \ “21 “22 ••• “зч I “ml “m2 ••• Quin' на число А. называется следующая матрица: (Ааи Аа12 Ка1п \ ла21 Ай22 ... Аа2Л | А-йр-д А.ягл2 ... А.адап/ Так же как и при сложении, нетрудно связать это действие с рассмотрением матрицы как матрицы линейного выражения од- них элементов через другие. Именно, если А есть матрица линейного выражения vt, о2, .... vm через иъ и2, .... ип , то КА, очевидно, будет матрицей линейного выражения Kvlt Kv2, .... Kvm через ult и2, ... ..., ип. 1.6. В множестве всех (т, и)-матриц действие сложения (1.3) и операция умножения на числа (1.5) обладают следующими основ- ными свойствами: 1) коммутативность сложения; 2) ассоциативность сложения; 3) обратимость действия сложения; 4) ассоциативность умножения на числа; 5) свойство дистрибутивности относительно сложения чисел; 6) свойство дистрибутивности относительно сложения матриц; 7) свойство единичного множителя. Справедливость выполнения указанных семи свойств устанав- ливается очевидным образом, поскольку рассматриваемые операции ,131
с матрицами непосредственно сводятся к соответствующим опера- циям над их элементами, являющимися числами. 1.7. Можно также прийти к свойствам 1.6, рассматривая матрицы как матрицы линейного выражения. Возьмем п линейно независимых элементов м1( и2, ..., ип не- которого линейного пространства L. (tn, п)-матрицу /I можно рас- сматривать как матрицу линейного выражения некоторых и2, ... ..., £ L через и2, .... ип (IV, 2.3), а матрицу В как матрицу выражения некоторых сь, и2, ..., vlrl С В через и1( «2, ..., ц Тогда А + В есть матрица линейного выражения элементов (vi + »i), (*Ч + » •••> (vra + Cm) через ub u2, ..., un, а матрица В + A — матрица линейного выражения элементов (щ + t\), (с2 4- Сг)т •••» (cm + ст) через «2, ..., и„ . Так как действие сло- жения в L коммутативно (и потому ut + v\ — v, 4- иД то ввиду единственности матрицы линейного выражения (IV, 2.2) получа- ем А 4* В = В 4- А. Аналогично можно рассуждать и для остальных шести свойств 1.6. 1.8. То, что в множестве всех (т, п)-матриц выполняются семь указанных в 1.6 свойств согласно определению IV, 1.1, означает, что это множество само оказывается линейным пространством над полем всех комплексных чисел. 1.9. Если взять множество, состоящее из всех тех (т, ^-мат- риц, элементы которых принадлежат числовому полю Р, то это множество Alp1'относительно действия сложения и операции умножения на числа из Р, очевидно, будет линейным пространст- вом над Р. Роль матриц из Alp1’'° определяется тем, что их можно рас- сматривать как матрицы линейных выражений т элементов из какого-либо линейного пространства над Р через п элементов этого линейного пространства. 1.10. Линейное пространство Afp1’л) имеет конечный ранг, равный т п. Действительно, рассмотрим матрицы £ц» ^12> Ец, ..., Етп, где Еи есть матрица, все элементы которой равны нулю, за исклю- чением элемента, стоящего в i-й строке и /-м столбце, который равен единице: /0 0 ... 0 .. 0 \л / 0 0 ... 0 ... 0 1 I Еи = I........................\ ! i li — 1, 2, .... т;\ | 0 0 ... 1 ... 0 5) v = 1, 2, ..., п). fi 0 о ... о 182
Указанные -n • п матриц образуют базис линейного прост- ранства М 'р' п\ Действительно, равенство: °П^11 Н~ + ••• + + ... + ^тп^тп — где 8 есть нулевой элемент Мрп' п\ т. е. нулевая матрица, у кото- рой все элементы равны нулю, возможно лишь при всех at), равных нулю Это следует из того, что матрица, получающаяся слева в результате сложения, имеет элемент в /-й строке и /-м столбце, равный atj. Таким образом, наши матрицы Etj линейно независимы между собой. Кроме того, всякая матрица А из М‘р’ п> (аи а12 ••• ат \ ц21 а22 ... агп | очевидным образом выражается линейно через указанные матрицы: Д = апЕп 4- а12Е124- ••• + ацЕц + ... 4 атпЕтп. 1.11. Укажем еще на одну возможность подхода к операциям сложения матриц и умножения их на числа. В IV, 5.16 мы обратили внимание на некоторое взаимно однозначное соответствие между (т, п)-магрицами и линейными отображениями линейного про- странства L ранга т в линейное пространство L' ранга п. Совокуп- ность всех таких отображений Ф само является линейным простран- ством (IV, 5.15). Указанное взаимно однозначное соответствие меж- ду Ф и множеством всех (пг, п)-матриц, как легко видеть, является изоморфизмом между этими двумя линейными пространствами. Действие сложения для (т, п)-матриц и операция умножения их на числа у нас были введены иначе. Но, очевидно, можно было бы ввести исходя из указанного соответствия между матрицами и линейными отображениями. § 2. Умножение матриц 2.1. Помимо сложения и умножения на числа, для матриц опре- деляется также действие умножения матриц друг на друга. Против ожидания, умножение матриц определяется вовсе не так, как это было бы естественно предположить — путем перемножения со- ответствующих элементов перемножаемых матриц, но при помощи правила, сравнительно сложного и на первый взгляд очень не- удобного. Это объясняется тем, что определяемые для матриц дей- ствия вводятся для того, чтобы исследовать те или иные важные соотношения между различными математическими обьектами. Мы введем действие умножения матриц, исходя из интерпрета- ции матриц, как матриц линейного выражения. Пусть даны три системы элементов линейного пространства L над полем Р. aylr w2, ..., wm\ Oi, v2.vn ; ult u2, .... ut, J 83
причем элементы первой системы выражаются линейно через эле- менты второй системы, а элементы второй системы в свою очередь выражаются линейно через элементы третьей системы: «Т = flnui + й12^2 + ... + alnvn , w2 = a21vx + a22v2 4- ... + a2nvn , wm = amivx + am,v2 + ... + amnvn , Vi — 4* bX2u2 4- 4- v2 — b2Xux 4” b22u2 4~ ... 4" b2luh vn = bmui + b„2u2 4- ... 4- b„iUt. Тогда нетрудно выразить линейно элементы первой системы tt'2, .... wm через элементы третьей системы и1( и2, .... и,: w, = ааУ1 4- a,2v2 4- ... 4- ainvn = = «и (Ьц«1 4- b12w2 4- ... 4- buMz) 4- 4- (^2iui "+ b22u2 + ... + b2/wz) 4- 4- ain (bnlU1 4- bn2u2 4- ... bnlut) = = (a.ibn + ai2b21 4- ... 4- ainbni) ux 4- 4- (a;i&i2 4* ai2b22 4- ... 4- alnbn2)u2 4- 4- (ЯцЬц 4- ai2b2l 4- ••• 4- ainbni) ui (i = 1, 2, ..., m). Выпишем три матрицы соответствующих линейных выражений. Матрицей выражения wx, w2, ..., wm через ult v2, ..., vn будет: (й11 й12 ••• ain Й21 й22 ”• а2П Йт1 йт2 ••• йтл матрицей выражения vlt v2, vn через их, и2, .... ц, будет: (Ьц ЬХ2 ... ЬХ1 Ь21 Ь22 ... b2i bni bn2 ••• Ьп[ матрицей выражения w2, ..., wm через их, и2, ..., щ будет: С12 ••• си \ с22 ... с21 |, ЙШ2 ••• ^'п1 где СЦ = 4- a,2b2j 4- ... 4- ainbnj (i = 1, 2.........т; j = 1, 2.........../). 184
Закон составления элементов матрицы С легко подметить. Элемент (из i-й строки и /-го столбца) матрицы С представляет собой сумму попарных произведений соответствующих элементов i-й строки матрицы А и /-го столбца матрицы В (замечаем, что стро- ки матрицы А имеют такое же количество элементов п, как и столб- цы матрицы В). Именно эта матрица С, являющаяся матрицей ли- нейного зыражения, получаемого в результате двух последова- тельно примененных линейных выражений, и называется произве- дением матриц А и В. Она помогает изучить важную операцию по- следовательного линейного выражения. Поэтому (так же как и по ряду других важных причин родственного характера) она и заслуживает изучения. 2.2. Определение произведения матриц, довольно естественно возникающее в связи с рассмотренными выше последовательными линейными выражениями, может быть формулировано и непосред- ственно. Определение. Пусть количество элементов в строках некоторой матрицы А равно количеству элементов в столбцах мат- рицы В: (^11 ••• bji b22 ... Ь^, . Ьт Ьм ... bj Тогда для этих матриц определена матрица С, называемая ик произведением: где /сп С12 ••• си \ С — f см ••• сы \ = А В^ 'с-т С m2 ••• ^тГ сц = ацЬц + ai2b2j + ... + ainbnj (i =1, 2, ..., т; j = 1, 2, ..., /). 2.3. Из 2.1 видно, что умножение матриц, определенное общим правилом 2.2, всегда можно связать с последовательными линей- ными выражениями. Действительно, пусть для матриц А, В, С имеет место А • В = С. Тогда, задавшись произвольной системой I элементов ult и2, ... ..., и;, можно при помощи матрицы В получить систему элементов vt, v2, ..., vn, выражающихся линейно через и1у и2, ..., ut с матри- цей В, затем при помощи матрицы А систему элементов w2, ... ..., wm, выражающихся линейно через vlt v2, ..., и„ с матрицей А. Матрица С, являющаяся произведением Л и В, будет матрицей линейного выражения w2, ..., wm через иъ u2i ..., ut. )85
2.4. Примеры. 1) В векторном пространстве V® даны четыре вектора! е1= (2, —1, 1),Ф?= (1, —3, yl, 03 = »« = (3,1. О- Далее векторы o>j и wt заданы в виде линейных выражений Wi = Зт>! + 2о2 + Ит»з + е4, w2 = «1 — 4®, + 3t>4- Исходные векторы з3, ®4 выражаются через базисные векторы 0i"=(l, 0, 0), 0а=(О, 1, 0), е3 = (0, 0, 1) очевидным образом: z>. = 2et — ег +• е3, т9=01 — -30аv» = et + —е3, = Зе, + е2 + е3. Согласно 2.1 линейное выражение а>р сн2 через ех, е3, е3 определяется матри- цей С, получающейся от перемножения матриц А и В: Умножим их по правилу 2.2: С = А • В = ((3-24-2-14 8-04-1-3) (3(—1)4 2 (-3)48-14-1-1) /з-1+2--^-48- \ 24 /1= (1-2-4-ItO-04-З-З) (1 (—1)—4 (-3)4-0 14-3-1) (1 -1 -4-=40-4-43-1 )/ \ 2 4// /11 0 71 ~ V 7 14 2). Отсюда следует, что a>i и to2 следующим образом выражаются через elt et, е3 Wi = Н^! 4- 7е3, wt = 7ej 4- 1402 4 203- Другими словами, w1 — (11, 0, 7), Wj = (7, 14, 2). 2) Для квадратных матриц n-го порядка (п > 1) (0 1 1 ... 1 \ /0 0 0 ... 0\ 0 1 1 ... 1 \ /1 1 1 ... 1\ 0 1 1 . . 1 . В~ 11 1 1 ... 1 01*1..*. ‘1/ \1Т1’..‘. 1/ найдем их произведение АВ и ВА: АВ = 'П — 1 п — 1 п — 1 ... п — 1 п — 1 п — 1 п — 1 ... п — 1 п — 1 п — 1 п — 1 ... п — 1 Л — 1 п — 1 п — 1 ... п -- 1 Особо подчеркнем то обстоятельство, что в нашем случае оказалось: АВ ВА. 2.5. Рассмотрим некоторые первоначальные свойства введен- ного нами умножения матриц. Прежде всего из самого определе- ния следует, что произведение матриц определено не для всяких (ffe
двух матриц. Именно перемножать можно только такие две матри- цы А и В. у которых левый множитель имеет в строках столько элементов, сколько элементов имеет в столбцах правый множитель. На примере 2.4, 2) мы видели, что умножение матриц, вообще говоря, не обладает свойством коммутативности, для некоторых пар матриц имеет место: АВ^ВА (разумеется, в отдельных случаях может оказаться АВ = ВА). 2.6 Следующее из основных свойств действий — ассоциатив- ность, оказывается, имеет место. Теорема. Умножение матриц ассоциативно, т. е. если суще- ствуют произведения матриц АВ и ВС, то существуют и произве- дения; (АВ)С, А(ВС), причем эти произведения равны между собой: (АВ)С = А(ВС). Доказательство. Можно было бы доказать требуемое равенство, исходя непосредственно из определения произведения матриц, однако будет проще, если мы станем интерпретировать паши матрицы как матрицы линейных выражений в некотором линейном пространстве. Пусть Л есть матрица линейного выражения элементов о*'?*, »2Л|, через о*®', ..., t/n’; В есть матрица линейного выражения .... v(“> через о0?, , .... С есть матрица линейного выражения v'Cz, ., , v'l' через линейно независимые между собой элементы и1, и2, ..., иг. Тогда элементы v1^ можно выразить линейно через v{C\\ v"?, ..., и?, причем матрицей этого выражения будет АВ. Так как элементы о* вы- ражаются в свою очередь линейно через и1( ut, ..., иг, то v[1’ можно выразить линейно через ult и2, .... иг, причем матрицей этого выражения будет (АВ)С. С другой стороны, можно рассуждать и так. Сперва выразим линей- но все v(® через щ, и2, .... иг. Матрицей выражения будет ВС. Благодаря этому выраженные линейно через t/®', ... .... о(®», можно сразу выразить через ult u2, ..., иг. Матрицей ли- нейного выражения через щ, и2, .... и, окажется Л(ВС). Ввиду предположенной линейной независимости ы1( м2, ..., иг матрица линейного выражения v(*', ..., v{m через ии щ, ... ..., иг определяется единственным образом, и, следовательно, (АВ)С = А(ВС’).
2.7. Сложение и умножение матриц связаны соотношениями дистр ибути вности. Теорема. Пусть А и В — две (т, п)-матрицо1. Для всякой (п, 1)-матрицы С имеет место: (А 4- В)С =АС+ ВС. Для всякой (I, т)-матрицы D имеет место: D (Д + В) ^DA + DB. Доказательство. 1) Будем обозначать элементы мат- риц соответствующими малыми буквами. (i, /)-элемент матрицы (Д 4- В)С равен: (a,i 4- + (й,а 4- bit)G3j -h ... + (ain + biny.nj. Для матриц АС и ВС их (t, /)-элементы соответственно равны: 4~ ^1^2) 4' ••• 4- ciincnj, ^ис1/ 4" Ь/А/ 4- ... 4- blncnj. Отсюда следует, что (i, /)-элемент матрицы (Д 4- В)С равен сумме (i, /)-элементов матрицы АС и ВС. Это означает справедли- вость первого из рассматриваемых равенств. 2) (t, /)-элемент матрицы D (Д 4- В) равен <in (а1; 4- Ьц) 4- di2 (a2j 4- Ь2/) 4- ... 4- dim (amj 4- bm]). Для матрицы DA и DB их (i, /)-элементы соответственно равны: 4^ 4- di2a2j 4- ... + dimamj, dnbij 4- dl2b2j 4- ... 4- dlmbmj. Отсюда следует второе из рассматриваемых равенств. 2.8. Отметим, что доказанные в 2.7 равенства также легко было бы получить, рассматривая участвующие там матрицы как матри- цы линейных выражений. Это наглядно объяснило бы внутренний смысл свойства дистрибутивности для матриц. 2.9. При помощи действия умножения матриц можно было бы определить введенную в предыдущем параграфе операцию умноже- ния матриц на число. Действительно, непосредственно из правила умножения матриц следует, что для произвольной (т, п)-матрицы (аи аи а1.1 \ й21 й22 а2П I ^тг а,пп' имеет место: А 0 ... 0\ ап а12 ... а1П \ ХД = /ОХ... О I / П21 а22 °2П j О 0 ... X/ 'О,л1 flmJ cimn (здесь левый множитель есть квадратная матрица порядка т). 188
Аналогично /й11 fl12 ••• ain ХЛ = | °я ага ••• а?п к 0 ... О' О 1 ... о .0*0..* к amt ani2 ••• атп (здесь правый множитель есть квадратная матрица порядка п). 2.10. Отметим, что из 2.9 можно получить следующую связь между операциями перемножения матриц и умножения матриц на число. Если для матриц А и Б определено их произведение, то при любом числе Л имеет место X (АВ) = (ХА)В = А (кВ). Впрочем, эти равенства легко следуют и из самих определений этих операций. 2.11. При изучении действия умножения матриц в большинстве случаев ограничиваются областью квадратных матриц одного и того же порядка. Согласно 2.2 и 2.G в множестве всех квадратных матриц поряд- ка и результат действия умножения определен для любых двух таких матриц. При этом указанное действие ассоциативно. Это позволяет говорить о множестве всех квадратных матриц одною и того же порядка как о полугруппе (Ч. VII, 2.2). Если ограничиться квадратными матрицами порядка п, все элементы которых принадлежат числовому полю Р, то, как непо- средственно следует из способа умножения матриц, множество та- ких матриц замкнуто относительно умножения. Поэтому оно также является полугруппой. Если множество всех квадратных матриц над Р рассматривать относительно сложения, умножения и умножения па числа из Р, то это множество оказывается линейной алгеброй над Р (IV, 9.2). 2.12. Лемма. Пусть А и В — две (т, п)-матрицы. Если для всех т-вектсров (рассматриваемых как однострочные матрицы) е, =(1,0.....0),е2 = (0,1.....0),. .,ет =(0,0...1) выполняется ekA = ekB (k — 1,2, ..., т), то А — В. Если для всех п-векторов (рассматриваемых как одностолбцовые матрицы) выполняется Af = Bft(l = 1, 2, ..., и), то А = В. Доказательство Обозначим через а1} и blf соответ- ствующие элементы матриц А и В. »89
Согласно правилу умножения матриц /-ым элементом одностроч- ной матрицы etA является О • atj + 0 • а21 + ... 4- 1 + ... + 0 • ап/ = а1}. Аналогично /-ым элементом однострочной матрицы efl является biS. Так как etA = efl, то aL, = Ъц, и так при всех I и j. Следова- тельно, А и В имеют одинаковые элементы, т. е. А — В. Второе утверждение доказывается аналогично. 2,13. Используя понятие умножения матриц, можно и удобно описать, как изменяются координаты элемента конечномерного линейного пространства при изменении системы координат, т е. при другом выборе базиса. Пусть в линейном пространстве L заданы два базиса: t/i = {«и, и12, ..., и1яУ и Ua = {usl, и2а, ..., игп} Выразим линейно элементы одного из них через элементы друюго: “«1 = «и«и 4- а12ы»а + ••• + аи«12^ «22 = ^21^11 4“ «22«12 4- ••• 4* ияа = атип 4- ала«12 4- ... + а~„ии. Произвольный элемент v С L можно выразить линейно и через базис Ut, и через базис Ut: v = Сции + с12и1а + ... + с1Чи1Я, V — ^21^21 4" ^22«22 4" ••• 4* £»дИ2Я. Если подставить в последнее выражение вместо иа1, иаа, ..., и2П их линейные выражения через ип, uVi, ..., и1Я, то мы получим но- вое линейное выражение v через ии, и12, ..., ы1Я. Но v выражается через L\ единственным образом. Следователь- но, полученное выражение должно совпадать с исходным выраже- нием v через Uv Приравнивая коэффициенты при одинаковых ии С ^i> получаем систему равенств: Сц = auc2i 4- «гАг 4- ... 4" Vi«, С12 = «12^21 4“ «22С22 4- ... 4" С1„ = Й1л^21 4" П»яСг2 4“ ••• 4* йппО2П. Учитывая правило перемножения матриц, эти равенства можно записать в виде равенства матриц: («ц аи ... а,„\ «и «22 а2П ) ат апг ••• anrJ где (сп, С12, .... с1Я) и (cgi, С22. •••» с»л) рассматриваются как одно- строчные матрицы. 1ЭД
Это равенство показывает, как координаты (сп, cJ2, .... с1п) произвольного элемента v б L в базисе выражаются через ко- ординаты (с2Г, с22, ..., с2Л) того же элемента в базисе Ut при помощи матрицы Л линейного выражения U2 через £/1. Следует иметь в виду, что согласно 2.12 полученное равенство, будучи выполнено для всех (сп, с12, с1Д) и (с21, с22, • ••. с2л), опре- деляет матрицу А единственным образом. 2.14. Отметим, что равенства, полученные в 2.13, могут быть оформлены также и в виде следующего равенства матриц: 2.15. Полученное в 2.13 (или, что по существу то же самое, 2.14) выражение для преобразования координат элемента конечномерного линейного пространства, заданных в одном базисе, в координаты относительно другого базиса особенно удобно, когда приходится совершать последовательно несколько переходов от одного базиса к другому. Пусть в линейном пространстве L заданы три базиса: t/i — {ии, и12, ..., uln}, U2 = {w2i, u22, ...» и2П}, U3 = {u91, и32, ..., изп}. есть матрица линейного выражения t/2 через £\, А2 — матрица линейного выражения U3 через U3 и В — матрица линейного вы- ражения U3 через Ul Для произвольного элемента & f £ обозначим его координаты относительно базиса Ut через (c/t , cis, .... Cin) (i = 1, 2, 3). Согласно 2.13 мы имеем: (С11> И?» •••• ^1л) = (^21 > С22.' ^1» (с21> с22, ..., Cj„) = (С31, СЭ2, ..., Сзп! A.it Wilt С12, ..,С|Ч) — (с91, с32,..., сзп) В. Сделав очевидную подстановку, получим: fall, С1»> •••» С1п) — (С31> СЭ2, •••> Gn) ' ^2-^1- Так как это имеет место для любого v б L, то согласно 2.12 отсюда следует: В = АгАг Таким образом, чтобы получить формулу преобразования ко- ординат в результате последовательно примененных двух заданных переходов от одного базиса к другому, надо найти произведение их матриц (сц, с12, ..., cin) — (c3j, с32, ..., cin) • 'А2А3). Аналогично и при числе последовательных переходов, большем двух. И»
§ 3. Деление квадратных матриц 3.1. Приступим к выяснению возможности деления матриц друг на друга (говоря о делении, мы имеем в виду нахождение одно го неизвестного множителя при заданных втором множителе и произведении). При этом мы будем проводить рассуждения лишь для квадратных матриц. Наиболее удобным подходом опять будет рассмотрение матриц как матриц линейного выражения. Решающим в данном вопросе будет свойство неособенности квадратных мат- риц (IV, 2.9, 2.10). Мы систематически будем использовать мате- риал § 2 гл. IV. 3.2. Теорема. Пусть А и В — две квадратные матрицы порядка п. Если А и В обе неособенны, то и произведение их АВ является неособенной матрицей. Если хотя бы одна из матриц А или В особенная, то и произве- дение их АВ является особенной матрицей. Доказательство. В некотором линейном пространстве L возьмем п линейно независимых элементов и1У и2, ..., ип. Матрицу В можно рассматривать как матрицу линейного выражения некото- рых v1( о2, ..., иЛ С £ через их, и2,.... ип (IV, 2.3). Матрицу Л мож- но рассматривать как матрицу линейного выражения некоторых о>1, ш2, ..., wn С L через о,, v2, ...,vn. Согласно 2.1—2.3 Л В есть мат- рица линейного выражения ац, а>2, .... w„ через и1г и2.ип . Если В особенная, то согласно IV, 2.11 и1( v2, ..., vrl линейно за- висимы. Поэтому и wu w2, ..., wn будут линейно зависимы. Но тогда линейно независимые их, и2, ..., ип не могут быть выражены ли- нейно через u'j, w2, .... wn (IV, 1.6). Отсюда согласно IV, 2.11 сле- дует, что матрица АВ должна быть особенной. Пусть теперь В неособенная. Тогда vx, v2, ..., vn линейно неза- висимы и и,, и2, .... ип могут быть выражены через них линейно. Если и А неособенна, то vlf vt, ..., vn могут быть выражены ли- нейно через wx, w2, ..., wn . Но тогда и их, и2, ..., ип выражаются линейно через wlt w2, ..., wn . Согласно IV, 2.11 это означает, что АВ, являющаяся матрицей линейного выражения wx, w2......wn через Wj, и2, ..., ип, должна быть неособенной. Если А особенна, то w2, ..., wn линейно зависимы. Тогда и1( иг, ..., ип не могут быть выражены линейно через wx, w2, ... ..., wn. Поэтому матрица АВ должна быть особенной, 3.3. Приступая к рассмотрению возможности деления в обла- сти квадратных матриц, начнем с выяснения вопроса о том, на какие матрицы делится так называемая единичная матрица, играю- щая во всей этой теории особую роль. Единичной квадратной матоицей порядка п называется матрица /1 0 ... (К р /о 1 ... 01 ~ I 1 \о’о’...’ 1/ 192
(индекс п часто опускается: Еп = Е). Еп можно рассматривать как матрицу тривиального (тождествен- ного) линейного выражения элементов иъ и2, .... ип £ L через са- мих себя: = lult и2 — 1и2, ип = 1ил Отсюда следует, что единичная матрица является неособенной, что, впрочем, ясно и непосредственно. Из 2.9 следует, что для воякой квадратной матрицы А порядка п имеет место /1 • Еп = Еп • А = Л. 3.4. Определение. Для квадратной матрицы А порядка п обратной к ней матрицей, обозначаемой через А"1, называется та- кая квадратная матрица порядка п, что имеет место А А'1 = Л-1 А = Е. (Показатель —1 в данном случае есть просто значок, употребля’ емый для обозначения матрицы, являющейся обратной к данной матрице Л.) Очевидно, не всякая матрица имеет обратную. Не существует обратной матрицы для особенной матрицы, поскольку произведе- ние особенной матрицы пи на какую другую квадратную матрицу того же порядка согласно 3.2 не может равняться неособенной единичной матрице Е. 3.5. Теорема. Неособенная квадратная матрица обладает единственной обратной матрицей. Доказательство. Неособенную квадратную матрицу А будем рассматривать как матрицу линейного выражения элементов olt о?, ..., vn некоторого линейного пространства L через линейно независимые и1( и2, .... uft f L Согласно IV, 2.11 и1у и2, ..., ип з свою очередь могут быть выражены линейно через vlt v2, ..., vn, которые оказываются линейно независимыми. Матрицу указанного линейного выражения обозначим через Л'. Согласно 2.3 А"А есть матрица линейного выражения ub и2, ... ип через и1( и2, .... ип , т. е. единичная матрица Еп . Аналогично ЛА* является матрицей линейного выражения vlt о2, »„ через t’l, и2, ..., vn, и потому также равна Е„ , поскольку р1( v2, ..., ип линейно независимы. Следовательно, Л' является обратной матрицей для матрицы А. Пусть Л" также является обратной матрицей для Л. Тогда Л" = Е • Л" «= (А'А)А" = А' (АЛ") = Л' • Е = Л'. Это доказывает единственность обратной матрицы. 3.6. Рассмотрев частный случай деления матриц, можно легко перейти к общему случаю. Сразу же надо отметить, что вопрос о делении матриц, т. е. действии, обратном умножению, осложняется тем, что умножение некоммутативно. Именно, частным от деления матрицы В на А можно называть, с одной стороны, такую матрицу X, что имеет место АХ =₽ В, 7 Заказ &V 193'
и, с другой стороны, такую матрицу У, «то имеет месте У А = В. Можно указать примеры таких пар матриц А к В, для которых существуют как X, так и У, причем, однако, X #= У. В связи с ука- занным обстоятельством термин «деление» в применении к матри- цам обычно не употребляется; если все же его используют, то го- ворят о левом делении и о правом делении. 3.7. Теорема Пусто А — неособенная квадратная мат- рица порядка п и В — произвольная квадратная матрица порядка п. Тогда существуют такие квадратные матрицы порядка п X и У, что АХ = В, YA = В. Если А — особенная квадратная матрица порядка п, то для некоторых квадратных матриц В порядка п не существует квад- ратных матриц п-го порядка X и У, таких, чтобы АХ = В, У А = В Доказательство. 1) Если А неособенная, то в каче- стве искомых матриц X и У берем X = А~гВ, У = ВА~1. Легко убеждаемся, что они удовлетворяют требуемым соотношениям: АХ = А (Д-1В) = (АА-^В = ЕВ = В, У А = (ВД-!)А •= В (Д'М) = BE — В. 2) Если А особенная, то при любой неособенной В рассматри- ваемые равенства не выполняются, поскольку согласно 3 2 АХ и УД при любых X и У особенны и потому не могут равняться неособенной матрице В. 3.8. Из 3.2 следует, что если А к В — две неособенные квадрат- ные матрицы порядка п, то и результаты левого и правого деления В на Д, т. е. матрицы X и У, такие, что АХ = В и УД = В, так- же будут неособенными. Благодаря этому совокупность всех квад- ратных неособенных матриц порядка п оказывается обладающей сле- дующими свойствами. В этом множестве определено действие умножения, ставящее в соотретствие двум любым его элементам третий элемент из этого же множества. Действие это ассоциативно. Действие обратимо. Согласно общему понятию группы (Ч. VII, 2.3, 2.8) множешво всех квадратных неособенных матриц порядка п относительно дей- ствия умножения является группой. Из рассуждений, использованных в 3.5, легко видеть, что если все элементы квадратной неособенной матрицы А принадлежат некоторому числовому полю Р, то и все элементы обратной матри- цы Д-1 также будут принадлежать Р. Тем самым, как видно из 3.7, результаты деления двух квадратных неособенных матриц над полем Р также являются матрицами над тем же полем. Благодаря этому оказывается, что совокупность всех квадратных неособенных матриц порядка п над полем Р является группой. 194
3.9. Отметим, что в группе квадратных неособенных матриц, как и во всякой группе, обратные элементы обладают следующим свойством: (АВ)-1 = B-U’1. Справедливость его следует из единственности обратной мат- рицы И ТОГО, что (Л В) (В-’Л-1) = Е, (В-1 А-1) (АВ) = Е. Заметим также, что из самого определения обратной матрицы следует, что (Л"1)-1 = А. Если для каких-то квадратных матриц n-го порядка имеет мес- то А • В = Е, то согласно 3.2 Л и В — неособенные матрицы и, очевидно, В = Л-1. 3.10. Свойствами, аналогичными 3.9, обладаег еще одно важное соотношение между матрицами Для произвольной матрицы А транспонированной по отноше- нию к ней называется матрица Л*, которая получается в резуль- тате замены б Л строк столбцами: (Наравне с Л* для транспонированной матрицы употребляется и друюе обозначение: Л*.) Непосредственно видно, что операция транспонирования в от- ношении действий сложения и умножения на число обладает сле- дующими свойствами: (Л + В)* = А* + В*, (ХЛ)* = ХЛ* Если для Л и В определено их произведение, то оно определено и для В* и А*, причем имеет место: (АВ)* - В*А*. Действительно, обозначая соответствующими малыми буквами элементы матриц Л и В, получаем, что (i, /^-элемент матрицы (АВ)*, равный (/. 0-элементу матрицы АВ, есть + aj 2^2; + ... + У В*Л* (i, j)-элемент равен baa‘i + + Ь1Па’г,Г Здесь й’? означает (р, <?)-элемент матрицы Л*, т. е а’л = ачр. Аналогично Ь’л = Ьяр. Поэтому (I, 0-элемент матрицы В*Л* 7« 195
оказывается равным (i, /)-элементу матрицы (АВ)*. Поэтом)' В* А* = (АВ)*. Из определения транспонированной матрицы непосредственно следует (А*)* = А- 3.11. По ряду причин, о некоторых из которых будет сказано ниже, особого внимания заслуживают следующие матрицы. Определение. Вещественная квадратная неособенная матрица А называется ортогональной, если А* — Л-1. 3.12. Отметим несколько первоначальных свойств ортогональ- ных матриц. 1) Единичная матрица Е ортогональна. 2) IIроизведение двух ортогональных матриц А и В одного и того же порядка является ортогональной матрицей. Действительно, учитывая 3.9 и 3.10, имеем: (АВ)* (АВ) = В*А*АВ = В*ЕВ = В*В = Е, (АВ)* = (АВ)~1. 3) Матрица, обратная для ортогональной матрицы А, сама ортогональна. Это следует из (Л-1)-1 = А и (Л-1)* — (Л*)* = А. 3.13. Из 3.12 следует, что совокупность всех ортогональных матриц порядка п относительно действия умножения матриц явля- ется группой. 3.14. Для произвольной вещественной квадратной матрицы порядка п рассмотрим произведение А • А*. Учитывая 3.9, усло- вие ортогональности А равносильно требованию А А* = Е. Обозначим строки А через ult uit ..., ип. Совершив умножение А А*, сразу обнаруживаем, что для ортогональности А необхо- димо и достаточно, чтобы «(, д2< •••> представляли собой ортого- нальную систему нормированных элементов «-мерного координат- ного евклидового пространства Совершенно аналогично рассматривая Д* • А, убеждаемся, что для ортогональности А необходимо и достаточно, чтобы ее стотбцы представляли собой ортогональную систему нормиро- ванных элементов пространства ’/V- 3 15 Пример. Непосредственной проверкой убеждаемся, что ь веществен- ной матрице строки (а следовательно, согласно 3 14 и столбцы) представляют ссбой ортого- нальную м нормированную систему при а — 0 — у = С = 0. В этом, и только в этом, случае матрица оказывается ортогональной. 196
| 4. Определители квадратных матриц 4,1. Определитель квадратной матрицы во многих случаях оказывается важной ее характеристикой Мы уже могли эта заме- тить на примере разделения квадратных матриц на неособенные и особенные, столь важном во многих случаях. Отмегим, что из определения определителя видно, что в случае, когда все элементы квадратной матрицы А принадлежат некоторому полю Р, ее определитель det А также оказывается числом из Р. 4.2. Использованная ранее важная теорема 3.2 благодаря IV, 2.10 оказывается следствием из следующей теоремы об опреде- лителе произведения квадратных матриц. Теорема. Для определителей квадратных матриц п-го порядка А и В имеет место: det (АВ) = det А • det В. Доказательство. Согласно правилу перемножения матриц определитель матрицы АВ имеет вид: С 2 ••• ^1П det (АВ) = с2* с«2 "• С2л Сп\ Сп2 ••• Спп где Сц = + al2b2i + ... + ainbni (i, j = 1, 2, ..., га). Поскольку элементы первого столбца этого определителя представлены в виде некоторых сумм, к нему можно применить свойство определителей (II, 2.9) и представить det (АВ) в виде суммы определителей вида: y-Tl^til) ^12 ••• С1п (a2kbkl) ^22 •»• С2п &11&12 ••• ••• = bk\ a<2kC^ iflnkbkx} Cfi2 ••• Cnn Таким же способом поступим с элементами второго столбца каждого из получившихся определителей, затем третьего столбца и так далее. В результате мы представим определитель det (АВ) в виде суммы всевозможных определителей вида . bkpbufi ... bhnn Й1*,Й1*2 ... ацгп dikfl2k, ... d2Kn • • • <Pi)in Те из этих определителей, у которых kt = k, для какой-либо пары I, j = 1, 2, ..., га; i Д= j, равны нулю, и их можно исключить из рассматриваемой суммы. В оставшихся определи путях klt kit ... J 97
.... kn есть совокупность всех чисел 1, 2, п, расположенных в той или иной последовательности. Переставим в каждом из указанных определителей столбцы так, чтобы они шли в такой же последовательности, как и в матри- це Д. Этого можно добиться, последовательно переставляя пары столбцов ~ соответствии с II, 1.11. При каждой такой переста- новке появится дополнительный множитель —1 (II, 3.6). Всего та- J (kt, к,.................................................Л ) ких множителей наберется J (klt k2, , kn) и (—1) " — = sign (Ар k.2, ..., kn). Теперь рассматриваемый нами определитель det (АВ) представ- ляется в виде суммы, в которой каждое слагаемое имеет вид. ”• (^1» ^2» •••♦ ^п) ' ^11^12 ••• ^1л ^2>®22 ••• &2п ^nl^n2 • •• Я'ГП В этой сумме общий множитель det А, входящий в каждое сла- гаемое, можно вынести за скобки, и мы получим следующее выоа- жепие для нашего определителя. det (АВ) = det Д • У sign (k}, k2, .... kn) • Ь^Ък,г ... b^, где 2 означает знак суммирования по всевозможным комбина- циям (klt k2, .... k,t), где (kit k2, .... kn) есть совокупность чисел 1, 2, ..., п, взятых в том или ином порядке. Но, как мы знаем (II, 1.16, 1.18), такая сумма есть не что иное, как определитель det В. Следовательно, det (АВ) = det Д • det В. 4.3. Пользуясь определителями, можно указать явную форму для матрицы, являющейся обратной к заданной квадратной неосо- бенной матрице. Сперва рассмотрим произвольную квадратную матрицу по- рядка я: А = ^11 ^12 ••• &1П ^2] ®22 ••• &2г1 Возьмем матрицу, элементы которой являются алгебраически- ми дополнениями соответщвующих элементов матрицы А: 193
Транспонируем ее (3.10): ell ^21 12 Atg .. Ans 1ч А 2п • • • А ц*' Такую матрицу иногда пазываюг взаимной по отношению к матрице А. Рассмотрим произведения матриц А и А*: А • А*, А* • А. Согласно правилу умножения матриц (t, /)-элемент первой из них равен + ai2Aji + ... + а!лА,л (учитываем, что (А, /)-элемент матрицы А* есть А,*). Получившаяся сумма согласно П, 2.8, 3.9 при i = / равна det А = Ь и равна нулю при i¥=j. Аналогично получается и для матрицы А* • А. Поэтому мы имеем: А.А* =А* • А 4 4. Если матрица А неособенная, т. е D =/- 0, то в получившихся выше равенствах умножим обе части на число —, отнеся в левой части этот множитель кА*. Если обозначить А’ = — А*, то полученные равенства примут вид: А • А* = Е„, А’ • А = Еп. Это означает, что матрица А' является обратной для А: 199
4.5. Пример. Найдем обратную матрицу для /1 0 —1\ А = : 2 1 о , \3 i 1/ которая явлгется неособенной, поскольку det А — 2. Находим алгебраические дополнения: Л И — 1 > Л]2 — —2, Л)3 — — 1, А г] — —1, А 22 — 4, А13 — —1, Л з2 — 1, Л 32 — —2, Л зз — 1. Согласно формуле, полученной в 4.4, имеем: 4.6. Для неособенной квадратной матрицы А из соотношения А • Л’1 = Е на основании 4.2 получаем: det А det Л-1 = 1. Следовательно, det (Д-1) = (det .4)-*. 4.7. Формула для обратной матрицы может быть использована при решении системы линейных уравнений в случае, соответствую- щем теореме Крамера (II, 5.2). Непосредственно видно, что для системы anXj + ai2x2 + ... + а)пх, = Ьъ °гЛ + а22х2 + ... + = Ьг, о [X] + ап?х2 + ... + о-ппХп — Ь, числа а(, а2, ..., ая составляют ее решение тогда и только тогда, когда выполняется равенство А • Q = S, где Таким образом, наша система уравнений может быть записана в виде одного матричного уравнения А • X = S, где X — неизвестная искомая одностолбцевая матрица: 200
В случае» когда матрица А неособенная, единственным решени- ем этого матричного уравнения, очевидно, является одностолбцо- вая матрица X — Л-1 • S. Ее элементы и образуют решение на- шей системы. Они могут быть найдены в результате вычисления А"1 и умножения ее иа S. 4 8. Пример. Решим систему линейных уравнений Xi — Ху — 3, 2*! 4- х2 =11, 3xj + х2 -р х3 = 18. Матрица системы А была рассмотрена в 4.5. Она неособенная и имеет обратную А~\ найденную в 4.5. Находим произведение: Согласно 4.7 это означает, что решением нашей системы является (5, 1, 2).
Глава VJ. ПРЕОБРАЗОВАНИЯ § 1. Умножение преобразований 1.1. Понятие преобразования используется в самых различных областях математики. Идея этого понятия состоит в следующем. То, что элементы множества М преобразуются при помощи неко- торого преобразования, означает, что каждому элементу из М сопоставляется результат преобразования этого элемента, также являющийся элементом из М. Именно система результатов преобра- зования, а не тот процесс, при помощи которого они могут быть по- лучены, определяет каждое данное преобразование множества. Определение. Преобразованием множествам называется отображение множества М в себя (IV, 5.1). Таким образом, преобразование X множества М есть такой за- кон, согласно которому каждому элементу а £ М сопоставляется некоторый элемент того же множества, который обозначается через Ха и называется результатом преобразования X элемента а Как и при записи произвольных отображений, в указанном обо- значении часто ставят скобки: Х(а). Иногда знак преобразований пишут справа или в виде показателя степени: аХ, а' Совокупность всех преобразований множества М будем обозна- чать через Гм, Если ЛГ сА1,то через ХМ’ (или Х(/И')) обозначается множе- ство всех элементов вида Ха, где а £ М". 1.2. При меры- I) Пусть к— некоторое целое число- Умножение всех целых чисел на к можно рассматривать как некоторое преобразование множест- ва Л'. Если его обозначить через Xk, то будем иметь: Xft (0) = 0, X* (1) = k, Хк (2) = 2 ft и вообще Хд (о) = ка (а € X). Если обозначить множество всех четных целых чисел через N’, то Х2.У’ будет множество всех чисел, делящихся на 4; X0S = 0 для любою непустого $ с У; XiS = S. 2) Пусть / (х) есть вещественная функция, определенная на некотором мно- жестве вещественных чисел Е Если все значения этой функции в свою очередь принадлежат £, то функцию f (х) можно рассматривать как некоторое преобра- зование множества Е. Если же среди значений f (х) имеются числа, не принадле- 202
жащие Е, го соображение, осуществляемое этой функцией, преобразованием в смысле 1.1 не будет. 3) Если каждому элементу некоторого множества сопоставить один и тет же фиксированный элемент из этого множества, то получаем некоторое особенно просто устроенное преобразование этого множества. 4) Линейное отображение линейного пространства в себя (IV, 5.8 для слу- чая L’ — L) есть некоторое преобразование L. Хотя, конечно, далеко не всякое преобразование L будет линейным отображением L в себя. 1.3 Имея дело с преобразованиями, часто удобно бывает записи _.ать их в виде таблиц. Для преобразования X множества М таб- лица, изображающая X, представляет собой пару строк. В верхней выписаны все элементы из М. Во второй под каждым элементом а С М подписывается элемент а" == Ха, в который а преобразуется: Y __ (а b с ...\ \а' Ь' с' {а, Ь, с, .. } = М, а" = Ха, b" = Xb, с" = Хс, ... . Порядок записи элементов в верхней строке, очевидно, безраз- личен. Мы получим таблицу, изображающую го же самое преобразо- вание, если этот порядок изменим, но при этом соответственно из- меним расположение элементов и во второй строке. Фактически полностью выписать таблицу, изображающую пре- образование множества Л1, можно только для случая, когда М ко- нечно и обладает не слишком большим числом элементов. По в об- щих теоретических рассуждениях бывает удобно представлять себе таблицы, изображающие преобразования, и для бесконечных М. Указанные таблицы иногда называют подстановками (хотя тер- мину «подстановка» часто придают более узкий смысл). 14. Примеры. 1) Преобразование X множества (1, 2, 3}, согласно ко- 1 2 3 \ торому XI = 3, Х2 = 1. ХЗ = 2, можно изобразить в виде: Х= Ig । gl- _ v /2 1 3\ Также можно записать: X = 1 j 32)" 2) Преобразование X множес!на натуральных чисел, которое каждое не- четное число преобразует в 1, а каждое четное — в 2, изображается в виде: Y _ /1 2 3 4 . . . 2/1 — 1 2/1 ... \ л ~ П 2 1 2 . . . 1 2 . . . Г Также можно записать. /1 3 5 . . 2л — 1 ... 2 4 6 . . 2« ... Х=(------------------------2 1.5 При рассмотрении преобразований очень часто приходится осуществлять последовательно одно за другим несколько преобра- зований. При этом результат можно рассматривать как некоторое новое итоговое преобразование того же множества. 2СЗ
Определение. Пусть X, Y, Z 6 FM. Говорят, что пре- образование Z является произведением (или суперпозицией) преобра- зеваний X и У: Z = XY, если для любого а £М имеет место: X (Уа) = Za. Та, что для всяких X, Y Е FM произведение XY всегда сущест- вует, и притом единственное, видно непосредственно. Z = ХУ есть преобразование, определяемое форму пой, приведенной в опре- делении. Согласно этой формуле Za для любого а 6 М получается так. Сперва, применяя к а преобразование У, получаем элемент Ya. Затем к получившемуся элементу применяем преобразование X и получившийся элемент X (Ya) считаем результатом преобразова- ния Z = XY. 1.6. Пример. Для множества М = {1, 2, 3} рассмотрим преобразова- ния *=(;?!)• ^-(51?) и найдем XY, УХ, X2 (т. е. XX), Y2. Произведение vV_ fi 2 з\ а 2 31 ЛГ ~ U 1 2ДЗ 2 1) находим следующим образом. Берем элемент 1. Сперва Y преобразует его в'З. Получившийся элемент 3 преобразование X переводит ч 2 Таким образом: (ХУ)1 = X (У1) == Х3= 2. Аналогично (ХУ)2 = X (У2) = Х2 = I, (ХУ)3 = X (УЗ) = XI = 3. Мы получаем: хг=(>?3). Рассуждая таким же образом, находим: YXI = УЗ = 1, УХ2 = У1 = 3, УХЗ = У2 = 2. Следовательно, «-(lit). Аналогично находим X2, У2: у» _ /1 2 31 fl 2 31 _ fl 2 31 Л - (З 1 гЛз 1 2) ~ 12 3 1Д v4_ fl 2 31 /1 2 31 fl 2 31 r ~ V* 2 1ИЗ 2 \1 2 3j Обращаем особое внимание, что в нашем случае оказалось ХУ Ф YX 1.7. Уже на простом примере 1.6 мы можем убедиться, что дей- ствие умножения преобразований не является коммутативным. Однако второе важное свойство — ассоциативность имеет место. 204
Теорема. При любом М действие умножения преобразова- ний в FM ассоциативно: (ХУ) Z = X (YZ) (X, Y,Z£ Fm)- Доказательство. Возьмем произвольный элемент a(JA и обозначим- Za = а', Ya' = а", Ха" — а"*. Мы имеем согласно определению: [(ХУ) Z] а = (ХУ) (Za) = (ХУ) а' = X (Уа') = Ха" = а'", [X (У7)] a = X F(yZ) a] = X [У (Za)] = X (Ya') = Xa" = a"‘. To, что [(ХУ) Z] a = [X (YZ)] а, означает, что преобразования (ХУ) Z и X (YZ) оба одинаково преобразуют а, являющийся про- извольным элементом из М. Тем самым (ХУ) Z и X (YZ) есть одно и то же преобразование: (ХУ) Z = X (YZ). 1.8. Как всегда, при наличии свойства ассоциативности можно говорить о произведении нескольких множителей, не расставляя в таком произведении скобок. Говорят о степенях преобразований: Х2 = Х • X, Х8 = Х • X • X....ХП = Х • X ... -X, ... (X£FM). п 1.9 Тс, что в FM определено действие умножения, являющееся ассоциативным, позволяет согласно (Ч. VII, 2.2) говорить, что Fu является полугруппой относительно действия умножения. Это полугруппа всех преобразований множества М. Определение. Непустое множество Н преобразований множества М (Н a FM) называется полугруппой преобразований М, если оно замкнуто относительно действия умножения преобразо- ваний, т. е. если из X, У £ И всегда следует ХУ б Н. Тем самым полугруппа преобразований множества М — это такое множество преобразований М, которое относительно дей- ствия умножения преобразований является полугруппой. Таким образом, сама полугруппа FM и все ее подполугруппы (Ч. VII, 2 13) оказываются полугруппами преобразований множества М. 1.10 Полугруппа FM всегда некоммутативна, за исключением случая, когда М состоит из одного элемента. Действительно, пусть a, b € М (а^а Ь). Среди преобразований, входящих в FM, есть та- кое Са, что Сах = а при всех х 6 М, и такое Сь, что Cbx — b при всех х 6 М. Для них мы имеем при любом х: (СаСь) х = Ca(Cbx) = СаЬ — а, (СьСа) х = С 0(С ах)—С ьа = Ь, 1.11. Важно то, что полугруппа FM обладает нейтральным элемен-тем (иначе называемым единицей; Ч. VII, 1.8). Таксвым 205
является тождественное преобразование Е, которое каждый элемент х £ М преобразует в самого себя: E = (abc -Y \а b с ...) Из правила умножения преобразований непосредственно следу- ет, чго ЕХ = ХЕ - X для всякого X € FM- 1.12. Примеры. 1) Пусть а С Л1—некоторый фиксированный эле- мент множества М. Обозначим через На множество всех таких преобразова- ний X из FM, которые не меняют а, т. е. Ха — а Если X, Y С На, то (XY)a -= X (Га) = Ха = а, т. е. XY € На. Следовательно, На является полугруппой преобразований (подполугруппой FM). Иа можно рассматривать для любого а £ М. Пересечение их зсех, очевид- но, состоит лишь из одного тождественного преобразования: На = Е. а<М 2) Для множества, состоящего из двух элементов М—{а, Ь}, выясним результаты всевозможных перемножений элементов полугруппы Fм; Fsl со- стоит дз четырех элементов: Согласно правилу умножения преобразований получим: ЕЕ = Е, ES = S, ЕСа = Са, SE =-- S, SS = Е. SCa = Сэ. аЕ “ СЛ, CfiS — Са, СаСа = Са, C&F, = Cf,, CfrS = Сь, СьСа = 6^, EC/j Сь, SC/) — a CjCj Ca, СьСь = Cft. Укажем, что полученные результаты, как это часто делается при рассмот- рении различных действий, удобно записать в виде таблицы умножения: 1.13. При изучении полугрупп важную роль играют следующие специальные преобразования множества всех элементов полугруппы. Пусть Д — {а, Ь, с, ...} есть полугруппа. Для произвольного элемента t С Л определяем преобразование Tt, согласно которому Ttx = tx (х Л), т. е. Tta = ta, T,b = tb и т. д. Ж
Преобразование Tt называют левым сдвигом полугруппы А, произведенным элементом t. Отметим, что иногда возможно для некоторых tY =# (/ь /2 £ Л) совпадение производимых ими левых сдвигов: Tt, = Т,2. Однако если полугруппа А обладает нейтральным элементом е, то при 4 /2 обязательно имеет место Эго видно из того, что в этом случае: 7\е = tte — /1( Ttie = t2e = t2. Таким образом, в случае, когда полугруппа А обладает ней- тральным элементом, между ее элементами и ее левыми сдвигами имеет место взаимно однозначное соответствие. t - rt (i е а). Отметим, что аналогично понятию левого сдвига полугруппы определяется понятие правого сдзига, как такого преобразозания Т( полугруппы A (t £ А), при котором 7/Х — xt (х £ Л). Впрочем, в ближайшее время правые сдвиги нам не понадобятся. 1.14. Полугруппы преобразований не только важны сами по себе, но они связаны со всей общей теорией полугрупп. Можно сказать, что с точностью до изоморфизма всякая полугруппа может рассматриваться как некоторая полугруппа преобразований. Теорема. Всякая полугруппа изоморфна (Ч. VII, 4.2) неко- торой полугруппе преобразований. Доказательство. 1) Произвольную полугруппу А мож- но рассматривать как подполугруппу некоторой полугруппы, об- ладающей нейтральным элементом. Действительно, если полугруппа А сама не обладала нейтральным элементом, то рассмотрим мно- жество А", состоящее из всех элементов А и еще одного новою элемента е. Б А* определяем действие умножения, полагая ab = с (а, Ь, с £ Д), если ab = с выполнялось согласно правилу умножения в А. Кроме того, полагаем хе = ех — х для всякого х £ А'. Докажем ассоциативность действия в А". и — (ху)г, и = х (уг) (х, у, г £ Д') Если х, у, z все принадлежат к <4, то и = v благодаря ассоциа- тивности действия в А. Если хотя бы один из элементов х, у или z равен е, то,как легко видеть, и и и v равны произведению двух других элементов. 2) Пусть А' есть полугруппа с нейтральным элементом, в ко- торой заданная полугруппа А является подполугруппой. Способом, указанным в 1.13, устанавливаем взаимнооднознач- ное соответствие между А' и множеством всех ее левых сдвигов. 207
Пусть ab = с для элементов a, b, с С- А". Для соответствующих левых сдвигов имеем при любом х 6 А": (ТСТь) х = Та (Tbx) = Та (bx) = a (bx) — abx, Тсх = сх = abx, и, значит, Т аТь — Тс. Это означает, что наше соответствие является изоморфизмом между полугруппой Д’ и совокупностью ее левых сдвигов. Эта последняя является полугруппой преобразований. 3) Если 4' была отлична от А, то рассмотрим совокупношь всех левых сдвигов полугруппы А", соответствующих при рассмот- ренном выше изоморфизме элементам из А. Она образует полу- группу преобразований. Действительно; для a, b С А имеем ТаТ\ ~ Тс, где c=ab^A. Установленный для всей Д' изо- морфизм определяет изоморфизм между Д и полугруппой левых сдвигов полугруппы Д', соответствующих элементам из А. 1.15. Пример. Рассмотрим полугруппу А, являющуюся множеством трех чисел {1, —1, 0} с действием обычного умножения чисел. Поскольку А сама обладает нейтральным элементом, то конструкция 1.14 непосредственно определяет изоморфизм между А и полугруппой, состоящей из трех преобра- зований .множества {1, —1, DJ: 1^(1 -1ТП _!<-»( 1 —1 0\ /1 —1 ОХ 1 lj —1 о/ 1 (—1 1 оф и (о о оф § 2. Обратимые преобразования 2.1. Среди преобразований особую роль играют преобразова- ния, для которых существуют обратные преобразования. Определение. Для преобразования X множества М об ратным преобразованием, обозначаемым через X*1, называется такое преобразование множества М, что: XX-1 = Х-1Х = Е, где Е — тождественное преобразование М (1.11). Преобразование, для которого существует обратное преобразо- вание, называется обратимым. Совокупность всех обратимых преобразований множества М бу- дем обозначать через GM. 2.2. Определение 2.1 вполне соответствует естественному пони- манию термина «обратное преобразование». Действительно, если Ха = а’ (а, а* С М), то Х-1а' = X”1 (Ха) =(Х-1Х) а —- Еа =а. Так же если X-1 b = b’(b, b' С A<f), то ХУ = X (X- = = (XX-1) b = ЕЬ = Ь. 2.3. Пример. В множестве всех преобразований множества нату- ральных чисел 1У+ рассмотрим следующие преобразования: . _ /1 2 3 4 ... 2л — 1 2л . . - (2 1 4 3 . . . 2л 2л — 1 . . 208
л _(1 2 3 4 . . . п . . Л Аз \l I 2 3 . . . п — 1 . . J' Преобразование /Ij само для себя является обратным: 4|~1 = Л,, посколь- ку А। = Е. Действительно, для 2п — 1 (п = 1, 2, 3, ...) имеем- 4% (2п — 1) = Л, (Л, (2/t — 1)) = Л1 (2/1) = 2/1 — 1, и для 2п (п — 1, 2, 3, ...): А) (2п) = Л1 (Л^ (2л)) = Л, (2л — 1) = 2л. Для Л2 и Л3 имеем Л3Л2 = Е. Действительно, (Л3Ля)л = Л3 (Л2л) = Л3 (л + 1)= п. Однако отсюда нельзя заключить, что Л2 является обратным для Л3, а Л3 — обратным для Лг. На самом деле, ни Л2. нк Л3 не являются обратимыми. Действительно, каково бы ни было X € FN+ : (Л2Х)1 1, г.осксльку, обозна- чив X! = k, имеем (Л2Х)1 = Л2 (XI) = Л2й= А + 1 ¥= 1. Поэтому Л2Х =/ £. Также (ХЛ3) 1 = XI, (ХЛ3)2 = XI. Поэтому или (XЛ3) 1 1, или (ХЛ3)2 2, т. е. Х/3 --/= Е. 2.4. Теорема. Для того чтобы преобразование X множест- ва М было обратимым, необходимо и достаточно выполнения усло- вий: 1) X является взаимно однозначным отображением, т. е. для любых a, b М из а-Д= b следует Ха =£ Х1х, 2) X является отображением М на вес М, т. е. для любого s £ М существует as € М, такое, что Xas = s. Доказательство необходимости. Пусть для X существует обратное преобразование X-1. Если для некоторых a, b С М имеет место Ха = ХЬ, то Х~г (Ха) = Х~1 (ХЬ). Но X-’ (Ха) = Еа = а и X-1 (ХЬ) = Eb — b. Следовательно, Ха—ХЬ возможно лишь при а — Ь. В качестве искомого as для s £ М можно взя-ь X~ls. Действи- тельно, Xas = X (X-ls) = (XX -1) s = Es = s. Доказательство достаточности. Пусть X удо- влетворяет обоим указанным условиям. Рассмотрим преобразование X' 6 Fv, согласно которому для всякого s £ М имеет место X's — as, где as — некоторый элемент из М, такой, что Xas — s (такой элемент найдется согласно второ- му условию). Для любого s С М имеем: (XX') s = X (X's) = Ха, = 8- Поэтому XX' = Е. 209:~
С другой стороны, X (X'Xs) = (XX') (Xs) = Е (Xs) = Xs. Благодаря первому условию отсюда следует (Х'Х) s = s, т. с, Х'Х - Е. Следовательно, преобразование X" является для X обратным. 2.5, Если преобразование X G Fм записать в виде подстановки (1.3): у _ (а b с ...\ U Ь' с' ...)’ то условия обратимости из 2.4, очевидно, означают следующее. Согласно первому условию в нижней строке никакой элемент из М не должен встречаться более одного раза. Согласно второму усло- вию всякий элемент из М должен входить в нижнюю строку. Дру- гими словами, условие обратимости заключается в том, что нижняя строка подстановки состоит из всех элементов М, входящих в нее каждый лишь по одному разу. 2.6. Из сказанного в 2.2 следует, что для обратимого преоб- разования, записанного в виде подстановки у _ [а b с .... Л Ь' с" ...]* обратным преобразованием является: ^—i — I bf с" ..Л а b с . 2.7. Два условия, участвующие в 2.4, независимы в том смысле, что для тех или иных подстановок одно из них может оказаться выполненным, а другое — нет. Пример этому дают преобразования Л 2 и Л3, рассмотренные в 2.3. Если, однако, множество М конечно, то из выполнения од- ного из условий 2.4 вытекает выполнение и второго. Действительно, пусть количество элементов в множестве М равно п. Если в ниж- ней строке, изображающей нашу подстановку, ни один из эле- ментов не повторяется, то тем самым в этой строке, содержащей п элементов, должны встретиться все элементы из М, которых всего и есть п. С другой стороны, если в нижней строке встречаются все п элементов из М, то ни один из них не может входить туда более одного раза, поскольку эта строка состоит из п элементов. 2,8 Отметим некоторые простейшие свойства обратимых преоб- разований. 1) Обратимое преобразование обладает лишь единственным об- ратным преобразованием. Действительно, если X', X" б F м оба являются обратными для X 6 FM, то X' = Х'Е = X' (XX'-) = (Х'Х) X" = EX" = X". ?10
2) Тождественное преобразование Е обратимо и Е~1-* Е. Это следует из ЕЕ = Е. 3) Если X обратимо, то и Х~1 обратимо и (Х~1 = X. Действительно, выполнение XX-1 = Х~’Х = Е ио определению обратного преобразования означает, что X является для X-1 об- ратным преобразованием. 4) Если оба преобразования X, Y £ FM обратимы, то и их произведение XY является обратимым преобразованием, причем (ХГ)-1 = Y^X-1. Это следует из того, что: (ХУ) (У-’Х-1) = X (УУ-1) X-1 = ХЕХ-1 = XX-1 = Е, (У-^Х-1) (ХУ) = У-1 (Х-’Х) У = Y-lEY = у-*у = Е. 2.9. В связи с гем что для обратимых преобразований мы по- лучили свойства 2.8, естественно вспомнить общее понятие группы (Ч. VH, 2.3, 2.8). Теорема. Для любого множества М совокупность всех его обратимых преобразований GM, рассматриваемая относительно действия умножения преобразований, является группой. Доказательство. Благодаря 2.8 (4) умножение обрати- мых преобразований оказывается действием в GM, поскольку произ- ведение двух любых обратимых преобразований из GM определено и само принадлежит GM. Как мы уже видели раньше (1.7), это действие ассоциативно Согласно 2.8 (2) тождественное преобразование Е принадлежит к GM. Оно является в GM нейтральным элементом. Благодаря 2.8 (3) для каждого X 6 GM в GM имеется такой эле мент X-1 Е GMt который согласно определению обратного преобра- зования является для X обратным элементом. 2.10, Напомним, что всякое непустое подмножество группы, замкнутое относительно действия умножения и операции взятия обратного элемента, называется подгруппой данной группы (Ч. VII, 2.14). Легко видеть, что подгруппы, и только они, являются такими подмножествами группы, которые сами являются группами. 2.11. Определение. Непустое множество Н некоторых обратимых преобразований множества М (И о GM) называется группой преобразований М, если оно замкнуто относительно дей- ствия умножения преобразований и операции взятия обратного элемента, т. е. если из X, У (. Н всегда следует XY t Н и X-1 6 Н. Согласно 2.10 группами преобразования являются группы и всевозможные их подгруппы. Можно также сказать, что группа преобразований есть такое множество обратимых преобразований, которое является группой. Сами группы GM называют симметрическими. 2.12. Отметим, что согласно определению термин «группа пре образований» относится только к совокупностям обратимых преобра- 211
зований (так что точнее было бы говорить — группа обратимых преобразований). Поэтому, говоря о группе преобразований, часто даже не оговаривают, что входящие в нее преобразования предпола- гаются обратимыми. И это несмотря на то, что и некоторые полу- группы необратимых преобразований являются группами. 2.13. Примеры 1) Найдем всевозможные группы преобразований множества, состоящего из трех элементов. Так как природа этих элементов совершенно безразлична, то можно взять в качестве этих элементов натураль- ные числа: М — {1, 2, 3). Учитывая условие обратимости 2.4, легко видеть, что симметрическая груп- па ОЛ) в этом случае состоит из шести элементов: Сразу видно, что Р’1 = Q, /?,-1 = Ri (i — 1, 2, 3). Так как Е есть ней тральный элемент, то сразу обнаруживаются следующие подгруппы группы: 1) Е; 2) (Е, Р. Q}; 3) {Е, ЯД, {Е, /?Д, (Е, R3). Вместе с самой GM мы получаем шесть групп преобразований. Нетрудно убедиться, что других подгрупп наша группа Gv не имеет. Предположим, что И есть такая подгруппа. Н обязана содержать Е. В Н должен содержаться некоторый /?.. Для определенности будем считать, что /?, € И. Если сверх того и /?2 € И, то и € И. Но RtRi = (о \ j 1 == Р i б Н; тогда и Q = Р~1 € Н. Наконец, R2P = Q ' у1 ~ Рз € Следова- тельно, Н = 0м. Аналогично и для Rlt R2 € Н. 2.14. Группы обратимых преобразований играют в теории групп роль, аналогичную роли полугрупп преобразований в общей теории полугрупп. Теорема. Всякая группа изоморфна некоторой группе обратимых преобразований. Доказательство. Пусть G — произвольная группа. Методом 1.13 сопоставим каждому элементу а группы G преобразо- вание Та множества всех элементов самой группы б. Согласно 1.14 мы получим изоморфизм б с полугруппой И с Fg, состоящей из преобразований Та (а £ G). Покажем, что в данном случае Н оказывается группой преобразований. Для произвольного Та Е Н рассмотрим преобразование 7й-1, также содержащееся в Н. Перемножим эти преобразования. Для любого г Е б имеем: (Та 73-1) х = Та (Та^х) = Т^а-'х) = aa~'x = ех •= х, (Те-i Та) х = Te-i (Тах) = Ta-i (ах) — а~'ах = ех = х. 212
Это означает, что Ta-i является обратным преобразованием для Те Отсюда следует, что все преобразования из Н обратимы и что Н замкнуто относительно операции взятия обратного элемента. § 3. Линейные преобразования 3.1. Как теория полугрупп преобразований, так и теория групп преобразований существенно разделяются на два направления Одно посвящено изучению преобразований множеств, при котором природа и свойства элементов этих множеств не принимаются во внимание. Именно такой характер носили результаты предыдущих параграфов. Наравне с этим важную роль играет направление, посвященное преобразованиям множеств элементов, обладающих определенными связями и свойствами, связанными с их природой. При этом рассматриваются такие преобразования, которые преобра- зуют эти элементы согласно характеру их свойств и связей. Линейные пространства дают подходящий пример преобразуемых множеств второго типа. Для них соответственно рассматриваются преобразования, которые сохраняют связи между элементами линейных пространств, определяемые основными операциями в ли- нейных пространствах. 3.2. Определение. Преобразование X линейного простран- ства L над полем Р называется линейным, если для любых и, v L и К £ Р выполняется X (и + v) = Хи + Х&, X (М - X (Хи). Согласно IV, 5.8 линейное преобразование можно определить как линейное отображение линейного пространства в себя. Совокупное!ь всех линейных преобразований линейною прост- ранства L обозначим через Совокупность всех обратимых линейных преобразований пространства L обозначим через Gy'1. Согласно IV, 5.15 в множестве FaL} определены действие сложе- ния и умножение на числа из Р и относительно этих операций Fv> образует линейное пространство над Р. Что касается то следует иметь в виду, что уже сумма двух преобразований из GV’ может не принадлежать 6р. В качестве наиболее простых, но важных примеров линейных преобразований линейного пространства L укажем следующие: Е — тождественное преобразование L; OL — аннулирующее преобразование L, согласно которому OL(u) — 0L для любого и £ L; так называемая гомотетия Xg, соответствующая числу £ £ Р, согласно которой Х^ (и) = То. что во всех этих случаях оба условйя определения 3.2 вьг полнены, видно непосредственно. 213
3 3. Теорема. Совокупность Fl£ всех линейных преобразо- ваний пространства L является полугруппой преобразований. Доказательство. Пусть X, Y € F(‘} и Z — XY. Нам надо показать, что Z £ Др, т. с. что Z удовлетворяет двум усло- виям 3.2. Пользуясь тем, что X, Y € Др, получаем: Z (и + v) = X [Г (и + о)] - X (Yu + Yv)=X(Yu)+X(Yv)= =Zu + Zv, Z (Хи) = Х[У(Хи)] = X [X (Уи)] - X [X (Уи)] = X (Zu). 3.4. Нетрудно видеть, что множество Др (3.2), рассматриваемое относительно всех действий: сложения, умножения на числа из Р и умножения, — оказывается линейной алгеброй над Р (IV, 9.2). 3.5. Лемма Для всякого X £ Др имеет место Х8Л = 8L. Если к тому же X £ G^>, то для всякого u =£ 9L (u € L) имеет место Хи 9L. Доказательство. 1)Х0 = Х(ОЭ,) = O(X9L) = 0л. 2) Пусть X 6 Gp и и 0L. Благодаря 2.4 из и Д= 0L следует Хи X0L = 0L. 3.6. Теорема. Совокупность GP всех обратимых линейных преобразований пространства L является группой преобразований. Доказательство. Пусть X, Y С G'f’ и Z = ХУ. Соглас- но 3.3 преобразование Z линейно и согласно 2.8 (4) оно обратимо Следовательно, Z б. Gp, Покажем, что для всякого X 6 Gp имеет место X-1 6 Gp, откуда и будег следовать, что Gp является группой. Для произвольных и, v £ L рассмотрим элемент: w = Х-’ (и + V} + (-1) Х-’и + (-1) X~lv. Преобразуем его с помощью X, используя то, что X линейно: Xw = XX-1 (и + и) 4- (—1) ХХ~1и + (-1) XX-1 v = (и + и) + + (-1) и + (-1) v = eL. Так как X С Gp. то согласно 3.5 отсюда следует w = 0£. Из 6L = X-1 (и + о) -j- (—1) Х-1и + (—1) Х-1о пслучаем: Х~‘(и + и) = Х-‘и + Х-Ч’. Сходным образом для и С L и X С Р имеем: да* =- X-1 (Хи) + (—1)ХХ-’и, Xw* = Хи + (—1)Хи = Поэтому w" = 0L и, следозателыю, X-1 (Хи) = X (Х-Ч/). Таким образом, X-1 € Ср. 214
3,7. Если линейное пространство обладает базисом, то зада- ние и изучение линейных преобразований этого пространства суще- ственно облегчается тем, что достаточно задать, как преобразуются при данном преобразовании элементы выбранного базиса. Теорема. Пусть U = {Uj, «8, ..., и,} есть базис линейного пространства L над полем Р; uj, и2, и'п — произвольная последовательность элементов из L. Тогда существует и притом единственное линейное преобразование X линейного пространства L, при котором: Хих — щ, Хи2 = и2, ..., Хип = и„. Доказательство. Всякий элемент о £ L может быть выражен единственным образом линейно через базис U’ V = XjHj 4- ХаМа 4- ... + ХвЫл. Полагаем: Xv = XjU] -j- Хги2 + ... h Алил. Легко видеть, что X (vt 4- v2) — Xvx 4- Xv2 и X (Xv) = A (Xo). Следовательно, построенное преобразование X является линейным. При этом согласно способу его задания Хщ — lit {i — 1, 2. п). Для всякого линейного преобразования для которого Yut = — щ (i = 1, 2, ..., л), мы благодаря свойствам линейности имеем: у и = Y (Mut 4" Х2и2 4- 4- Xau!t) = XxY их 4~ Х2Уи2 4* ... 4~ 4' — ^lMi + ^2U2 "Ь \tUn ~ %v- Следовательно, Y совпадает с X. 3.8. Теорема 3.7 устанавливает взаимно однозначнее соответ- ствие между всеми линейными преобразованиями линейного про- странства L, имеющего ранг, равный п, и последовательностями, состоящими из л элементов пространства L: X (u;, и', .... ип), где и[ = Хиь и2 = Хи2, ..., u't = Хип. 3.9. Элементы и) = Хих, и2 = Хи2, .... ип = Хип можно выразить линейно через элементы исходного базиса U: «; = «и«1 + а12и, 4- ... 4- ainun, ы2 = aaiui + ами2 4- ... 4- а2ч«л. < = + - + ап.ип- Определение. Матрица линейного выражения элементов Хих, Хи2, ...» Хип через элементы uXi и2, ..., ил базиса U аца12 ••• О1П aZLa?2 ••• а2п а .а ~ а,. nl п2 ДИ(Х) = 2L5
называется матрицей линейного преобразования X в базисе U (или относительно базиса U). Заданием матрицы линейного преобразования определяется в соответствии с 3,7 и само преобразование. 3.10. Для различных линейных преобразований их матрицы относительно одного и того же базиса, очевидно, различны. Так как всякая квадратная матрица порядка п над полем Р является матри- цей линейного выражения некоторых п элементов из L через U (IV, 2.3), то согласно 3.7, 3.8, 3.9 между всеми линейными преобра- зованиями L и квадратными матрицами порядка п над Р уоанавли- вается взаимно однозначное соответствие: х - лдх) (х е я/>). Легко видеть, что это соответствие согласуется с IV, 5.16. 3.11. Матрица Ли(Х) линейного преобразования X определяет преобразование X и хорошо характеризует различные его свойства. Теорема. Если матрица Аа(Х) неособенная, то линейное преобразование X обратимо. Если матрица Аа(Х) особенная, то линейное преобразование X необратимо. Доказательство. 1) Пусть матрица Аа(Х) неосо- бенная. Согласно IV, 2.11 элементы и' = Хи1г и'2 = Хи2, ..., и,. = Хи линейно независимы. Так как количество их есть п, то согласно IV, 1.9 они образуют базис линейного пространства L. Благодаря 3.7 существует линейное преобразование X', для которого Х'и\ = «!, Х'и'2 = и2, ..., Х'и'п = ип. Для двух произведений линейных преобразований X и X' по- лучаем: (Х'Х) и, = X' (Хи) = х*«; = и,., (XX') и) = X (Х'и) = Хи,. = и) (i = 1, 2, .... п). Так как Eui = и,, Еи\ = и., тс благодаря 3.7: Х'Х = Е, XX' = Е. Это означает, что преобразование X' обратно по отношению к X, и потому X обратимо. 2) Пусть матрица АЙ(Х) особенная. Согласно IV, 2 11 элементы и\, u'v ...» и’п линейно зависимы. Если бы преобразование X было обратимо, то для обратного к нему преобразования X-1 мы имели бы: Х~'и‘ = и1г X~lu2 = и2, .... Х~^и'п — ип. Но это невозможно, поскольку из линейной зави- симости и\, и2, .... и'п следует, что и Х-1и), Х-1^, .... Х-1и, линейно зависимы. 216
3.12. То, как преобразуются элементы из £ б результате ли- нейного преобразования X, заданного при помощи матрицы Аи(Х), удобно описать при помощи матричного умножения. Каждый элемент v £ L задается в координатной форме отно- сительно U, т. е. при помощи коэффициентов линейного выражения v через U: v = + c2u2 + ... 4- спип (сп cs, .... сп е Л. ® = (₽i, с,...с„) £ Vp. Так же и для преобразованного элемента Xv — v": v* = Ci (XuJ + c2 (Xu2) + ... 4- cn(Xun) = = c;«, + c'u2 + ... + c'nun, “° = (Cl, C’2, ..., Cn) £ Vp°. Подставив вместо Xw, (i — 1, 2, ..., n) их линейные выражения через «1, u2, ..., ufi, получаем: у' = Cj (fluUj 4- a12u2 + ... + a\nun) + + c2 (fl21Uj -Ь'а22иг + ... -j- 4- 4- cn (aniut 4- ai2«2 4- ... 4- anaun) = — (tT'3n + c2a21 4* ••• 4- c,tan}) u-i 4- 4- (ci°i2 + c2a22 + ... 4* cnUn2) u2 4- 4- (C|atI 4- сга2п 4- ... 4- cnann) un. Следовательно, < = ctan 4- c2a21 4- ••• 4- c,<znl, c2 = CjO12 4- с.ла22 4- ... 4- cnan2, C'n — c>airt + С2а-гч + ... 4- caw. Но эти равенства означают выполнение следующего равенства для соответствующих матриц: (0^1^12 ••• 0|п \ «21^22 - а2п j Я 1Л / Таким образом, для и и о* — Xv, заданных в координатной ферме- v, v‘ £ имеем: ЛИ(Х). 217.
При этом следует иметь в виду, что согласно V, 2.12, если для некоторой квадратной матрицы S порядка п при всяком v имеет место ё’ = v S, то обязательно S = Да (Л). 3.13. Устанавливая соответствие между линейными ппеобразо- ваниями конечномерного линейного пространства L и матрицами, мы все время считали фиксированным некоторый базис U — {ut> .... и J этого пространства. Но ведь в L существует не один ба. зис. Естественно выяснить, как изменится указанное соответствие при изменении базиса. Пусть в L заданы два базиса: U = {«1, «2....“J. w {Wt, tt>t, .... wj. Исходя из U линейному преобразованию X сопоставляется матрица Аа (X); исходя из W — сопоставляется матрица Att(X). Выясним связь между этими матрицами. 3.14. Обозначим через Т матрицу линейного выражения W через U. Так как элементы wlt wt, ...,wn линейно независимы, то согласно IV, 2.11 матрица Т неособенная. Поэтому для нее существует обратная матрица Г’1. ' Теорема. Л.ДХ) = Т Аа(Х) • т-1. Доказательство. Произвольному элементу и £ L при помощи базиса U сопоставляется вектор v ** 0 = (q, с2...сп) и при помощи 1" вектор о «-* » = №. №» .... dn). Так же и для преобразованного элемента: V‘ = Xv ~ V' = (с;, с'2, .... с',), vf = Хи v' = ld\, dv ..., Д). Согласно V, 2.13: ё = V • Г, 5- = V* Т. Согласно 3.12 "О' и v связаны соотношением: V' = v • Аа (X). Подставляя сюда выражения для v и о' через v и 0', получаем: v‘ • Т - ©'• Т • АИ(Х). Отсюда в' = v • Т • Аи(Х) Т-1. 248
Так как это равенство выполняется для вектора ©, изображающе- го произвольный элемент из L, то согласно 3.12 это означает, что Т Аи (X) • Т-1 есть матрица линейного преобразования X отно- сительно базиса W: Aw (Х) = Т • Аа (X) • Т~\ 3.15. В предыдущих рассуждениях мы использовали, исходя из некоторого базиса, представление элементов линейного простран- ства в виде однострочных матриц: v ** v (v $ L, о E Vfn)). Разу- меется, можно изображать элементы в виде одностолбцоиых мат- риц. Согласно понятию транспонирования матриц (V, 3 10) эго оз- начает переход к транспонированным матрицам: Благодаря свойству транспонирования V, 3.10 основное ра- венство, полученное в 3.12, преобразуется для транспонированных матриц в следующее равенство1 ©'* = ЛИ(Х)* • Ф*. Матрица ЛЬ(Х)*, транспонированная по отношению к матри- це Л„(Х) (3.9), Л„(Х)* ^11 Я-21 ••• И @22 @ 12 CJlrt &2п • •• в такой же мере, как и сама матрица Л„(Х), может быть использо- вана для того, чтобы характеризовать линейное преобразование X. Иногда именно матрицу Аи (X)* (а не саму <4„(Х)) берут в качестве основной характеристики линейного преобразования X и назы- вают матрицей линейного преобразования X. В некоторых случаях, как мы вскоре увидим, это действительно оказывается удобнее. Мы будем называть матрицу Л„(Х)* транспонированной матрицей линейного преобразования X. 3.16. Матрицы ЛИ(Х) и Аи(Х)* очевидным простым способом определяю! друг друга. Благодаря 3.10 для линейного пространства L над Р, имеющего ранг п, устанавливается взаимно однозначное соответствие между всеми его линейными преобразованиями и транспонированными матрицами линейного преобразования: X - Аи(ХУ (X £ Гд’). 3.17. Матрицы мы рассматоиваем относительно их сложения (V, 1.3), умножения на числа (V, 1.5) и умножения (V, 2.2). Тогда 219
соответствия, указанные в З.Ю и 3.16, оказываются обладающими следующими важными свойствами. Пусть U — {м1( п2, .... ип} есть базис линейного пространства L над полем Р; X и Y — линейные преобразования L с матрицами АЦ(Х) и Аи(У). Имеют место соотношения: Аи(Х + У) = АДХ) + AJY), А^Х) = X АДХ) (л € Р), АДХ • Y) = Аа(У) • АДХ). Действительно, имеем: (X + Y) и, = Xut + Yut (i — 1, 2, ..., и). Согласно V, 1.4 матрицей линейного преобразования X + Y в базисе U является АДХ) + Alt(Y). Аналогично доказывается второе равенство. Обозначим произвольный (г, /)-элемент матрицы АДУ) через Ьч. Имеем: ХУ (at) = X (Ун,) = X (ЬцИх + bi2U2 + ... + binUt) — — Ьц (ХиД -j- bi2 (Хи2) 4- ... + bin (Хиа) (i = 1, 2, ..., п). Следовательно, элементы (ХУ) ult (ХУ) и2, ..., (ХУ) ип линейно выражаются через Хих, Хи2, .... Хип с матрицей линейного выра- жения АДУ). В свою очередь Xult Хи2, .... Хип линейно выражают- ся через их, и2, .. , ип с матрицей линейного выражения АДХ). Согласно V, 2.1 получаем: АДХ • У) — АДУ) • АДХ). Таким образом, взаимно однозначное соответствие х - АДХ) (X $ pH оказывается изоморфизмом линейного пространства Fl’ линейных преобразований пространства L (3.2) и линейного пространства квадратных матриц порядка п над Р (V, 1.9). Однако оно не будет изоморфизмом относительно умножения. Используя свойства транспонирования матриц (V, 3.10), получа- ем: АДХ+ У)* = АДХ)* Ъ АДУ)*, АДХХ)* = X • АДХ)* (X € Р), АДХ • У)* = АДХ)* АДУ)*. Взаимно однозначное соответствие X - АДХ)* (X € F?), как и предыдущее соответствие, оказывается изоморфизмом линей- ных пространств. Очень существенно то, что это соответствие ока- зывается также изоморфизмом мультипликативной полугруппы Fl (3.3) и мультипликативной полугруппы квадратных матриц порядка п над Р (V, 2.11). Тем самым установленное взаимно однозначное соответствие ока- зывается изоморфизмом между линейной алгеброй линейных пре- 220
образований пространства L размерности п над Р и линейной алгеб- рой квадратных матриц порядка п над Р. 3.18. Теорема. Группа Gap всех обратимых линейных преобразований линейного пространства L над Р, имеющего ранг п, изоморфна группе всех неособенных квадратных матриц порядка п над Р. Доказательство. Рассмотренное в 3.16 соответствие для всего множества А/’ определяет собой соответствие и для его подмножества G[z\ Согласно 3.11 если X £Gl\ то матрица ЛИ(Х) неособенная, а потому неособенной будет и ЛИ(Х)*. При этом и, обратно, из неособенное™ Аи(Х}*, что равносильно неособенное™ Аи(Х), следует, что X обратимо. Благодаря этому рассмотренное в 3.16 соответствие для всего множества Fl} определяет собой взаимно однозначное соответствие между G£Z) и множеством всех неособенных квадратных матриц порядка п над Р: X - Аи(ХГ (X б GT). Так как эго соответствие обладало свойством изоморфизма относительно умножения для всего множества F'l (3.17), то это свойство сохранится и для его подмножества. Отсюда следует справедливость доказываемого утверждения. 3.19. Пример. В координатном линейном пространстве У^1 рассмот- рим линейные преобразования X, Y, Z, заданные относительно главного ба- зиса = (1, 0), ег = (0, 1) своими матрицами: Д (X) = (}’ -2), А (У) = (J «), A (Z) = (-] J). Для преобразования X имеем: Xet для произвольною (а, о) € выпол- няется X (а, Ь) = а (Хер + * (Хе£) = = (а b, Ъ — 2а). Поскольку матрица Л (X) неособен- ная, преобразование X обратимо. С геометрической точки зрения всякое преобразование пространства У‘^' можно рассматривать как пре- образование пространства геометри- ческих секторов на плоскости с фик- сированной прямоугольной декарто- вой системой координат и в равной степени как преобразование множест- ва точек этой плоскости (1, 2.4). В этом случае преобразование X каж- дую точку плоскости с координата- ми (а Ь) преобразует в точку с ко- ординатами b-2aY Под дейст вием преобразования Л всякая фигура S на плоскости преобразуется в неко- торую новую фигуру X(S) (рис. 9). Рис. 9 221
Для преобразования У, очевидно, имеем: У (а, Ь) = (а, 0) ((а, Ь) 6 У^*1. Поэтому У можно рассматривать как ортогональное проектирование всех точек плоскости на ось Ох При всяком (a, b) € У^ имеем. Z (а, Ь) — (—а 4-6, 2а — 2Ь). Нетруд- но убедиться в том, что образы всех точек плоскости при преобразовании Z составляют прямую, проходящую через начало координат и через точку с ко- ординатами (—1, 2). 3.20. При изучении линейных преобразозаний евклидовых пространств естественный интерес вызывает рассмотрение таких линейных преобразований, которые сохраняют скалярное произ- ведение элементов. Определение. Линейное преобразование X евклидова про- странства L (IVt 6.2) называется ортогональным преобразованием L, если для любых и, v k L скалярное произведение (Хи, Xv) совпадает со скалярным произведением (и, и): (Хи, Хи) = (и, о), т. е. если оно сохраняет скалярные произведения. Сразу отметим, что всякое ортогональное преобразование взаим- но однозначно. Действительно, если Хи — 0£ (и С £), то (и, и) = (Хи, Хи)--0 и согласно IV, 6.2 а — 9д. Следовательно, ядро преобразования X состоит из одного нулевого элемента и, значит, X взаимно однознач- но (IV, 5.13). Таким образом, отрогональное преобразование X евклидова пространства L является изоморфизмом L на X(L) cz L. Если L имеет конечную размерность, то подпространство X ([.), имея ту же размерность, что и L, совпадает с L. 3.21. Пример. Рассмотрим евклидово пространство геометрических векторов на плоскость с фиксированной декартовой прямоугольной системой координат (IV, 6.2). Его можно трактовать как координатное евклидово про- странство И?’ (IV, 6.5). Фиксируем какое-нибудь вещественное число а. Преобразование X, пере- водящее всякий вектор и, заданный нарой (а, Ь} € Уд* в вектор Хи, определя- емый парой вещественных чисел а' = a cos u — b sin а, Ь' = a sin а 4- b cos а, очевидно, является линейным. Оно соответствует повороту всех точек плоско- сти вокруг начала координат на угол а. Это преобразование сказывается орто- гональным. Действительно, для и = (а, 6), -о = (с, d) ( У)^: (Хи, Xv) = (а cos а — & sin а) (с cos а — d sin а) 4- (а sin а 4- b cos а) (с sin а 4- а cos а) = ас (eos2a 4- sin1 а) 4* bd (sin* а 4~ cos’ о) — ас 4* 4- М = (и, v). 3. 22. Теорема. Пусть U — (и,, иг. ..., ип) — некоторый ортонормированный базис евклидова пространства L\ X —линейное 222
преобразование L, имеющее в данном базисе матрицу Аи(Х) (3.9). Преобразование X будет ортогональным тогда и только тогда, когда матрица ЛИ(Х) ортогональна (V,3.11) Доказательство. 1) Пусть X ортогонально. Из того что U — оргонормированная система, согласно 3.20 следует, что и Хии Хи2, ..., Хи» должны образовывать ортонормирозанную систему. Из самого определения матрицы Аи(Х) (3.9) видно, что это означает выполнение условия из V, 3.14 и матрица Лл(Х) ока- зывается ортогональной. 2) Пусть матрица ЛЦ(Х) ортогональна. Для произвольных элементов из L и — cqUi + а2и2 + ... + апи„, v = 0xuL + 0ги2 + ... + 0пи.;, благодаря IV, 7.10 имеем, (u, v) + а202 + ... + а,(0л. Согласно определению матрицы Ли(Х) имеем: (Xuz> Xu;) =s = ааа?1 + а12а,г 4- ... 4- ain ajn. Ввиду ортогональности ЛЙ(Х) эта сумма равна 1 при i — j и равна нулю при i /. Благодаря этому ввиду IV, 6.4 получаем: Хи -= a, (XuJ + а2 (Хи2) + ... + а„ (Хи„), Xv = 0, (XuJ + 02 (Xu2) + ... + 0„ (Xu„), (Xu, Хи) = 1.а,0у (Xu;, Хи}) = аД + а202 + ... + а„0л = (и, о). i.i § 4. Автоморфизмы 4.1. Понятие изоморфизма встречалось в предшествующем из- ложении не раз. Сперва мы имели дело с изоморфизмами множеств относительно некоторых алгебраических действий (Ч. VII, 4.1, 4.2) или систем действий (Ч. VII, 4.7, 4.8). Затем появились изо- морфизмы относительно бинарных отношений, заданных в мно- жествах (Ч. VII, 6.11). Тогда же мы обратили внимание на воз- можность рассмотрения изоморфизмов сложных систем, когда в множестве одновременно задано некоторое количество действий и отношений. Вводя понятие линейного пространства, мы вскоре естественно пришли к понятию изоморфизма линейных пространств (IV, 4 5). В каждом из этих случаев термин «изоморфизм» отражал одну и ту же идею. Рассматривались некие образования, представляющие собой системы, состоящие из множеств, между элементами кото- рых были установлены некоторые соотношения и связи. Изоморфиз- мом между двумя такими системами называется взаимно однознач- ное соответствие между их множествами, при котором соотношения и связи между элементами сохранялись, т. е. всегда когда в одном из множеств некоторые элементы связаны рассматриваемым спо- собом, то и соо гветствующие им элементы второго множества также должны быть связаны таким же способом. 223
Каждый раз, сталкиваясь с тем или иным видом изоморфизма, мы разъясняли смысл и значение этого понятия. Если отвлечься от конкретной природы изоморфных систем и обращать внимание только на систему связей между их элементами, то изоморфные системы можно считать вполне одинаковыми с точки зрения ука- занных связей. 4.2. При изучении алгебраических систем интерес представляют не только изоморфизмы между различными системами, но и изомор- физмы системы с самой собой. Каждому изоморфизму, как было показано в IV, 5.5, 5.G, соот- ветствует изоморфное отображение. Изоморфное отображение алгебраической системы на себя есть обратимое преобразование множества всех элементов этой системы, определяющее изоморфизм. Оно называется автоморфным отобра- жением (впрочем, этот термин в настоящее время выходит из упо- требления) или просто автоморфизмом системы. 4.3. Конечно, всякая система обладает автоморфизмами. Имен по, всегда существует тождественный автоморфизм <р, при кото- ром фх — х для всех элементов х данной системы. 4.4. Указанный выше тождественный автоморфизм мало инте- ресен. Чрезвычайно важным является то, что, помимо тождествен- ного автоморфизма, часто существуют еще и иные, нетождественные автоморфизмы. Наличие некоторого нетождественного автомор- физма можно рассматривать как некую симметрию системы. Дей- ствительно, автоморфизм сопоставляет всяким элементам системы некоторые элементы этой же системы, которые удовлетворяют всем тем же связям и соотношениям, что и исходные элементы. Между исходными элементами и соответствующими им при автоморфизме элементами (а в совокупности и те и другие составляют множество всех элементов рассматриваемой системы) существуют одни и те же связи. Это и соответствует идее симметричности рассматриваемой системы. Поэтому вообще вполне можно было бы отождествить по- нятия автоморфизма и симметрии различных систем. 4.5. Примеры. 1) Множество Q' всех отличных от нуля рациональных чисел будем рассматривать относительно действия обычного умножения. Преобразование X, согласно которому Ха = — для каждого а С О', а очевидно, является обратимым (взаимно однозначное отображение Q' на себя). При этом для любых а, О, с С Q' из а • h = с следует — • — = — и наоборот а о с Это и означает, что X язляется автоморфизмом. В этом смысле Q', рассматрива- емое относительно действия умножения, как бы симметрично относительно соответствия в «♦ — (а € <?'). а 2) Множество всех целых чисел N рассмотрим относительно отношения сравнения чисел по величине. Преобразование Xk. rjifi k — любое фиксирован- ное число из N, согласно которому Х^а — k 4- а (а € ^), очевидно, является 224
взаимно однозначным отображением V на себя, т. е. обратимым преобразова- нием V. При этом из а < Ъ следует k + а < k + Ь, т. е. Xka < Xkb. Так же и наоборот. Следовательно, преобразование Л* является автоморфизмом. Однако Хк при k #= 0 уже нельзя считать автоморфизмом, если рассматри- вать в N не только отношение сравнения по величине, нс еще и действие сло- жение. Действительно, 1 + ! = 2, но ХИ + Хь1 -/= Хк2, поскольку Хк\ = = k + 1, Х^2 = й + 2 и (k + 1) + (k 4* 1) =/= k + 2. 4.6. Пусть М есть множество, в котором задано некоторое действие (Ч, VII, 1.3). Согласно Ч. VII, 4.2, 4.3 и тому, что было сказано выше, автоморфизм М есть такое обратимее преобразование X, при котором для всяких а * t> = с (a, b, с £ М) имеет место (Ха) \ (ХЬ) = Хс Напоминаем, что согласно отмеченному в Ч. VII, 4.3 при выполнении указанного условия автоматически выполняется то, что из (Ха) * (ХЬ) = Хс всегда следует а * Ь — с. Если в М задано несколько действий, то обратимое преобра- зование X будет называться автоморфизмом такой системы, если оно является автоморфизмом относительно каждого из рассматри- ваемых действий. Совокупность всех автоморфизмов множества Л1 будем обозна- чать через А - Ам рассматриваем как подмножество GM (2.1). 4.7. Польза от рассмотрения автоморфизмов той или иной системы обычно бывает связана с тем, что набор всех автоморфиз- мов Ам сам рассматривается как некоторая алгебраическая сис- тема. Теорема. Пусть в множестве М заданы несколько дей- ствий. Множество Ам всех его автоморфизмов является группой относительно действия умножения преобразований (т. е. 4М есть подгруппа группы GM). Доказательство. Пусть X, Y € Ам и знак * соответ- ствует одному из действий нашей системы М. Так как X, Y 6 Ам с GM, то XY, Х~> ^GM. Если а * Ь = с (a, b, с £ .44), то (ХУ) с = X (Yc) — X(Y(a*b))= = X (Ya * Yb) = X (Ya) * X (Yb) - (XY) a * (XY) b. Так как зто имеет место относительно всякого действия из числа действий, рассматриваемых в Л4, то мы получаем XY £ Ам. Обозначим (X-1 а) * (Х_,6) = с‘. Так как X 6 А м, то Хс — = X ((X-1 а) * (X~'b)) = (XX-1 а) * (XX~lb) = а * Ь = с. Из с" — X-1 с получаем (Х-1а) * (Х-16) = Х-1с, т. е.Х-1бАд1 . Так как Ам есть подмножестве группы GM, то из доказанного следует, что само Ам является группой. 4.8. Пусть Q есть группа, для которой, как обычно, будем упо- треблять мультипликативную запись. Среди различных автоморфизмов группы G особого внимания заслуживают так называемые внутренние автоморфизмы. Для 8 Заказ 653 225
произвольного элемента g 6 G внутренним автоморфизмом группы G, порождаемым элементом g, называется следующее преобразова- ние группы G: Wg(x) = g-1 xg (х € G). Тс, что преобразование Wg взаимно однозначно и отображает G на всю G, проверяется без труда. Легко убедиться и в справедли- вости соотношения: (Wgx) (Wgy) — (ху). Совокупность всех внутренних автоморфизмов группы, как нетрудно проверить, является группой (подгруппой группы Ам). 4.9. П р и м е р. В группе неособенных квадратных матриц второго по- рядка (V, 3.8) рассмотрим внутренний автоморфизм, порождаемый матрицей g = з). Вычислим, в какую матрицу преобразует этот автоморфизм Wg (— 3 2\ матрицу х = ^_15 8) Легко находим: g-1 = (g Имеем: Wgx = g'-xg = _ ( 3 — П (- 3 2\ /2 Ц _ /2 0\ - 5 2) ‘ 15 8) ‘ \5 3/ — \0 3) • Отметим, что по свойству автомопфизма для любого натурального п вы- полняется: Wg (хп) = (IV7^х)п. Поэ-ому хп = х)п = Wg-1 (W'gX)'1 = g (Wgx)ag"1 = _ /2 1\ /2 0\n ( 3 —1\ _ (2 1\ I2n 0 \ / 3 —1\ ~ \5 3) ‘(.0 3) ‘ 5 2) ~ \5 3) ‘ \0 3") ‘ (—5 2p Это позволяет без труда вычислить различные степени матрицы х Полу- чить тот же результат путем последовательного умножения матрицы х на са му себя было бы довольно громоздко. С помощью же полученной формулы это делается без труда. Например, /_ 3 2\« (2 0\« V—15 8/ ~ ‘ \0 з) ‘ /2 1\ /64 0 \ ( 3 — П = /- 3261 1330', “ 1,5 3) ’ \ 0 729/ ‘ 5 2) ~ 9975 4054/ 4.10. При изучении числовых полей (да и полей общего типа) рсссмотренне их автоморфизмов оказывается одним из основных методов исследования. Пусть Р есть некоторое числовое поле. Рассматриваем его как множество с двумя действиями — сложением и умножением. Со- ответственно выделению этих действий определяется группа его автоморфизмов Ар (4.6). Покажем, что автоморфизмы из А/- являются автоморфизмами и относительно обратных операций. Это означает, что для всякого А е лр-. X (а—Ь) = Ха- ХЬ, Х|'-| = \ с ) (о, Ь, с Е Р; с 0). Ха Хс Так как а = (а — Ь) А- Ь, то Ха = X (а — Ъ) + ХЬ, т. е. X (а — Ь) = Ха - ХЬ. 226
Отсюда следует ХО = X (1 — 1) = (XI) — (XI) = 0. Поэтому при с 0 имеем Хс ¥= О (X — взаимно однозначное отображение). Так как а — — - с, то Ха = X (— 'j • Хс, т. е. X —. с \с , \с / Хс 4.11. Отметим также важное обстоятельство, что для любого рационального числа | имеем X | = Е при всяком автоморфизме X поля Р (напоминаем, что Q с: Р согласно Ч.VI,3.3). Действительно, для любого с б Р, с=У 0, имеем 1 = —, и потому С согласно 4.10 XI = — = 1. Хс Но отсюда следует: Хп = X (1 + 1 + ... + 1) = XI + XI + ... -г XI = = 1 + 1 + ... + 1 = Я (Л € (V+). п Поэтому для любого — € Q+ (р, q 6 (V+) согласно 4.10 я Х{р\ = хр_ = — \ Я I Хя я' Как мы уже показали в 4.10, имеет место Х0 = 0. Поэтому и для —— С Q~ (р, q € Х+) имеем. Я Х|—^Л = х/'о— -Д-Л = хо — хИ = о— \ я) \ я 1 \я / я я 4.12. Примеры. 1) Пусть УЧ означает арифметическое значение этого корня. Совокупность Q СК2) всех чисел вида а + b У 2 (a, b С Q) как было показано в Ч. VI. 2 9, является полем. Найдем группу автоморфизмов А этого поля. Для любого автоморфизма X £ А согласно 4.11 из (УЧ)2 = 2 следует (ХУ/2р=2. Следовательно, могут иметь место лишь две возможности: X К2'= У 2 или X /2= -У 2. Первый случай соответствует тождественному автоморфизму Е, поскольку из X Уч — У 2 следует; X (а + b УЧ) = Ха 4- ХЬ • X У 2 = а + b Уч = Е (а + b У 2). Второй случай осуществляется автоморфизмом Z, при котором Z (а + t> У Ч) = а — b УЧ. То, что такое преобразование Z является обратимым, видно сразу. Для двух произвольных чисел а( + 5, у 2 и а2 (- bt Уч из нашего поля имеем: 2 «а; + Ь, УЧ) + (а2 + Ь3 УЧ)) = Z ((а, + а2) + (Ь, + 62) УЧ) = = (<h + <h) - (*1 + *2) Уч =(в1 - Ьг УЧ) к (а3 - ьг УЧ) = Z (ъ+^УЧ) + + Z (аа + 62 УЧ), 227 8Т
2 ((a, 4 by 1Л2) • (a2 + b2 V2)) — Z ((<jjfl2 + 2bAb2) + (а2Ь2 + а2Ь2) Г 2) — = (axa2 + 2fr,t2) — (“1*2 + a2*i) V2 = (“i — *i V 2) (a2—*2 У2) = = Z(a,+ bi /2) • Z(a2+ b2 /2). Это и доказывает, что Z € А. Легко видеть, что всякий автоморфизм Y € А, у которого Y У 2 = —У''2, совпадает с Z: Y (а + b /2) = Ya + Yb • Y /2 = а + b (—/2) = а — b }' 2 = Z (a + b /2). Таким образом группа автоморфизмов нашего поля состоит из двух эле- ментов £ и Z, которые перемножаются по правилу: ЕЕ = Е, EZ — ZE = Z, ZZ = E 2) Пусть V 2 означает арифметическое значение этого корня. Рассмотрим поле, являющееся расширением поля Q при помощи числа У2 (Ч. VI, 3.10). Числами, принадлежащими этому полю, являются числа вида с, + *i У 2 + с. у'Д I = —------------- т— (“р *1, ₽!. в4, b„ сг е Q). t?2 Н- ^2 г Ч" То, что запись числа в таком виде не единственна, для нас сейчас не суще- ственно. Для произвольного автоморфизма X нашего поля из (jz2 )3 = 2 следует (.¥ f' 2 )3 = 2. Но два значения корня У2, отличные от арифметического, не являются вещественными Они не содержатся в нашем поле. Поэтому должно з _________________ з г__ иметь место X । 2 = । 2. Отсюда рассуждением, аналогичным проведенному в первом примере, получаем Х£ = с для любого числа | из нашего поля. Оказалось, что рассматриваемое поле не имеет никаких автоморфизмов, за исключением тождественного. 4.13. Идея автоморфизма, как изоморфного отображения па се- бя, очевидным образом распространяете я и на другие области ма- тематики, имеющие дело с образованиями различной, в тем числе и весьма сложной, природы. И в таких случаях мы приходим к груп- пе автоморфизмов. Укажем в связи с этим на книгу советского математика Б. И. Плоткина «Группы автоморфизмов алгебраических систем» (изд. «Наука», М., 196S), содержащую обширный материал, посвя- щенный этому направлению 4 14. Для линейного пространства L над полем Р автоморфиз- мом в согласии со сказанным выше будет линейное обратимое преобразование. Группой автоморфизмов является группа (У1 (3.2, 3.6). Кстати напомним, что в случае конечномерного линей- ного пространства эта группа оказывается изоморфной группе неособенных квадратных матриц над Р (3.18). 4.15. Вводя понятие автоморфизма для систем самого общего вида (4.2, 4.4), мы обратили внимание на то, что это понятие от- 228
ражает идею симметрии систем. Понятие симметрии наиболее зна- комо и привычно в связи с геометрическими идеями и построения- ми. Легко убедиться, что геометрическую симметрию, действитель- но, вполне можно рассматривать как наличие соответствующего автоморфизма некоторой системы. Возьмем обычную евклидову плоскость (совершенно аналогич- ны рассуждения и для трехмерного евклидова пространства). Ее можно рассматривать как множество всех ее точек, между кото- рыми рассматриваются связи, состоящие в том, что для каждой пары точек определено расстояние, т. е. сопоставлено некоторое неотрицательное вещественное число. На вопросе о свойствах этого сопоставления мы можем сейчас не останавливаться. Согласно сказанному выше автоморфизмом всей плоскости, рассматриваемой как система указанного вида, следует назвать взаимно однозначное отображение множества всех точек плоскости на себя (т. е. обратимое преобразование), при котором сохранятся расстояния. Это значит, что для любых двух точек и М.2, рас- стояние между которыми обозначим через d (ML, (И2), при преоб- разовании X, являющимся авгомоэфизмом, должно иметь место d (ХМг, ХМ2) = d М2). Определенный таким образом азтоморфизм есть не что иное, как преобразование плоскости, называемое движением. Здесь надо иметь в виду, что тем самым под движением понимается не только преобразование, соответствующее чисто механическому движению, но и зеркальное отражение плоскости относительно некоторой пря- мой. Оно является движением в указанном смысле, но не может быть осуществлено путем постепенного перемещения плоскости так, чтобы каждая точка перешла в отражаемую точку (симметричную относительно взятой прямой). Такое широкое понимание движения весьма удобно и часто употребляется. То, что для любой пары точек плоскости существует движение (автоморфизм), переводящее одну из них в другую, характеризует плоскость с точки зрения ее полной симметричности, полного «рав- ноправия» всех ее точек. 4.16. Намеченный подход оказывается особенно полезным при изучении свойств симметрии фигур на плоскости и в пространстве. Пусть на плоскости Р задана некоторая фигура S, т. е. под- множество S ст Р. Те движения плоскости Р, которые сохраняют рассматриваемую фигуру, т. е. переводят ее в себя, можно назвать автоморфизмами плоскости с выделенной фигурой, или, как чаще всего в этом случае говорят, самосов.неимениями этой фигуры. На- личие таких автоморфизмов-самосовмещений характеризует сте- пень симметричности фигуры. 4.17. Пример. Рассмотрим на плоскости равносторонний треуголь- ник S', г — длина его стороны. Каждая из его вершин А, В, С является такой точкой, для которой в S найдутся точки, находящиеся от нее на расстоянии г (две другие вершины S). Никакие другие точки из S, очевидно, таким свойст- 229
гем не обладают. Отсюда следует, что при всяком движении плоскости, сохра- няющем S, вершины S должны перемещаться друг в друга. 1о, во что переходят три течки А, В, С при движении, вполне определяет все движение, поскольку каждая точка D должна при движении X перейти в точку XD, расстояния от которой до ХА, ХВ, ХС таковы, как и расстояния ог Г> до А, В, С. Но такая точка XD на< плоскости только единственная Мы- слимы лишь такие движения плоскости, являющиеся самосов мешения ми S, при которых вершины треугольника S переходят друг в друга одним из сле- дующих шести способов: что все шесть таких движений действительно существуют, легко про- исходя из геометрических соображений. Движение YL есть поворот всей плоскости вокрут точки О (центр треуголь- 2 ника S) по направлению движения часовой стрелки на угол —л; У2 — то же, 3 Тс, верить, 4 на угол —л; ZB есть 3 зеркальное отображение плоскости отнесигельно прямой, проходящей че- рез точки В и середину стороны АС (рис. 10). Ана- логично определяются ZA и Zc. Е есть тривиаль- Рис. 10. ное, «.вырожденное» движение, при котором все точки остаю"ся на месте. В результате проведенного оассуждеиия мы мо- жем говорить о группе самосовмещений треуголь ника S, состоящей из шести элементов, или, что то же самое, о группе автоморфизмов плоскости с выделенным на ней треугольником S. Наличие шести указанных автоморфизмов рав- ностороннего треугольника S характеризует сте- пень симметричности этой фигуры. Если бы мы взяли треугольник S' равнобед- ренный, но не являющийся равносторонним, то, как легко убедиться, для него, помимо тривиаль- ного тождественного движения, нашлось бы лишь одно движение плоскости, сохраняющее S' (отра- жение относительно прямой, проходящей через вершину и середину противоположной стороны, отличной по длине от двух других равных между собой по длине сторон). Группа самосовмещений- автоморфизмов для S' состоит из двух элементов. Меньшее количество автоморфизмов в этом случае соответствует меньшей симметричности фи- гуры S' по сравнению с S. Если, наконец, взять треугольник S', у кото- рого все три стороны различны по длине, то, как легко убедиться, кроме тождественного движения, вообще не существует движений плоскости, пере- водящих S" в себе. В этом смысте S" вовсе не обладает нетривиальным автоморфизмом, что со- ответствует полному отсутствию симметрии у этой фигуры. 4.18. Рассуждения, сходные с теми, ко- торые были проведены в 4.17, могут быть 236
осуществлены и для других фигур как на плоскости, так и в прост- ранстве. Сопоставление каждой такой фигуре группы всех ее само- совмещений-автоморфизмов определяет многие важные ее свойства, в первую очередь степень и характер ее симметричности. В кристаллографии выявление различных симметрий кристалло- графических систем играет фундаментальную роль при изучении их свойств и в деле их классификации. Для развития теории кристаллических структур чрезвычайно важным оказалось выявление всех групп, которые являются груп- пами автоморфизмов тех или иных кристаллических структур. Это было осуществлено русским ученым Е. С. Федоровым (1853—1919). 4.19. В некоторых вопросах бывает полезно обобщить понятие автоморфизма до некоторого более общего понятия. Основой для этого является понятие гомоморфизма, относящееся к общим ал- гебраическим системам. Оно относится к понятию изоморфизма, как понятие общего линейного отображения (IV, 5.8) откосится к понятию изоморфного отображения линейных пространств (IV, 4.5, 5.6). Сохраняется основное свойство изоморфизма, требую- щее сохранения отношения между элементами, ко происходит отказ от требования взаимной однозначности. 4.20. Определение. Пусть в множестве .М задано дейст- вие и в множестве М’ задано действие. Отображение ц> множества Л1 в множество М' называется гомоморфным относительно этих дейст- вий или просто гомоморфизмом, если для любых х,у С М в М' имеет место-. ф (* * у) = (<р х) * (ф у). Можно говорить в очевидном смысле и о гомоморфизме для двух систем с несколькими действиями. Гомоморфизм ф, осуществляющий взаимно однозначное отобра- жение М на все ЛГ, есть не что иное, как изоморфизм. Понятие гомоморфизма играет большую роль в различных об- ластях алгебры. 4.21. Пусчь ф есть гомоморфизм множества с действием М на все множество с действием М' (фЛ4 = М'). Нетрудно убедиться, что если в М выполняется какое-либо из основных свойств дейст- вий: ассоциативность, коммутативность, обратимость, то соответст- вующее свойство будет выполнено и в ЛГ. Тем самым, если Л1 — полугруппа, то и М' = фЛ4 будет полу группой; если М — группа, то и М'~ фЛТ будет группой. 4.22. Пример ы. 1) Множества всех комплексных чисел Z и всех не- отрицательных вещественных чисел будем рассматривать относительно дей ствия обычного умножения. Ф — отображение Z, согласно которому каждому числу г € Z сопоставля- ется его модуль q>Z — |г |, по известному свойству модулей комплексных чисел оказывается гомоморфизмом первой полугруппы на вторую. 2) Важная теорема V, 4.2 означает не что иное, как то, что сопоставление квадратным матрицам порядка п их определителей является гомоморфизмом мультипликативной полугруппы квадратных матриц порядка п в мультипли- кативную полугруппу чисел. 231
4.23. Подобно тому, как на основе понятия изоморфизма стро- ится понятие автоморфизма, исходя из понятия гомоморфизма при- ходим к понятию эндоморфизма. Пусть в множестве М задано действие. Отображение <р в себя, т. е. преобразование Л1, называется эндоморфизмом, если оно яв- ляется гомоморфизмом. 4.24. Произведение эндоморфизмов множества М само является эндоморфизмом М. Действительно, пусть S и S' — эндоморфизмы иду- произ- вольные элемен1ы рассматриваемого множества М. Так как SS' (х* у)= S(S” (х * у)) = S ((S’x) * (S'у)} =• S (S'%) * S (S'y) = = (SS’) x * (SS') у, то SS” также оказывается эндоморфизмом. Отсюда следует, что совокупность всех эндоморфизмов, рас- сматриваемая относительно действия умножения преобразований, является полугруппой. 4.25. Пример ы. Множество всех вещественных чисел R будем рас- сматривать относительно обычного умножении Рассмотрим его преобразования X, Y, 7, согласно которым Ха = д2г Ya = а + 1, Та = 1 (если а > 0), Та — —1 (если а < 0), 70 — 0. Легко убедиться, что X и Т являются эндоморфизмами, но Y не является. § 5. Инвариантные подмножества 5.1. При рассмотрении тех или иных преобразований различных множеств особую роль играют те подмножества и отдельные эле- менты, которые «сохраняются» при этих преобразованиях. Определение. Подмножество М1 множества М назы- вается инвариантным относительно преобразования X множества Л1, если при любом а £ М' имеет место Ха С М'. Если Н есть некоторая совокупность преобразований множест- ва М, то М‘, инвариантное относительно всех преобразований из Н, называют инвариантным относительно Н. В частности, если ЛГ состоит из одного элемента, то он назы- вается инвариантным элементом. Часто инвариантный элемент называют неподвижной точкой. Само множество М, конечно, нсегда является своим инвариант- ным подмножеством. Однако обычно, говоря об инвариантных под- множествах, имеют в виду только собственные подмножества, при- чем часто этого даже не оговаривают. Разумеется, только в таком смысле можно говорить об отсутствии инвариантных подмножеств у какого либо множества относительно некоторого преобразования. Из самого определения следует, что если М' инвариантно от- носительно некоторой совокупности преобразований Н, то оно инвариантно и относительно всякого подмножества Н‘ cz Н. 232
52. Примеры. 1) За исключением самого М никакое подмножество М не является инвариантным относительно совокупности всех преобразований множества М. 2) Если подмножества М' и М'' оба инвариантны относительно преобра- зования X, то инвариантными будут М' (J М" и М’ f| М". 3) Пусть трехмерное евклидово пространство повернуто вокруг некоторой прямой на некоторый угол. Относительно этого преобразования сама ось вра- щения и каждая ее точка будут инвариантны. Так же инвариантной будет вся- кая плоскость, перпендикулярная оси вращения. 4) Для всех поеобразоааний Ак {k — 1, 2, 3, ...) множества всехцелых чисел N, согласно которым Ага = ак (а € /V), числа 0 и 1, очевидно, являются инвариантными элементами. Других инвариантных элементов для совокупно- сти всех этих преобразований, очевидно, нет; N+ есть инвариантное подмноже- ство для всех преобразований Ак\ N~ будет инвариантным множеством лишь для тех Ak, у которых k нечетное. 5.3. Пусть М' есть непустое подмножество множества М, инвариантное относительно преобразования X множества М. Каждому элементу а £ М‘ сопоставим элемент Ха, который тоже принадлежит М‘. Таким образом, X определяет преобразование множества М'\ Обозначим его через X'. По определению: Х'а = Ха для всякого а С М‘. Преобразования X' и X различны, поскольку они действуют на разных множествах (если М' Ф М). Говорят, что X' есть ограничение (сужение) преобразования X на множество М'. В свою очередь преобразование X называют продолжением (распространением) X' на множество М. Впрочем, нередко позво- ляют себе говорить, что X' есть то же самое преобразование X, но только рассматриваемое (или ограниченное) на множестве М' 5.4. Пусть X — обратимое преобразование конечного множе- ства М. Возьмем некоторый элемент аг С М. Рассмотрим элементы Ха} — аг, Ха2 = а3, ... .В виду конечности XI мы рано или поздно должны получить Ха„, — as (т > s). Пусть m — наименьшее из таких чисел. Если бы s > 1, то мы имели бы Хат = as и а... Так как X обратимо, ю это означает а.п = т. е. X am-! — о что противоречит выбору т. Следовательно, на самом деле s = 1. Мы получили некоторый «цикл» различных между собой элемен- тов Пр а2, ..., ат 6, М: Хах = «2, Хс., = а3.....= Ха,., Хат = аг. Множество {а1( аг, .... ат} сказывается инвариантным подмножест- вом М относительно X. Отметим, что последовательная нумерация элементов в пост- роенном множестве носит «циклический характер». Ее можно на- чать с любого ак : ак, ak+l, ..., а,„, ак, а2, .... ак-р, Xat. = ак+\, Хак+\ = аь+2, ..., Хат = а1( Хп1=а2, ..., Xak-\ =аЛ. Дополнение построенного инвариантного подмножества: Л4\ {я,, а2, ..., а.,} также будет инвариантно, поскольку благо- даря обратимости X равенство ХЬ = ак невозможно ни для ка- кого Ь i {нь о2, ..., а„). 233
Возьмем какой-нибудь элемент Ьг из М \ {ап о2, .... ат} и для него аналогичным образом построим цикл {Ьь Ь2, bt}- Xb, = ft2, Xb2 = Ь3, ..., ХЬ^ = blt Xbt = bx. Продолжая так далее, разбиваем все М па попарно неиересекаю- щкеся подмножества, инвариантные относительно X: -^1 — \а11> а12> •••> М2 = {а.л, а22.......а1Р2}, М. = foi. .........flsoj, м = Mi и м2 и ... и м,. Здесь Xatj = a.il+1), если j < р, и Ха<р = ап. Как легко видеть, всевозможными подмножествами М, инва- риантными относительно X, являются различные объединения: Л1,-, и Мл и ... и м.е Преобразованиями, для которых не существуют собственные ин- вариантные подмножества, являются преобразования, состоящие из одного цикла. Такие преобразования устроены очень просто. Все элементы множества М занумерованы некоторым образом: М = {оу, я2, ..., а,„}, и имеет место. Хак = а4+1 (й — 1,2, .... т — 1) и Хат = ах. Задание разбиения М на попарно непеоесекающиеся подмножест- ва с последовательной нумерацией элементов в каждом из них (носящей указанный циклический характер) вполне определяет преобразование X. При этом любое такое разбиение и нумерация определяют некоторое преобразование. Элементы Л1, входящие в цикл указанного вида, имеющий дли- ну 1, являются инвариантными элементами относительно данного преобразования В теории конечных обратимых подстановок принято обозначать само преобразование X при помощи указания описанных циклов. X ~ (йц, Я12> •••> alpJ (а21> а22, .... а2рг) ... (asl> •••» asps). Если при этом само УИ было указано, то циклы длины 1 обычно опускают в записи. 5.5. Пример. Для множества М ={1,2,3} группа GM состоит из шее ти преобразований (см. 2.13). Указанным в 5.4 способом их можно записать в виде циклов, связанных с их инвариантными подмножествами, следующим образом: Е = (1) (2) -3), Р = (1, 2, 3). Q = (1, 3, 2) /?,= (!) (2 3) = (2,3), R3 = (1, 3) (2) = (1, 3), /?3 = (1. 2) (3) = (1, 2). 5.5. После тождественного преобразования наиболее просто ус- троенным можно считать преобразование, состоящее из одного не- 234
тривиальногогэ цикла длины два; ТсЬ = (а, Ь). Такие преобразо- вания называются транспозициями. 5.7, Для преобразования, состоящего из одного нетривиального икла, как легко проверить, выполняется равенство: X = (<31( й2, .... йп) = Тап_{ап • Тйп_2ап • ... • Таап ‘ Та\ап- Благодаря этому из 5.4 вытекает, что всякое обратимое преоб- разование конечного множества (обратимая подстановка) может быть представлено в виде произведения транспозиций. 5.8. Такое представление возможно не единственным образом. При этом интересно отметить, что если одно из таких разложений содержит четкое число транспозиций, то и всякое другое разложение этого преобразования будет состоять тоже из четного числа транс- позиций. Мы не будем останавливаться на доказательстве этого утверждения, так как оно нам в дальнейшем не потребуется. 5.9. В 4.8 упоминались преобразования группы, называемые внутренними автоморфизмами. В связи с этими преобразованиями и со сказанным в 5.1 естественно появляется следующее понятие, Определение. Подгруппа Н группы G называется инва- риантной (или нормальной, или нормальным делителем), если Н инвариантна относительно всех внутренних автоморфизмов груп- пы G. 5.10. Определение 5.9 означает, что подгруппа Н группы G будет инвариантной, если при любом g EG выполняется g-1//gcr//. Нетрудно убедиться, что на самом деле в этом случае выпол- няется равенство g~lHg = Н. Действительно, каждый элемент х ЕН можно представить ввидех = g~'gxg~',g Eg~'Hg (учитывая, 4iogxg-1 = (g-1) lx(g ~l)E E (g-1)-1// (g-1) с H). Но тогда H c g~4ig, и потомуg-1//g = H. Во всех разделах теории групп понятие и свойства инвариант- ных подгрупп играют исключительно важную роль. 5.11. П р и м е р. В группе См для М = {1,2, 3}, рассмотренной в 2.13, как было показано, существует шесть подгрупп. Сама GM, подгруппа, состоя- щая чз одного единичного элемента Е, и подгруппа (Е, Р У) являются ин- вариантными подгруппами. Три другие подгруппы {Е, /?,} (i = 1, 2, 3} не инвариантны. В этом легко убедиться, исходя непосредстзенно из определения, хотя рассуждения можно еще упростить, используя некоторые дополнитель- ные, почти очевидные соображения. 5.12. В 1.13 мы определили преобразования Tt и Т'г в множест- ве элементов произвольной полугруппы А, которые назвали левыми и правыми сдвигами. В общей теории полугрупп важную роль играют подмножества, инвариантные относительно этих преобра- зований. Если непустое подмножество полугруппы А инвариантно отно- сительно всех левых сдвигов, то оно называется левым идеалом полугруппы. Если оно инвариантно относительно всех правых 235
сдвигов, то оно называется правым идеалом. Подмножество, являю- щееся одновременно и левым и правым идеалом, называется дву- сторонним идеалом. Таким образом, непустое подмножество U полугруппы А есть ее левый идеал, если ах Е U для всяких а £ А пх^Ь'; оно есть пра- вый идеал, если ха £ U; двусторонний идеал, если ах, ха £U. 5.13. Несколько странный на первый взгляд термин «идеал» связан с историей возникновения этого понятия. Впервые оно воз- никло в связи с присоединением к системе чисел некоторых новых дополнительных элементов, которые называли идеальными числами. В теории полугрупп рассмотрение идеалов играет важную роль. Одним из первых получил ряд результатов, относящихся к идеалам полугрупп, советский математик А. К. Сушкевич (1889—1961). 5.14. В 4.10 и 4 11 мы говорили о важной роли, которую играют автоморфизмы при изучении полей. При этом большее внимание уделяется инвариантным подмножествам полей относительно тех или иных автоморфизмов. Для произвольного подполя Р' поля Р обозначим через И (Р‘) совокупность тех автоморфизмов поля Р. относительно которых каж- дое число из Р' является инвариантным элементом. Покажем, что Н (Д') есть подгруппа группы Ар всех автомор- физмов поля Р. Пусть X, Y Е Д (Р') и & — произвольнее число из Р'. Мы имеем: (ХГ) § = X (У£) = Х| = £. Поэтому XY Е Н (P'Y Так как £ = Х"*ХН и X? = 1, ю в = X-1 в. Л Поэтому Х~* Е Д (Д'). Таким образом, каждому подполю Р' поля Р сопоставляется подгруппа Д (Д') группы Ар. В частности, для Q, являющегося, как известно, подполем вся- кого числового поля, благодаря 4 11 имеем И (<?) = Ар. Из самого определения Д (Д') непосредственно вытекает сле- дующее свойство рассматриваемого соответствия Если для под- полен поля Р имеет место Рг а Р2, го для соответствующих групп выполняется обратное включение Д (PL) р Д (Р2). 5.15. В свою очередь для каждой подгруппы В группы Ар всех автоморфизмов поля Р можно рассмотреть подмножество S (В) поля Р, состоящее из тех чисел, которые являются инвариантными элементами относительно всех автоморфизмов из В. Покажем, что $ (В) есть подполе поля Р. Прежде всего отметим, что согласно 4 11 S (В) дт Q Пусть В, т] Е 5 (В). Тогда, учитывая 4.11, имеем для каждого X Е В. X а + л) = xg + XII = в + п, X (В - п) = XI - Хп = 5 - п. х (В • м2 = Х£ • XI] = в • Г|, X 1 = ? = ~ (при п °)- \ 1 / Ар I] ж
Поэтому S (В) оказывается замкнутым относительно всех че- тырех арифметических действий, т. е. является полем. Таким образом, каждой подгруппе В группы автоморфизмов Ар сопоставляется подполе S (В) поля Р. Если для подгрупп группы Ар имеет место Вг с В2, то, как следует из самого определения соответствия, для соответствующих подполей выполняется обратное включение: S (BJ зэ 3 (В2). 5.16. Соответствия между подполями поля и подгруппами группы его автоморфизмов, указанные в 5.14 и 5.15, оказываются очень важными при изучении свойств полей. В некоторых важных случаях оба эти соответствия совпадают (т. е. для И (Р') имеет место В (Н (Р')) — Р' и для В (В) имеет место Н (В (В)) = В) и оказываются взаимно однозначным соответствием между сово- купностью всех подполей числового поля Р и совокупностью всех подгрупп группы автоморфизмов Ар. Изучение этого соответствия лежит в основе теории Галуа, в которой, в частности, выясняется вопрос о возможности выраже- ния корней полинома через его коэффициенты при помощи арифме- тических действий и операции извлечения корней разных степе- ней (Ч. VI, § 5). § 6. Инвариантные подпространства линейных пространств 6.1. Особенно важную роль понятие инвариантного подмноже- ства играет в теории линейных преобразований линейных прост- ранств. При этом главное внимание обращается на инвариантные подпространства. Это отчасти объясняется следующим. Пусть М есть инвариантное подмножество линейного пространства L отно- сительно линейного преобразования X. Тогда линейная оболочка М множества М (IV, 3.4) будет инвариантным подпространство^ относительно X. Действительно, произвольный элемент и из М согласно IV, 3.5 имеет вид: « = + Z2u2 4- ... 4- Х„ип, где vlt v2, .... v„ £ M. Так как преобразование X линейно, то Хи = 1, (Xvt) + Х2 (Av2) + ... + Х„(Хи„). Из инвариантности М следует, что Xvt £ М (i = I, 2, ..., zi). Поэтому Хи С М. Это доказывает инвариантность М. Непосредственно видно, что пересечение и сумма инвариант- ных подпространств являются инвариантными подпространствами. Нулевой элемент 0Лннвариантен относительно всякого линей- ного преобразования. Для линейного преобразования А' образ L, т. е. A (L) (IV, 5.11), есть инвариантное подпространство, поскольку A (Xu) С А (£) 237
для произвольного элемента Хи множества X (L) (и £ L). Также инвариантно и ядро преобразования Кх (IV, 5.11), поскольку Хи — 0,6 /<х ДЛЯ ВСЯКОГО и с Ху. 6.2. Примеры, 1) Для rt-мерного комплексного векторного координат- ного пространства ^'рассмотрим преобразование Xk (0 k л), согласно которому Хк 0»i. °2..вл) = (ОЛК^Л), щ, аа,.... а„.к). к Легко видеть, что X* при любом k линейно. Подмножество состоящее из всех элементов вида (О, 0.О, сь са, ..., ся_т), является линей- т ным подпространством И"', инвариантным относительно всех преобразоза ний Хк. 2) Относительно преобразования Хс (£ £ Н), согласно которому Х-и — — для любого элемента и произвольного линейного пространства L над Р, всякое подпространство линейного пространства L, очевидно, язлиется инва- риантным. 3) Относительно преобразования Yv (v € £), согласно которому Yvu = = и 4- v для любого элемента и линейного пространства L, всякое подпро- странство L', содержащее v, очевидно, будет инваоиантным. Если же подпро- странство L' не содержит и, то оно не будет инвариантным относительно Yv. Действительно, 0 € L', но Yv 0 = 6 + v = v £ L'. 6.3. Пусть у линейного пространства L, имеющего ранг, рав- ный п, подпространство L' с рангом г, где 0 < г < п, является инвариантным относительно линейного преобразования X. Возьмем какой-либо базис ult и2, .... иг подпространства L'. Согласно IV, 1.9 его можно дополнить до базиса всего пространст- ва L: ut, и2, .... иг, иг+1, .... и„. Из того, что L' инвариантно, следует, что при преобразовании элементов указанного базиса при помощи преобразования X эле- менты «!, и2, ..., иг будут преобразовываться в элементы, при- надлежащие L', а потому выражающиеся линейно через и2,... ..., иг: Xiti = unul 4~ ai2u2 + ... + а1гиг, Хи2 — a2liii + а22и2 4- ... 4" <^ггиг, Хиг — аг1и1 4" af2«2 + ... 4- яггиг, Xun — ••• H- ^4 (r+i>“r+i4" ••• 4"anrun. 236
। аким образом, матрица преобразования X в выбранном базисе имеет вид: «л Й21 #12 ° 22 "1Г ° 2г О О О О А (X) = «н «гг •агг 0... О a(r+l)l а(г-Ц) 2 ••• tt<r+l)r а(г+1) (г+1) ••• О(г+1)л \ап1 СП2 ••• апг йп(, + 1) •••апп Правый верхний прямоугольник, состоящий из г строк и п—г столбцов, целиком заполнен нулями. Матрицу такого вида назы- вают полу распавшейся. Часто з схематической форме полураспаз- шуюся матрицу записывают в виде: А' О А" А'" где А' — квадратная матрица порядка г, А'"— квадратная матри- ца порядка п—г, А" есть (и — г, г) матрица и О означает нуле- вую (г, п — г)-матрицу. Транспонированную матрицу к такой матрице также называют полураспавшейся. Необходимо иметь в виду, что указанный вид матрицы линейно- го преобразования приобретают лишь при подходящем выборе ба- зиса. 6.4. Существенно то, что по отношению к 6.3 веоно и обратное утверждение. Пусть матрица А(Х) линейного преобразования X некоторого конечномерного линейного пространства L относитель- но некоторого базиса ut, и2, ..., ип является полураспавшейся: Л(Л) -(л-Л-) где порядки квадратных матриц А' и А'" равны соответственно t и п—г. Тогда в L имеется инвариантное подпространство ранга г. Этим подпространством будет линейная оболочка элементов alt иг, ..., иг. Действительно, согласно виду матрицы Д(Х) ХиЛ (k = 1, 2, ..., г) выражается линейно через и,, и2, ..., иг. Отсюда вытекает, что Хы для любого w из указанной линейной оболочки принадлежит эпято ей. Если в полураспавшейся матрице линейного преобразования X пулевой угол расположен слева внизу то инвариантным подпространством будет линейная оболочка по- следних в отношении нумерации элементов базиса. Соответствующие рассуждения, очевидно, вполне аналогичны предыдущим. 6.5. Пример В трехмерном координатном пространстве V'O) рассмот- рим преобразование X, которот произвольный элемент и = (а^, а3, л3) преобра- зует в элемент Ха — («ц + а2 + а3, а3, а2). 239
Нетрудно убедиться, что преобразование X линейно. Относительно базиса Е, состоящего из et= (1, 0, 0), е2 = (0, 1, 0) е3 = (0, 0, 1), это преобразоза- ние имеет матрицу: /1 0 0\ А (X) = 1 0 1 \1 1 о/ Эта матрица является полураспавшейся: Ае (X)= О 0\ сП ' 1 О/ Такой вид матрицы преобразования X соответствует тому, что линейная оболочка элемента et, т. е. подпространство, состоящее из элементов вида (щ, 0, 0), является инвариантным. Нетрудно убедиться, что в пространстве V<3> базис будут образовывать и элементы — (1, 1, 1), И, — (1, 1, 2), и3 = (2, —1, 1). Наше линейное пре- образование X преобразует их следующим образом: Х«! = (3, 1, 1), Хи2 = (4, 2, 1), Х«3 = (2, 1, —1). В указанном базисе U матрицей преобразования X будет матрица Аи (X) = 5 4 _2\ ~ 3 3 L 2. ~ з з _8_ 1_ 3 3 / Она не имеет вида полураспавшейся матрицы. Разумеется, это не проти- воречит рассуждениям, проведенным в 6.3 и 6.4. Ведь наличие инвариантных подпространств делает матрицу полураспавшейся только при соответствующем выборе базиса в линейном пространстве. 6.6. При надлежащем выборе базиса матрица линейного преобра- зования приобретает особенно простой вид в том случае, когда ко- нечномерное линейное пространство разлагается в прямую сумму (IV, 3.11) нескольких своих подпространств, которые являются инвариантными относительно рассматриваемого линейного преобра- зования. Пусть L = Li + L2 + ... + Lm, где сумма прямая, а все подпространства L, (i — 1, 2, ..., tn) инвариантны относительно линейного преобразования X. Пусть ип, ил, ..., и1г. есть некоторый базис подпространства L (t = 1,2, ..., tn). Тогда, как легко вытекает из IV, 3.14, совокупность всех Ujj будет базисом L. Благодаря инвариантности L. всякий uiJt будучи преобразован преобразованием X, преобразуется в элемент, выражающийся линейно через ип, ил, .... ulfj. Отсюда 240
следует, что матрица Д(Х) преобразования X в рассматриваемом базисе будет иметь вид: /IXd)' А (X) = \0 л(т) где Л0’ означает квадратную матрицу порядка r; (i =1, 2, m), а повсюду вне клеток Л(,) расположены нули. Матрицу такого вида называют распавшейся или клеточко-диаго- нальной. Отметим, что каждая диагональная клетка Л(,) является матри- цей линейного преобразования, индуцированного в L, линейным преобразованием X (5.3). 6.7. Легко устанавливается и обратная связь. Пусть матрица линейного преобразования X линейного пространства L имеет в некотором базисе клеточно-диагональный вид 6.6 с клетками по- рядков rt, гг, ..., гт. Тогда линейная оболочка Lx первых ту элемен- тов базиса будет инвариантным подпространством, так же линейная оболочка L3 следующих г2 элементов базиса и т. д. Все пространство L распадается на сумму этих инвариантных подпространств: Z. = Lx + L2 + ... + Lm. Так как гх + г2 + ... + rm = rang L, то согласно IV,3.14 сумма будет прямой. 6.8. Особую роль в теории линейных преобразований играют ин- вариантные подпространства ранга один. С ними тесно связаны сле- дующие понятия. Определение. Пусть X есть линейное преобразование линейного пространства L над Р и для некоторых v б L, v #= и А С Р имеет, место Xv = At». Тогда А называется собственным значением преобразования X, a v — собственным элементом (или собственным вектором) преобра- зования X, принадлежащим собственному значению А. 6.9. Теорема. Ненулевой элемент v линейного пространства L является собственным для линейного преобразования X тогда и только тогда, когда линейная оболочка элемента v является инва- риантным подпространством пространства L. Доказательство. 1) Согласно IV, 3.5 линейной обо- лочкой L' элемента и является совокупность всех элементов вида &» <Л t Р). Если v есть собственный элемент преобразования X, то Хи--А» при некотором А ё Р- Но тогда благодаря линейности X имеем: X (^) = ЦХи) = £ (Аи) =• (I v. 241
Оказалось, что всякий элемент из L' преобразуется при по- мощи X в элемент, опять-таки принадлежащий L'. Это и означает инвариантность L'. 2) Пусть L' инвариантно. Для и £ //, v 0L должно иметь месте Хи ( I/, т. е. Xv = Xv. Это и означает, что v есть собст венный элемент преобразования X. 6.10. Если v есть собственный элемент линейного преобразо- вания X линейного пространства L над Р, то для любого £ 6 Р, I --/= 0 элемент тоже собственный для X. При этом gu принадле- жит тому же значению X, что и v. Действительно, если Xv = Xv, то X (&) = £ (Xv) == g (Xv) = = X (?v). 6 11. В связи с 6.9 и 6.10 обратим внимание на то, что, с одной стороны, линейная оболочка всякого ненулевого элемента v, как легко видеть, является подпространством ранга один (этот элемент v сам и образует базис этого подпространства). С другой стороны, всякое линейное подпространство L', имеющее ранг 1, является линейной оболочкой всякого своего ненулевою элемента (всякий ненулевой элемент из L' образует базис L', и потому линейная оболочка этого элемента совпадает с L'). Тем самым собственными элементами линейного преобразования X линейного пространства L являются всевозможные ненулевые элементы, содержащиеся в инвариантных относительно X подпро- странствах, имеющих ранг, равный единице. 6.12. Для нахождения собственных элементов и собственных значений линейного преобразовання конечномерного линейного пространства удобно использовать матрицу этого преобразования относительно какого-нибудь базиса. Лемма. Пусть U — {иь н2, .... ип} есть базис линейного пространства L\ X — линейное преобразование L, имеющее отно- сительно базиса U матрицу Аи(Х). Элемент v = щщ + с2ы2 -j- + ... -Ь с„ ип является собственным элементом преобразования X, принадлежащим собственному значению X, тогда и только тогда, когда (clt сг, ..., с„) • АО(Х) = X (сь с2, .... с„). Доказательство. Справедливость нашего утверждения вытекает из соотношения, связывающего координаты элемента Xv = c'w! + c'/i2 + ... + спиЛ с координатами и (3.12): (<. с’2, .... с'п) = (си с2.сД Аи(Х), поскольку соотношение Xv — Xv означает: (С], С2 ••• » С:) — ^(^1» ^2> •" » ^п)‘ 6.13. Согласно 6.12 собственные значения, а также собствен- ные элементы линейного преобразования X полностью определяют- ся матрицей Аи(Х) Поэтому естественно назвать собственные зна- чения преобразования X собственными значениями матрицы Аа(Х). Так как каждая квадратная матрица является матрицей некоторого 242
линейного преобразования, то для каждой квадратной матрицы определяются ее собственные значения. В соответствии со сказанным выше число X называется собствен- ным значением квадратной матрицы если существует ненулевой n-вектор V = (с1ж г2, ся), такой, что v • А = Xv. Это соотношение в развернутом виде означает выполнение ра- венств: + а21сз + ... + ап1сп = Хс1, a12Ci + atica + ... + ап2сп = Хс2, а^1 + а2пс2 + - + аппсп = Хс„. Перенося в одну сторону нее члены, приведем соотношения к виду fan — X) с, + <г21С2 + ... + ап1с„ = О, Oj2cl + (а22 — X) С2 + ••• + апгсп = О, атс\ + ainc2 + ••• + (апп — X) с7= о Полученные соотношения можно рассматривать как однородную систему линейных уравнений с неизвестными с1( с2, ..., с„. На- равне с матрицей этой системы удобно рассматривать транспони- рованную к ней матрицу, которую можно записать в виде А — ХЕ, где Е — единичная матрица n-го порядка: /а11 --°12 ••• ат \ __ХД ={ °21 °22 — X ... а2П | 4 агч апг ••• апп X/ 6.14. Для нахождения собственных значений матрицы А ис- пользуется определитель det (Л — хЕ) а11 Х а12 ••• й21 й22 X ••• агп ао1 ani ...апп—х В выражении этого определителя участвуетх. Здесь под х можно понимать любое число. Значения рассматриваемого определителя, очевидно, зависят от значений х. Таким образом, этот определитель м.ожно считать функцией от х. Его называют характеристическим полиномом матрицы А. (Изучением полиномов мы займемся в сле- дующих главах нашей книги; сейчас этот термин употребляется просто как составная часть собственного имени данного выражения.) 243
Нас будут интересовать корни характеристического полинома матрицы А, т. е. такие значения х, при которых указанный опре- делитель обращается в нуль. 6.15. Теорема Собственные значения квадратной матрицы А совпадают с корнями ее характеристического полинома. Доказательство. Число X будет собственным значением матрицы А тогда и только тогда, когда при этом % однородная система линейных уравнений, рассмотренная в 6.13, имеет ненуле вые решения (съ с2, ..., с„). Но согласно II, 5.5 это означает, что при этом X определитель матрицы указанной однородной систе- мы уравнений, а значит, и равный ему определитель транспониро- ванной матрицы обращается в нуль, т. е. X — корень характеристи- ческого полинома матрицы А. 6.16. Используя правила вычисления определителей, мы можем представить характеристический полином матрицы п-ro порядка А в зиде: «и — х а12 ... а.г «21 «22 ---- X . . «,„ = + ь1Х + ... + Ьп_гхп-' + Ьпхп. «П1 «42 ar.n X Вполне ясно, что при раскрытии определителя на основании определения (И, 1.16) мы не получим членов, содержащих х в сте- пени, превышающей п. Наибольшую степень х мы получим лишь в том слагаемом определителя, который равен произведению диа- гональных элементов: («п — х) (ам — х) ... (апп — х). Во все остальные слагаемые, в сумме составляющие определитель, х входит сомножителем с показателем степени, не превышающим п — 2, поскольку всякое слагаемое определителя, содержащее со- множителем элемент при i -/=/ , не содержит сомножителей (а„ — х) и (а;7 — х). Из наших рассуждений, в частности, следует, что в полученном выражении характеристического полинома коэффициент при хп равен оп = (—1)". 6.17. Если А есть матрица линейного преобразования X в некотором базисе U, то матрицей того же преобразования в другом базисе W является В = ТАТ~\ где 7— матрица линейного выра- жения W через U (3.14). В соответствии с 6.12 и 6.13 собственные значения преобразования X совпадают с собственными значениями матрицы А, а также с собственными значениями матрицы В. Они в свою очередь являются корнями характеристического полинома матрицы А, а также корнями характеристического полинома мат- рицы В (6.15). Важным также является то, что для матриц А и В совпадают не только корни их характеристических полиномов, но и сами характеристические полиномы. 244
Теорема. Характеристические полиномы матриц А и ТАТ~1 совпадают. До казательство. Учитывая перестановочность при ум- ножении матрицы хЕ при любом значении х со всякой квадратной матрицей того же порядка, что и единичная матрица Е, получаем-, det (ГАТ-1 — хЕ) = det (TAT-1—TxET~l) = det (T(A-xE)T -1} = = det T • det (A— xE) det (T'1) = det T (detT)-1- det (A— xE) = — det (A — xE). 6.18. Для каждого собственного значения X квадратной матри- цы n-го порядка А определяется непустое множество ненулевых n-векторов V = (с1( с2, .... сп), для которых чу А = ко. Это множе- ство состоит из ненулевых решений однородной системы линейных уравнений, рассмотренной в 6.13. В случае когда А есть матрица над полем Р и X б Р, среди ненулевых решений указанной системы существуют и такие, все компоненты которых принадлежат Р (I, 1.18). Если при этом А есть матрица линейного преобразования X линейного пространства L над Р, найденная относительно ка- кого-нибудь базиса U, то согласно 6.12 указанные решения с ком- понентами из Р задают в координатной форме относительно базиса U собственные элементы преобразования X, принадлежащие X, 6.19. Примеры. 1) Рассмотрим преобразование X трехмерного коор- динатного пространства V'(3), согласно которому X (a,, аг, а3) = — а3, 2а, + аг, —а2). Оно, очевидно, линейно. Матрицей этого преобразования в главном базисе е3 = (1,0, 0), ег = (0, 1, 0), е3 = (0, 0, 1) будет: /12 0 Л = 0 1-1 \-1 о о Характеристическим полиномом этой матрицы является 1 — х 2 0 0 1 — х —1 —1 0 — х = -(х - 2) (х2 + 1). Следовательно, собственными значениями матрицы Л, а значит, и преобразо- вания X оказываются числа: X, = 2, Х2 = г. Х3 = — i. Множество собственных элементов преобразования X, принадлежащих X, = 2, совпадает с множеством ненулевых решений системы —Х1 — Х3 = О, 2х, — х2 =0, — х2 — 2х3 = 0. Рассуждения относительно Х2 = i и Х3 = — i аналогичны. Если же рассматривать координатное вещественное пространство , то для преобразования, задаваемого по указанному выше правилу, следует взять только вещественное собственное значение X, = 2 и в качестве собствен- ных элементов этого преобразования рассматривать лишь вещественные ненуле- вые решения полученной системы уравнений. 245
2) Непосредственно из 6.14 к 6 15 видно, что квадратная мгтрица А имеет гобственное значение, равное нулю, тогда и только тогда, когда det А = 0, т. е. когда А особенная. Пусть А — неособенная квадратная матрица Ее собственные значения — это такие значения Умножая это соотношение на ся—X за знак определителя, приходим к соотношению: de* Л-1 — %, которые удовлетворяют соотношению det (Л — ХЕ) = 0. ошение на det (А-1), получаем: det (£ — ХА’1) = 0. Выяо- 1£),о. Следовательно, собственными значениями матрицы А-1, обратной к Л, являются числа, обратные к собственным значениям матрицы А. 6.20. В связи с рассмотренными понятиями выясняется вопрос о том, когда матрица линейного преобразования конечномерного линейного пространства является диагональной. Теорема. Пусть U есть некоторый базис линейного прост- ранства L\ X — некоторое линейное преобразование L. Для того чтобы матрица линейного преобразования X Аи(Х) была диагональной, необходимо и достаточно, чтобы все элементы базиса U являлись собственными для преобразования X. Доказательство необходимости. Пусть матрица .4Й(Х) диагональная: /\0 ...Ос Аи(Х) =1 0Х2 - 0 ). \ь ь :..х / Для U = {ut, иг, .... ип} это означает, что Xut = Х;иг (i =1, 2, ..., n), т. е. каждый элемент базиса U является собственным относитель- но X. Доказательство достаточности. Пусть все элементы базиса U = {ult ы2, ., ип} являются собственным, т. е. Хи. — А м, (i = 1, 2, ..., п). Согласно определению матрицы линейного преобразования име- ем: / Xi 0 ... 0 \ Аи(Х) =( 0 Х2 ••• 0 ). Xob’./xJ 6.21. В связи с теоремой 6.20 напомним, что вид матрицы Аи(Х) зависит не только от X, но и от выбора базиса U. Вполне может случиться, что в L имеется базис U, элементы которого являются собственными элементами X, но для другого базиса U эго не так, и потому матрица линейного преобразования Аи,(Х) может не иметь диагонального вида. 246
6.22. Пример В координатном пространстве И3’ рассмотрим линейное преобразование X, которое относительно главного базиса Е = {elt е2, е3} определяется матрицей: /94 Ц Л £ (X) = -7 -2 -1 \—4 —2 2 / В этом линейном пространстве рассмотрим также базис U = {«р и2, «3} где и, = (1, 1, 0), и2 = (3, 2, 1), us = (5, 3, ). Матрицей линейного выражения U через Е является /110 Т = 3 2 1 '531 Поэтому согласно 3.14 матрицей линейного преобразования X относитель- но базиса U будет матрица Л„(Х)= Т . Ае(Х) т-'. /—1 —1 1\ Согласно V,4.4 находим выражение обратной матрицы: Т-1= I 2 1 —11. \-1 2 -1/ /2 0 0\ Теперь можно вычислить Аа(Х) = Т • АР(Х) • T~l = I 0 3 С 1. \0 0 4/ То, что получившаяся матрица оказалась диагональной, означает что все три вектора Ир н2, и3, составляющие базис U, являются собственными отно- сительно преобразования X. Элемент и2 принадлежит собс1 венному значению 2, элемент и2 принадлежит собственному значению 3, элемент а3 принадлежит собс геенному значению 4. 6..23. Особо остановимся на случае, когда матрица линейного преобразования является такой диагональной матрицей, у которой все ее диагональные элементы различны. Л е м м а. Пусть в линейном пространстве L элементы ult и2( .... ит являются собственными относительно некоторого линей- ного преобразования X, причем они все принадлежат различным между собой собственным значениям. Тогда ult иг, .... ит между собой линейно независимы. Доказательство. Обозначим через X, собственное зна- чение, которому принадлежит элемент (i — 1,2, т). Имеем X,#- X, при i =# /. Доказательств проведем по индукции относительно т. Если т = 1, то единственный ненулевой элемент иг составляет линейно независимую совокупность. Считая утверждение справедливым для всяких элементов в числе, меньшем/и (га > 1), предположим, что для наших га элементов име- ется некоторая линейная зависимость. Yi«i + у2и2 4- ... + — 0. Так как среди чисел у; есть отличные от нуля, то будем считать, что у2 =£ 0. 247
Применим к нашему равенству линейное преобразование X: Y1 ( XuJ + Т2 (^2) + ••• + = 0. + У‘^ги-1 + ... + УтКпит = 0- Вычитая из полученного соотношения исходное равенство ли- нейной зависимости, умноженное на Хъ получим: (Z2 — >.j) y2U2 + (Х3 — Ij) y3Us+ ... Шт — Поскольку у2 =4= 0 и /-2 =# X,, мы получили линейную зависимость для иг, и3, ..., ит, что противоречит индуктивному предположе- нию. 6.24. Пусть X есть линейное преобразование линейного про- странства L, обладающего размерностью п. И пусть в 1„ существует совокупность из п элементов U — {и|( «2, ..., ип}, являющихся собственными относительно X, причем все они принадлежат различ- ным собственным значениям Хп Ха, ..., Хя(Х,ШХу при I У= j), Согласно 6.23 U оказывается базисом L. Матрица Л„(Х) линейно- го преобразования X в базисе U согласно 6 20 будет диагональной. Ее диагональными элементами, как мы видели в 6.20, являются числа X], Х2, ..., Х„, которые все различны между собой. Легко видеть, что имеет место и обратное. Если матрица Аи (X) линейного преобразования X в базисе U диагональная, причем все ее диагональные элементы Хп Х2, ..., Хп между собой различны, то совокупность U = {uj, u2, ..., ип } состоит из собственных эле- ментов преобразования X, причем они принадлежат различным между собой собственным значениям Хп Х2, .... Х„.
Глава VII. КОМПЛЕКСНЫЕ ПОЛИНОМЫ ОДНОГО ПЕРЕМЕННОГО § 1. Комплексные функции 1.1. Курс математическою анализа в основном посвящен изу- чению функций. Рассматриваемые в нем функции являются ве- щественными. Это означает, что допустимые значения независи- мого переменного, так же как и значения самой функции, явля- ются числами вещественными. Значение понятия вещественной функции в первую очередь заключается в том, что оно является математическим эквивалентом понятия зависимой переменной ве- личины, которое возникает и рассматривается в различных об- ластях научного естествознания (физика, механика, астрономия, биология, химия). Изучаемые там переменные величины могут принимать значения, являющиеся вещественными числами. Изме- нения одной из них зависят от изменений других. Изучение ха- рактера изменений и зависимостей между ними производится при помощи математического метода, оазвиваемого в курсе математи- ческого анализа и связанных с ним математических дисциплин. Учитывая характер изменения упомянутых переменных вели- чин, в курсе математического анализа главное внимание уделяется не любым произвольным вещественным функциям, но таким функ- циям, которые удовлетворяют дополнительным условиям, как то: непрерывность, дифференцируемость и т п. К таким функциям принадлежат, в частности, полиномы (много- члены). Интерес к ним определяется также их ролью для алгебра- ических уравнений, потребность в решении которых и изучение их свойств возникают как в пределах самой математики, так и в различных областях научного естествознания, в которых находят свое применение математические методы. Как это нередко бывало в истории математики, на некотором этапе изучения вещественных функций, и в частности веществен- ных полиномов, выяснилось, что для дальнейшего успешного и уг- лубленного их исследования полезно (в некоторых случаях просто необходимо) расширить область исследования и рассматривать ве- щественные функции, в частности вещественные полиномы, как 249
частный случай оолее общего понятия комплексной функции (оно будет формулировано ниже способом, вполне аналогичным тому, как определяется вещественная функция). Изучение полиномов (и тесно связанное с ним изучение ал- гебраических уравнений) является одним из важных разделов ал- гебры. Как мы увидим ниже, для успешности этого изучения со- вершенно необходимо осуществлять его в пределах наиболее есте- ственной для данной теории области всех комплексных полиномов. Подчеркнув эту основную для нашего последующего изложения причину, по которой в качестве основного объекта будут взяты комплексные полиномы, бегло упомянем, что в некоторых областях физики и других областях изучения природы иногда оказывается удобным ряд конкретных физических процессов описывать при по- мощи комплексных функций. Можно упомянуть в связи с этим такие области науки огромной прикладной значимости, как аэро- гидродинамику и электротехнику. Обоснование общей теории комплексных функций было осущест- влено О. Коши (1769—1857). 1-2. Определение. Пусть дано некоторое множество комплексных чисел Е. Комплексной функцией, определенной на мно- жестве Е, называется закон, который каждому комплексному числу из Е (называемому в этом случае значением комплексного независи- мого переменного) ставит в соответствие новое комплексное число (называемое значением функции при данном значении независимого переменного). Множество Е называется областью определения функции (или множеством допустимых значений независимого переменного для данной функции, или областью изменения независимого переменного). 1.3. Данное определение является непосредственным естест- венным обобщением определения вещественной функции, приво- димого в курсе математического анализа (прилагательное «ве- щественная» там обычно опускается, так как только такие функ- ции там и рассматриваются). Вещественная функция есть част- ный случай комплексной функции, при котором область задания функции Е принадлежит множеству вещественных чисел и все значения функции содержатся в /?. Подобно тому как очень наглядно и удобно представлять себе вещественную функцию как переменную вещественную величину, изменение которой зависит от изменения другой вещественной величины, так же и комплексную функцию можно представлять се- бе как переменную комплексную величину, изменяющуюся в за- висимости от изменения другой переменной комплексной величины. Впрочем, такая точка зрения в последующем изложении будет использоваться нами редко и лишь как образное выражение. 1.4. Как и при рассмотрении вещественных функций, для комплексных функций употребляются обозначения вида: / (х), ф (х), F (i) и т. п. 2ВД
Если xQ, a, g и т. п. есть какие-либо числа из соответствующих областей определения этих функций, то под f (x0), <р (a), F (5) и т. п. понимают соответствующие им значения функций. Часто функции задаются следующим образом. Указывается по- следовательность операций, которые надо совершить над числом а, чтобы получить значение данной функции при значении независи- мого переменного, равном а. Если для этих операций имеются соот- ветствующие обозначения, то получаем задание функция в виде формулы. Берется какая-нибудь буква (чаще всею х) и выражение для функции f (х) записывается при помощи обозначения соответ- ствующих операций, примененных к х. Сам х называют в этом слу- чае независимым г временным. Очень часто при этом не оговаривают особо, какова область определения функции, считая само собой разумеющимся, что эта область состоит из всех чисел, для которых указанная последовательность опеоаций может быть осуществлена. 1.5. Примеры. 1) Следующие комплексные функции задаются форму- лами: I (х) = х2, g (х) = |х|, <р (х) — —. X Областью определения / (х) и g (х) является множество всех комплексных чисел Для ф (х) область определения состоит из всех комплексных чисел, отличных от нуля. При х = 1 имеем; / (1) = 1* = 1, g (1) = |11 = 1, ф (1) = у = 1. При х = Г. I («) = i2 = —1, g (Q = p| = 1, Ф (() = — = —i. i При x = 1 + i: f (1 + i) = 2i, g (1 + i) — 1^2, Ф (1 + 0 = у — у/. 2) Рассмотрим функцию, у которой область определения состоит из ьсех комплексных чисел, а значения определяются по следующему правилу. Пусть независимое переменное задано з обычной форме задания комплексного числа х = а 4’ р/. Тогда функция задается формулой: F (х) = F (а + Р i) = а|3 + I sin (а + fj). Значения этой функции определяются очевидным образом. Например, F (]_ 0=1. (-1) 4- i sin (1 + (-1)) = -1, г ( \ гх Л » • • / _ . \ У 2 F — i) = 0 •------isin 10 4—) = 2_£д \4 ; 4 \ 4/2 Из способа задания этой функции видно, что по тому же способу из двух вещественных функций от двух независимых переменных каждая (в нашем случае это были функции ар и sin (а 4* Р)) можно всегда построить комплексную функцию. Б общей теории комплексных функций такой способ их задания играет важную роль. Для нас в дальнейшем он не будет иметь особого значения. 1.6. Отметим, что, давая в 1.2 определение комплексной функции, мы ограничились случаем функции однозначной. Надо сказать, что 251
в общей теории комплексных функций более общее понятие много- значной функции играет важную роль. Однако нам в дальнейшем не будет необходимости иметь дело с многозначными функциями. Поэ- тому мы не даем здесь определения многозначной функции, а з даль- нейшем без особых оговорок под функцией будем понимать то, что было определено ь 1.2 (т. е. функцию однозначную). В качестве примера рассмотрим поведение У г, где z — пропз- гольное комплексное число. Здесь мы как раз столкнулись бы с необходимостью рассматривать z как многозначную функцию от независимого комплексного переменного z (ведь /г при всех z =/= О имеет в Z в точности п различных значений). 1.7. Действия над комплексными функциями определяются аналогично действиям над вещественными функциями. Пусть заданы комплексные функции А (х) и f2 (х), определенные соот- ветственно на множествах комплексных чисел и £г. Для них определены функции: Ф1 W = /1 М + /2 U), Фг W = fi W — /2 (х), Фз (*) = fi (х) • fi (х), называемые суммой, разностью и произведением ft (х) и /2 (х). у которых область задания состоит из чисел, входящих как в £п так и в Е2 (пересечение: £\ Q £2) и значения которых для каждого числа а из этого множества определяются по правилу: Фт (а) = fj (а) + f2 (а), Фг (а) = Л (а) — fi (а)> Фз (о) = Д (а) ft (а). Аналогично определяется и частное: с тем отличием, что область определения <р4 (х) состоит только из тех чисел а, входящих как в £ь так и в £г, при которых f2 (а)=^ 0. 1.8. Согласно определению действия сложения, вычитания, умножения и деления функций сводятся к сложению, вычитанию, умножению и делению комплексных чисел, являющихся значениями этих функций. Действия сложения и умножения комплексных чисел обладают свойствами. 1) сложение коммутативно и ассоциативно; 2) умноже- ние коммутативно и ассоциативно; 3) сложение и умножение связаны свойством дистрибутивности. Отсюда непосредственно вытекает, что и действия сложения и умножения функций обладают соответст- вующими свойствами. 1.9. Однако в общем случае свойство обратимости не имеет места пи для сложения, ни для умножения функций. 252
Если число а входит в область определения функции (х), но не входит в область определения функции /2 (х), то ни при какой функции <р (х) не может иметь места ни /2 (х) + <р (х) = /г(х), ни /г (х) • <р (х) = Л (х). В связи с этим следует иметь в виду, что для некоторых функций вполне может оказаться: /1 (X) + [/» (х) - К (х)] f2 (X), UI (*) J Дело в том, что левая часть может отличаться от правой обла- стью определения. В связи с этим может оказаться, что К (х) + g (х) = (х) + g (х), но функции Д (х) и /2 (х) различны. Это будет иметь место, если Д (а) =/= (а) только для тех чисел а, которые не входят в область определения функции g (х). Надо также иметь в виду, что в некоторых случаях пересечение Ег П £г может оказаться пустым. О такой функции, у которой область определения не содержит ни одного числа, иногда говорят как о «пустой», или «несобственной», функции. 1.10. Как видно из 1.9, определение арифметических действий с функциями, приведенное в 1.7, не вполне удобно, В связи с этим нередко определение суммы, разности и произ- ведения двух функций ограничивают только тем случаем, когда их области определения одинаковы (Ег = Е2). Это удобно потому, что совокупность всех комплексных функций, заданных на одном и том же множестве, с точки зрения общей теории действий оказывается коммутативным кольцом (Ч. VII, 3.2). Действительно, к основным свойствам действий сложения и умножения (1.8), которые сохраняются и при сделанном ограниче- нии определения добавляется свойство обратимости сложения (неограниченная возможность вычитания). Что касается обратимости умножения (хотя бы и с ограничением относительно деления на нулевую функцию, т. е. функцию, у которой все значения равны нулю), то оно не имеет места. Это следует из того, что при /2 (а) 0 и Д (а) = 0 (причем при других значениях х значения Д (х) могут и отличаться от нуля) не существует функции <р (х), для которой /х (а) • <р («) = f2 (а). Следует также иметь в виду, что как при общем определении 1.7, так и в случае указанного ограничения может иметь место сле- дующее. Хотя функция g (х) не является нулевой, все же можег случиться, что Л (х) £ (х) = /2 (х) • g (х) при различных функциях /\(х) и /2(х). 253
В качестне примера укажем ка следующие функции, опреде- ленные на множестве всех ве шественных чисел: fi W = х, (х) = = 2 |xj — х, g (х) =- |х| + х. Функции Д (х) и /2 (х) раз- личны (например, /у(—1) ——1, но М-1) =2|-1|-(-1) =3; А (—2) = -2, но М-2) =6 и т. д,). Однако непосредствен- ной проверкой (которую удоб- нее провести порознь для поло- жительных и отрицательных значений х) убеждаемся, что (х) g (х) = /2 (х) • g (х). 1.11. Отметим также, что для комплексных функций, так же как и для вещественных, определяется построение сложной функции (иногда называемое суперпозицией). Из функций <р (х) и f (х) строим функцию F (х) — f (<р(х)), у которой область определения состоит нз всех таких чисел а, для которых определены <р (а) и / (д> (а)). Значением F (х) при х = а считается F (а) = f (tp (а)). 1 12. При изучении вещественных функций бывает полезно ис- пользовать их изображение при помощи графиков. Комплексные функции в общем случае не обладают таким наглядным способом изображения. Если, однако, комплексная функция f (х), заданная на множестве Е, такона, что все ее значения являются веществен- ными числами (но при этом £ не обязано содержаться в R), то для нее сходное наглядное изображение возможно. Рассмотрим трехмерное пространство евклидовой геометрии с прямоугольной декартовой системой координат. Плоскость XY будем считать комплексной плоскостью. Таким образом, £ можно рассматривать как некоторое множество точек в плоскости XY («фигура», расположенная на этой плоскости). Над каждой точкой I из £ восставим перпендикуляо, равный по длине |/ (01, «вверх», если f (0 0, и «вниз», если f (0 С Конны этих перпендикуляров образуют некоторую поверхность (рис. 11). Очевидно, эта поверх- ность вполне определяет нашу функцию. 1.13. Для произвольной комплексной функции f (х), заданной на £, можно в качестве вспомогательной величины рассмотреть ее модуль; |/ (х)| есть функция, заданная на тем же множестве £, причем значением ее для каждого числа t f Е является веществен- ное неотрицательное число |/(01- Способом, описанным в 1.12, | f (х)| допускает удобное нагляд- ное изображение при помощи поверхности, расположенной над £. Эта поверхность целиком расположена выше плоскости XY (или касается ее), поскольку все значения \[ (х)| неотрицательны. Разу- 254
мсется, указанная поверхность не определяет полностью саму функ- цию f (х), но в некоторых отношениях она ее характеризует. 1.14. Примеры. Рассмотрим функцию f (х) = f (а + bi) = а, являю- щуюся вещественной частью комплексного числа х = а + Ы. Поскольку значения f (х) вещественны, она может быть изображена способом 1.12 при по- мощи поверхности. Легко видеть, что этой поверхностью оказывается пло- скость, проходящая через ось ординат и образующая с плоскостью XY угол, я разный — (рис. 12). 4 2) Для функции f (х) = х поверхностью, изображающей ее модуль \[ (х)|= — |х|, будет конус (рис. 13). 1.15. При изучении вещественных функций в курсе математи- ческого анализа важную роль играет понятие непрерывности. Для исследования функций используется операция дифференцирова- ния. Эти понятия непосредственно переносятся и на комплексные функции, причем играют : общей теории комплексных функций столь же важную роль. Определение непрерывности функции и определение производной производятся для комплексных функций совершенно так же, как к для вещественных функций. С ними можно познакомиться по любой книге, посвященной теории функций комплексного переменного. § 2. Комплексные полиномы 2.1. Среди различных комплексных функций особо важную роль играют определяемые ниже функции, которые называют полинома- ми или многочленами, иногда полиномиальными функциями или целыми рациональными функциями. В дальнейшем мы будем ис- пользовать лишь первый из этих терминов. Определение. Комплексным полиномом (в дальнейшем будем обычно говорить просто полином) называется функция, опре- деленная на множестве всех комплексных чисел, значение которой И>5
при любом значении х, т. с. при любом комплексном числе х, опре- деляется по формуле'. f (х) = с0 + cLx -Ь сгх2 + ... + сп.1х'-1 + сПхп. Здесь п — целое неотрицательное число, с0) си с2, .... crt_t, с„ — произвольные комплексные числа, постоянные для данного полинома. Они называются коэффициентами, 2 2. В предыдущем определении при п = 0 в качестве частного случая полинома получаем функцию, являющуюся постоянной. Это функция, все значения которой равны одному и тому же числу. При этом в дальнейшем часто особую роль будет играть поли- ном, являющийся постоянней, равной нулю: / (х) Ч 0. 2.3. В выражении полинома f (х) = с0 + <\х + с2х2 4- ... 4- с„_! х,—14- сп хп некоторые из его коэффициентов с0, сь с®, .... c„_t, сп в тех или иных конкретных случаях могут быть равны пулю. Конечно, соответст- вующие члены можно выбросить, после чего мы получим ту же самую функцию. Поэтому, приписав дополнительные слагаемые 0xn+1 4- Ох"4'2 4* 4- ... 4* Ох1" (т > п), мы можем записать f (х) в виде суммы с лю- бым числом слагаемых m > н. Благодаря этому, имея дело одновременно с несколькими поли- номами, мы можем, если это нам окажется удобным, записать их все в виде сумм одинаковой длины (т. е. с одним и тем же п). 2.4. Сумма и разность двух полиномов тоже яьлякгея полино- мами. Согласно определению сложения и вычитания функций (1.7) для полиномов f (х) = с0 + сух + ... 4- с^х4-1 -ь спх\ g (х) = ф 4- djX 4- ... 4- d^x'1-1 4- dnxn их суммой и разностью, как легко видеть, будут: ZW 4-g(x)=(c04-4)-b(Ci-1-c!i) х4- ... 4-(cn-i4-4-1)xe-14- (cn4-d„)x'", Дх)—g(x)=(c0-d0)4-(Ci—d.)x4- ... 4- (c„_1-d„_1)x'l-14- (с„ —dn)x’. 2.5. Так же произведение двух полиномов есть полином. Для f (х) = с0 4- q х 4- ... 4- c„-i х"-1 4- сгхн, g (х) = d0 4- di х 4- ... 4- dm_! xm~l 4- drxm (в этом случае нам пет причины записывать оба полинома в виде сумм одинаковой длины), перемножая их, как суммы, и собирая по- том вместе члены с одинаковыми степенями х, очевидно, получаем: / (х) g (х) = 4- ^1 х 4- егх2 4- - 4- e„+m..1x',t-'«-1-t- емтхп+т. жл
Коэффициенты eh можно выразить через коэффициенты исход- ных полиномов по формуле: + CA-j 4- ... 4- ск_^ 4- ck dc (k •= 0, 1, 2, ..., n 4- m)- Следует только иметь в виду, что в этой формуле при k > п члены crt+2dft_n_2, .... chd0 следует отбросить. При k > т соответственно надо отбросить члены , c}dk_lt ... ... , ck-m-1dm+1. В частности, очевидно, еп+т = сп dn и е0 — codo. 2,6. Что касается действия деления для полиномов, то с ним дело обстоит значительно сложнее. Как мы скоро увидим, в об ласти полиномов далеко не всегда для пары полиномов f(x) и g (х) найдется частное, т. е. такой полином ф (х), что f W = g (х) • ср (х). 2.7, Учитывая сказанное в 1.10 о свойствах действий сложения и умножения комплексных функций, мы заключаем, что множество всех комплексных полиномов является коммутативным кольцом. 2.8. В некоторых вопросах для изучения свойств полинома f (х) бывает полезно рассмотреть его модуль |/ (х)| (1.13). Некото- рое представление о характере этой функции дает доказываемое ниже неравенство Лемм а. Пусть С есть наибольший из модулей коэффициентов полинома f (х) = с0 4- <4* 4- ... 4- сп_1х'’-а 4- спхп (п 1): С = max (|col, Iql, .... |c„_J, \сп |). Тогда при всех значениях х имеет, место: |/ (х)| > \сп | • |х| — пС. Доказательство. Для всякого значения х, такого, что |с„ | • |х| < пС, рассматриваемое неравенство выполняется, по- скольку в его левой части стоит неотрицательное вещественное число, а справа в этом случае оказывается неположительное ве- щественное число. Пусть \сп | • |х| > п С В этом случае из |сп | < С следует |х[ 1, а потому |х|"~1 > |xjft 1 (k — 0, 1, 2, ..., п— 1). Используя свойства модуля комплексных чисел, получаем: I/ (х)1 = ко 4- CiX 4- ... 4- ся_1х'1-1 4- сях,| > > к« ! • I xln — |с0| — IcJ • |х| — ... — кл-11 • kl"-1 > > к„ I • W" — с ।х|л 1 — с И"’1 — - — С кГ1 = = kn I • |х|’ — пС\х\п~1 = I х|"-* (кя I • |х|— пС) >к„| • |хI — пС' 2.9. Очевиден геометрический смысл неравенства 2.8. Если полином f (х) не является постоянной,’ то в формуле, его задающей, можно считать с„^=0. Согласно 1.12 неравенство 2,8 означает, что погерхность, изображающая |/(х)|, располагается выше поверхности, соответствующей функции |ся | • |х| — пС. О Заказ-653 •257
Рис. 14. ществеиное чмло LM, что при А этой поверхностью, как лег- ко видеть, является конус (рис. 14). 2.10. Полученное неравенст- во характеризует функцию I/ (х) | для полинома 1 (х), не являющегося постоянной, как растущую при увеличении мо- дуля |х|. Этот рост, правда, не является монотонным в том по- нимании, что для отдельных пар чисел Xj и хг вполне возможно |xj < |х,|, но |/ (.ц)| > |f (xj|. Но все же хотя и немонотонно, по рост | f (х) | имеет место в следующем смысле. Следствие. Если поли- ном f (х) не является постоян- ной, то для всякого вещественно- го числа М найдется такое ее- всех значениях х, превосходящих по модулю LM (|х| > LM), имеет место неравенство \l WI >М. Доказательство. В выражении для f (х) = с0 + <\х + + ... + св_]ха-1 + спх”1 можно согласно 2.3 отбросить справа чле- ны с коэффициентами, равными нулю, после чего мы получим выра- жение такого же типа, ко уже сядА 0. При этом n 1, так как f (х) не является постоянной. Согласно 2.8 мы имеем. t/U)l I • И — пС. „ , М + пС Взяв в качестве искомого числа L,,= —, мы для лю- м I сп I ’ бего |х| > L^, пользуясь этим неравенством, получаем: I/ WI > |С„ 1 • |х] - пС >|с„ I • п С = М. 1 сп I 2.11. Уже на опыте знакомства с некоторыми простыми веще- ственными функциями мы знгем, что иногда внешне различные функции на самом деле оказываются равными. Это означает, что, будучи заданы на одном и том же множестве, опи принимают' рав- ные значения при любом значении переменного из этого множества. Пример этому дают следующие функции, определенные на мно- жестве всех вещественных чисел, sin 2л и 2 sin х • cos х. По внешнему виду нелегко догадаться, что заданные на мно- жестве всех вещественных чисел из промежутка [—1,1] вещест- венные функции J/1 ф- х2 — р I — х2 и V 2 (1 — у 1 — х4) (здесь 258
знак радикала означает арифметическое значение корня) на самом деле равны. 2.12. В связи с этим естественно возникает зопрос, не могут ли в отдельных случаях два по внешности различных полинома на самом деле представлять собой одну и ту же функцию. Теорема. Если у полиномов f (х) = Со + + с2х2 4- ... 4- сп_ххп~1 4- с„хп, g (х) = Оо -I- dtx 4- d2x2 4- ... 4- 4- ^х’, хотя бы при одном значении k = 0, 1,2, ..., п, имеет место ck=£dh, то полиномы f (х) и g (х) не равны, т. е. представляют собой раз- личные функции. Доказательство. Прежде всего напомним, что согласно сказанному в 2.3 не является ограничением то, что оба наших по- линома записаны в виде сумм с одинаковым числом слагаемых. Рассмотрим разность полиномов f (х) и g (х), причем в ее вы- ражении отбросим стоящие справа члены с нулевыми коэффициен- тами, если таковые окажутся: h (х) = / (х) — g (х) = (с0 — t/o) 4- (q — dj х 4- ... 4- (ch^ — — dh^) Xй"1 4- (cft - dA) x\ cb — dk Ф 0. Если k = 0, t. e. h (x) — f (x) — g (x) = c9 — d0 y= 0, to f (x) =0= g (x) при любом значении x. Если k > 1, то согласно 2.10 для h (х) найдется такое число Lo, что для всех значений х, таких, что | х| > £э, имеет место |Л (х)| > 0, а потому h (х) 0 и f (х) 7= g (х). 2.13. Интересно отметить, что в процессе доказательства 2.12 мы не только доказали, что /(х) и g(x) различны, но и обнаружили, что f (х) и g (х) принимают различные значения для всех достаточно больших по модулю значений переменного х. 2.14. При исследовании ряда свойств полинома особую роль играет член с наибольшей степенью х, коэффициент при котором отличен от нуля. Часто в рассуждениях, где этот член бывает важ- но выделить особо, оказывается удобным (но, разумеется, это вовсе не обязательно) записывать члены полинома по нисходящим сте- пеням х, начиная с члена, обладающего наибольшей степенью х, коэффициент при котором отличен от нуля. Форма записи полинома: / (х) = а1>х'1 4- СгХ""1 4- .•• + on-iX + ап (а9 0) называется нормальной, число п в этом случае называется степенью полинома, aQxn называется старшим членом, аа — старшим коэф- фициентом, ап — свободным членом. Полиномами нулевой степени оказываются функции, являющие- ся постоянной, отличной ст нуля. Что касается полинома, являющегося постоянной, равной нулю, то для него нормальной формой принято считать само число нуль. э* 259
Этот полином не имеет старшего члена, и ему не приписывается никакой степени. Из 2.3 и 2.12 следует, что каждый полином обладает нормальной фермой, которая определяется для него единственным образом. Каждый полином, не являющийся постоянной, рапной нулю, обладает определенной степенью Постоянная нуль есть единственный полином, не имеющий сте- пени. Поэтому в дальнейшем всюду, когда мы будем говорить о степени некоторого полинома, тем самым автоматически будет подразумеваться, что этот полином пе является постоянней, рав- ной нулю. 2.15. Степень полинома является важной его характеристикой. Очень существенно знать, как зависит степень суммы, разности и произведения полиномов от степеней компонент. Это легко выяс- нить благодаря 2.4 и 2.5. Пусть степень полинома f (х) равна п и степень полинома g(x) равна т. Степень суммы полиномов / (х) + g (х) и их разности f (х)- g (х) не превосходят наибольшего из чисел пит. Произведение полиномов f (х) • g (х) имеет степень, равную сумме степеней сомножителей л + т. Если один из полиномов не имеет степени, т. е. является посто- янной, равной нулю, то, очевидно, / (х) + 0 = 0 + f (х) = / (х) - 0 = / (х), 0 - / (х) = -f (х), / (х) • 0 = 0 • f (х) = 0. Из 2.5 также следует, что старший коэффициент произведения равен произведению старших коэффициентов сомножителей. Свободный член произведения равен произведению свободных членов сомножителей. 2.16. Из сказанного в 2.15, в частности, следует, что частное двух полиномов определено в области полиномов далеко не всегда. Если полином / (х) имеет степень п, а полиномg (х) — степень т, причем т > п, то ни при каком полиноме <р (х) благодаря 2.15 невозможно f (х) = g (х) • <р (х), поскольку степень g (х) • <р (х) не меньше т и не может равняться п. Если же ср (х) есть постоянная нуль, то и g (х) • ф (х) есть постоянная нуль. 2.17. Легко видеть, что полиномы, отличающиеся на постоян- ный и не равный нулю множитель, f (х) и с • / (х) (с 0), хотя при с У= 1 и различны, весьма близки по своим свойствам. С этой точки зрения полиному f (х), имеющему старший коэффициент ас, естест- венно, сопоставить полином — / (х), у которого старший коэффи- ао циент равен 1, и изучать именно этот новый полином. Иногда эго оказывается удобным. Полиномы со старшим коэффициентом 1 иногда называют нормированными. 2.18. В нескольких местах дальнейшего изложения нам будет полезно употреблять понятие и некоторые простейшие свойства 200
производной полинома. Ее можно было бы определить при помощи общего понятия производной для комплексной функции. Такой подход наиболее естествен. Однако для того, чтобы не отклоняться в сторону от основного нашего пути, мы дадим определение, непосред- ственно относящееся к нашему случаю. Определение. Производной полинома f (х) = Со + cLx + С2Х2 + ... + сп_1хп~1 + Спхп, называется полином f (х) = q 4* 2с2 х 4- Зс3х2 -|- ... 4- (п — 1) ся_1хя-24-гасяхя'1. Отметим, что степень производной полинома на единицу меньше степени самого полинома. В дальнейшем нам будут важны следующие свойства производ- ных полиномов: (А (х) 4- /г (х))' = f. (х) 4- f' (х), (А (х) • f2 (х))” = А (х) • А (х) 4- Г, (х) • /2 (х), (Xя)' = пхп~1, (с)” = 0. Справедливость этих свойств легко получается, если исходить из общего понятия производной произвольной комплексной функции, о котором мы упомянули выше (но не приводили его). Нетрудно было бы провести доказательства и исходя из формаль ного определения производной полинома, приведенного выше. 2.19. Как и в теории вещественных функций, употребляется понятие второй производной: /" (х) = [/'(х)]’. Вообще по индукции определяется понятие k-й производной (х) для любого k = 2, 3, 4, ... . Именно (х) — [АА-1) (х).]'- Согласно определению для полинома степени п все производ- ные А^(х) (k — 1, 2, ..., п — 1) суть полиномы, не являющиеся постоянной, /<п)(х) есть постоянная, отличная от нуля, и все /<0(х) (/ — «4-1. «4-2, ...) являются постоянной нуль. 2.20. В этом параграфе мы дали определение и начали изучение свойств полиномов. Мы подошли к понятию полинома с точки зре- ния более общего понятия функции. Упомянем, что довольно часто используется и другой подход. Можно, не апеллируя к понятию функции, непосредственно определить множестве полиномов как множество выражений вида сс 4- qx 4- с2х2 4- ... 4- сп^ хп~1 4- спхп. При задании такого выражения знаки 4* и степени х восприни- маются как формальные разделительные знаки Таким образом, полином по существу понимается просто как последовательность своих коэффициентов с0, q, q, ..., сп_и сп . В множестве таких выра- жений (или последовательностей) определяются действия сложения и умножения. То, что действия эти задаются одним, а не каким- либо другим способом, ниоткуда не выводится, а кладется в опре; 261
деление. Последующее изучение строится на базе этого определения множества полиномов и действий между элементами этого множе- ства. Дальнейшее развитие теории и при такой исходной установке в принципе существенно не отличается от теории, имеющей в сво- ей основе принятую нами функциональную точку зрения. Все же возникают и некоторые различия. Например, доказызаемая нами в 2.12 единственность задания полинома не требует доказательства, как лежашая в самом определении. Зато ряд других вопросов, в первую очередь вопросы, непосредственно связанные со значениями полинома при тех или иных значениях независимого переменного, требуют существенно другого, особого обоснования и изложения. Более глубокое основание для намеченного выше подхода будет рассмотрено дальше (IX, L.10). § 3. Деление с остатком полиномов 3.1. Подобно тому как это имеет место в области целых чисел, где деление не всегда возможно, и в области полиномов оказывается полезным рассматривать особую операцию — деление с остатком. Определение. Делением с остатком полинома f (х) на полином g (х), имеющий степень т, называется выражение поли- нома f (х) через полином g (х) следующим образом: f (х) =-- g(x) • s (х) + г (х), где s (х) и г (х) — какие-то полиномы, причем степень полинома г (х) меньше т или же г (х) есть постоянная, равная нулю. Здесь полином г (х) называется остатком, a s (х) — частным при делении с остатком f (х) на g (х). Легко видегь, что при выполнении указанного соотношения в случае, когда f (х) не есть постоянная нуль, степень полинома s (х) равна разности степеней f (х) и g (х) или же s (х) есть постоян- ная нуль. 3.2. Теорема о делении с остатком. Для поли- номов f (х) и g (х), где g (х) не есть постоянная, равная нулю, деле- ние с остатком f (х) на g (х) всегда возможно и притом единствен- ным образом: f(x)^g (х) • $ (х) + г (х) (т. е. s (х) и г (х) определены единственным образом). Доказательство. 1) Сперва докажем возможность де- ления с остатком. Прежде всего рассмотрим случай, когда степень f (х) меньше степени g (х) или когда f (х) есть постоянная, равная нулю. В качестве искомых s (х) и г (х), очевидно, можно взять s (х) = О и г (х) = f (х). Дейстьигельпо, в этом случае f (х) = g (х) • 0 + г (х), причем степень г (х) = f (х) меньше степени g (х) (или г (х) = / (х) есть постоянная, равная нулю). 2S2
Пусть теперь f (x) = и^х” + OiX"’1 + ... + an_rx + an (a„ 0), g (x) = boxm+ b2xm~l 4- ... + + bm (bd=/~. 0), n > m. Введем в рассмотрение следующие полиномы: tpj (х), <р2 (х), ..., степень которых обозначим соответственно через klt k2, ..., а стар- шие коэффициенты — через с\, с2, '• f (х) — -°- хп т g (х) = <рх (х), *0 Ф1 (*) — v- *** т ё (х) = (х). Фа (*) — Xk‘~mg (X) = ф3 (х), ьо Ф,-1 (х) -<р- х*5 1 т g(x) = фДх). Степени уменьшаемого и вычитаемого в каждой из разностей, стоящих слева, одинаковы (именно: п — в первом равенстве, — во втооом, kt — в третьем и т. д.). Старшие коэффициенты тоже одинаковы (а0 — в первом равенстве, q — во втором, с2 — в третьем и т.д.). Поэтому старшие члены уничтожаются (с;х ‘ —x*z ’freX” = \ Ьв — 0), и степень каждого ф/+1 (х) оказывается меньше, чем степень ф/ (*): п > ••• ks-1 i бывающая последовательность целых неотрицательных чисел, меньших п, содержит не более п членов. Поэтому не позже как на я-м члене построение полиномов ф; (х) оборвется. Но оборваться оно может только в том случае, когда получившийся полином Ф5 (х) имеет степень меньшую, чем т, или же есть постоянная нуль, так как только в этих случаях мы не можем построить по тому же правилу следующего полинома ф5+1 (х). Итак, некоторый ф, (х) (с номером s, не большим я) имеет степень, меньшую т, или есть постоянная нуль. Сложим все полученные выше равенства, причем взаимно уничто- жим члены фх (х), ф2 (х), ..., ф,_г (х) и перенесем вправо все члены, кроме f (х) f (х) = х’-т + -1- х*'^'п + .. . + — x^-i"m L ьа £(х) + фДх). Так как степень ф^ (х) меньше т или же ф^ (х) есть постоянная нуль, то получившееся равенство и представляет собой деление с остат- ком f (х) на g (х). 253
2) Теперь докажем единственность. Пусть имеет место одно- временно: / W = £ W «1 W + fj (х), I W = g (х) s2 (х) + г4 (х), где степень г, (х) (i = 1, 2) меньше степени g (х) (или г,- (х) является постоянной, равной нулю). Вычитая из одного равенства другое и перенося некоторые члены в левую часть, получим: g (х) (s2 (х) — 51 (х)) = гг (х) — г2 (х). Если бы $2 (х) — $! (х) =£ 0, то слева мы имели бы полином, степень которого согласно 2.15 была бы не меньше степени g(x), тогда как справа мы имеем полином, степень которого меньше степени g (х). Следовательно, на самом деле $2 (х) — 5] (х) = С, а потому и ri (х) — г2 (х) = С, т. е. оба деления с остатком f (х) на g (х) совпадают. 3.3. Как легко видеть, приведенное доказательство теоремы 3 2 дает способ, при помощи которого фактически можно совершать деление с остатком Это есть не что иное, как известный еще в школе способ деления с остатком «уголком», только там вычисления для удобства записываются по известной схеме. Отмстим, однако, что едва ли не проще указанного способа нередко оказывается способ неопределенных коэффициентов. Зная, что деление с остатком всегда возможно, мы, имея целью совершить это действие дли двух каких-либо полиномов, можем сразу написать зависимость, выражающую деление с остатком, в которой коэффи- циенты неизвестных полиномов $ (х) и г (х) обозначены какими- нибудь буквами (о степенях s (х) и г (х) мы знаем, что степень г (х) меньше степени g (х), а степень s (х), очевидно, равна разности сте- пеней полиномов f (х) и g (х)). Так как эта зависимость представляет собой равенство полиномов, то должны равняться между собой коэффициенты при одинаковых степенях х в левой и в правой частях равенства. Также равенство должно сохраняться, если придать независимой переменней х какое-либо численное значение. Поль- зуясь этими соображениями, можно определить неизвестные коэф- фициенты полиномов $ (х) и г (х). 3.4. Примеры. 1) Пусть требуется выполнить деление с остатком полинома / (х) = Ах* — 2л’ 4- 4х’ -1- х — 3 на ясли ном g (х) = 2№ + х — 2. 264
2х2 4- х - 2 2х2 — 2х 4- 5 По методу деления «уголком» получим; 4х4 — 2х3 ф 4х2 4- х — 3 4х4 4" 2х3 — 4№ — 4л3 4 8х2 + х —3 — 4х3 — 2х2 4 4х 10х2 — Зх — 3 10х24- 5х— 10 — 8х 4- 7 Следовательно, деление с остатком наших полиномов имеет следующий вида 4Х4 - 2х3 4- 4х2 4- х — 3 = (2х2 4- х — 2) (2х2 — 2х 4~ 5) — 8х 4~ 7. Покажем теперь, как этот же результат мог бы быть получен методом не* определенных коэффициентов Сразу можно написать: 4х’ — 2х3 4- 4х2 + х — 3 = (2х2 4- х — 2) (Л2х2 4" Лгх 4" Л2) 4- Вох 4 Bt. Для нахождения коэффициентов Ао, Alt А2, Во, Bi раскрываем справа скобки и сравниваем коэффициенты при одинаковых степенях х в левой и в правой частях (последующие выкладки следует делать в уме). Сравнивая коэффициенты при х4, получаем: 4 = 2Л0> Л9 = 2. Сравнивая коэффициенты при х3 (используя, что Ло = 2), получает —2 = 2Аг 4- Ло, At = —2. Сравнивая коэффициенты при х*,’ получаем: 4 = 2А2 4- Л, — 2ЛС, Л2 = 5. Сравнивая коэффициенты при х, получаем: 1 = -2ЛХ 4- Л2 4- Йо, В., = -8. Наконец, сравнивая свободные члены, получаем: —3 = — 2Аг 4- Вг =» 7. Подставляя найдег.ные значения Аа, Лг, Л2, Во, в написанное ранее соотно- шение, получаем равенство, представляющее собой деление с остатком наших по* ли номов. 2) Пусть требуется найти остаток при делении с остатком полинома х4 4- «х8 4- 2ix2 — 2ix 4- 4 — I на пнвшюм- х2 —1. Записываем готовый результат деления с остатком, причем «кладок пишем пока с неопределенными коэффициентами: х4 4- »х* 4- 2ix2 — 2ix 4- 4 — i = (х2 — 1) s (х) 4- Лх 4- В. Полагая х = 1, получаем: 5 = Л -I- В. Полагая х= —1, получаем: 5 4- 2/ = —Л 4- В. Из полученных соотношений для Л и В сразу находим: Л = — i, В = 5 4- I- Следовательно, искомый остаток равен —ix 4" 5 + i.
3,5. Особо остановимся на случае деления с остатком на поли- ном вида х — с, где с — постоянная. Этот случай важен в связи со следующей тсс-ремой, называемой обычно теоремой Безу (1730— 1783), Теорема. Остаток от деления полинома [ (х) на полином х — с равен f (с), т. е. значению [ (х) при х ~ с. Доказательство. Деление с остатком наших полиномов имеет вид: f (х) = (х — с) s (х) -Ь г, где г есть постоянная (нуль или полином, степень которого меньше единицы, т. е. постоянная, отличная от нуля). Полагаем в этом равенстве х — с. Значение г при этом не изме- нится, так как г есть постоянная: / (с) = (с — с) s (с) + г. Отсюда г = f (с). 3.6. Вычисления для случая, рассмотренного в 3.5, могут быть оформлены в удобную схему, называемую часто схемой Горнера. Пусть f (х) = адхп + afxr‘~l + ... + a,_jX -f- ап (с0 #= 0). Запишем результат делений с остатком полинома f (х) нах — с, записывая s (х) и г (х) с неопределенными коэффициентами: а,)хг’ + ^х"-1 + ... + ая_,х + ап = = (х — с) (ЛоХ""1 + + ... + Ля_2х + Ля_,) + R. Мысленно раскрываем н правой части скобки. Сравнивая затем коэффициенты при равных степенях х, получаем: ай = Ао, tij = Tlj — cAg, «2 = ak = Ak—cAk_u an-l = ^Л-1 С^Л-2> ая = ^ — cAn..v Отсюда последовательно находим: До = ао, Л1 = at + сАа, Д2 = а2 ^Alt Af, — п1г Ф сАк_х, ^1—1 ~ 1 "Ь 1 '^л—2> R =ап+ сА^. 266
Вычисления обычно принято заносить в следукицую схему: "о «1 - ап -1 С 4» 4, 42 4* 4«-t R Каждое получается путем сложения стоящего над ним ak со стоящим перед ним Лл_р умноженным па с. Так как в нижней строчке расположены коэффициенты полинома s(x), то, в случае если требуется совершить деление с остатком s (х) на х — с, можно соответствующую схему написать просто сни- зу к данной схеме. 3.7. П р и м е р ы. 1) Пусть требуется совершить деление с остатком по- линома 2хь 4- (l-У 27)х< + (2 + i)x3 + (1 + 4i)x + i на полином л + Z. Располагаем вычисления по выше записанной схеме (здесь с = —/). Так как в верхней строке схемы следует писать все коэффициенты исходного поли- нома, то в нашем случае на третьем месте должен стоять коэффициент при х3, т. е. нуль. 2 1 4-2Z С 2 + » 1 4-4/ i — i 2 1 — Z 1 4- 7 2 4-37 3 — 1 Таким образом, мы получаем деление с остатком: 2х* + (1 + 2i)x* + (2 + 1)хг + (1 + 4«)х + i = = (х + 0 [2х* + х3 — IXs + (1 + /)х + 2 + 3Z] 4- (3 - I). Значение нашего полинома при х = —i согласно 3.5 равно 3 — I. 2) Разложим полином Xs 4- 2х — 5 но степеням х — 2 Для э~ого по схеме 3.6 совершаем ряд последовательных де- лений с остатком на х — 2: 10 2—5 2 12 6 7 2 1 4 И 2 1 6 2 1 Первая строка означает: х3 4- 2х — 5 = (х — 2) (х2 4- 2х 4- 6} 4- 7. Из второй строки следует: х* 4- 2х 4- 6 - (х — 2) (х 4- 4) 4- 14, т. е. х3 4 2х — 5 = (х 4- 4) (х — 2)3 4- 14 (х — 2) 4- 7. 267
Из третьей строки следует: х + 4 = (х — 2) + 6, т. е. х3 + 2х — 5 = (х — 2)3 + 0 (х — 2)2 + 14 (х - 2) + 7- Конечно, можно было бы написать это разложение сразу, беря в качестве коэф- фициентов последние члены в каждой строке нашей схемы 3.8. Легко видеть, что задача, рассмотренная в последнем при- мере, может быть поставлена для любого полинома и любого числа. Теорема. При любом числе с полином / (х) степени п всегда можно представить и притом единственным образом в ваде f (х) = b0 + bi (х — с) + &2(х — с)2 4- ... + bn (х — г)" (Ь„ =/= 0). Доказательство. 1) Совершив деление с остатком f (х) па х — с, получаем: f (х) = s, (х) • (х — с) + Ь„, где s, (х) — полином степени п — 1, а Ь9 — постоянная. Совершив деление с остатком s/x) на х — с, получаем: Sj(x) = s2(x)(x — с) + Ьь f (х) = ba 4- b, (x — c) 4- «»(x) (x — c)2. Повторив соответствующие деления с остатком п раз, очевидно, получаем требуемое разложение; 2) Ьо из рассматриваемого разложения, очевидно, можно рас- сматривать как остаток от деления с остатком i (х) на х — с. Поэтому Ьо определяется единственным образом. 4* bi (х — с) есть остаток при делении с остатком f (х) на (х — с)2. Поэтому и он определяется единственным образом. Так как bj для этого полинома есть старший коэффициент, то он опре- деляется единственным образом. Повторяя это рассуждение, убеж- даемся в том, что все коэффициенты определяются единствен- ным образом. 3.9. Коэффициенты в предыдущем разложении могут быть получены путем последовательных делений с остатком, как это указывалось в доказательстве теоремы 3.8. Обычно более удобным с вычислительной точки зрения является нахождение их по схеме 3.6, как это было сделано в примере 3.7 (2). Используя по- нятие и свойства производных (2.18, 2.19), можно находить их также по формуле, указанной ниже. Эта формула, называемая часто разложением Тейлора полинома [ (х), существенно используется в ряде разделов курса математиче- ского анализа. Теорема. В разложении f (х) = Ьп 4- (х — с) 4- Ь2 (х — с)2 4- ... 4- Ьк (х — с)п коэффициенты определяются следующим образом-. <*=°- 2- 263
где f(k}(x) означает k-ю производную полинома f (х) (/(в) (х) есть сам f W). Доказательство. Продифференцировав k раз обе части нашего разложения, благодаря определению производной полино- ма получим равенство вида: /,А)(х) = k (k - 1)... 2 1 • bb + <р (х) (х - с), где <р (х) — некоторый полином, вид которого нам сейчас не Инте- ресен. Положив в этом равенстве х = с, получаем: /< > (с) = М bR +0, Поэтому 3.10. Полезно отметить, и б дальнейшем это будет нам весьма важно, следующее свойство деления с остатком. Как непосредствен- но видно из рассуждений доказательства теоремы 3.2, коэффициен- ты частного s(x) и остатка г (х) получаются из коэффициентов исходных полиномов ' (х) и g (х) при помощи четырех арифметичес- ких действий Поэтому если, в частности, все коэффициенты полиномов t (х) и g (х) вещественны, то таковыми же будут и коэффициенты поли- номов s (х) и г (х). 3.11. Для целочисленного полинома / (х) (т. е. полинома, все коэффициенты которого — целые числа) при делении его с остатком на целочисленный полином g (х), старший коэффициент которого равен единице, частное s (х) и остаток г (х) также оказываются цело- численными полиномами. Это непосредственно видно из рассуждений, проведенных в пер- вой части доказательства теоремы 3.2. Действительно, Ьо == 1 и все числа и коэффициенты полученных там полиномов <р(- (х), очевидно, оказываются целыми числами. 3.12. Частным случаем деления с остатком является соотноше- ние между полиномами / (х) = g (х) s (х). Это есть тот случай, когда при делении с остатком остаток есть постоянная, равная нулю. Определение. Если для полиномов f (х) и g (х) найдется полином $ (х), при котором выполняется / (х) = g (X) • S (х), то говорят, что f (х) делится на g (х), a g (х) есть делитель f (х). Как и в теории целых чисел, в этом случае иногда употребляют запись f (х) : g (х). Из теоремы о делении с остатком (3.2) следует, что если / (х) делится па полином g(x), не являющийся постоянной, равной нулю, то частное s (х) определено однозначно. 209
Если полином g (х) есть постоянная нуль, то никакой полином, не являющийся постоянной, равной нулю, не может, очевидно, делиться ня g (х). Если оба полинома / (х) и g (х) являются одновременно постоян- ной, равной нулю, то в качестве частного s (х) можно взять любой полином. 3.13. Единственность частного при делении на полином, отлич- ный от постоянной, равной нулю, позволяет производить сокраще- ние умножения с ограничением относительно нуля. Следствие. Если для полиномов имеет место f W • Ф (х) = g (х) • <р (х), где <р (х) не есть постоянная нуль, то f (х) = g (х). Действительно, и / (х), и g (х) можно рассматривать как част- ные, полученные в результате делимости одного и того же полинома f (х) • q> (х) = g (х) • ф (х) на полином ф (х). Благодаря единствен- ности частного должно иметь место f (х) = g (х). § 4. Корни полиномов 4.1. При исследовании той или иной функции всегда очень важно бывает выяснить, каково множестве ее значений. В частно- сти, существенно бывает знать, входит ли в область ее значений число нуль и при каких значениях независимого переменного она принимает это значение. Определение. Число а называется корнем полинома f (х), если при х = а полином принимает значение, равное нулю: f (а) = 0. 4.2. Отметим, что так как модуль числа нуль, и только этого числа, равен нулю, то а будет корнем тогда и только тогда, когда |/ (а)| = 0. Геометрически это означает, что в точке а плоскости XY поверхность, изображающая \f (х)| (см. 1.13), касается плоско- сти XY. 4.3. Найти корни полинома, исходя из задания его коэффициен- тов, задача крайне непростая. Однако уже сейчас, пользуясь результатами предыдущего параграфа, мы можем указать один спо- соб, как ограничить область, в пределах которой содержатся все корни полинома. Теорема о границе корней полинома Пусть С есть наибольший из модулей коэффициента полинома f (х) = ДоХ" + ^х"-1 4- ... + а„_1Х 4- ав (а0 0). Тогда модуль каждого из корней полинома f (х) не превосходит числа 273 •
Доказательство, Если п = 0, то f (х) 0 при всех значениях х Пусть 1 и г есть произвольнее число, такое, что Благодаря 2.8 имеем: I/ (г)| >|оо| • |г| — пС > |с0; • п • —пС = пС — пС = О, |а» I т. с. f (г) 0. 4.4. Геометрически полученный результат означает, что точки, изображающие на комплексной плоскости корни полинома, распо- С ложены в пределах круга с радиусом п —, имеющего центр в на- |0о1 чале координат. Упомянем, что известен ряд других более совершенных оценок для модулей корней полинома. С некоторыми из них можно позна- комиться, например, в книге: Ф а ддеев Д. К,, С о Мин- ск и й И. С. Сборник задач по высшей алгебре. М., «Наука», 1968. 4.5. К понятию корня полинома можно подойти также с точки зрения делимости, как это непосредственно вытекает из теоремы 3.5. Следствие. Число а является корнем полинома f (х) тогда и только тогда, когда х — а является делителем полинома [ (х). 4.6. При рассмотрении корней полинома оказывается весьма полезным разложить его на множители. Лемма. Пусть f (х) = q>r (х) • ф2 (х) • ... • <рт (х). Корнями полинома / (х) являются вое корни полиномов Ф1(х), <р2(х), ..., <Р,„(х). Доказательство. Для любого числа г имеем: /(г) = <р1 (г) • <р2 (г) • ... • <рт(г). Но произведение комплексных чисел равняется нулю тогда и толь- ко тогда, когда среди сомножителей есть равные нулю. 4.7. Вопрос с существовании корней у полинома будет выяснен позже. Что касается возможною количества различных корней у по- линома данной степени, то этот вопрос решается следующим об- разом. Для любых чисел 0 < k С п можно указать полином степени п, имеющий точно k различных корней. Например, таковым будет тр (х) = (х — aj"-**1 • (х — а2) • ... • (х — аА), поскольку согласно 4.6 числа cet, a2, ..., a k, и только они, являются корнями / (х). Верхнюю оценку количества различных корней имел уже И. Ньютон (1643- -1727). 271
Теорема. Количество корней полинома f (х) степени п не превосходит п. Доказательство. Рассуждаем по индукции относи- тельно п. Если п — 0, io (х) есть постоянная, отличная от нуля, и, сле- довательно, корней не имеет. Пусть п > 0 и для всех полиномов меньшей степени утвержде- ние справедливо. Если бы [ (х) вовсе не имел корней, то доказыва- емое утверждение было бы справедливо. Пусть а есть корень f (х). Согласно 4.5 имеем / (х) = (х — a) s (х), где s (х) — некоторый полином степени п — 1 (3.1). Количество корней s (х) не превосхо- дит п — 1. Эти числа и еще число а являются согласно 4.6 всеми корнями f (х). Значит, количество последних не превосходит п. 4.8. Следствие, Пусть f (х) и g (х) — полиномы, степени которых меньше п. Если существует п различных чисел %, г», ... ..., zn_x, zn , для которых значения этих полиномов равны ftek) = 1. 2, ..., п — 1, п), то f (х) = g (х) (т. е. f (z) = g (z) для всех z С Z). Доказательство. Рассмотрим полином <р (х) — f (х)— — g (х). Если <р (х) есть постоянная нуль, то f (х) = g (х). Предположим, что это не так. Степень ф (х) должна быть меньше п, что благодаря 4.7 противоречит тому, что п различных чисел zA, ?г, ..., zn_x, z„ являются его корнями: Т (zj =/ (**) — g(z;i) =0 (k = 1, 2, .... п— 1, п). 4 9. В связи с полученным в 4.5 следствием довольно естествен- ным оказывается следующее понятие. Определение. Число а называется корнем кратности k полинома f (х), если f (х) делится на (х — а)к и не делится на (х — а)*+1. Иными словами, кратность корня а есть показатель наивысшей степени (х — а), на которую делится полином. Корни, кратность которых больше единицы, обычно называ- ются кратными, корни первой кратности называются простыми. В дальнейшем мы не будем употреблять этих терминов. 4.10 Лемма. Число а является корнем кратности k для по- линома f (х) тогда и только тогда, когда f (х) представим в виде f (х) = (х — а)* • <р (х), где ф (х) — такой полином, что ф (а) 0. Доказательство. I) Если а есть корень кратности k, то согласно определению 4.9 f (х) = (х — а)* - ф (х). При этом полином ф (х) не должен делиться на к — а, а потому Ф (а) 0. 272
2) Если f (х) представим в указанном виде, ю / (х) делится иа (х — а)". При этом / (х) не делится на (х — а)т при т > k. Иначе мы имели бы равенство: (х — а)* • <р (х) — (х — а)71 • if (*), и потому <р (х) = (х — а)'7-’1' • if (х), что противоречит ф (а) #=0. 4.11. Проверку того, будет ли данное число корнем полинома, обычно удобно бывает производить методом, рассмотренным в 3.6. При этом легко определяется кратность корня. Действительно, для определения кратности, очевидно, надо сперва совершить деление с остатком полинома / (х) на х — а и убедиться, что остаток равен нулю: f (х) = (х — а) - S, (х). Затем совершить деление с остатком полинома st (х) (коэффициен- ты которого в схеме 3.6 выписаны в нижней строчке) на х — а и и т. д. до тех пор, пока остаток не окажется отличным от нуля. Количество делений с нулевым остатком, очевидно, и укажет крат- ность корня. 4.12. Пример. Выясним, будет ли число 2 корнем и какой кратности для полинома х6 — 7х* + 12х» 1- 16х3 — 64г + 48. Вычисление проводим по схеме 3.6, деля наш полином на х — 2: Получившийся в ос1атке нуль показывает, что 2 является корнем. Совершаем повторное деление с остатком. В остатке получается опять нуль. Еще раз прочззодим деление с остатком. В остатке опять нуль. В остатке получилось число, отличное от нуля. Дальнейшее вычисление прекращаем. При последовательном проведении деления с остатком мы три раза получали в остатке нуль. Следовательно. 2 является для нашего полинома корнем третьей кратности. Результат деления полинома на (х — 2)3 можно записать, пользуясь числами предпоследней строки схемы: х6 — 7Х4 + 12х3 + 16хг — 64х + 48 = (х — 2)3 • (ха — х - 6). 4.13. Для исследования вопроса о кратности корней полинома иногда удобно бывает использовать понятие и свойства производной (2.18, 2.19). Л е м м а. Если а является корнем кратности k для полинома f (х), то а будет корнем кратности (k — 1) для производной этого полинома f (х). Если k = 1, то а вовсе не будет корнем для Г (X). 273
Доказательство. Благодаря 4 JC f (х) — (х — а)* х X <р (х), где <р (а) =/= 0. Используя свойства производной (2.18), получаем: Г (х) = k (х — а)4-1 • <р (х) + (х — а)" • <р' (х) = = (х — а)* • <р (х) 4- (х — а) • ф' (x)j. Мы видим, что /' (х) делится на (х — а)4-1. При згом частное от деления k • <р (х) 4- (х — а) • <р (х) при х = а отлично от нуля- k • q> (а) 4- (« — а) • <р' (а) — k • <р (а) -/= 0. Следовательно, а является для /' (х) корнем кратности (А — 1), а в случае k — 1 вовсе не является корнем /' (х). 4.14. Теорема. Если для последовательных производных полинома [ (х) (2.19) имеет место f (а) = 0, f (а) = 0, Г (а) = 0, ..., (а) = 0, /<“'> (а) =^0, то число а является для f (х) корнем кратности k. Доказательство. Так как (х) = [^-1) (х)]', то согласно 4.13 а является корнем первой кратности для (%). Отсюда опять-таки согласно 4.13 следует, что а будет корнем второй кратности для (х) Повторяя рассуждение, получаем, что а для /' (х) будет корнем кратности k — 1. Отсюда следует, что для / (х) чисто а есть корень кратности k. 4.15. Пример. Путем непосредственной подстановки сразу убеждаемся, что число 1 является корнем полинома f (х) = 273х10 — ЮОх9 — 1830* 4- 1657. Его кратность нс меньше двух, поскольку для f (х) -= 2730х® - 900х« — 1830 имеем: /' (1) = 0. Так как для Г (х) = 2730 • 9 • х* — 900 8 • *’ имеем /’ (1) 0, то 1 является для / (х) корнем именно второй кратности. 4.16. Так как функция определяется не только законом соот- ветствия своих значений значениям независимого переменного, но и областью задания, то между функциями естественным образом возникает следующее отношение Определение. Пусть функция (х) определена на Ег и функция ft (х) — на Et. Если Ela Et и f\(z) — ft (z) для вся- кого z С £lt то функция ft (х) называется продолжением функции h (х), a h (х) — ограничением или сужением функции (х) на мно- жестве £Р Мы будем в этом случае писать: fl (х) = /2 (х) |£/ 274
4.17. Разумеется, в общем случае функция, заданная па Elt имеет несколько (даже бесконечно много) различных продолжений на ЕгсоЕ1 (£j Ф £2). Однако если ограничиваться функциями лишь определенных классов, то иногда положение дел оказывается иным. В частности, так обстоит дело для интересующего нас случая поли- номов. 4.18. Из 4.8 вытекает следующее. Следствие. Пусть множество чисел Е бесконечно и ком- плексные полиномы (х) и f2 (х) имеют одинаковые ограничения на Е: fi (х) |g = ft (х) |е. Тогда и сами полиномы Д (х) и f2 (х) равны. Действительно, (?) = /2 (?) выполняется для бесконечного множества чисел ? из £ 4 19. Частным случаем отношения 4.16 является отношение между вещественными и комплексными полиномами. Вещественным полиномом называется функция, определенная н множестве всех вещественных чисел R, значения которых опре- деляются формулой: / (х) = с0 + CjX + с2х* -г ... + сп_1хп~1 + с„хл, где с0, сг, с8, ..., ся_!, сп С R. Очевидно, вещественный полином f (х) есть не что иное, как ограничение на R комплексного полинома с теми же коэффициен- тами. 4.20. Поскольку множество всех вещественных чисел R бес- конечно, то согласно 4.18, 4.19 отношение между комплексными по- линомами с вещественными коэффициентами и вещественными поли- номами, рассматриваемыми как их ограничения па R, является взаимно однозначным: f(x) ~f(x)]R. При этом, очевидно, если f U) + g М = ср, (х), f (х) g (х) = <р3 (х), Ш — g (х) = ф2 (х), f (х) : g (х) = ф4 (х), то и для их ограничений на R имеет место: f (х).1« + g W1Л = Ф1 W I/?, f (х) I* g (х) |R = ф3 (х) |R, f (x)\R - g (x)\R = ф2 (х)|л, f(x)\R :g(x)\R = ф4 (x)|K. Используя понятие изоморфизма, можно сказать, что относи- тельно арифметических действий множество всех комплексных по- линомов с вещественными коэффициентами изоморфно множеству всех вещественных полиномов.
Отсюда следует, что изучение вещественных полиномов можно свести к изучению комплексных полиномов с вещественными коэф- фициентами. Иногда вообще под вещественным полиномом понимают просто комплексный полином с вещественными коэффициентами. Все же следует иметь в виду, что существуют вопросы, специфи ческие именно для вещественных полиномов (вообще вещественных функций), для изучения которых переход в область комплексных полиномов не оказывается целесообразным. В первую очередь это относится к сравнению значений функции по величине, поскольку для комплексных невещественных чисел это отношение не опреде- лено. Сюда включается изучение изменения функций в отношении возрастания и убывания. Геометрическое изображение в виде графиков очень наглядно и поучительно. Но оно осуществляется лишь для вещественных по- линомов.
Глава VIII. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ § 1. Исходные понятия теории уравнений 1.1. О понятии уравнения в самом широком смысле слова было сказано в 1, 1.1. В дальнейшем пам предстоит заниматься уравне- ниями, которые по отношению к упомянутому зесьма широко форму- лированному понятию составляют значительно более узкий класс. Именно такие уравнения чаше всего рассматриваются в математике на первых этапах ее изучения. Поэтому нередко понятие уравнения ограничивают приводимым ниже определением. Уравнение в узком смысле слова. Пусть не- которое множество комплексных чисел М. задано в качестве области значений неизвестного. Заданы также две комплексные функции'. f(x), определенная на множестве Еи g (х), определенная на множе- стве Eg. Условие равенства значений обеих функций при некоторых числах из М (тем самым такие числа должны принадлежать Е f П П Eg) определяет уравнение, которое обычно обозначают в виде равенства I W = g (х) (задание Л1 чище всего производится отдельно). Тем самым уравнение в узком смысле слова задается при помощи множества М и лары функций / (х) n.g(x). При этом буква х в указанной записи уравнения означает уже не независимое перемен- ное, но является обозначением неизвестного этого уравнения. Часто уравнение задают просто при помощи пары функций, не оговаривая отдельно область значения неизвестного М. При этом автоматически подразумевается, что М есть Ef f] Eg. В этом случае множество Ef р Е„ называют также областью определения уравне- ния. Всякое число а £ /И, такое, что а £ Е< f| Eg и имеет место f (а) — g (а), называется решением (или корнем} уравнения. Го- ворят также, что значение неизвестного х — а удовлетворяет урав- нению. Необходимо иметь в виду, что запись уравнения в виде / (х) = = g (х) нельзя смешивать с равенством самих функций f (х) и 277
g (x). Знак равенстза означает равенство не самих функций, но ра- венство их значений при некоторых значениях х. При указанной записи уравнения имеется в виду отыскание таких значений х ( М, при которых значения данных функций равны. Тем самым х озна- чает уже не независимое переменное, но неизвестное из заданной области чисел М. Рассматривая уравнение f (х) = g (х), обычно называют функ- цию f (х) левой частью уравнения, a g (х) — правой частью. Так как в ближайшем мы ограничимся рассмотрением уравне- ний, определенных в узком смысле слова, то не будем делать со- ответствующих оговорок. 1.2. Задание уравнения само уже определяет множество его ре- шений. Решить уравнение — это значит получить для чисел, являю- щихся его решениями, некоторое явное выражение. Это понятие носит описательный, нестрогий характер. Конечна, встречаются уравнения, которые не обладают решени- ями. Уравнения, обладающие решениями, называются разрешимы- ми, а не обладающие решениями — неразрешимыми. 1.3. При задании уравнения, функции, из которых оно состав- лено, часто задают при помощи формул. Как мы уже говорили в связи с этим (VII, 1.4), областью определения каждой из этих функ- ций считается множество тех чисел, для которых данная формула определяет некоторое численное значение. В этом случае в качестве области значений неизвестного в соответствии с 1.1 обычно подра- зумевается Ef П Eg- Впрочем, в некоторых случаях существо во- проса требует взять в качестве области значений неизвестного М какое-либо множество чисел, отличное от Е, (~| В этом случае говорят, что уравнение, записанное в виде равенства двух функций, рассматривается в пределах данной области чисел М. Та же цель может быть достигнута при помощи задания ограничений областей определения функций. Так, например, можно говорить об уравнении х2 + 1 =0, рассматриваемом в области R. Такое уравнение неразрешимо, так как вещественных решений у него нет. Часто это выражают сло- вами, говоря, что уравнение х2 + 1 =0 неразрешимо в R. В то же самое время можно рассматривать уравнение х2 + 1 =0 в области Z. В этом случае оно разрешимо и имеет два решения: х — i ц х — —i. Нельзя понимать это так, что в отношении одного и того же уравнения могут быть дань: два различных ответа. На самом деле речь идет о двух разных уравнениях, отличающихся областями значений неизвестного. 278
Когда из общего характера рассуждений ясно, о какой области значений неизвестного идет речь, обычно не делают соответствую- щих дополнительных пояснений, и это не вызывает каких-нибудь недоразумений. Однако в некоторых более тонких и ответственных рассуждениях такое дополнение желательно делать н явном виде. В дальнейшем нам чаще всего придется иметь дело с уравнения- ми, у которых область значений неизвестного есть множество всех комплексных чисел Z и области определения обеих функций, со- ставляющих уравнение, тоже равны Z. Впрочем, в отдельных слу- чаях особое внимание будет уделяться уравнениям в области А?. Следует иметь в виду, что существуют и иные подходы к поня- тию уравнения, нежели излагаемые в настоящей книге. Разуме- ется, различие отражается лишь на характере изложения, а не на содержании основных результатов. 1.4. В соответствии с общим подходом (I, 1.5) два уравнения и узком смысле слога (1.1), у которых неизвестные обозначены оди- наковым способом, называются эквивалентными или равносильны- ми, если всякое решение каждого из них является решением и для другого, т. е. множества решений этих уравнений совпадают. 1.5. Непосредственно видна справедливость следующих свойств отношения эквивалентности. 1) Всякое уравнение эквивалентно самому себе. 2) Уравнение f (х) = g (х) эквивалентно уравнению g (х) = = f (х). 3) Если уравнение (х) = gi (х) эквивалентно уравнению f2 (х) — = gi (х), а последнее в свою очередь эквивалентно уравнению [я (х) = = g?(x), то уравнение /\ (х) =gi(x) эквивалентно уравнению h (х) = ёз (х). В следующих свойствах обозначаем через Ef область определе- ния функции f (х), через Eg область определения функции g (х); Ф (х)— некоторая функция, область определения Е$ которой та- кова, что Ev zd Ef Q Eg. 4) Уравнение 1 f(x) — g (х) эквивалентно уравнению f (х) + ф (х) = g (х) + ф (х). 5) Если ф (х) не принимает значений, равных нулю, при значе- ниях х из Ef П Ея, то уравнение f (х) = g (х) эквивалентно уравне- нию ф (х) • f (х) = ф (х) • g (х). 6) Пусть Ег и Е2 — такие подмножества Z, что Е1слЕ/, Е2с: Eg и Е, П Е2 = Ef П Eg. Тогда уравнение f (х) — g (х) эквивалентно уравнению f(x)\E = g(x)|£/ 1.6. Пример. Рассмотрим уравнение 2 1 — х« , ________—----------- X3 + 1 1 + X3 279
Его область значений неизвестного определяется соотношением х2 4- 1 =#= 0. Преобразуя правую часть, получаем: ___2___= 2-(1 + х2) _ %2 _ _2___ = 2 _ 1 +*г _ х2 1 1 + X2 ’ X2 +1 14-х2 14-х2 Получаем, что исходное уравнение эквивалентно уравнению 0 = —1 — х2 с той же областью задания неизвестного х2 4~ 1 У= 0. Полученное уравнение, а значит, и исходное неразрешимы. Подчеркнем, что исходное уравнение не эквивалентно уравнению 0 = —1 — — х2, у которого в качестве области задания неизвестного рассматривается мно- жество всех комплексных чисел. Поэтому опустить указание на область задания неизвестного в последнем уравнении нельзя, это привело бы к явной ошибке. 1.7. Свойство 1.5 (4) можно применить к уравнению / (х) = g (х), взяв в качестве ф (х) функцию —g (х). Тогда указанное уравнение оказывается эквивалентным уравнению / (х) — g (х) = 0. При этом благодаря 1.5 (6) нс вызовет ошибок то, что мы будем считать, что стоящая справа функция есть постоянная нуль, имеющая областью определения Z. Но тогда особо важно иметь в виду, что на стоящую слева функцию / (х) — g (х) следует смотреть с учетом того, что было сказано в VI 1,1.9 относительно вычитания функций с различными областями задания. Вычитание здесь не есть действие в прямом смысле, обратнее сложению. Важность этого замечания хорошо видна на примере 1.5. Из сказанного видно, почему при изучении уравнений всегда можно ограничиться уравнениями, правая часть которых есть нуль. 1.8. Для упрощения исследования уравнения, а также для нахождения его решений часто употребляется следующее преобра- зование, обычно называемое заменой неизвестного. Пусто функции [ (х), заданная на множестве Е<. и g (х), задан- ная на множестве Eg, таковое, что g (Eg) = Ef. Тогда для всякого решения х0 уравнения / (х) = 0 (*) найдется такое решение z0 уравнения /(g(z))=0, (♦*) что x0=g(z0). Обратно, каково бы ни было решение z0 уравнения (*♦), число х0 = g (z„) будет решением уравнения (*). Действительно, пусть хс — решение (*), т. е. х0 б Ef и / (х0) = = 0. Так как хс б Ef = g (£ J, то найдется такое z0 б Eg, что х0 = = g (z0). Так как f (g (z0)) =0, то z0 — решение уравнения (**). Пусть zc — решение (**); Тогда z0 € Eg и / (g (z0)) = 0. Число л0 — g (z0) содержится в Е< и является решением (*). 1 9. Благодаря 1.8 для отыскания всех решений уравнения (*) / (х) = 0 280
достаточно уметь найти решения вспомогательного уравнения (**): / (g (2)) = о. При этом для получения всех решений уравнения (*) не всегда обязательно брать все решения уравнения (**). Если два различ- ных решения уравнения (**): Zj и z2 — таковы, что g (21) = g (z2), то для получения решений уравнения (*) число z2 можно и не брать. Действительно, получающееся из него решение уравнения (*): # (z2) — будет и без того получено из числа гх (тек как g (z2) = = g (2f)). Переход or рассмотрения исходного уравнения / (л) = 0 к вспомогательному уравнению / (g (2)) = 0 обычно называют преобразованием уравнения при помощи замены неизвестного. 1.10. Определение. Уравнение Щрс'- + ^х"-' + ... + a„-ix -Ь ап =- 0 (о0 0), левой частью которого является полином степени п, называется алгебраическим уравнением п-й степени. Благодаря 1.5, (5), взяв в качестве <р (х) число —, всегда можно «о перейти от данного алгебраического уравнения к эквивалентному ему уравнению со старшим коэффициентом, равным единице. 1.11. Укажем одну простейшую замену неизвестного в алгебра- ическом уравнении, которая иногда несколько облегчает его изу- чение. Легко видеть, что функция от переменного z: g(z) = z + fl, где p — некоторая постоянная, обладает свойством, что для лю- бого х0 найдется такое z0, что *о = g (г.,). Таким z0, очевидно, является z0 = х0 — ц. Поэтому в алгебраиче- ском уравнении всегда можно произвести замену неизвестного (1.8, 1.9) по формуле: х = г 4- р 1.12. Лемма. При помощи замены неизвестного naQ алгебраическое уравнение п-й степени аохп 4 + ••• 4* 4- = С 0) 2К1
пробразуется в алгебраическое уравнение п-й степени, у которого коэффициент при (п— 1)-й степени неизвестного равен нулю: 4- Ь^-2 + ... + 6,-tZ -I- ЬП = О (ba -# 0). Доказательство Составляем преобразованное уравне- ние с неизвестным z: / ai \П I / ai \"~1 I I а1 \я-2 , , л <z0'z----— ] +«! г-------*- +а2 z--------1- +...4-а = 0. \ ла, ) \ пл, / \ па, / Раскрывая все скобки, собираем члены с одинаковыми степенями z. Очевидно, мы получаем степени г от нулевой ло n-й. Член с г" получается только при раскрытии первой скобки. Он равен ауг*. Члены с г4-1 получатся только при раскрытии первой и второй скобок. Согласно формуле бинома Ньютона они имеют вид: аопг'!~1. = — я^-1 + = 0. \ / Таким образом, для неизвестного г получается уравнение вида: Ь^п + £>8гл~г + b3z"~3 -г ... + bn-iZ + Ьа = 0 (Ьп = о, =# 0) § 2. Алгебраические уравнения низших степеней 2.1. Общее изучение алгебраических уравнений оказывается тем сложнее, чем выше степень рассматриваемых уравнений. Для степеней п — 1, 2, 3, 4 оказывается возможным полностью выяс- нить вопрос, о решении уравнений. Алгебраическое уравнение нулевой степени имеет по опреде- лению своей левой частью полином нулевой степени, т. е. постоян- ную с, отличную от нуля. Так как равенство с = 0 всегда несправедливо, то уравнение нулевой степени неразрешимо. 2.2. Алгебраическое уравнение первой степени имеет вид: ах + b — 0 (а #= 0). Число ——, очевидно, является его решением. Никакое другое а число решением не является. Следовательно, уравнение первой степени всегда разрешимо и имеет одно решение 2.3. Для исследования алгебраического уравнения второй сте- пени ах2 4- Ьх + с — 0 (а #- 0) совершим замену неизвестного 1.12: 28?
Получаем: az2 — — 4- с = О, 4а > — 4ас Получившееся уравнение разрешимо. Его решениями являются числа: У^ Ь2 — 4ас ~ У" Ь2 — 4ас Zl - " ~~~ ' ~~ “• . 1 2а 2 2а (Употребляя знак радикала, мы здесь предполагаем, что в обеих выражениях он означает одно и то же значение корня.) Из полученных значений неизвестного z получаем решения ис- ходного уравнения: — Ь + У'ь2 4ас — b — + 4яс Xi • Хо — • 1 2а 2а Эти формулы для решений уравнения второй степени совпада- ют с формулами, рассматриваемыми в курсе элементарней алгебры. Однако там они сбычно выводятся лишь для случая вещественных коэффициентов. Если Л2 — 4ас =# О, то полученные формулы дают два различных решения нашего урав- нения. Если Ь2 — 4ас = О, то X] = х2, т. е. уравнение обладает лишь одним решением. Отме- тим, что иногда в этом случае говорят не об одном решении, но о двух совпадающих решениях. Целесообразность соответствующей течки зрения выясняется в результате исследования более глубоких свойств полиномов. Отметим, что в случае, когда коэффициенты уравнения веще- ственны, уравнение при Ь2 — 4ас > О имеет оба решения вещественными. При Ь2 — 4ас < О оба решения оказываются комплексными, невещественными, сопря- женными между собой числами. При h2 — 4ас — О единственное решение уравнения вещественно. 283
2.4. Пример. Рассмотрим уравнение 2х2 — 8« + 8 — = 0. Его решение можно найти по формулам 2.3: Так как 4t = 4 (cos— -|- isin— \ \ 2 2 / го для y~4i имеем два значения, одно из которых есть: 2 cos — 4- i sin— 'i = У 2 4- (У 2. \ 4 4 / Таким образом, наше уравнение имеет решения: X, = 2 +1 (Г2+ Г2) =•+££+Ий 4 4 4 X, = 2 - А (/2 + 1 Г2) - - IJ. (. 2.5. Для исследования, решений уравнения третьей степени нам понадобится замена неизвестного (1.8), осуществляемая при помощи функции g(z) = 2 + 2L (М=/=0), г определенной на множестве всех комплексных чисел, отличных от нуля. Для любого числа х0 найдется такое г0, что Действительно, для заданного х0 искомое ге найдется как решение уравнения г2 — хсг + М = 0, которое, как мы знаем, всегда разрешимо. При этсм благодаря. М =# 0 получаем: z0 ¥= 0. Отметим, что если два решения zr и z4 вспомогательного урав- нения / (г 4- -) = 0 \ 2 / 281
связаны соотношением Zt Z2 = М, то для получения решений исходного уравнения / (х) = О согласно 1.9 достаточно взять одно из них. Действительно, . . , М м . . . £(*i) = *id-----------hz2 =g(z2>. г, г2 2.6. Алгебраическое уравнение третьей степени мы будем сразу рассматривать в виде А"3 + рх + q = 0 (р 0). Можно ограничиться этим случаем, так как из 1.12 следует, что любое уравнение третьей степени без труда приводится к та- кому виду/ а при р = 0 уравнение решается при помощи извле- чения корня. Совершим замену неизвестного 2.5 пока с неопределенным зна- чением постоянной М, которое потом подберем удобным для нас образом: / , М \3 / , М , А 2 4----4 р г н--------+ q = О, \ г / \ г / г® + З.Мг + З.М2 — + .И3 4 4- pz + рМ — 4- q = О, ? 4- (ЗМ 4- р)?4 4- </z3 4- (ЗЛ42 4- pW 4- М3 = 0. Возьмем для М значение, равное —у. Тогда получим: г6 4- — — = О. v 27 Для нового неизвестного мы получили уравнение шестой степе- ни. Впрочем, такое повышение степени не опасно, ибо полученное уравнение без труда решается в два приема. Обозначим одно из значений квадратного радикала: Решая полученное уравнение относительно г3, по формулам 2 3 получаем для 23 два значения: г3 = -4-4-/?. z3=-±-R. 2 2 Соответственно само неизвестное z получает шесть значений: 3 /----?----- 3/---------- гЪ»>3 = 1/ o’ Н" /?» г4>5>« — 1/ « 2W
Каждое из этих шести значений определяет решение исходного уравнения по формуле: х, = г,--------р— (/ = I. 2, 3, 4, 5, 6). 3z/ Однако решений х4, хь, хв можно не принимать во внимание. Дей- ствительно, для I, равного 4, 5 или 6, имеем: 3/------------- 3/--------------------------------- г' = |/ = з /— где k равно 1, 2 или 3, так как у/ z* равен zlt г.} или z3. (Мы восполь- зовались в проведенных преобразованиях тем, что zf -f- — р’ л з Р3 \ ------= 0, т. е. —а — Zt — — —— ' 27----7 27 г?' Таким образом, z, • z« = — — и согласно 2.5 г( (г = 4, 5, 6) приведет к тому же решению для х, что и гк (k = 1, 2, 3). Окончательно для исходного уравнения третьей степени мы нашли, что оно обладает тремя решениями, которые могут быть получены по формуле: В этих формулах для квадратного радикала можно ограничиться лишь одним значением, общим для обоих слагаемых. Для кубиче- ского радикала надо взять все три значения, причем каждый раз одно и то же в обоих слагаемых. 2.7. Отметим, что формуле, полученной в 2.6, иногда придают несколько другой вид. В 2.6 мы получили для х три значения: xk = zh-£- (А = 1,2,3). Но для каждого z*, как это было видно из проведенных в 2.6 рас- суждений, найдется свое z, (t = 4, 5, G), такое, что zft • zt = —р-. Поэтому Xfe — Zfr 2— = z* • -f- z(-. 2ЯВ
Подставляя вместо Zu и г, их значения, получаем для значений не- известного х формулу: В гаком виде эта формула обычно называется формулой Кардано. Значения кубических радикалов в ней следует выбирать так, что- бы их произведение равнялось — ~ (так как эти радикалы есть Zk р и г,, такие, что г< • г< = — — з 2.8. Пример. Решим уравнение: —2+ ]- 18х2 — 42х + 10 = О Прежде всего умножим его на — у. Затем заменой неизвестного у+ 3 приведем его к виду, для которого мы рассматривали в 2.6 уравнение третьей степени: (у + З)3 - 9 (у + З)2 + 21 (у + 3) - 5 = 0 Получаем для у уравнение. у3 — бу + 4 — 0. Теперь мы могли бы срезу применить формулу, полученную в 2.6, а также 2.7. Однако мы лучше воспроизведем все рассуждения 2.6. Произведем замену неизвестного 2.5: I (случаем преобразованное уравнение: + 4=0, г3 ЗЛ1г + ЗЛ42 — + ЛР— — 6г — 6,И-'- + 4=0, г г3 г ? + (3 М — 6) г4 + 4г3 + (3 Л42 — ЗЛ1) za + Л13 = 0. Возьмем для Л1 значение 2: , 2 У = ----. г Получаем уравнение'. ? + 4г3 + 8 = 0. Решаем его как уравнение второй степени относительно z3, причем, как было ука- зано в 2.6, берем для г3 лишь одно значение радикала: г3 = —2 + У Т"—8 = —2 + 2». 287
Извлекая кубический корень из числа —2 + 20 найдем три значения для г з.______ ,3 Г I 3 3 \ г- I « л \ г>= / — 2 + 21 = 1/ 2 у 2 I cos—л + i sin—п = V 2 . cos —Н sin =» у \ 4 4/ \ 4 4/ - 1 + I. Два остальных значения кубического корня пслучаются от умножения найден- ного значения на два невещественных корня третьей степени из единицы: / 1 /3 \ ?2 = (1 + 0 ш “ (1 + 0 ~ ~2~‘у* / 1 V3 \ г, = (1 + 0 (о* = (1 + I) - - - —I). Из полученных чисел г1( гд, г3 получаем три значения для неизвестного у: , 2 ь-' + ' + —-2- 2 г- у2 = (1+0о + (1+0 а>+ (1-0а)»= -1-V3 , (1 +1) СО у3 = (1 +0О» +(14Дм2 = (1 + i) со» + (1 — 0 ь) = -1 + /3 . Отсюда получаем решения исходного уравнения: *i = Ут + 3 = 5, х2 = у2 + 3 = 2 — 'КЗ, х3 — у3 + 3 ~ 2 + I 3" 2.9. Теперь перейдем к вопросу о решении уравнения четвертой степени. Для этого сперва отметим одно вспомогательное свойство полиномов второй степени. Если у полинома второй степени f (х) = сх2 + Ьх + с имеет место Ь2 — 4аг, — 0. то он представим в виде квадрата неко- торого полинома первой степени. Действительно, из Ь2 — 4ас = 0 следует, что при соответствующем выборе значений У а и Ус: b — 2 У а • Ус. Поэтому f (х) — ах2 + Ьх + с — (Уах)3 + 2 (V ах)У с + (Кс) = = (У ах + Ус}\ 2.10. Теперь непосредственно перейдем к уравнению четвертой степени, рассматриваемому согласно 1.12 в виде: х4 + рх2 + qx + г = 0. 238
При любом X, очевидно, справедливо равенство: х4 + рх2 + qx + г = (х2 + X)2 — [(2Х — р)х2 |- (~q)x + (X2—г)1. Подберем теперь для X такое значение, чтобы имело место: (-z?)2 - 4 (2Х - р) (X2 - г) =» 0. Таксе значение для X найдется, так как мы получаем для X уравне- ние третьей степени, которое не только разрешимо, но решения которого мы можем найти (кстати, нам достаточно иметь лишь одно значение X, т е. одно решение этого вспомогательного уравнения). Л1ы берем для X указанное значение потому, что в результате такого выбора X полипом второй степени, стоящий в квадратных скобках, согласно 2.9 оказывается равным квадрату некоторого полинсма перьой степени (ах 4- 0). Таким образом, при этом X левая часть нашего уравнения приобретает очень удобный для дальнейшего рассмотрения вид: (х2 + 1)2 _ (ах + 0)* = о. Можно придать левой части вид произведения- (х2 + X + ах + 0) (х2 + X — ах — 0) = 0. Чтобы число х0 было решением этого уравнения, очевидно, необходимо и достаточно, чтобы оно обращало в нуль одну из перемножаемых скобок. Таким образем, решениями нашего уравне- ния четвертой степени оказываются решения двух уравнений вто- рой степени: х2 4* ах 4- (X 4- 0) = 0, х2 — ах + (X — 0) = 0. Но уравнения второй степени мы решать умеем. 2.11. Способы решения алгебраических уравнений первой и второй степени были известны еще в древности. Невозможно ука- зать какую-либо дату, соответствующую открытию способов их решения, или каззать имена ученых, которым можно было бы при- писать это открытие. Решение уравнения третьей степени, как мы видим, значитель- но сложнее. Получить его удалось только в результате достаточно- го развития математических методов Способ решения уравнений третьей степени был найден итальянским математиком!' а р т а л ь я (1500—1557). Однако так как его способ был опубликован впервые итальянским математиком Кардано (1501—1576), то соответ- ствующая формула получила название формулы Кардано. Следует также указать, что несколько раньше способ решения уравнений третьей степени был получен итальянским математиком Сципионом Ферро (1465—1526, точность дат не вполне достоверна), который, однако, не опубликовал его. 10 Заназ 653 289
Как мы видели выше, решение уравнений четвертой степени может быть сведено к решению уравнения третьей степени. Это было обнаружено в 1545 г. Л. Феррари (1522—1565) — учени- ком Кардано. Последующие многочисленные попытки получить сходным об- разом решение уравнения пятой степени не увенчались успехом. Лишь много позже в результате исследований Э. Галуа (1811— 1832) выяснилась причина этой неудачи. Дело заключается в сле- дующем. Для уравнений первой, второй, третьей и четвертой степе- ней, как мы видели, существуют общие формулы решения этих уравнений (для уравнений четвертой степени мы не выписали в явном виде такой формулы, но это, конечно, нетрудно было бы сделать) Эти формулы выражают решения уравнения через его коэффициенты при помощи действий сложения, вычитания, умноже- ния, деления и операции извлечения корней. Казалось естествен- ным пытаться найти формулу такого же характера и для уравнений пятой степени. Однако вопрос о существовании подобной формулы, волновавший математиков многие десятилетия, в конце концов получил отрицательное решение. Ни для уравнений пятей степени, ни для уравнений более высоких степеней нет и не может быть полу- чено общих формул, выражающих решения через коэффициенты при помощи пяти вышеуказанных действий. Следует отдать себе отчет, что указанное обстоятельство от- нюдь не означает неразрешимости этих уравнений, в разрешимости их мы скоро убедимся Речь идет лишь о том, что ни для какого я 5 ке существует общей формулы, выражающей решения лю- бого уравнения степени п через коэффициенты этого уравнения при помощи действий сложения, вычитания, умножения, деления я извлечения корней различных степеней. Факт отсутствия общих формул сам по себе еще не предрешает ответа на соответствующий вопрос для каждого отдельного уравнения. Известно, что решения многих уравнений любых степеней выражаются через коэффициен- ты при помощи указанных пяти действий. Вопросом первостепен- ной важности является вопрос о том, существуют ли уравнения, у которых дело обстоит иначе, решения которых не могут бьпъ вы- ражены через их коэффициенты при помощи упомянутых действий. Хотя упорная систематическая работа по исследованию алге- браических уравнений велась математиками уже с XVI века, дока- зательство существования подобных уравнений было получено лишь во второй четверти прошлого века. Решающим в этом направ- лении оказались работы французского математика Э. Галуа. Оказалось, что, начиная с пятой, существуют уравнения любых степеней, решения которых не могут быть выражены через коэф- фициенты при помощи действий сложения, вычитания, умножения, деления и извлечения корней. Такие уравнения могут выглядеть совсем не сложно, как, например, уравнение: х5 — х — 1 =0. 2РС-
Однако доказательство упомянутого их свойства весьма не элементарно и опирается на результаты глубокой и сложной тео- рии. Основная идея этой теории заключается в том, что каждому алге- браическому уравнению сопоставляется некоторая конечная груп- па. Свойства этой группы определяют возможность выражения решений уравнения через его коэффициенты при помощи упомяну- тых пяти действий. Теория, посвященная изучению этих вопросов, называется теорией Галуа. Имеется целый ряд книг, посвященных ее изложению В качестве наиболее доступной для первоначального ознакомления с ней может быть рекомендована книга: Постни- ков М. М. Теория Галуа. М., 1963. § 3. Разрешимость алгебраических уравнений 3.1. Целью настоящего параграфа является доказательство того, что в области комплексных чисел всякое алгебраическое урав- нение ненулевой степени разрешимо, Другими словами, это озна- чает, что всякий полином, не являющийся постоянной, обладает корнями. Принципиальная важность этого результата очевидна. Соответствующая теорема часто называется основной теоремой алгебры. В настоящее время ввиду развития алгебры по некоторым новым направлениям указанную теорему уже нельзя считать основ- ной для всей этой пауки (многие отрасли современной алгебры не связаны с указанной теоремой), и все же эта теорема остается одной из важнейших теорем. По-видимому, впервые предположение относительно истинно- сти указанной теоремы было высказано Альбертом Жираром (1595—1632) в 1629 г. Даламбер (1717—1783) предложил в 1746 г. доказательство, которое нельзя признать безупречным. Впервые полное строгое доказательство основной теоремы алгебры было осуществлено Гауссом в 1799 г. Впоследствии Гаусс несколь- ко раз возвращался к доказательству этой теоремы и дал несколько существенно различных ее доказательств. Все доказательства указанной теоремы в гой или иной форме используют свойство непрерывности полиномов. Использование этого свойства может быть осуществлено различными способами. Мы выберем подход, опирающийся па теорему о наименьшем зна- чении модуля полинома. Формулировка этой теоремы напоминает известную из курса математического анализа теорему о наименьшем значении непре- рывной вещественной функции. Там она доказывается и для слу- чая одного вещественного переменного, и для случая двух веще- ственных переменных. У нас независимое переменное одно, но из- меняется в белее широкой области Z. Мы покажем, что наш случай может быть сведен к случаю, рассматриваемому в курсе математи- ческого анализа. 10* 291
3.2. Теорема о наименьшем значении мо- дуля полинома. Для всякого комплексного полинома f (х) всегда найдется такое число ха, что при всех значениях х имеет место: l/(Xo)KI/WI, т. е. модуль f (х) при х — хс принимает свое наименьшее значение. Доказательство. 1) У полинома / (х) = с0 4- С,Х 4- + ... 4- Ca-lX"-1 4- СлУ' представим его коэффициенты в нормальной форме представления комплексного числа: Ck — 4- РД (»й, Рь € К; k = 0, 1, 2, ..., п). Значениями независимого переменного х являются любые ком- плексные числа, поэтому х можно представить в виде х = £ 4- Ч*» где g и г) — любые вещественные числа, Можно говорить с £ и р, как о вещественных независимых переменных. Рассмотрим квадрат модуля нашего полинома: I/ (х)|2 «= |cfl 4- qx 4* с2х- 4- ... 4- сп^хп~' 4- спхп|2 = = 1(<*о + РоО 4- («1 4- Pit) (В + пО + («2 4- Р20 (I 4- яО2 4- ... ... + (а„_| 4- P,t—ii) (g 4- НО'1-’ 4- 4- М (g + *)«)'’ Iе = = |F 4- /ДТ- Здесь F получается как вещественная часть выражения, распо- ложенного под знаком модуля, если мы раскроем все входящие ту- да скобки, Н есть выражение, получающееся после того, как мы соберем там все члены, содержащие I. Легко видеть, что F и Н имеют вид полинома (многочлена) от двух вещественных переменных g и ту коэффициентами которых служат вещественные числа, зави- сящие очевидным образом от а.* и р* (А = 0, 1,2, .... п). Тем самым и квадрат модуля f (х) |/ (х)|2 - = Р + Н2 = Ф (g, п) оказывается выражением, которое можно рассматривать как ве- щественный полином от двух вещественных переменных g и ту 2) Если f (х) есть постоянная, то справедливость утверждения теоремы очевидна. Будем считать, что степень / (х) больше нуля. Согласно VII, 2.10 для числа М = |/ (0)| = |с0| найдется веще- ственное число Ьм > 0, такое, что |/ (х) | > М имеет место при всех значениях х, превосходящих по модулю Lu. Применим известную теорему из курса математического ана- лиза о наименьшем значении непрерывной вещественной функции от двух вещественных независимых переменных к функции Ф (g, г,) относительно числа LM. Это возможно, поскольку, как было пока- зано в первой части доказательства, Ф (g, т]) можно рассматривать как вещественный полином двух вещественных переменных. Для Ф (g, т]) согласно этой теореме среди множества значений переменных g и ту удовлетворяющих условию I1 + Л2 < L'm, 292
найдется такая пара значений Во. т]0, что неравенство Ф (Во. По) < Ф (£, И) будет иметь место для всех значений В и т], таких, что I2 4- И2 < L2M. Обозначим ха = Во 4- По*. Так как Ф (U По) = 7 Ml2. Ф(1, И) = 7(х)12. то написанное выше неравенство означает, что для всякого зна- чения х = В 4* П1, такого, что |х| = KF+п2 < LM, имеет место 7(х0)12<7(х)12- Так как значения модуля неотрицательны, то отсюда получаем: 7МК7 WI- Для полученного числа х0 мы доказали требуемое неравенство для таких значений х, которые по модулю не превосходят LM. Без труда докажем наше неравенство и для остальных значений х- Пусть |х| > LM. Тогда по определению LM: |/(х)| >М = |с0| =|/(0)|. Но нуль входит в число тех значений х, для которых требуемое неравенство уже было доказано (ведь |0| LM). Поэтому I/ (0)1 > |/ (х0)|. Объединяя два последних неравенства, получаем требуемое неравенство и для значения х, по модулю превосходящему LM: 1/(х)| >|/(0)|>|/(хо)|. 3.3. Доказательство интересующей нас теоремы о разрешимости алгебраических уравнений получится от соединения теоремы 3.2 с нижеследующим свойством модуля полинома. Лемма Даламбера. Пусть степень полинома больше нуля и число z0 не является корнем f (х). Тогда для этого z0 всегда найдется такое число zlt что 7 Ml <7 Ml- Доказательство. Пусть f (х) = с0 4- схх 4- с2х2 4- ... 4- ся_1хл-1 4- спхп. 293
Обозначим х — г0 = h, таким образом, х = z0 4- Л. В выражение для / (х) вместо х подставим (Zg 4- Л) и разделим обе части па число f (гэ) (которое по условию отлично от нуля): 77Т = 777 + 777 (2« + h) + 77 \ (2о+А)в+- • •+ (г° + + /(z0) /(го) /(г0) /(го) / (г0) + — (*0 + ^- /(го) Раскроем скобки и соберем члены с одинаковыми степенями Л: 77~ — 4- bxh 4- b2h1 4- • • • + Ьп_рп *4- Wi . / (*o) Коэффициент b0 определяется сразу. Для этого временно поле- жим х = га, т. е Л = 0. Получаем: .. . — / (г0> т. е. &0 — 1. Что касается прочих коэффициентов bit то для нас важно лишь то, что не все они равны нулю (иначе мы имели бы f (х) = — f (z0), т. е. полипом f (х) являлся бы постоянной, т. е. имел бы степень, равную нулю). Обозначим через Ь„ первое из чисел Ь1г Ъ2, • ••. Ьл, отличное от нуля (в частности, это может быть и bt). Мы имеем: 777 = 1 + bRh + b^x hk+l + ... + bnh* (Ьк 0). / Ио) По свойству модуля суммы получаем: ; I < 11 + ь, v 1+1 л-+>|+...+1 ьп h-1. I I W) I Переменнее Л может принимать любые значения (ведь h = х — z0, где х — независимое переменнее). Рассмотрим значения п вида: Ч- где 1—положительное вещественное число, меньшее единицы. Подставляя это выражение для Л в последнее неравенство, полу- чаем: где dk+1, .... dn— некоторые числа, зависящие лишь от bh, bh+1, ... ..., bn , но не от X. Так как числа (I — X*), Xм1, х*+2, .... х« вещественны и положительны, то модуль каждого из них равен самому числу. Поэтому I777I < !-Х* +Xft+,!d+1| + ...4X4dJ = I I I = 1 - Xй 4- xfr • X [|dft+11 4- х |dft+21 4- ... 4- X^-’ |d„ П. 2S4
Но X < 1, откуда следует: |^|<i_x* + ^.x[|dA+1| + |dft+2r+... + |doji I / (?с) I Теперь окончательно фиксируем h, придав Л вещественное зна- чение Хо, удовлетворяющее одновременно следующим трем усло- виям: Ч >0, К < 1, Хо [|d,+1| + |dft+2| + ... + |d„ |] < 1. При таком Z9, т. е. для значения х, равного zx — го-|-лор^— получаем: |7т41<1-^+^ = 1’ I / (го) I что и означает, что 17^)1 <\f (»«)!• 3.4. Пример. Способ отыскания для каждого z0 своего zit рассмотренный в 3.3, вполне осуществим в каждом конкретном случае. Рассмотрим, например, полином 13 f (к) = л4 — 4№ 4----л2 — 5л + 2 и постараемся для Zg = 1 найти такое г,, чтобы if (zi)l < !/(!)! = у Обозначим х — 1 = Л. Подставляем в ) (х) вместо х 1 4- h и делим ка f (1) = 1; fix) _ (14-Л)4 _4 (*4-А)» _|. 13 . (14-Л)» .кОЧ-Л). 2 e j + l/ol /11 /1\ 2 ш ш п 1 *Д \2/ \2/ \2/ \2/ \2! 4- Д’ 4- 2Л*. В качестве h будем брать числа вида: h = X ]/=Т, 0 < X < 1. Полагаем h = Ki. Тогда f (х\ । = 1 4- (Xi)2 + 2 (Xi)* = 1 - X »4- 2X*. Окончательно в качестве X надо взять такое число, чтобы 2Х2 < 1. Положим, например, Х= —, т. е. ?i = 1 4" А == 14* ~i. 295
Тогда f(i+ =i-l + 2 - = - I /(1) i 4 + 16 8' 1 17 7 1 IH’,+y)l=7-7 = 77<7=l/mi. 2 2 о 10 2 Интересно отметить, что, хотя исходный полином имел вещественные коэф- фициенты и заданное число 1 было также вещественным, искомое число оказалось невещещвенным. Нетрудно заметить, что в нашем примере и не существует такого вещественного zlt чтобы |/ (Z,)l < |/ (1)| = у. Действительно, если х вещественно, то вещественно и А, а тогда + + Таким образом, мы обнаружили, что доказанная лемма имеет место лишь при том условии, если мы действуем в области всех комплексных чисел Если огра- ничиваться областью вещественных чисел, то искомого числа г{ может в отдель- ных случаях и не оказаться 3.5. Теорема о корнях комплексных поли- номов. Всякий полином ненулевой степени имеет корни. Доказательство. Согласно 3.2 полином / (х) обладает таким числом х0, что при всех значениях х имеет место: If (Хо)1 С/ WI- Число х0 обязано быть корнем [ (х), так как в противном слу- чае для х0 согласно 3 3 нашлось бы такое число гь что 1/(гД| < |/ (х0)|. 3.6. Теореме 3.5 согласно нашим основным определениям мо- жет быть придана другая, эквивалентная формулировка. Теорема. Всякое алгебраическое уравнение ненулевой степени аохп + а1хгг~1 + ... 4- ап_гх + ап = 0 (а0 #= О, п > 0) разрешимо (разумеется, здесь имеется в виду: разрешимо в области всех комплексных чисел). 3.7. Доказанная теорема позволяет выяснить вопрос о множе- стве значений полинома. Дело в том, что множества всех значений, принимаемых той или иной функцией, вообще говоря, для разных функций различны. Например, для функции f (х) =—-—, задак- X — 1 ной на множестве всех отличных от 1 комплексных чисел, множе- ство ее значений состоит из всех комплексных чисел, отличных от нуля. Для f (х) — |х| множество значений состоит из всех веще- ственных неотрицательных чисел. Для постоянной г множество значений состоит из одного числа г. 296
Следствие. Множество значений всякого полинома ненуле- вой степени состоит из всех комплексных чисел. Действительно, какое бы ни взять комплексное число г, урав- нение / (х) — г =0 согласно 3.8 разрешимо: i (х0) — г = 0. Сле- довательно, при х = х0 полином / (х) принимает значение, равное произвольно заданному комплексному числу г. 3.S, Следует отметить, что доказательство теоремы 3.5, позволя- ющее утверждать существование корня, не дает способа для факти- ческого получения корней какого бы то ни было конкретного поли- нома. Рассуждения, составляющие это доказательство, не пред- ставляют собой алгорифма Поэтому вопрос о решении алгебраиче- ских уравнений отнюдь не снимается доказательством нашей тео- ремы. Действительно, обычно важно бывает не только знать о суще- ствовании корней, но получить их численные значения или выяс- нить те или иные их свойства. Не следует, однако, и недооценивать роли полученной теоремы. При исследованиях, посвященных оты- сканию способов фактического получения корней или изучению тех или иных их свойств, часто существенно используется факт существования этих корней. В ряде же теоретических вопросов, где появляются алгебраические уравнения, уже одно то, что корни существуют, позволяет сделать те или иные важные выводы. § 4. Сравнения с одним неизвестным 4.1. Среди алгебраических уравнений особое место занимают уравнения, в которые входят полиномы с целыми коэффициентами. С точки зрения теории чисел представляют интерес такие ре- шения этих уравнений, которые являются целыми числами. Ввиду той роли, которую играют в теории чисел сравнения целых чисел по какому-нибудь модулю (Ч.П, 2.7, 2.12), полезным и интересным является рассмотрение соотношений родственного вида, в которых вместо равенства имеет место сравнимость по заданному модулю. Такие соотношения с точки зрения понятия уравнения в широком смысле (I, 1.1) можно считать некоторым специальным видом урав- нений. По своему характеру они в определенной степени родствен- ны алгебраическим уравнениям. 4.2. Определение. Пусть заданы, полиномы с целыми коэффициентами f (х) = с0 + qx + сах2 + ... + cn_lxr‘~1 + спхп, g (х) =db + dpt + d,x'- + ... + d^xfe-1 + dkxk и натуральное число m > 1. Условие того, что целые числа, являю- щиеся значениями этих полиномов при некоторых целых числах х, сравнимы по модулю т, называется сравнением с неизвестным х по модулю т и обозначается'. I (х) =- g (х) (mod т).
Значения неизвестного х, являющиеся целыми числами, при которых значения f (х) и g (х) сравнимы по модулю т, называются решением данного сравнения. Говорят также, что эти значения неизвестного удовлетворяют данному сравнению. При указанной записи сравнения с неизвестным полином f (х) называют его левой частью, a g (х) — прозой частью. Сравнение с неизвестным, обладающее решениями, называется разрешимым, а не обладающее решениями — неразрешимым, Решить сравнение с неизвестным — это значит найти в язном виде все его решения. Это понятие носит описательный характер. Если все числа некоюрого класса чисел по модулю т' (Ч.П, 2.9) являются решениями сравнения с неизвестным по модулю т, то такой класс будем называть классом решений по модулю т' это- го сравнения. Особого внимания заслуживает случай, когда т' — — т. В литературе по теории чисел под термином «решение» для сравнения с неизвестным по модулю т обычно понимают не только одно число, удовлетворяющее сравнению, но и весь класс чисел, сравнимых с ним по модулю т. Это естественно в связи со свойством, рассматриваемым в следующем пункте. 4.3. Пусть целое число и является решением сравнения f (х) == g (х) (mod т), где f (х) = с0 + ох + с2х2 + ... + ся_1х’1*1 4- сп хп, g (х) = d0 + d,x + d2x2 4- ... + дк_гхк~1 +- dftx* . Тогда и всякое число из класса чисел по модулю т, содержащего и, является решением данного сравнения. Действительно, если v =s и (mod т), то согласно Ч.П, 2.14 (3) имеем: Со + cyj + с2о2 + ... + Сп_,ол-1 + cnvn = с0 + щи + C2U2 4- ... ••• + сп-1иП'1 + спи* (m°d d0 Н~ djV + d2v2 + ... + + d^ === de 4 dxu + d3u2 + ... ... + d^.jtz4-1 + dhu* (mod m}, и следовательно, f (и) = g (и) (mod m), t. e. v оказывается также решением рассматриваемого сравнения. Следовательно, для всякого класса чисел по модулю т имеет место одно из двух: или все числа этого класса суть решения дан- ного сравнения с неизвестным по модулю т (и значит, мы имеем класс решений по модулю т данною сравнения), или ни одно из чисел этого класса не является решением данного сравнения. Поэтому множество решений сравнения с неизвестным по моду- лю т разбивается на несколько классов решений по модулю т. Всякое разрешимое сравнение с неизвестным го модулю т благодаря доказанному выше имеет бесконечное множество реше- 293
нпй. Однако количество классов его репений по модулю т конечно и не превосходит т. Ввиду сказанного для произвольного сравнения с неизвестным по модулю т важной характеристикой является количество клас- сов его решений по модулю т. 4.4. Нахождение всех решений сравнения с неизвестным по мо- дулю т, или нахождение всех классов решений по модулю т этого сравнения, может быть произведено с использованием ка- кой-нибудь полной системы вычетов по модулю т, т.е. совокуп- ности чисел, взятых по одному из классов чисел по модулю т (Ч.П, 2.9). Возьмем какую-нибудь полную систему вычетов по модулю т и в ней выберем все числа, являющиеся решениями данного сравне- ния с неизвестным по модулю т. Пусть это будут &£.....kr (г т). Полученная совокупность характеризуется тем, что каждое из се чисел есть решение данного сравнения, эти числа попарно не сравнимы по модулю т и всякое решение рассматриваемого сравне- ния сравнимо по модулю т с одним из kt (4.3). Такую совокупность естественно было бы назвать приведенной системой решений дан- ного сравнения. При помощи такой совокупности можно удобным и полезным образом задать все решения сравнения. При всяком i = 1, 2, ..., г множество целых чисел х = kt (mod т) является для данного сравнения классом его решений по модулю т. Множество всех решений сравнения есть объедине- ние этих классов. Тем самым данное сравнение имеет в точности г классов решений по модулю т. Поэтому совокупность всех реше- ний данного сравнения может быть записана в виде: х = (mod т), х = ft2 (mod т), ..., х = kr (mod tn). 4.5. Пример. Для того чтобы решить сравнение х3 2х + 2=0 (mod 5), возьмем полную систему наименьших по абсовюгной величине вычетов по моду- лю 5: С, 1, —1, 2, —2. Из этих чисел данному сравнению удовлетворяют лишь 1 и —2. Значит, все решения сравнения составляют два класса решений по модулю 5: х = 1 (mod 5), х = —2 (mod 5). 4.6. Можно рассматривать и системы нескольких сравнений с одним неизвестным. Решением такой системы называется всякое целое число, являющееся решением каждого сравнения системы. Можно также говорить и о классах решений системы но тому или иному модулю. Пусть дана система сравнений с. одним неизвестным A W ё1 (х) (mod mJ, h(x)=sgAx) (mod m2), M zsgAx) (mod mJ, 299
h = HOK+ (mlt m2, ms). Если целое число и есть решение этой системы и v =s и (mod Л), то благодаря делимости h на каждое т1 имеем v == и (mod т(), и поэтому согласно 4.3 fi («) gt (v) (mod mt) (i = 1, 2....s). Таким образом, множество всех решений рассматриваемой си- стемы сравнений разбивается на несколько классов чисел по мо- дулю h, которые являются классами решений по модулю h этой системы. Количество классов решений по модулю h данной системы явля- ется одной из важных ее характеристик. Отыскание всех решений системы может быть осуществлено ана- логично 4.4, исходя из полной системы вычетов по модулю h. 4.7. Пример. Решим систему сравнений х2 + х + 1 = х? — 1 (mod 2), 2х° = 4 (mod 3), xi + х3 j- х2 + х = 2 (mod 4), HOK1" (2, 3, 4) = 12. Из чисел полной системы вычетов по модулю 12: 0, 1, —1, 2, —2, 3, -3, 4, -4, 5, -5, 6 — лишь одно число 2 удовлетворяет системе. Значит, система имеет один класс решений по модулю 12: х = 2 (mod 12). 4.8. В связи с рассмотрением классов чисел по различным мо- дулям отметим следующее свойство. Пусть для натуральных чисел т, т' >1 имеет место дели- мость т на т': т = т' d. Тогда всякий класс чисел К по модулю т' разбивается на d классов чисел по модулю т. При этом для любого и £ К числа и, и т.', и + 2m', ..., и + (d — 1)т' являются вычетами указанных классов чисел по модулю т, на кото- рые разбивается К. Действительно, указанные числа, очевидно, сравнимы с и по модулю т' и, значит, лежат в К, Эти числа попарно не сравнимы по модулю т, поскольку разность между любыми двумя различны- ми числами из этой совокупности по абсолютной величине меньше, чем т, и, значит, не делится на т. И наконец, всякое число v С К, т. е. о = и + m't (t G N), срав- нимо по модулю т с одним из указанных чисел. Для этого разде- лим с остатком I на d: t = dq + г (г — 0, 1, 2, ..., d — 1) и подста- вим в выражение v: v = и + т' (dq 4- г) = и 4 mq + т’г == и + rm' (mod т). ЗМ
4.9. Два сравнения (а также две системы сравнений) с одним и тем же неизвестным называются эквивалентными или равносиль- ными, если всякое решение каждого из них является решением дру- гого. Другими словами, множество решений одного из них совпада- ет с множеством решений другого. Из свойств числовых сравнения (Ч. II, 2.14, 5.23(9)) очевидным образом вытекает справедливость следующих свойств, устанавли- вающих эквивалентность сравнений-с неизвестным. Эти свойства удобно использовать при решении сравнений с неизвестным. 1) При любом полиноме h (х) с целыми коэффициентами сравне- ние f (х) =s g (х) (mod m) эквивалентно сравнению f (х) + h (х) = g (х) + h (х) (mod т). 2) При любом натуральном числе k сравнение f W =g (х) (mod т) эквивалентно сравнению kf (х) = kg (х) (mod km). 3) При любом целом числе а, взаимно простом с модулем т, сравнение f (х) s=g (х) (mod т) эквивалентно сравнению af (х) == ag (х) (mod т). 4) Если в сравнении с0Н- CjX + с2х2+ ... + cnxn=d0 + djX 4- d2x2+ ... + dhxk (modm) коэффициенты ct и d; заменить сравнимыми с ними по модулю т числами с'. == с(. (mod т), d’.= d (mod т) (i = 0, 1, 2, ..., п; j = 0, 1, 2, ..., k), то полученное сравнение со + cix + V2 + ••• + с'пхП — d'o + dix + d2xi + ••• + ^xft(mod m) эквивалентно исходному. 4.10. Благодаря свойству 4.9 (1) всякое сравнение f (х) = g (х) (mod т) может быть заменено эквивалентным ему сравнением f (х) — g (х) е= 0 (mod т). Поэтому при изучении сравнений с неизвестным можно всегда ограничиться сравнениями, правая часть которых есть нуль. 301
4.11 Пример. Решим сргзчеиие Шх'Ч- 72х2+ 51 = G (mod 24). Заменяем коэффициенты их остатками при делении с остатком на 24: 21Х4 + 3 = 0 (mod 24). Делим коэффициенты и модуль на 3: 7Х* 4* 1 = 0 (mod 8), или 7х“ — 7 =0 (mod 8). Коэффициенты делим на число 7, взаимно простое с модулем 8: х4 — 1=0 (mod 8). Полученное сравнение эквивалентно исходному. Решаем его Из полней системы наименьших по абсолютной величине вычетов по модулю 8 решениями полученного сравнения являются лишь 1, —1, 3, —3. Поэтому полученное сравнение, а значит, и исходное имеют четыре класса решений по модулю 8: х = 1 (mod 8), х = —1 (mod 8), х г 3 (mod 8). х = —3 (mod 8). Каждый из этих классов можно разбить согласно 4.8 на три класса чисел по модулю 24 Класс чисел х = 1 (mod 8) разбивается на классы чисел по модулю 24, вычетами которых являются числа 1, 1 + 8 = 9, 1 + 2 8 = 17: х = 1 (mod 24), х = 9 (mod 24), х = 17 (mod 24). Рассуждая аналогично для других классов, получаем: х = —1 (mod 24), х = 7 (mod 24), х е 15 (mod 24), х = 3 (mod 24), х = 11 (mod 24), х = 19 (mod 24), х = —3 (mod 24), x = 5 (mod 24), x = 13 (mod 24). Таким образом, исходное сравнение имеет двенадцать классов решений по модулю 24. 4.12 Если в сравнении с0 + CiX + с2хг + ... + спхп = 0 (rr.od т) какой-нибудь коэффициент ct делится на т, то согласно 4.9 (4) ин может быть заменен нулем и, значит, соответствующее слагаемое может быть опущено. Если коэффициент сп при наибольшей сте- пени х не делится на т, то п называется степенью сравнения. Срав- нение пулевой степени, очевидно, не имеет решений. 4.13. К понятию сравнения с неизвестным может быть осущест- влен подход па основе рассмотрения кольца классов чисел по дан- ному модулю (4.VII, 3.7 (3)). Обозначая для произвольного це- лого числа а через а класс чисел по модулю т, содержащий а, мы, исходя из произвольного сравнения с неизвестным са 4- сгх 4- с2х2 F ... + + спхп = 0 (mod т), построим соответствующее ему уравнение в кольце классов чисел но модулю т: С0 + СхХ + с2х2 + ... + Сд^х"-1 4- с„ха = 0. 302
Эю уравнение определяет значения неизвестного х, являющиеся некоторыми классами чисел по модулю т. Учитывая правила дей- ствий сложения и умножения в кольце классов чисел ио модулю™, видим, что решения полученного уравнения совпадают с классами решений по модулю т исходного сравнения. Поэтому вместо исход- ного сравнения с неизвестным можно рассматривать соответствую- щее уравнение в кольце классов чисел по данному модулю. В случае, когда гп есть простое число, кольцо классов чисел по модулю т образует поле (4.V1I, 3 12), и мы получаем уравнение в поле классов чисел по простому модулю tn. В связи с этим можно отметить, что при ином подходе к понятию полинома, о котором будет сказано в гл. IX (1 10), и алгебраические уравнения, в гом виде, как они рассматривались в настоящей главе, и сравне- ния с неизвестным по простому модулю могут рассматриваться как частные случаи общего понятия и общей теории, посвященной изу- чению полиномов, коэффициентами которых являются элементы произвольных, не обязательно числовых полей. Аналогично рассуждаем и для системы сравнений (х) = 0 (mod mJ, f2 (х) = 0 (mod m2), Л (х) н= 0 (mod mJ. Пусть h = НОК+ (то т2......mJ, h — т, • k, (i — 1, 2, ..., s). Согласно 4.9 (2) эта система сравнений эквивалентна системе ktfL (х) s 0 (mod Л), (х) = 0 (mod Л), о (mod fi). Заменяя каждое сравнение этой системы соответствующим уравне- нием в кольце классов вычетов по модулю Л, мы получаем систему уравнений в этом кольце. Решения этой системы уравнений суть классы решений по модулю h исходной системы сравнений. 4.14. Рассмотрим сравнения с неизвестным первой степени. Очевидно, их всегда можно представить в виде ах = b (med m), где а ф 0 (mod m). Теорема. Сравнение с неизвестным первой степени ах ss =з b (mod m) разрешимо тогда и только тогда, когда b делится на d = НОД+ (с, m). В этом случае количество классов его решений по модулю m (4.3) равно d. Доказательство. Разрешимость данного сравнения, очевидно, означает разрешимость в целых числах уравнения ах — ту — Ь. При этом целое числе и будет решением сравнения тогда и только тогда, когда найдется целое число и, такое, что пара и, и оказыва- ется решением полученного уравнения. 303
Уравнения указанного вида изучались в Ч.П, § 6 Согласно Ч.П, 6.2 разрешимость в целых числах полученного уравнения, а значит, разрешимость исходного сравнения означает делимость числа b на d. Пусть и — какое нибудь целое число, удовлетворяющее на- шему сравнению. Тогда благодаря Ч.П, 6.7 все целые числа, удовлетворяющие сравнению, — это числа х = и + m-t (t g N). Они составляют один класс чисел по модулю—: d / j т \ х = и mod — . \ / Согласно 4.8 этот класс чисел разбивается на d классов чисел по модулю т, вычетами которых являются числа: , т , ,,т . т и, и ----, и 4“ 2—, • • * » и л- (d — 1)—. d d d 4.15. В связи с теоремой 4 14 отметим, что сравнение с неиз- вестным первой степени ax = b (mod tn) в случае, когда оно разрешимо (т. е. b • d = НОД+ (а, т)), экви- валентно благодаря 4.9 (2) сравнению а Ь , , т. —х =— (mod -). d d d Здесь числа и взаимно просты. Последнее сравнение имеет один класс решений по модулю —. Он разбивается на d классов ре- d шений по модулю т. Для нахождения всех решений сравнения нам достаточно найти какое-нибудь одно его решение и, поскольку благодаоя сказан- ному выше все решения данного сравнения составляют один класс чисел х = и (mod —1 \ d) Этот класс ввиду 4.8 разбивается на d классов решений по модулю т исходного сравнения, вычетами которых служат числа: 1 771 । л /71 । / j t \ 771 = и, иг — и + —, и2 = и 4- 2—, ud_1 — и + (а — I) —. d d d Поэтому зсе решения исходного сравнения могут быть также запи- саны с помощью классов решений по модулю т в виде: х = и0 (mod т), х == ut (mod т), х = «2 (med т), ..., х = (mod т). 304
4.16. Нахождение какого-нибудь одного решения сравнения с неизвестным первой степени ах = b (mod т) очевидным образом можно свести к нахождению какого-нибудь целочисленного решения уравнения ах — ту — Ь. А это нами уже рассматривалось (Ч.П, § 6). Как отмечалось в Ч.II, 6.3, найти целочисленное решение полученного неопределен- ного уравнения можно с помощью выражения наибольшего обще- го делителя чисел а и т через эти числа. Необходимое выражение наибольшего общего делителя можно получить, используя после- довательность Евклида (Ч.П, 5.15). Также можно воспользо- ваться свойством подходящих дробей конечной цепной дроби (4.IV, 14 11(2)). Укажем непосредственную формулу для нахождения одного из решений рассматриваемого сравнения. Как отмечено в 4.15, дан- ное сравнение эквивалентно сравнению а'х = b' (mod m'), где а' = Ь' = —, т' = d = НОД+(я, т) Благодаря взаимной простоте чисел а' и т' мы на основании свойства функции Эйлера (Ч.П, 8.18) имеем (я')ф!т 1 == 1 (mod т'). Отсюда вытекает, что число и = (а')ч'<т )-1 • Ь' является решением рассматриваемого сравнения: а' • и = (a')<?<m *• b' s== b' (mod т"). 4.17. Пример ы. 1) Сравнение бх s 10 (mod 45) неразрешимо, посколь- ку 10 не делится на НОД1- (6,45) — 3. 2) Сравнение 6х г 15 (mod 45) разрешимо, поскольку 15 делится на НОД+ (6,45) = 3. Оно имеет три класса решений по модулю 45. Данное сравне- ние эквивалентно сравнению 2х = 5 (mod 15), которое имеет один класс решений по модулю 15. По формуле, полученной в 4.16, находим одно из решений заданно- го сравнения; и = 2Ф115)-1 . 5 = 27 . 5 = 64С Имеем: 640 = 10 (mod 15). Все решения нашего сравнения составляют один класс чисел х = 10 (mod 15). Он разбивается на три класса решений по модулю 45: хз 10 (mod 45), х = 25 (mod 45), х = 40 (mod 45). 305
4.18. Рассмотрим системы сравнений первой степени с одним неизвестным. При этом ограничимся системами, состоящими из сравнений вида х = w (mod mJ. Как мы увидим позже, к таким системам может быть сведена вообще всякая система сравнений с одним неизвестным. Теорема. Если система сравнений х = Н] (mod mJ, х = и2 (mod mJ, х = us (mod mJ разрешима, то она имеет в точности один класс решений по модулю h = HOiC(fflk,/n2, ..., mJ (4.6). Доказательство. Благодаря 4.6 нам достаточно по- казать, что любые два решения и и и данной системы сравнимы между собой по модулю Н. Так как и = «г (mod mJ, и = ut (mod mJ, то u = v (mod mJ (i = 1, 2, ..., s). Из делимости и — она каждое т1 получаем дели- мость и — vwah — НОК+ (/nJt т2, ..., mJ и, значит, и = v (mod hj. 4.19. Среди систем сравнений с одним неизвестным рассматри- ваемого вида особую роль играют такие, у которых модули попарно взаимно просты. Теорема. Система сравнений х = и} (mod mJ, х == и2 (mod mJ, х = и. (mod mJ, у которой модули тъ т2, ..., int попарно взаимно просты, всегда разрешима. Доказательство. Обозначим h = • т2 - ... • ms. Для всякого i = 1,2, .... s числа т, и — взаимно просты (Ч.Н, ffl; 5.23 (!)). Благодаря 4.14 каждое, сравнение — у 5= I (mod mJ fit} разрешимо; пусть уг — некоторое его решение (г =1, 2, s). Тогда целое число h h . . h и= - у1Ы1 4----y2u2 4-... 4--ysu. m, т.г ms является решением исходной системы сравнений. Действительно, для всякого i = 1,2, ..., s благодаря делимости ~ на т, при / i имеем: ту и = — у,Ц| (mod mJ. 306
Так как согласно выбору чисел у, имеет место — >,= 1 (mod mJ, то и = щ (mod т) (i =1, 2, s). 4.20. Пример. Система сравнений х = 2 (mod 3), х = 3 (mod 4), х = 4 (mod 5) разрешима и имеет один класс решений по модулю h — 60. Используя рассуждения, проведенные в доказательств теспемы 4.19, aaft- дем одно из решений системы. Для этого берем по одьоыу решеннл каждого срав- нения: 20у г 1 (mod 3), lay = 1 (mod 4), 12у = 1 (mod 5). Например, Л =2, Уа=-1, Уз=—2 Искомым решением является: и = 20 • 2 • 2 + 15 • (—1) -34-12- (—2) - 4 = —61. Имеем: - 61 = —1 (trod 60) Вес решения системы составляют один класс чи- сел х = —1 (mod 60). Нашу систему можно решить и более коротким путем. Для этого достаточно заметить, это целое число х будет решением системы тогда и только тогда, когда х + 1 делится ta числа 3, 4, 5, т. е. когда х + 1 делится на 60. Множество этих чисел х образует один класс чисел по модулю 60: х s —1 (mod 60). 4.21. Рассмотрим один общий способ решения системы сравне- ний указанного вида по произвольным модулям: х = (mod mJ, х = (mod /nJ, x s= us (mod mJ. Сначала решаем систему, состоящую из первых двух сравне- ний; х === иг (mod mJ, х == и2 (mod m2). Первое сравнение определяет целые числа, представимые в виде х = 4- mJ (/ С Ю- Находим все значения t, при которых со- ответствующие значения х удовлетворяют и второму сравнению: Uj J- mJ = и2 (mod mJ, или, что то же самое: mJ = (u2 — uj (mod m2). Разрешимость этого сравнения относительно t (а значит, и разре- шимость системы, состоящей из первых двух сравнений) означает 307
согласно 4.14 делимость и2 — их на d = 1ЮД+ (т-, т2). Ввиду 4.15 множество решений последнего сравнения (в случае, когда оно разрешимо) составляет один класс чисел по модулю — ; d t = t0(mod—\, \ d Г где 4 — одно из решений этого сравнения, т е. t=t0 + -Jq <q^)- а Поэтому решениями системы, состоящей из первых двух сравнений исходной системы, являются числа х = и1 + т1 р0 + q\ = (Ut + /п,4) + q \ а ] а при всевозможных q < N. Эти значения х образуют один класс чисел по модулю - — = НОК+ (тх, т2): d х (иi + tnxt0) (mod m —1 \ d / Таким образом, первые два сравнения исходной системы могут быть заменены одним полученным сравнением с неизвестным такого же вида, Вместо исходной системы из sсравнений с неизвестным мы можем решать эквивалентную ей систему, состоящую из (s — 1)-го сравнения аналогичного вида. Продолжая этот процесс, мы или убедимся в неразрешимости системы, или найдем все ее решения. 4.22. Пример. Способом 4.21 решим систему сравнений. х = 2 (mod 4), х = 4 (mod 6), х = 7 (mod 15). Сначала решаем систему, состоящую из первых двух сравнений: х = 2 (mod 4), х = 4 (mod 6). Имеем: х — 2 + 41 г 4 (mod 6), т. е. 4/ = 2 (mod 6). Значит, t = 2 (mod 3), т е. I = 2 J- Зу, и поэтому х — 2 + 4 (2 + 3q) = 10 + 12р (д £ -V), т. е. х = 10 (mod 12). Заменяя этим сравнением первые два сравнения системы, получаем новую систему, эквивалентную исходной: х = 10 (med 12), х = 7 (mod 15). Решаем ее аналогичным способом. Имеем: х = 10 + ',2q = 7 (mod 15), 12<? = —3 (mod 15}, 4q = —1 tmed 5). Следовательно, q s 1 (mod 5), t. e. q = 1 + 5p (p € N), и поэтому x = = 10 + 12 (1 + 5p) = 22 + 60p. 308
Гаким образом, лее решения исходной системы образуют один класс чисел по модулю 60: х = 22 (tr.od 60). 4.23. Всякая система сравнений с одним неизвестным fi (х) = 0 (mod /И;), ft (х) а 0 (mod m2), is (х) = 0 (mod ms) может быть следующим образом сведена к системам, состоящим из сравнений вида х =н и (mod т). Решая каждое сравнение системы Д (х) == 0 (mod /п;), найдем все классы его решений по модулю т,- х s u,i (mod mi), х =s u,-2 (mod mi)..' х = u^/mod mi). Если окажется, что какое-нибудь из сравнений системы неразреши- мо, то, очевидно, и вся система неразрешима. Для каждого i = 1,2.....s возьмем по одному классу решений но модулю mi соответствующего i-ro сравнения системы и с по- мощью них составим всевозможные системы вида х - U|/t (mod /Hj), х е= u2/2 (mod m2), x == uSj' (mod m5). Легко видеть, что произвольное целое число будет решением исходной системы сравнений тогда и только тогда, когда оно яв- ляется решением какой-нибудь из построенных систем сравнений первой степени. Поэтому множество всех решений исходной систе- мы состоит из всех решений всевозможных построенных систем сравнений. 4.24. Пример. Для нахождения всех решений системы X* + 2х + 1 = 0 (mod 4), х3 + 3 = 0 (mod 10) решим сначала каждое из сравнений. Первое сравнение имеет два класса решений по модулю 4: х = 1 (mod 4), х = —1 (mod 4). Второе сравнение имеет один класс решений по модулю 10: х = 3 (mod 10). Для нахождения всех решений исходной системы следует вешить две системы: 1 х = 1 (mod 4), I х = ~ 1 (mod 41- (х = 3 (mod 10), ( х = 3 (mod 10). 309
Решая их способов 4.21, получаем: х = — 1 (mod 20), х = 3 (mod 20). Полученные решения составляют множество всех решений исходной системы. 4.25. Сравнение с одним неизвестным может быть следующим образом сведено к системе сравнений. Теорема. Всякое сравнение с одним неизвестным f (х) = 0 (mod т), где модуль т разлагается в произведение попарно взаимно простых множителей: т = m.t т2 ... • ms (т, >1), эквивалентно систе- ме сравнений f (х) s 0 (mod mJ, f (х) =0 (mod m2), f (x) Я 0 (mod mJ. Доказательство. Если целое число и есть решение исходного сравнения, т. е. / (и) делится на т, то f (и) делится и на каждое из чисел mlt m2.ms, и, значит, и есть решение системы. Обратно, если / (и) делится на каждое из чисел тп т2, ..., т5, тс благодаря их попарной взаимной простоте f (и) делится и на их произведение mj • m2 • ... • ms = m (Ч.П, 5.23 (5)). 4.26. При использовании теоремы 4.25 удобно брать канониче- ское разложение модуля: т = р^'р2г ... P*s, где р, — различные простые числа, k, 1 (/=1,2, ..., s). При этом роль попарно взаимно простых множителей играют степени простых чисел р\\ р%’, ..., р>. В соответствии с теоремой 4.25 произвольное сравнение с одним неизвестным может быть сведено к системе сравнений с одним неизвестным по модулям вида где р — простое число. Ввиду 4.23 для нахождения всех решений этой системы достаточно решить каждое из ее сравнений. Таким образом, вопрос о решении произвольного сравнения с одним неизвестным в указанном выше смысле сводится к нахожде- нию всех решений соответствующих сравнений но модулям, явля- ющимся степенями простых чисел. 4.27. Пример Сравнение 17 + х1 f 0 (mod 35) эквивалентно системе сравнений х1 + х2 = 0 (mdd 5), х‘ + х2 = 0 (mod 7). 310
Первое из сравнений этой системы имеет два класса решений по модулю 5s х = 0 (mod 5), х = —1 (mod 5). Второе — тоже два класса решений: х = 0 (mod 7), х = —1 (mod 7). Следует решить четыре системы (х = 0 (тос 5), / х = 0 (mod 5), j х = —1 (mod 5), (х = —1 (mod 5), | х = 0 (mod 7), j х = —1 (mod 7), | x = 0 (mod 7), (x = —1 (mod 7). Решая эти системы находим все решения исходного сравнения: х = 0 (mod 35), х = —15 (mod 35), х = 14 (mod 35), х = — 1 (mod 35). 4.28 Учитывая 4.26, рассмотрим сначала произвольное срав- нение с неизвестным по простому модулю р; f (х) = 0 (mod р). Разделим с остатком f (х) на хр — х: f (х) = (** — х) • q (х) + г (х). Согласно VII, 3.11 частное q (х) и остаток г (х) суть полиномы с целыми коэффициентами. Т е о р е м а. Сравнение с неизвестным по простому модулю f (х) == 0 (mod р) эквивалентно сравнению г (х) = 0 (mod р), где г (х) есть полином, степень которого не превосходит р — 1, являющийся остатком при делении с остатком f (х) на хр — х. Доказательство. Имеем: / (х) = (хР — х) • q (х) + 4- г (х). Так как при любом целом значении х имеет место х° — х я=а 0 (mod р) (Ч.П, 8.20), то / (х) = г (х) (mod р). Следовательно, сравнения с неизвестным, указанные в форму- лировке теоремы, эквивалентны между собой. 4.29. Пример. Чтобы решить сравнение х13 — х11 + х’ — х7 + Xе + х3 + х + 1 = 0 (mod 7), разделим с остатком полином, стоящий в левой части, на х7 —х. Согласно 4.28 солучаем сравнение, эквивалентное исходному: 2х3 + х 4- 1 н 0 (mod 7). Его решения составляют один класс чисел х = —3 (mod 7). 4.33. Для сравнения с неизвестным по простому модулю можно дать оценку количества классов его решений по данному модулю, зависящую лишь от степени сравнения (4.12). Теорема. Пусть р — простое число. Для произвольного сравнения с неизвестным п-й степени по модулю р количество клав' сов его решений по модулю р не превосходит п. 311
До казательствс. Рассуждаем по индукции относи- тельно п. При п — 0 имеем сравнение нулевой степени, которое всегда неразрешимо. Пусть п > 0 и наше утверждение справедливо для всех срав- нений с неизвестным, степень которых меньше п Пусть сравнение ц-й степени / (х) = О (mod р) разрешимо и целое число и есть его решение. Разделим с остатком / (х) нах — м: f(x) = (х — и) • q (х) 4- f(u). Здесь q (х) есть полином с целыми коэффициентами (VII, 3.11), его старший коэффициент, как и у f(x), не делится на р. Пусть целое число v тоже есть решение сравнения f (х) = s= 0 (mod р), причем и и v лежат в разных классах чисел по мо- дулю р. Покажем, что тогда и есть решение сравнения q (х) = 0 (mod р). Имеем: f (о) = (о — и) q (и) + f (и). Так как числа / (и) и f (и) делятся на р, то и (и — и) • q (v) тоже делится на р. Так как v # и (mod р), тс v — и не делится на р. Поэтому q (v) делится на р и, значит, р (о) == О (mod р). Из доказанного вытекает, что все классы решений по модулю р сравнения f (х) = G (mod р), за исключением одною класса, содержащего и, являются классами решений по модулю р и срав- нения q (х) = 0 (mod р). Так как степень полинома q (х) меньше п, то согласно индуктивному предположению количество классов решений по модулю р сравнения (/ (х) = 0 (mod р) не превосходит п — 1. Поэтому количество классов решений по модулю р сравне- ния [ (х) = 0 (mod р) не превосходит п. 4.31. Следствие. Если сравнение с неизвестным по про- стому модулю си + <4х + с2х2 + ... 4- сд_1Х"-1 4- спхп = 0 (mod р) имеет более чем п классов решений по модулю р, то все коэффициен- ты с0, clt сг, ..., сп-1, сп кратны р. 4.32. Используя 4.31, можно получить интересное условие про- стоты натурального числа, называемое обычно критерием Вильсо- на. Следствие. Натуральное число р будет простым тогда и только тогда, когда (р — 1)! 4- 1 делится на р. Доказательство. Пусть р — простое число (можно считать р > 2). Согласно теореме Ферма (Ч.П, 8.19) числа 1, 2, ..., ..., р — 1 удовлетворяют сравнению хр~1 — 1=0 (mod р). 312
Эти же числа удовлетворяют также сравнению (х — 1) (х — 2) ... (х — р + 1) = 0 (mod р). Следовательно, числа 1, 2, ..., р — 1 являются решениями сравне- ния (х — 1) (х — 2) .. (х — р + 1) — (хр-1 — 1) = 0 (mod р). Учитывая, что числа 1, 2, ..., р — 1 попарно не сравнимы между собой по модулю р, получаем, что последнее сравнение имеет р — 1 классов решений по модулю р. Раскрывая скобки и собирая вместе члены с одинаковыми степенями х, приведем полином, стоящий в левой части этого сравнения, к нормальной форме. Члены с хр~1 уничтожатся. Следовательно, степень этого полинома меньшер — 1. Согласно 4.31 каждый коэффициент его, в том числе и свободный член, равный (р — 1)! 4* 1, делится на р. Пусть теперь число р не простое, р k, где 1 < k < р. Тогда (р - 1)1 : Л. Отсюда следует, что (р — 1)! 4- 1 не делится на k. Но тогда (р — 1)! 4 1 не может делиться и на р. 4.33, Перейдем к рассмотрению сравнения f (х) s 0 (mod рк), где р — простое число, k > 1. Укажем один способ, при помощи которого нахождение всех ре- шений этого сравнения может быть сведено к нахождению решений сравнения f (х) = 0 (mod р*-1). Тем самым, в конечном итоге задача нахождения всех решений ис- ходного сравнения может быть сведена к сравнению по простому модулю f (х) == 0 (mod р). Всякое решение сравнения f (х) = 0 (mod рк} является, оче- видно, и решением сравнения f (х) = 0 (mod р*~’). Учитывая так- же, что всякий класс чисел по модулю р*-1 разбивается на р клас- сов чисел по модулю рк (4 8), получаем, что всякий класс решений по модулю р* сравнения f (х) es 0 (mod рк} содержится в некотором классе решений по модулю рк~х сравнения / (х) = 0 (mod р*-1). Таким образом, нам достаточно для каждого класса решений х = и (mod р*-1) сразнения / (х) = О (mod pft_J) выяснить, какие из его чисел х = и 4 р*-1 • t (при некоторых t С V) являются ре- шениями сравнения f (х) == 0 (mod рк). Это можно сделать следую- щим образом. Используя разложение Тейлора (VII, 3.9), имеем: / (х) = f (о 4- Р*-1 0 = f (v) 4- f (v) (р*-Ч) + ^(pft-4)4 4--. .. 4- ^Чр*-1/)”, nt ’ ыз
причем числа f (if), f (v), целые. В этом разложении зсе слагаемые, начиная с третьего, делятся на рк. Поэтому число X = v 4- рь—Ч будет решением сравнения f (х) =s 0 (mod pk) тогда и только тогда, когда соответствующее значение t удовлетворяет сравнению первой степени: f (v) + f'(v) pk~4 = 0 (mod pk). Учитывая делимость f (о) на pft_1, заменим это сравнение с неизве- стным t эквивалентным ему: f = — Ж.(щоар). рК—\ Если это сравнение неразрешимо относительно t, то в классе решений х = v (mod pft_1) сравнения f (х) == О (mod pft_l) не со- держится решений сравнения f (х) = 0 (mod pk). Если это сравнение разрешимо относительно t и f'(v) • р, то любое целое число I удовлетворяет ему и тогда все числа класса х = v (mod р*"1) являются решениями сравнения f (х) = 0 (mod р*). Пусть теперь рассматриваемое сравнение разрешимо относи- тельно t и /' (и) не делится на р. Ввиду взаимной простоты чисел f (□) и р это сравнение имеет один-единственный класс решений по модулю р (4.14): t = tn (mod р) (здесь t0 — какое-нибудь одно решение этого сравнения). Числа этого класса представимы в виде t =• to + Pl при произвольных I £ N. При этих t соответствующие значения х, являющиеся решениями f (х) = 0 (mod pR) в классех == v (mod pk~l), записываются в ваде- х - v + pW (/0 + рЛ = (и + р*-%) + рЧ (I € N). Эти значения х составляют один класс чисел по модулю pft: х sb v 4- р*-^ (mod pk). 4.34. Пример. Решим сравнение х6 + Юх3 4- х + 6 = 0 (mod 108). Имеем каноническое разложение модуля: 158 = 2’ • 3®. Данное сравнение экви> валентно системе (4.25): Xs 4- 10x«d- х 4- 6 г= 0 (mod 4), х6 4* IC.v® -г х 4- 6 = 0 (mod 27). Первое из этих сравнений, как легко видеть, имеет только един класс решений ио модулю 4: х = 2 (mad 4). Второе сравнение решим способом 4.33. Для этого решаем сначала сравнение х* 4* Юх* 4- х -т1 6 = ? (mod 3). 314
Легко видеть, что всякое целое число является его решением. Поэтому сравнение имеет три класса решений по модулю 3: х = О (mod 3), х = 1 (mod 3), х = —I (mod 3). С помощью эти х классов чисел по модулю 3 решаем сравнение х*' 4- Юл1 4- 4- х 4- 6 = 0 (mod 9) или эквивалентное ему х4 4- х3 4 х 4 6 = 0 (mod 9), обозначая его левую часть / (х) = х5 4- х3 4- х 4- 6. В классе х = О (mod 3) берем числа х = 3t при значениях t, удовлетворяю- щих соотношению /'(0) . t = _ (moo 3), т. е. t = — 2 (mod 3), /=—2 4-3/ (I € N). 3 Получаем: x = 3 (—2 4- 3/) = —6 4- 9/. Эти числа образуют один класс реше- ний сравнения f (х) =0 (mod 9): х = 3 (mod 9). В классе х s 1 (mod 3) берем числа х = 14-3/, где / удовлетворяют соот- ношению f (!)•/ = ——-(mod 3), т. е. 9/ = —3 (mod 3). Здесь / — произволь- 3 ное целое число. Значит, весь класс состоит из решений сравнения f (х) = = 0 (mod 9). Этет класс разбивается на три класса решений по модулю 9 этого сравнения: х s 1 (mod 9), х = 4 (mod 9), х = —2 (mod 9). В классе чисел х = —1 (mod 3) ищем числа х~ —14- 3/, где / удовлетво- ряют соотношению /'(—1) • t “ (mod 3), т. е. 9/ =—1 (mod 3). Таких / 3 не существует. Значит, в рассматриваемом классе чисел нет решений сравнения f (х) = 0 (mod 9). Наконец, с помощью найденных классов решений сравнения / (х) = 0 (mod 9) находим аналогичным образом решения сравнения х* 4- Юх5 4- х 4- 6 = 0 (mod 27) В классе х = 3 (mod 9) находим лишь один класс решений рассматриваемого сравнения х = —0 (mod 27). В классе х е 1 (mod 9) нет решений данного сравнения. Класс х = 4 (mod 9) состоит целиком из решений рассматриваемого срав- нения, и поэтому он разбивается на гри класса решений по модулю 27: х = 4 (mod 27), х = 13 (mod 27), г = — 5 (mod 27). Класс х = —2 (mod 9) гоже целиком состоит из решений нашего сравнения, и, значит, мы получаем еще три класса решений этого сравнения: ха- -2 (mod 27), х = 7 (mod 27), х = —И (mod 27). Итак, для нахождения всех решений исхсдного сравнения по модулю 108 следует решить следующие системы: ( х = 2 (mod 4), ( х = 2 (mod 4), I х = 2 (mod 4), J х = 2 (mod 4), i х = —6 (mod 27), I x - 4 (mod 27), ( x = 13 (mod 27), ( x = —5 (mod 27), x = 2 (mod 4), x = —2 (mod 27), x = 2 (mod 4), I x = 7 (mod 27), 1 x = 2 (mod 4), x = —11 (mod 27). Решая эти системы, находим вес решения заданного сравнения: х е — 6 (mod 108), х = 58 (mod 108), х = —14 (mod 108), х н 22 (mod 108), х — —2 (mod 108), х = 34 (mod 108), х ~ —38 (mod 108). 315
Г лава IX. РАЗЛОЖЕНИЕ ПОЛИНОМОВ НА МНОЖИТЕЛИ § 1. Кольца полиномов над полем 1-1. Так как в области полиномов один из заданных полиномов далеко не всегда делится на второй, то свойства делимости образуют сложную теорию. Эта теория во многих отношениях напоминает теорию делимости целых чисел (Ч.П, § 4, 5, 6, 7). Возможность разложить изучаемый полином на произведение множителей, являющихся полиномами мекыпей степени, часто зна- чительно облегчает рассмотрение данного полинома. Это особенно полезно в задаче нахождения корней полинома (другими словами, для решения алгебраического уравнения), поскольку корнями исходного полинома будут корни его сомножителей (VII, 4.6). О том, что изучение полиномов более высоких степеней вызывает обычно значительно большие трудности по сравнению с изучением полиномов меньших степеней, мы уже говорили. 1.2. В связи со сказанным естественно поставить вопросы: какие полиномы могут быть разложены в произведения полиномов меньших степеней? Сколькими различными разложениями обла- дают разложимые полиномы? Каковы свойства этих разложений? Как связаны между собой различные разложения одного полинома? Сднако, прежде чем перейти к отысканию ответов на эти вопросы, необходимо уточнить самую их постановку. Допустим, нас инте- ресует полином + 2. Разложим ли он на множители? Положительный ответ может быть дан благодаря следующему разложению: где с — любая постоянная, отличная от нуля. Однако такое разло- жение нас не удовлетворит, так как не может быть использовано для изучения свойств самого полинома. Ставя вопрос, мы имели в виду отнюдь не такие «тривиальные» разложения. Итак, будем говорить о разложениях, у которых множители являются полиномами ненулевой степени. Материал школьной ал- 316
гебры дает отрицательный ответ на вопрос о такой разложимости нашего полинома х2 4- 2. Однако вместе с тем мы можем написать следующее разложение. х2 + 2 = (х + i 1/2) (х — !/2). Как согласовать получающееся противоречие? Во всяком слу- чае, не так, чю в элементарной алгебре х2 -j- 2 неразложим, а в высшей — разложим. Сравнив оба ответа, мы убеждаемся, что различие ответов зависит от того, какими числами мы позволяем себе оперировать. Оставаясь в области вещественных чисел, мы без труда можем доказать неразложимость полинома х2 + 2 на произведение полиномов ненулевой степени. Если же обратиться к более широкой области всех комплексных чисел, то мы получим написанное выше разложение нашего полинома. Аналогичный вопрос, поставленный для полинома х2 — 2, также получил бы различные ответы, в зависимости от того, в какой области чисел мы пожелали бы оперировать. В области всех вещественных чисел имеет место разложение х2 - 2 = (х + 1/2) (х — 1/2). В то же время, пользуясь известным фактом, что У 2 не является рациональным числом, было бы нетрудно доказать, чго полином х2 — 2 неразложим на произведение полиномов ненулевой степе- ни с рациональными коэффициентами. Итак, исследование разложений полиномов на множители ока- зывается существенно зависящим от того, в какой области чисел производится исследование. Казалось бы, можно избежать этого усложняющего обстоятельства, зафиксировав раз и навсегда ка- кую-нибудь область чисел, только относительно которой и про- водить все рассуждения. Однако такое ограничение оказалось бы в противоречии с интересами как развития самой алгебры, так и ее приложений (например, в вопросах физических или геометриче- ских, очевидно, совсем не безразлично, являются ли величины, получающиеся в каком-либо рассуждении, вещественными или нет, положительными или отрицательными). Необходимо строить теорию так, чтобы она могла быть использована в равной степени относительно и одного, и другого класса чисел. Какие же классы чисел — числовые области — следует иметь в виду? Существует несколько точек зрения, исходя из которых комплексные числа можно разбивать на различные классы. Такая классификация зависит от того, какие свойства чисел существен- ны для данного исследования. Алгебра в основном интересуется числами с точки зрения четырех арифметических действий над ними (сложение, вычитание, умножение, деление). Поэтому есте- ственно, что основным понятием, обособляющим некоторые клас- 317
сы чисел, будет такое, которое выделит классы чисел, замкнутые относительно этих четырех действий, т. е. понятие числового поля. 1.3. Определение. Если все коэффициенты полинома [ (х) = с0 4- щх + С2х2 + ... 4- с^хп являются числами из поля Р, то / (х) называют полиномом над по- лем Р. Следует сразу же отметить, что, поскольку коэффициенты какого-нибудь полинома могут все принадлежать одновременно и одному полю Plt и другому полю Р2, это,- полином соответствен- но будет называться и полиномом над полем Plt и полиномом над полем Р2. Например, все полиномы могут рассматриваться как полиномы над полем всех комплексных чисел. Полиномы с рацио- нальными коэффициентами являются полиномами над любым чис- ловым полем, поскольку всякое числовое поле содержит все рацио- нальные числа Большинство наших последующих теорем будет формулиро- ваться для полиномов над произвольным числовым полем. Тем самым мы получим результаты, которые могут быть непосредствен- но переформулированы для важнейших числовых полей Q, R, Z и вообще для любого числового поля, необходимость рассмотрения которого может возникнуть в той или иной задаче. Впрочем, для полей Q, R, Z будут осуществлены и дополнительные специальные рассмотрения, которые приведут нас к некоторым дополнительным результатам, специфическим для каждого из этих полей. 1.4. Поскольку коэффициенты полиномов, являющихся сум- мой, разностью или произведением двух заданных полиномов, получаются из их коэффициентов при помощи четырех арифметиче- ских действий, мы можем сделать следующее важное заключение. Если f (х) и g (х) являются полиномами над полем Р, то и поли- номы / (х) 4- g (х), f (х) — g (х), f (х) • g (х) суть полиномы над тем же полем Р. Проанализировав, как строятся полиномы s (х) и г (х) при деле- нии с остатком (VII, 3.2): / (х) ^g (х) s (х) 4- г (х), мы так же можем утверждать следующее. Если f (х) и g (х) являются полиномами над полем Р, то и поли- номы з (х) и г (х), являющиеся частным и остатком при делении с остатком f (х) на g (х), также суть полиномы над Р. В частности, если f (х) делится на ненулевой полином g (х): /(х) = g(x)s(x), то частное s (х) есть полином над тем же полем Р. 1.5. Если / (х) есть полином над Р и а £ Р, то непосредственно ьидно, что f (а) С Р. При этом, однако, вполне возможно, что f (и) £ Р, хотя а £~Р. 31£
В частности, следует иметь в виду, что корень полинома над полем Р вполне может оказаться числом, нс содержащимся в Р. Например, корни полинома над полем вещественных чисел х2 4- 1 невещественны, корни полинома над полем рациональных чисел х2 — 2 иррациональны. 1.6. Вспомнив понятие кольца (4.V1I, 3.2), мы можем указан- ные в 1.4 результаты оформить в виде следующего утверждения. Совокупность всех полиномов над некоторым числовым полем Р является кольцом. Обычно эту совокупность так и называют кольцо полиномов над Р. Если в совокупности всех полиномов над Р, помимо действий сложения и умножения, в качестве самостоятельной операции рас- сматривать операцию умножения полиномов на числа из Р, ю мы получаем линейную алгебру над Р (IV. 9.2), которую обычно назы- вают алгеброй полиномов над Р 1.7. В некоторых случаях может представиться необходимым рас- смотреть совокупность полиномов, все коэффициенты которых со- держатся в множестве чисел К, являющемся числовым кольцом, но не нолем. Их можно называть полиномами над числовым кольцом Д'. Важнейший пример дают целочисленные полиномы, все коэффи- циенты которых являются целыми числами. Легко видеть, что сово- купность таких полиномов также является кольцом Однако в наших дальнейших рассуждениях мы не будем останавливаться на таких случаях, за исключением кольца целых чисел. Причем и в этом случае рассмотрение целочисленных полиномов в основном сводится к рассмотрению полиномов над нолем рациональных чисел Q. 1.8. Причины, по которым было бы неудобно строить теорию, исходя из понятия полинома над числовым кольцом, связаны в первую очередь со свойствами деления. Если f (х) и g (х) являются полиномами над числовым кольцом К и f (х) делится на g (х): f W = g (*) S (x), то коэффициенты s (x) могут и не принадлежать /(. 1.9. Пример. Имеем 2х* — 2х — 4 = (2х — 4) (х + 1). Здесь 2ха — 2х — 4 и 2х — 4 являются полиномами над кольцом целых четных чисел. Однако коэффициенты х Е 1 целые, но нечетные. Более того, легко по- казать, что 2ха — 2х — 4 вообще не может быть разложен на произведение двух полиномов над кольцом целых четных чисел, хотя и имеет делитель 2х — 4, принадлежащий кольцу полиномов, имеющих коэффициентами целые четные числа. 1.10, В предыдущем изложении теории полиномов мы подошли к понятию полинома с точки зрения более общего понятия функции. Довольно часто используется и другой подход на основе понятия линейной алгебры (IV, 9.2) и находящийся в очевидном соответст- вии со сказанным в VII, 2.20. 819
Возьмем множество Л1, состоящее из элементов Xq, Xi, x2, .хп, ..., Р — числовое поле. Рассмотрим линейное пространство над Р, в котором М оказывается бесконечным базисом (можно иметь в виду линейное пространство, построенное по способу IV, 1.16). В соответствии с IV, 9.5 в этом линейном пространстве введем дей- ствие умножения, превращающее его в линейную алгебру над Р, исходя из следующего правила перемножения базисных элементов: xt Xj —xt+l(i, j = О, 1, 2, ...). Построенная линейная алгебра коммутативна, ассоциативна и обла- дает единицей х0. В соответствии с IV, 9.7 можно считать, что Р содержится в этой линейной алгебре, и обозначать с — сх0 (с С Р). Согласно введенному умножению х* = х* (fe = 1, 2, 3, ...). Обычно обозначают: х0 — х°, xt = х. В этих обозначениях М состоит из элементов х° = 1, х, х2, ..., хп, ... . Построенную линейную алгебру будем обозначать через Р [хф Поскольку М есть базис в Р [х], всякий элемент f из Р [х] мо- жет быть представлен в виде f = с0 + сгх + с2х2 + ... + спхп (ct ( Р). При условии сп Ф 0 такое представление / единственно. Из формы записи элементов алгебры Р [х] вполне естественным оказывается то, что их иногда называют полиномиальными симво- лами, а саму линейную алгебру Р [х] называют алгеброй полино- миальных символов над Р. Правила сложения и умножения на числа из Р для элементов алгебры Р [х] определяются свойствами линейного пространства. Умножение производится в соответствии с IV, 9.5. Построенная линейная алгебра Р [х] оказывается изоморфной линейной алгебре полиномов над Р (1.6). Действительно, сопостав- ляя каждому полиномиальному символу над Р: f = С'о + ctx + с2х2 -г ... + Спхп, полином ог переменного х, имеющий такую же форму записи, мы благодаря единственности нормальной формы полинома (VII, 2.14) получаем взаимно однозначное соответствие между элементами алгебры Р [х] и полиномами от одного переменного над Р. Как легко видеть, сложение, умножение и умножение на числа из Р в Р[х] производятся но тем же правилам, что и для полиномов. Поэтому установленное взаимно однозначное соответствие является изоморфизмом. Довольно часто теория полиномов излагается как теория поли- номиальных символов (которые в этом случае и называются просто полиномами). Ввиду доказанного изоморфизма эта теория по суще- ству совладает с теорией полиномов, построенной па базе функций. 320
Однако следует иметь в виду, что теория полиномов широко ис- пользуется не только в самой алгебре, но и в ряде других матема- тических дисциплин (в первую очередь в широком цикле, объединя- емом термином «математический анализ»), а также за пределами самой математики, в областях ее естественно-технических приложе- ний. В этих случаях полиномы появляются именно как особый вид функций. Поэтому в интересах единства и цельности восприятия математи- ческой теории мы предпочитаем придерживаться указанной в VII, 2.1 функциональной точки зрения на полиномы. Обратим внимание на то, что построение полиномиальных симво- лов как элементов линейной алгебры Р [х] делает естественным рассмотрение их и в случае, когда Р пе обязательно числовое поле, .а поле произвольной природы. § 2. Свойства делимости полиномов 2.1. При изучении делимости полиномов постоянно использу- ются свойства, которые разительно напоминают соответствующие свойства делимости целых чисел. При этом следует заметить, что ту роль, которую в области целых чисел в отношении делимости играют числа 1 и —1, в кольце полиномов играют полиномы нуле- вой степени, которые являются делителями всех элементов коль- ца. При рассмотрении следующих свойств делимости можно счи- тать, что каждый раз все участвующие там полиномы принадлежат кольцу полиномов над каким-либо числовым полем Р. Временно мы будем использовать обозначение, которое уже употребляли при изучении деления в кольце целых чисел. Если полином f(x) делится на полипом g (х), т. е. при некотором поли- номе s (х) имеет место f (х) = g (х) s (х), то будем писать: 7W ! Я (*)• 2.2. Первоначальные свойства делимости. 1) / (х) : с и f (х) • cf(x) для любой постоянной с, отличной от нуля. Действительно, / (х) = с - f (X) j и f (х) = — • [с/ (х)]. 2) Пели f (х) • g (х) и f (х) не есть постоянная нуль, то степень I (х) больше или равна степени g (х). Действительно, степени полиномов есть целые неотрицательные числа. При / (х) = g (х) s (х) степень f (х) равна сумме степеней g (х) и s (х), откуда следует указанное неравенство. 3) Если с : f (х), где с — постоянная, отличная от нуля, то -f(x) также есть постоянная, отличная от нуля 4) Отношение делимости полиномов обладает свойством тран- зитивности, т. е. из f (х) : g (х) и g (х) : h (х) следует fix) \h (х). Действительно, при f (х) = g(x)s(x) и g (х) = h(x)t(x) имеем: f (х) = h(x) [/(x)s(x)]. 11 Заказ 053 321
5) Если каждый из полиномов (х), f2 (х), fm (х) делится на g (х), то при любых полиномах <рх (х), <р2 (х), <рт (х) полином Ф1 (х) К (х) + <Р2 W h W 4- ... + фт W fm (х) делится на g (х). В частности, [/х (х) + f2 (х)] : g (х) и \fx (х) — —/2 W1 = g (х). Действительно, из (х) — g (х) st (х) (I =1, 2, .... т) следует: Ф1 (х) fl (х) + ф2 (х) Zs (х) + ... + Фт (x)fm (X) = = g (х) 1ф1 (х) S1 (х) + Фз (х) S2 (X) 4- ... + Фт (х) STO (х)1. 6) Если fi (х) g. (х) (i — 1, 2, ..., т), то Е/i (х) • /2 (х) • ... fm (х)] : [gx (х) • g2 (х) • ... • g„ (х)]. Действительно, из Д (х) = gt (х) st- (х) (i =1, 2, ..., т) следует: [fl (X) • /2 (х) • ... • fm (х)] = rgl (х) • g2 (х) • ... • gm (х)] • [Si(x)x X s2 (х) ... • sm (х)]. 7) Если f (х) • g (х), то при любых постоянных сх и с 2 О имеет место [cj (х)] : [с2 g (*)]. Действительно, из f (х) = g (х) s (х) следует: [Cif (x)j = [<?2g (х)] • l-’-S (x)j. L C2 J 8) Если f (x) : g (x) и g (x) : f (x), mo f (x) отличается от g (x) на постоянный множитель, отличный от нуля. Действительно, из f (х) — g (х) s (х), g (х) = f (х) t (х) полу- чаем: / (х) = / (х) 6 (х) t (х). Если f (х) и g (х) не являются постоянной нуль, то отсюда сле- дует, что степень f (х) равна сумме трех неотрицательных чисел, равных степени f (х), степени s(x) и степени t (х), поэтому два по- следних числа должны равняться нулю, т. е. s (х) и t (х) суть по- стоянные, отличные от нуля. 9) Если f (х) : g (х), то при любом полиноме <р(х) имеет место <р (х) f (х) ф (х) g (х). Действительно, из f (х) = g (х) s (х) следует: Ф (х) f (х) = [ф (х) g (х)] « (х). 10) Если<р (х) f (х) • ф(х) g(x),edey (х) не есть постоянная нуль, то f (х) • g (х). Действительно, из ф (х) f (х) — ф (х) g (х) s (х) благодаря един- ственности деления следует: f (х) = g (х) s (х). 11) Если f (х) • g (х), то все корни полинома g (х) являются кор- нями и для f (х). Действительно, из / (х) = g (х) s (х) и g (а) = 0 следует f (а) = =- g (а) s (а) = 0. 322
2.3. Продолжая строить теорию делимости полиномов по об- разцу теории делимости целых чисел, нам надо внести понятия наи- большего общего делителя и наименьшего общего кратного и рас- смотреть их свойства Определение. Полином, являющийся делителем каждого из полиномов А (х), f2 (х), ..., [т (х), называется их общим делителем. Общий делитель полиномов называется их наибольшим общим делителем, если он делится на всякий общий делитель этих поли- номов. Из определения непосредственно не видно, для всякой ли сово- купности полиномов существует их наибольший общий делитель и сколько наибольших общих делителей может существовать. Эти вопросы будут рассмотрены в настоящем параграфе. Как и в теории делимости целых чисел, для наибольшего общего делителя d(x) полиномов /,(х), f/x), ..., fm (х) будем использо- вать обозначение d (х) = НОД (А (х), f2 (х), ..., f„ (х)). Если при этом старший коэффициент полинома d (х) равен 1, то будем писать: а (х) = нод1 (А (х), А (х), .... /„ (X)). Как мы скоро убедимся, обозначение НОД не является одно- значным, но НОД* однозначно. 2.4. Укажем несколько простейших свойств наибольших общих делителей. Справедливость некоторых из соответствующих утверж- дений непосредственно вытекает из определения. 1) Если d (х) = НОД (Д(х), А (х)...f„ (х)), то множество всех делителей d (х) совпадает с множеством всех общих делителей полиномов (х), А (х), ..., fm (х). 2) Постоянная нуль есть НОД (А (х), A (х).fm (х)) з том и только в том случае, когда все (х) суть постоянные куль. 3) d (х) есть НОД (A (х), А (х). •••, fm (х), 0) тогда и только тог- да, когда d (х) = НОД (A (х), А (х), > fm (х)). 4) Пусть d (х) = НОД (х). A (х), •••. An (х)). Тседа все полино- мы с d (х), где с есть любая постоянная, отличная от нуля, и только эти полиномы являются всевозможными наибольшими общи- ми делителями полиномовh (х), А (х), •••. fm (х). Действительно, согласно 2.2 (7) с d (х) есть общий делитель наших полиномов. Из того что с • а (х) делится на d (х), следует, что ок есть их наибольший общий делитель. Если d (х) = НОД (A (х). А (х). •••. fm (х)). то d'(x') делится на d (х). Но одновременно d (х) делится на ~d (х) Согласно 2.2 (8) отсюда следует, что d (х) = с d (х) при некоторой постоянной с 0. 5) Если d (х) = НОД (А (х), А (х), .... fm (х)) и с есть старший коэффициент полинома d (х), то у • d (х) = НОД1 (А(х), А (х), ... 11* 323
.... fm (x)), причем это единственный полином, являющийся НОД1 (А (х), А (х)...fm (х)). Это непосредственно следует из (4), если принять во внимание, что два полинома, делящиеся друг на друга и имеющие одинаковые старшие коэффициенты, очевидно, равны. 6) Если один из полиномов fk (х) совокупности (х), f2 (х), ... ..., fm (х) является делителем всех их, то Т (х) = НОД (А (х), /» W, .... fm W). 7) Пусть f (х) — g (х) s (х) -J- h {х). Благодаря 2.2 (5) каждый общий делитель полиномов g (х) и h (х) будет общим делителем и для полиномов f (х) и g (х). Анало- гично всякий общий делитель полиномов f (х) и g (х) будет общим делителем g (х) и 1г (х) Поэтому если d (х) = НОД (g (х), It (х)), то d (х) = НОД (/ (х), g (х)), и обратно. 8) Если d (х) = НОД (А (х), f2 (х), .... fm (х)) и d (х) = =НОД(с!(х), fm+l W)i П1О W —НОД (А (Х'А А (х), ..., fт (х), /Л, + |(Х)). Действительно, из того, что d (х) есть общий делитель а (х) м fm+1 (х), следует, что он есть общий делитель полиномов A (х), А (х),fm (х), fm+x (х). Если q> (х) есть какой-то их общий делитель, ТО из d (х) : ф (х) и fm+1 (х) : ф (х) следует d (х) : ф(х). Поэтому d (х) = НОД (А (х), А (х).../от (х), f т+1 (X)). 9) Пусть d (х) = НОД (А (х), А (х), ..., f„ (х)) и степень d (х) равна п. Так как d (х) делится на всякий общий делитель полиномов fi (x)J2 (х),..., fm (х), то степени общих делителей этих полиномов не превосходят п. В множестве общих делителей А (х), А (х), •••» fm (*) полиномы, имеющие степень п (т. е. наибольшую степень), и только они, явля- ются НОД (fl (х), f2(x), (х)). Действительно, всякий полином ф (х) степени п, принадлежа- щий указанному множеству, есть делитель полинома d (х), имеюще- го степень п. Поэтому ф (х) может отличаться от d (х) лишь на по- стоянный множитель и потому согласно (4) также является НОД (A (х), А .... fm (х)). Еслиф (х) = НОД (А (х), A (х), •••, fm (*)). ~оф (х) согласно (4) может отличаться от d (х) лишь на постоянный множитель, отлич- ный от нуля. Поэтому степеньф (х) равна степени d (х). 2.5. Как и в теории делимости целых чисел, схожим образом опре- деляется последовательность Евклида. Определение. Последовательность полиномов Фх (х), ф2(х), ..., ф; (х) называется последовательностью Евклида для полиномов f\ (х) и А (х), если ф, (х) =А (х), ф2 (х) =А (х) и каждый Ф* (х) (k = 3, 4, .... I) является остатком при делении с остатком Фл_2 (х) на фй_1 (х), а (х) не есть постоянная нуль и является де- лителем полинома ф;_а (х): <Р1 (х) = ф2 (х) s2 (х) + Фз (х), ф2 (х) = фз (х) s3 (х) + ф4 (х), 324
ф*-2 (X) = фА-1 (X) $fc—l (х) + Ук (х), Ф/-2 (X) = Хр,—! (х) $Z—j (X) + <pz (X). Ф/-1 (X) = ф; (X) Sz (X). 2.6. Если ,% (х) не является постоянной нуль, то последователь- ность Евклида для (х) и /2 (х) всегда существует. Действительно, мы можем последовательно совершать указан- ные деления с остатком до тех пор, пока впервые не получим пару Ф,-! (х) и Ф,- (х), в которой ф,_! (х) делится на ф, (х), т. е. соответ- ствующий остаток есть постоянная нуль. К такой паре мы обяза- тельно придем, ибо степень каждого из полиномов фА (х) (k, = 3,4,...) меньше степени ф«_1 (х). Степени полиномов суть целые неотрица- тельные числа. Убывающая последовательность таких чисел долж- на па каком-то шаге оборваться. Но невозможность ее дальнейшего продолжения означает, что при очередном делении с остатком мы получили в остатке нуль. 2.7. Очень важно иметь и виду, что для /у (х) и /2 (х), являющих- ся полиномами над полем Р, все члены последовательности Евклида этих полиномов также являются полиномами над Р. Это непосред- ственно следует из 1.4 и способа построения членов последователь- ности Евклида. 2.8 Теорема. В последовательности Евклида ф, (х),ф2 (х), ... .... Ф, (х) для полиномов fi (х) и f2 (х) последний член ее является наи- большим общим делителем для fx (х) и f2 (х): Ф, (х) = НОД (х), /2 (х)). Доказательство. Из соотношений, связывающих члены последовательности Евклида (2.5), вытекает следующее. Благодаря 2.4 (6) из последнего соотношения 2.5 следует ф; (х) — — НОД (ф,-! (х), ф, (х)). Отсюда благодаря 2.4 (7) получаем из предпоследнего соотношения^ ф, (х) — НОД (ф,_2 (х), ф,_4 (х)). Аналогично из предшествующего соотношения получается ф( (х) “ = НОД (ф/-з (х), Ф/-2 (•*))• Повторяя это рассуждение, получаем в конце концов ф, (х) = НОД (ф, (х), ф2 (х)) = НОД (х), f2 (х)). 2.9. Пример. Найдем наибольший общий делитель полиномов А (х) = 2х« — х3 4- 5х + 2, А (х) = х* - Xs + х2 -+ х — 2, построив для них последовательность Евклида. Фх W = А (х). фг (х) = fi (х). Далее совершаем требуемые деления с остатком: 2Х* — х3 -4- 5х -Ь 2 I х* — х3 + х2 х — 2 2х« — 2х3 + 2х2 + 2х — 4 I 2 х3—2x2-i-3x4-6 325
Следовательно, q>3 (у) = х1 — 2х2 + Зх 4~ 6. г1 — х' + х2 + х — 2 I х:’ — 2х2 + Зх 4- 6 х* - 2х* + Зх2 + 6х_ — ----------------- Xs — 2х2 — 5х_ 2 1 х3 — 2х2 + Зх 4- 6 — 8х — 8 Следовательно, <р4 (х) = - -8х — 8. х3 — 2х2 4- Зх 4- 8 I — 8х — 8 г'+ __________ 1 3 з" — Зх2 — Зх 8 ° 6х 4- 6 6х 4- 6 "О Построение последовательности Евклида ' . Ее последний член <р, (х) = —8х — 8 закончено, поскольку есть наибольший общий делитель исходных полиномов f} (х) и/2 (х). Согласно 2.4 (5) имеем: х 4- 1 = =НОД' (X). f2 (х)). 2.10. Отметим вскользь следующее. Некоторое упрощение в вычислениях при нахождении наибольшего общего делителя иног- да может быть получено, если рассматривать последовательность, в которой члены связаны несколько более общими соотношениями, имеющими вид: a*_2<pft_2 (х) = ^_2<Pft-i (х) s,_i (х) 4- <pft (х), где aft_2, bk-i, Ch-t — любые отличные от нуля постоянные. Рас- суждениями, вполне сходными с предыдущими, легко убедиться, что ? случае ф/—2 (х) : ф; (х) последний член такой «обобщенной по- следовательности Евклида» также оказывается наибольшим общим делителем полиномов А(х) и /2(х), 2.11. Используя теорему 2.8, мы теперь можем доказать сущест- вование наибольшего общего делителя для любой конечной сово- купности полиномов, причем из рассуждений следующей теоремы легко видно, как этот наибольший общий делитель может быть по- строен. Теорема. Для любых полиномов (х), А (х), ..., fm (х) су- ществует их наибольший общий делитель. Если все fi (х) (i — 1, 2, ..., т) являются полиномами над по- лем Р, то НОД1 (А (х), А (х), .... fm (х)) также является полиномом над Р. Доказательство. 1) Если полиномы А (х), A (х), •••« .... fm (х) суть постоянные нуль, то благодаря 2.4 (2) 0 = НОД (А (х), А (X), .... fn (х)). 2) Пусть А (х) или А (х) не является постоянной нуль. Дока- зываем по индукции относительной = 2,3,..., щ.чюА (х), А (х),... fm (х) обладают наибольшим общим делителем, являющимся полиномом над Р. (Случай k = 1 очевиден.) При k = 2 это непос- редственно следует из 2.5, 2.6, 2.7, 2.8. 326
Если k 3 и h (х), f2 (х), fk -i (х) имеют наибольший общий делитель d (х), то согласно 2.4 (8) полином над Р: d (х) == =®НОД(3 (х), fk (х)), который найдется благодавя 2.5, 2.6, 2.7, 2.8, будет наибольший общий делитель для А (х), /2 (х), ..., А (х). При k = т мы получаем наибольший общий делитель наших по- линомов, являющийся полиномом над Р. 3) Имея наибольший общий делитель, являющийся полиномом над Р, мы благодаря 2.4 (5) получаем их наибольший общий дели- тель со старшим коэффициентом, равным единице, который, оче- видно, также будет полиномом над Р. 2.12. Из доказанной теоремы, в частности, вытекает следующее интересное следствие. Пусть заданы полиномы над Р- ft (х), /2 (х), ..., 1т (х). Если поли- ном d (х) делится на всякий полином над Р, являющийся общим де- лителем данных полиномов, то, в частности, d (х) делится на НОД1 (fi (х), ft (х), ..., fm (х)) и потому d (х) делится на любой об- щий делитель данных полиномов. 2.13. Наибольший общий делитель полиномов может быть сле- дующим образом выражен через них (как иногда говорят, «выражен линейно»). Теорема. Если d (х) = НОД1 (х), ft (х), .... fm (х)), то найдутся полиномы^ (х), v2 (х), ••.Фп (х), такие, что d (х) (х) fi (х) + фг (х)А (х) + ... + Фт (х) fm (х). Если при стом все ft (х) (i — 1, 2, ..., т) были полиномами над полем Р, то в качестве Vi (х) могут быть взяты полиномы над Р. Доказательство. Рассуждение ведем методом мате- матической индукции. При т = b d (х) ——fi(x), где с — старший коэффициент С полинома (х). Здесь — и есть искомый фу (х). С При т — 2 строим для ft (х) и А (х) последовательность Евкли- да Фх (х), ф2 (х), ..., (х). Пользуясь системой соотношений 2.5, будем последовательно находить для <р* (х) выражения интересую- щего нас вида: <Pft (х) =Ф{*>(*)/1 (х) -+ ф<*«(х)А (х), где фр (х) и (х) — некоторые полиномы над Р. Для k = 3 сразу получаем из первого соотношения из 2.5: Фз (х) = 1 • А (х) ф- (—s2 (х)) А (х). Подставив это выражение для ф3 (х) во второе из соотношений 2.5, получим требуемое выражение для ф4 (х). Подставив полученные вы- ражения для фз (х) и ф4 (х) в третье соотношение 2.5, получим тре- буемое .выражение для <р6 (х). 327
Продолжая так далее, найдем требуемое выражение для <р, (х). Умножив его на —, где с — старший коэффициент полино" с ма <р( (х), получим искомое выражение для d (х) = — tp; (х). Пусть т > 2 и для d (х) = НОД1 (/, (х), /2 (х), .... (х)) мы имеем: d (х) = ф1 (х) Л(х) + ф2 (х) /2(х) + ... + (x)fm_j(x), где ф, (х) — некоторые полиномы на^д Р. Благодаря 2.4 (8) d (х) = НОД1 (d (х), fm (х)). Благодаря индук- тивному предположению при некоторых полиномах над Р: ф, (х) и ф2 (х) — имеем d (х) =% (x)d (х) + ф2 (х) /„ (х). Если подставить сюда вместо d (х) указанное выше е-о выражение, то, очевидно, сразу получим требуемое выражение для d (х). 2.14. О п р е д е л е н и е. Полиномы Д (х), f2 (х), ..., Д, (х) называются взаимно простыми, если они не имеют других общих де- лителей, за исключением постоянных. 2.15. Если Д (х), /2 (х), ..., fm (х) взаимно просты, то из опре- деления следует: НОД1 (Д (х), /2 (х), ..., fm (х)) = 1. Очевидно и обратное. Действительно, если НОД1 (Д (х), /2(х), ... ..., fm (х)) — 1, то общие делители этих полиномов, будучи делите- лями 1, должны быть постоянными. 2.16. Отметим ряд свойств полиномов, связанных с отношени- ем взаимной простоты. 1) Если ft (х), /2 (х), ..., fm (х) взаимно просты, то найдутся такие полиномы (х), ф2 (х), ..., фт (х) (при этом над тем же по- лем Р, над которым были взяты (х), f2 (х), ..., fm (х)), что 1 =фх (х) * (х) + ф2 (х) /2 (х) + ... н- Фт (х) fm (х). Это непосредственно следует из 2.13 и 2.15. 2) Если для некоторых полиномов имеет место: 1 = ф2 (х) Д (х) + ф2 (х) /2 (х) + ... + фт (х) fm (х), то /у (х), Д (х), ..., fm (х) взаимно просты. Действительно, всякий общий делитель полиномов (х), /2 (х), .... fm (х) является делителем 1, т. е. есть постоянная. 3) Если полином f (х) взаимно прост с каждым из полиномов gi (х), g2 (х), ..., gv (х), то f (х) взаимно прост с произведением gi W §2 (х) ... g,t (х). Действительно, благодаря (1) найдутся такие полиномы <р,- (х),ф( (х) (( =1,2, .... т), что 1 =ф! (х) / (х) + ф! (х) Я1 (х), 1 =Фа (х) / (х) + <р2 (х) g2 (х), .... 1 =ф,„ (х) j (х) -i- <pm (x)g„( (х). 328
Перемножая почленно левые и правые части этих равенств, полу- чим равенству вида: 1 -=Ф W f W + <р (х) gt (х) g2 (х) ... gm (х), из которого согласно (2) вытекает требуемая взаимная простота. 4) Если полином f (х) взаимно прост с произведением gi (*) §2 (х) g.n (х), то f (х) взаимно прост с каждым из его сомно- жителей gi (х). Действительно, если f (х) не взаимно прост с некоторым gt (х), то они имеют общий делитель ф (х), не являющийся постоянной. Но тогда ф (х) был бы общим делителем для / (х) и произведения gl W $2 W ... gn (х). 5) Произведения полиномов Д (х) Д (х) ... fm (х) и gx (х) g2 (х) ... • •• gn (х) взаимно просты тогда и только тогда, когда каждый из fi (х) взаимно прост с каждым из gt (х) (г =1, 2, ..., т; j = 1, 2,... .... п). В частности, [f (х)]’" и ^(х)]1 взаимно просты тогда и только тогда, когда f (х) и g (х) взаимно просты. Это непосредственно следует из (3) и (4). 8) Если произведение полиномов fy (х) Д (х) делится на g (х), причем h (х) и g (х) взаимно просты, то Д (х) делится на g (х). Действительно, при иекоторных ф (х),ф (х) имеем: 1 = Ф W [л (х) + Ф (х) g (х). Отсюда получаем: Д (х) = ft (х) ф (х) fr (х) + f2 (х) ф (х) g (х). Так как Д (х) f2 (х) : g (х), то полином, стоящий в правой части ра- венства, делится на g (х). Поэтому Д (х) • g (х). 7) Если полиномы gx (х), g2 (х),..., gin (х) попарно взаимно просты и полином f (х) делится на каждый из них, то f (х) (§! (х) • g2 (х) • ... • gn (х)). Доказательство ведем по индукции относительно т. При т = 2 имеем f (х) = gr (х) s (х) и gL (х) s (х) • g2 (х), так как gi (х) и g2 (х) взаимно просты, то благодаря (6) s (х) g2 (х). Но тогда, очевидно, f (х) = g2 (х) s (х) ; \gt (х) g2 (х)]. Пусть т > 2. Благодаря (3) gy (х) g2 (х) ... gm_r (х) и gm (х) взаимно просты. Используя индуктивное предположение, мы мо- жем считать, что / (х) : [gj (х) g2(x) ... §т_х(х)]. Из этого и f (х) : : gm (х), опять-таки на основании индуктивного предположения, заключаем: f (х) i ((g{ (х) g2 (х) ... grn^ (х)) • gm (х)). 8) Пусть ft (х) = ф (х) Й! (х), f2 (х) = ф (х) g2 (х), .... fm (х) = = ф (х) gm (х), причем не все полиномы fi (х) есть постоянная нуль. Для ф (х) = НОД (Д (х), f2 (х), ..., fm (х)) необходимо и достаточно, чтобы gi (х), g2 (х), ..., gm (х) были взаимно просты. Если gL (х), g2 (х), ..., gm (х) имеют общий делитель ф (х), не являющийся постоянной, то ф (х)ф (х) есть общий делитель Д (х), Д (х), ..., fm (х). Так как ф (х) нс делится на ф (х)ф (х), то ф (х) не является НОД (Д (х), /2 (х), .... fm (х)). 329
Если gi (х), g2 (х), .... gm (х) взаимно просты, то по (1) найдутся полиномы тр,- (х), такие, что 1 = фх (х) g2 (х) + ф2 (х) g2 (х) -|- ... + ф,„ (х) gm (х). Умножая на ср (х), получаем: ф (х) = Ф1 (х) fa (х) + Фз (х) ft (х) + ... + (х) fm (х). Отсюда следует, что ф (г) делится на всякий общий делитель полиномов Д (х), (х), (х). Так как сам ф (х) есть их общий делитель, то ф(х) = НОД (Л (х), /2(х), ...,Мх)). 9) Полиномы (х), /2 (х), ..., fm (х) взаимно просты тогда и только тогда, когда не существует общего корня Оля них всех. Действительно, если число а есть корень для каждого ft (х), то (х) делится на х — а. Следовательно, полиномы Д (х), f2 (х), ... ..., . „ (х) имеют общий делитель х — а, не являющийся постоянным. Пусть /1 (х), f2 (х), ..., fm (х) не имеют общего корня, d (х) = = НОД (х), /2 (х), ..., fm (х)). Всякий корень а полинома d (х) должен был бы быть корнем и для каждого Д (х). Так как таких общих корней нет, то d (х) оказывается полиномом, не имеющим корней. Как мы знаем (VIII, 3.5), такими полиномами являются лишь постоянные, отличные от нуля. Отсюда и следует взаимная простота (х), f2 (х)...(х). 10) Для того чтобы все корни полинома f (х) имели первую крат- ность, необходимо и достаточно, чтобы f (х) был взаимно прост со своей производной f (х). Действительно, пусть f (х) обладает корнем а, кратность кото- рого больше единицы. Тогда согласно VII, 4.13 а будет корнем и для f (х). В этом случае f (х) и f (х) не взаимно просты, ибо имеют обший делитель х — а. Пусть f (х) и f (х) не взаимно просты. Тогда они обладают не- которым общим делителем ф (х) ненулевой степени. Полином <р (х) имеет корень 5 (VI1I, 3.5). Число (> является корнем и для f (х), и для f (х). Согласно VII, 4.14 кратность корня р для f (х) больше единицы. 2,17. Определение. Полином, который делится на каж- дый из полиномов fi (х), f2 (х), ..., fm (х), называется их общим крат- ным. Общее коатное этих полиномов называется их наименьшим общим кратным, если оно является делителем всякого общего кратного зтих полиномов. Из определения непосредственно не видно, для всякой ли сово- купности полиномов существует их наименьшее общее кратное и сколько наименьших общих кратных может существовать. В бли- жайщее время мы выясним эти вопросы. 330
Для наименьшего общего кратною h (х) полиномов А (х), f2 (х), ..., fni (х) будем употреблять обозначение: h (X) = НОК (Л(х), f2 (х), .... fm (х)). Если при этом старший коэффициент полинома h (х) равен 1, то будем писать: h (х) = НОК1 (А (х), f2 (х), .... fm (х)). Как мы скоро убедимся, обозначение НОК не является однознач- ным, но НОК1 однозначно. 2.18. Укажем несколько простейших свойстз наименьших общих кратных. Справедливость некоторых из соответствующих утвержде- ний непосредственно вытекает из определения. 1) Если h (х) ±= НОК (fi (х), А (х), ..., fm (х)), тс множество по- линомов, делящихся на h (х), совпадает с множеством всех общих кратных полиномов fx (х), A (х), • ••»/« (х). 2) Постоянная нуль есть НОК (А (х), /2 (х), ..., fm (х)) в том и только в том случае, когда среди полиномов f2 (х), А (х), ..., /к(х) есть постоянная нуль. 3) Пусть /1 (х) — НОК (А (х), ft (х), .... fn (х)), Тогда полиномы с h (х), где с есть любая постоянная, отличная от нуля, и только эти полиномы, являются всевозможными наименьшими общими крат- ными полиномов fi (х), А (х), .... (х). Благодаря свойствам делимости с- h (х) есть общее кратное наших полиномов, причем ото есть делитель h (х), а потому и вся- кого их общего кратного. Следовательно, с • h (х) есть наименьшее общее кратное. Если h (х) = НОК (fi (х), f2 (х), ..., fm (х)), то h (х) есть делитель h (х) и одновременно само делится на /: (х). Поэтому h (х) = с х X h (х), где с есть постоянная, отличная от нуля. 4) Если h. (х) = НОК (fi (х), /2 (х), •••, fm (х)) 11 с есть старший коэффициент полинома h(x), то — • h (х) = НОК1 (А (х), f2 (х), ... С причем это единственный полином, являющийся НОК1^ (х), /г W. •••, Гт to). 5) Если один из полиномов f2 (х), А (х), ..., fm (х) делится на все полиномы этой совокупности, то он является их наименьшим общим кратным. _6) Если h (х) = НОК (fi (х), А (х), .... fm (х)) и h (х) = НОК (Л to. fm+1 to). т0 h to = Н°К (fl to. h to. fm <X). fm+1 (ХУ)- Действительно, из того, что h (х) делится на h (х) и на fm+1 (х), следует, что h (х) есть общее кратное полиномов А (х), f2 (х), ... • > fm U)> fm+i W- Ьсли <p (х) есть какое-то их общее кратное, то из Ф (х) : h (х) и ф (х) ' f mi-1 (х) следует ф (х) : h (х). Поэтому h (X) = НОК (А (х). А (X), ...,fm (X). fm+1 (х))- 7) Пусть h (х) = НОК (А (х). А (х), •••, fm (х)) и степень h (х) равна п. Так как h (х) есть делитель всякого общего кратного 331
полиномов A (х), f2 (х).fm (х), то степени общих кратных этих полиномов не меньше п. Б множестве общих кратных полиномов fx (х), А (х), [т (х) полиномы, имеющие степень п (т. е. наименьшую степень), и только они, являются НОК (/i (х), /2 (х), , fm (х)). Действительно, всякий полином <р (х) степени п, принадлежа- щий указанному множеству, делится на полином h (х). имеющий степень п. Поэтому <р (х) может отличаться or h (х) лишь на по- стоянный множитель и потому согласно (3) также является НОК (А (х), f2 (х), ..., fm (х)). Если ф (х) = НОК (jx (х), 2 (х), .... fm (х)), тоф (х) согласно (3) может отличаться от h (х) лишь на постоянный множитель. Поэ- тому степеньф (х) равна степени h (х). 2.19. Произведение полиномов, очевидно, является их общим кратным. Исходя из него можно получить наименьшее общее крат- ное. Теорема. Если d (х) = НОД (/ (х), g (х)) не есть постоян- ная нуль и f (х) g (х) = h (х) d (х), то h (х) — НОК (/ (х), g (х)). Доказательство. При некоторых р. (х) и qx (х) имеем: f (х) = d (х) f>! (х), g (х) = d (х) qx (х). Поэтому п (х) d (х) = = f (x)g (х) = d (х) pj (х) d (х) qx (х). Отсюда следует h (х) • / (х). и Й (х) : g (х). Пусть ф (х) есть какое-то общее кратное полиномов / (х) и g (х). Из ф (х) = / (х) р2 (х) и ф (х) = g (х) q2 (х) получаем d (х) х Хр2 (х) = d (х) <7j (х) y2 (х) и потому рх (х) р2 (x) = qx (х) q2 (х). Так как d (х) = НОД (/ (х), g <х)), то согласно 2 16 (8) рх (х) и qx (х) взаимно просты. Поэтому благодаря 2.16 (6) из рх (х) р2 (х) = = qx (х) q2 (х) следует р2 (х) J qx (х). Из равенства f (х) g (х) = Л (х) d (х), которое можно записать в вндес! (х) Pi (х) d (х) qx (х) = h (х) d (х), следует: d (х) рх (х) qx (х) = = h (х), т. е. h (х) = f (х) qx (х). Так как ф (х) =-- f (х) р2 (х) и р2 (х) = ft (х), то Ф (х) = h (х). 2.20. Теорема, Для любых полиномов (х), /2 (х), ..., fm (х) существует их наименьшее общее кратное. Если все fi (х) (I = 1,2,..., т) являются полиномами над полем Р, то НОК1 (fi (х), f2 (х), ..., (х)) также является полиномом над Р. Доказательство, 1) Если среди полиномов Д (х), Д (х), •••> (х) есть постоянная пуль, то согласно 2.18 (2) 0 = НОК (Д (х), f2 (х), ..., fm (х)). 2) Пусть все ft (х) отличны от постоянной нуль. Справедливость нашего утверждения видна по индукции отно- сительно т. (Случай т = 1 очевиден.) При т — 2 возьмем d (х) = НОД1 (А (х), f2 (х)), являющийся согласно 2.11 полиномом над Р. Так как А (х) f2 (х) • d (х), то А (х) А (х) ~ (х) й (х)> причем h (х), являющийся полиномом над Р, согласно 2.19 есть наименьшее общее кратное полиномов А (х) 332
и ft (х). Если с есть старший коэффициент h (х), то полином — h (х>, с имеющий старший коэффициент, равный 1, и являющийся полино- мом над Р, согласно 2.18 (4) будет НОК1 (Д (х), А (х)). Пусть гп > 2 и по индуктивному предположению существуют Л (х) = НОК1 (А (х), fi (х), . fm_1 (х)), являющийся полиномом над Р, и h (х) = НОК1 (h (х), fm (х)), также являющийся полино- мом над Р. Но тогда согласно 2.18 (6) h (х) оказывается НОК1 (Д (х), Д (•*)...L-i W. fm (*))• 2.21. Отметим, что, используя рассуждения из 2.19 и 2,20, можно найти наименьшее общее кратное для любой конечной сово- купности полиномов. 2.22. Пример. Найдем НОК* (А (х), /2 (х), А (х)) для полиномов А (х) = х2 + Зх + 2. А (х) = х2 + 5х + 4, /3 (х) = х2 + 6х + 8. Сперва найдем НОК1 (А (х), А (х)). Для этого найдем d (х) = НОД1 (А (г), А (х)). Строим соответствующую последовательность Евклида: х2 Н- Зх + 2 = 1 • (х2 + 5х + 4) + (—2х — 2), х2 + 5х + 4 = (—-^-х — 2j (—2х — 2). Следовательно, (—2х — 2) = НОД (А (х), А (х)), и потому d (х) = НОД1 (А (х), /2 (х)) = х + 1. Руководствуясь 2.19, разделим А (х) = (х2 + Зх + 2) (х + 4) (х + I) на (х + 1). Получившийся полином h (х) = (х2 + Зх 4* 2) (х + 4) = х3 4- — 7х2 + 14х + 8 есть НОК1 (fi (х), A (х)). Теперь надо найти НОК1 (й (х), А (х)). Для этого начинаем искать их наибольший общий делитель. Совершаем деление с остатком: х3 4- 7х2 + 14х J- 8 । х2 -г 6х 4- 6 х24-6х24- 8х ' —:----------- X2 4- 6x4-8 х2 4* 6х 4- 8 0 Оказалось, что h (х) А (*)• Поэтому сразу непосредственно заключаем, что НОК* (й (х),А (х)) = й (х) = х3 4- 7х2 4- 14х 4- 8. Отсюда благодаря 2.18 (6) следует: х3 4- 7х2 4- 14х 4- 8 = НОК1 (А (х), f2 (х), /3 (х)). § 3. Неприводимые полиномы 3.1. В самом начале изучения делимости полиномов было под- черкнуто се глубокое родство с теорией делимости в кольце целых чисел. Материал § 2 подтвердил это сходство. Известно, что в теории делимости целых чисел фундаментальное значение имеют по- нятие и свойства простых чисел. Естественно ожидать появления соответствующего понятия и для полиномов. Это действительно так. При этом, как мы уже и предупреждали в § 1, наиболее це- лесообразным сказывается развитие теории делимости в кольце -ЙЭ
полиномов над числовым полем Р. Интерес представляют как общие свойства, относящиеся к произвольному Р, так и частные выводы для некоторых отдельных важных полей. 3.2. Определение. Полином f (х) над полем Р, имеющий степень п > 0, называется неприводимым над Р, если он не имеет делителей, являющихся полиномами над Р и имеющих степень, большую нуля, но меньшую п. f (х) называется приводимым над Р, если он обладает делителями, являющимися полиномами над Р и имеющими степень, большую нуля, но меньшую п. Идея введения этих понятий принадлежит Галуа. С точки зрения этих понятий все полиномы над Р разделяются на четыре класса: неприводимые над Р, приводимые над Р, поли- номы нулевой степени (т. е. числа из Р, отличные от куля), постоян- ная пуль. 3.3. Если f (х) : g (х), причем и [ (х) и g (х) есть полиномы над Р, то существует полином s (х), который также является полиномом над Р (1.4), такой, что f (х) = g (х) s (х). Отсюда следует, что полином f (х) над Р является приводимым над Р тогда и только тогда, когда он может быть разложен на про изведение двух полиномов над Р, имеющих степени, меньшие сте- пени самого / (х). Соответственно неприводимость означает не- возможность такого разложения. Чаще всего неприводимость именно так и определяют. В дальнейшем такой подход будет ис- пользоваться наравне с определением 3.2 без особых оговорок и напоминаний. 3.4. Пример, Полином 1 над полем всех вещественных чисел R приводим, поскольку имеет место разло- жение х4 + 1 = (х2 + /2х +- 1) (хг — /2х |- 1). Нетрудно убедиться, что каждый из этих двух сомножителей уже неприводим над R. Действительно, будучи приводим, полином ха ± К2х + 1 имел бы де- Ь литель над R первей степени ах f Ъ. Но тогда число —— € R оказалось бы кор- а нем и для х4 + 1, который делится на ах + о. Но полином х4 + 1 вещественных корней не имеет. Рассматривая х2 ± У2х1 как полином над Z, мы сразу убеждаемся ь егс приводимости. Действительно, он имеет делитель х — а, где а — корень этого полинома. Отметим (откладывая доказательство), что х4 -f- 1 над полем Q оказывается неприводимым. 3.5. Укажем ряд свойств неприводимых полиномов. 1) Полином первой степени над Р всегда неприводим над Р. Действительно, этот полином не может иметь никаких делите- лей, степень которых была бы меньше 1, но больше 0, 2) Если степень полинома f (х) над Р больше единицы и он име- ет корень а, являющийся числом из Р, то f (х) приводим над Р. 331
Действительно, х — а оказывается делителем полинома f (х), являющимся полиномом над Р (его коэффициенты: 1 и —а) и имеющим степень (единицу), большую нуля, но меньшую степе- ни / (х). 3) Если степень п полинома f (х) над Р равна двум или трем и f (х) не имеет корней, являющихся числами из Р, то f (х) непри- водим над Р (как видно из примера 3.4, отсутствие корней в Р для полиномов степени, большей трех, не означает их неприводи- мости). Действительно, будучи приводим, f (х) разлагался бы на про- изведение /' (х) = ф (х) ф (х), где ф (х) и ф (х) — полиномы над Р ненулевой степени. Сумма степеней ф (х) и ф (х) равна 2 или 3. Следовательно, степень, хотя бы одного из них, равна 1. Пусть Ф (х) — ах + b (a, b £ Р; а т^О). Тогда число а = —— £ Р, бу- а дучи корнем ф (х), оказалось бы корнем и для / (х). Но это проти- воречит тому, что / (х) не имеет корней в Р. 4) Если полином f (х) над Р ненулевой степени является дели- телем неприводимого над Р полинома ф (х), то f (х) = сф (х), где с £ Р, с --^= 0. Это следует из того, что степень f (х) должна равняться сте- пени ф (х). 5) Если полином I (х) неприводим над Р, то и полином с! (х) (где с € Р, с у= 0) также неприводим над Р. Это следует из того, что f (х) и с/ (х) имеют одинаковые делители. 6) Пусть f (х) — произвольный полином над Риц (х) — не- приводимый полином над Р. Если f (х) не делится на ф (х), то f (х) и ф (х) взаимно просты. Действительно, если / (х) и ф (х) не взаимно просты, то сте- пень d (х) = НОД1 (/ (х), ф (х)) больше нуля, й (х) оказывается полиномом ненулевой степени над Р, являющимся делителем Ф (х). Так как ф (х) неприводим над Р, то согласно (4) а (х) = с к X Ф (х) (с £ Р, с#= 0). Так как / (х) : d (х), то [ (х) • ф (х). 7) Если произведение нескольких полиномов над Р: (х) (х) ... ... f,„ (х) — делится на неприводимый над Р полином ф (х), то един из сомножителей ft (х) должен делиться на ф (х). Действительно, если бы ни один из (х) не делился на ф (х), то согласно (6) все они были бы взаимно просты с ф (х). Но тогда согласно 2Л6 (3) и произведение Д (х) fz (х) .. fm (х) должно было бы быть взаимно просто с ф (х), что противоречит тому, что оно делится на ф (х) 8) Пусть для полей Рг и Рг имеет место Рг сс Р2. Если поли- ном f (х) над Рг является неприводимым над Р2 (поскольку Рг cz с Р2, [ (х) одновременно может рассматриваться и как полином над Р2), то он неприводим и над Рг. Это следует из того, что всякий делитель полинома f (х), яв- ляющийся полиномом над Plt можно рассматривать как его дели- тель, являющийся полиномом над Ра. 33S
9) Если полином ф (х) неприводим над Р, то все его корни имеют первую кратность. Так как степень производной ф' (х) полинома <р (х) меньше сте- пени ф (х), то <р' (х) не делится на <р (х). Поэтому согласно (G) Ф (х) и <р' (х) взаимно просты. Благодаря 2.16 (10) отсюда следует, что все корни <р (х) имеют первую кратность. 3.6. Как обычно, говоря о разложении в произведение, мы до- пускаем и «несобственное разложение», состоящее из одного мно- жителя, т. е. тривиальное представление: А — А. Теорема. Всякий полином ненулевой степени над полем Р может быть представлен в виде произведения неприводимых над Р полиномов. Доказательство. Пусть f (х) есть произвольный по- лином над Р, имеющий степень п 1. Если /’ (х) неприводим над Р, то мы имеем разложение в «не- собственное произведение», состоящее из одного множителя: f (X) = f (X). Дальнейшее рассуждение ведем по индукции относительно п. Если п = 1, то / (х) согласно 3.5 (1) неприводим над Р и мы имеем уже рассмотренный случай. Пусть п > 1 и / (х) приводим над Р. Тогда найдутся такие g (х) и h (х), являющиеся полиномами над Р и имеющие степени, меньшие п, что f (х) — g (х) • h (х). Благодаря индуктивному пред- положению мы можем считать, что g (х) = ф! (х) фг (х) ... фр (х), Л (х) =ф1 (х)фг (х) ...ф7 (х) (конечно, возможно р = 1 и q = 1), где все ф, (х) и ф,- (х) — неприводимые над Р полиномы. Отсюда получаем требуемое разложение и для / (х): / (х) = ф! (х) ф2 (х) ... фр (х) Ф, (х) фг (х) ... (х). 3.7. Доказав теорему о разложении на произведение неприво- димых, естественно поставить вопрос о единственности такого раз- ложения (разумеется, здесь и дальше речь идет о единственности с точностью до порядка сомножителей). Однако мы сразу же убеж- даемся, что, не сделав каких-либо дополнительных ограничений, мы не можем говорить ни о единственности, ни даже об ограничен- ности количества различных разложений. Действительно, возьмем, например, полипом х2— 1. Он обладает известным разложением: хг — 1 = (х + 1) (х — 1). Однако наравне с этим можно написать и такие разложения: х2-1 = (2х + 2) и т. д. Очевидно, подобного рода различных разложений можно на- писать неограниченное количество. Однако эти разложения пред- 336
ставляются нам различающимися между собой в некотором смысле несущественным образом. Полиномы двух таких разложений от- личаются друг от друга лишь постоянными множителями, и такое различие, действительно, в известном смысле несущественно. Встав на такую точку зрения, можно доказать конечность количе- ства «существенно различающихся между собой» разложений дан- ного полинома. Можно также показать, что существует лишь един- ственное (опять-таки единственное с точностью до отличия в по- стоянных множителях) разложение полинома на множители, неприводимые над данным полем. Однако мы, для того чтобы избежать упомянутой неоднознач- ности, используем несколько другой подход. Мы ограничимся рас- смотрением делителей полинома, являющихся полиномами, стар- шие коэффициенты которых равны единице. Разумеется, такое «сужение» не меняет существа вопроса. 3.8. Теорема. Всякий полином ненулевой степени над по- лем Р может быть представлен единственным образом (с точно- стью до порядка множителей) в виде произведения f (х) = а<рг (х) ф2 (х) ... (х), где а есть число из Р, отличное от нуля, а фх (х), <ра (х), ..., <рш (х) — неприводимые над Р полиномы, имеющие старшие коэффициенты, равными единице. Доказательство. 1) Согласно 3.6 f (х) представим в виде: f W = Ф1 W (х) ... ф,п (х), где все (х) неприводимы над Р. Обозначим через с( старший коэф- фициент полинома (х) (t = 1,2,.., т), являющийся числом из Р. Разложение f (х) = (схс2 ... ст) (х)] (-ф2 (х)( ... (—(х)) является искомым, поскольку (ctc2 ... с„) С Р и каждый полином над Р' — ф; (х) — имеет старший коэффициент, равный единице, Cl и неприводим над Р согласно 3.5 (5). 2) Теперь докажем единственность рассматриваемого разложе- ния. Пусть некоторый полином f (х) над полем Р имеет два разложе- ния рассматриваемого вида. В этих разложениях выделим все об- щие множители: f (х) = йфх (х) ф2 (х) ... <р* (х) фх (х) ф2 (х) ... ф, (х) = = афх (х)ф2 (х) ... ф* (х)фх (х)ф2 (х) ...% (х). Здесь каждый ф,-(х) отличен от всякого фу (х). Из равенства обоих разложений следует, что «фх (х)ф2 (х) ... ф, (х) = афг (х)ф2 (х) ... (х). 337
Если бы I — 0 и т =0, то оказалось бы, что а = а и оба рассмат- риваемых разложения были бы одинаковы. Предположим, / #= 0. Произведение, стоящее в левой части последнего равенства, представляет собой полином над Р, деля- щийся Haipj (х). Следовательно, и произведение, стоящее в правой части, есть полином над Р, делящийся на фх (х). Согласно 3.5 (7) на фх (х) должен делиться один из сомножителей правого про- изведения ф, (х). Но ф. (х) неприводим над Р. Следовательно, его делитель^ (х), являющийся полиномом над Р ненулевой степени, мог бы отличаться от (х) лишь на постоянный множитель Одна- ко старшие коэффициенты фх (х) и ф, (х) равны единице, поэтому 4'i (*) = Ф/ (*). что противоречит выделению миожителей ф. (х) и ф, (х) в исходных разложениях. 3.9. В разложении полинома (3.8) могут оказаться одинаковые множители. Поэтому это произведение удобно бывает записывать в виде, указывающем на то, какие множители между собой одина- ковы. В этом случае разложение примет вид: / (х) = а<р1 (х)к>(р2 (х);о ... ф,„ (х)Ч где а — число из поля Р, полиномом над которым рассматривается наш / (х), a <Pi (х), ф2 (х), ..., ф„, (х) — различные между собой не- приводимые над Р полиномы со старшими коэффициентами, рав- ными единице. Числа klt k2, ..., k.„ натуральные. Впрочем, иногда удобно бывает допускать для некоторых значение, равное нулю (это будет озяа“ать, что соответствукйций полином ф( (х) в разложе- ние f (х) на самом деле не входит и делителем f (х) не является). 3.10. Если рассматриваемые полиномы заданы в форме, ука- занной в 3.9, то можно непосредственно решить, будет ли один из них делителем другого или нет. Пусть два полинома над нолем Р: f (х) и g (х) — заданы в ука- занной форме: f (х) = Пфх (х)“‘ ф2 (х)*з ... <рт (х)кт, 8 (х) = Йф) (х)г-ф2 (х)г’ ... фт (х)1т (в разложениях обоих полиномов участвуют одни и те же непри- водимые множители; это не является ограничением, если мы допустим для показателей kt и lf также и значения, равные нулю). Если для всех показателей имеет место kt 4 (1 = 1, 2, ..., т), то, очевидно, g (х) есть делитель f (х), так как / (X) = g (X) • (-фг (x)k>~‘> ф2 (х)^-Ь ... фт (x)km \ и Если же хотя бы в одном случае kt < /,, то g (х) не будет дели- телем f (х). Действительно, предположим, что g (х) все же будет делителем f (х) Тогда представим g (х) и частное от деления / (х 338
на g (х) в виде произведений чисел из Р и неприводимых над Р полиномов со старшими коэффициентами, равными единице, Пе- ремножив оба выражения, мы получим представление f (х) в виде произведения числа из Р и неприводимых над Р полиномов со старшими коэффициентами, равными единице .Это произведение будет отлично от исходного, ибо в него <рг (х) будет входить более чем kt раз (так как по предположению lt > k-t). Но это противоре- чит единственности, доказанной в 3.8. 3.11. Из рассуждения, проведенного в 3.10: следует, что для полинома над Р, представленною в виде 3.9' f (х) = йф! (х)#,ф2 (Х)^ ... ф„ (Х)*т, всеми делителями над Р со старшими коэффициентами, равными единице, будут полиномы вида: Ф1 (*)'• <Ра (х)1’ ... ср,л (х)1т (0 < < /г(, i = 1, 2, ..., т). Таких полиномов лишь конечное число (нетрудно подсчитать, ка- кое именно). Всеми остальными делителями над Р полинома / (х) будут полиномы, отличающиеся от данных на произвольные по- стоянные множители из Р, отличные от нуля (таких полиномов бу- дет уже бесконечное множество благодаря тому, что всякое число- вое поле содержит бесконечное количество различных чисел). В соответствии с делителями находятся различные разложения по- линома на произведения полиномов над тем же полем. Для полино- мов, заданных в рассматриваемом нами виде, мы получаем возмож- ность написать различные их разложения на произведения. Коли- чество таких разложений, «существенно отличающихся» между со- бой (считая, что два разложения различаются «несущественно», если полиномы обоих произведений отличаются лишь постоянными множителями), оказывается для данного полинома конечным чис- лом (опять-таки нетрудно подсчитать, каким именно). 3.12. Пусть два полинома над Р представлены в виде, указан- ном в 3.9: f (х) = Ш?! (х^чрг (х)*» ... фт (x)*m, Я W = &Ч>1 W<P2 ... ф,„ (x)'m. (Некоторые из показателей kt и могут быть и нулями.) Учитывая 2.12, из 3.10 и 3.11 получаем, что НОД’ (/ (Д g W) = (х)ч<р2 (x)s* ... <pm (х)Х где sz равно наименьшему из чисел kt и (I = 1,2,..., гп). 3.13. Из 3 12, в частности, следует, что рассматриваемые там полиномы / (х) и g (х) будут взаимно просты тогда и только тогда, когда для каждою I = 1, 2, .... tn или ki, или lt равно нулю. 3.14. Для полиномов f (х) и g (х), указанных в 3.12, очевидно, аналогично 3.12 имеет место: НОК1 (f (х), g (х)) = фг (х)г>ср2 (х)'< ... ф,п (х)Х где rt равно наибольшему из чисел ktn (i «1,2, .... tn). 389
3.15. Вопрос о корнях полинома / (х) над полем Р, принадле- жащих этому же полю Р, тесно связан с разложением f (х) указан- ного в 3.9 вида. Выделим в этом разложении те множители, кото- рые имеют степень, равную единице. Очевидно, каждый из них мож- но представить в виде х — а. Конечно, таких может и не оказаться (что соответствует р = 0): / (х) = а (х — а^х — а2)' = ... (х — ар)'!₽ (х)'-<р2 (х)6 ... (х)-’«. Степени всех <р, (х) считаются здесь уже большими единицы. Всеми корнями / (х) являются корни сомножителей указанного разложения. Полиномы <рг (х) не имеют в Р корней (иначе такой (х) был бы благодаря 3.5 (2) приводим в Р). Таким образом, корнями полинома f (х), принадлежащими Р, являются числа alt а2, ..., ар. При этом kt является показателем кратности корня а,. Тем самым между корнями полинома f (х), принадлежащими Р, и полиномами над Р первой степени, являю- щимися делителями f (х) и имеющими старший коэффициент, рав- ный единице, имеет место взаимно однозначное соответствие. 3 16 Мы показали, как вопрос о корнях полинома, принадле- жащих тому же полю, и различные вопросы, связанные со свой- ством делимости, получают свое мгновенное разрешение, если рас- сматриваемые полиномы заданы как полиномы над некоторым по- лем и разложены на произведение постоянной и полиномов, не- приводимых над этим полем, имеющих старшие коэффициенты, равные единице. Это показывает важность теоремы 3.8, на которой основывались все рассуждения настоящего параграфа. Однако необходимо подчеркнуть, что рассуждения теоремы 3.8 не представляют собой алгорифма. Вспомним, как мы рассуждали: «если полином неприводим», или «приводимый полином по опреде- лению представим в виде произведения». Но как же фактически выяснить относительно какого-либо заданного полинома, непри- водим он или приводим, и найти для него разложение в последнем случае? Перебрать при помощи конечного числа проб все полиномы, имеющие степени, меньшие данной, невозможно, ибо таких поли- номов бесконечное множество. Только для отдельных полей могут быть построены алгорифмы, позволяющие найти для полинома над данным полем его разложение на произведение неприводимых полиномов. После сделанных замечаний первоначальное впечатление с силе и значении теоремы 3.8 может смениться противоположным — о малой полезности этой теоремы ввиду нсалгорифмичиости соответ- ствующих построений. Однако не следует впадать и в такую край- ность. Как мы уже отчасти видели, теорема 3.8 дает принципиаль- ные ответы на некоторые важные вопросы (например,о конечности числа делителей полинома над данным полем со старшими коэф- фициентами, равными единице) Эти ответы и сами по себе интерес- ны и служат основой для дальнейшего исследования других вопро- 340
сов. Кроме того, поиски тех или иных алгорифмов в этой области обычно основываются на том, что уже доказано существование со- ответствующих выражений, Таким образом, принципиальное ре- шение основного в данной области вопроса, как это и вообще обыч- но бывает в математике, является существенным и важным шагом. 3 17. В связи со сказанным в 3.16 очевидное значение приобре- тает то, что хотя и не само разложение 3 9, но некоторые сведения о нем для конкретных полиномов могут быть получены некоторым, б известном смысле алгорифмическим путем. Нам понадобится следующее свойство, как можно заметить, по существу обобщающее свойство корней VII, 4.13. Лемм а. Если полином f (х) нид Р делится на ф (х)*, где ф (х) — неприводимый полином над Р, и не делится на ф (x)ft+1, то его производная f (х) делится на ф (х)*-1 и не делится на ф (х)* (в частности, это означает, что если k = 1, то f (х) не делится на ф (*))• Доказательство. Имеем: f (х) == ср (х)к g (х). Диф- ференцируя f (х), получаем: f (х) = Аф (х)*-1 ф' (х) g (х) + ф (x)*g' (х) = = ф (х)6-1 Щ)' (х) g (х) + ф (х) g' (х)1. Если бы /' (х) делился на ф (х)*, то полином, стоящий в квадрат- ной скобке, должен был бы делиться на ф (х). Так как второе сла- гаемое этого полинома делится на ф (х), то должно было бы де- литься на ф (х) и первое слагаемое. &ф' (х) g (х). Но это не так, ибо в этом произведении ни один из трех множителей не делится на неприводимый полином ф (х) (ф' (х) имеет меньшую степень, чем Ф (х), a g (х) не делится на ф (х) по условию). 3.18. Пусть теперь / (х) есть произвольный полином ненуле- вой степени над некоторым полем Р. В его разложении 3.9 на не- приводимые над Р множители распределим последние по тому при- знаку, сколько раз они встречаются в этом разложении (т. е. в зависимости от соответствующего kt). Пусгь фа (х), ф/2 (х), ... ф/т.(х) (I = 1, 2, 3, ...) — те из не- приводимых полиномов в разложении 3.9, которые входят в него точно / раз (имея соответствующее равным /). Возьмем их про- изведение- Ft (х) = ФП (х) ф,2 (х) ... ф;л1( (х) (1=1, 2, 3, ...). Тогда разложение 3.9 можно записать в виде: f (х) = aF. (х) • (х)2 • F3 (x)s • ... • Fs (x)\ Рассмотрим следующие делители полинома / (х): Ht (х) = Ft (х) • Ft+1 (х)2 • ...• Fs (xy~‘+l К = 1, 2.s). В частности, f (x) = a H, (x). Обозначим Dt (x) = НОД1 (Ht (x), Ht (x)) (r = 1,2, s — 1). 341
Согласно 3.12 D, (х) разлагается «а произведение неприводи- мых множителей, которые входят в разложение Н, (х). Это суть <pz/ (х), где i I. При этом если <pi; (х) входит в разложение Hf (х) г раз, то в разложение Н', (х) согласно 3.17 он будет входить (г—1) раз. Следовательно, и в разложение Dt (х) множитель Фо (х) будет входить (г — 1) раз. Отсюда следует, что £\(х) имеет следующее разложение: Dt (х) = Ft+1 (х) • (х)2 • ... • Fs (xY-‘. Оказалось, что Dt (x) = H t+1 (x) Хотя мы построили полиномы Ht (х) исходя из разложения 3.9 для f (х), но теперь мы можем отметить тот принципиальный факт, что на самом деле они могут быть найдены последовательно одни за другим исходя лишь из самой нормальной формы полинома f (х). Действительно, (х) это есть —f (х); Н2 (х) есть НОД1 (И, (х), а Hi (х)). Для его нахождения надо найти путем дифференцирования Hi (х) и затем применить ряд делений с остатком согласно схеме алгорифма Евклида. Аналогично и дальше. Httl (х) может быть получен из найден- ного ранее Нt (х) путем дифференцирования и делений с остатком. Таким образом, путем указанных операций мы. исходя из f (х), можем получить последовательность 17 г (х), Н2 (х), ..., Hs(x). Из вида //, (х) следует, что Ht (х) = Ft (х) FM (х) ... Fs (x) Нм (x) ^1,2, .... s-l). Благодаря этому путем деления Ht (х) на Н!+1 (х) мы можем получить произведение ^((x)F/Xi (х) ... FJx) (t = 1, 2, ..., s). Но дальше, деля одно такое произведение на последующее, мы, очевидно, получаем в частном Ft (х). Из сказанного следует, что путем операций дифференцирования и деления с остатком мы всегда можем из исходного полинома f (х) полупить все потиномы Ft (х), т. е. осуществить для / (х‘) указан- ное выше разложение: f (х) = oEj (х) F2 (х)2 F3 (х)8 .. F4(x)s. Во многих вопросах это разложение оказывается удобным. От- метим, в частности, что каждый участвующий в нем множитель Ft (х), являющийся полиномом над Р, обладает тем свойством, что в его разложении на произведение неприводимых над Р гголнномов каждый неприводимый полином входит только один раз: Pi (х) -= Ф/i (х) <р/2 (х) ... Ф/./г/ (х) 3.19. Неприводимые полиномы, входящие в полученное в 3.18 разложение, попарно различны, а потому и взаимно просты (3.5 (6)). Поэтому никакие два из них не имеют общих корней. Каждый корень полинома <pZr (х) согласно 3.5 (9) является для 342
него корнем первой кратности. Поэтому и для Ft (х) его кратность равна единице. Таким образом, полученное в 3.18 разложение полинома f (х): f (х) = аР, (х) F, (х)2 Р3 (x)3 ... Fs (x? — является его разложением на произведение таких полиномов, у которых все их корни имеют первую кратность. Так как изучение корней полинома, разложенного в произве- дение, свотится к изучению корней сомножителей, то тем самым за- дача об изучении корней полиномов может рассматриваться как сведенная к изучению корней таких полиномов, у которых все кор- ни имеют первую краткость. В некоторых случаях это представляет значительное удобст- во. Упомянем, в частности, что при разработке и применении ме- тодов приближенного вычисления вещественных корней веществен- ных полиномов отсутствие у них корней с кратностью большей, чем единица, иногда существенно облегчает рассуждения и вычис- ления. 3.20. Отмстим, что решение задачи «освобождения от кратных корней», о которой говорилось в 3.19, само по себе может Сыть получено короче. Пусть разложение вида 3.9 для f (х) есть: f (X) = ШР! (х)4- (X)h« ... (х)*«. Обозначим: d (х) = НОД1 (/ (х), f' (х)), f (х) = d (х) • f (х). В разложение вида 3.9 для полинома d (х) блаюдаря 3 12 мо- гут входить только <р; (х). Благодаря 3.12 и 3.17 каждый такой <FZ (х) входит в разложение для d (х) (kt — 1) раз. Следователь- но, d (х) имеет вид: d (х) = <pi (х)*»-1 <р2 (х)4*-' ... <ря (x)*m-i. Отсюда следует: Г(х) = афх (х) <р2 (х) ... <рт (х). Очевидно, полиномы f (х) и f (х) имеют одни и те же корпи. Но при этом согласно 3.5 (6), (9) у полинома f (х) все его корни явля- ются для него корнями первой кратности. В каждом конкретном случае полином /(х), являющийся, кстати, полиномом над тем же полем, что и f (х), может быть найден для f (х) при помощи операций дифференцирования и деления с остатком. <8 4. Неприводимые полиномы над полем всех комплексных чисел 4.1. В предыдущем параграфе мы рассмотрели ряд свойств разложения на множители полиномов в кольце полиномов над не- которым произвольным числовым полем Р. Теперь мы посмотрим, 343
как эти результаты конкретизируются, если в качестве поля Р взять одно из трех основных полей: поле всех комплексных чисел, поле всех вещественных чисел, поле всех рациональных чисел Мы увидим, что разложения полиномов на неприводимые множи- тели над этими полями являются основанием для получения ряда новых важных свойств полиномов. 4.2. Мы начнем наше рассмотрение с поля всех комплексных чисел. Теорема. Над полем всех комплексных чисел неприводимы- ми являются только полиномы первой степени. Доказательство. Что полиномы первой степени не- приводимы, мы уже знаем (3.5 (1)). Пусть степень полинома j (х) над полем всех комплексных чисел больше единицы. Как мы пока- зали в VIII, 3.5, полином f (х) должен иметь корень. Обозначим его через а. Согласно VII, 4.5 f (х) будет делиться на полином пер- вой степени х — а.. Поэтому / (х) будет приводимым над полем комплексных чисел. 4.3. Каждый полином первой степени со старшим коэффициен- том, равным единице, очевидно, можно записать в виде х — а. Поэтому для всякого полинома, который всегда можно рассматри- вать как полином над полем всех комплексных чисел, разложение, полученное з 3.8, выглядит следующим образом. Следствие о разложении полинома на линейные множители. Полином f (х) степени п пред- ставим единственным образом в виде произведения: f (х) = а (х — ах) (х — а2) ... (х — а„) (а Ф 0), где a, ах, <х2, •••> а« — некоторые комплексные числа. Количество множителей первой степени в нашем разложении равно п, так как степень произведения должна равняться сумме степеней сомножителей 4.4. Разложение 4.3 очевидным образом связано с корнями полинома. Числа ах, а2, .... ая, и только они, являются корнями / (*): / (а/) = 0, f (г) #= 0 (г а;, i = 1, 2, ..., п). Отсюда, в частности, вытекает справедливоеть свойства, от- меченного нами ранее (VII, 4.7). Полином степени п имеет не более п различных корней. 4.5. Конечно, в разложении 4.3 можно объединить одинаковые множители и получить разложение типа 3.9 относительно поля всех комплексных чисел. / (х) = а (х — aj** (х — а2)^ .. (х —ат)^ (а =£ 0). Здесь ах, а2, ая все различны между собой и + kz + ... 4~ km = п. ЗМ
Так как f (х) делится на (х — a)kt и не делится па (х — at) в сте- пенях больших, чем kt, то k{ является показателем кратности кор- ня а; полинома f (х). Отсюда получаем: Следствие о числе корней полинома По- лином степени п имеет ровно п корней, если считать каждый корень столько раз, какова его кратность. 4.6. Из 4.5 вытекает еще и следующее очевидное следствие. Задание старшего коэффициента и корней полинома вместе с указанием кратности каждого из них вполне определяет сам по- лином. 4.7. Теперь сравним задание полинома в нормальной форме с заданием ею в виде разложения на линейные множители f (х) = асхя + (Jjx"-1 + ... + tz„.rv + а„ (и0 -/= 0); f (х) = а (х — ах) (х - a2) ... (х — a„). Здесь alt a2, ..., а„— корни полинома f (х), некоторые из ко- торых могут бытв равны между собой. Раскроем мысленно скобки в последнем выражении. Очевидно, мы получим сумму слагаемых, каждое из которых является произведением п 4- 1 сомножителей: «А ...г„, где гй равно или х, или ( — aft). Наша сумма будет состоять из все- возможных таких слагаемых. Соберем члены, содержащие одина- ковые степени переменного х. Напомним, что такое выражение было уже рассмотрено нами в 4.1,5.21 (то, что там речь шла о на- туральных числах, а здесь у нас числа могут быть любыми комплекс- ными, не меняет характера рассуждений). Например, слагаемыми, содержащими х в первой степени, будут: ах (—а2) (— а3) ... (—а„), а (— а,)х (—а3) ... (--а„), ... ..., а (—aj (—а2) ... (— ал_х) х. Вынося за скобки степень х в каждой такой группе слагаемых, мы получим для / (х) следующее выражение: / (х) = ах'1 — аст/а,, a2, ..., a„) х"-1 + aa3(a1, a2,..., a.n) xn"2— ... ... + (—l)"-Ica,I_l(a1,a2..a„)x+ (—l)nacr, (a„a2, ...,a„). Здесь через oh (a,, a2, .... a,) (k = 1, 2, ..., n) обозначены вы- ражения, остающиеся после вынесения за скобки соответствующей степени х и (—1)* в каждой группе слагаемых. Как было показано в 4.1, 5.21 (да это видно и непосредственно), выражения ст* (ах, а2, •••> а„) имеют следующий вид: Hi («1, а?... ая) = а1 + а? + + а, , <Т. («к а2, •••, «,) = ф-а^з о а2,= а.а2 ... а„_х’+ с^а/... ал_2ал ф- ... ... ф а^з ... ал4- а2а3 ... ал, ал(«1, а2....ал) = аха2 ... ал.
Словами можно сказать, что ол (а1г а2, а„) есть сумма всевоз- можных произведений из k различных сомножителей: аь а2, ... .... а„. В свое время мы доказали и уже много раз пользовались тем свойством, что каждый полипом может быть задан лишь единствен- ным образом в виде суммы различных степеней х с численными коэф- фициентами. Поэтому должны иметь место следующие равенства: = а, aj = —a<jl(a1, ав, .... ая). а2 = а<г2 (аи а2..... ал), ah = (—]")* а4, .... а„), ая-5 =-(—а2, —» «„), =(—l)naa„(a1( а2, .... а„). Если подставить вместо oh (аг, а2, .... ая) их выражения, то мы получим формулы, связывающие коэффициенты полинома с корнями (частный случай для полинома второй степени рассматри- вается еще в школьном курсе элементарной алгебры): а0 = а, аж =- —а (04 4- а2 + ... + «„), а2 = a (аха8 4- ахЯз + ... 4- «„-/kJ, fi-3 — —Cl (оС|СС2йз 4“ 04<X2tt4 4* ••• 4* О.Ч—1®л)» c„_i = (—1)"'’ a (ct1a2 ... ая_! 4- axa3 ... a„_2a„ 4- ... ... 4- а^з ... a„ 4- a2a, ...a„), an = (— l)”a aLa2 ... an. Эти формулы называются обычно формулами Виета, по имени математика Ф. Виета (1540—1503), которому, в частности, при- надлежит большая заслуга введения удобных алгебраических обо- значений, близких к современным. 4.8. Решение алгебраического уравнения состоит б отыскании корней полинома, стоящего в левой части уравнения. Задать поли- ном — это значит задать последовательность чисел, являющихся его коэффициентами. Поэтому задача о решении алгебраического уравнения n-й степени СоХп 4- а1хп~1 4- ... 4- а^Х + «., = 0 тождественна задаче о решении системы п уравнений с п неизвест- ными alt а2> .... ая: «I = —«о (<h 4- «2 4- ... 4- ая), а2 = (аха2 4- «1<х3 4- 4- ая-,ая). а3 = ~а0 (aia:a3 4- 4--... 4- «ж-^л-^л), a„_t = (—I)""1 а0 (а,а2 ... ая_1 + ага2 ... ая_.2ая4- ... ... 4- 04а3 ... ая4- а2а3 ... ая), ая = (—l)"a0aia2 •••««• 346
Таким образом, доказанная нами ранге (VIII, § 3) основная теорема с разрешимости алгебраического уравнения может быть переформулирована как теорема, утверждающая, что вышеприве- денная система из п уравнений с п неизвестными всегда разрешима. Подобный подход к алгебраическим уравнениям не дает чего- либо особенно ценного для выяснения их свойств и природы. Одна- ко в некоторых случаях он может оказаться полезным. § 5. Неприводимые полиномы над полем всех вещественных чисел 6.1. После того как в § 4 мы выяснили, как конкретизируется и уточняется общая теория неприводимых полиномов для случая поля Z, перейдем к следующему важному полю R — полю всех вещественных чисел. Для произвольного комплексного числа z £ Z определим по- лином фг(.г), который будет играть вспомогательную роль в даль- нейших построениях; , . . (х — г, если z € R, ф, (х) = _ ’ _ '{х— z)(x— z), если z^R (здесь z означает комплексное число, сопряженное с числом z в смысле общей теории комплексных чисел — 4.V, 3.14). Сразу отмстим, что z является корнем полинома фДх). В обоих случаях фг (х) есть полином пад R. В первом случае это непосредственно очевидно. Во втором име- ем: Фг М = (х — г) (х — zj = х2 — (г + z)x + гг. Коэффициенты оказываются вещественными, так как согласно Ч. V, 3.15 и сумма и произведение сопряженных комплексных чисел вещественны. 5.2. Л е м м а. Полином f (х) над R имеет своим корнем число z тогда и только тогда, когда f (х) делится на полином фг (х). Доказательство. 1) Пусть / (х) делится на фг (х) / (к) = ф,(х) s (х). Имеем: f (г) — фг (z) s (г) =0, поскольку z — корень для (х) 2) Пусть f (z) = 0. f (х) делится на х — г по VII, 4.5. В случае z (_ R совершаем деление г остатком f (х) на фДх): f (х) = фДх) s (х) + Ах + В. Поскольку степень ф2 (х) равна двум, степень остатка Ах -Т В не может превосходить 1. Так как f (х) ифг (х) оба являются поли- номами над R, то и остаток есть полином над R, т. е. А, В R. 847
Положив в этом равенстве х — z, получаем: f U) = Фг (2) s (г) + Аг + О = 0 4- Лг 4- 3. При А =Л0 мы получили бы г = —— £ R, что в рассматриваемом случае не так. Следовательно, А = 0. Но тогда из последнего равенства полу- чаем также и В = 0. То, что А = В = 0, означает, что f (х) делится на (х). 5.3. Ирк ы еры. 1) Для числа 5 имеем ip., (л) = х — 5. Для 1 + i имеем ip1+z (х) = [х — (14* 0] [х — (1 — *)]• Раскрывая скобки, получаем 1р1+г (х) = х2 — 2х + 2. 2) Не уточняя, отметим вскользь, что, произведя соответс-зующую модифи- кацию определений, мы могли бы трактовать лемму 5.2 как у-верждение о том, что в кольце всех полиисмов над R полином (х) является НОД1 для множе- ства всех полиномов над /?, имеющих своим корнем г. 5.4. Следствие о сопряженных корнях. Если комплексное число г = а 4* bi является корнем полинома f (х) над 11, то и сопряженное с ним число г = а — Ы будет корнем этого полинома. Доказательство. Так как z есть корень f (х), го со- гласно 5.2 f (х) делится на фг (х). Из самого вида (х) следует, что и число z является корнем (х) (в случае г € R имеем г — г). Но тогда г будет корнем и для f (х). 5.5. Теорема. Над полем всех вещественных чисел, кроме полиномов первой степени, неприводимыми являются только такие полиномы второй степени ах* 4- Ьх 4- с, у которых Ь2 — 4 ас < 0. Доказательство. Полином первой степени неприводим. Полином второй степени их2 4- Ьх + с согласно 3.5 (2), (3) будет неприводим нал R тогда и только тогда, когда он не обладает вещественными корнями. Для этого, как было показано в VIII, 2.3 необходимо и достаточно выполнение неравенства Ъ2 — 4ас < 0. Поливом f (х) степени п > 2 согласно VIII, 3.5 имеет корень г. Согласно 5.2 он делится наф2 (х), являющийся полиномом над R, степень которого больше нуля и меньше п. Следовательно, / (х) приводим над R, 5.6. Из 5.5 видно, что полиномы (х) при разных z, и только они, являются неприводимыми над R полиномами, имеющими стар- ший коэффициент, равный 1. То, что все фл(х) являются таковыми, очевидно. Полином х 4- b (Ь £ R) есть (х). 348
Пусть I (х) — х2 -j- Ьх -Ь с над R неприводим, z — его корень. Так как z С R, тс согласно 5.2 f (х) должен делиться на фг(х). Тах как степени f (х) и фг(х) равны и оба имеют старшие коэффи- циенты, равные 1, го f (х) =% (х). 5.7. Из 5.5 следует, что всякий полином, неприводимый над полем всех вещественных чисел и имеющий старший коэффициент, равный единице, имеет один из следующих двух видов: х — а, х2 + рх + q (р2 — 4<т < 0). Поэтому разложение, выведенное в 3.8 для случая произволь- ного поля Р, в том случае, когда в качестве Р берется поле всех вещественных чисел R, приобретает следующий вид. Следствие о разложении на множители полиномов над R. Полином степени п над полем всех вещественнных чисел может быть единственным образом представ- лен в виде следующего произведения полиномов первой и второй степени над R: fix) = а (х — а,) ... (х — а„) (х2 + ргх + ... (х2+р;х + q;), где а =5^= 0, р2 — 4<?(. <0 (i — 1, 2, ..., Г), k + 2/ = п. Равенство k + 21 = п непосредственно следует из того, что п, степень произведения, должна равняться сумме степеней сомножи- телей. Разумеется, как мы это сделали в 3.9 для случая произвольного поля, можно и в этом разложении собрать вместе одинаковые мно- жители. К полиномам, заданным в гаком виде, применимы все рас- суждения о делимости, проведенные нами в § 3 для случая произ- вольного поля. 5.8. Отметим, что из 5.7 следует, что всякий полином над R, имеющий нечетную степень, обладает вещественными корнями. Действительно, в его разложении 5.7 обязательно должны иметься множители первой степени (иначе степень всего полинома оказа- лась бы четной). Корень каждого такого множителя веществен и является корнем самого полинома. Впрочем, это следствие нетрудно было бы получить и из других соображений. 5.9. Как мы ужеотметили, рассмотрение полиномов над R в сущ- ности равносильно изучению вещественных полиномов. Полученный в 5.7 результат можно трактовать и как теорему для веществен- ных полиномов, Она существенно используется при различных исследованиях вещественных полиномов. Интересно отметить, что формулировка этого важного свойства вовсе не требует не только свойств, но даже понятия комплексного числа. Она целиком отко- сится к области вещественных чисел. Вместе с тем, если мы вспом- ним, на чем основан вывод этого свойства, то убедимся, что дока- зательство существенно использует теорию комплексных чисел и 349
комплексных полиномов. Ведь вывод теоремы о полиномах, непри- годимых над полем всех вещественных чисел, опирался на основ- ную теорему о разрешимости алгебраических уравнений. Эта по- следняя теорема по самому своему существу относится к области комплексных чисел. Здесь мы имеем характерный пример того, как свойство сравнительно более простых объектов (вещественные числа и вещественные полиномы) может быть получено лишь с ис- пользованием свойств объектов более сложных и на первый взгляд даже чуждых и посторонних (комплексные числа и комплексные полиномы). 5.10. Как было уже упомянуто, изучение вещественных полино- мов имеет особое значение. В частности, это связано и с применением алгебры в других дисциплинах, математических и нематематичес- ких. Вещественный полином может иметь, а может и не иметь ве- щественных корней. Согласно сказанному выше это зависит от того, имеются ли в его разложении 5.7 множители первой степени. Однако судить об этом, исходя непосредственно из вида самого полинома, в общем случае не представляется возможным. Следует упомянуть, что известен общий способ выяснения существования вещественных корней у каждого данного вещественного полинома. Более того, можно, не находя значений этих корней, заранее опре- делить их количество. Способ решения этой задачи принадлежит французскому математику Штурму (1803—1855). В задачу настоя- щей книги изложение его не входит. Но его можно найти в различ- ных курсах по высшей алгебре, в частности, в книге: Л я п и н Е. С. Курс высшей алгебры. Изд. 2-е. М., 1955. § в. Неприводимые полиномы над полем всех рациональных чисел 6.1 Теперь мы перейдем к третьему основному чистовому полю— полю всех рациональных чисел. Как непосредственно сле- дует из определения неприводимых полиномов, чем «меньше» ио- ле, тем многочисленнее и разнообразнее неприводимые над дан- ным полом полиномы. В самом «большом» поле — поле всех комп- лексных чисел — неприводимыми оказывались лишь полиномы первой степени. В поле всех вещественных чисел наравне с поли- номами первой степени неприводимыми оказались уже и некоторые полиномы второй степени. В «минимальном поле» — поле всех рациональных чисел — встречаются неприводимые полиномы лю- бой степени. При этом они столь разнообразны; что описать их всех каким-нибудь удобным способом нам не удастся. Упомянем, однако, что известен алгорифмический способ, при помощи которого для всякого полипом? над Q можно выяснить, приводим он или непри- водим над Q. Более того, имеется алгорифм разложения любых полиномов над Q на неприводимые множители. Мы этих алгорифмов приводить здесь ке будем. Укажем, что они описаны, например в 350
§ 6 гл. V книги Е. С. Липина (Курс высшей алгебры, 2-е изд. М 1955). 6.2. Среди полиномов над Q особого внимания заслуживают целочисленные полиномы, т. е. полиномы, коэффициентами которых являются целые числа. В дальнейшем нам понадобится следующее свойство целочисленных полиномов. Лемма. Пусть простое число р таково, что у полиномов с целыми коэффициентами fi (х) = ОоХ’ — ^х’"1 + ... + а.^х + ап, h W = V” + -V”"1 + ... + 4- ьт не все коэффициенты aQ, alt а2, .... o„_j, а4 делятся на р и не все коэффициенты b0, blt Ьг, .... Ьт_Л, Ьт делятся на р. Если у произведения этих полиномов fl W fi (х) = с0 хп^т + с1х"тт-1 + ... + 0,,+^х 4- сп+т коэффициенты сп с2, ..., сп+т_1( сж+я, делятся на р, то у исходных полиномов должны делиться на р коэффициенты alt а2, ..., а:1. х, ^1» ^2» ^т-1» £,пг Доказательство Пусть у полинома (х), аг есть коэф- фициент с наибольшим номером, не делящийся на р, и у полинома f2 (х) bs есть коэффициент с наибольшим номером, не делящийся на р. Рассмотрим коэффициент cr+s. Этот коэффициент, очевидно, представляет собой сумму слагаемых аф;, у которых i 4~ / = — г 4- *>. Все аф,, у которых i > г, делятся на р, так как а; при i > г делится па р, по обозначению а, Также все afij, у которых / > s, делятся на р, так как Ь. при / > s делится на р, по обозначе- нию bs. Что касается слагаемого arbs, то оно на р не делится, гак как ни аг, ни bs, не делятся на р, которое является простым числом. Итак, cr+s равен сумме слагаемых, которые все, кроме одного, де- лятся на р. Поэтому сам с, ¥s на р не делится. По условию это воз- можно лишь при г 4- s — 0, т. е. когда г = 0 и s — 0. По это и озна- чает, что все а; при I > 0 и все bj при j > 0 делятся на р. 6.3. Свойства делимости полиномов над полем всех рациональ- ных чисел поддаются исследованию благодаря тому, что удается свести вопрос к изучению полиномов с целыми коэффициентами. Прежде всего отмечаем очевидный факт, что каждый полином над полем всех рациональных чисел можно умножить па такое на- туральное число, чтобы получившийся полином имел коэффициен- тами целые числа. Для полиномов же этого типа имеет место сле- дующая основная теорема, полученная Гауссом. Теорема о приводимости целочисленных полиномов. Полином с целыми коэффициентами, приводимый над полем всех рациональных чисел, разлагается на произведение полиномов ненулевой степени с целыми коэффициентами. Доказательство. Если полином с целыми коэффициен- тами f (х) приводим над полем всех рациональных чисел, тс он мо- жет быть разложен на произведение двух полиномов ненулевой 351
степени, коэффициенты которых — рациональные числа. Умножим f (х) на такое натуральное число п, чтобы указанное разложение превратилось в разложение полинома п f (х) на произведение двух полиномов ненулевой степени, коэффициенты которых будут уже целыми числами: = К (х) /2 (х). Пусть п есть наименьшее из натуральных чисел, таких, что п f (х) разлагается на произведение полиномов ненулевой степени с целыми коэффициентами. Для доказательства нашей теоремы надо показать, что п = 1. Допустим противное: пусть п > 1. Обозначим через р какое-либо простое число, являющееся делителем п. Если бы все коэффициенты Д (х) делились на р, то можно было бы в нашем равенстве произвести сокращение на р, разделив слева п на р и справа все коэффициенты Д (х) на р. После этого мы получили бы п опять требуемое разложение, но с первым множителем меньшим п, что противоречит определению числа п. Следовательно, не все коэффициенты полинома Д (х) делятся на р. Совершенно аналогично убеждаемся, что не все коэффициенты /2(х) делятся на р. Что ка- сается коэффициентов полинома п f (х), то они все делятся на р, так как п делится на р. Значит, к нашему разложению применима лемма 6.2. Согласно этой лемме все коэффициенты (х) и f2 (х), кроме старши-х, делятся на р. Старшие же коэффициенты не могут делиться на р, так как среди коэффициентов Д (х) и /2 (х) должны иметься не делящиеся на р. Однако это противоречит тому,-что произведение старших коэффициентов Д (х) и Д (х) равно старшему коэффициенту полинома п f (х), делящемуся на р 6.4. В качестве примера использования доказанных выше лем- мы и теоремы приведем одно следствие, дающее достаточное (но отнюдь пе необходимое) условие неприводимости целочисленного полинома над полем всех рациональных чисел. Следе тв ие. Если все коэффициенты полинома f (х) = аохп Ч- а]х’!-1 + ... + а^х ф ап целые числа, причем а0 не делится на некоторое простое число р, тогда как все остальные коэффициенты делятся на р, причем, однако, ая не делится на р2, то f (х) неприводим над полем всех рациональных чисел. Доказательство. Если бы f (х) был приводим над полем всех рациональных чисел, то согласно 6.3 он разлагался бы на мно- жители ненулевой степени, имеющие коэффициентами целые числа. Ставшие коэффициенты каждого из этих множителей не делятся на р, так как ар не делится на р. Поэтому можно применить лемму 6.2, согласно которой все прочие коэффициенты множителей, в том числе и свободные члены, должны делиться на р. Но отсюда следовало бы, что а„, равное произведению этих свободных членов, делилось бы па р2. ЗЬ2
6.5. Примеры. 1) Полкяом 5г> + 6х* — 144х* -J- 18х‘ — 42х + 12 неприводим над полем всех рациональных чисел. Действительно, все сгр коэф- фициенты, кроме старшего, делятся на 3, причем свободный член не делится иа 9, Отмстим попутно, что следствие 6.4 применить к нашему полиному относительно р = 2 было бы нельзя. Действительно, хотя старший коэффициент не делится на 2, г все прочие коэффициенты иа 2 делятся, но свободный член делится на 2*. 2) Условие следствия 6.4, являясь достаточным для неприводимости над полем всех рациональных чисел, не является необходимым- Действительно, полином х» + 2х + 3 неприводим уже над полем все* вещественных чисел. Следовательно, он и по- давно (Неприводим над полем всех рациональных чисел. Вместе с тем для этого полинома не существует простого числа р, обладающего свойствами, указанны- ми в 6.4. 3! Отметим, что иногда удается применить условие 6.4 после того, как ис- ходный полином предварительно преобразован. Рассмотрим, например, полином f (х) = хР~1 4- хР-1 + ... + х + I, где р — пзастое число. Непосредственно 6.4 применить нельзя. Введем новую переменную у = х — 1. Совершая очевидные преобразования, получаем: f (X) = ~~ = (У+ 1)^-1 = + руР-.г + ур-з |_ ... p(p-l)...(p-fe t-1) А_, р(р—1)...3-2 ' 1-2 3...* У 1.2..,(р-1) ’ Все коэффициенты, кроме старшего, делятся на о (известно, что биномиаль- ные коэффициенты суть целые числа, знаменатели же дробных выражений, ко- торое задают эти коэффициенты, взаимно прости с р и потому не сократят р). Свободный член не делится на р1. Следовательно, по 6.4 получившийся полином от переменной у неприводим над полем всех рациональных чисел. Отсюда не- посредственно следует, что и исходный полином, рассматриваемый как полипом от х; также будет неприводимым. 4) При любом п полином над полем всех рациональных чисел х« —2 неприводим над этим полем. Действительно, все его коэффициенты, хроме стар- шего, делятся на 2. Свободный член не делится на 4 (6.4). 6.6. Отметим, что пример 6.5 (4) доказывает высказанное ранее утверждение о существовании неприводимых полиномов над Q любой степени. : 6.7. Вопрос о рациональных корнях полиномов над Q, очевидно, непосредственно сводится к нахождению рациональных корней полиномов с целыми коэффициентами. Для решения последней за- дачи существует алгорифм, очень просто выводимый и вполне при- годный для применения в тех или иных конкретных случаях. 6.8. Теорема. Если рациональное число — (где р и q — я взаимно простые целые числа) является корнем полинома с целыми 12 Зэкаэ 353
коэффициентами f (х), то р является делителем свободного члена, a q — делителем старшего коэффициента. Доказательство. Подставим в f (х) вместо х корень полинома —: ч о# (— ) + at | — | + ... 4- an-i /—1 + ап = 0. \ Я) \ Я1 \ я / Умножив на qn, получим айрп 4- a^pn~lq + ... + an_,pqrt~l + апдл = 0. Так как все слагаемые, начиная со второго, делятся на q, то и первое слагаемое а^р* должно делиться на q. Но р и q взаимно просты: поэтому, как известно, произведение а(рп может делиться иа q только в том случае, если делится на q. Аналогично рассуждаем для р. Все слагаемые, начиная с первого и до предпоследнего, делятся на р. Следовательно, и последнее слагаемое ап q" должно делиться на р, а так как р и q взаимно просты, то на р должно делиться ап. 6.9. Доказанная теорема дает способ нахождения всех рациональ- ных корней полинома с целыми коэффициентами. Для этого надо сперва найти всевозможные делители старшего коэффициента и всевозможные делители свободного члена. Sh-их делителей конечное число, и нахождение их обычно не представляет труда. Затем надо составить всевозможные дроби —, где р — делитель свободного я члена, a q — делитель старшего коэффициента, причем р и q взаимно просты. Не обязательно все получившиеся числа — будут корнями я нашего полинома, но все рациональные корни будут находиться сре- ди этих чисел. Поэтому, вычисляя значения /(—у *ля всех этих чи- сел, узнаем, какие из них действительно являются корнями, а ка- кие нет. Вычисление /(—] можно вести путем деления с остатком на \я 1 х — —.В этом случае, повторяя деление частного, мы одновременно узнаем и кратность каждого корня. 6.10. Вычисления, связанные с изложенным выше способом, могут быть значительно сокращены, если воспользоваться еще од- ним необходимым (но опять таки не достаточным) условием того, чтобы заданное рациональное число являлось корнем данного по- линома с целыми коэффициентами. Теорема. Пусть рациональное число где р и q — взаимнс я простые целые числа, является корнем полинома с целыми коэффи циентами f (х). Тогда при всяком целом числе т целое число } (т} будет делиться на (р — qm). эм
Доказательство. Совершаем деление с остатком поли- нома f (х) на х — т: I (х) = (х — т) (box’1 + &1Х*-1 4- ... + &Л_1Х +&*) + / ("О- Так как все коэффициенты полинома f (х) — целые числа, то из самого способа деления с остатком следует, что все числа Ьс, bv.. ..., Ьк_г, bk, f (m) будут целыми (VII, 3.11). Полагая в полученном равенстве х = —, благодаря /( —1=0 получаем: Я \ч / _ /А _ к (АV + bl /А?"1 _|.... + / А] + U = f / L \ <7! \ я 1 \я I J Умножив обе части равенства на qk+l, получим, что целое число 7*+V (^0 разлагается на произведение двух целых чисел, одно чз кото- рых есть \р — qm). Числа р*+' и (р -qm) не имеют общих натуральных делителей, отличных от единицы (иначе они имели бы общим дели- телем какое-нибудь простое число s, которое, будучи делителем <7*+1, было бы делителем q, а так как р — (р — qm) -|- qm, то s было бы делителем и р, что противоречит тому, что р и q общих делителей не имеют). Отсюда следует, что произведение q^ 1 f (т) может делить- ся на (р — дт) только ь том случае, если на (р — qm) делится чис- ло f (т). 6,11. Пример. Найдем нее рациональные корни полинома: f (х) = 12х5 — 41Х4 + х9 + 47х* — 4х — 12. Если —. где Р и Я — взаимно простые целые числа, есть корень / (х), то согласно Я 6.8 р и Я могут принимать следующие значения: р | ± 1, ± 2, ± 3, ±4, ±6, ±12 q | 1, 2, 3, 4. 6, 12 р (очевидно, положительно или отрицательно —, вес равно можно считать q> 0). р Различных, подлежащих проверке комбинации — оказывается несколько Я десятков- Поэтому воспользуемся теоремой 6.10. Без труда вычисляется значение f (х) при х = 1: f (1) = 3. Согласно 6.10 р — q должно быть делителем 3, т. е. р — q может равняться иля ±1, или ±3. Благодаря этому некоторые из первоначальных возможностей отпадают 3 (например, 3= —, поскольку в этом случае р = 3. q = 1, т. е. р — q — 2). Очевидно, остаются лиш? следующие возможности: А 1 1 2 2 3 3 4 4 —1 —2 = 2 ’ 4 ’ 1 ’ 3 ’ 2 ’ 4 ’ 1 * 3 ’ 2 ’ 1 ‘ Теперь вычислим значение f (х) при х = —1: f (_1) = -15. 12» 355
Согласно 6.10 отсюда следует, что р )- q может равняться Лишь ±1, ±3, 3 4 ±5 ±15. Благодаря этому отпадают числа — и —. 4 о Вычислим f (2). f (2) = -96. р Отсюда следует, что р — 2q есть делитель —96. Но для всех наших чисел — Я число р — 2q по абсолютной величине не превосходит 7. Следовательно, р — 2q может разняться лишь ±1, ±2, ±3, ±4, ±6. Этому условию удовлетворяют лишь следующие числа: р 1 2 3 4 2 q ~ 2’ 3’ 2* Г “ 1’ Осталось лишь пять чисел, относительно которых существует сомнение, не являются ли некоторые из них корнями нашего полинома. Непосредственной проверкой (для чего удобно привлечь схему Горнера) убеждаемся, что числа —, 3 2 4, —2 не являются ксрьямь полинома / (дг), а — есть корень.
Глава X ДРОБНО-РАЦИОНАЛЬНЫЕ ФУНКЦИИ § 1. Задание дробно-рациональных функций 1.1. Опираясь на результаты теории полиномов, можно изу- чать некоторые функции более широкого класса — лак называемые дробно-рациональные функции (иногда их называют просто ра- циональными функциями или даже рациональными дробями). Вещественные дробно-рациокальные функции постоянно встре- чаются в курсе математического анализа Некоторые из вопросов, рассматриваемых в теории дробно-рациональных функций, свя- заны именно с потребностями математического анализа. При изучении дробно-рациональных функций существенным ос- ложнением является то, что область их определения содержит не все комплексные числа. Это обстоятельство всегда надо иметь в виду при изучении дробко-рациоиальных функций. 1.2. Пусть f (х) и g (х) — два любых полинома, только g (х) не есть постоянная нуль. С их помощью естественно определяется функ- ция F (х), называемая дробно-рациональной функцией, имеющей числителем полином / (х) и знаменателем полином g (х), которая обозначается: F(x) Нх) g(*)' В область определения функции F (х) входят прежде всею все числа, не являющиеся корнями полинома g (х). Для каждого такого числа с значение функции F (х) определяется по формуле: F(c) ((c) g (с)' Пусть теперь число с является корнем полинома g (х). Если f (х) и g (х) можно представить в виде f (х) = (х — с)* • f (х), g (х) = (х — с)" g (х), g (c) тС О, 357
и g (x) — некоторые полиномы, то с также считается вхо- дящим в область определения функции F (х). Для этого числа с значение функции F (х) принимается равным F(c)=^M. g(f) Если число с является корнем полинома g (х), но j (х) и g (х) не пред- ставимы указанным способом, то число с считается не входящим в область определения функции F (х). Для дальнейшею использования оба рассмотренных выше слу- чая можно объединить одним правилом. Число с входит в область определения функции F (х) = Р--, если полиномы / (х) и g(x) g(x) можно представить в виде f (х) = (х — с)* • f (х), g (х) = (х — с)к х xg (х), где £ > 0 и g (с) ч* 0 Соответствующее значение дробно- рациональной функции считается равным F (с) — -С^-. § (CJ Так как каждый полином, отличный от постоянной нуль, имеет лишь конечное число корней, то область определения дробно-ра- циональной функции всегда содержит все комплексные числа, за исключением разве лишь конечного их количества. Если f (х) и g (х) являются полиномами над числовым долом Р, f (х\ то говорят, что F (х) = —- есть дробно-рациональная функция gW над полем Р. Класе дробно-рациональных функций охватывает класс полино- мов, поскольку каждый полином / (х), очевидно, можно рассматри- вать как дробно-рациональную функцию ——. 1,3. В связи с определением 1.2 следует отметить, что во вто- ром случае относительно числа с полиномы / (х) и g (х) могут быть представлены в виде f (х) = (х — с)* • Г(х), g (х) = (х — c)ft • g (х) (g (с) =#= 0) лишь единственным образом. Поэтому и в этом случае значение функции F (х) для соответствующего с опоеделено одно- значно. 1.4. Как мы вскоре покажем, каждую дробно-рациональную функцию можно представить в виде F (х) = где полиномы f(x) 8 (^1 и g (х) взаимно просты. При таком представлении функцию F (х) можно рассматривать как результат деления полинома f (х) на по- лином g (х) в смысле определения VII, 1.7. Таким образом, знак черты в записи дробно-рациональной функции можно рассматри- вать как знак деления, а не просто как разделительный значок. 1.5. Пример. Полиномы х* — х к х* — х определяют дроСно-рациолаль- иую функцию над полем всех рациональных чисел _ Xs— X fw==——. 3W
Все числа, не являющиеся корнями полинома х8 — х, т. е. отличные от О, t> —1. входят в область определения этой функции. Имеем, например, F(2) 4 — 2 1 8 —2= 3’ Число нуль также входит в область определения функции F (х), поскольку х» — ж = х(х — 1), Xs — х = х(х» — IX При этом имеем: Для числа 1 имеем: х’ — х = (х — 1)х, Xs — х = (х — 1) (х’ + х). Поэтому 1 входит в область определения F (х), и мы имеем! F(l) = 1 1 1» + Г 2’ Что касается числа —1, то оно в область определения функции F (х) не вхо- дит. Действительно, х* — х = (х -f- 1) (хг — х), где х8 — х при значении х, равном —1, отлично от нуля. Но полином х’ —х не может быть представлен в виде (х + 1) ~g (х), поскольку —1 не является корнем для х! — х. Xs — X Легко убедиться, что рассмотренная функция F (х) = —------ совпадает а функцией 1 х-М •. У них одинаковые области определения, состоящие из всех ком- плексных чисел, кроме числа —1. И значение обеих функций при каждом х У= — 1, как легко убедиться, одно и то же. 1,6. Как мы видели на примере 1.5, две различные по внеш* нему виду дробно-рациональные функции могут оказаться равными. В связи с этим отметим несколько соответствующих свойств. Лемма. При любых полиномах f (х), g (х), h (х), где g (х) uh (х) не являются постоянной нуль, дробно-рациональные функции F(х) = Н{х) = /(*)/1(л). g(*) V g(*)A(x) равны (в этом случае говорят, что выражение F (х) получено из Н (х) при помощи сокращения на h (х)). Доказательство. Для любого числа с представим на* ши полиномы в виде: f W = Г(Х) (х - сг, Г(с) О, g (X) = g (X) (х — с)*, g (с) О, h(x) = h (х) (х - с)1, h (с) 0. Эго всегда возможно, и притом единственным образом (конечно, т, k или I могут оказаться равными нулю). 35»
< Если tn < k, то с не входит в область определения ни для F (х), ни для // (х). Если т k, то с входит в область определения и для F {х)„ и для Н (х), причем мы имеем: Р(С) = 7(с)(с~сГ‘-* = 7(c)h(c)(c-c):m+,)--(*+f) , g(c) ₽(С)Л(С) и потому F (с) = Н (с). 1.7. Следствие. Две дробно-рациональные функции 1{х}~ fa(x)~&w равны тогда и только тогда, когда имеет место равенство поли номов: ft U) gt (х) = f2 (х) gi (х). Доказательство. Согласно 1.8 имеет место Fl(x)=^(x)^x}-, FA* = -№&®-. £i(x)g»W ftWgjW Если fi (х) g2(x) = fi (х) gi (х), то, очевидно, Ег (х) — F2 (х). Пусть fi (х) gi (х) и fi (х) gi (х) — различные полиномы. Тогда существует бесконечное количество таких чисел с, что Д (с) g2 (с) П (С) gi (С) (VII, 4.8). Среди этих чисел найдется такое, которое не является корнем полинома gi (х) g2 (х) (поскольку этот полином, хак и всякий по- лином, не являющийся постоянной, равной кулю, имеет лишь ко- нечное число корней). Это число с тходит в области определения и дли Fi (х), и для Fi (х). При этом Г, (с) Ft (с). Из этого следует, что функции Е, (х) и Ft (х) различны. 1.8. Теорема. Каждая дробно-рациональная функция над полем Р может быть представлена, причем единственным образом, в виде: F (х) = g(X) где f (х) и g (х) — взаимно простые полиномы над Р, причем стар- ший коэффициент полинома g (х) равен единице. Доказательство. 1). Пусть для произвольной дробно- рациональной функции F (х) — над ? полипом d (х) есть наибольший общий делитель полиномов f* (х) и g* (х), старший коэффициент которого равен сгаршему коэффициенту полинома g* (х). Как известно, d (х) является полиномом над Р. Имеем: f* W == / (х) d (х), gr (х) = g (х) d (х), где полиномы над Р: f (х) и g (х) — согласно IX, 2.16 (8) взаимно просты. При этом старший коэффициент g (х) равен 1. Э<ю
Благодаря 1.6 имеем: F(X) = = ItodW = M '' ₽*(*) g(x)d(x) g(x)’ 2) Пусть дробно-рациональна я функция F (х) представлена в виде двух выражений: F (х) — Я1(х) £»(*)’ где fh (х) и gk (х) взаимно просты, а старший коэффициент gh (х) равен 1 (6=1,2). Согласно 1.7 должно иметь место: /1 (х) gi (х) = /г (х) gx (х). Ввиду взаимной простоты полиномов Д (х) и g, (х) из этого равенства благодаря IX, 2.18 (6) следует, что g2 (х) делится на g, (х). Аналогично и gi (х) делится на gt(x). Так как их старшие коэффи- циенты равны, то gj (х) — g2 (х). Но тогда из рассматриваемого равенства следует, что и (х) — f2 (х). Тем самым оба исходных выражения совпадают. 1.9, Область определения дробно-рациональной функции F (х) = -угу, У которой / (х) и g (х) взаимно просты, определяется очевидным образом В согласии с исходным определением 1.2 сна состоит из всех чисел, не являющихся корнями полинома g (х). Это непосредственно следует из того, что взаимно простые полиномы / (х) и g (х) не могут иметь общих корней. 1.10. Теорема. Если для двух дробно-рациональных функ- ций F- (х) и .г4 (х) найдется бесконечное множество чисел М, вхо- дящее в область определения каждой из них, причем Fx (х) и Ft (х) принимают равные значения для каждого числа из М, то функции Fi (х) и F.{ (х). равны. Доказательство. Для Л(х) = -4т. F2(x) = -^L обозначим через М’ множество всех чисел из М, не являющихся корнями ни для gx (х), ни для (х). Поскольку М бесконечно, а количество корней и у gi (х), и у g2 (х) конечно, множество М* бесконечно. Для любою с € М' имеем. А (с) _ Л (с) gl(C) g,(c)’ fl (с) gi (С) — f2 (с) gY (с) = 0. Отсюда следует, что для полинома Л W = Л W в» (х) — fi (х) gt{x) 3^1
все числа из М’ являются корнями. Так как М* бесконечно, то отсюда следует, что h (х) есть постоянная нуль, т. е. A (*) ёг (х) e А (*) gi (х). Согласно 1.7 отсюда следует, что (х) — Ft (х). 1.11. При изучении дробно-рациональных функций часто рас- сматривают их ограничения (VII, 4.16). В частости, при рассмотре- нии дробно-рациональных функций над некоторым полем Р часто естественно бывает брать их ограничения на Р. Особенно важен случай поля всех вещественных чисел. Если множество чисел М бесконечно, то. как следует из 1.10, ограничения двух дробно-рациональных функций F} (х) и Fg (х) на М: F, (х)|м и Ft (x)JM— равны тогда и только тогда, когда равны сами исходные функции Ft (х) и Fs (х). 1.12. При таком построении теории, когда полиномы рассмат ривают не как функции, но просто как некоторые выражения, иначе говоря, как набор их коэффициентов (VII, 2.20), естественно и дробно-рациональную функцию определить как соответствующее выражение, представляющее собой пару произвольных полиномов f (х), g (х) (лишь бы второй из них не был постоянной, равной нулю), , j (х) , рассматривая ее запись в виде дроби -рулишь как формальное обозначение. Приняв аксиому равенства, согласно которой пары g.(x)’ равны тогда и только тогда, когда /1 (х) gj (х) * (х) gt (х), и, определив формально действия сложения и умножения с парами, развивают дальнейшую теорию как теорию пар полиномов. В связи с наличием указанных двух подходов к рассматрива- емому понятию можно полностью повторить все сказанное по ана- логичному вопросу в связи с понятием полинома (VII, 2.20). § 2. Действия с дробно-рациональными функциями 2.1. Рассмотрение действий над дробно-рациональными функ- циями существенно осложняется тем, что области определения различных дробно-рациональных функций могут не совпадать. Конечно, арифметические действия с дробно-рациональными функциями можно совершать согласно правилам VII, 1.7. Однако это затрудняло бы построение достаточно глубокой теории прежде всего в связи с тем, что совокупность всех дробно-рациональных функций над полем Р не оказалась бы кольцом (см. VII, 1.8, 1.9, 1.10), поскольку в нем не было бы выполнено свойство сокращения 362
относктельнс сложения, а вычитание не являлось бы в прямом смыс- ле слова действием, обратным к сложению. Выход из указанной трудности может быть найден по-разному. Можно, имея дело с некоторым заданным конечным множеством дробно рациональных функций, перейти от их рассмотрения к рассмотрению их ограничений (VII, 4.16) на каком-либо множестве М, которое входит в область определения всех рассматриваемых функций. Если множестве М бесконечно, то, как было отмечено в 1.11, между исходными дробно-рациональными функциями и их ограничениями на М устанавливается взаимно однозначное соот- ветствие. Вместо самих исходных функций рассуждения можно проводить для соответствующих им .граничений. Такой подход использован, например, в книге: Л я п и и Е. С. Куре высшей алгебры. Изд. 2-е. М., 1955. Другой выход из указанного затруднения связан с иным под- ходом к дробно-рациональным функциям (1.12). Ниже, оставаясь на функциональном подходе к дробно-рацио- нальным функциям, мы дадим несколько другое решение упомя- нутой проблемы. 2.2. Для дробно-рациональных функций Fl(x)=A<iL определяем их сумму, разность, произведение и частное по фор- мулам: Ft W + F, (х) *= Fi W — Ft(x) = ft (x) Si (*) Fi(x). F,(x) = FA (x) : F, (x) = Указанные дробно-рациональные функции всегда определены, за исключением частного, которое определено всегда, кроме слу чая, когда ft (х) есть постоянная нуль, что означает, что сама дробно-рациональная функция F, (х) есть постоянная нуль. Отметим, что при таком определении деления знак черты ч обозначении дробно-рациональной функции уже всегда можно рас- сматривать как знак деления. Действительно, для двух полиномов I (х) = и g (х) = —мы имеем: -4й- 383
2.3. 'Гак как каждая дробно-рациональная функция задается не единственным образом в виде пары полиномов, то необходимо убе- диться, что результаты арифметических действий не зависят от спо- собов задания функций, над которыми производятся эти действия, гт Л (*) <₽1 М /,(х) «г. (к) , _ Пусть• = - —, — - = , что согласно 1.7 означает: (х) 4>i (х) gj (х) ф, (x'j fi W ♦ Ф1 M •= <p, (x) • gt(x), fi (x) • ф, (x) = <p2 (x) • g2 (x). Умножая первое равенство па g2 (х) • ф2 (х), а второе — на (х) х X (х) и складывая, получаем: fi(*)gi(x)'hW’hW + <Pi(x)^2(x)gL(x)gs(x) + + <pt (х) Т1 Wgi (x)gi (х). Ввиду 1.7 полученное соотношение означает равенство дробно-ра- циональных функций, являющихся суммами исходных дробно-ра- . “ fl (х) , f« (х) ft (х) g, (х) + А, (х) 0, (х) циональных функции: Д1Д-4- = .'.st5./ giW gt(x) gi(x)gt(x) »i(x) <P2(X) _ Ф1(x) ф.(X) + c2(x)ф, (x) ♦i(x) Ф2(х) 'MW'M*) Совершенно аналогичны рассуждения для разности, произве- дения и частного. 2.4. Определение действий с дробно-рациональными функциями, сделанное в 2.2, не вполне согласуется с определением VII, 1.7. Впрочем, различие не столь значительно Сумма двух дробно- рациопальных функций (х) и Гг (х). найденная по правилу VII, I 7, есть функция, область Определения которой отличаегся ог области определения суммы Fz (х) и Г2 (х), найденной по правилу 2.2 лишь конечным количеством чисел. Значения же обеих функций в общей области определения, очевидно, одинаковы. То же отко- сится и к разности, произведению и частному. В определении 2.2, мы по существу производим некоторое продолжение функций, являющихся суммой, разностью, произведением и частным, най- денных согласно VII, 1.7. Такое продолжение, как мы увидим, оказывается чрезвычайно удобным для развития теории дробно- рациональных функций. Оно делает эту теорию глубже, а ее изло- жение более удобным. I 2.6. Пример. Согласно 2.2. имеем: -----1---— = —. г X* -(- X X + 1 (*’ + *) (X + 1) х-|-1+х* + * (хЧ-1)1 1 И^лиу. 1.6. «ед,,™ Отметим, что число —I не входит йи в область определения функции —-, X X нм в область определения функции —Цг, однако оно входят в область Определе, х -f-1 нм суммы этих функций . 364
2.6. Способ 2.2 определения арифметических действий с дробно^ рациональными функциями таков, что для двух дробно-рациональ- ных функций над полем Р их сумма, разность, произведение и част- ное также являются дробно-рациональными функциями над Р. Легко видеть, что действие сложения дробно-рациональных функций обладает свойствами коммутативности, ассоциативности и обратимости. Также умножение обладает свойствами коммутатив- ности и ассоциативности; обратимость имеет место с ограничением в отношении постоянной нуль (4.VII, 3.9). Из сказанного следует, что совокупность всех дробно-рациональ- ных функций над произвольным числовым полем Р является полем (4.VII, 3.2, 3.10). 2.7. Важной характеристикой дробно-рациональной функции F (х) — -АМ является разность степеней полиномов f (х) и g (х). Из 1.7 следует, что величина этой разности будет одна и та же независимо от того, при помощи какой пары полиномов f (х) и g (х) мы задаем данную дробно-рациональную функцию. Действительно, если то (х) gs (х) — ft (х) & (х). giW gt(x) . . , v Поэтому сумма степеней (х) и gt (х) равна сумме степеней (х) и (х). Отсюда следует, что разность степеней /\ (х) и gx (х) равна разности степеней /2 (х) и g2 (х). 2.8. Теорема. Пусть у дробно-рациональной функции F(x)~-^-, не являющейся полиномом, степень числителя f (х) g(x) равна п и степень знаменателя g (х) равна т. Если п^ т, то F (х) может быть представлена и притом единственным образом в виде f(x) = S(x) + ^-. где s (х) — полином степени п — т и степень полинома h (х) мень- ше т. Доказательство. 1) Совершим деление с остатком по- линомов: f (х) = g (х) s (х) + г (х). Здесь степень s (х), как известно, равна п — т и степень г (х) меньше т. г (х) не есть постоянная нуль, так как иначе F (х) оказа- лась бы полиномом $ (х). Согласно 2.2 и 1.6 имеем: Р(Х\ = = g(x)s(x) + r(x) _ g(x)s(x) r(x) _ , л , r(x) ' ' g(x) g(x) g(x) g(x) g(x)' Это и есть требуемое выражение для F (х). 2 ) Пусть F (х) представлена требуемым образом F(x)=IM =s(x) + AM. g(x) g(x) 368
Согласно 2 2 и 1.7 отсюда следует f (X) = g (х) s (х) + h (х). Учитывая соотношение степеней полиномов, это соотношение можно рассматривать ках результат деления полинома / (х) на полином g (х). Ввиду единственности деления с остатком s (х) и Л (х) определяются по заданным f {х) и g (х) единственным образом. § 3. Разложение дробно-рациональных функций на сумму простейших 3.1. Среди дробно-рациональных функций над полем Р особый интерес в ближайшее время будут представлять для нас следующие дробно-рациональные функции. Определение. Дробно-рациональная функция над Р назы- вается простейшей, если она имеет вид <р(х)4’ где ф (х) — неприводимый над Р полином со старшим коэффициен- том, равным единице, а пел ином над Р а (х) имеет степень, меньшую степени ф (х). Причины, по которым оказывается целесообразным особо вы- делить именно такие функции, лежат в области математического анализа и связаны с доказываемой ниже теоремой. 3.2. Пример. Функция Г 'Г) х4 4 2х2 4- 1 может быть рассматриваема как простейшая дробно-рациональная функция над полем всех вещественных чисел. Действительно, ее знаменатель может быть представлен в виде (х2 + 1)?, а полином х2 + 1 над полем всех вещественных чисел неприводим. Степень числителя, равная- единице, меньше степени непри- водимого полинома xf + 1. . Эта же самая функция является дробно рациональной функцией над нолем всех комплексных чисел. Однако относительно этого поля она уже не будет про- стейшей. Действительно, ее знаменатель в поле всех комплексных чисел может быть следующим образом разложен на произведение: х* + 2х2 + 1 = (х + О2 (х - (?• Множители (х + i) и (х — <) неприводимы над полем всех комплексных чи- сел и различны. Следовательно, знаменатель не является степенью одного не- приводимого полинома, как это должно было быть у простейшей дробно-рацио- нальной функции. 3.3. Докажем ту основную теорему, которая и вызвала к жиз- ни сделанные выше определения. Теорема. Дробно-рациональная функция над полем Р мо- жет быть представлена в виде суммы полинома и простейших дробно-рациональных функций над Р. При этом знаменатели этих простейших будут делителями знаменателя исходной функции. 366
Доказательство. Будем доказывать теорему по индук- ции относительно степени знаменателя исходной дробно-рациональ- ной функции. Если эта степень равна нулю, т. е. знаменатель есть постоянная, то наша функция сама есть полином. Пусть степень знаменателя функции F(x) g(x) больше нуля. Предполагаем, что доказываемое утверждение спра- ведливо для всех дробно-рациональных функций над Р, у которых степень знаменателя меньше степени полинома g (х). Разложим g (х) на произведение неприводимых над Р полиномов (IX, 3.9): g (х) = q>! (х)Ч» (х)*’ ... фт(х)*«. Здесь Ф1 (х), <р» (х), ..., фот(х) суть различные между собой непри- водимые над Р полиномы со старшими коэффициентами, равными единице (разумеется, можно ограничиться случаем, когда старший коэффициент g (х) равен единице). Если т ~ 1: g (х) = <Pi (х)\ то совершим деление с остатком полинома f (х) на <рх (х): / W = Ф1 (х) s (х) + г (х). Очевидно, наша функция F (х) может быть представлена в виде следующих двух дробно-рациональных функций: F (ж) = -Ж- = _£« + _Ж «(*) Ф1 (*)*‘ 1 <Pi(*)*‘ (если г (х) есть нуль, то второе слагаемое отсутствует). Первое слагаемое есть дробно-рациональная функция, у кото- рой степень знаменателя меньше степени знаменателя функции F (х). Поэтому по индуктивному предположению это слагаемсе может быть представлено в виде суммы полинома и простейших дробно-рациональных функций над Р. При этом знаменатели последних, будучи делителями (х)*1-1, тем самым являются делителями и g (х) — Ф1 (х)*’. Второе слагаемое само есть про- стейшая дробно-рациональная функция, ибо степень г (х) меньше степени <рж (х). Таким образом, в случае т = 1 требуемое утвержде- ние доказано. Пусть теперь tn > 1. Наибольшим общим делителем двух различных неприводимых над Р полиномов ф] (х) и <ра (х) является единица. Поэтому согласно IX, 2.16 (1) найдутся такие полиномы над Р: их (х) и и3 (х), что 1 = ut (х) (х) + и, (х) ф» (х). 367
.Пользуясь этим равенством, представим нашу функцию F (х) следующим образом в виде суммы двух дробно-рациональных функций над Р: рщ £00 f W [ut (х) <р,(х)-!-и8 (х) <г2 (х)~ _ Ф1 (*)*’ <Р2 (*)к* - фт Ф1 («)** % (*)*’ • • <Pm __(*) |/(х)цДх) <Pi (x)*'-1 q>, («)*«... <pm (x)*"1 <pj (x)*> <p2 (*)*«-* ... q>m (x/m Оба слагаемых являются дробно-рациональными функциями над Р, у которых знаменатели являются делителями g (х) и имеют степени, меньшие степени g (х). Поэтому по индуктивному пред- положению они представимы требуемым образом, откуда следует, что и их сумма F (х) представима требуемым образом. 3.4. Способ, которым была доказана теорема 3.3, фактически пригоден для разложения любой дробно-рациональной функции, если только известно разложение ее знаменателя в произведение неприводимых над данным полем множителей. {’фактически, однако, бывает удобнее проводить рассматри- ваемое разложение методом неопределенных коэффициентов. Для этого в первую очередь следует выделить полином г.р и помощи деления с остатком числителя на знаменатель, затем можно сразу паписать готовое разложение, пользуясь гем, что знаменатели простейших должны быть делителями знаменателя самой дробно- рациональной функции. Числитель этих простейших приходится писать с неопределенными постоянными коэффициентами. Для того чтобы найти эти коэффициенты, можно привести сумму полинома и простейших к общему знаменателю (равному, очевидно, знамена- телю исходной функции) и приравнять чиститель числителю исходной функции. Мы получаем равенство двух полиномов, коэф- фициенты одного из которых даны, а коэффициенты второго зави- сят от неопределенных постоянных. Придавая независимому пере- менному те или иные численные значения или приравнивая коэф- фициенты, стоящие в обеих частях равенства при одинаковых сте- пенях независимого переменного, мы получим уравнения, из которых могут быть определены искомые неопределенные коэффициенты. 3.5. Пример. Рассмотрим функцию Г(х) ---------------*--------------, ' х5 — xi -г 2х3 — 2х» 4-х — 1 считая ее функцией над полем всех комплексных чисел. Для того чтобы предста- вить ее в том виде, о котором говорится в теореме 3.3, сперва совершим деление с остатком числителя на знаменатель: X» = (X» — х1 4- 2х3 — 2х» + х — 1) (х + 1) — х1 + х* 4- I. Тогда Г (х) ~ х 4- 1 — х1 4~х* 4~ 1_______ х4 — х4 4- — 2х’ 4- х — 1 ' 368
Теперь надо разложить знаменатель . произведение полиномов, чепривода мых над полем всех комплексных.чисел. Не обладая каким-либо общим способом, мы вынуждены использовать частные соображения, относящиеся к данному по- линому. Легко обнаруживаем один из корчей знаменателя: х = 1. Пользуясь этим, делим знаменатель на х — 1. Получившееся частное х* 4- 2х2 * + 1 равно (x4 + Полином х* + 1 очевидным способом раскладывается на множители первой степени: х2 + 1 = (х4- ») (х —»). Таким образом, окончательно полу- чаем следующее разложение знаменателя на множители первой степени: х» — х4 4- 2х» — 2х* |- х — 1 = (х — 1) (х -I- О2 (х - О» Теперь можем приступить к отысканию требуемого представления нашей функции, причем можем временно оставить а стороне слагаемое х+ 1, которое уже является полиномом. Используя теорему 3.3, пишем: — х* 4-х4 4-1 А В С D £ Xs— х4 4- 2х® — 2х’ 4- х— 1 х—1 (х4-0* *4-< (х —«)* х— С Для нахождения неопределенных коэффициентов А, В, С, О, Е приводим правую часть к общему знаменателю, который оказывается, конечно, равным знаменателю левой части. После этого можно приравнять числители обеих функций: —X* 4- X» 4- 1 = А (х 4- О* (х - О4 4- в (X - 1) (х - 0» 4- С (х - 1)х Х(х 4- 0 (х - 0» 4- D (х - 1) (х 4- »)’ 4- £ (х - 1) (х 4- О’ (х - »). Мы получили равенство двух полиномов. Коэффициенты при одинаковы* степенях х должны быть равны между собой; кроме того, должны получиться рав- ные значения, если мы будем придавать х какие-либо численные значения. Вос- пользуемся обоими этими обстоятельствами. Полагая х= 1, получим 1 = А (1 4- О4 (1 —04« т- в- А “ —. Полагая X = I, получим —1 = —4 (/ — 1) О, т. е. D = ——-— I. Положим, х = — I, 8 8 тогда — 1 = 4 (I И- О В, т. е. 3 = — —- 4- — I- о 8 Приравняем коэффициенты при х4: —I = А 4- С 4- £, — — = С 4- £- 4 Далее приравняем свободные члены: 1-44 В 4- 1С 4- D — IE, — I - С — Е< Из системы уравнений -4= С4- £, 4 —» =ч С — £ находим С и £: Теперь мы можем написать окончательное разложение нашей функчии на сумму полинома и простейших: 1 1—,» 5 4-4» 1-Н 5 — 41 £(х) = х4-14 -------- --------------------- 4(х— 1) 8(Х4-!)2 8(х-Н) 8(х—«)* 8(х-0 Ж
3.6. Рассмотрим вопрос о единственности того разложения, которое было дано в 3.3. Ожидать единственности без каких-либо дополнительных оговорок мы, конечно, не можем, ибо всегда можно видоизменить имеющееся разложение, заменив, например, слага- у I 3 емое суммой двух слагаемых: —х— +--1 (х« + I)» (х’ + I)’ от чего вид разложения, конечно, изменится. Однако с точностью до подобных очевидных изменений вид разложения оказывается единст- венным. Теорема. Дробнорациональная функция над полем Р F(x) = -^- gW .может быть лишь единственным об пазом представлена в виде та- кой суммы полинома и простейших дробно-рациональных функций над Р, в которой все слагаемые имеют разные знаменатели. Доказательство В 3 3 мы показали, что всякая дробно- рациональная функция над Р может быть представлена в виде суммы полинома и простейших дробно-рааиональных функций над Р. Если в таком разложении имеются два слагаемых с одинаковыми знаменателями, то оба слагаемые, очевидно, можно объединить в одно, которое опять-таки даст простейшую дробно-рациональную функцию над Р. Путем такого последовательного объединения мы, очевидно, можем привести исходное разложение к виду, о котором говорится 11 теореме. Остается показать единственность разложения рассматривае- мого вида. Допустим, что для некоторой дробно-рациг.нзльней функции имеются два таких разложения. Приравняем их и уни- чтожим справа и слева все одинаковые слагаемые. Если в резуль- тате этого уничтожатся все члены, значит, оба разложения были одинаковы. Предположим, что это не так. Тогда, перенеся все сла- гаемые в одну сторону и объединив вместе слагаемые с одинаковыми знаменателями, мы получим равенство вида: s (х) + 51 (х) + 5, (х) + ... 4- 5? (х) - О, где s (х) — полином, а 5< (х) — простейшие дробно-рациональные функции над Р, имеющие разные знаменатели. Количество послед- них не равно нулю, так как иначе мы получили бы равенство, в котором слева стоит полином s (х), у которого не все коэффициенты равны нулю, а справа нуль. Пусть для определенности записи именно 51 (х) имеет знамена- тель, степень которого не меньше степеней знаменателей прочих 51 (х). Обозначим его через (р, (х)'1, где <р, (х) неприводим над Р. Знаменатели всех прочих 5< (х), очевидно, имеют вид или <pt (x)m, где nt < rlt или ф (х)', где ф(х) отличен от (х). 370
Пусть Л (х) есть наименьшее общее кратное знаменателей всех дробно-рациональных функций 5< (х). Согласно IX, 3.14 ft (х) должен иметь вид: /I (х) = Ф1 (х)'- ф2 (х)'« ... ф, (х)Г/ (t < q), где все <р, (х) различны. Умножив рассматриваемое равенство на Л (х), получим: h (х) s (х) + h (х) 5, (х) + h (х) 52 (х) + ... + ft (х) 5, (х) = 0. Все слагаемые этой суммы — полиномы. За исключением полинома ft (х) 5; (х), все остальные слагаемые делятся на <Pj (х), так как ft (х) делится на ф: (х)о, г знаменатели 5< (х) (при г-/= 1) имеют вид <рл (х)' (ft = 2, 3, ..., 0 или <рх (х)да, где m < rv В то же время поли- ном к (х) 51 (х) имеет вид: ft (х) 51 (х) *= и (х) фз (х/» ... ф, (х)г<, где и (х) — числитель дробно-рациональной функции 51 (х). Его степень меньше степени <рх (х). Полином ft (х) 51 (х) согласно IX, 3.5 (7) не делится на фг (х), так как ни один из сомножителей произ- ведения, которому ок равен, не делится на (х), а ф, (х) — непри- водимый над Р полином. Перенеся слагаемое ft (х) 51 (х) в правую часть равенства, мы придем к невозможному равенству, поскольку в его левой части стоит сумма полиномов, делящихся на ф! (х), а правая часть — — ft (х) 51 (х) есть полином, не делящийся на ф! (х) 3.7. Результат, полученный выше относительно произвольного числового поля Р, конкретизируется очевидным образом для двух важнейших случаев поля всех комплексных чисел Z и поля всех вещественных чисел R. Согласно IX, 4 2 неприводимыми полиномами над Z являются лишь полиномы первой степени. Поэтому всякий неприводимый полином над Z, имеющий старший коэффициент, равный 1, можно записать в виде х — а. Лишь постоянные имеют степень, меньшую чем единица. Поэтому простейшими дробно-рациональными функ- циями над Z являются функции вида л (х- а)"’ где А и а — некоторые комплексные числа. Пусть F (х) — есть дробно-рациональная функция над Z, g(x) знаменатель которой g (х) имеет старший коэффициент, равный 1. Согласно IX, 4.5 он разлагается на множители: g (х) = (х — сц)** (х — а,)*« ... (х — аж)*т, где аъ аа, .... ат различны между собой. Теорема 3.3 для случая, когда рассматриваемым полем является поле всех комплексных чисел, означает следующее. 37Г
Лробно-рапиональная функция F (х) = -- над Z может бить «(*) представлена в виде суммы полинома и простейших дробно-рацис- нальных функций вида д <» =1.2, .... т\ 0 < щ < ki). Коэффициенты упомянутою полинома и коэффициенты А определяются благодаря 3 6 единственным образом. Они могут быть найдены методом неопределенных коэффициентов, подобно то- му, как это было сделано в примере 3.5. 3,8. Согласно IX, 5.5 неприводимыми полиномами над R, имею- щими старшие коэффициенты, равные единице, являются полиномы вида: х — а, х2 + рх 4~ q (р2 — 4q < 0). Поэтому простейшие дробно-рациональные функции над /? — это есть функции вида ---* &х+с . (p^ — 4Q<Q) (х-а)"-------------------(х2 + рх + <г)П *4'" >' где А, с, В, С, р, q £ R. У функций второго типа числитель имеет степень один или нуль (при В = 0), поскольку степень полинома х2 рх -j- q равна двум. Для дробно-рациональной функции F (х) = над полем всех вещественных чисел R знаменатель ее согласно IX, 5.7 разла- гается следующим образом на неприводимые над 7? полиномы: g (х) = (х — at)*< (х — а2)*« ... (х — а.^ х X (х2 + рхх + <?,)'. ... (х2 + ргх + <7,)'г tfi-Aq, <0; /= 1, 2, .... г). Поэтому теорема 3.3 для случая поля 7? дает следующее. Дробно-рациональная функция F (х) = — над R может быть представлена в знде суммы полинома над /? и простейших дробно рациональных функций вида А Вх + С (x-afi’ (х» pjx + qtfj (i -= 1, 2, .... s; / = 1, 2.г; 0<щ < kr, р/ — 4fy<0), где A, az, В, C, pit £ R. . Вещественные коэффициенты определяются благодаря 3.6 един1 сгвенным образом. Для их нахождения может быть использован ме- тод неопределенных коэффициентов. 3.9, Пример. Рассмотрим дробно рациональную функцию над полем всех вещественных чисел х6 —j^ + Sx3 —2х* + х—1 ’ 372
которую в 3.5 мы рассматривали как дробно-рациональную функцию над полек всех комплексных чисел. Используя деление с остатком числителя на знамена- тель и разложение знаменателя на множители, приведенное в 3.5, получаем: F (х) = х 4~ 1 4- —х‘ + X* -t- 1 (X-l)(X»+t)»~ Полиьомы к — 1 и ха 4- I неприводимы над полем всех вещественных чисел. Поэтому должно существовать разложение F(x) = х 4-1 + ——j+ х— 1 #х + Р (х2+»)а Qx-т R х»4-1.' Нахождение неизвестных коэффициентоз М, N, Р, Q, /? может быть про- ведено таким же способом, как в примере 3.5. Мы приводим простейшие дробно- рациональные функции к общему знаменателю и приравниваем числитель полу- чившейся функции полиному —х1 + х* + 1. Придавая затем независимому пе- ременному х те иля иные значения или приравнивая коэффициенты при одина- ковых степенях х, мы получим уравнения, из которых могут быть нгйдены не- известные М, N, Р, Q, R. Так как этот путь вполне аналогичен тому, который мы проделали в 3.5, то не будем на нем останавливаться. Вместо этого получим необходимое разложение, пользуясь уже имеющимся разложением над полей всех комплексных чисел. В 3.5 мы получили: „. . =. , .. , 1 _ 1 - / _ 5 -г It _ 1 I t _ 5 —4i W ~ • 4(x— 1) 8(x-H)2' 8(x4-i) - S(x— i)1 8(x —0‘ Объединим вместе третье и пятое, а также четвертое и шестое слагаемые (мы объединяем их так, чтобы получить те знаменатели, которые должны быть при разложении над полем вещественных чисел). В результате получаем: 1 х1 — 2х — 1 5х 4 F(x) = (х + 1) + —-— — —T77-TJ—• ~ , , ,; - 4(х—1) 4'х’ + 1)* 4(х’+1) Эго разложение не является искомым, гак как степень числителя третьего ела гаемого не меньше степени неприводимого ха + 1, квадратом которого является знаменатель. Поэтому совершим деление с остатком этого числителя на х* + 1: х> — 2х — 1 = (х® + 1) — 2х — 2. Подставив полученное выражение для х1 — 2х — 1 в наше разложение, получим искомое разложение нашей функции над полем всех вещественных чи- сел: г, , , 1 , 1 (ха(-1) —(2x4-2) 5x4 4 F(x) -x-r 1 + 4(ж_1} 4(х»-}-1)» 4(х’+1) 1 1 2х + 2 5х )- 4 * ~ ’ + 4(х—1) “4(х»+ 1) +4(х’-+ 1)’-4(х’+ 1) 1 х + 1 _ 5х 4- 5 * + + 4lx_ j) “ 2 (x^TTja ~ 4 (ж« 4- п • § 4. Значения дробно-рациональных функций 4.1. Для того чтобы вычислить значение заданной дробно- рациональной функции, можно непосредственно воспользоваться формулой, которая ее задает. Однако в некоторых случаях возможно при помощи предварительных преобразований существенно упрос- зтз
тить задачу. Упомянутые преобразования представляют и опреде- ленный теоретический интерес, выясняя некоторые важные свойства чисел. Если дробно-рациональная функция является функцией над полем Р, то характер ее значения при значении независимого пе- ременного х, равного числу г, существенно зависит от того, является ли число 2 алгебраическим или трансцендентным относительно пи- ля Р (4.V1, 4.1). 4-2- Пример. Рассмотрим следующую дробно-рациональную функцию над нолем рациеьальных чисел Q: F(x} = — х — I Число У 2 является алгебраическим относительно Q. Значение F (х) при х, равном У2, есть F (/5) —---------. /2—1 Как известно, это выражение может быть легко преобразовано к виду, в котором /2 в знаменатель не входит: ПУТ> - - .+П у2-1 (/2-1) (/2+1) Рассмотрим теперь значение F (х) при х, равном я, имея а виду, что число я относительно Q трансцендентно: FW---------- Я —- 1 Легко видеть, что преобразовать это выражение к виду такого типа, который был получен выше для F (/2), невозможно. Действительно, предположи!, что при некоторых о,, а,,.... an.t, а„ € Q имеет место F (л) = —— = воя" + «!«“"» +... 4- с„~1Я + ап, я— 1 мы получили бы соотношение, противоречащее трансцендентности я относитель- но Q: ОоЛ'11’* + (в! — <1#)ЯЛ + ... + (ап — ая_1 — 1) я — ап — 0. 4.3. Оказывается, что для значений любых дробно рациональных функций над любым полем дело обстоит в принципе так, как это имело месте в примере 4.2. Однако, для того чтобы прийти к этому, нам предварительно придется несколько углубить сведения об ал- гебраических числах. Согласно определению число z является алгебраическим отно- сительно поля Р, если существует полином ненулевой степени над Р, для которого z является корнем. Таких полиномсь для данного z существует, очевидно, бесконечно много. Но среди них можно выделить здии, определяемый числом z единственным образом. Теорема Если число z является алгебраическим относительно поля Р, то существует единственный непривсс^лый над Р полином 374
Ф (х), иллчщий старший коэффициент, равный единице, такой, что г является его корнем Всякий полином над Р, имеющий г своим корнем, делится на этот полином <р (х). Доказательство. Пусть f (х) есть произнольный нену- левой полином над Р, имеющий г своим корнем. Разложим / (х) на произведение числа и неприводимых над Р полиномов со старшими коэффициентами, равными единице (IX, 3.8): f (х) = а • <р, (х) • <р4 (х) • ... • <рт (х). Положив х = z, получим: f (г) — а • <Pj (г) • ф3 (z) • ... • <pm (г)-0. Так как а =/= О, то один из сомножителей (г) должен равняться нулю. Таким образом, мы получили полином <р(х) = <р,(л), непри- водимый пад Р, имеющий старший коэффициент, равный единице, для когорого г буде! корнем. Всякий полином над Р, имеющий корень г, не взаимно прост с <р(х) (IX, 2.18 (9)) и потому делится на полином tp (х) (IX, 3.5 (б)). Остается показать, что если <р (х) и ф (х) оба суть полиномы, неприводимые над Р и имеющие старшие коэффициенты, равные единице, причем г является корнем каждого из них, то ф (х) = ф (х). Действительно, полиномы <р (х) и ф (х), имеющие общий корень, не взаимно просты. Отсюда ввиду неприводимости <р (х) и ф (х) получаем, что каждый из них должен делиться на другой. А так как старшие коэффициенты этих по- линомов одинаковы (равны единице), то ф (X) = ф (х). 4.4. Доказанная теорема делает естественным следующие по- нятия. Определение. Степень неприводимого над Р полиноми со старшим коэффициентом, равным единице, имеющего число г своим корнем, называется степенью алгебраического числа г относительно Р. Корни упомянутого полинома называются числами, сопряжен- ными с числом г относительно поля Р. 4.5. Отметим несколько свойств алгебраических чисел, непо- средственно получающихся из определения 4.4 и теоремы 4.3. I) Количество различных чисел, сопряженных относительно по- ля Р с числом г, алгебраическим относительно Р, равно степени г относительно Р (при этом в числе сопряженных с г чисел считается и само z) Действительно, мы знаем, что полином, неприводимый над ка- ким-нибудь полем, имеет все корни первой кратности. Поэтому количество различных корней такого полинома равно его степени (IX, 3.5). Степень неприводимого над Р полинома со старшим коэффициентом единицей, имеющим своим корнем г, и есть по опре- делению степень z 2) Алгебраическими числами первой степени относительно по- ля Р являются числа, принадлежащие Р, и только они. Действительно, корень полинома первой степени над Р ах Ь, 375
равный —принадлежит Р, С другой стороны, ееяи р — число а из Р, то оно является корнем полинома первой степени над Р: х — р. 3) Если число z является корнем полинома f (х) степени п над Р, то степень z относительно Р будет числом, не поевосходяищм п. Действительно, f (х) согласно теореме 4.3 должен делиться на неприводимый над Р полином $ (х), степень которого равна степени числа г и, следовательно, не превосходит п. 4) Пусть все числа из поля Рх являются также числами из поля Рг. Тогда число г, являющееся алгебраическим степени п относительно Plt будет алгебраическим и относительно Ру при этом его степень относительно Р2 не больше п. Действительно, неприводимый над Рх полином <р (х) сте- пени п, имеющий z своим корнем, является одновременно и полиномом над (так как все числа из Рх принадлежат Р9). Поэтому число z будет алгебраическим относительно Р2. Степень его относительно Р2 согласно 3) будет числом, не превосходящим п. Отметим, что степень будет равна п в том случае, когда <р (х) будет также неприводимым и над Рг, что, как мы знаем, бывает далеке не всегда. Если число £ сопряжено с z относительно Рг, то г и г* будут кор- нями неприводимого над Рг полинома ip (х) со старшим коэффи- циентом, равным единице. Согласно 4.3 этот ф (х) будет делителем ф (х), откуда следует, что z и z\ очевидно, являясь корнями для Ф (•*). будут сопряжены относительно Р,. 4.6. Докажем упомянутую в 4.3 возможность преобразования выражения для значения дробно-рационалыюй функции. Теорема об освобождении от иррацио- нальности в знаменателе. Пусть F (х) есть дробно- рациональная функция нид полем Р. г — алгебраическое число сте- пени п относительно Р, входящее в область определения функции F (х). Тогда при некоторых с0, си ..., ся_2, ся_х С Р имеет место. F Й) = Q + V + ... 4- сп_уг”~* 4- cn_1z'!~l. Доказательство. Согласно 1:8 F (х) может быть пред- ставлена в виде F (х) = Hit, где / (х) и g (х) — взаимно простые gM полиномы над Р. Ф (х) есть неприводимый над Р полином степени п, для которого г является корнем (4.3, 4.4). g (х) не делится на <р (г), так как <f (г) — 0, но g (z) Ф 0 согласно 1.9. Отсюда следует, что полиномы над Р\ g (х) и <р (х) — благодаря неприводимости <р (х) должны №
быть взаимно простыми (IX, 3.5 (6)). Но тогда существуют такие по- линомы над Р: и (х) и v (х), что и W g (*) + v (х) <р (х) = 1. Положим, в этом равенстве х = г. Так как ср (z) = 0, то мы ио- лучим: «(z)g(z)=l. Обращаемся теперь к интересующему пас выражению для зна- чения функции F (х): ,Й=Й.«0Й!Й.,Й|М g(z) gW Совершим деление с остатком полинома и (х) f (х) яа полипом ср (х): м (х) f (х) = ф (х) s (х) -Ьс0 4- CjX 4- ...4- сл_2х'-2 4- Остаток, имеющий степень, меньшую п — степени полинома ср (х), есть полином над Р, что означает с0, сг, .... сл_4, cn_j G Р. Так как ср (z) = 0, то мы, полагая х = z, получаем для F (г) требуемое выражение: ? =iS = (г)=с»+ciz+-++c«-i?n'1- 4.7. Апалпзируя доказательство теоремы 4.6, замечаем, что для проверенного там преобразования, приведшего к освобождению от иррациональности в знаменателе, в сущности совсем не обяза- тельно находить именно неприводимый над Р полипом ср (х), для которого z являлось бы корнем, В качестве <р (х) можно взять лю- бой над Р полином, для которого z является корнем, лишь бы наи- больший общий делитель полиномов ср (х) ng (х) оказался постоян- ной. Это обстоятельство существенно расширяет возможность использования рассмотренного преобразования, ибо проверка не- приводимости полинома может представить значительные (иногда практически непреодолимые) трудности. Следует также отметить, что иногда преобразование, использо- ванное при доказательстве теоремы 4.6, целесообразно произвести последовательно двукратно или даже несколько раз. 4.8. Пример. Изложенный в 4.6 способ «освобождения ст иррациональ- ности г знаменателе» вполне применим для преобразования конкретных числен- ных выражений. Пусть, например., дано число t_ t У 25 — 2 4 5 ’ t является значением дробно рациональной функции 3 /-г при х — у5. 977
Способом 4.6 можно выразить t черед Уб. Число У5 является корнем сле- дующего полинома над полем всех рациональных чисел: х1 - 5. Построим последовательность Евклида для полиномов Xs — 5 и х1 — 2х 4- + 5: *» _ 5 = (х> - 2х + 5) (х + 2) - х - 15, х» - 2х 4 5 = — (х 4- 15) (—х + 17) + 260. Отсюда выражаем 260 (наибольший общий делитель х1 — 5их*—2*+5) через исходные полиномы: 250 = (х> - 2х 4- 5) 4- (х 4- 15) (—х 4- 17) = = (х» - 2x4- 5) 4- £(х» - 2х - 5) (x-t- 2) - (х3 - 5}] (-х + 17) = = (х* - 2х 4- 5) (- х* 4- 15х 4- 35) 4- (х3 - 5) (х - 17). Полагая х= у^б, получаем: 260 = [(3/5)» — 2 |<Г4- 5] • [—(У 5)’ 4- 15 У5 4- 354 Отсюда для рассматриваемого нами числа t получаем: /зя И-1 = (Уб - I) • [-(Уб)34-15 У5 4- 35] (Уб)* - 2 Уб 4- 5 [(У5)*_2У5 4-^].[-(У5)’4-15Уб4-35] = i [16 (Г5)3 4- 20 3/5 - 46] = (У5)4 И- ZOU ОО 1О 1О 4.9. Если число z трансцендентно относительно поля Р и F (х) есть дробно-рациональная функция над Р, не являющаяся полиномом, то значения F (?) не может быть выражено через г, так, как это было сделано в 4.6 для случая алгебраического числа. Действительно, предположим, что Р(2) = Ж = Л(г), g(«) где f (х), g (х), h (х) — полином над Р, причем f (х), g (х) взаимно просты. Тогда f (г) — h (?) g (?) — 0, т. е. г является корнем полинома над Р: f(x) — h (х) g (х). Так как г трансцендентно относительно Р, то этот полином должен быть постоянной нуль: ftf — h (х) g (х) = 0. Следовательно, / (х) = Л (х) g (х). Так как f (х) и g (х) взаимно просты, то их общий делитель g(x) должен быть постоянной: g (х) = с. Но тогда дробно-рациональная функция F (х) оказывается полиномом: F (х) = — [ (х). С зге
4.10. Пусть F (х) есть дробно- рациональна я функция над по- лем Р. Если z есть алгебраическое число относительно Р, то значе- ние функции F (z) является алгебраическим числом относительно Р. Это следует из того, что F (г) получается из z и из чисел, принадле- жащих Р, при помощи арифметических действий. Но множество всех чисел алгебраических относительно Р является полем (4.VI 4.7). Поэтому из того, что z и числа из Р принадлежат этому во- лю, следует, что и F (z) должно принадлежать этому полю, т. е. быть числом алгебраическим относительно Р. 4.11. Теперь выясним вопрос об алгебраичнссти и трансцен- дентности значения дробно-рациональной функции при транс- цендентном значении переменного Теорема. Пусть F (х) есть не являющаяся постоянной дробно рациональная функция над числовым полем Риг — число, трасцендентное относительно Р. Тогда число F (z! трансцендентно относительно Р. Доказательство. Пусть F (х) = где /(х) к g(x) g (х) — взаимно простые полиномы над Р (1.8). Так как F (х) не является постоянной, то степень хотя бы одного из лолиномон f (х) или g (х) должна превосходить нуль. Предположим, что F (z) является корнем некоторого полинома над Р ненулевой степени: h (х) = щр* 4- щх*-1 4- ... 4- ая_гх 4- а„ 0, п > 1). Имеем: нор + oi Г /и) |*ч Отсюда получаем: Щ f (г)д 4- aj (z)n~l g (z) 4- ... 4- W g (z)n~l 4“ 0^(2)* = 0. Так как z трансцендентно относительно P, то соответствующий по- лином над Р должен быть постоянней, равной нулю: ав/(х)п + aj(x)r-lg (х) 4- ... 4- ап_ф (x)g(x)"~14-e4jrWrt = 0- Среди чисел alt at, .... вя_.п а„ должны иметься числа, отличные от нуля, так как иначе благодаря щ & 0 оказалось бы, что f (х) есть постоянная, равная нулю, а потому и F (х) есть постоянная, равная нулю. Пусть ak (k 1) есть а{ с наибольшим номером, отличное от нуля. Сокращая в последнем равенстве на f (х)*-*, получаем: о»/to* + ох/ Wft“*g(x) 4- ... 4- ah_{ fix) g(x)‘-‘ 4- ад(х)‘ = 0 (йо. а* ¥= 0; k > I). Если степень полинома f (х) над Р больше нуля, то существует неприводимый над Р полином <р (х), являющийся делителем f (х).
В последнем равенстве все слагаемые, кроме последнего, делятся на Ф (х). Следовательно, и последнее слагаемое a* g (х)4 (а* =£ С) должно делиться на <р (х). Благодаря IX, 3.5 (7) из того, чго ф (х) неприводим над Р, отсюда следует, что g (х) должен делиться на <р (х). Но это противоречит тому, что f (х) и g (х) взаимно просты. Точно таким же рассуждением приходим к противоречию при предположении о том, что степень полинома g (х) больше нуля. § 5. Простые расширения числовых полей 5.1. Пусть Р — произвольное числовое поле иг — некоторое число. Согласно (4.VI, 3.8) определяется поле P(z), обладающее тремя свойствами: 1) Р (г) zd Р; 2) Р (г) Э z; 3) Р (г) является подмножеством вся- кого числового ноля, содержащего Риг. ,Мы будем называть Р (г) простым расширением поля Р, произведенным примитивным эле- ментом г. Так же говорят, что Р (?) есть поле, полученное из Р присоединением числа г. В (4.V1, ЗЛО) было выяснено, из каких чисел состоит Р (г). Теперь мы можем сказать, что Р (г) состоит из значений всевозмож- ных дробно-рациональных функций над Р, взятых при значении переменного х, равном числу г. Строение и свойства простых расширений существенно зависят от того, является ли число г относительно Р алгебраическим или трансцендентным (4.VI, 4.1). Соответственно говорят о простом алгебраическом расширении и о простом трансцендентном расши- рении. 5.2. Сперва рассмотрим простое трансцендентное расширение. Пусть число г трансцендентно относительно числового поля Р. Согласно 1.8 и 5.1 каждое число из Р (г) может быть представлено в виде: ^) = ж g(z) где f (х) и g (х) — взаимно простые полиномы над Р, причем стар- ший коэффициент полинома g (х) равен единице. Покажем, что это задание для каждого числа из Р (г) единст- венное. Пусть имеет место равенство двух таких выражений Ji (г) _ U) Ki (z) ft (г) ’ Мы имеем: /1 W Si (г) = f2 (г) g. (г). Эго означает, что г является корнем следующего полинома над Р: fl (х) gt (х) — ft (х) (х). 3»
.Так как z трансцендентно относительно Р, то этот полином дол- жен быть постоянной нуль: fi (х) gt (х) — (х) g, (х) = 0. Поэтому должно иметь место равенство' fi (х) gt (х) = (х) g! (х). Из того что ft (х) и gt (х) взаимно простые, благодаря IX, 2.16 (6) следует, что g2 (х) должен делиться на gt (х). Аналогично gt (х) делится на ga (х). Так как их старшие коэффициенты равны, то gi (х) ~ St (х). Благодаря этому из нашего равенства следует и fi (х) ft (х). Таким образом, два рассматриваемых выражения и просто совпадают. 5.3. Благодаря 5.2 между числовым полем Р (г) при трансцен- дентном г и полем дробно рациональных функций, которое мы обозна- чим на время Р (х) (2.6), устанавливается взаимно однозначное соответствие Р (?) - Р (х) (Р (?) € Р (г), F(x)£P (х)). Согласно правилу сложения дробно-рациональных функций при Pi (х) + Ft (х) = F3 (х) имеет место Pi (z) + Ft (?) = F3 (z). Аналогично и для остальных арифметических действий. Это озна- чает, что указанное соответствие предсгавляет собой изоморфизм (4.VII, 4.7) между простым трансцендентным расширением Р (z) поля Р и полем Р (х) всех дробно рациональных функций над Р. Тем самым вес простые трансцендентные расширения поля Р оказываются изоморфными между собой. Это означает, что с ал- гебраической точки зрения они устроены совершенно одинакого. 5.4. Иначе обстоит дело в отношении простых алгебраических расширений. Если число г алгебраическое относительно Р, то раз- ные дробно-рациональные функции над Р при х, равном г, могут иметь равные значения. Простые алгебраические расширения поля Р, порожденные разными примитивными алгебраическими элемен- тами, могут оказаться устроенными совсем по-разному 5.5. Пусть z есть алгебраическое число степени п относительно числового поля Р. Согласно 4.6 и 5.1 Р (z) есть множество всевоз- можных сумм вида св + ctz 4- ... + (с0, с1( ..., ся_3, с„_1€ Р). Легко убедиться, что всякие две такие различные по виду суммы представляют собой неравные числа из Р (г). ЭВ1
Действительно, из равенства двух таких выражений вытекло бы равенство вила 4> + + ... + dn_^ + = 0(^4,, ...,dn_itdn^P), з котором ке все d, равны нулю. Это означало бы, что г является корнем некотооого полинома над Р, имеющего степень, меньшую п. Но это противоречит 4.3 и 4.4. 5.6. Выяснив, из каких чисел состоит простое ал1ебраичсское расширение Р (г), укажем, как совершаются действия над числа- ми из Р (г), заданными в рассматриваемой ферме. Пусть г — алгебраическое чисто степени п относительно по- ля Р является корнем неприводимого полинома <р (х) над Р, имею- щего старший коэффициент, равный единице (4.3). Возьмем два чиста из Р (г): ti = со 4- сг2 -I- ... + Сп._2гП~2 + /; = с; 4- <г + ... 4- С/-* 4- <_1ze-1 (cp ct G P', i — 0, 1, .... n—2, n—I). Очевидно, t 4- f = (co4-co) 4- (cx4-ci) z-f- 4- (сп^2-{-сп-2) zr 24- 4- (cn_j 4- cn -i) z’-1, t — t' = (co—c'j) 4- (cx—<) z 4- ..._4- (ca г—c’n_ 2)zn 2 4- 4- (ся_1 — Cn-i)zn-1. Что касается произведения t и f, то, перемножив соответствующие выражения для этих чисел, получим, что / - Г = Л (г), где Л (г) есть значения некоторого полинома h (х) над полем Р. Так как степень h (х) может оказаться больше, чем п — 1, то полу- ченное выражение для t Г ке есть еще искомое- Однако его легко преобразовать к требуемому виду. Для этого надо совершить деле- ние с остатком полинома h (х) на полином <р (х): Л (х) == ф (х) • s (х) 4- со 4- ci* 4- ... 4- c«_sxn_’4-^-ix"-1. Отсюда, пользуясь тем, что <р (z) = 0, мы получаем: t t" = h (z) = co 4- Ciz 4* ••• 4" Cn-2Zn-a 4- a»—iz”-1. Также и частное наших чисел < в с» 4- 4- - 4- сп^п~14- _ е со4-с/4- ••4-Cn-?z""a+ сл^1гП-1 можно способом, рассмотренным в 4.6, привести к виду: — = eg 4" cjz 4" ••• 4- сА-гг"-* + Cn-iz""1, где с{, с|, ..., Сп-2, ся*-1 — числа из Р. 382
Таким образом, мы получаем полное описание строения простого расширения и в том случае, когда примитивный элемент оказы- вается числом алгебраическим относительно исходного поля. Такие простые расширения могут существенно отличаться друг от друга. Все зависит от того, какой неприводимый полином ф (х). Задание этого полинома по существу определяет строение простого расши- рения. Два простых расширения, для которых указанный полином <р (х) один и тот же, т. е. когда их примитивные элементы сопряжены относительно исходного поля (4.4), по существу одинаковы, от- личаясь лишь обозначением примитивного элемента. При разных неприводимых полиномах простые расширения уже по существу различны, ибо даже в случае одинаковой степени примитивных элементов имеется разница в правилах совершения действия ум- ножения и деления чисел у обоих простых расширений. 5.7. Пример. Пусть г есть корень полиноме х4 — 2х 4~ 10. Полином этот неприводим над полем всех рациональных чисел Q. Таким обра- зом, всякое число из простого расширения поля всех рациональных чисел, полу- ченного при помоши примитивного элемента г, однозначно представимо в виде Cjz3 4- щ 4- где clt ct, с,. с< — рациональные числа. Рассмотрим на примере, как совершаются действия над теслами, задан- ными в таком виде Пусть r = 2»_ya*4-l, Г =г*4-1. Выражения для суммы и разности этих чисел получаются сразу: < + Г = / + уг» + 2, = —|z*. Произведение имеет вид; t • f — ? — ~ z* 4- 4- у z* 4- I. Для того чтобы привести это выражение к требуемому ниду, совершим деление с остатком со- ответствующих полиномов: 1 1 I 1 \ 5 х»_-х*4-х’4--х»4-1=(ж‘-2«4-,О) х--)4-х8+-х»-Пх4"в. л л \ л J л Так как г есть корень х* — 2х 4- Ю, то получаем для t • т' требуемое выражение: 11 5 t • f = г*— "г4 4-л* + —г* 4-1 = ** + — z* — Н* + 6- A, A, i Теперь рассмотрим частное наших чисел: < _ f а*+1 Прежде всего, совершая деление с остатком, получаем: 3 t _ 1 _ 2 Г 2 ~ z*4-l ‘ *1
получаем: Для получения требуемого выражения для — гкзбазляемся от иррациональности ч знаменателе» методом 4.6. Строим последовательность Евклида для полиномов х* - 2jt + 10 и х" -I 1: _ 2х + 10 = (х4 + 1) (х1 --1) 2х - 11), х»+ 1 =(-2х-Ь П)4 \ 2 4/ 4 Полагая х = г и пользуясь гем, что г есть корень х4 — 2х 4- 10 125 / 1 11\ -==(г« + 1) + (2г_ц)(_.-г_7)г, = (г’4-1)4- (г*4-1)(г*-1)(-у = (г’ + 1)(-Тг3-7г> + |г+т)- Пользуясь полученным разенством, находим: t 1 f ~г (— 2г3 - 11г14-2г + 15) 1 2 (г1 + 1)(—2г3—11га + 2г+15) 2* 2 8 — S J-----гз _ 125 ' 125 -!s(-^'8=, + ?", + i2*-f)- 37 113 8 — — г4 -т- — г — —. 250 125 25 о 2 4 20 Вычитая из полученного выражения —г4——г 4------(это число равно ну- 125 125 125 , i л«>), находим, наконец, искомое выражение для —: t 3 , 37 . 117 12 125 250 125 25 5.8. Мы показали, что поле, получаемое из исходного числового поля Р путем присоединения одного алгебраического числа (простое алгебраическое расширение), устроено, действительно, очень просто. Может показаться, что дело значительно усложнится, если мы при- соединим к Р несколько алгебраических чисел. Как мы сейчас уви- дим, на самом деле это не так 5.9. Пусть Р — некоторое числовое поле и zt, г2, .... гп — некоторые числа. Согласно (4.VI, 3.8) определяется числовое поле Р («,, zs, ..., Zn), обладающее тремя свойствами. 1) Р (zlt z2, .... zn) о эР;2)Р (zlr z2, ..., z„) 3 zlt z2.zn; 3) P (zlt z2, ..., zrt) является подмножеством всякого числового поля, содержащего Р и числа zt, z2, .... z„. Легко .чидеть, что поле Р (z1( z2, .... zn) можно получить из Р при помощи ряда последовательных простых расширений. Рассмотрим последовательность полей: Ро = Р. Рг = Ро (zj, Р8 = Р, (г2), .... Р„ = Р„_г (г„). Каждое РА является простым расширением поля Pfc_i(^=l, 2,... .... л). зм
Покажем по индукции, что Р1г — Pi;-\ (z*) = Р (ги z2, гк) Для /г — I это так. Пусть k > 1 и Р4_г = Р (г1( z2, .... 2^_1). Поле Рк = Pk_} (z,J содержит Р и числа гп z2, zk_\, zk. Поэтому Pk zz> Р (zlt z2, .... zA_,, zk). Нс, с другой стороны, Pk должно содержаться в поле Р (г,, г2, ..., zk-i, zh), поскольку Р (2Р г2, ..., г*..,, гД до Р (z1T z2, .... zk..\) = Рк-\ и Р (zlt z2, ... .... zft_i, гД J zk. Следовательно, Рк = Р (zn z0, ..., zk-\, zk). Мы доказали, что Р (гь г2, ..., zn) = Рп. Отметим, что если все числа z1( z2.з„ были алгебраическими относительно Р, то каждое из них будет алгебраическим и относи- тельно каждого Pi. Поэтому каждое из полей Рк, входящих в рас- сматриваемую последовательность, будет простым алгебраическим расширением предыдущего поля Рк^ (6=1, 2, ..., п). 5.10. Следующая теорема, играющая исключительно важную роль в теории алгебраических чисел, была получена норвежским математиком Н. Абелем (1802—1829). Теорема о примитивном элементе. Пусть числа и и v являются алгебраическими относительно числового поля Р. Тогда Р (и, и) (5.9) является простым алгебраическим расширением поля Р. Доказательство. Обозначим Рг = Р (и) и Р2 = Р (и). Согласно 5 9 Р2 = Р {и, v). Обозначим через <р (х) неприводимый над Р полином со старшим коэффициентом единицей, для которого число и является корнем. Через ф (х) обозначим неприводимый над Р полином со старшим коэффициентом единицей, для которого v является корнем. Возьмем теперь такое рациональное число с, для которого имеют место нера- венства: для всех и", сопряженных с и относительно Р (4.4).(в том числе и для и" = и), и всех ц', сопряженных с о, но отличных от v (при v' — i< выражение справа вообще не имеет смысла). Такое с, конечно, найдется, ибо чисел, сопряженных с а и со, и — и' конечное количество, так что выражение-------принимает лишь У — v конечное число различных значений. Введем в рассмотрение следующее число z из поля Р2: z = и + cv. Рассмотрим простое расширение поля Р, произведенное с по- мощью примитивного элемента z: Р3 = Р (г). Мы хотим доказать, что Р3 = Р2. Для этого нам достаточно показать, что Р3 содержит числа и и V. Действительно, отсюда будет следовать, что Р3 => Р2 = = Р (и, о). Но с другой стороны, z £ Р2 = Р (и, v), и потому Р.. с= ед Р2 = Р (и, V), т. е. Р3 = Р2. 13 Заказ 6"' 385
Рассмотрим полиномы <р (z — сх) и ф (х). Олп оба являются по- линомами над Р3. Действительно, выражение для полинома <p(z — сх) получится, если в <р (х) вместо х подставить z—сх. Но совершив такую подстановку и объединив члены с одинаковыми степенями х мы, очевидно, получим при них коэффициенты, выраженные рацио- нально через число z, принадлежащее Р3, и коэффициенты поли- нома q? (х), которые, как и рациональное число с, принадлежат по- лю Р, а следовательно, и полю Р3. Что касается ф (х) , то, будучи полиномом над Р, он тем самым может рассматриваться и как поли- ном над Р3. Обозначим через d (х) наибольший общий делитель по- линомов ф (z — сх) и ф (х), имеющий старший коэффициент, рав пый единице. Пусть а есть произвольный корень d (х), число а должно быть корнем ср (z — сх) и ф (х). Но Ф (г — са) = С имеет место только в том случае, когда г — са есть корень ф (л), г. е. одно из чисел, сопряженных с и относительно Р: г — са — и . С другой стороны, из того, что ф (а) = 0, следует, что а должно быть числом, сопряженным относительно Р с и: а = v‘. Следователь- но, z — си — и , и -h cv — av* — и‘, и — и' = с (о‘ — v). Благодаря выбору с последнее равенство имеет место лишь в случае v' = v и и = и". Отсюда следует, что никакие числа, отличные от V, не могут быть корнями d (х). То, что а — v действительно есть корень d (х), следует из того, что о является корнем и ф (z — сх) и ф (х): ф (z — си) = ф (и) = 0, ф (о) = 0. Благодаря этому оба указанных полинома должны делиться на х — о, а тогда и их наибольший общий делитель d (х) должен де- литься на х — о. Таким образом, полином над полем Р3, d (х), имеет лишь один корень V. Тем самым этот полином должен иметь вид d (х)=(х—о)п (мы не будем отвлекаться доказательством несущественного для нас обстоятельства, что на самом деле т = 1). Но коэффициентом при х7”-1 у этого полинома является —то. Из —то £ Р3 следует, что а £ Рз- А так как и число z = и ф- со принадлежит Р3, то отсюда следует, что и число и = z — со должно принадлежать Р3. Квк было сказано, из и, и 6 Рз вытекает, что Р3 = Р (z) равно Р.3—Рщ, и). 386
Остается отметить, что число г является алгебраическим отно- сительно Р. Действительно, если бы оно было трансцендентным, то согласно 4.11 все числа из Р., не принадлежащие к Р, должны были бы быть трансиендентны относительно Р. Но числа и, v при- надлежат к Р2 и являются алгебраическими относительно Р, а из их принадлежности к Р следовало бы, что uz=u-\-cvQP. 5.11. Пр и _м с р. Пусть Q есть поле ьсех рациональных чисел. Рассмотрим поле Q (р2, Уб). Как следует из 5.10, оно является простым алгебраическим расширением поля всех рациональных чисел Q. Найдем какой-нибудь примитив- ный элемент этою расширения (мы говорим «какой-нибудь», ибо, очевидно, каж- дое простое алгебраическое расширение обладает бесконечным количеством раз- личных примитивных элементов). Согласно построению, приведенному в 5,10, в качестве искомого примитив- ного элемента можно взять число /2 + с/5‘, где с есть любое рациональное число, такое, что где и' —число, сопряженное с |^2, и v' — число, сопряженное с У5 относи- тельно поля всех рациональных чисел и отличное от Уб. Так как JZ 2 есть корень неприводимого полинома над полем всех рациональных чисел № — 2, а Уб есть корень неприводимого полинома над полем всех рациональных чисел х2 — 5, тс и' равняется У 2 или —рЛ2", а и' равняется —Уб. Таким образом, для с полу- чаем условия: (-Гб)-/5 /5 т. е. в качестве с можно взять любое отличное от нуля рациональное число, на- пример с = 1. То, что У 2 4- У5 оказался примитивным элементом простою расширения У (У2, Уб) поля Q, другими словами, означает, что «исла ) 2и Уб могут быть выражены через У 2 4- У5 и через рациональные числа при помоши действий сложения, вычитания и умножения. 5.12. С л с д с т в и е. Пусть каждое из чисел zlt z2, zn является алгебраическим относительно числового поля Р. Тогда Р (zlt z2, ..., z,) есть простое алгебраическое расширение поля Р. Доказательство. Рассмотрим последовательность чис- ловых полей, указанную в 5.9: Ро = Pi Р1 — Ро (гг)> Рч = Р\ (гс)> • ••» Рп — Рп-\ (рп). Докажем по индукции, что поле — Р (zlt z2, ..., zP) (5.9) является простым алгебраическим расширением поля Р. Для k — 1 это так. 13* 387
Пусть k > 1 и Pk-i является простым алгебраическим расшире- нием ноля Р, т. е PK-i = Р {I), где t — некоторое число, алгебраи- ческое относительно Р. Так как Pt, = Pt—i (г.) и Р.—i = Р (/), то согласно 5.9 Р„ = = Р (t, гк). Но тогда благодаря 5.10 Р,. = Р (I, зк) есть простое алгебраическое расширение поля Р. Таким образом, Р (zv г2, .... г,,) оказывается простым алгебраи- ческим расширением поля Р. 5.13. Пусть / (л) есть некоторый полином над числовым полем Р и zlt г2, ..., z, — все его корни. Поле Р (zo z2, ..., гп), как легко видеть, является минимальным полем из полей, содержащих Р, относительно которого полином / (л) разлагается на множители пер- вой степени. Так как числа z,, z.,, ..., zn алгебраичны относительно Р, то поле Р (zn г,, ..., г,) благодаря 5.12 является простым ал- гебраическим расширением поля Р. Зто означает, что в поле Р (zp z2, ..., zn) существует таксе число / 6 Р (zn z2, ..., z„_), что Р (Zp z2, ..., z,) = P (l). Выражение этого поля в виде простого расширения поля Р существенно способствует изучению его свойств. Рассмотрение этого поля составляет основу углубленного изучения системы корней полинома f (л), а тем самым и алгебраического урав- нения f (х) — 0. § 6. Конечные расширения числовых полей 6.1. Пусть Р, есть некоторое числовое поле и Р2 его расширение, т. е. таксе числовое поле, что Рг ст Р2. Если рассматривать множество чисел, принадлежащих Р2, относительно действия слежения и операции умножения на числа из Рр то Р2, очевидно, оказывается линейным пространством над полем Рр Такой подход к расширениям позволяет использовать понятия и результаты теории линейных пространств. Для изучения некоторых свойств полей это оказывается очень удобным и полез- ным. Важнейшей характеристикой линейного пространства Р2 над Р± является ранг указанного линейного пространства. Так как по самому полю Р2 нельзя судить, над каким его подполем мы хотим рассматривать его как линейное пространство, то для определен- ности записи будем обозначать через rangptP2 ранг указанного ли- нейного пространства Р2 над полем Рг. 6.2. Определение. Если rangp, Р2 существует (другими словами, конечен), то Р2 называется конечным расширением поля Р, Конечно, было бы удобнее говорить не о конечном расширении, но о расширении конечного ранга или конечной размернссти, но в алгебраической литературе твердо принята именно указанная в определении терминология. 6.3 Теорема. Пусть Р2 есть конечное расширение числового поля Рг. Тогда всякое число из Р2 является алгебраическим относи- тельно Рк. 3S8
Доказательство. Пусть rangp Р2 = п. Для произволь- ного числа z f Р2 рассмотрим числа 1, г, г2, zn~', г". Все эти п 4- 1 чисел выражаются линейно относительно Рг через п чисел базиса линейного пространства Де над Pt. Отсюда согласно IV, 1.6 следует, что наши числа должны быть линейно зависимы отно- сительно Рр Со • 1 + CjZ СрЕ + ... + Cn—\Z'l~i + cnzn — О (со, Ср С2..Сп-1, Сп б Р). Так как среди чисел сг есть отличные от нуля, то это равенство означает, что z является корнем следующего полинома над Plt не являющегося постоянной нуль: сэ + CjX + с2х2 4- ... 4- Cn-ix4-1 4- спхп. Следовательно, г алгебраическое относительно Рг. 6.4. Теорема. Пусть Р (z) есть простое расширение число- вого поля Р, порожденное числом z. Если z алгебраическое относи- тельно Р, то Р (z) — конечное расширение (6.2). Если z трансцен- дентное относительно Р, то P(z) не является конечным расширением. Доказательство. 1) Пусть г есть алгебраическое число степени п относительно Р. Согласно 5.5 всякое число из Р (г) пред- ставимо единственным образом в виде: Со 4* CjZ 4- ... 4- c„_<'“24-Cn.-iz’’-1 (с„, ct. с„_2, c„-iCP). Это означает, что п чисел 1, г, .... г4-2, г1-1 образуют базис ли- нейного пространства Р (г) над полем Р. Следовательно, расшире- ние конечно. 2) Пусть z есть трансцендентное число относительно Р. Р (г) не может быть конечным расширением поля Р, так как иначе со- гласно 6.3 всякое число из Р (z) было бы относительно Р алгебраич- по, тогда как число z принадлежит к Р (г), но трансцендентно от- носительно Р. 6.5. Из рассуждений, проведенных в 6.3 и 6.4, легко увидеть, как для конечного расширения Р2 поля Рг можно было бы связать величину rang., Р2 со степенями чисел, алгебраических относи- тельно Рн входящих в Р2. Но у час сейчас нет причин останавливать- ся на этом подробнее. 6 6. Лемма. Если Р, ст Р2 с Р3, где Р.г есть конечное расши- рение числового поля Р\, а Р3 есть конечное расширение Р2, то Р3 будет конечным расширением поля Р1( причем rangpP3 = (rangp_Ps) (rangpPJ. Доказательство. Пусть ult и2< ..., иг есть некоторый базис линейного пространства Р2 над Р} и vlt v2, , vs — базис линейного пространства Р3 над Р2. Тем самым rangPiP2 = г, rangP2P3 = s. 389
Всякое число г из Р3 представимо в виде г — AjOj + A2i>2 4- ... + ksvs (Aj, A2, .... hs £ P2). Но каждое из Х; в свою очередь представимо линейно над PL через числа и,, и2, .... иг. Подставив соответствующие линейные выражения для А; в указанное выражение для z, мы,очевидно,полу- чим линейное выражение над Р} числа г через числа UjV^ ихиг, ..., UiVj, ..., urvs. Для того чтобы показать, что эти rs чисел образуют базис линей кого пространства Р.л над Pt, достаточно доказать, что эти числа линейно независимы Пусть некоторая сумма рассматриваемых чисел, взятая с коэф фициентами а, из поля Рг, равна нулю: аПы1у1 + al«ulu2 + ••• + а' UiVf + ••• + arsurvs = О- Объединим вместе члены с одинаковыми /IjVj Н' ‘^2V2 + ••• + ~ О- Так как числа Uk и ач принадлежат полю Рг, то все коэффициенты Aj оказываются числами из Рг. Но числа иь и2, , vs линейно не- зависимы относительно Р2, так как они образуют базис линейного пространства Рл над Рг. Следовательно, все коэффициенты At обя- зательно должны равняться нулю: Д; = ai;«! 4- а21и2 4- ... 4- а,/и, = 0 (/ = 1, 2, ... , s). Так как числа а« принадлежат Р., а числа и2, иг линейно независимы относительно Pt, то все коэффициенты этой суммы должны равняться нулю. Мы показали, что исе а,,- обязаны равняться нулю. Это и озна- чает линейную независимость чисел u.vt относительно Pv 6.7. Следствие. Пусть для числовых полей Pt с Pt с... ... ст Pm_, ст Рт каждое Рк (k = 2, 3, ..., т) является конечным расширением поля Pk-i- Тогда Рт есть конечное расширение псля Ри Действительно, согласно 6.6 Ра есть конечное расширение псля Pi. Но отсюда, благодаря тому что Р4 есть конечное расширение поля Р4, согласно 6.6 следует, что Р$ есть конечное расширение Рх. Повторяя соответствующее количество раз это рассуждение, по- лучаем требуемое утверждение, 6.8. Пусть Р — некоторое числовое поле и Р' — совокупность всех чисел, являющихся алгебраическими относительно Р. Отме- тим, что кз 6.6 непосредственно вытекает тот важный результат, который был получен ранее (4.VI, 4.7). Речь идет с том, что Р' является полем. Пусть zn г2 С Р' Согласно 6.4 Рх — Р (zj есть конечное рас- ширение поля Р, а Р2 — Pi (z2) есть конечное расширение поля Рг (поскольку г2, будучи алгебраическим относительно Р, тем самым является алгебраическим относительно Pj). Благодаря 6. 7 Ра есть конечное расширение поля Р. Числа zt 4* z2, zt — z2, z, z2, Zj : z2 (при z2 =/= 0) содержатся в Pa. Поэтому они согласно 6.3 алгебраи- 390
ческие от носительно Р. Это доказывает замкнутость Р‘ относительно арифметических действий. 6.9. Т е о р е м а. Если число z алгебраическое относительно поля Р', состоящего из всех чисел, алгебраических относительно некоторого числового поля Р (6.8), то z является алгебраический относительно самого поля Р, т. е. z £ Р'. Доказательство, z является корнем некоторого поли- нома f (х) над Р', т. е. f (г) = с0 + CjZ + ... + c,l_1zn~x + cKzn = 0. Рассмотрим последовательность полей Ро ~ Р1 Р\ ~ Ро (Со). Р2 = Р\ (с1). • • •> Рп+\ — Рп (сп), Pn±2 = Pn \-l(z). Каждое из этих полей Pk является простым алгебраическим расширением Рк~\ {k — 1, 2, .... п + 1, и 4- 2). Действительно, каждое с , будучи алгебраическим относительно Р, тем самым является алгебраическим и относительно Pk_i- z алгебраическое относительно Ди+1, поскольку оно является корнем полинома f (х), все коэффициенты которого принадлежат к РЙ-i. Согласно 6.7 Р„+2 является конечным расширением поля Ро = Р. Поэтому бла- годаря 6.3 число z, содержащееся в Рп+2, должно быть алгебраиче- ским относительно Р. 6.10. Всякое число из некоторого числового поля Р является алгебраическим относительно Р. Бывают такие поля, относительно которых никаких других алгебраических чисел не существует (такие поля называют алгебраически замкнутыми). Теорема 6.9 означает, что совокупность всех чисел, являющихся алгебраически- ми относительно некоторого поля, как раз является таким полем. Этот результат важен уже и для того случая, когда рассматри- вается совокупность Q' всех чисел, алгебраических относительно поля всех рациональных чисел Q. Попытка расширить поле Q', до- бавляя к нему числа, алгебраические относительно Q', ничего не дает. Все эти числа сами принадлежат Q', т. е. мы получаем опять все то же поле Q'. 6.11. В заключение отметим, что рассмотренное в этом парагра- фе понятие конечного расширения числового поля оказывается на самом деле эквивалентным понятию простого алгебраического расширения, которому был посвящен предыдущий параграф. Действительно, с одной стороны, в 6.4 было показано, что про- стое алгебраическое расширение поля Р± является его конечным расширением. С другой стороны, пусть Р2 есть конечное расширение поля Рг. Возьмем некоторый базис и2, .... ип для Р2, рассматриваемого как линейное пространство над Р\. Очевидно, Рг (щ, иг, .... и,)=Р2. Согласно 6.3 все числа «х, иг, .... ип являются алгебраическими от- носительно Pt. Поэтому из 5.12 следует, что Р2 — Р2 (щ, и2, .... ия) есть простое алгебраическое расширение числового поля Рг. Сказанное позволяет пересказать все результаты настоящего параграфа в терминах простых алгебраических расширений. 391
Гласа XI. ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ § 1. Понятие полинома от нескольких переменных 1.1. Наравне с функциями одного переменного рассматриваются и функции от нескольких переменных Идея функции от несколь- ких переменных очень естестсенна и проста и является обобщением понятия функции одного переменного. Это относится как к вещест- венным функциям, так и к комплексным. Определение. Пусть задано множество Е последователь- ностей, состоящих каждая из п комплексных чисел'. (а1г а2, ..., а ). Комплексной функцией от п комплексных переменных, определенной на множестве Е, называется закон, который каждой последователь- ности из Е (называемой в зтом случае системой значений комплексных независимых переменных) ставцт в соответствие некоторое комп- лексное число (называемое значением функции при данных значениях независимых переменных). Множество £ называется множеством допустимых систем зна- чений независимых переменных для данной функции или областью изменения независимых переменных, а также областью задания (определения) функции. Числа, составляющие последовательность (а1( а2, ..., ап) С £, называются значениями: 04 — первого независи- мого переменного, <х2— второго независимого переменного и т. д. Для такой функции употребляются обозначения вида: £ Сч» я2, •••» хп). В случае, когда запись оказывается слишком громоздкой, пе- ременные хг в обозначении функции часто не указываются и вме- сто £ (х±, х2, ..., хп) пишут просто £: £ = £(%], х2..... хп). Значение данной функции при значениях независимых переменных Xi = aL, х2 = •••> Хп = «п, т. е. число, соответствующее после- довательности (а1( »2> • «.) из £, обозначается: £ (ах> а2, ап). 392
1.2. Для функции от нескольких переменных, как и для функ- ции одного переменного, часто используется способ задания при помощи формулы, указывающей последовательность операций, которые надо произнести для получения из значений переменных Хр х2, ..., хп значения данной функции. Если нет специальных указаний относительно области определения этой фукпцин, обычно считают, чю опа состоит из всех таких последовательностей чисел хи х2, ..., х„, для которых указанная последовательность опе- раций может быть осуществлена. 1.3, Пусть комплексная функция F (Xj, х2, ..., х.) имеет своей областью определения множество п-членных последо- вательностей Е. Если некоторым из независимых переменных придать какие-ни- будь числовые значения, например хг = ух, х2 — у2, .... х, = уг (г и), то мы получим функцию от п — г переменных f (Yi. Ъ. •••. Тг. хг+1, х,+ г, .... хп). Ее область определения образуют последовательности значений ос- тавшихся переменных при которых (у,, у2) ..., уг, аг+1, аг+2.ап) С Е, а соответствую- щее значение функции есть F (Т1. У2, •••• Уг- «г+1. «,+2. «/.)• 1.4. С другой стороны, всякую функцию от п переменных F (хх, х2, .... х,(), заданную на множестве Е, можно в следующем естественном смысле рассматривать как функцию от большего числа s переменных при любом s п. Для этого берется множество s-членных последовательностей (аг, а2, ..., а„, а,г+1, ап+2, .... «?), таких, что (ап а2, ..., а„) б Е, и считается, что значение функции для каждой такой последователь- ности совпадает со значением F («1, «г. •••. Новую функцию обозначают обычно через F (хи х2, ..., xnt х„+\, Хл+г. •••. х,) и считают, что она равна исходной функции, при- чем лаже пишут: F (Хх, Х2, ..., Хп) ~ F (хп Х2, ..., Хп, Хл {-1» Хд.у2, *.. Х2). Благодаря сказанному мы всегда можем при рассмотрении не- скольких функций считать, что все они заданы как функции от од- них и тех же независимых переменных. 393
1.5. Примеры. 1) Рассмотрим комплексную функцию от двух пере- менных F (i, —i) — 0; при хх = Ее областью задания язляется множество всевозможных последовательнее стен комплексных чисел (а,, а2), у которых #= а2. Например, при X] = i, х2 = —i ее значение есть = i, х2 = 1 ее значение есть J-1) а + 1) F(i, D = -^ = Если переменному х2 придать одного переменного 2i и т. п. (I - 1) (( + 1) -2 значение х2 = —1, то получаем функцию от X, — 1 F - о = гл-; Ту же функцию F (хь х2) можно рассматривать и как функцию от трех (к Солее) независимых переменных: F (хх, х2, х3) = Л1 -- Л2 Ее область задания составляют последовательности комплексных чисел (сц, аа, а3), где ах -ф а2. Например, при х: = i, х2 = 1, х3 = — имеем; F (i, 1, у) = F ((, 1) = -i. 2) Для совместного рассмотрения функций f (х) = X, g (у) = у, h (г) = г можно каждую из них представить как функцию от одних и тех же переменных ‘ (х, у, г) = X, g (х, у, г) = у, h (х, у, г) = г. В этом случае для последовательности (1, 2, 3) имеем: /(1,2,3)= 1, g [1,2,3) =2, Л (1,2, 3) = 3. 1.6. Вполне аналогично тому, как это было сделано в VII, 1.7 для комплексных функций одного переменного, для функций не- скольких переменных определяются действия сложения, вычитания, умножения и деления. Пусть функции Fx (хх, х2, .... хп ) и F2 (х,, х2.хп) заданы на множествах последовательностей £х и £2. На пересечении £х р £2 определены функции ФХ (Хх, Х2, ..., Хп) — Fi (Хх, Х2, ..., Хп) -J- F2 <Хх, Х2, ..., Хп), Фз 0^1» Хд) = Fx (хх, Xg, ..., хл) F2 (хх, X2, ..., Xn), Ф3 (Xx, X2, ..., Xn) — Fi (xx, X2, ..., Xn) • Fg (xx, X2, ..., Xn) так, что для всякой последовательности (ах, а2, ..., а„) из £х П £г значение Ф* (а1( а2, ..., а„) совпадает с результатом соответствую- 3S4
щего действия, произведенного над числами, являющимися зна- чениями Fr а?| ..., а„) и F, (04, а2, • «п). Аналогично определяется и частное (>> Л (Х(, х2..хп) ^4 Р1> Л2> —, >-п) = ~---------— F2 (xlt х2, ... x,i, с тем отличием, что область задания Ф4 (xlt х2, ..., х„) состоит из тех последовательностей (ап а2, .... ап) из Ег Г, Ег, при которых F2 (а1( ct2, .... а,) ф 0. Действия сложения, вычитания, умножения и деления функций согласно самому определению сводятся к соответствующим дейст- виям с комплексными числами, являющимися значениями этих функций. Поэтому, как и в случае функций одного переменного (VII, 1.8), мы имеем следующее свойства действий над комплексным! функциями от нескольких переменных: 1) сложение коммутативно и ассоциативно; 2) умножение коммутативно и ассоциативно; 3) сло- жение и умножение связаны свойством дистрибутивности. Относительно свойства обратимости как по отношению к сложе- нию, так и по отношению к умножению функций нескольких перемет- ных имеют место соображения, вполне аналогичные тем, которые были высказаны при изучении функций одного переменного (VII, 1.9). В частности, если функции /у (л. х2, • ••» *«) и Мн хг< • ••> *«) заданы на одном и том же множестве (Е3 — Е2), то существует функ- ция, являющаяся разностью между ними, заданная па том же мно- жестве. Сказанное выше приводит нас к следующему' выводу. Множество всех комплексных функций от п переменных xlt х2, ..., х„, заданных на од нем и том же множестве, с точки зрения общей тео- рии действий оказывается коммутативным кольцом (4.V1I, 3.2). Иногда определение суммы, разности и произведения двух функ- ций вообще ограничивают лишь случаем, когда обе функции заданы на одном и том же множестве. Нетрудно видеть, что этот подход в принципе мало чем отличается от принятого нами и ни один из них не обладает перед другими какими-либо принципиальными преиму- ществами. 1.7. Аналогично VII, 1.11 для функций от нескольких перемен- ных определяется построение сложной функции (это построение на- зывается также суперпозицией или взятием функции от функций). Пусть дана функция Г (хг, х2, ..., хп), а также п функций от t переменных каждая: Gi 6’1, у2. •••. >’(), (У1, Уг, •••. У,). •••. Gn (У1, У2.У<)- Тогда можно определить функцию //(УоУ2, ••,y1)=F(G1(y1,y2, у2. .... yz).Gn(ylty2, ...,у()), область определения которой состоит из таких Zчленных после- довательностей ‘(«j, а2, ..., at), принадлежащих области определе- ния каждой функции G, (у1; у2, .... у() (i = 1, 2, ..., п), что зна- чения этих функций G2 (aJ( а2...cij, G2 (аъ а2, ..., а,), .... Сп (ах, а2.а,) •395
образуют n-членную последовательность, принадлежащую области определения функции F (хп х2, хп). Для каждой такой после- довательности значение функции Н (у,, уа, .... у() равно Я(ах, аа, at)^-F(G}(a}, а2.....at), Ga(alv a2, at), ... ..., Gn (a1( a2> .... az)). 1.8. Понятие комплексного полинома (называемого также и многочленом) от нескольких переменных формируется при помощи следующих наиболее простых комплексных функций. Определение. Функция от п переменных, определенная на множестве всех последовательностей п комплексных чисел, зна- чения которой определяются по формуле и (хъ ха, .... хй) = Ах*‘Х*‘ ... х\п (klt kt..kn = 0, 1, 2, ...), называется простейшим полиномом или одночленом. Здесь А — комплексное число, постоянное для данного одно- члена и называемое его коэффициентом. 1.9. Одним из частных случаев простейшего полинома будет случай = k2 — ... = kn — 0, т. е. функция и (х1( ха, .... хп) = А, которая при любых значениях независимых переменных прини- мает всегда одно и то же значение А. Такая функция называется постоянной Другой простой частный случай А = 1, kt == 1, kj = 0 (/ « 1, 2, .... 1-1, Н 1, .... п) приводит к функции и (х1( Ха, ..., Хп) = х;, называемой i-й независимой переменной: х;. Сам простейший полином есть произведение постоянной и не- зависимых переменных (причем в это произведение каждое незави- симое переменное может входить несколько раз). 1.10. Для одночленов и — Axkyxk2- ... xfy, и — Вх\'Х1^ ... х\п их произведение, как легко видеть, тоже является одночленом: и и — (АВ) х*‘+'« х^2+^ ... xknn+ln. В общем случае аналогичное утверждение относительно суммы данных одночленов несправедливо. Однако если одночлены и и v подобны друг другу, т. е. kt = lt (i = 1, 2, .... п), то их сумма тоже является одночленом: и + v — (А + В) xkyxfy ... xfr. Если при этом и н и противоположны друг другу: и — —v (т. е. А = —В), то Их сумма есть постоянная, равная нулю. 396
1.11. Важно отметить единственность задания одночленов в виде 1.8 (исключая случай постоянной, равной нулю). Другими словами, равенство двух одночленов A xk2 ... х;И - В х'< х'> ... х‘р (А С, В 0) как функций возможно лишь при А = В, kt = /z (i = 1, 2, .... «). Действительно, полагая в указанном равенстве одночленов *1 = х2 — ... = хп — 1, получаем: А = В. Затем, полагая х, = 2, х, = х2 = ... = х,_, = X:., = ... = х„ = 1, I ' 1 <4 11 И ’ получаем: 24 = 2й и, значит, kt = Z; (i = 1, 2, ..., fi). 1.12. Для одночлена Axky xfy ... х'ф (Д -ф 0) число k, называется его степенью относительно переменного xt (i — 1, 2, ..., «). Сумма k2 + k., + ... + ktl называется степенью одночлена (относительно совокупности всех переменных). Благодаря 1.11 для данного одночлена его ст епень относительно каждого переменного и степень относительно совокупности всех переменных определены единственным образом. 1.13. Определение. Комплексным полиномом (или просто полиномом) от п переменных называется такая комплексная функция от п переменных, которая может быть представлена в виде суммы нескольких одночленов ст п переменных: F (xlt х2, .... х„) = их + и2+ ... + « ., us — Д5х*1’ х$ ... xF; (s —• 1, 2, ..., m). Согласно определению суммы функций (1.G) полином F (хр х2, .... хп) задан па множестве всевозможных «-членных последо- вательностей комплексных чисел. Если коэффициенты всех одночленов us являются числами из некоторого числового коля Р, то F (х1( х2, ..., хп) называют полино- мом над полем Р. 1.14. Сумма, разность и произведение двух полиномов, как легко видеть, также являются полиномами. Для полиномов, представ- ленных в виде суммы одночленов F = F (х1( х2, ..., хл) = их + и2 + ... + и.,, G = G (xlt х2, ... ..., х„) = Oj + v2 4- ... + vQ, их сумма, разность и произведение следующим образом представлены в виде суммы одночленов: F + G — и2 4- и2 4- ... 4- ир 4- 4“-Р| 4- ••• 4~ vq, F — G = fij 4- «2 4- ••• + Up — Vi — ^2 — ••• — Vq> F G — UjVi 4- u2v2 4- ... + UjV^ 4~ + •А~ирОд (в случае произведения учитываем, что произведение двух одночле- нов есть одночлен). 3»?
Если F и G были полиномами над полем Р, то непосредственно видно, что их сумма, разность и произведение тоже будут поли- номами над Р. Учитывая свойства действий с фу нкциями от нескольких перемен- ных (1.6), мы получаем, что множество всех комплексных полиномов от п переменных является коммутативным кольцом. То же верно и по отношению к множеству всех полиномов от. п переменных над полем Р. 1.15. Аналогично и полином от полиномов как сложная функция (1.7) также оказывается полиномом. Действительно, для полинома F = F (jfj, л'2( ..., хп) = сц и2 + ... ~Ь um, . ,(S) . (S) ,(s> us = Аусф xfy ... x^n (,$ = 1, 2, ..., tn) и полиномов Gi = Gi (Уь Уг, •••, У(), G2 = Gt(yi. Уг . .. У,).G, = = Gn (Ух, У2, •••, Уг) сложная функция F (Gi (У1. Уг, Уг), G« (У1. Уг, •••, У,), •••, G« (Ух, Уг, •• , У .)) есть сумма полиномов, представленных в виде ЛЛСИУь Уг, •••. y.))ft<|S>(G2 (У1. Уг, У<))’:'' (С’п (Ух, Уг, •••, У/)/"- Благодаря 1.14 в результате получается полином от t перемен- ных ух, у2, ..., у,. Если при этом полином F и все G]( G2, ..., С„ являются поли- номами над полем Р, то и получающийся полином тоже является полиномом над Р. 1.16 В выражении произвольного полинома в виде суммы одно- членов (1.13) всегда можно объединить подобные одночлены, т. е. отличающиеся лишь коэффициентами (1.10). Кроме, того, очевидно, можно исключить из суммы слагаемые, являющиеся одночленами с нулевыми коэффициентами. Последнее нельзя сделать только в слу- чае, если полином сам является одночленом с нулевым коэффициен- том. В этом случае исключать это единственное пулевое слагаемое, конечно, не приходится. Задание полинома от нескольких переменных в виде суммы одно- членов назовем нормальной формой полинома, если в эту сумму не входят одночлены с нулевыми коэффициентами и не имеется подоб- ных между собой одночленов. Также будем считать нормальной фор- мой сумму, состоящую из одного слагаемого, равного нулю. В соответствии со сказанным выше каждому полиному от не- скольких переменных может быть придана нормальная форма. 098
1.17. Естественно поставить вопрос, единственной ли нормаль- ной формой (разумеется, с точностью до порядка расположения в ней слагаемых) обладает каждый полином. Мы получим положитель- ный ответ на этот вопрос. Для этого рассмотрим сперва один част- ный случай. Лемма. Пусть нормальная форма полинома F (rlt х2, .... х„) не состоит из одного нулевого слагаемого. Тогда найдутся такие значения переменных Хд = Сд, хг — а2, ..., хя ап, что F (а1( а£, ..., ап) =£ 0. Доказательство. Рассуждаем по индукции относитель- но числа переменных п. Если п = 1, то мы имеем полином от од- ного переменного, который благодаря теореме о границе корней (VII, 4.3) при дсстаточно больших по модулю значениях перемен- ного принимает значения, отличные от нуля. Пусть п > 1. Предположим, что доказываемое утверждение справедливо для всякого полинома от меныгего чем п числа пе- ременных. В нормальной форме полинома F (xlt х2, .... х„) соберем вместе одночлены, содержащие одинаковые степени хр F (*!, х2, ..., хп) = До (*». Х3, .... хп) xi 4- Лд (х2, х3, ..., хп) хТ' + -|- ... -I- Ak-\ (xit xs, ..., хп) хЛ + А, (х2, хя.Хп). Здесь A-t (х2, х3, .... х ) — полиномы от (п—1)-го перемен- ного, получающиеся после вынесения х*-г из соответствующих одночленов (/ = 0, 1, 2, .... А) При этом можем считать, что нор- мальная форма первого из этих полиномов Ло (х2, х3, ..., хп) со- стоит не из одного нуля. Благодаря индуктивному предположению существуют значения х2 = а2, х3 = а3, ..., хл = ап, такие, что (а2, сс3, ..., ап) у-0. Придавая эти значения х2, х3, ..., х„, мы пре- вратим нащ полином в полином от одного переменного хр. F (хъ а2, а3, ...,а..,)=Лв (а2,а3, ..., ап) х?+Дд (ах, а3 , ...,ап)хкГ' + 4- ... ф Аь-i (а2, а3, ..., ап) хг + Ak (а2, а3, ..., аг>), причем Ао (а2, а3..ап) =£ 0. Для полученного полинома, ввиду VII, 4.3, существует значение хх = ат (и таких значений даже бес- конечно много), при котором значение полинома отлично от нуля: F (а1( а2, as, ...,«,)#= 0. 1.18. Теорема. Лолином от нескольких переменных может быть задан в нормальной форме лишь единственным образом. Доказательство. Предположим, что полином F (хм, х2, хп) обладает двумя различными нормальными формами: F (Хд, Хг, .... Хп) == Ид + и2 + ... + ир, F (х1( х2, хп) = Од + v2 + ... + М9
(здесь «1, и2, ..., up и vit v.2, v:/ — какие-то одночлены), Раз- ность между ними, очевидно, есть постоянная, равная нулю: О = Ui и2 + ... + и., — — v2 — ... — v . Если u; = то в правой части полученного равенства эти одночлены могут быть взаимно уничтожены, т. е. разность щ — vjt являющаяся постоянной нуль, может быть отброшена. Так как ис- ходные нормальные формы полинома F (xt, х2, .... х„) различны, то в правой части рассматриваемого равенства все одночлены и; не могут взаимно уничтожиться со всеми v . Следовательно, спра- ва мы имеем полином, нормальная форма которого не состоит из одного нуля. То, что этот полином равен нулю, т. е. при всех зна- чениях переменных принимает значение, равное нулю, противо- речит лемме 1.19. Поэтому наше предположение о возможности существования у полинома дв\ х различных нормальных форм неправильно. 1.19. Пусть полином F (xj, х2, .... х„) представлен в нормальной форме: F (хп хг, ..., = ut 4- и2 + ... + и„. Наибольшая из степеней одночленов un u2......и,„ относительно какого-либо переменного х. (1.12) называется степенью самого полинома F (Хц х2, ..., хп) относительно х,: . Наибольшая из степеней одночленов ult u2, ..., и,„ относительно совокупности всех переменных (1.12) называется степенью поли- нома F (хь х2, ..., хп) (относительно совокупности всех переменных). Благодаря единственности нормальной формы полинома от не- скольких переменных (1.18) и единственности записи его одночле- нов (1.11) эти понятия однозначны в применении к каждому поли- ному. Как и в случае одного переменного, постоянная, разная нулю, является единственным полиномом, которому не приписана ника- кая степень. 1.20. Особую роль играют полиномы, в нормальной форме ко- торых все слагаемые одночлены имеют относительно совокупности всех переменных одну и ту же степень k. Такие полиномы называют- ся однородными полиномами степени k. Однородные полиномы назы- ваются также формами: линейными формами при k = 1, квадратич- ными формами при k = 2, кубическими формами при k = 3 и т. п. Интерес к квадратичным формам объясняется их особым значе- нием в ряде вопросов различных отраслей математики, включая области прикладного значения. Исследования кривых 2-го порядка и поверхностей 2-го порядка го существу сводятся к вещественным квадратичным формам. Изучение квадратичных срорм основывается обычно на том, что их выражения могут быть существенно упроще- ны при помощи замены переменных. Эти исследования можно най- ти з большинстве книг по высшей алгебре и геометрии. Изложение некоторых из этих вопросов содержится в § 6. 400
1.21. Примеры. 1) Полином от трех переменных F (х„ хг, х3)= х3 + 2х3х2 — х2х3 + х|, очевидно, будет однородным полиномом третьей степени. Что касается его сте- пеней относительно каждого из переменных, то они неодинаковы. Степень поли- нома относительно х1( а также и относительно х2 равна трем. Степень нашего полинома относительно х3 равна единице. 2) Рассмотрим общий вид нормальной формы однородного полинома от п переменных степени k. Каждый ее одночлен имеет вид Ах^ х<» ... х^, где каждое неотрицательно и + k2 + ... + kn — k. Количество одночленов в нормальной форме рассматриваемого полинома общего вида совпадает с числом последовательностей степеней kx, k2, .... kn. Согласно 4.1, 8.19 это количество равно: ск = (fe+n—1)! k! (п—1)!' 1.22. Следует обратить внимание на следующее. Понятие нор- мальной формы определено как для полиномов от одного переменного (VII, 2.14), так и для полиномов от нескольких переменных (1.16). Для полинома от одного переменного f (х) понятие нормальной формы, введенное для полиномов от одного переменного, преду- сматривает определеннее расположение слагаемых — по убыванию степеней переменного; при этом коэффициенты при некоторых степенях х могут быть равными нулю. С другой стороны, понятие нормальной формы, введенное для полиномов от нескольких пе- ременных, не требует от / (х) указанного расположения слагаемых, но исключает возможность наравне с ненулевыми слагаемыми записывать и нулевые. Например, полином f (х) — х2 -4- 2х3 — 7 записан в нормальной форме, определенной для полиномов от нескольких переменных (1.16). Но для получения нормальной формы / (х) в смысле теории полиномов от одного переменного (VII, 2.14) следует переставить местами первое и второе слагаемые и добавить одно нулевое сла- гаемое: f (х) = 2Х3 4- х2 + Ох — 7. Хотя указанные различия не являются принципиальными, в отдельных случаях с ними все же приходится считаться. 1.23. Как и для полиномов от одного переменного (VII, 2.20), при введении полиномов от нескольких переменных весьма часто используется иной подход, отличный от изложенного выше. Поли- ном от нескольких переменных может быть определен как выражение вида ь(1) J1» х*2 ЛО *(2) „(2) Л2) а лт} kw (nt) ...х>+Д2х^‘ xk22 ...Х^ + ...+АтХ^ х\2 ...Х*", в котором последовательности (Лр, k$>, ..., Л®) между собой различны и Л, =/= 0 (i = 1, 2..zn). При этом обычно сразу фик- сируют некоторое числовое поле Р и рассматривают лишь такие 401
выражения, в которых все А, принадлежат Р. Знаки действий и степени в указанных выражениях воспринимаются лишь как фср- мальные разделительные знаки. В множестве таких выражений формальным образом вводятся действия сложения и умножения. Последующее изучение строится на базе этих определений. Полу- чающаяся теория в принципе существенно не отличается от теории, основанной на принятой нами функциональной точке зрения. В последующем изложении мы будем основывать*^ на .функцио- нальном подходе к основам теории полиномов от нескольких пере- менных. § 2. Сгсйстпа полккогсов ст нескольких переменных 2.1. При изучении полиномоз от нескольких переменных удоб- но испотьзовать те или иные специальные способы расположения одночленов, в сумме составляющих полином. Один из таких способов (использованный нами в доказательст- ве леммы 1.17) заключается в расположении одночленов по степе- ням одного из переменных. Для ненулевого политтома F (хих2,..., х„) группируем вместе его одночлены, содержащие одинаковые степени какого-нибудь переменного, например хР В результате получим представление нашего потинома в виде: F (xj.Xjj, ...,хл) = Ао (х,.х3, ...,хл) х*+ Л, (х2,х3,.... x«)x?-‘ + ... • + Лй_1 (х2, х3, .... x„)xj 4- А,, (х2, х3, .... хл), где Л; (х2, х3, .... х„) — некоторые полиномы от х2, х3, .... хя, причем Ло (х2, х3, .... хй) не есть постоянная нуль. В этом разложе- нии k есть степень полинома относительно х{. Такое представление F (х2, х2, ..., хп) йазывают разложением его по степеням перемен- ного xv В указанной записи те полиномы А; (х2, х3, ..., хл), которые являются постоянной нуль, обычно опускают. Такое разложение для F (xlt х2,.... х„) может быть получено, исходя из его нормальной формы. 2.2. Другой способ состоит в расположении одночленов по сте- пеням относительно совокупности всех переменных. Для полинома F (х1( х2, ..., хл), не являющегося постоянной нуль, группируем вместе его одночлены, имеющие одинаковые степени относительно совокупности всех переменных. Получаем представление F (хи х2, ..., хл) в виде F (хьх2, ...,хл) =ФЧ (хпх2....хл) 4- Ф^Лх^х,.......хл) 4--. ... 4- Ф1 Cq, X.,, .... хл) 4- Фо (*1, Х2, .... хл), где каждый Фг (хн х2, ..., х„) есть однородный полипом степени i или постоянная нуль, причем Фй (хх, х2...хл) не есть постоянная нуль. В этом случае k есть степень полинома F (х1( х2, ..., х„) от- 402
носитсльно совокупности всех переменных. Говорят, что полином F (хп х2, .... х„) разложен по однородным полиномам. Полиномы Ф, (xlt х2, ..., х„), являющиеся постоянной, равной нулю, обычно в записи опускают. Такое разложение для F (хь х2. •••> гп) может быть получено, исходя из его нормальной формы. 2.3. Примеры. 1) Для полинома F (Xj, Х2> Х3) — Х,Х2 + XjX3 + *! + 2х1Хг — Зх^Хд — х| — х|—х3+4 его разложение по степеням xt имеет вид: F (х1( х3, х3) = (х2 — 1)х, + (x3)xf + (Зх2х3 + 2х2 4 l)xt + (—*|— х3-Н). Его разложением по однородным полиномам будет: F (Xj, х2, х3) = Х;Х2 + ( х^х3 + ЗХ]Х2Х3 — xf) + (2хгх2 — х§) + (х,--х3) +4. 2) Найдем количество возможных одночленов в нормальной форме полинома от п переменных общего вида степени k (относительно совокупности всех перемен- ных). В разложении рассматриваемого полинома по однородным полиномам (2.2) мы благодаря 121 (пример 2) знаем количестве слагаемых одночленов в каждом Ф( (X], х2, ..., хя), которое равно (i = 0, 1, 2, ..., k). Общее количество одкочлепов равно сумме 1 +СГ.+ Сп+1 + - +С*+п-1- Легко доказать (например, проводя рассуждения по индукции относительно k при фиксированном п), что эта сумма равна: + »)! *+" «Я1 ' 2.4. Один из важнейших способов расположения одночленов в нормальной форме полинома от нескольких переменных основан на следующем отношении между одночленами, устанавливаемом при определенном выборе последовательности переменных хг, х2, ... ..., хп. Для ненулевых одночленов и — Ax'Hxfy xknnt v — Bx'fxfy ... х‘п (Д =#0 , В -/= 0) будем говорить, что и выше v, a v ниже и, и записывать: и |- о, а также- v и, если одночлены не подобны и в последовательно- стях показателей степеней переменных первый неравный показа- тель в и больше соответствующего показателя в о, другими слова- ми, найдется такой номер i (1 i и), что k-i = Z3, k2 = Z2, ..., kL_। = I._[, > Zt.. Введенное отношение называется отношением сравнения одно- членов по высоте. Его называют также лексикографическим срав- нением одночленов. Это отношение соответствует принципу расположения слов в словаре. Взаимное расположение двух слов в словаре определяется по первым различным буквам этих слов: в словаре раньше рас- 403
полагается то слово, у которого эта буква стоит в алфавите раньше соответствующей буквы другого слова. Подразумевая под буквами переменные хи х2, ..., х„, которые при возведении в степень по- вторяются по нескольку раз, мы получаем аналогичное правило и для одночленов. Поэтому и сам способ такого упорядочения одночленов называ- ют лексикографическим, т. е. словарным. Например, одночлен х^хрсрс* выше, чем одночлен 2х^х^. Заметим, что расположение но высоте не зависит, вообще говоря, ст степеней одночленов. Так, в нашем случае хотя первый одночлен и выше второго, однако степень его относительно совокупности всех переменных меньше соответствующей степени второго одночлена. 25. Отметим необходимые нам свойства введенного в 2.4 отно- шения сравнения одночленов по высоте, обозначая произвольные одночлены: и = Axkxxk* ... Х^п, V — Вх’.'Х'? ... Х'п, W = Сх’б'Х^ ... Хп'п I X, П 1 — 1 z п (Л О, В ф О, С =# 0). 1) Линейность-, если одночлены и и v не подобны между собой, то имеет место в точности одно из соотношений: и v или v р- и. Действительно, для первых неравных друг другу показателей k. --А lt имеем или /, и, значит, и v, или kt < (£. и, значит, и —I V. 2) Транзитивность: если и I— v, v |— w, то и j— w. Действительно, пусть = llt k2 = l2, ..., kt_{ = I k^L и Л = h — mt, •••, mj~i> lj> Для наименьшего из номеров i и j, пусть для определенности им будет i, получаем: kt = тх, k2 = т2, ..., > mt. Следовательно, и ш. 3) Стабильность относительно умножения: если и ь- V, то UW |— VW. Действительно, так как kx = lx, k2 — 12, .... k > > I., то kx + тх = /г + /И), k2 + m2 = l2 + m2...-+- т(_х == = ^,_i + mi-v + mL > I. + tn , и, значит, одночлен uw = = ACx‘?y+m'xk^+m' ... xkn+mn выше, чем vw — BCx.'>+'”- x'>+m‘ ... ... Xln+mn. n 2.6. Благодаря свойствам 2.5 (1), (2) в нормальной форме поли- нома F (х1г х2, ..., х„), не являющегося постоянной нуль, можно так расположить одночлены (среди которых нет нулевых и подоб- ных друг другу), что каждый следующий одночлен будет ниже предыдущего: F (xuxz, ...,хп) = щ + и2 + ... + ит, их Н и2 ... I- ит. Такое расположение одночленов в нормальной форме полинома называется лексикографическим. Для данного полинома F (хъ х2, ..., х„) единственным образом определен одночлен и2, который выше всех остальных одночленов 404
нормальной формы этого полинома. Этот одночлен иг называется высшим членом полинома F (х3, х2, .... х„). Аналогично может быть определен низший член ит для данного полинома. 2.7. Пример. Пслином F (xlt х2, х3) = х2х3 — 2х1>хгх^ + х2 х£ x'j — — х2 + 5х;х| Xj + х| + л'З + л* + 2 записан в нормальной форме с лексикографическим расположением одночленов. 2.8. Возвращаясь к замечанию, сделанному в связи с различи- ем в понятиях нормальных форм для полиномов от одного перемен- ного и от нескольких переменных (1.22), следует обратить внимание на то, что каждый из рассмотренных нами способов расположения одночленов в применении к одночленам полинома от одного пере- менного f (х) приводит к нормальной форме этого полинома в смыс- ле теории полиномов одного переменного (VII, 2.14). 2.9. Используя рассмотренные способы расположения одночле- нов для полиномов от нескольких переменных, установим ряд важ- ных свойств. Теорема. Если полиномы F = F (х3, х2, .... х„) и G — — G (Xj, х2, х„) не являются постоянной, равной нулю, то их произведение F G тоже не есть постоянная, равная нулю. При этом высший член произведения равен произведению высших членов сомно- жителей . Доказательство. Запишем полиномы в нормальной форме с лексикографическим расположением одночленов: F (х1( х2, .... х„) = + и2 + ... + ир, uL |- и2 j- ... |- ир, G (х1( х2, .... хй) = Vj + v2 + ... + vtI, оД- v2 ••• H 4,- Произведение F • G есть сумма всевозможных произведений и vf (i — 1, 2, ..., р\ j = 1, 2, ..., q). Среди этих произведений, являю- щихся некоторыми одночленами, могут встречаться подобные. По- кажем, что произведение высших членов ц3о3 в смысле 2.4 выше всякого другого произведения utVj (где i или / больше единицы) и тем более не подобно ему. Пусть для определенности i > 1 (случай / > 1 аналогичен). Имеем: u3 Н и(, и поэтому н (2.5. 3). Так как »3|— vt или = Vj, то ир\ |- utVj или = UiVj. Используя транзитив- ность отношения сравнения одночленов по высоте (2.5, 2), полу- чаем UjVj UtVj. Таким образом, произведение ири не будучи подобным ника- кому другому произведению сохранится в нормальной форме произведения F G и будет для нею высшим членом. 2.10. Для всякого полинома от нескольких переменных важны- ми характеристиками являются его степени как относительно от- дельных переменных, так и степень относительно совокупности всех переменных (1.19). При сложении и вычитании полиномов рассмат- риваемая степень результата, очевидно, не может быть больше, чем 405
наибольшая из соответствующих степеней исходных полиномов. Рассмотрим произведение полиномов. Теорема. Пусть полиномы F = F (хи х2, ..., хп) и G = = G (х1( х2, .... хч) имеют относительно переменного х, степени k и I. Тогда произведение F G относительно х, имеет степень, рав- ную k + I- Доказательство. Воспользуемся разложениями поли- номов по степеням данного переменного (2.1), полагая для просто- ты записи Xi = Хр F (ХрХ2,...,хп) = Ао (х.,,х3, ...,хя)х» At (х2,х3, ...,хя)х*-; +... ... + А:_! (х2, х3, .... xjxj + Ац (х2, х3. хп), G (Xi,x2,..., х„) = В0(х2,х3, ...,хя)х; -4- (х2,х3, ...,хя)х-' + ... ... 4~ (Л-2» х*3, • ••> x^)Xj -+ В[ (х2, х3, ..., хД. Здесь А„ (х2, х3, ..., х.) и В„ (х2, х3, ..., хп) не есть постоянные, равные нулю. Перемножая данные полиномы и их разложения, получаем: F • G = (Ло В0)х*И + (Л0В1 + Л1В0)х^'-> + ... + (А^В,). Произведение А0В0 = Ло (х2, х3, .... хп) Во (х2, х3, ..., х„) согласно 2.9 не есть постоянная нуль. Значит, мы получили разло- жение произведения F G по степеням хг (2.1), откуда вытекает, что наше произведение относи гельно хх имеет степень, равную k 4- I. 2.11. Теперь рассмотрим степень произведения полиномов от- носительно совокупности всех переменных. Теорема. Пусть полиномы F — F (х1( х2, ..., хп) и G == = G (х1( х2, .... хп) имеют относительно совокупности всех перемен- ных степени р и q. Тогда произведение F • G относительно совокуп- ности всех переменных имеет степень, равную р + q. Доказательство. Воспользуемся разложением данных полиномов по однородным полиномам (2.2): F (хрХ2, ...,х„) = Фр (ХрХ,, ...,х ) + Фр_, (xnx2, ...,х„) + ... • •• 4_ Ф1 (х'1, х2, ..., хп) 4* Фо C^i> •'2> •••> ^п)» G (хр х2,..., хп) == (х ], х2, ..., Хп) 4“ Д^—J (Хр х2, ..., xrt) 4~ . • • ... 4- Д1 (х^, х2, ..., xrt) 4“ До (-^1» *^2» •••» Перемножая левые и правые части этих разложений, получаем, что F G равно сумме всевозможных произведений Ф, (хь х2, ... .... х„) • Фу (Хр х2, .... Хп), каждое из которых есть или однород- ный полином степени i + /, или постоянная нуль. Учитывая, что сумма однородных полиномов одной и той же степени снова есть однородный полином той же степени или постоянная нуль, полу- чаем разложение произведения F • G по однородным полиномам: F-G =(Фр Т4) 4- (ФД4-! + Фр-хД,) 4- - 4- (ФоДо). 406
Здесь произведение ненулевых полиномов Фр = Фр (хХ1 х2, •••. хп) (хх, х2, х,,) есть однородный полином степени р + q. Согласно 2.2 произведение F С относительно совокупности всех переменных имеет степень, равную р + q. 2.12. Для полинома от нескольких переменных так же, как и для полиномов одного переменного, представляют интерес совокуп- ности значений переменных, при которых полином принимает значение, равное нулю, а также совокупности значений перемен- ных, при которых значение полинома отлично от нуля. Т е о р е м а. Для всякого полинома от п (n > 1) переменных F (хх, х2, ..., х„), не являющегося постоянной, множество последова- тельностей комплексных чисел (?м Е2, ..., |„), при которых F (Ех, Е2, ..., Еч) =0= 0, бесконечно. Множество последовательностей (т]х, т]2, .. . т],), при которых F (qx, тр2.т]„) =0, тоже бесконечно. Доказательство. Разложим наш полином по степе- ням одного из переменных, относительно которого степень поли- нома больше нуля, например относительно хр F (хх, х2...хп)= Ао (х2, х3, .... xjx* + Лх (х2, Хз, .... x,)xk-' + • • • + Ak—i (х%, х3, ..., xn)Xj-H Ак (х2, х3, ..., Хп) (здесь k > 0 и полином Ли (х2, х3, ..., х„) не есть постоянная нуль). Далее рассуждаем по индукции относительно п. При п =2 согласно VII, 2.10 существует бесконечное множество чисел а2, при которых Лц (а2) Ф 0. При каждом таком а2 для полинома от одного переменного F (хх, а2) = ^п («2)х* + А, (а2)«*-| + ... А ,_1 (а2)хх + Ak(a2) существуют числа |, не являющиеся его корнями (VII, 2.10), а также существуют числа т|, являющиеся его корнями (VIII, 3.5). Для нар (I. а2) (количество таких пар бесконечно) имеем F (|, а2) 0. Для пар (г;, а2) (количество их тоже бесконечно) имеем F (rj, а2) = 0. Пусть п > 2 и требуемое утверждение справедливо для поли- номов от менее чем п переменных. Для полинома Ао (х$, х3, ..., х„) в указанном выше разложении полинома F (хх, х2,.... хя) существует согласно индуктивному предположению бесконечное множество та- ких последовательностей (а2, а3, ..., ал), при которых Ло (а3, а3, ... ..., а,,) 0. Каждой такой последовательности соответствует поли- ном от одною переменного хх, не являющийся постоянной. F (хх, а2, ..., а„). Для этого полинома существуют числа Е, не являющие- ся его корнями: F (£, а2, ..., ал )=#0, а также существуют числа т), являющиеся ею корнями: F (г), а2, ..., ал) =0. 2.13. Для полиномов от нескольких переменных, как и для полиномов от одного переменного, важным является понятие де- лимости. Если для полиномов F = F (хх, х2, ..., хя) и G = G(xx, х2, ... ..., хл) найдется полином S = S (хх, х2, .... хл), такой, что 407
F = G S, то говорят, что F делится на G, a G называется дели- телем F. Полином S, называемый частным, очевидно, существует не для всяких полиномов F и G. Если частное S существует и полином G не есть постоянная нуль, то частное определено единственным образом. Действительно, если F = G • и F == G • S2, то G (S, — S2) = =*.0 и согласно 2.9 — S2 = 0, т. е. — S2. Что касается делимости на полином, являющийся постоянной нуль, то здесь имеют моего такие же соображения, которые были высказаны для полиномов от одного переменного (VII, 3.12). Используя соотношения для степеней полиномов относительно отдельных переменных и относительно совокупности всех перемен- ных при умножении (2.10, 2 11), получаем, что степень частного как относительно какого-либо переменного, так и относительно со- вокупности всех переменных равна разности между соответствую- щими степенями полиномов F и G (здесь предполагается, что поли- ном F не есть постоянная нуль). 2.14. Пример ы. 1) Одночлен Ах^'х22 ... х^п (Д 0) делится на одночлен Bx^x'f ... х\п (В 0) тогда и только тогда, когда kt (i = =1,2,..., п). В случае делимости частным является одночлен А {, _I ь _! k r xl *2 ' ' хп 2) Пусть однородный полипом F = I (ад, х2, ..., х„) степени fe делится на однородный полином G = G (хп х.2, ..., хп} степени /: F — G S. Покажем, что частное S = S (xj, х2, ..., хп), будучи полиномом степени т = k — I, есть одно- родный полином. Разлагаем S по однородным полиномам (2.2): S = Фяг + Ф.„ -1 Е ••• + $1 + Фо. Имеем: F = G • .S = G Фт + С • ФЯ1_г 4- ... + G С; + G • Фп. Получен- ное выражение является для F разложением по однородным полиномам Так как F однородный, то все слагаемые этого разложения, начиная со второго, являются нулевыми. Так как G не есть постоянная нуль, го ввиду 2.9 нулевыми будут Фо, Ф1т .... Фт_1- Следовательно, S = Ф,,г есть однородный полином. 2.15. Пусть F = F (хх, х2, .... хп) и G = G (xlt х2, ..., хп) — полиномы над полем Р, не являющиеся постоянной нуль. Если имеет место делимость F —G • S, то частное S = S (хп х2, ..., хл) тоже есть полином над Р. Для доказательства рассмотрим нормальную форму полинома S с лексикографическим расположением одночленов (2.6): S = uj + и2 + ... + ип, «х Н и2 ... н ит. Так как высший член произведения G • S = F равен произведению высших членов сомножителей (2.9), то ввиду 1.10 коэффициент од- ночлена иг есть частное от деления коэффициентов высших членов полиномов F и G и, значит, принадлежит полю Р. Далее рассуждаем по индукции относительно т. 408
При т = 1 благодаря сказанному выше S = i/j есть полином над Р Пусть т > 1 и наше утверждение справедливо во всех случаях, когда нормальная форма S состоит меяее чем из т слагаемых. Имеем: F — G S = G (и1 + и2 + ... + «„,) = G u1+G • (ut + u3 + ... + ит). Слагаемое G их, являясь произведением дву.х полиномов над Р, есть полином над Р. Поэтому полиномом над Р оказывается и разность F — G щ = G (иг + и3 -г ... + ит). Со- гласно индуктивному предположению и2 + и3 + ... + ит есть полином над Р. Следовательно, и S = + и2 + и3 + ... + ип есть полином над Р. 2.16. Для полиномов от нескольких переменных сохраняются все первоначальные свойства делимости, которые рассматривались в IX, 2.2 для полиномов от одного переменного. Мы не будем воспро- изводить здесь эти свойства. Приходится отметить, что для полиномов от нескольких пере- менных не существует в полной мере аналога известной теоремы о делении с остатком, рассматриваемой в теории полиномов одного переменного. И это затрудняет развитие теории делимости для полиномов от нескольких переменных в том направлении, что и для полиномов одного переменного. Например, для полиномов ог нескольких переменных могут быть введены аналогичные извест- ным понятия наибольшего общего делителя и наименьшего обще- го кратного. Однако использование этих понятий затруднено от- сутствием какого-либо способа, пригодного в каждом конкретном случае, находить наибольший общий делитель и наименьшее общее кратное нескольких полиномов от более чем одного переменного. В теории полиномоз одного переменного с этой целью использовал- ся алгорифм Евклида, основанный на возможности деления с ос- татком. 2.17. П р и м е р ы. 1) Для полиномов F (х. у) = у'2 и й (х, у) = ху, как легко видеть, не существует представления вида F (х, у) = G (х, у) S (х, у) + R (х, у), в котором .$ (х, у) и R (х, у) — некоторые полиномы и R (х, у) имел бы степень меньше, чем степень G (х, у) (равная двум). В указанном представлении полином R (х, у) не может также иметь степень относительно у меньше, чем степень отно- сительно у полинома Q (х, у) (равная единице). 2) Как и в теории полиномов одного переменного, некоторые полиномы от нескольких переменных можно назвать взаимно простыми, если у них нет об- щих делителей, за исключением постоянных, стличных от нуля. Ввиду сказанного в 2.16 многие важные свойства взаимно простых полиномов от одного переменного не переносятся в теорию полиномов от нескольких переменных. И в частности, это относится к свойству, связанному с выражением единицы через взаимно простые полиномв! (IX, 2.16). Рассмотрим, например, полиномы х — у и х + у. Они взаимно просты в том смысле, что не имеют общих делителей, за исключе- нием постоянных, отличных от нуля. Однако рассматриваемые полиномы при- нимают значение, равное нулю, при х = у — 0, и значит, не существует выраже- ния единицы в виде 1 = (х — у) • А (х, у) + (х + у) • В (х, у) ни при каких полиномах А (х, у) и В (х, у). 409
2.18. Некоторый аналог теоремы о делении с остатком может быть получен с использованием разложений полиномов по степеням какого-нибудь одного переменного, например х±: F (х1(х2,..., xj = Ао (х2,х3, ...,хл)х* + (x2,x3,...,xn) х*~> 4- .„ • •• + Ак-1 (х2, х3, .... x„)xi + Ак (х2, х3, х„), G (Xj.Xo, ...,хл) = Во (х2,х3,...,хг)х7 + В1 (х2,х3,...хг1)х7-1 + ... ••• Н- (^2> ^3» ••>^л)Х( ~Ь Вт (х2, х3, ...,хл). Как мы знаем, множество всех полиномов от нескольких пере- менных образует кольцо, но не образует поля. Последнее объясня- ется тем, что деление полиномов (с ограничением относительно деления на нулевой полином) не всегда выполнимо. Тем самым для произвольных полиномов F = F (xlt х2, ..., хп) и G = G (х1( х2, ... , х„), где G не есть постоянная нуль, мы не можем при п > 1 при- менить (используя в качестве коэффициентов полиномы At и В) рассуждения, использованные в доказательстве теоремы о делении с остатком для полиномов от одного переменного (VII, 3.2). С анало- гичным затруднением в теории полиномов одного переменного мы встретились, когда рассматривали целочисленные полиномы, т. е полиномы с целыми коэффициентами. Чтобы получить деление с остатком, оставаясь в области целочисленных полиномов, кам достаточно было потребовать, чтобы старший коэффициент второго полинома был равен единице, т. е. чтобы на него делилось любое целое число (VII, 3.11). При рассмотрении полиномов от п (п > 1) переменных мы имеем аналогичную ситуацию в случае, кегда полином Во — Во (х2, х3, .... х„) есть постоянная, отличная от нуля. В этом случае, про- водя рассуждения, дословно повторяющие те, которые были исполь- зованы при доказательстве теоремы о делении с остатком для поли- номов одного переменного (и которые мы здесь воспроизводить не будем), получаем следующее. Пусть для заданных полиномов F = F (хх, х2, ..., х„) и G — — G (хд, х2, ..., хп) коэффициент Во = (х2, х3, ..., хп) есть по- стоянная, отличная от нуля. Тогда полином F может быть выра- жен через полином G в виде F = G S У R, где S — S (хп х2, ..., хп) и R = R (х1( х2, .... хп) — некоторые по- линомы, причем степень относительно xt полинома R меньше сте- пени относительно х1 полинома G или же R есть постоянная нуль Указанные полиномы S и R определены для данных F uG единствен- ным образом. Полученное выше выражение можно назвать делением с остат- ком относительно хг полинома F на G. Как и в случае полиномов одного переменного, для получения полиномов S и R можно применить схему деления «уголком». 410
2.19. Пример. Разделим с остатком относительно у полином F (х, у, г) = (хг)у3 — 2хг (х + г)у2 + (х2г)у + 2х3г 1 J 1 на полином G (х, у, г) = — у2 — ху + — г\ 1 з 2. (хг) у3 — 2хг (х + г) у3 4* (х2г) у — 2х3г 2 * У 2 (хг) у3 —2л2гу2 4- (хг2) у 2хгу— 4хг2 — 2хг2у2 + хг (Л — г) у +'2х::г ___________—2хг2у2 -j- 4хг.2у — 2хг3 хг (х — г — 4хг) у + 2х? (х2 (- г2) Получили: F (х, у, г) = G (х, у, г) • (2хгу — 4хг2) + [хг (х — г — 4хг)у 4- 4- 2хг (х2 4- г2)]. 2.20. Случай деления с остатком относительно i, на полином вида — Т (х2, х3, ..., хя) приводит к обобщению известной тео- ремы Безу (VII, 3.5). При делении с остатком относительно хх полинома F (xlt хг, ... ..., х„) на полином Xj — Т (х2, х3, .... хп) остаток равен полиному, получаемому как сложная функция (1.15) из Г (xlt х2, •••> за- меной хх на Т (х2, х3, .... х„): = F (7* (х2, Х3, ..., Хп'), Х2, Х3, Хп). Действительно, имеем: F (хь х2......хя) = [Xj — Т (х2, х3, ..... х„)] • S (хп х2, ..., хп) + + R (Хь х2, .... хп). Остаток R = R (х1( x2t ..., хя) не зависит от значений xt (2.18), т. е., меняя значения х1( мы не меняем самого полинома R. Полагая в указанном равенстве х, = Т (х2, х3, ..., х„), получаем: R — F (Т (х2, х3.......Хп), х2, х3) .... х,). 2.21. В качестве следствия из 2.20 приходим к условию делимо- сти полинома на полином вида х} — Т (х2, х3............х„). Для того чтобы полином F (xlt х2, .... х„) делился на хх — Т (х2, х3, ..., х„), необходимо и достаточно, чтобы полином F {Т (х2, х3, ... ..., хп), х2, х3, .... х„) был постоянной, равной нулю. 2.22. Примеры. 1) Полином F (х, у, г) = х3 4- у3 + г3 —- Зхуг делит- ся на х 4- У + г> поскольку при х = — у — г он обращается в постоянную нуль: F (—у — г, у, г) = (—у — г)3 4- у3 4- г3 — 3 (—у — г)уг == 0. Найдем частное от деления, воспользовавшись методом неопределенных коэффициентов. Частное есть однородный полином второй степени (2.14, при- мер 2), и поэтому его запишем в виде: 5 (х, у, г) = а,х2 4- а2у2 4- а3г2 + frxxy 4- Ь2уг 4- Ь3хг. Имеем: х3 4- У3 4- г3— Зхуг = (х 4- У 4- г) (ajx3 4- а2У2 + ^Зг2 4- btxy 4- Ьууг 4 Мг). Раскроем скобки б правой части и благодаря единственности нормальной формы полинома приравняем коэффициенты при соответствующих одночленах левей 411
и правой частей. Приравнивая коэффициенты при г*, у3, г3, получаем: а, = а4 =-» = а3 = 1. Приравнивая коэффициенты при х2у, у2г, г2х, получаем: аг + = О, о2 + &2 = 0, а3 + Ь3 = 0 и, значит, 6, — Ь2 = Ь3 = —1. Получили: F <х, у, г) — (х 4* у + г) (х2 + у2 + г2 — ху — уг — хг). 2) Часто оказывается полезным следующее свойство, вытекающее непо- средственно из 2.21. Пусть полином F = F (х,, х2, ..., хл) делится на полиномы G = G (х1л х2, ..., х„) и Н = х, — Т (х2, х3, ..., х„). Если G (Т (х2, х3, ..., х„), х2, х3, ..., хл) не есть постоянная нуль, то F делится на произведение G • И. В частности, если F делится на G = хг — S (х2, х3, .... хл) и на Н — х; — — Т (х2, х3, .., х„), причем S (х2, х3, .... х„) и Т (х, х3.хл) — различные по- ливомы, то F делится на произведение G Н. Используем эти рассуждения для разложения на множители полинома F [к, у, г) = (х — у)3 4* (У — г)3 4~ (г — х)3. Этот полином делится на х — у, на у — z и на г — х, поскольку при х = у, у = г и г = хон обращается в нуль. Елаюдаря сказанному выше F (х, у, г) делится на произведение (х — у) (у — z)X Х(г - х), при э~ом частное есть постоянная, отличная от нуля: (х — у)3 4" (у — — г)3 4* (г — х)3 = (х — у) (у — г) (г — х) • А. Полагая х = —1, у = 0, г = 1, находим: А — 3. 2.23. Вопрос о разложении полинома от нескольких переменных над числовым полем Р в произведение полиномов над Р меньшей степени, как и в случае полиномов одного переменного, связан с понятием неприводимости. Полином F (xlt х2, .... хп) над полем Р, имеющий относительно совокупности всех переменных степень k > 0, называется не- приводимым над Р, если он не имеет делителей — полиномов над Р, имеющих степень больше нуля, но меньше k, и называется приводи- мым над Р, если он обладает делителями указанного вида. Благодаря 2.15 приводимость F (хь х2, ..., х„) над Р означает возможность разложения F (хь х2, .... x„) = Ф, (xlt х2, ..., хл) Ф2 (хъ х2, .... х„), где (хь х2, ..., хл) и Ф? (Хц х2......хл) суть полиномы над Р, степень каждого из которых меньше k. Точно так же, как и для полиномов одного переменного (IX, 3.6), доказывается, что всякий полином от нескольких переменных нену- левой степени над полем Р может быть представлен в виде произве- дения неприводимых над Р полиномов. Имеет место также и единственность разложения на неприводи- мые множители (с точностью до постоянных множителей и порядка сомножителей). Однако доказательство этого утверждения суще- ственно отличается от доказательства аналогичного утверждения для полиномов одного переменного (IX, 3.8) и представляет зна- чительные трудности. Практическое использование упомянутых результатов для по- линомов от более чем одного переменного весьма затруднено тем, что для произвольного числового поля Р строение неприводимых над Р полиномов очень разнообразно и не существует каких-либо общих способов, устанавливающих приводимость или неприводи- мость полиеомоз от п (п > 1) переменных. Это может быть отчасти 412
объяснено тем фактом, что для всякого числового ноля Р сущест- вуют неприводимые над Р полиномы от п (п > 1) переменных лю бой наперед заданной степени. 2.24. Пример. Возьмем произвольное числовое поле Р и натуральное число n > 1. Рассмотрим полипом от п переменных произвольной степени k: F (хь хг.хп) = х\ + G (х2, х3, .... хп), где С (х2, х3, .... х„) — какой-нибудь полином над Р степени k; например, можно взять х\ + Xj + ... 4- х* Покажем, что F (хь х2.хл), являющийся поли- номом над Р, неприводим. Пусть он разлагается в произведение полиномов над Р: F (хг х2, ..., хл) = Ф, (х,, х2, .... хл) • Ф2 (хь х2.хл). Так как степень F (xlt х2, ..., хл) относительно хг равна единице, то степень относительно х2 одного из сомножителей правой части гоже равна единице, а степень другого — нулю. Пусть: (*1- ...х„) = /10 (х2, х3, ..., хл) (х2, х,....хл), Ф2 (*1. *2..хп) = Вй (х2, х3, .... х„), где Ае (xt, х3, ..., хл) и Бэ (х2, х3, ..., хл) не являются постоянной нуль. Имеем: Р = Ио • #o)*i + (-41 • Йо)- Благодаря единственности нормальной формы полинома коэффициент при Xj в правой части есть постоянная, равная единице. Поэтому полином й0 = Ф2 (xlt х2,.... хл) есть постоянная, отличная от нуля, т. е. некоторое число из Р. А зна- чит, степень Oj (хь х2, ..., хл) равна k. § 3, Симметрические полиномы 3.1. При изучении полиномов от нескольких переменных часто важным является выяснение того, меняется ли полином или нет при тех или иных подстановках переменных. Рассмотрим преобразование полиномов от переменных хь х2, ... ..., хп, осуществляемое по следующему правилу. Пусть дано не- которое обратимое преобразование совокупности переменных (в дальнейшем слово «совокупности» будет опускаться), записанное в виде подстановки £ __[ ^2 %п j Х^ ... XiJ' Здесь Х{г, ..., Xin есть некоторая перестановка, полученная из rJ( х2, ..., хп, т. е. х(;, ..., х —это тежехг,х2....хп, но толь- ко расположенные в ином порядке. Для произвольного полинома F (х2, х2, ..., хп) образуем новый полином от тех же переменных х1( х2, ..., хп, обозначаемый через F (Xilt xct, ..., х( ), который получается из данного полинома за- меной в нем каждого xk на х,к (k = 1,2................п). В этом случае гово- рят, что полином F (xlt х2, хп) преобразовался в F (х(|, x(-t, .... x<n) в результате применения указанного обратимого преобразования переменных, заданного подстановкой S (или короче: в результате подстановки переменных S). 413
3,2. Пример. Рассмотрим полином F (xlt х2, ха, х4) = х3 — х2 + х3 — — х4. Применяя к нему подстановку переменных р1 *3 Xi), мы в результате \Х2 Х3 Х4 Ху) получим полином F (х2, хъ, х4, X]) = х2 — х3 + х4 — xv Оказалось: F (х2, хэ, xt. X]) = — F (хь х2, х3, х4). Применяя к нашему полиному подстановку переменных с' *2 *4), мы \Хд ^2/ в результате получим полином» совпадающий с исходным: F (х3, xit xlt х2) = = х3 — х4 + X] — х2 — F (Х1, х2, х3, х4). 3.3. Пусть полином, не являющийся постоянной нуль, записан в нормальной форме: F (xlt х2, ..., х„) = их + и2 + ... + ит. В результате обратимой подстановки переменных pi г'! ” Хп . каждый одночлен щ преобразуется в новый одночлен, который обо- значим на время через и'. Так как среди и1г и2, , ит не было по- добных между собой одночленов и нулевых, то таких не окажется и среди и;, и2, ..., и'т. Поэтому нормальной формой преобразованно- го полинома будет: F (xit, ..., х, ) = и\ + и', + ... + и'п В случае, когда преобразованный полином совпадает с исход- ным, мы благодаря единственности нормальной формы полинома получаем, что и', и', ..., и'— это те же одночлены, что и иь иг, ..., ит, но расположенные, может быть, в другом порядке 3.4. Вопрос о юм, от каких обратимых подстановок переменных •юлином меняется, а от каких нет, связан с глубокими свойствами полиномов. Можно считать, что, чем больше обратимых подстановок переменных не меняют данный полином, тем большей симметрич- ностью относительно своих переменных он обладает Особую роль играют такие полиномы, которые не меняются ни при каких обра- тимых подстановках переменных. Определение. Полином от нескольких переменных назы- вается симметрическим, если он не изменяется ни при каких обрати- мых подстановках переменных. Каждая обратимая подстановка переменных хг, х2, ..., хп опре- деляет некоторое преобразование множества всех полиномов от х1( х2, ..., хп (3.1). Симметрические полиномы оказываются «не- подвижными точками» (VI, 5.1) относительно совокупности всех таких преобразований. 3.5. Примеры. 1) Для произвольного полинома F = F (хь х2, .... х„) множество Мр обратимых подстановок переменных, не меняющих F, не пусто, ибо содержит тождественную подстановку. Покажем, что Мр есть группа пре- образований (VI, 2.11). Возьмем X, У £ Мр. У = Ху Х2 ... хн xh •• Х = х. ... х, Г /> ‘п! 414
Здесь х , х ,...,х, их ,х ,...,х, суть некоторые перестановки переменных ‘1 G п A it л Хц х2, хп. По определению имеем: F (xZi, xi? .... х,л) = F (х1( х2, .... х„), F (хк. xh, .... хУл) = F (<Л, х,2.х,п), и поэтому F (х;- , х!г, .... xjn) = F (х,, хг.хл). Следовательно, произведение взятых подстановок у . у ___ (Х1 Х2 ... Х,| Ц', Х/г ... Xjt является такой подстановкой переменных, от которой полином F (хь х2.......ха) не изменился. Значит, X • У £ MF. Ст подстановки, обратной к У, наш полином, который возьмем в виде F (х(- , х, , ..., х^), преобразуется в Р (хь х2, .... хл) и, следовательно, не меняется. Значит, У-1 € Мр. 2) Полином F (х,, Х2, Х3) — XjX , + X2Xj + Х^Х2 + X|Xj не является симметрическим, поскольку он меняется в результате действия под- становки переменных Mi Ч *з\ Hi *з Ч/ Действительно, з преобразованном полиноме F (xj, х3, х2) = x,Xj + х3х] + х2х3 4- х,х2 нормальная Форма содержит, например, одночлен Х[Х3, не входящий в нормаль- ную форму исходного полинома. Легко видеть, что группа подстановок переменных, не меняющая F (х3, х,. х3), состоит из двух подстановок: pi „ (Ч х2 х3\ \%I Х% Xq) \Х2 Х1 хз/ 3.6. Пусть F (хъ х2, ..., хп) — произвольный полином, не яв- ляющийся постоянной нуль. Если он симметрический, то ввиду 3.3 для всякого одночлена его нормальной формы Язф Xk2‘ ... Xknn при любой перестановке показателей степеней k!lt k!t, .... kJn одночлен , ki ki h: Axt‘l xf ... xn'rt также входит в нормальную форму F (хх, хг, .... х„), поскольку он получается из исходного одночлена в результате подстановки пе- ременных xSl ... xjn %2 ••• 415
Верно и обратное: полином F (хъ xt, , хп) будет симметриче- ским, если в его нормальной форме вместе со всяким одночленом Ахк- х*2 ... хкп содержатся также одночлены Axki, хкн ... хк/„ при всевозможных перестановках kit, kIt, ..., kt чисел klt k2, ... ..., kn. Действительно, в этом случае всякая обратимая подстанов- ка переменных, как легко видеть, лишь переставляет между собой одночлены нормальней формы полинома F (х1( х2, ..., хл). 3.7. Пример. Симметрическим полиномом от переменных xlt х2, х3 с наименьшим числом одночленов в его нормальной форме, содержащей хрс2х3 и 2x?Xj, является согласно 3.6 полином (х[х2ха + х^.фз + X]X2Xj) + (2x2x| Е -г 2x^X3 ф 2xJxj + 2х^ + 2.фх| + 2х\ф)- 3.8. Если полиномы F (хь х2, ..., х„) и G (xj, х2, . хп) не ме- няются от какой-нибудь обратимой подстановки переменных х1( х2, ..., хп, то сумма, разность и произведение этих полиномов, конечно, тоже не меняются от той же подстановки пере- менных. Поэтому сумма, разность, произведение симметрических поли- номов также являются симметрическими полиномами. Следователь- но, множество всех симметрических полиномов от п переменных образуют подкольцо (4.VII, 3.14) кольца всех полиномов от п пе- ременных. Можно также ограничиваться и любым числовым полем Р. 3.9. В дальнейшем для нас важным окажется тот случай, ког- да полином может быть выражен как сложная функция в виде поли- нома от симметрических полиномов. Пусть F (хп х2, ..., хл) — произвольный полином, а Gi (У1, у2, G2 (У1, >2, ...,уЗ....Gn (у±, у2, — симмет- рические полиномы. Тогда полином от этих симметрических полиномов F (Gi (У1, у2,..., yz). 62 (У1, у2, .... у,), .... Gn (У1, у2, . , у,)) оказывается ввиду 3.8 симметрическим полиномом, поскольку он получается из Сх, G2, .... Gn и некоторых постоянных (коэффициен- тов полинома F) в результате действий сложения и умножения. 3.10. П р и м е р ы. 1) Пусть для полиномов от нескольких переменных имеет место делимость F (Xi, х2...хл) = G (Xi, х2, ..., х„) • S (хъ х2...х„), где полином G (х1: х2, ..., хл) не есть постоянная нуль. Если полиномы F и G не меняются от какой-либо обратимой подстановки переменных j*1 х* ), го S (хх, х2, ..., хл) тоже не меняется, поскольку х1, ••• *1Л/ О (хь х2....хл) • S (xZj, xit, ..., х/д) = G (Xi, х2, .., хя) • S (хъ х2, .... хл), и значит, S (xi? х1г...xin) = S (xv х2.....хл). В частнос-и, если F и G — симметрические полинсмы, тс частное S тоже симметрический полисом. 416
2) Пусть полипам разложен по однородным полиномам (2.2): F (xn x.t.х„) = Фт + Фт-1 + - + + Фо- Легко видеть, что обратимая подстановка не меняет Г тогда ч только тогда, когда опа не меняет каждый полином Ф(. В частности, если F симметрический, тс и все тоже симметрические поли- номы. 3.11. Особую роль играют следующие симметрические полино- мы, называемые элементарными симметрическими полиномами: О1 (-4, -Ч, .... х„) = хх + х2 + ... + х„, СТ2 (*1. *2, ..., Хп) =X1X5j + ХХХ3 + ... + Х,Хп + Х2Х3 + ... +Хл_1Хп , ОП-1 (XX,X2, •••.^) = ХГХ2 .. Хп_х + XjX2 ... Хя_4Хп+ ... + Х2Х3...Х„, Он (Хх, Х2, .... Х„) = ХхХ2 ... Х„. Симметричность их устанавливается без труда, поскольку про- извольный с* (xlf х2, ..., Хл) есть сумма всевозможных произведений по k различных переменных. 3.12. Элементарные симметрические полиномы имеют явную связь с формулами Виета (IX, 4.7). Для полинома одного перемен- ного f (х) = йохп + + ... + ап_хх + а-, (а0 4= 0) его ко>1)фициенты выражаются через корни aJ( a2, ..., (взятые с учетом кратности каждого) как раз при помощи значений1 элемен- тарных симметрических полиномов: а* = (—1)*о0 • ст* (аь a2, ..., ал) (k = 1, 2, .... n). Если f (x) есть полином над полем Р, то значения о* (alt а2, ... .... а*) являются числами из поля Р: ст* (аь а2, .... а.,) = (—1)*-^. ао Как мы не раз отмечали, для полинома f (х) над полем Р его корки ап а2, ..., ап могут и пе принадлежать Р Поэтому и различ- ные рациональные выражения от корней, т. е. числа, выраженные через аь а2, ..., ап при помощи четырех арифметических действий, не обязаны принадлежать полю Р. Случаи, когда это все же имеет место, представляют особый интерес. В связи с этим отметим один важный случай. Для произвольного полинома F (хг, х2, ..., х„) над Р рассмот- рим полином от элементарных симметрических полиномов (1.15): F (стх (xt, х2, .... х„), ст2 (хх, х2.хл), .... ст„ (х1( х2, ..., х„)). Значение его при хх = ах, х2 = сс2, ..., хл = а„ получается из значений ст* (ах, а2, .... «„), являющихся числами из Р, и коэффи- циентов F (хх, х2. ..., х„), тоже принадлежащих Р, в результате сложения и умножения. Тем самым это значение гоже является некоторым числом из Р. 14 Заказ 417
В ближайшее время мы выясним, каковы те полиномы, которые могут быть представлены как полиномы от элементарных симметри- ческих полиномов. 3.13. Сначала остановимся на одном вспомогательном свойстве. Лемма. Пусть высшим членом симметрического полинома F (хх, х2, .... хп) является и = Ах*' х*г ... xknn. Тогда ...5s kn. Доказательство. Предположим противное, т. е. k- < <A-i-t при некотором i. Благодаря симметричности полином F (хи хе, ..., х„) не изменится от подстановки переменных /Xj_ Х2 ••• X/—i Xi Xi-\-\ X^-j-2 ••• \Xx X2 ... Xi-\ Xi+1 Xi X/+2 ... xj Высший член и в результате этой подстановки переменных (ко- торая, очевидно, обратима) преобразуется в одночлен и' = Ах*' ... Х*1_} ... х*«, который согласно 3.3 должен входить слагаемым в нормальную фор- му F (хХ) х2, ..., хп). Однако это невозможно, поскольку одночлен и' выше, чем и. 3.14. Всякий полином, представимый в виде полинома от эле- ментарных симметрических полиномов, является симметриче- ским (3.9). Верно и обратное утверждение, являющееся основной теоремой в теории симметрических полиномов Теорема. Всякий симметрический полином F(xx,xs, ...,х„) может быть представлен как полином от элементарных симмет- рических полиномов Oi^i(xu х2.....хп), а2=о2(Хт, х2, ..., х„)...0п = <т„(хх, х2.хп). Если при этом F (хх, х2, ..., хл) есть полином над полем Р, то он представим как полином над Р от аъ <т2....оп . Доказательство. Пусть высшим членом F(xux2, ...,хл) является и = Лх** X*’ ... х£л. Согласно 3.13 £х> ...^ kn. Построим следующий одночлен от элементарных симметрических полиномов: Ф1 = Ф, (<УХ, ог..о„) = Ло?*-** ohrka ... дЪ1-Ал <л- Как полином от хх, х2, .. , х„, он являегся симметрическим (3.9). Высший член его, являющийся произведением высших членов сомножителей (2.9), совпадает с высшим членом F = F (хх, х2, ... .... х.,): Лх*«-*«- (ххХ2)к~Ъ • ... • (ххх2 ... х„_х) • (ххх2 ... хч)*« = =Лх*« х*> ... х\а. 418
Поэтому в полиноме, представленном в виде разности =Г-Фь высший член оказывается ниже высшего члена F или же F1 есть постоянная нуль. При этом Ft как разность двух симметрических полиномов тоже симметрический. Если F был полиномом над не- которым числовым полем Р, тоФх, а следовательно, и F^ тоже ока- зываются полиномами над Р. Проводя аналогичные рассуждения, взяв вместо F полипом Flt мы построим новый симметрический полином Ф2, представимый в виде одночлена от элементарных симметрических полиномов, выс- ший член которого совпадает с высшим членом полинома FP Сле- довательно, для полинома F2 = FX—Фа его высший член оказывается ниже, чем высший член Flt или же Н2 есть постоянная нуль. Продолжая так далее, мы, исходя из полинома F, получаем последовательность полиномов: Л =г-фх, е2 = — Ф2, F3 = F2 ф3’ S-2 “ ®s-l» = fc-i — Ф5- При этом высший член F выше высшего члена Flt тот в свою оче- редь выше высшего члена F2 и т. д. Покажем, что эта последова- тельность не может быть бесконечной, т. е. мы получим некоторый полипом Fs, являющийся постоянной нуль (и следовательно, для него не определен высший член). Рассмотрим высший член произвольною полинома Ft нашей последовательности: V = Atxl* xfy ... x‘nn. Согласно 3.13 l2^ ... ln. Так как высший члени полинома F выше, чем о, то для их показателей степеней первого перемен- ного хх имеем А, > Число k. как степень относительно хх выс- шего члена F (х1( х2, .... хп) определено для данного полинома един- ственным образом. Поскольку 1^ 12~^ 1„, каждое из lt может прини- мать не более чем kr 4- 1 значений (ими могут быть 0, 1,2, ..., kJ. Поэтому количество различных последовательностей (llt 1г, ..., !„) указанного вида конечно (оно не превышает (fex 4- 1)" (4.1, 8.6)). Высшие члены полиномов F, Flt F2, ... между собой не подобны, и, следовательно, последовательности показателей степеней перемен- 'ных этих высших членов вес различны между собой. Благодаря сказанному выше последовательность F, Flt Fa, ... конечна, и, значит, встретится полином Fs, являющийся постоян- ной нуль. 14* 419
Складывая летые и правые части полученных выше равенств и взаимно уничтожая в обеих частях полиномы F}, F2, Fs-t, при- ходим к выражению: F =®i + Ф? + Ф3 + ••• + Ф6 1 + Ф3- Здесь каждый Ф, есть одночлен от элементарных симметрических полиномов оХ) а2,стя и, значит, F представлен в виде полинома от ®i> •••> Если при этом F есть полином над некоторым полем Р, то из характера нашего построения ясно, что коэффициенты одночленов Ф (j — 1, 2, s) от ах, о2, •••> являются некоторыми числами из Р. 3.15. Возвратимся к рассмотрению корней полинома одного пе- ременного (3.12). Следствие. Пусть полином ст одного переменного f (х) == af>xn + а^-1 + ... -Ь ал_хх 4- a, (as 0) является полиномом над полем Р\ ах, а2, ап — все его корни с учетом кратности каждого из них, F (хх, х2, ..., хп)— произволь- ный симметрический полином над Р. Тогда при хх = ах, х2 = а3, ..., хп = ал значение полинома F (ап а2, ..., ал) есть число из Р. 3.16. П р и м е р ы. I) Выразим симметрический полином F (хх, хг, х3) — хх3 + х£3 4- х23 через элементарные пх = oL (хх, х2, х3) = хх + х2 + х„ а2 = о2 (х„ х£> х3) = XjX2 + xtxs -j- х2х3, <Jg = а3 (•*!> *». Х3) = XjXjXg. Отыскание нужного нам выражения проведем в соответствии с доказательством теоремы 3.14. Высший член полинома F равен xf = xf х^ху Составляем полином: Ф1 ®1 Ui- х2, х3) = 1 • а?-^Чо-°0® = о? = xf + х32 + xf + + 3 (Х^Х2 + xfx, + Xjx] 4- XjXj + Х^Хд + XjXg) + CxxX2Xg. Находим разность: Fx (xlt x, x3) = F (xb x2, x3) — Фх (xx, x2, x3) = == —3 (xfx2 + xfx3 4- XjX] 4- ХхХз + X2X3 + Х2Хз) — 6XjX2X3 Высший член Fl (хь x2, x3) равен —Зх']’х2 = - Зх[х\х° Составляем полином: Ф2 = Фг (xi, х2, х4) = —3of-’ = —301<т2 = = —3 (Xj + х2 + х,) • (ххх2 4- XjX3 4- х2х3) = —3 (х"х2 4- xfxj 4- ХХ*2 + 4- Xjxj 4- Х^х3 4- XjXj. SXjXjXg. Находим разность: Fg (х±, х„ х3) = Fj (хх, х2, х3) — Ф2 (хх, х2, х3) = Зххх2х3. 420
Составляем полином: == (xlt Х2, Х3) == 3(jj ' Оу ' ^3 ” ^3 ~ ЗХ|Х2Хз« Разность между F2 (хь х2> х3) и Ф3 (хь х2, х3) есть постоянная нуль. Окончатель- но получаем: Г (х1г х2, х?) = of — Зя,<т2 н- За3. 2) Для выражения симметрического полинома через элементарные удобно использовать метод неопределенных коэффициентов, применяя его к однородным симметрическим полиномам, на которые разлагается всякий симметрический полином (3.10, пример 2). Согласно рассуждениям, проведенным в доказатель- стве теоремы 3.14, общий вид разложения симметрического полинома в сумму одночленов or аь па....оп: F (х, х2...х„) = Фх + Ф2 + ... + Ф5_1 + Ф, — таков, что каждый одночлен представим в виде Ф, = 4a'f-'2 </*“'» ... с',^71 я о'я, где > /2 > ... > 1п и At > 11г л, — степень относительно хх высшего члена неходкого полинома. При этом коэффициент Ф1 равен коэффициенту высшего члена F. Если к тому же F (xlt х2..хл) однородный степени k, то, как легко видеть из доказательства теоремы 3.14, должно еще выполняться /х 4" 4* ••• + — k. Для рассмотренного в примере 1) полинома F (хх, х2, xj = xf + х] + х|( который является симметрическим и однородным, общий вид разложения со- стоит из одночленов, определяемых следующими последовательностями: (3, 0, 0): Ф, — =* <т> (2, 1, 0): Ф2 = Аа^’ ^-°о® = Аа^, (1, 1, 1): Ф3 = Во}- Gj'1 о| = Во3. Поэтому Г (х,, х2, х3) = of + 4аха2 4 В<т3, т. е. *? + *? + *з =<*г + хг + *3Р 4~4(х( + х2 + х3) (ххх2 4- ххх3 + х2х3) + Вх1х2х,. Для нахождения коэффициента А полагаем хх = 0, х2 = х3 = 1 2= 23+ А • 2 • 1, 4 = —3. Для нахождения В полагаем хх = х2 = х3 = 1: 3-=За—3-3-34-В, В = 3. Получаем: F (хх, х2, х3) = Wj” — 30j<J2 + Зс3, 3) Найдем сумму кубов коркой полинома f (х) = Xй + Зх2 + 14х + 30. Обозначая корни сто через ах, а2, а3, имеем: ах (а,. а2, а3) = —3, а2 (ах, а2, а3) = 14, ст3 (аь а2, а3) = —30 Используя полученное выражение суммы кубов через элементарные симметри- ческие полиномы, получаем: aj3 4- <х23 4- Чз* = [«г («1. «г- а3)У — 3 [ах (ах. а2, а,) - а2 (с^, а2, а3)] -4* 4- За3 (Oj, а2, а3) = (-3)» — 3 (-3)14 + 3 ( 30) = 9. 421
Конечно, для получения этого результата мы могли бы просо вычислить а2, а2, а3 и затем найти сумму их кубов. Однако этот путь оказался бы более труд- ным. Самое же главное то, что для случая полиномов пятой и более высоких степеней мы, как чравило, не умеем найти точного выражения их корней, тогда как рассмотренный в настоящем параграфе способ для нахождения симметри- ческих выражений от корней полинома (например, для сумм одинаковых степе- ней всех корней) всегда осуществим. 3.17. Теорем а. Для всякого симметрического полинома су- ществует лишь единственное выражение его в виде полиномов от элементарных симметрических полиномов. Доказательство. Пусть для симметрического полинома F (xlt х2, .... хп) получено двумя способами выражение его в виде полинома от элементарных симметрических полиномов о, = о, (х,, х2, ...,xn),i = 1,2...«: F (xv х2, ..., х.,) = Ну (Oj (xn х2, ..., xn), o2 (xt, x2, ..., x„), ... .... G„ (Xlt X2, .... X„)), F (xb x2, ..., x„) = Д2(ах (xn x2, .... x„), a2 (xlt x2, ..., x„), ... •••» CSn (Xj, X2, .. , Xi)i Полиномы Ну и Ht рассматриваем как полиномы от перемен- ных с,, о2, ..., оп. Эти переменные могут принимать произвольные численные значения. Действительно, для любых чисел у1( у2, ... ..., уп найдутся значения х2 = 0lt х2 = 02, ..., хп = 0^, такие, что °1 (01, 02» "•> Рп) — Tt, (01, 02, •••> Рп) — 'lit •••> °л (Р1> 02, ••• .... 0.) -Тч В качестве 0Ъ 02, ..., 0П можно взять благодаря 3.12 корни (с уче- том кратности) полинома х" — ^х*-1 + ?2х"’2 — ... 4- (—1)яТн. При произвольных численных значениях <rlt о2,..., о„, получаю- щихся при некоторых xt = 0., х2 = 02, ..., хп — 0Л, значения Ну и Н2 равны между собой, поскольку значение каждого из них равно F (3j, 02, ..., 0Г,). Тем самым благодаря единственности нормальной формы полинома от нескольких переменных выражения F (xlt х2....х„) в виде суммы одночленов от с\, о2, ..., ст„ одинаковы । 3.18. Понятие симметрического полинома и его важнейшее свой- ство— основная теорема о симметрических полиномах (3.14), как мы видели, тесным образом связаны с вопросом о зависимости меж- ду корнями и коэффициентами полиномов от одного переменного. Однако это не единственная причина, по которой симметрические полиномы заслуживают изучения Теория симметрических полино- мов, в основе которой лежит доказанная основная теорема, имеет многочисленные применения в различных вопросах теории поли- номов Причины, объясняющие роль симметрических полиномов, лежат очень глубоко и с полной ясностью обнаруживаются лишь при изучении свойств автоморфизмов полей. 422
Рассмотрение симметрических полиномов восходит к Л. Жирару. Помимо доказательства Жирара, впоследствии доказательства ос- новной теоремы, основанные на других принципах, были даны К. Гауссом и О. Кеши. Среди симметрических полиномов особого внимания заслужива- ют так называемые степенные суммы х* 4 хк + ... + хк (k = = 1, 2, ...) Они, как и всякие симметрические полиномы, могут быть выражены через элементарные. При этом оказывается, что и всякий элементарный симметрический полином в свою очередь может быть выражен через степенные суммы. Соотношения между Элементарными симметрическими полиномами и степенными сум- мами, называемые формулами Ньютона, важны в ряде вопросов. Из сказанного видно, что всякий симметрический полином может быть представлен как полином от степенных сумм. 3.19. Пример ы. 1) Рассмотрим симметрические полиномы от двух переменных х, у. Для степенных сумм S % = xft 4* У® при k = 1, 2 имеем: 3, = х 4- у = р„ S, = х2 4- Уг — of — 2о2 (где а, = х 4- у, о2 = ху). Пусть k > 2 и уже найдены выоажения через а, и а» для степенных сумм S,, S?, .... Sfc_j. Умножая обе части равенства = хк~2 4* у*-1 на с, =*4* 4- у, получаем: ”i S* -! = (* + У) (**'* 4- у*-1) = (хк 4- ук) 4- ху (хк~2 4- у*-2) = = За 4- с2 • SA_2. Отсюда находим: S* = о, • S^-i — р2 • $k-z- Используя полученную формулу, находим выражения: 3, = G„ 3, = of — 2аг. S3 = of — ЗО,О2, S4 = a* — 4ofc2 4- 2af, 3» = оj — 5ofa2 4- 5a,a|, Для произвольного симметрического полинома F (х, у) в е-о нормальной ферме для каждого одночлена ах'у1 должен найтись одночлен ах1ук (3.6). груп- пируя их вместе и используя выражения для степенных сумм, можно предста- вить F (х, у) в виде полинома от о, и а2, не прибегая к общей теореме (3.14). 2) В соответствии с примером 1) найдем выражение через а, = х + у и следующего симметрического полинома. .4 4- 24 у2 4- Зх2у2 — 4у — ху4 4* 2х2/ 4- У5 = = (х5 4- у5) 4- 2х2у2 (х 4- У) — ху (х3 4- У3) 4- Зх2у2 = = (а? — 5а,а2 4- 5с {- 2а|а, — о2 (а) — 80,03) 4- 3aj = = af — 6ofc2 4- 1©а,о| 4- За|. 3) Выражение симметрических полиномов от х, у через о, = х + у и с2 = = ху бывает удобно использовать при решении систем уравнений с двумя не- известными. Это объясняется тем, что система уравнений х 4“ У = а, ху — Ь 423
определяет такие значения х, у, которые являются корнями квадратного трех- члена t2 — at + b. Используем эти соображения для решения системы: х4 + у3 = 8, х2 4- у4 = 4. Используя выражения степенных сумм через щ и а2, получаем: — 3jjO2 =8, о? — 2а2 = 4. Подставляем в первое уравнение выражение <т2 из второго уравнения: <Г| — 12а, 4-16=0, (a, — 2)’ (а, 4- 4) = 0. В случае ст, = 2 имеем а2 = 0, т. е. х 4- у — 2, ху = 0. Находим два решения исходной системы: (0, 2); (2,0). В случае at = —4 имеем а2 = 6, т. е. х 4- у = — 4, ху — 6. Значения х и у находим как значения корней полинома t2 4* 4/ Ь 6. Это дает нам еще два решения исходной системы: (—2 4- yr2i: —2— У 2«); (—2 —У21, —24- + /2«). § 4. Системы уравнений с несколькими неизвестными 4.1. В I, 1.1 нами рассматривалось понятие уравнения в наи- более широком смысле. Частным случаем является уравнение с одним неизвестным в узком смысле слова, задаваемое при по- мощи области значений неизвестного и пары функций (VIII, 1.1). Очевидным образом это понятие распространяется и на случай функций от нескольких переменных. Пусть некоторое множество М, состоящее из п-членных после- довательностей комплексных чисел, задано в качестве области зна- чений неизвестного. Задана также совокупность пар функций от п переменных: Fi (х1( ха,..х„), Gt (х1( х2, .... x„) (i = 1, 2, ..., т). Условие равенства значений функций Ft (хх, х2, ..., х„) и Gt (хь х2, .... хп) (i = 1, 2, .... т) при некоторых последовательностях из М (тем самым такие последовательности должны принадлежать пересечению областей задания всех функций Ft, Gt для i = 1,2, ... ..., т) определяет систему уравнений с неизвестными х2, х2, .... хя, которую обычно записывают в виде системы равенств: F^(xi, хг, .... хп) =G1(x1, х2.....хп), 7% (х1( Х2, ..., Хп) = G2 (Xj, х2..Хп), Fт (Xj, х2, ..., Хп) — Gm (х,, х2, ..., хч). Часто под областью М автоматически подразумевают пересе- чение областей задания всех функций Ft, Gt ‘(i =1, 2, .... т) и называют это пересечение областью определения системы уравне- ний.
Введенное понятие системы уравнений можно рассматривать кая частный случай уравнения, понимаемого в самом широком смысле (1, 1.1, 1-4). Важный частный случай систем линейных уравнений был изу- чен нами раньше в главах I и II. Всякая последовательность (аъ а2, ...,ал) которая при- надлежит пересечению областей определения всех функций, вхо- дящих в систему уравнений, и при которой значения соответствую- щих функций равны Fi (аь а2, ..., а,.) = G, (аг, а2, .... а„) (i = = 1,2, ..., т), называется решением дайной системы уравнении. Говорят также, что значения неизвестных хг — аг, xt = а2, ... хп = ап удовлетворяют системе уравнений. Система уравнений, обладающая хотя бы одним решением, на- зывается разрешимой (или совместной), а не имеющая решений — неразрешимой (или несовместной). Задание системы уравнений само уже определяет множество его решений. Решить систему уравнений — это значит найти не- которое явное выражение для решений системы. Разумеется, ска- занное носит лишь описательный, но пе строгий характер. 4.2. Как и в случае уравнения с одним неизвестным (VIII, 1.1), запись уравнений в виде равенств ни в коей мере нельзя смешивать с равенством самих функций. Для систем уравнений с несколькими неизвестными имеют место также соображения относительно задания уравнений в виде фор- мул, аналогичные тем, которые были высказаны для уравнений с одним неизвестным (VIII, 1.3). 4.3. В соотвстствиии с общим подходом (I, 1.5) две системы уравнений с п неизвестными, обозначенными одинаковым образом, называются эквивалентными или равносильными, если всякое ре- шение каждой системы уравнений является решением и для дру- гой системы’, т. е. множества решений этих систем уравнений совпадают. 4.4. Из самого определения эквивалентности систем уравнений вытекает следующее часто используемое свойство. Если в системе уравнений какую-нибудь ее подсистем у заменить эквивалентной ей системой, то мы получим новую систему уравне- ний, эквивалентную исходной. 4.5. Понятие эквивалентности можно использовать и для отдельных уравнений (т. е. систем, каждая из которых состоит из одного уравнения) При этом, как легко видеть, для уравнений а несколькими неизвестными справедливы простейшие свойства отно- шения эквивалентности, рассмотренные нами в VIII, 1.5 в отноше- нии уравнений с одним неизвестным. В частности, всякое уравнение F (хх, х2, ..., xr) = G (хп х2, .... х„) эквивалентно уравнению F (^i, х2, .., Xn) G (xj, х2, ...» хп) =* О, 428
правая часть которого есть пуль (т. е функция, принимающая зна- чение, равное нулю, при всевозможных n-членных последователь- ностях комплексных чисел, которые составляют область определе- ния этой функции). Благодаря 4.4 всякую систему уравнений можно заменить экви- валентной ей системой уравнений, правые части которых равны нулю. Поэтому при изучении систем уравнений мы можем ограни- чиваться системами именно такого вида. 4.6. Пусть в системе уравнений F\ (^Т- -^2» •••» F2 (ху, х2, .... х„) = О, Ui, Хг.....хп) = О одна из функций, например Fx (х1( х2, .... х„), разлагается в произ- ведение. (хь х2, ..., х„) =ФГ (хп х2, .... хл) • Ф2 (хь х2, ..., х„) х... ... X Ф5 (хь х2, ..., х„). Тогда всякое решение каждой из систем Ф; (хп х2, .... хл) = О, (х = 1, 2...5) F2 (хь х2, ..., х„) =0, Fm(X!, х2, ..., хл) =0, принадлежащее области определения исходной системы уравнений, очевидно, является решением исходной системы уравнений. При этом всякое решение исходной системы уравнений является реше- нием одной из указанных систем. Действительно, если (ап а2, ..., ал) есть решение данной систе- мы, то благодаря /у (аг, а2...а„) = 0 имеем Ф1 (аъ а2.....а„) • Ф2 (alta2, ...,ал) • ... • Ф5 (alt а2.ал) = 0 и, значит, один из сомножителей равен нулю;Ф(- (a1,a2, ...,ал) = 0. Поэтому (а;, а2, ..., ал) есть решение той системы уравнений, которая получается из исходной заменой первого уравнения урав- нением Ф, (Xj, х2, ..., хл) = 0. 4.7. Пример. Решим систему уравнений в облает» вещественных чисел х/у — х = 0 Х4- У X + ху + У = 1- Ее область определения £ состоит из пар вещественных чисел (х, у), где х у, х + у =/: 0. Разлагая в произведение левую часть первого уравнения, получаем две системы уравнений, в каждой из которых функции будем рассматривать на том же множестве Е: М- = о, fHEL = o. х+ у и х + у 1х + ху + у = 1 х + ху -с у = 1. 426
Первая система имеет одно-единственное решение (0, 1). Вторая система может быть записана при ограничениях функций на множестве Е в виде /х=у, /х=У, 1х+ху + у=1, ]у2 4- 2у - 1 = 0. Квадратный трехчлен имеет два вещественных корня: yt =—1 + У 2, у2~ = —1 — У 2. Поэтому исходная система, помимо уже найденного решения (0, I), имеет еще два: (-1 + У 2, -1 + V2), (-1 - /2, -1 - У2). 4.8. Иногда при сопоставлении двух систем уравнений имеет место лишь включение множества решений одной из них в множе- ство решений другой. Если всякое решение системы уравнений (1) является решением системы уравнений (2), то говорят, что система (2) есть следствие системы (1). Эквивалентность систем уравнений (1) и (2) означает, что каж- дая из этих систем есть следствие другой. 4.9. Полезно иметь в виду следующее свойство, непосредствен- но вытекающее из понятия следствия (4.8). Если в системе уравнений какое-нибудь из уравнений есть след- ствие системы, состоящей из всех других уравнений, то, удалив это уравнение, мы получим систему уравнений, эквивалентную исходной. 4.10. В связи с понятием следствия остановимся на более уз- ком понятии. Уравнение F (хи х2, ..., хп) =0 назовем линейным следствием системы уравнений Ф1(*1, *2, -,Хп) = °- Ф2 (Хъ Х2, .... Х„) =0, фт к, х2..........................х„) = 6, если для функции F (х1( х2, ...,хп) имеет место линейное выражение: F(xlt х2, .... хп) = • ФЛ*!, х2, .... хп) + Х2 • Ф2(х1, х2, .... х„) 4- ... -)- • Фт (Xi, х2, . хп), где Х15 Х2, ..., —некоторые числа. Очевидно, всякое решение системы будет решением и данного уравнения. Другими словами, всякое уравнение, являющееся линейным следствием системы, оказы- вается следствием этой системы. Также и систему уравнений назовем линейным следствием дру- гой системы, если всякое уравнение первой системы есть линейное следствие второй системы уравнений. Благодаря предыдущим рас- суждениям всякая система уравнений, являющаяся линейным следствием другой системы, оказывается следствием этой системы. Как мы уже знаем, для систем линейных уравнений верно и об- ратное (I, 4.13). Всякое линейное уравнение, являющееся следст- 427
вием разрешимой системы линейных уравнений, оказывается ли- нейным следствием этой системы. Тем самым в теории систем ли- нейных уравнений понятия следствия и линейного следствия по существу совпадают- 4.11. Пример. Чтобы решить систему xi -р у» == а, ху=Ь (Ь ф 0) поступим следующим образом. Возводя левую и правую части второго уравнения ь п-ю степень, получаем систему, являющуюся следствием исходной: ха + уп= а< хп . уП== ьч_ Значения хп и у" являются корнями а и Р полинома f2 —at + b ‘. Найдем все значения корья n-й степени из а: аг, а2, .... ая — и все значения корня п й сте- пени из р: р1? Р2, .... рп. Всевозможные пары (az, р,) и (pz, az) составляют мно- жество решений агорой системы. Однако некоторые из них могут оказаться «лиш ними» пс отношению к первой, исходной системе. Нам следует взять лишь такие пары (а„ Ру) и (Ру, az), для которых az • ру — Ь. Решая, например, указанным способом систему уравнений х4 + у4 = 25, ху = 2/3“ находим все ее решения: (2. /3),_ (/3, 2), (-2, -/3), (-) 'З, -2), (—21, /31), (/31, —2ij, (2t, —/3i), (—V31, 2i). 4.12. Наиболее часто применяемый прием исследования и ре- шения систем уравнений состоит в переходе от данной системы уравнений к другой системе, более простой и эквивалентной ей. Один из таких приемов основан на следующем преобразовании системы уравнений. Теорема. Пусть дана система уравнений Л (*!» *2| ••» *л) — 0. F2 (*1, *2..*,.) = 0. •••.*«) =0 с областью определения £ и пусть Ф (хг, х2, ..., х„) и ’F (х,, х2, . .. .... х„)— функции, области определения которых содержат Е. ПриэтомФ (х1,х2, ...,х„) не принимает.значений, равных нулю, при (*1> *2’ •••’ . Если в исходной системе уравнений одно из уравнении Fi (xlt х2, .... хп) —0 заменить новым Ф (Xj, х2, .••, хп) • Fz (Xj, х2, ..., хп) (xli, х2, ..., хп) • Fj (xj, х2, ...,х„) =0 (/¥=0, то полученная система уравнений будет эквивалентна исходной. Доказа тельство. Всякое решение (aI( a2..................a„) ис- ходной системы будет решением и новой системы, поскольку при 428
Xi — «J( x2 = a2, .... xn — a„ удовлетворяются все ее уравнения, в тем числе и новое i-e уравнение впнду Ft (a,, a2, ..., a„) =0 и F. (a1( a2, .... a„) =0 Пусть теперь (01( 02, 0„) есть решение второй системы. Оно, очевидно, будет решением всех уравнений и первой системы, за исключением, быть может, лишь ее i-ro уравнения. Так как Ф (01. 02. -. 0„) • Л (01. 02....0„) + ¥ (01. 02, ... . 0ft) • F) (Рк, 02. -. 0Я) =0 и при j * i F. (Pn 02, .... 0n) = o, TO Ф(01.02.....0n) Ft (01( 02, .... 0n) =0. Согласно условию Ф (0Ь 02, ..., 0П) #= 0, поэтому Pi (01.02.-.0Я) =0, т. е. (0,, 02, ..., 0,) оказывается решением и i-ro уравнения первой системы. 4.13. Теорема 4.12 лежит в основе способа решения систем уравнений, называемого методом алгебраического сложения. Он состоит в том, что при помощи указанного в теореме преобразования системы уравнений получают новую систему, эквивалентную ис- ходной и более просто устроенную. В частности, в уравнениях иногда удается уменьшать число неизвестных. Частным случаем этого общего метода является тот, который рассматривался нами в 1, 1.9 в отношении систем линейных уравне- нии и использовался для приведения системы линейных уравнений к трапецеидальному (треугольному) виду (I, 1.11). Там в качестве Ф (х„ х2, ..., хп) выступает постоянная, равная 1, а в качестве ¥ (хп х2, ..., х„) — произвольная постоянная %. 4.14. П р и м е р ы. 1) Рассмотрим систему двух уравнений с тремя не- известными: хг + уг + 1 = 0, х* + ху — 1 =₽ 0. Область определения входящих в систему функций можем ограничить множе- ством Е, состоящим из трсек комплексных чисел (х, у, г), в которых х у- 0 (при значении х = 0 система не имеет решений). В соответствии с 4.12 первое уравне- ние умножим на х и прибавим к нему второе, умноженное на —г (речь идет о Функциях, стоящих в левых частях). Получим новую систему, эквивалентную исходной: х + г = 0, х2 + ху — 1 = 0. Отсюда находим общее выражение для решений нашей системы: 1 — а2 х — а, у =-----. г — —<х а при произвольном а =И= 0. 429
2) Решим систему трех уравнений с двумя неизвестными: х’ + ху + 4у2 — 2 =0, Xs 4* 4ху2 + у — 2х = 0, х2у + ху2 4- у = 0. Пользуясь 4.12. ко второму уравнению прибавим первое, умноженное на —х, а к третьему прибавим первое, умноженное на —у: х2 + ху + 4у2 — 2 = 0, —- х2у + у — 0, — 4у3 + Зу = 0. Из последнего уравнения получаем, что у может принимать одно из трех значе- ний: у = 0, у = у = — При у = 0 два последних уравнения удовлетворяются, а первое будет удов- летворяться лишь при х2 _ 2 = 0. Таким образом, получаем два решения исходной системы: (/2,0), (-/?, 0). Если у = ± L_t, то из второго уравнения для х имеется лишь возможность х*= •= 1, т. е. х= ±1. Непосредственной проверкой убеждаемся, что указанные зна- чения х и у не удовлетворяют первому уравнению. 4.15. Следует обратить особое внимание на условие, наклады- ваемое в теореме 4.12 на функцию Ф (хь х2, ..., х„), которая не должна принимать нулевых значений в области определения си- стемы уравнений. Если этим условием пренебречь, го, как видно из доказательства теоэемы 4.12, мы можем получить новую систему, являющуюся лишь следствием исходной. В результате решений новой системы мы можем получить так называемые «лишние» реше- ния, которые не являются решениями исходной системы. Нетрудно видеть, что при этих «лишних» решениях значение функции Ф (хь х2, хп) равно пулю, хотя, конечно, не всякое решение второй системы, при котором значение функции Ф(хп х2, ..., х„) равно нулю, будет «лишним». 4.16. Пример. Рассмотрим систему уравнений: (х + У) х (х + У) У _ х+ j =0 у2 X Ее область определения состоит из пар (х, у), а которых ни х, ни у не равно ну- лю. Умножим первое уравнение на (х -|- у) и прибавим второе, умноженное на (—у). Получим систему уравнений с той же областью определения: х(1 + у) = 0, (х + у) х _ (х 1-у)у _х J = 0. у2 X 1 430
Поскольку функция (х + у), на которую умножалось первое уравнение, может принимать значение, равное нулю в области определения системы, то мы полу- чили лишь следствие исходной системы. Из первого уравнения полученной системы, учитывая, что х -£ 0, получаем у = —1. При этом значении у второе уравнение принимает вид (х - 1) (х2 - х + 1) = 0. Получаем три решения второй системы: .О. -1), (L+pl. -1). (kzpi. _t). Лишь первое из них требует согласно 4.15 проверки, поскольку обращает в нуль функцию х-j- у. Непосредственно видно, что значения х= 1, у = —1 не удов- летворяют исходной системе. Значит, решениями исходной системы являются лишь два других. 4.17. Еще один широко используемый в практике способ реше- ния систем уравнений основан на следующем. Теорема. Пусть дана система уравнений Fi (xlt х2, .... хп) =0, F2 (хь х2, ..., хп) = 0, Лп(*1. х2, ...,х'п) =0. Если уравнение Fx (xlt х2, , х„) = 0 эквивалентно уравнению вида Xi — Ф (хь х2, ..., х„), то исходная система эквивалентна системе: Xi =Ф (%1, хг, .... х„), F2 (Ф (х1( х2, .... х„), х2, ..., х„) = 0, Гт(Ф (xlt х2, ..., х„), х2.хя) =И). Доказательство. Пусть (аь а2, ..., ая) есть решение ис- ходной системы уравнений. Благодаря эквивалентности первого уравнения и Xj = Ф (хг, х2, .... хп) имеем ах = Ф (аь а2, .... а„), и так как Fj (аь а2, .... а„) = 0, то Еу(Ф (а1( а2...а„), а2.....ап) =0 (/ = 2, 3..т). Обратно, если (Рь (32, ..., р„) есть решение второй системы урав- нений, то Pi =Ф (Pn р2, .... ря), и значит, Ft (Ръ р2, .... 0„) =0 при любых i =1,2, ..., т. 4.18. Основанный на теореме 4.17 способ решения систем на- зывается методом подстановок. Он основан на том, что с помощью указанного в теореме 4.17 преобразования системы ее заменяют другой, эквивалентной ей системой, но более просто устроенной. Наибольший интерес представляет тот случай, когда функций Ф (х1г х2, ..., х„) можно выбрать так, чтобы она не зависела от хх. В этом случае задача сводится к системе, состоящей из т — 1 уравнений с п — 1 неизвестным. 431
По существу частным случаем этого общего метода является упомянутый в I, 1.13 способ подстановки при решении систем ли- нейных уравнений. 4.19. Примеры. Разложим на множители 1/ Решим систему уравнений: ху — у2 = 2, хру — х2у2 - 8. левые части: У (х — у) = 2, х*у (х — у) = 8. Область определения системы можно ограничить условием х =/= у При этом огра- 2 имении первое уравнение эквивалентно у =------. Подставляя но второе урав- пение, получаем х2 = 4. Следовательно, наша система эквивалентна системе 2 У ~ х — У к2 = 4, Отсюда легко находим все решения данной системы: (2, 1 4- i), (2, 1 - Г), (-2, -1 + О, (-2, -1 - О. 2) Рассмотрим систему уравнений: ху—х у-j- 1 = 0 Х+У х —у ^=1. X Ее область определения состоит из пар комплексных чисел (*, у), для которых х У= У, х--/= —у, х =у-- 0. При ограничении х =/- 0 второе уравнение эквивалентно у = 2х. • Решая методом подстановки, получаем систему: 2х* + 5х + 3 = 0, У = 2х, которая эквивалентна исходной системе (можно не ограничивать ее область опре- деления, поскольку ни в одном из случаев х = у, х = — у, х — 0 она, очевидно, / 3 \ не имеет решений). Решениями ее являются (—1, —2) и(——, —31. § 5. Результант и исключение неизвестного 5.1. Система уравнений, в которой все функции являются поли- номами от нескольких переменных, называется системой алгебраи-' ческих уравнении. В книге Е. С. Ляпина «Курс высшей алгебры» (1955) изложен один общий элементарный метод решения произ- вольной системы алгебраических уравнений, Для различных част- ных видов систем алгебраических уравнений существуют сбои приемы решений. 432
В этом параграфе мы рассмотрим один общий метод исследова ния и решения произвольной системы двух алгебраических урав- нений с двумя неизвестными. 5.2. Предварительно дадим одну форму ответа на вопрос о су- ществовании общих корней у двух полиномов от одного перемен- ного. Лемма. Полиномы f (х) степени п > О и g (х) степени т > О имеют общие корни тогда и только тогда, когда существуют поли- номы ф (х) степени меньше гп и ф (х) степени меньше п, такие, что Цх) Ч (х) = g(x) -Ф (х). Доказательство. 1) Если f (х) и g (х) имеют общий корень а, то они делятся на х — а (VII, 4.5): / (х) = (х — а) • ф (х), g (х) = (х — а) • <р (х). Отсюда получаем f (х) ф (х) = g (х) ф (х), при этом степень <р (х) равна т — 1, а степень ф (х) равна п — 1. 2) Пусть существуют указанные в формулировке леммы поли- номы ф (х) и ф (х). Предположим, что f (х) и g (х) нс имеют общих корней. Тогда они взаимно просты (IX, 2,16 (9)), и поэтому найдутся полиномы А (х) и В (х), такие, что Л(х) • f (х)4- В (х) • g (х) = — 1 (IX, 2.16 (1)). Обе части равенства умножим па ф (х)- А (х) f (х) ф (х) + В (х) g (х) ф (х) = <р (х). В этом равенстве левая часть делится на g (х), а правая часть, явля- ясь полиномом степени меньше, чем степень g (х), не делится на g(x). Следовательно, в действительности f (х) и g (х) имеют общие корни 5.3. Еще один подход к решению вопроса о существовании об- щих корней у двух полиномов связан со следующим понятием. Определение. Результантом полиномов f (х) = щх” 4- а1ха~1 4- ... 4- а„ (^ 0), g (х) = йоХ714- t>iXm-1 4- ••• 4- ьт (Ь„ =# 0), имеющих степени п > 0 и т > 0, называется следующий опреде- литель (п 4- гп)-го порядка-. «1 а-2 • - а„_, ап 0 0.. . 0 0 0 а9 «1 *л-1 «я о . 0 0 0 0 ов ’ - •' ап- a ^t-2 • . 0 0 m R (/ W, g (х)) = 0 &о 0 di 0 • • (Iq а % • • Ьт^ Ьт 0 0 .. • ая-1 . 0 Я/; 0 0 Ьо bi Ьт— 2 bm^i Ьт 0 . 0 0 < 0 0 bo • Ьт~з bm^2 bm—i Ьт . 0 0 n 0 0 0 ... Ьд Ь} Ь$ ... Ьт-! Ьт 433
5.4. Теорема. Полиномы f (х) = аихп + «jX"-1 + ... + ап (о0 =/> О, п> 0), g{x) = boxm + b1Xm~l+bm (&о=#О, m>0) обладают общим корнем тогда и только тогда, когда их результант равен нулю: R\f (х), g(x)) =0. Доказательств о. Из леммы 5.2. вытекает, что полиномы /(х) и £(*) обладают общим корнем тогда и только тогда, когда существует последовательность чисел £1, ^2» *•* ^2» ”•> среди которых есть отличные от нуля, такая что для полиномов <р(х) = cixm-1+ c2xm—2 + ... + ст, ф (х) = diXn-1+ d2xn~2 + ...+dn выполняется равенство Их) • <р (х) = g (х) ф (х). Благодаря единственности нормальной формы полинома одного переменного последнее равенство означает совпадение коэффициен- тов при одинаковых степенях х, получающихся в результате пере- множения полиномов: f (х) - <р (х) и g (х) • ф (х). Выписываем эти равенства; n0Cj = bod, а1с1 + апс2 = bld1 + bod2, o2Ci + ^1^2 4" аоез — bidi + btd2 + bfjd3, ancm~l~T~ an-lcm —birdn_y + Ьт_^Л, ancm= bmdn. Нетрудно убедиться, что, перенеся члены из правых частей этих равенств в левые, мы получим систему равенств, которую можно рассматривать относительно ct и —dj как однородную систе- му т п линейных уравнений с т + п неизвестными и определи- телем которой является определитель, транспонированный к ре- зультанту R (f (х), g (х)). Существование ненулевого решения у этой системы линейных уравнений, как мы знаем (II, 5.5), равно- сильно тому, что определитель системы, а значит, и транспони- рованный к нему определитель равны нулю: R (J (х), g (х)) = 0. 5.5. Примеры. 1) Для полиномоз f (х) = х2 — 2х 2 и g (х) = х* — 2х® р Зха — 2х + 2 их результантом является определитель 6-го порядка: «Л4
g(x)) = 1 —2 2 0 0 0 0 1—8 2 0 0 Э 0 1—2 2 0 0 0 0 1—22 1 —2 3 —2 2 0 0 1—2 3—2 2 1 —2 2 0 0 0 0 1 —2 2 0 0 0 0 1 —2 2 0 0 0 0 1—22 0 0 1 —2 2 0 0 0 0 1 —2 2 (во втсром определителе третья и пятая строки одинаковы). Согласно 5.4 поли- номы / (х) и s (х) имеют общий корень. 2) Выясним, при каких значениях X полиномы f (х) = х1 — Хх2 + Хх — 1 и g (х) = х2 + X .имеют общие корпи. Вычисляем результант: о —1 R If (<). я (*)) = 1 о 1 с о -X X 1 —X О X 1 о С 1 —1 X о X о (X2 - 1)2. о о X Следовательно, f (х) и g (х) обладают общими корнями лишь в случае X — ztl. При X = 1 общими корнями являются: i и —i, а при X = —1: 1 и —1. 5.6. Рассмотрим теперь пару полиномов f (х) = а^п + щх"-1 + ... + ап, g (х) = Ь^хт + &1х'п-1 + ... + Ьт, не требуя, чтобы в их записи коэффициенты а0 и Ьй были отличны от нуля. По тому же принципу, что и результант, составим опреде- литель; о= а0 ах а2 ап_г ап 0 0 ... 0 0 0 а0 Щ а„_2 an_t ап 0 ... 0 0 0 0 «э ая_3 аП_г ап ... 0 0 0 0 0 . а0 ах а2 а3 a„_i ап b0 bt b2 ... &т_х Ьт 0 0 0 0 о &о by ... bm_2 Ьт_у Ьт 0 0 0 о о Ьо ... bm_3 bn_2 Ьт_2 Ьт 0 0 0 0 0 Ьй by Ьг Ь3 ... bm-i Ьт • Следствие. Если полиномы f (х) и g lx) обладают общим корнем, то D — 0. Доказательстве. Если хотя бы один из полиномов f (х) или^ (х) есть постоянная нуль, то все коэффициенты этого полинома равны нулю и, следовательно, 0=0. Далее можем считать, что ни f (х), ни g (х) не является постоян- ной. Согласно 5.4 результант этих полиномов равен нулю: А! (/ (х), g (х)) = 0. Если а0#=0, 0, то опредетитель О и является ре- зультантом этих полиномов. О = R (j (х), g (х)) — 0. Если а3 = Ьо = 0, то у определителя О оказывается нулевым первый столбец и, значит, опять 0=0. 435
Пусть теперь один из коэффициентов аа или &0 отличен от нуля, а другой равен нулю, например О, Ьо = 0. Обозначим через I наименьший номер, при котором соответствующий коэффициент полинома# (х) отличен от нуля: bz=/= 0(0 <J < tn). Разложим опре- делитель D по первому столбцу. Получившийся определитель тоже разложим по первом^ столбцу. Повторив так I раз, мы получаем: D = а‘ • R (f (х), # (х)) = 0. 5.7. Понятие результанта может быть применено к исследова- нию вопроса о решениях системы двух алгебраических уравнений с двумя неизвестными: F (х, у) = 0, G (х, у) = 0. Здесь F (х, у) и G (х, у) — полиномы от двух переменных х и у, степени которых относительно каждого из переменных больше нуля. Полиномы F (х, у) н G (х, у) разложим по степеням одного из переменных, например х: F (х, у) — Ло (у)х’ + At (у) Xя"1 + ... + (у) (п > 0), G (х, у) = Во (у) хт -Ь Bi (у) х’»"'* + ... + Вт (у) (т> 0), при этом полиномы Ло (у) и Ви (у) не являются постоянной нуль. По тому же принципу, что и результант, составляем определи- тель: Ло(у)^с(у) ................... л„(у) о о .. о о о Л0(у)/((у)....... Л„_2(у) А,.:(у) л„(у) 0 ... 0 0 0 0 0 ... 40(у) 41 (у) Л2(у) Д3(у)......ДП-1(У)ЛП(У) В,„(у) 0 0 ....... 0 0 о Bc(y)Bi(y)...Bm_,(y) Вт_2(у) Вт(у) 0 ............ О 0 0 0 0 ... (у) В/у) В2(у) В3(у) ... В^_!(у)Вт(у) В развернутой форме этот определитель представляет собой некоторый полином от у, построенный для заданных F (х, у) и G (х, у). Придавая переменному у произвольное численное значение У — Р, получаем полиномы от одного переменного х: F (х, Р) = (р)х« + Дх (Р)х*-1 + ... + Л„(Р), G (х, р) = Во (Р)х« F В2 (plx*1’1 + ... + Bm(p). В этом случае R (р) есть определитель, составленный для F (х, р) и G (х, р) по тому же принципу, что и результант. Если До (р)цдО и Вц (р)¥~- 0, то R (р) есть результант этих полиномов: Я(Р) =R(F(x, p),G(x, Р)). 436
5.8. Теорема. Если (а, JJ) есть решение системы (5.7).* F (а, Р) = О, G (а, р) = О, то R (р) = 0. Доказательство. Число а является общим корнем по- липомов F (х, Р) и G (х, р). Согласно 5.6 соответствующий определи- тель 7? (р) должен быть равен нулю. R (р) — 0. 5.9. Теорема. Если /? (Р) = 0 и А. (Р) ф 0, Во (Р) ф 0, то найдется такое а, что (а, Р) будет решением системы (5.7): F (а, р) - 0, G (а, р) = 0. Доказательство. Результант полиномов Е(х. р) = Л9 (р) х” + Лх (р) х-1 + - + Ап (р) (Ле (Р) 0), С(х, Р) = Вэ (Р)х^ + В, (р) х-’1 + ... + В,п (р) (Во (р) 0), как отмечено в 5.7, равен R (р). Так как R (Р) = 0, то согласно 5.4 рассматриваемые полиномы обладают общими корнями Для вся- кого их общего корня а пара (а, р) есть решение исходной системы уравнений. 5.10. Предыдущие рассуждения приводят нас к общему методу решения указанной в 5.7 системы двух алгебраических уравнений с двумя неизвестными: F (х, у) = 0, G (х, у) = 0. Этот метод, называемый методом исключения неизвестного, сводит нахождение решений этой системы к отысканию корней полиномов одного переменкою. Он состоит в следующем. Полиномы F (х, у) и G (х, у) разлагаем по степеням одного пе- ременного: F(x, у) = Л0(у)х'! + n^yjx"-1 + - 4-Лл(у) (п > 0), G (х, у) = Во (у) хт + Bj (у) х"*-1 + ... 4- Вт(у) (т > 0). Здесь ни Л, (у), ни В„ (у) не есть постоянная нуль. Затем состав- ляем полином R (у) (5.7) (разумеется, можно рассуждать и отно- сительно переменного х). Основой рассматриваемого метода является тс, что для всяко- то числа р, являющегося корпем R (у), и общего корня а полиномов F (х, В), G (х, Р) пара (а, |!) является решением исходной системы уравнений и благодаря 5.8 всякое ее решение устроено указанным образом. При этом согласно 5.9 для всякого р, являющегося кор- нем R (у) и не являющегося корнем ни Ло (у), ни В& (у), указанное а существует. Пусть R (у) не есть постоянная нуль. В этом случае количество его корней конечно. Если для его корня р оба полинома F (х, Р) и G (х, р) являются постоянной, равной нулю, то для всякого чис- ла | пара (£, Р) есть решение исходной системы уравнений. Если 43/
хотя бы один из полиномов F (х, Р), G (х, Р) не есть постоянная нуль, то количество общих корней а этих полиномов конечно и соответ- ствующие пары (а, Р) являются решениями исходной системы. Пусть R (у) есть постоянная нуль. Тогда для всякого числа р, не являющегося корнем ни одного из полиномов Ао (у) и Вс (у) (и таких р бесконечное множестго), согласно 5.9 существует такое а, что (а, р) есть решение исходной системы. Количество чисел р, являющихся корнями одного из полиномов Лс (у) или Во (у), ко- нечно, и для каждого из них вопрос о существовании решений ис- ходной системы, имеющих вид (а, |3), сводится к вопросу об общих корнях полиномов F (х, р) и G (х, р). 5.11. Пример. Решим систему полиномы, стоящие з левых частях, по уравнений, предварительно разложив степеням х: х2 + ху — х + у = О, х2у + х2 + 2у = О, х2 + (у — 1) х + у = О, (У + 1'х2+ 2у = 0. Вычисляем: Я(у) = 1 (У-1) У О о 1 (у — 1) у (у +1) 0 2у 0 О (у+1) 0 2у = у(у- I)2 (Зу 4-2). Корнями полинома R (у) яьляются 0, 1, — —. Они не являются корнями Дл (у)= = 1 и Во (у) = у + 1. Поэтому они участвуют в качестве вторых компонент в некоторых решениях исходной системы. При у = 0 исходная система принимает вид: х2 — ж = О, х2 = 0. Получаем одно из решений исходной системы: (0, 0). При у = 1 имеем: х2 + 1 = 0, 2х2 + 2 = 0 и, значит, х = ±|. Получаем еще два решения: (i, 1), (—I, 1). 2 При у — — — имеем: Зх2 — 5х - 2 = 0, _ 4 = 0 и, значит, х = 2. Получаем еще одно, последнее решение исходной системы: § 6. Квадратичные формы 6.1. Как уже было сказано, однородные полиномы в алгебре часто называют формами. В частности квадратичной фермой назы- вают однородный полином второй степени. Интерес к квадратичным формам объясняется их особым значением во многих областях мате- матики и областях ее применения Например, исследование кривых второго порядка и поверхностей второго порядка в основном сво- 433
дится к изучению соответствующих квадратичных форм от двух и трех переменных. Если все коэффициенты некоторой квадратичной формы принад- лежат некоторому числовому полю Р, то, как обычно в теории поли- номов, будем говорить, что сна является квадратичной формой над полем Р. Особенно кажны случаи, когда в качестве основного поля Р берется поле Z всех комплексных чисел (комплексные квадратич- ные формы) и ноле р всех вещественных чисел (вещественные квад- ратичные формы). 6.2. Квадратичную форму от п переменных принято записывать в симметрическом виде: F (xlt х2, .... хг) = ф- а1гхух2 ф- ... ф- а1пхххп ф- + й21х2%] ф- а22х\ + ... ф- а2пх2хп ф- + О-щХпХ^ ф- С1п2ХпХ<> + ... ф- Щ,пХ„, где ац = ац при любых i, j = 1, 2, .... п. Разумеется всякую квадратичную форму можно записать в та- ком виде (разбивая член cxtXj, где i =ф= /, на два слагаемых у х,Ху к — XjX), притом единственным образом. Из коэффициентов симметрической записи квадратичной формы можно составить квадратную матрицу: (а11 а12 ••• а1п \ ^21 ^22 ‘ @2П I Яг>1 О-nt • • • апп/ , которая называется матрицей данной квадратичной формы. Эта матрица симметрическая, т. е. обладает свойством ац — ац для любых I, /. Другими словами, это означает, что А совпадает со своей транспонированной матрицей А* (V, 3.10). Конечно, всякая симметрическая матрица является матрицей некоторой квадратичной формы. 6.3. Специального внимания заслуживают особенно просто устроенные квадратичные формы, в выражении которых «отсутст- вуют смешанные члены», т. е. ац = 0 при любых i Ф j. Такая квад- ратичная форма называется диагональной: Т -^2» • ••> ~ *4* ^2’^*2 Ф- ••• Ф" аПпХп. У диагональной квадратичной формы ее матрица диагональна: (ап 0 0 ... 0 \ 0 а22 0 О I 0 0 а33 ... 0 I ООО ...апп/. 439
Про диагональную квадратичную форму часто говорят, что сна имеет канонический вид. Изучение квадратичных форм основывается на тем, что путем подходящего преобразования переменных квадратичную форму можно привести к каноническому виду. 6.4. Линейные формы от переменных хп х2, ..., хп над полем Р, т. е. однородные полиномы над Р первой степени, очевидно, обра- зуют линейное пространство над Р относительно действия обычного сложения и умножения на числа из Р. В этом линейном простран- стве простейшие полиномы xlt х2, ..., хп образуют его базис. Таким образом ранг этого линейного пространства равен п. Отметим попутно, что это линейное пространство, очевидно, изоморфно Пусть даны п лилейных форм над Р: У1 = р1Х Х2 -ф р12 Х2 • •• “Ь Pin-Vi > У2 = р21 хх + р22 х2 + ... + РгпХп, Ул = |1л1 Хх -|- Цпг -^2 "Т ••• Т" IhmXnt причем матрица ('РТ1 Н12 ••• Рш \ М-21 Р-22 -• Р-2Л I Цп1 рП2 • • • Илл ' неособенная. Как мы знаем (IV, 2.11), в этом случае все х,- можно в свою очередь выразить линейно над Р через уп у2, ..., уп. Из V, 2.1, 3.4, 3.5 легки вытекает, что матрицей линейного выражения в этом случае будет АТ1. 6.5. В V, 2.1 было показано следующее. Пусть Ух, уг, •••, Ул выражаются линейно через х1( х2, ..., хп с матрицей линейного выражения Aft, a zx, г2, ..., г„ выражаются линейно через ylt у2, .... у„ с матрицей линейного выражения М2- Тогда zt, z2..zn могут быть выражены линейно через x]t х2, ... ..., хп е матрицей линейного выражения М2МГ. При этом х1(х2, ..., хп выражаются линейно через zx, z2, ..., zn с матрицей линейного вы- ражения (AfjAfJ-1 = Л4“1Л4Г1. 6.6. Пусть F (х1( х2, .... хп) некоторая функция от п переменных хъ х2, ..., хп и заданы линейные формы у1( у2, .... уп от хп х2, ..., х„ с неособенной матрицей М их линейного выражения. Все элементы М принадлежат некоторому числовому полю Р. Выразив линейно хх, х2, ..., Хп через ух, у2, ..., у„, мы можем подставить полученные выражения в F (х2, х2, ..., х„). В результате получим F (х1? х2, .... х„) = Н (ух, у2, .... у„). В этом случае говорят, что F (хХ1 х2, ..., хП) преобразовалась в И (ух, у2...уп) при помощи линейного преобразования (или 440
замены) над Р переменных хх, х2, ..., хп с новые переменные ух, Уг.-. Уп- Если F (хх, х2, хп) есть квадратичная форма над Р, то, как легко видеть, и Н (ух, у2, у„) будет квадратичной формой над Р Отметим, что благодаря 6.5 результат нескольких последова- тельно произведенных линейных преобразований переменных над Р можно рассматривать как результат единого линейного преобра- зования переменных. 6.7. Лемма. Квадратичная фор ма F (х^, хг, хп) над Р путем соответствующего линейного преобразования над Р перемен- ных хх, х2, .... х„ в переменные ух, у2, .... уп может Сыть преобра- зована в квадратичную форму Н (ух, у2, ..., уп), у которой коэффи- циент при yf отличен от нуля. Доказательство. 1) Если в F (хх, х2, .... хп) отличен от нуля коэффициент при некотором х*, то требуемое выражение получим при помощи линейного преобразования, являющегося простым переименованием переменных: У1 = хю Ул = хк yt = Xi (2 < t < n. i k). 2) Если в F (xx, x2.x„) коэффициенты при всех квадратах переменных равны нулю, но отличен коэффициент при некотором произведении х,Ху, то в качестве требуемого линейного преобразова • ния возьмем преобразование переменных следующие ух, у2, ..., у„: ух = Xi 4- Xj, у3 = Xi — Xj, ya = Xx, у/ = X2, у, = x, (3 < s < n; s =#= i, /). 1,111 1 ак как, очевидно, имеем: х,- = —ух -г —у2 и xj = — ух —-у2, то в результате преобразования член сх(Ху преобразуется в ':'Ы' + 7й)' (^'-гу') = Лу' ~7Уг Коэффициент при у? оказался отличен от нуля. При этом он не уничтожится, когда мы выпишем и остальные члены, ибо ни один из других членов, очевидно, не будет содержать у]. 6.8. Следующая теорема является основной в теории квадратич- ных форм. Ее часто называют теоремой о приведении квадратичных форм к каноническому виду. Впервые она была получена француз- ским математиком Ж Л. Лагранжом (1736 — 1813). Теорема. Всякая квадратичная форма над числовым полем Р при помощи соответствующего линейного преобразования перемен- ных над полем Р (6 6) может быть преобразована в диагональную квадратичную форму над тем же полем Р. Доказательство . Доказательство ведем по индукции относительно числа переменных п. Если п = 1, то квадратичная форма уже имеет требуемый вид ДдХ?. 441
Предположим, что п > 1 и доказываемое утверждение справед- ливо для всех квадратичных форм с числом переменных, меньшим п. Благодаря 6.7 мы можем считать, что у рассматриваемой квад- ратичной формы F (хх, х2, ..., хп) = апх? — а13х3х2 + ... + alnXiXn + + «2lX2Xj 4" Й22Х2 + ... + fl2nX2-*7l 4“ 4~ ctn3xnx3 4~ <zn2xnx2 4~ ... -|- а^хп (предполагается симметрическая запись) аи 0. Возьмем линейную форму: Ух = й1Л 4- йХ2л-2 +- ... + а1пхп и проделаем следующее тождественное преобразование: F (х1( х2, ..., хп) = — у{ 4- F (х1( х2, .... хп)-- yi = а11 СЦ = —у? 4- <6)4 4- + ... 4- alnx1xn 4- an 4- а^х^ 4- a31xsx} 4- • •• 4- anixnxL 4- Ф (хг, х3, .... хп) — —- (0u*i 4- «12*2 4- ... 4- а1пхп)* = — у? 4- V (х2, х3, ..., х„). аП а11 Здесь через Ф (х2, х3, .... хп) и Т (х2, х3, ..., хп) обозначены оче- видным образом составленные суммы одночленов вида cxiXj, у ко- торых i =/= 1 и / #= 1 (члены, содержащие х1( как легко видеть, уничтожатся, поскольку alh = Обе эти суммы оказываются квадратичными формами над Р от х2, х3, ..., х„. Благодаря индуктивному предположению найдутся такие ли- нейные формы у2 = </2гх2 4* <^2з^з 4~ ••• 4- d-2nXn> Уз ~ d33x3 4- d33x3 4- 4" d3nxnt Уп — dn2x3 4“ dn3x3 -j- ... 4" dnnxn, матрица линейного выражения которых неособенная, с коэффици- ентами, принадлежащими Р, и такова, что соответствующее линей- ное преобразование переменных дает: (х2, х3, ..., Хп) — Ь3У2 4* ЬзУз 4" ... 4* Ь„Уп, где Ьг, Ь3, .. , bn € Р. Таким образом, для исходной квадратичной формы имеем: F (хх, х2, х„) = -- у? 4~ Ь2Уг 4~ ^зУз 4- ••• 4* bny'n ан Так как у1( у2, ..., уп линейно выражаются через хХ1 х2, .. , хп с матрицей линейного выражения /аИа12а)3 аШ \ I 0 d22d23 ... d3,i I 0 d32d33 ... tian I 0 dfl2 ••• dnn' 9 442
которая, очевидно, является неособенной, то наша исходная квад- ратичная форма оказалась приведенной к диагональному виду ли- нейным преобразованием над Р переменных х2, х2, ..., хп в указан- ные переменные уп у2, •••» Уп- 6.9. Приведение квадратичных форм к диагональному (канони- ческому) виду используется для изучения их свойств. Подробное изложение соответствующей теории в задачу настоящей книги не входит. Поэтому мы лишь в качестве примера ограничимся несколь- кими простейшими свойствами квадратичных форм над R (именно вещественные квадратичные формы особенно часто встречаются в приложениях). 6.10. Согласно 6 8 вещественная квадратичная форма F (xit х2, ..., хп) соответствующим преобразованием переменных может быть приведена к виду + b2yt + ... + Ьпуп, где й1( Ь2, .... Ъп вещественны. Совершим дальнейшее линейное преобразование переменных уд, у2, .... уп в zlt z2, .... zn, при ко- тором г, = V bi-yi при bi 0 и г, = V—bfyj при bj < 0. Произведя затем переименование переменных (которое так же является линей- ным преобразованием переменных), мы, очевидно, можем придать нашей квадратичной форме вид: ?2 _L_ 4- 7^ _ 7^ — — -Г ... т ?р zp+l ... где 0 < р + q п. 6.11. Параметры р и q во многом характеризуют свойства квад- ратичной формы как вещественной функции. При q = 0 областью значений вещественной квадратичной формы, как легко видеть, является множество всех неотрицательных вещественных чисел; при р = 0 — множество всех неположительных вещественных чисел; при р =/= 0, 7 =/= 0 эта область есть R. G.12. Хотя одна и та же квадратичная форма может быть при- ведена к диагональному виду, указанному в 6.10, при помощи раз- личных преобразований переменных, результаты оказываются сходными. Параметры р и q (6.10) не зависят от выбора преобразова- ния. Соответствующая теорема, носящая несколько странное на- звание, была получена немецким математиком К Г. Якоби (1804—1851). Закон инерции квадратичных форм. Если вещественная квадратичная форма F (х1( х2, •••> ХФ двумя вещест- венными линейными преобразованиями переменных преобразуется с формы вида: Fi \ 2 । 2 1 .22 2 (л'1, Х2, ..., Х„) = U] + «2 + • •• + UPl — — ... — F (xlt х2..хя) = о? + + ... + v2p — — ... — Vp,+?„ що Pi = ps и ft = qt. 443
Доказательство. Предположим, что рх р2. Пусть означает наибольшее из этих двух чисел: рг > р2. Покажем, что это предположение приводит нас к противоречию. Мы имеем равенство: wi 4* иг + ... + «р, + yp2-i-i 4- ... + Vp,+?, = — Up^i 4- i'p,+2 4- ••• 4- Up,4-p, 4* ui 4- ••• т vP1. Так как p2 < оь to ft 4- Ps < ft 4- Pi < n. Обозначим через wlf w2, ..., ws (s qt 4- p2) некоторый базис СОВОКУПНОСТИ ЛИНеЙНЫХ ф0ВМ Up,4-1, Up,4-2, ..., Up,4-p,, ft, ft, .... Vp.. Если бы каждая из линейных форм uH u2, ..., upt выражалась линейно через w2, ..., ws, то зсе щ, и2, .... Up,+?, выражались &л линейно через s линейных форм. Но это противоречит линейкой независимости ft, и2, ..., ип, поскольку s < pt 4* ft (IV, 1.6). Поэтому можно считать, что какая-то из линейных форм iq, u2, .... uP1 не выражается линейно через tft, w2, ..., ws. Пусть для определенности записи эго будет ft. Линейные формы ft, wlt w2, ..., ws линейно независимы между собою. Действительно, в случае линейной зависимости между ними имело бы месте или линейное выражение ft через wlt w2, ..., ws, или же линейная зависимость eft, ш2, ..., ws между собою. Составим систему линейных уравнений, левые части которых соответствуют линейным формам ft, tft, w2, ..., ws: ut — 1, wx — 0, tft = 0, ..., ws = 0. Поскольку линейные формы, соответствующие левым частям уравнений, линейно независимы между собою, ранг матрицы этой системы уравнений равен числу уравнений. Поэтому система разрешима (I, 4.5). Так как коэффициенты уравнений все вещественны, то она обладает решением (ft, х2, ... «... хп), состоящим из вещественных чисел. Значение произвольной функции g = g(xlt ft, .... хп) при зна- чении переменных xt = ft, х2 — х2, .... хп = хп будем обозначать через g = g (ft, ft Хп). _ _ _ _ По самому выбору ft, х2, ..., хп мы имеем ft = 1, ift = 0, w2 = 0, ..., ws — 0. Так как Up,+i, Up1+2, .... Up,+p,, ft, ft, ...,vp2 выражаются линей- но через u\, w2, ..., ws, то из tft = w2 = ... = ws =0 вытекает: Up,4-1 — Up,-|-2 == ... = Up,4.p, = Ui = V2 — ... = Vp, = 0. В исходном равенстве придадим переменным xlt х2, ..., хп зна- чения хг, х2, .... хп- Получим: _и? 4* U2 4- ... + Up, 4*_ Up,4-j 4-д. 4* Up,44t_= = Up,4-i + u2Pl4.2 4- ••• 4- Up,-|-p, 4* of 4- ... 4- Vp,- Все участвующие здесь числа вещественны. Так как uf = 1 > 0, то число, стоящее в левой части равенства, больше нуля. Но тогда 444
равенство оказывается невозможным, ибо все слагаемые в правой части равны нулю. Доказательство = о2 проводится совершенно аналогично. 6 13. Пример. Рассмотрим квадратичную форму над R: F (Хр хг, х3, х4) = 4x^2 + 4xtx3 + xlxi. Так как коэффициенты при всех квадратах переменных равны нулю, то для приведения нашей кнадратичной формы к сумме квадратов сперва необ ходимо произвести линейное преобразование переменных 6 7: 1 1 У1 = «1 + Ъ xi = -- Л у2, 1 1 У г = *1 — х2 *з = у У4 —у У». Уз = *». хз = Уз- Уз = хг, х4 = у4. Наша квадратичная форма преобразуется в квадратичную форму, И (У1. У4. Уз. 5J = у\ — У\ + 2У1Уз + 2УзУз + у УЛ + j УЛ- Телерв надо ввести новую переменную способом, употребленным в 6.8: 1 Л = У| +Уз + “ У» Получаем квадратичную форму: г\ 4- У? — у\ + 2yi'з + 2у2у8 + -~ уЛ + -|у2у4 - (у, + у3 + У4)’ =" £ А тг 9 9 л 9 1 1 о = г. - У г + 2у,Уз + -УгУ,. ~ Уз ~ у УзУз ~ у У* Совокупность всех членов, кроме zf, представляет собой квадратичную форму уже от трех переменных. По отношению к ней проводим соответствую- щие преобразования. Введя новую переменную: г2 = — У2 + Уз + Т >4. 4 получаем: 2 9 9 « л 9 1 1 9 «1 — г? — >2 + 2УзУз + у УзУз - Уз — 7 УзУ4 - Уз + Z 2 10 / 1 \2 + 1 —Уз + Уз + уУ4) =г?— г|. Мы получили требуемое выражение для квадратичной формы. Суммируя проведенные рассуждения, можно сказать, что наша квадратичная форма при помощи линейного преобразования переменных хх, х2, х3, х4 в новы? пере- менные Zj = Xi + х} + х3 + — xt. z2 = + х2 + х3 + у х„ «3 = х3, 2, = Х, (обозначения для z3 и z4 вводим лишь для полноты обозначений) преобразу- ется в квадратичную форму: G fa, г2, г3, z4) = zf =- г|. 445
ЛИТЕРАТУРА LB. Г. Б о л т я н с к и й, Н. Я. 3 и л е н к и н. Симметрия в алгебре. М., «Наука», 1967. 2. 3. И. Б о р е в и ч. Определители и матрицы. М., «Наука», 1970. а В. Ю. Бурьян. Учебное пособие ио высшей алгебре. М., Учпедгиз, 1962. 4. А. А. Бухштэб. Теория чисел. М-, «Просвещение», Г966. 5. Б. Л. Ваи-де р-В арден. Алгебра. М., «Мир», 1976. 6. Ф. Л. Варпахозский, А. С. Солодовников. Алгебра. М., «Просвещение», 1974. 7. И. М. Виноградов Основы теории чисел. М., «Наука», 1972. 8. М. Н. В и с л а в с к и й. Линейная алгебра и линейное программирова- ние. М., «Высшая школа», 1966. 9. В. В. Воеводин. Линейная алгебра. М., «Наука», 1974. 10. Д. Гейл. Теория линейных экономических моделей. М., ИЛ, 1963. IL И. М. Гельфанд. Лекции по линейкой алгебре. М. «Наука», 1971. 12. Н. В. Е ф и м о в, Э. Р Розен дор н. Линейная алгебра и многомер нгя геометрия. М., «Наука», 1976. 13 А. М. Журавский. Сборник задач по высшей алгебре. М., ГТТИ, 1933. 14. С. Г. 3 а в а л о. Элементарная алгебра. М., «Просвещение», 1964. 15. М. 3 а м а н с к и й. Введение в современную алгебру и анализ. М., «Нау- ка», 1974. 16. В. А. И л ь и н, Э. Г. П о з н я к. Линейная алгебра. М., «Наука», 1974. 17 Л. А. К а л у ж н и н. Введение в общую алгебру. М., «Наука», 1973. 18. И. Л. Кантор, А. С. Солодовников. Гиперкомплексные чис- ла М.. «Наука», 1973. 19. А. М. Кауфман. Высшая алгебра. Ч. I. Рязань, I960. 20. А. Г. К у р о ш. Курс высшей алгебры. М., «Наука», 1971. 21. А. Г. К у р с ш, Лекции по общей алгебре. М., «Наука». 1973. 22. А. Г. К у р о ш. Общая алгебра. Лекции 1969 -1970 гг. М., «Наука», 1974. 23. С. Ленг. Алгебра. М., «Мир», г 963. 24. С. Е. Л я п и н, И. В. Б а р а н о в а, 3. Г. Б о р ч у г о в а. Сборник задач по элементарной алгебре. М., «Просвещение», 1973. 25. Е. С. Ляпин. Курс высшей алгебры. М., Учпедгиз, 195-5. 26 Е. С. Л я п и н, А. Е. Е ь с е е з, Алгебра и теория чисел, Ч. I, Числа. М., «Просвещение», 1974. 446
41. А. И. Мальцев. Алгебраические системы. М., «Наука», 1970. 28 А. И. Мальцев Основы линейной алгебры. М., «Наука», 1970. 29. Ш. X. М и х е л о в и ч. Теория чисел. М., «Высшая школа», 1967. 30. С. И. Новоселов. Специальный курс элементарной алгебры. М., «Высшая школа», 1965. 31. Л. Я. Окунев. Высшая алгебра. М,, «Просвещение», 1966. 32. Л. Я. Окунев. Сборник задач по высшей алгебре. М., «Просвещение», L964. 33. Л. Я. Окунев. Краткий курс теории чисел. М., Учпедгиз, 1956. 34. Ш. П и з о, М. Заманский. Курс математики. Алгебра и анализ. М., «Наука», 1971. 35. М. М. Постников. Теория Галуа. М., Физматгиз, 1963. 36. И. В. Проскуряков. Числа и многочлены. М., «Просвещение», 1965. 37. И. В. Проскуряков. Сборник задач по линейной алгебре. М., «Нау- ка», 1974. 38. М. И. Р о м а к и н. Элементы линейной алгебры и линейного программи- рования. М., «Высшая школа», 1963. 39. В. И. Смирнов. Курс высшей математики. Тт. I—V. М., «Наука», 1974. 40. А. С. Солодовников. Введение в линейную алгебру и линейное про- граммирование. М., «Просвещение», 1966. 41. А. С. Солодовников. Системы линейных неравенств. М., «Наука», 1969. 42. А. К. С у ш к с в и ч. Основы высшей алгебры. ОГИЗ ГИТТЛ, 1941. 43. Д. К. Фаддеев, В. Н. Фаддеева. Вычислительные методы ли- нейной алгебэы. М., Физматгиз, 1963. 44. Д. К. Ф а д д е е в, И. С. С о м и н с к и й. Сборник задач по высшей алгебре. М., «Наука», 1972. 45. С. Н. Черник1)в. Линейные неравенства. М., «Наука», 1968. 46. С. Н. Черников. Об основных теоремах теории линейных неравенств.— Сибкрск. матем. журнал, 1964, № 5. 47. Г. М. Шапиро. Высшая алгебра. М., Гос. учебно- педаг. изд-во, 1936. 48. Г. Е. Шилов. Введение в теорию линейных пространств. Гостехиздат, 1956. 49. Энциклопедия элементарной математики. Т. II. Алгебра. Гостехиздат, 1951- Следует иметь в виду, что многие из указанных книг имели несколько изда- ний. В некоторых случаях предшествующие издания имеют те или иные отличия от последующих. По разделам современной алгебры и теории матриц, помимо указанных книг, имеется обширная монографическая литература.
ИБ № 1504 Евгений Сергеевич Ляпин Александр Евгеньевич Евсеев АЛГЕБРА И ТЕОРИЯ ЧИСЕЛ Часть II Линейная алгебра и полиномы Редактор Г. С. Уманский Художник переплета Б. Л Николаев Художественный редактор Е. Н. Карасик Технический редактор Е. В. Богданова Корректоры Л. П. Михеева, Т. Ф. Алексина Сдано в набор 31- 03. 78 г. Подписало к печать 19. 10. 78 г. 60x90’11®. Типэгр. X" 1. Ли- гари. Печать высекал. Усл. п. л. 28. Уч.-изд. л. 26,67. Тираж 57 000 эка. Зака.» № 653. Цена 1 руб. 10 коп. Ордена Трудового Красного Знамени издательстве «.Просвещение» Государственного комитета Совета Министров РСФСР по делам издательств, полиграфии и книжной торговли. Москва, 3-Я проезд Марьиной рощи. 41. Отпечатано с матриц Саратовского ордена Трудового Красного Знамени полнграфкомбияата на Калининском ордена Трудового Красною Знамени полиграфкомбннате детской литературы им. 50-летия СССР Росглгвполиграфпрома Госкомиздата РСФСР. Калинин, проспект 50 летая Октября, 46.