/
Текст
В. ХОДЖ и Д. ПИДО
МЕТОДЫ
АЛГЕБРАИЧЕСКОЙ
ГЕОМЕТРИИ
ТОМ I
Перевод с английского
Л. И. ГОЛОВИНОЙ и О. Н. ГОЛОВИНА
Под редакцией
А. И. УЗКОВА
и *л
ИЗДАТЕЛЬСТВО
ИНОСТРАННОЙ ЛИТЕРАТУРЫ
Москва —1 954
METHODS
OF
ALGEBRAIC GEOMETRY
by
W. V. D. HODGE and D. PEDOE
VOLUME I
BOOK I: ALGEBRAIC PRELIMINARIES
BOOK II: PROJECTIVE SPACE
CAMBRIDGE
19 4 7
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА
Геометрия алгебраических многообразий высших размерностей
является естественным развитием теории алгебраических кривых и
поверхностей. Ее можно рассматривать также как геометрическую
теорию систем алгебраических уравнений или как геометрический
аспект теории алгебраических функций. Ввиду такой многогранности
предмета изучения, алгебраическая геометрия чрезвычайно богата свя-
связями с самыми различными отраслями математики, причем связи эти
возникают как в постановках вопросов, так и в используемых ме-
методах. .
История алгебраической геометрии своеобразна в том отношении,
что в ней накопление фактического материала намного опережало
„наведение порядка" в смысле достижения надлежащей строгости.
Разрыв здесь настолько значителен, что до сих пор не исчезли
сомнения в правильности многих утверждений и не прекратились
дебаты о том, достаточно или нет то или иное доказательство.
Все это, конечно, крайне затрудняет изучение алгебраической геометрии
по имеющейся литературе.
Сказанного достаточно для того, чтобы понять значение каждой
монографии, имеющей целью изложение той или иной существенной
части алгебраической геометрии на должном уровне строгости. До
последнего времени можно было назвать только две таких моно-
монографии:
1. В. van der Waerden, Einftthrung in die algebraische Geo-
metrie, Berlin, 1939.
2. A. Weil, Foundations of algebraic geometry, New York, 1948.
Первая из этих книг охватывает, однако, лишь наиболее элемен-
элементарнее вопросы алгебраической геометрии, а вторая посвящена исклю-
исключительно теории пересечений и лишь мельком касается других вопросов.
Нужно добавить еще, что книга Вейля сильно загромождена алгебраи-
алгебраическими подробностями, относящимися к случаю многообразий над
1*
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА
полями конечной характеристики, и поэтому мало пригодна для перво-
первоначального ознакомления с предметом.
Монография Ходжа и Пидо, перевод которой предлагается вниманию
советского читателя, выгодно отличается от обеих названных книг как
большой широтой охвата фактического материала, так и разумным
ограничением общности изложения, позволяющим наиболее прямо
подвести читателя к принципиальным вопросам теории и избежать мно-
многих чисто технических трудностей.
Содержание этой монографии распределяется следующим образом.
Первый том содержит алгебраическое введение и теорию проек-
проективных пространств, излагаемую в несколько большем объеме, чем
это действительно нужно в самой алгебраической геометрии.
Второй том посвящен алгебраическим многообразиям в проективном
пространстве. В нем излагается общая теория, а также подробно
исследуются квадратичные и грассмановы многообразия, которые дают
богатый материал, иллюстрирующий общие методы.
В третьем излагается бирациональная теория алгебраических
многообразий.
А. И. Узкое.
ИЗ ПРЕДИСЛОВИЯ АВТОРОВ
Этот том является первой частью работы, имеющей целью познако-
познакомить читателя с основными понятиями и методами современной алге-
алгебраической геометрии. Так как почти каждый вопрос алгебраической
геометрии имеет известные основания для включения в книгу, то для
того, чтобы объем ее не выходил из разумных пределов, пришлось
строго ограничиться описанием общих методов и отказаться от деталь-
детального изложения геометрических свойств изучаемых объектов.
Мы сочли целесообразным посвятить первую часть чисто алгебраи-
алгебраическим вопросам. После вводной главы об основных понятиях алгебры
мы излагаем теорию матриц. Некоторое новшество состоит здесь
в том, что основное тело не предполагается коммутативным. Полу-
Получаемые при этом более общие результаты используются в главах V
и VI при исследовании понятий, на которых основана проективная
геометрия. В главах III и IV, необходимых для следующего тома, изу-
изучаются алгебраические уравнения.
Вторая часть тома посвящена определению и основным свойствам
проективного пространства п измерений. При этом рассматриваются
как алгебраическое, так и синтетическое определения. Теория матриц
над некоммутативным телом используется для доказательства того, что
пространство, определяемое свойствами инцидентности, может быть
реализовано в виде координатного пространства без введения какого-
либо предположения, эквивалентного теореме Паппа. Из-за необходи-
необходимости рассмотрения большого числа частных случаев глава VI оказалась
несколько длинной. В последних частях этой главы объем экономится
за счет того, что „специальный случай" конечной геометрии только
упоминается и проведение некоторых достаточно простых доказательств
предоставляется читателю. Можно надеяться, что это не создаст
каких-либо затруднений. Вторая часть заканчивается чисто алгебраиче-
алгебраическим описанием коллинеаций и корреляций. Указываются некоторые
ИЗ ПРЕДИСЛОВИЯ АВТОРОВ
элементарные геометрические следствия полученных результатов, однако
подробное изучение геометрических вопросов выходит за пределы
наших задач.
Второй том будет посвящен теории алгебраических многообразий
и изучению некоторых геометрических мест, встречающихся во многих
вопросах геометрии.
Кембридж, в. Ходж
ноябрь 1946 г.
Д. Пидо
ЧАСТЬ I
АЛГЕБРАИЧЕСКОЕ
ВВЕДЕНИЕ
ГЛАВА 1
КОЛЬЦА И ТЕЛА
Предполагается, что читатель этой книги знаком с геометрическими
применениями однородных и неоднородных координат в случае, когда
координатами служат действительные или комплексные числа. При
построении геометрии с помощью таких координат результаты полу-
получаются методами алгебры, дифференциального исчисления и т. д. Пред-
Предмет настоящей книги составляют те геометрические результаты, кото-
которые могут быть получены чисто алгебраическими приемами (сюда вхо-
входят многие из результатов, получаемых обычно методами анализа).
Алгебраическими операциями, подлежащими нашему изучению,
являются сложение, вычитание, умножение, деление и решение алге-
алгебраических уравнений. Обычные комплексные числа представляют
собой наиболее привычные элементы, над которыми можно производить
такого рода операции, но существуют множества более общего типа,
в которых можно определить алгебраические операции. Допуская, что
рассматриваемые нами координаты принадлежат такого рода множе-
множествам, можно получить более общую геометрическую систему. Таким
образом мы приходим к определению пространства, более общего, чем
обычное элементарно-геометрическое. Изучение этого пространства и
составляет задачу первого тома настоящей книги.
В этой и следующей главах мы рассматриваем множества элемен-
элементов, в которых определены некоторые или все из перечисленных выше
алгебраических операций. Постепенно мы получим характеристику тех
множеств, элементы которых можно использовать в качестве коорди-
координат. Такие множества известны в алгебре под названием тел. Однако
для того, чтобы получаемая этим путем геометрия строилась по образцу
геометрии, получаемой при использовании комплексных чисел, на рас-
рассматриваемые' тела приходится налагать некоторые ограничения. Мы
будем вводить их постепенно; каждое новое ограничение будет вво-
вводиться только после достаточно далекого, в соответствии с потреб-
потребностями предмета, продвижения при ограничениях, уже введенных ранее.
Математические преимущества такого метода очевидны.
§ 1. Группы
Рассмотрим множество S элементов, которые будем обозначать
через а, Ь, с Произвольное правило, по которому каждой дан-
данной упорядоченной паре не обязательно различных элементов а и Ь
ГЛ. I. КОЛЬЦА И ТЕЛ А
из 5 сопоставляется однозначно определенный элемент с из S, назы-
называется законом композиции, заданным в S. Непустое множество 5
элементов с законом композиции, удовлетворяющим некоторым изло-
изложенным ниже условиям, называется группой.
Мы будем обозначать элемент, поставленный в соответствие паре
элементов а и Ъ (в заданном порядке), через ab; если этим элементом
является элемент с множества S, то будем писать
ab = с.
ab есть однозначно определенный элемент множества S; он может быть
при этом отличным от элемента да.
Закон композиции называется ассоциативным, если для любых
трех элементов а, Ь и с из 5 выполняется равенство
(ab) c = a (be).
Соответствующий элемент мы будем обозначать через abc.
Условия, при которых множество 5 с заданным законом композиции
представляет собой группу, состоят в следующем:
(I) закон композиции ассоциативен;
(II) для каждых двух элементов a, b из S существуют в 5 такие
элементы х и у, что
ах = b и уа = Ь.
В качестве примера группы рассмотрим всевозможные перестановки
чисел 1, 2, 3. Если а, р, f — какая-нибудь из этих перестановок,
то операцию замещения чисел 1, 2, 3 соответственно числами а, р, -г
обозначим символом
'1 2
Эта операция называется подстановкой рассматриваемых элементов.
Последовательное проведение любых двух из шести возможных
подстановок эквивалентно некоторой одной из этих же подстановок;
тем самым в множестве подстановок определен закон композиции.
Если мы обозначим шесть подстановок
1 2 3\ /1 2 3\ /12 3
1 2 ЗУ' U 3 1/' \Ъ 1 2
1 2 3
1 3 2
/1 2 3\ /12 3\
\3 2 1/' \2 1 Ъ)
соответственно через а, Ь, с, d, e, f и условимся обозначать результат
проведения сначала подстановки х, а затем подстановки у через ху,
то закон композиции будет полностью задан следующей таблицей
с двумя входами, где на пересечении строки, соответствующей, под-
§ 1. ГРУППЫ И
становке х, и столбца, соответствующего подстановке у, стоит под-
подстановка ху:
a b с d e f
а
b
с
d
е
f
а
b
с
d
е
f
b
с
а
f
d
е
с
а
b
е
f
d
d
е
f
а
b
с
е
f
d
с
а
b
f
d
e
b
с
a
Из таблицы или непосредственно из определения легко усматри-
усматривается ассоциативность закона композиции. Далее, так как каждая
строка содержит все шесть элементов, то уравнение
цсегда разрешимо; аналогичный вывод для уравнения
вытекает из того факта, что каждый столбец содержит все шесть
элементов. Следовательно, рассматриваемые подстановки образуют
группу относительно указанного закона композиции.
Заметим, что в этой группе bd = e, в то время как db=f. Таким
образом, равенство ху=ух справедливо не для всех пар элементов
группы. Такие группы называются некоммутативными. Если в не-
некоторой группе всегда справедливо равенство ху—ух, то группа
называется коммутативной, или абелевой. Простым примером абелевой
группы является множество всех целых чисел с обычным сложением
в качестве закона композиции.
Для коммутативных групп часто бывает удобнее пользоваться адди-
аддитивной символикой для закона композиции и писать а-\-Ь вместо ab.
В таких случаях и саму группу мы будем называть аддитивной.
Отметим, что этот способ записи никогда не применяется для не-
некоммутативных групп.
Выведем теперь некоторые свойства, общие для всех групп. Из
условия (Н) следует, что для произвольного элемента а существуют
такие элементы е и /, что
ае = а, fa = a.
Пусть b — произвольный элемент группы S. Тогда существуют такие
элементы cud, что
ас = Ь и da = b.
В силу условия (I), мы имеем
fb = f{ac) = (fa) c^ac =
J2 ГЛ. I. КОЛЬЦА И ТЕЛА
В частности, полагая сначала b=f, а затем Ь = е, мы получаем, что
fe—f и fe = e. Следовательно, e = f. Из допущения, что существует
другой элемент е' со свойствами элемента е, вытекают равенства
е'е = е' и е'е = е;
поэтому элемент е является единственным. Таким образом, мы дока-
доказали существование в группе единственного элемента е, обладающего
тем свойством, что
ае = еа = а
для каждого элемента а группы. Элемент е называется единицей
группы. В случае аддитивной группы его называют нулем и обозна-
обозначают через 0.
Рассмотрим теперь уравнение
где а — произвольный элемент группы, а е — единица. В силу усло-
условия (II), это уравнение имеет решение х. Для него
хах — хе = х.
Следовательно, элемент f — ха обладает тем свойством, что/х = х
при рассматриваемом х. Но тогда рассуждения, аналогичные прове-
проведенным выше, показывают, что fb — b и для произвольного эле-
элемента b группы. Действительно, пусть с — элемент, удовлетворяющий
уравнению хс =¦ Ь. Тогда
fb = fxc = xc — b.
При b=^e отсюда следует, что/ = е. Таким образом, ха = е. Пусть
у — произвольный элемент, обладающий тем свойством, что
ау = е =уа.
Тогда
у = уе = уах = ех — х.
Следовательно, х однозначно определяется уравнениями
ах = е — ха.
Этот элемент х называется обратным к а и обозначается через а.
(В случае аддитивной группы он называется противоположным к а и
обозначается через —я. В этом случае вместо Ь-\-( — а) мы будем
писать b — а.)
Теперь мы покажем, что уравнения
ах = b, ya = b
при произвольных элементах а и b определяют элементы х и у одно-
однозначно.
§ 1. ГРУППЫ 13
Действительно,
х = ex = а~1 ах = а~г b
и
Поэтому элементы х и у определены единственным образом. В част-
частности, уравнение
а~х х — е
имеет единственное решение. Но
д-1 а — е;
таким образом, этим решением является х = а. Следовательно,
В случае аддитивной группы это соотношение принимает вид
Непустое подмножество s группы S также может быть группой
относительно закона композиции, определенного в 5. Такое подмно-
подмножество называется подгруппой группы S, Следующие условия, очевидно,
необходимы и достаточны для того, чтобы подмножество s являлось
подгруппой: '
(I) если s содержит элементы s и ft, то оно содержит и ab;
(II) если s содержит элемент а, то оно содержит ив.
Мы закончим настоящий параграф кратким описанием очевидного
обобщения приведенного выше примера группы, а именно, описанием
симметрической группы, элементами которой являются подстановки
чисел 1, 2, 3, .... я.
Закон композиции вводится здесь так же, как в рассмотренном
примере. Важной подгруппой этой группы является знакопеременная
группа. Для выделения знакопеременной группы воспользуемся много-
многочленами от п неизвестных хи ..., хп, которые мы будем изучать
подробно в § 5. Рассмотрим многочлен
*i — **) (I, Л=1. 2,..., л).
Легко видеть, что при любой перестановке индексов I, 2,..., я
многочлен А либо остается неизменным (с точностью до порядка со-
сомножителей), либо превращается в — Д. Подстановки, оставляющие Д
инвариантным, называются четными, остальные нечетными. Транс-
Транспозиция, т. е. подстановка, переставляющая только два индекса,
очевидно, является нечетной. Каждую подстановку можно рассматри-
рассматривать как произведение транспозиций. Такое разложение подстановки
в произведение транспозиций неоднозначно, однако четность или
нечетность числа транспозиций для данной подстановки не зависит
14 ГЛ. I. КОЛЬЦА И ТЕЛА
от способа разложения. Произведение двух четных или двух не-
нечетных подстановок четно; произведение четной подстановки на не-
нечетную является нечетной подстановкой. Следовательно, множество
всех четных подстановок симметрической группы представляет собой
подгруппу; ее называют знакопеременной группой. Число четных
подстановок симметрической группы равно числу нечетных подста-
подстановок.
§ 2. Кольца
Для элементов некоторого множества может быть задано несколько
законов композиции. В частности, нам придется иметь дело с мно-
множествами, в которых определены два закона композиции, причем по
одному из них эти множества представляют собой коммутативные
группы. Такую группу мы будем записывать аддитивно, рассматри-
рассматривая соответствующий закон как закон сложения. Нуль аддитивной
группы называется нулем рассматриваемого множества.
Второй закон композиции мы будем называть законом умноже-
умножения, а результат применения этого закона к элементам а и b —
произведением ab. Умножение не обязано быть коммутативным, но мы
будем требовать, чтобы оно подчинялось ассоциативному закону.
Умножение называется дистрибутивным относительно сложения, если
a(b~\-c) = ab-\-ac и (b -j- с) а ~ Ьа -\- са
для любых элементов я, Ь, с рассматриваемого множества.
Кольцом называется множество элементов с двумя законами компо-
композиции, сложением и умножением, обладающее следующими свойствами:
(I) это множество представляет собой аддитивную группу относи-
относительно сложения;
(II) умножение ассоциативно и дистрибутивно относительно сло-
сложения.
Приведенные ниже примеры показывают разнообразие возможно-
возможностей, которые могут представиться при изучении колец (в первых
четырех примерах законами композиции элементов являются обычные
сложение и умножение чисел):
(а) Множество всех комплексных чисел.
(б) Множество всех целых действительных чисел.
(в) Множество всех четных чисел.
(г) Множество всех целых чисел, приведенных по модулю т (где
т — некоторое натуральное число).
(д) Множество всех квадратных матриц порядка q с комплексными
элементами, т. е. таблиц вида
§ 2. КОЛЬЦА.
15
где все а^ — комплексные числа. Сложение матриц определяется пра-
правилом
/Q Q О
-iq\ /Pu Pl2 ••• Pi,
ао„ \ , I p21 p22 ... P2
«t
а умножение — правилом
/au ot18 ;. . alg\ /pn pi2 ..
«21 a22 • • • a2? I I Pal P29 ¦ •
a«2 ¦ • • aqq' Wq\ P72
где
. 3,
flu Tie
T21 T22
Pql P72 • • • Y
qq
\Tgl Tg2
Tw
»=1
Читатель может легко проверить, что все эти множества действи-
действительно являются кольцами относительно указанных законов сложения
и умножения. Дальнейшее изучение этих примеров обнаруживает не-
некоторые свойства, присущие многим, хотя и не обязательно всем
кольцам.
A) В примерах (а), (б), (в) и (г) нулем кольца является число 0.
В примере (д) нулем служит нулевая матрица:
0 =
/О 0... 0\
О 0 ... О
Во всех пяти случаях
\0 0... О/
аО = Оа = О
для любого элементата.
B) Обозначим в примерах (а), (б) и (г) через е число 1, а в при-
примере (д) положим
И
16 ГЛ. I. КОЛЬЦА И ТЕЛА
во всех этих случаях е обладает свойством, которое выражается равен-
равенством
ае = еа = а,
справедливым для каждого элемента а соответствующего кольца.
В дальнейшем мы покажем, что если такой элемент е существует,
то он единственен. Он называется единицей кольца. В примере (в)
кольцо не обладает единицей.
C) Во всех примерах, кроме последнего, умножение коммутативно.
В примере (д) оно некоммутативно, так как при q > 1
0...0
О 0 ... О
в то время как
/ап 0 ... О
а21 0 ... О
\0 0...0/ \aql О ...О
D) В примерах (а), (б) и (в) из равенства
где а и b — элементы соответствующего кольца, следует, что по
крайней мере один из этих элементов равен 0.
Кольцо (г) обладает этим свойством в том и только в том случае,
если т — простое число. Если m = pq, где рф\ и qф\, то р и q
представляют собой два ненулевых элемента кольца, для которых
pq=O в этом кольце. С другой стороны, если т просто и ab = 0, т. е.
ab = cm,
то, в силу единственности разложения обычных натуральных чисел
на простые множители, хотя бы одно из чисел a, b делится на т.
Рассматриваемым свойством не обладает кольцо (д), если <7 > 1-
Действительно,
'1 0 ... 0\ /0 0 ... 0\
\о о... о/ \о о... о/
в то время как ни один из сомножителей не является нулем кольца.
E) В примере (а) каждому отличному от нуля элементу а кольца
соответствует единственный обратный элемент а~1, т. е. такой, что
аа~г = а~1 а — е.
% 2. КОЛЬЦА 17
Кольца (б) и (д) не обладают таким свойством, а кольцо (г) обладает
им, как нетрудно показать, лишь при простом т. Это свойство ока-
оказывается бессодержательным в примере (в), так как в этом случае
кольцо не имеет единицы.
F) Если мы введем обозначения
а-\-а = 2а,
и рассмотрим элементы а, 2а, За, ... (а ф 0), то легко установим,
что все эти элементы различны во всех случаях, кроме случая (г),
в котором для всех элементов а кольца
Заметим, что только свойство A) оказалось присущим всем пяти
рассматриваемым кольцам.
Докажем теперь, что этим свойством, заключающимся в том, что
для нуля 0 кольца равенство аО = Оа = 0 выполняется при любом
элементе а кольца, обладают вообще все кольца, и выведем ряд
других элементарных результатов, справедливых для любых колец.
Пусть а и b — произвольные элементы некоторого кольца R,
а 0 — нуль того же кольца. Тогда
откуда
ba = b
и
ab = (я + 0)* = ab -j-Ob.
В силу единственности нуля в кольце, мы заключаем отсюда, что
Ь0 = 0Ь = 0;
эти равенства справедливы для любого элемента b из R.
Далее, ¦ мы знаем, что уравнение
а-\-х = Ь
имеет в R единственное решение
х = Ь-\-{ — а) = Ь — а.
Но
а (Ь — с) -|- ас — а (Р — с-\-с) = ab\
следовательно,
а (р — с) = ab —-ас
и аналогично
(Ь — с)а = Ьа — са.
Отсюда, полагая b = 0, получаем равенства
а{—с) = — ас, (—с) а — — са
2 Зак. 1230. В. Ходж и Д. Пидо
18 f л. t. кольца И тел А
для любых элементов а, с из R. Далее,
(-а) {-Ь) -аЪ = (—а) {—Ь) + (-«) Ъ = (-a) (-b+b) = (-«) 0 = 0,
и поэтому
(—я) (—*)== аЪ.
Тем самым мы доказали, что обычные мультипликативные свойства
знака минус сохраняются в произвольном кольце.
Теперь мы определим соотношение между двумя кольцами, изве-
известное под названием изоморфизма. Пусть R и R*—два кольца,
и пусть каждому элементу а кольца R соответствует однозначно
определенный элемент а* кольца R* и, наоборот, каждый элемент а*
кольца R* является образом точно одного элемента а кольца R. Такое
соответствие называется взаимно однозначным.
Пусть, кроме того, это соответствие таково, что если элементам
a, b соответствуют элементы а*, Ь*, то сумме а-\-Ь соответствует
а*-\-Ь* и произведению ab соответствует а*Ь*. Такое соответствие
называется изоморфизмом.
Изоморфизм колец принадлежит к классу соотношений, носящих
общее название соотношений эквивалентности. Рассмотрим неко-
некоторое множество 5 элементов a, {J, f. • • • и предположим, что между
этими элементами определено некоторое соотношение, которое мы
будем обозначать знаком <~, причем для каждых двух элементов а, C
из 5 известно, имеет ли место это соотношение между ними или нет.
Если рассматриваемое соотношение
(I) рефлексивно, т. е. а"»' а для всех а из 5,
(И) симметрично, т. е. из а~|3 всегда следует j3~a,
(HI) транзитивно, т. е. из a—р и J3 — f всегда следует a~']f,
то оно называется соотношением эквивалентности.
Каждое соотношение эквивалентности разбивает множество 5 на
классы, попарно не имеющие общих элементов и такие, что если два
элемента принадлежат одному классу, то они эквивалентны, и, напро-
напротив, никакие два элемента, принадлежащие различным классам, не
эквивалентны. Каждый элемент множества 5 принадлежит одному из
классов.
Легко проверяется, что если под 5 понимать множество всех ко-
колец, а под соотношением a~p — изоморфизм между кольцами аир,
то это соотношение будет соотношением эквивалентности. Мы будем
иногда называть два изоморфных кольца эквивалентными, подчерки-
подчеркивая этим возможность замены при проведении определенных рассуж-
рассуждений одного кольца другим, изоморфным ему (с необходимыми
естественными заменами при таком переходе).
Подмножество 5 кольца R называется подкольцом кольца R, если
элементы, входящие в 5, образуют кольцо относительно операций
сложения и умножения, действующих в R. Для этого необходимо и
§ 2. кбльЦА
достаточно, чтобы вместе с а и b подмножеству 5 принадлежали
элементы а — b и ab.
Если 5 — подкольцо кольца R, то говорят, что R является рас-
расширением кольца S. Следующая теорема имеет много применений:
Теорема I. Если А и В*—два кольца и А изоморфно не-
некоторому подкольцу В кольца В*, то существует расширение А*
кольца А, изоморфное кольцу В*, причем этот изоморфизм вклю-
включает в себя исходный изоморфизм между А и В.
Обозначим через С произвольное множество, для элементов кото-
которого может быть установлено взаимно однозначное соответствие Г
с элементами кольца В*, лежащими вне В. Рассмотрим множество А*,
состоящее из элементов множеств А я С. Нам нужно ввести в Л*
операции сложения и умножения так, чтобы А* стало кольцом с
требуемыми свойствами. Пусть ах, а2, ... —элементы множества А*.
Каждому й< соответствует однозначно определенный элемент Ь{ из В*.
Если а4 лежит в А, то элемент bt принадлежит В и соответствует а(
при заданном изоморфизме между А и В. Если же at принадлежит С,
то Ь{ является тем элементом, лежащим в В* и вне В, который отве-
отвечает at при соответствии Г. Обратно, каждому элементу bt из В*
соответствует единственный элемент а4 из А*. Если теперь ах и д2 —
два произвольных элемента из А*, то их сумму ах -f- Д2 и произведе-
произведение аха% мы определим следующим образом. Элементам ах и д2 со-
соответствуют элементы bt и Ь% из В*. Пусть
и пусть д3 и а4 —те элементы из А*, которые соответствуют эле-
элементам Ьь и bv Тогда мы положим, по определению,
а1 4" «2 = fl8> Я1а2 = «4-
Очевидно, что тем самым Л* превращается в кольцо, изоморфное
кольцу В*. Кроме того, из построения видно, что А оказывается
подкольцом этого кольца А*. Итак, А* обладает всеми требуемыми
свойствами.
Мы закончим настоящий параграф описанием некоторых частных
типов подколец, с которыми нам придется встречаться в дальнейших
главах. Пусть R — произвольное кольцо, а /—его подмножество,
обладающее следующими свойствами:
(I) если а и b принадлежат /, то и а — b принадлежит /;
(И) если а принадлежит /, а г — произвольный элемент кольца R,
то га принадлежит /.
Если эти условия выполняются, то мы будем называть / левым
идеалом кольца R; для определения правого идеала надо в (II) за-
заменить га на аг. Левый и правый идеалы совпадают, если умножение
в кольце R коммутативно.
Если идеал / не пуст, то он является подкольцом кольца R:
действительно, если г принадлежит /, то условия (I) и (II) превра-
2*
ГЛ. 1. КблЬЦА И ТЕЛА
щаются в отмеченные выше (стр. 19) условия, необходимые и доста-
достаточные для того, чтобы подмножество / было подкольцом. С другой
стороны, не все подкольца являются идеалами, так как условие (II)
для подколец не всегда выполняется.
Само кольцо R служит своим собственным идеалом — так назы-
называемым единичным идеалом. Подмножество кольца R, состоящее из
одного нуля, также является идеалом. Эти два идеала называются
обычно несобственными идеалами кольца R. Примером кольца,
имеющего собственный идеал, может служить кольцо целых чисел
[см. рассмотренный выше пример (б)]. Действительно, если т — произ-
произвольное целое число, большее 1, то множество / всех целых чисел
вида та, где а пробегает все целые числа, представляет собой, оче-
очевидно, собственный идеал этого кольца.
Наличие идеала / в кольце R дает нам возможность определить
некоторое соотношение эквивалентности в R. Пусть а, Ь — элементы
кольца R; мы будем писать
а-*(/),
если а — b лежит в /. Читатель может легко проверить, что этим
действительно установлено соотношение эквивалентности. Этот тип
эквивалентности будет в дальнейшем часто встречаться.
§ 3. Классификация колец
Кольца, не подчиненные никаким другим условиям, помимо тех,
которые входят в определение кольца, данное в § 2, являются на-
настолько общими, что не могут представлять особого интереса в алге-
алгебраической геометрии. Мы будем ограничивать класс рассматривае-
рассматриваемых колец путем наложения на них дополнительных условий, кото-
которые на самом деле эквивалентны требованию, чтобы кольца обладали
одним или несколькими из свойств B) — F), найденных нами в § 2
при рассмотрении приведенных там примеров колец. Различные огра-
ограничения приводят к кольцам с существенно различными свойствами.
Рассмотрим несколько наиболее важных типов колец.
Мы видели, что кольцо R может обладать или не обладать таким
элементом е, что
еа = ае = а
для каждого элемента а из R. Теперь мы покажем, что R не может
обладать двумя различными элементами е, f с этим свойством.
Действительно, если еа = а, bf = b для всех элементов a, b из R,
то мы можем, в частности, положить а = /, Ь = е; тогда мы полу-
получим равенства
Если в R такой единственный элемент е существует, то он назы-
называется единицей кольца R. В дальнейшем мы будем предполагать,
§ 3. КЛАССИФИКАЦИЯ КОЛЕЦ 21
что все рассматриваемые кольца обладают единицей (если только явно
не оговорено противное). Условимся обозначать единицу кольца через е.
Если ' а — элемент кольца R с единицей, то либо существует,
либо не существует обратный элемент а:
аа~х = а~1а = е.
Однако а не может иметь двух различных обратных элементов, так
как если
ах = е,
то
а~гах — а~*е,
т. е.
х — а~1.
Элемент а, для которого существует обратный элемент а, называется
регулярным элементом кольца, или делителем единицы. Очевидно,
что е и —е всегда являются делителями единицы. С другой стороны,
нуль 0 кольца не может являться делителем единицы, так как для
любого элемента а из R
«0 = 0.
Далее, мы видели (§ 2, пример (г)], что существуют кольца R,
обладающие такими парами отличных от нуля элементов а и Ь, для
которых
В этом случае элемент а называется левым делителем нуля, а эле-
элемент b ¦— правым делителем нуля. Делитель нуля не может являться
регулярным элементом. Действительно, если а обладает обратным
элементом, в, то
? = a~1ab = а 0 = 0,
вопреки нашему предположению, что b ф 0. Подобным же образом
и b не может быть регулярным.
Мы будем особенно часто иметь дело с двумя типами колец:
областями целостности и телами. Областью целостности назы-
называется коммутативное кольцо с единицей, не имеющее делителей
нуля. Из примеров, приведенных в § 2, области целостности мы
имеем в случаях (а) и (б), а также в случае (г), когда т есть простое
число.
Тело определяется как кольцо с единицей, в котором каждый
элемент, отличный от нуля, регулярен. Кольцо всех комплексных
чисел, очевидно, является телом. В силу сказанного выше, тело не
имеет делителей нуля. Коммутативное тело, т. е. тело, в котором
умножение коммутативно, называется полем. Поле является, очевидно,
областью целостности.
Мы будем иметь возможность в конце концов ограничиться рас-
рассмотрением лишь коммутативных колец; однако нам необходимо
22 ГЛ. I. КОЛЬЦА И ТЕЛА
получить некоторые результаты, относящиеся к некоммутативным коль-
кольцам, так как эти результаты будут использованы при анализе посту-
постулатов, на которых обычно базируется проективная геометрия. Поэтому,
если не сделано специальных оговорок, мы не будем предполагать
рассматриваемые кольца коммутативными.
Пусть а — произвольный элемент кольца R. Выпишем элементы
Заметим, что па — не произведение, а сумма п элементов, каждый из
которых равен а. Мы видели на одном из примеров, что существуют
кольца R, для всех элементов которых
та —О,
где т— некоторое натуральное число.
Пусть теперь R — кольцо с единицей е. Предположим, что для
некоторого натурального п
пе = 0.
Пусть т — наименьшее натуральное число, удовлетворяющее этому
условию. Тогда, прежде всего, для произвольного элемента а кольца R
та — а-\-а-\-... -\-а = еа-\-еа-\- ... -\-еа =
= (е -\-e-\- .. .-\-е)а = (те) а = 0.
Далее, если число т не является простым, т — pq, то ре Ф 0, qe Ф 0
причем
ре • qe = pqe = me = 0;
Таким образом, R обладает делителями нуля. Число т называется
характеристикой кольца R. Мы доказали, что характеристикой
(если таковая существует) области целостности (или тела) служит
обязательно простое число. Если в кольце R для всех отличных от
нуля целых чисел п
пе ф 0,
то R называется кольцом без характеристика.
Пусть R — кольцо характеристики т с единицей; тогда его под-
подмножество
О, е, 2е (т— \)е
образует подкольцо. Действительно,
ае — Ье*={а — Ь) е = се,
где с э а — Ь (mod m), и
(ае) (be) = de,
где d s= ab (mod m). Таким образом, R содержит подкольцо, изоморф-
изоморфное кольцу вычетов кольца целых чисел по модулю т. Отсюда,
§ 4. ПОЛЕ ЧАСТНЫХ ОБЛАСТИ ЦЕЛОСТНОСТИ 23
согласно теореме I § 2, следует, что существует расширение этого
кольца вычетов, изоморфное кольцу R.
Подобным же образом, если R — кольцо без характеристики, то
оно изоморфно некоторому расширению кольца целых чисел. Следо-
Следовательно, кольцо без характеристики содержит бесконечно много
элементов.
Во всех случаях мы будем идентифицировать R с изоморфным
ему образом и обозначать единицу области целостности или тела
через 1.
Позднее мы ограничимся рассмотрением исключительно областей
целостности и тел без характеристики; однако сейчас мы этого
ограничения вводить не будем.
§ 4. Поле частных области целостности
Хорошо известно, что область целостности, состоящая из целых
чисел, лежит в некотором поле, а именно, в поле рациональных чисел.
Этот факт содержится в общей теореме, которой мы будем часто поль-
пользоваться:
Теорема I. Для каждой области целостности I существует
поле К, содержащее I в качестве подкольца.
Конструкция, которую мы осуществим, приводит к построению
минимального поля, обладающего требуемым свойством. Это мини-
минимальное поле определяется однозначно с точностью до изоморфизма.
Обозначим элементы области целостности / через а, Ь, с, ...,
нуль и единицу — через 0 и 1. Рассмотрим множество всех упоря-
упорядоченных пар (а, Ь), в которых b Ф 0 („допустимых пар"), и определим
в этом множестве соотношение ~, полагая
(a, b)~(c, d)
для таких пар, для которых
ad — be — 0.
Из коммутативности умножения в / непосредственно следует рефлек-
рефлексивность и симметричность введенного соотношения. Оно является
также и транзитивным. Действительно, если
(a, b)~(c, d) и (с, d)~(e, /),
т. е.
ad = bc и cf = de,
то
adf = bcf=bde,
откуда
d(af—be) = 0.
24 ГЛ. I. КОЛЬЦА И ТЕЛА
Так как область целостности не содержит делителей нуля, а эле-
элемент d служит вторым элементом пары и потому отличен от нуля, то
af=be,
(а, Ь)~{е, /).
Итак, введенное нами для пар элементов соотношение является соот-
соотношением эквивалентности и, следовательно, разбивает все множество
пар на классы эквивалентных пар. Класс, к которому принадлежит
пара (а, Ь), мы будем обозначать символом [а, Ь], или [с, d], если
(a, b)~(c, d).
Определим сумму двух пар (а, Ь) и (с, d) равенством
(а, b) + (c, d) = (ad-\-bc, bd).
По условию, b и d отличны от нуля. Следовательно, и bdфO. Тем
самым пара, определенная как сумма двух исходных пар, оказывается
допустимой. Введенное сложение пар, очевидно, коммутативно. Далее,
если
(a, b)~(a', b') и (с, d)~(c', d'),
то
(a', b')-\-(c', d') = (a'd'-\-b'cr, b'd')~(ad-[-bc, bd),
так как
(ad -f- be) b'd' — (a'd' + b'c') bd = (ab' — a'b) dd'-\-(cd' — c'd) bb' = O.
Следовательно, мы имеем право определить сложение классов,
положив
[a, b\ + [c, d] = [ad + bc, bd].
В силу равенства
(la, b] + lc. <Ч)-И«. f]=*ladf+bcf+bde,
= \а,
сложение классов ассоциативно. Далее, уравнение
[a, b] + x = [c, d]
имеет решение
х = [Ьс — ad, bd].
Таким образом, классы образуют коммутативную группу по сложе-
сложению. Нулем этой группы является класс [0, 1] = [0, а], где в качестве а
может фигурировать любой отличный от нуля элемент из /.
Определим теперь умножение пар с помощью равенства
(а, *) (с, d) = (ac, bd).
§ 4, ПОЛЕ ЧАСТНЫХ ОБЛАСТИ ЦЕЛОСТНОСТИ 25
Коммутативность введенного умножения очевидна. Далее, если
(а, *)~(«', Ь') и (с, d)~(c', d'),
то
(aV, Vd')~(ac, bd),
так как
a'c'bd — acVd1 = («'? — ab') c'd + (c'd — cd') db' = 0.
Тем самым обоснована возможность определения умножения классов
с помощью равенства
[а, Ь\ [с, d] = [ас, bd].
Непосредственно доказывается ассоциативность этого умножения.
Поскольку же
[a, Ь]{[с, d] + [e. /]) = [а, b\[cf+de, df] = [ac/+ ade, bdf] =
= [abcf-\- abde, b*df\ = [ac, bd\ -j- [ae, bf\ =
умножение оказывается и дистрибутивным относительно сложения.
Таким образом, множество классов эквивалентных пар относительно
введенных операций сложения и умножения представляет собой ком-
коммутативное кольцо. Обозначим его через К*.
Пусть а — произвольный отличный от нуля элемент из /; тогда
(а, «)~A, 1)
и, следовательно,
[а, а] = Ц. 1].
Равенство
[а, Ь}{1, l] = [a, b]
показывает, что класс [1, 1] играет роль единицы в кольце К*-
Наконец, если [а, Ь] — отличный от нуля элемент кольца К*, то оба
элемента а и b отличны от нуля. Поэтому можно говорить и
и классе [Ь, а]. Далее,
[*, а)[а, Ь\ = \аЬ, ab] = [l, 1],
а это означает, что каждый отличный от нуля элемент из К* имеет
обратный. Следовательно, К* есть поле.
Рассмотрим теперь элементы поля К*, имеющие вид [а, 1]. Под-
Подмножество, образуемое ими, обозначим через 5. Поскольку
[a, U — [b, l] = [a — b, 1] и [a, \][b, \\ = \ab, 1],
множество 5 является подкольцом поля К*, изоморфным /. Следо-
Следовательно, по теореме I § 2, существует расширение К области
целостности /, изоморфное К* и являющееся поэтому полем. Элемент
поля К, соответствующий элементу [а, Ь] поля К*, обычно обозна-
26 ГЛ. I. КОЛЬЦА И ТЕЛА
чают через alb. Если
то
ad = be.
Далее,
т—•
Таким образом, поле К удовлетворяет всем поставленным требова-
требованиям. Оно обычно называется полем частных области целостности /.
Для окончания доказательства, нашей теоремы остается показать, что
каждое поле К', содержащее / в качестве подкольца, содержит под-
подполе, изоморфное полю К. Прежде всего заметим, что отличные
от нуля элементы поля К', по определению поля, образуют группу
относительно умножения. Следовательно, уравнение
где а и b — элементы из К', имеет единственное решение в К'. Мы
теперь покажем, что решения уравнений
Ьх = а и dx = c,
где а, Ь, с, d лежат в / и b, d отличны от нуля, совпадают в том
и только в том случае, когда
ad = be.
Во-первых, если это условие выполнено и дг — решение первого
уравнения, то
bdx = ad = be,
откуда
b(dx — c) = 0,
т. е.
dx = c.
Наоборот, если рассматриваемые уравнения имеют общее решение дг,
то
ad = bdx = be.
Таким образом, каждому элементу дг из К', удовлетворяющему урав-
уравнению
Ьх = а,
где a, b принадлежат /и bф0, однозначно соответствует элемент а/Ь
из К, и наоборот. Более того, если дг соответствует alb, а у соот-
соответствует cjd, то
Ьх = а и dy = c.
Отсюда вытекает, что
§ 5. КОЛЬЦО МНОГОЧЛЕНОВ 27
и
bdxy = ас.
Следовательно, х-\-у соответствует а/Ь-\-с/с1, а ху соответствует
(a/b)(c/d). Тем самым доказано, что поле К' содержит подполе,
изоморфное К.
Из этой теоремы мы заключаем, что К является минимальным
полем, содержащим / в качестве подкольца.
Наконец, отметим, что если характеристика кольца / равна р, то
для р слагаемых
1 + 1 + -.. + 1=0;
следовательно,
[1, 1] + [1, 1]+...+[1, 1] = 0,
т. е. характеристика поля К также равна р. С другой стороны, если
/—кольцо без характеристики, то
[1, 1]+п, Н+...+П, i] = [i + i + ... + i, imo, и,
т. е. К—поле без характеристики.
§ 5. Кольцо многочленов
Мы познакомимся теперь с методом расширения колец путем при-
присоединения некоторого элемента дг, называемого неизвестным. При
этом единственным случаем, с которым нам придется встречаться
далее, является случай, когда исходным кольцом служит область
целостности. Поэтому ради простоты мы будем предполагать в этом
параграфе,' что основным кольцом, от которого мы отправляемся,
является область целостности /.
Рассмотрим упорядоченные системы
(«о» йк • • • > аг)>
каждая из которых состоит из конечного числа элементов аг кольца /.
Две системы
(во> Й1 аг) и (V *i bs)
будем называть эквивалентными, если
ai = bi {i= I, 2 min(/-, s)),
a( = 0 (i = s+l г при r>s),
b{ = 0 (/ = /-+1 s при s>r),
Очевидно, что это соотношение рефлексивно, симметрично и тран-
зитивно, т. е. является соотношением эквивалентности. Определим
сложение двух систем с помощью равенства
(«о. ai <*r) + (*0> h *«) = (<:о» ci с«)>
где f = max(r, s), ci = ai-\- Ьг и считается, что а4 = 0 для / > г
и bi = 0 для i > s. Легко видеть, что при замене каждой из двух
28 ГЛ. 1. КОЛЬЦА И ТЕЛА
систем на эквивалентную их сумма также заменится на эквивалентную
систему. Умножение двух систем определим равенством
К' а1 «г)(*0> *1> '••> *e) = (do> dl dr+a).
где
причем, как и выше, нужно считать а< = 0 для / > г и ^ = О
для i > s. При замене систем на эквивалентные произведение исход-
исходных систем также переходит в эквивалентную систему. Обращаясь
к рассмотрению классов эквивалентных систем, легко устанавли-
устанавливаем, что они образуют по сложению коммутативную группу, нулем
которой служит класс систем, эквивалентных системе @). Умно-
Умножение классов ассоциативно и дистрибутивно относительно сложе-
сложения. Таким образом, наши классы эквивалентных систем при двух
введенных выше законах композиции образуют кольцо R. Легко
видеть, что класс, содержащий систему A), является единицей этого
кольца.
Построенное кольцо R содержит подкольцо, изоморфное исходному
кольцу /. Элементами этого подкольца являются классы • систем,
эквивалентных системам вида (а). Действительно,
и потому требуемый изоморфизм устанавливается условием, что (я)
отображается в элемент а кольца /.
Рассмотрим теперь систему @, 1). Очевидно, что
@, 1J = @, 1)@, 1) = @, 0, 1),
@, 1K = @, 1)^@, 1) = @, 0, 0, 1),
@, 1)» = @, 1)"-1@, 1) = @, 0, 0, .... 1),
где в последней системе единице предшествует п нулей. Поскольку
1)« = @, 0, 0 а),
систему (а0, ах аг) можно записать в виде
(«0, ait .... аг) = (а0) + К)@, 1) + («2)@, 1J+ ...
Обозначим теперь через 1[х] расширение кольца /, изоморфное R
(§ 2, теорема I). Пусть х — элемент этого расширения, соответ-
соответствующий системе @, 1) кольца R. Тогда, как мы только что пока-
показали, система («0, av ..., аг) отобразится в элемент «0 —{— «^^лс —{— .. .
. . . -\-агхг кольца 1[х]. Этот элемент называется многочленом
с коэффициентами а0, аи ..., аг. Если аг ф 0, то говорят, что
многочлен a,Q-\-axx-Y ... -\-arxr имеет степень г.
§ 5. КОЛЬЦО МНОГОЧЛЕНОВ 29
Заметим, что нуль @) кольца R отображается в нуль кольца /
и потому равенство
^0 + «1*+-- • +«»г*Гв0 A)
означает, что
ао = а1 = ... =«г = 0.
Именно это свойство элемента х оправдывает то, что его называют
неизвестным, присоединенным к I.
В записи многочленов мы будем обычно опускать те члены агх1,
в которых at = 0, даже если i меньше степени многочлена. В этом
смысле апхп есть многочлен, полная запись которого выглядит так:
0 -)- 0* + ... + Одгп~! + апхп. Далее, многочлен
можно рассматривать как сумму г -\- 1 многочленов
а0, aLx, ..., a,jc>:
Каждый член а{х* является произведением a.f на X*. Для многочленов
дг, дг2, ... справедливо обычное правило умножения степеней
хРх<г = хР^ч.
Таким образом, кольцо / [х] может быть получено из / введением
нового элемента х, который коммутативно перемножается с любым
элементом кольца /. Мы будем говорить, что /[дг] получено путем
присоединения к I неизвестного дг. /[дг] называется также кольцом
многочленов над I.
Эти результаты справедливы для любого коммутативного кольца /
с единицей. Теперь мы перейдем к выводу свойств кольца /[дг],
связанных с предположением, что /—область целостности.
Теорема I. Если 1.есть область целостности, то 1[х] —
также область целостности.
Как мы уже показали выше, / [лг] — коммутативное кольцо с еди-
единицей. Нам остается доказать, что 1[х\ не содержит делителей нуля.
Если
— два не равных нулю многочлена, то мы можем считать, что
ат Ф 0 и Ьп Ф 0. Тогда
fg = ^о + сгх + ... + ст+пхт+п,
где Сп+т^ атК *? 0, так как / не содержит делителей нуля. Сле-
Следовательно, fg Ф 0. Другими словами, если /§"=0 и / Ф 0, то ?=0.
Таким образом, 1[х] — кольцо без делителей нуля.
Процесс присоединения неизвестного к области целостности
с целью ее расширения может быть продолжен. Если J = I[x1], то
30 i"л. U кбльцА и тела
j\x<i\ есть вновь область целостности. Ее элементами являются много-
многочлены
а0+а1*2+---+«п*2,
где
— элементы из /[#,], a /»— наибольшая из степеней многочленов
а0, 0^ ап. Элементы atj лежат в /. Следовательно, элементы
кольца J[x2] можно записывать в форме
2 2
i=Oj=O
где каждый член a{jxlx{ является коммутативным произведением
множителей «у, х* я х{. Если У' = /[лг2], то элементы J'[хх] имеют
вид
i=Oj=O
Теперь очевидно, что области целостности J[x^] иУ'^] изоморфны.
Мы будем в дальнейшем обозначать их через I[xlt х2].
Продолжая таким образом далее, можно присоединить к области
целостности / неизвестные дг1( д:2, ..., хг. Получаемое при этом
кольцо I[xlt x2, ..., хг] не зависит от порядка присоединения не-
неизвестных. Действительно, каждый элемент этого кольца имеет вид
общий член этой суммы является коммутативным произведением мно-
множителей ai { , *'', ..., х\г.
Далее, 1\хг хг\ есть область целостности. Мы доказали это
утверждение выше для случая присоединения одного неизвестного
к /. Предположим, что оно справедливо для случая, когда присоеди-
присоединяется г—1 неизвестных, так что J — I[xlt ..., х,,^] является
областью целостности. Тогда, по теореме I, это верно и для J[xr].
Остается напомнить, что J[xr.]asl[x1, ..., хг\. Итак, доказана
Теорема II. Если I есть область целостности, то
I[xt хг] — также область целостности.
В заключение настоящего параграфа введем новую важную опе-
операцию над многочленами из 1{х1, ..., хг], называемую специализа-
специализацией. Пусть
п, пг
" t П • я 4| • • • ? 1 Т
IS. кольцо мнбгочлёнбв
—многочлен из рассматриваемой области целостности. Из числа не-
неизвестных xlt ..., хг отберем некоторые, скажем х1 ;сД0<7<>).
Пусть alt ..., a.j — произвольные элементы из /. Тогда, если мы в/
заменим неизвестные хи ..., Xj соответственно элементами а1(..., с^,
то многочлен / перейдет в
где коэффициенты
попрежнему принадлежат /. (Здесь а* является, конечно, произведе-
произведением / множителей, каждый из которых равен а.) Говорят, что мно-
многочлен /* из I[Xj+1, ..., хг] получен путем специализации из
многочлена /, принадлежащего кольцу I[xlt ..., хг]. Для обозначе-
обозначения специализации мы будем употреблять следующую запись:
Если .учесть, что такие равенства, как
выражают по существу лишь определенные соотношения между коэф-
коэффициентами многочленов /,' g, h и k, причем в этих соотношениях
не участвуют неизвестные дг1 хг, то нетрудно заметить, что при
любой специализации неизвестных, при которой
/-+/*, g'-+g*. h^-h*, k-+k*
будут справедливы равенства
Обращение этого результата, конечно, неверно.
Замечание. Мы не рассматривали многочлены, коэффициенты
которых принадлежат некоммутативным кольцам, однако следует
отметить, что теория таких многочленов существует. Единственный
результат этой теории, который нам понадобится, состоит в следую-
следующем. Пусть
где коэффициенты at принадлежат некоммутативному кольцу К,
а х — неизвестное, перестановочное со всеми элементами кольца К.
Тогда для любого элемента а из К существуют такие многочлены
32 гл. 1. кольца й тела
и такие элементы Ьт, ст из К, что
В самом деле, можно положить
. . ... . (г = 0, 1 /и).
§ 6. Алгоритм деления
В этом параграфе / будет обозначать область целостности,
К—поле, а 1[х] и К\х]—кольца многочленов над ними.
Пусть
+
— два многочлена из 1\х] степеней соответственно т и л. Предпо-
Предположим сначала, что Ьп= 1. Тогда очевидно, что
является многочленом из 1[х), имеющим степень т1 < т. Если
< И
то
есть многочлен степени т2 < /и1. Продолжая этот процесс, мы при-
придем к многочлену q степени т — ге, для которого разность
будет многочленом меньшей степени, чем степень многочлена g.
Этот результат можно распространить на случай, когда Ьп—про-
Ьп—произвольный регулярный элемент кольца /. Действительно, если
то
есть многочлен степени п, у которого член с хп имеет коэффициен-
коэффициентом единицу. Как мы знаем, для него существует такой, много-
многочлен q', что разность
является многочленом степени, меньшей п.
Алгоритм деления 33
Покажем теперь, что многочлены q и г, удовлетворяющие ука-
указанному соотношению, однозначно определены. Действительно, если
q' и г1 — какие-нибудь два многочлена, для которых г'=/—(fg,
причем степень г меньше п, то мы имеем
Но степень многочлена г — г' меньше ге, а степень многочлена
(q' — q) g по меньшей мере равна и, если только q' ф q. Следова-
Следовательно, при q' ф q мы получаем равенство между многочленом сте-
степени, меньшей ге, и многочленом степени, не меньшей п. Поскольку
это невозможно, должно быть q = q', а потому и г— г'.
Проведенный выше процесс нахождения многочленов q и г назы-
называется алгоритмом деления.
Непосредственным следствием только что полученного результата
является теорема об остатке. Пусть с — произвольный элемент
из /. Положим g = х — с. Тогда существует такой многочлен q, что
разность
f—q(x — c) = r
принадлежит /. Это равенство сохраняет силу при специализации
х -> с. Следовательно,
'=¦/(').
где /(с) — результат подстановки элемента с вместо х в много-
многочлен /.
Возвращаясь к алгоритму деления, рассмотрим тот случай, когда
/• = 0. Пусть в кольце 1[х\ выбрана такая тройка отличных от нуля
многочленов /, g и q, что
f*=gq.
Многочлены g и q называются делителями многочлена /, а /—
кратным многочлену g и многочлену q. Если степени многочленов
g и q больше нуля, то оба они называются собственными делителями
многочлена /.
Предположим теперь, что / есть поле: 1~К. Так как каждый
отличный от нуля элемент поля регулярен, то алгоритм деления можно
применить к любой паре многочленов /0, Д из К\х\. С помощью
повторного применения алгоритма деления мы построим последова-
последовательность многочленов /2, /3 Степень многочлена Д обозначим
через mt и предположим, что mo^>mv Наша цель состоит в полу-
получении сведений об общих делителях многочленов /0 и Д. Применяя
к /0 и Д алгоритм деления, получим равенство
где т2 < ту Если /2 не равен нулю, то применим алгоритм деления
к Д и /2. При этом мы получим равенство
3 Зак. 1230. В. Ходж и Д. Пндо
34 гл. '• кольцА:И тйлА
Продолжим этот процесс до тех пор, пока не придем к равенству
fa-1 — Qsfa+fs+l»
где fa+1— нулевой многочлен. Этого мы достигнем с помощью не
более чем тг -J- 1 применений алгоритма.
Пусть g— общий делитель многочленов /0 и Д. Тогда, если
to
/2 = h^g, где А2 = Ао —
Аналогично,
/3 = *8?. ГДе А3 = А1 —
и т. д. Наконец,
fs = Kg> где K = he-^ — 4e-iK-v
Таким образом, каждый делитель многочленов /0 и Д является общим
делителем и всех многочленов /2 /„• Наоборот, пусть g-—
делитель многочлена /в. Тогда последовательно получаем:
/в = *.§".
/о =
Таким образом, каждый делитель многочлена /8 является общим
делителем многочленов /0 и fv
Поскольку каждый общий делитель многочленов /0 и /t является
делителем и /в, степень этого общего делителя g не может превос-
превосходить та, т. е. степени многочлена fa. С другой стороны, /в является
делителем самого себя, а следовательно, и делителем многочленов
/о и /j. Эти многочлены имеют, таким образом, общий делитель сте-
степени та и не имеют общих делителей более высоких степеней. Мы
назовем многочлен /в, или а/а, где а — произвольный отличный от
нуля элемент поля К, наибольшим общим делителем многочленов
Алгоритм деления дает возможность следующим образом выра-
выразить /8 через /0 и Д. Мы имеем равенства
к = /0 —
U = Л — Я^ч = — Я Jo + A + ?i<72) Л.
§ е. алгоритм деления
С помощью легко проводимой индукции получаем, что
где а и Ь — многочлены из К\х\.
Если многочлены /0 и ft не имеют общих делителей ненулевой
степени, то мы будем говорить, что /0 и /а являются взаимно про-
простыми элементами из К\х\. В этом случае /и8 = 0 и/8 — отличный
от нуля элемент поля К. Пусть g— обратный ему элемент. Тогда
где Л и В — многочлены из К[х].
Отличный от нуля элемент кольца К[х], не имеющий собствен-
собственных делителей, называется простым элементом, или неприводимым
многочленом. Проведенные выше построения дают возможность дока-
доказать следующую теорему:
Теорема I. Если неприводимый многочлен f из К[х] является
делителем произведения gh двух многочленов из того же кольца,
то f служит делителем одного из множителей.
Пусть, например, / не является делителем g. Тогда степень
любого общего делителя этих двух многочленов меньше степени
многочлена /. Но / неприводим; следовательно, единственными его
делителями, степени которых ниже степени самого /, являются дели-
делители нулевой степени. Это означает, что / и g взаимно просты.
Поэтому существуют такие многочлены а и Ь, что
откуда
h = afh + bgh.
Но /—делитель gh. Это означает, что существует многочлен k,
удовлетворяющий равенству
gh*=fk.
Таким образом,
h = (ah-\-bk)f,
что и доказывает теорему.
Нужно отметить, что термин множитель часто употребляется
в том же самом смысле, что и термин делитель] в частности,
можно говорить о наибольшем общем множителе двух многочленов.
Мы закончим этот параграф теоремой, которая имеет много
приложений. Пусть К* — расширение поля /Си/, g — многочлены
из Klx], а следовательно, и из К*[х]. Если fug рассматривать
как многочлены из кольца К*[х], то алгоритм деления, примененный
к этим многочленам, будет осуществляться целиком внутри под-
кольца К[х]. Следовательно, и процесс нахождения наибольшего
гл. i. кольца и тела
общего делителя / и g как многочленов из К* [х] может быть
осуществлен в пределах кольца К[х]. Таким образом, наибольший
общий делитель многочленов /*и g в К[х] остается их наибольшим
общим делителем и в К* [х] и, наоборот, наибольший общий дели-
делитель многочленов / и g в К* [х] после умножения на соответствую-
соответствующий элемент поля К* оказывается лежащим в К[х] и служит наи-
наибольшим общим делителем многочленов / и g в этом кольце. В част-
частности, справедлива
Теорема II. Если К* есть расширение поля К и f, g — dea
взаимно простых многочлена из К[х], то они взаимно просты и
в К* [х].
§ 7. Разложение на множители в области целостности
Элемент а области целостности / мы условились называть дели-
делителем единицы, или регулярным элементом, если в / для него
существует обратный элемент а~1ш.
Мы видели, что обратный элемент единственен.
Очевидно, что элементы 1 и —-1 всегда являются делителями
единицы области целостности /. Существуют области целостности,
не имеющие других делителей единицы. Таково, например, кольцо
целых чисел. С другой стороны, область целостности, являющаяся
полем, обладает тем свойством, что каждый ее элемент, отличный
от нуля, должен быть делителем единицы. Нам придется впоследствии
воспользоваться следующей теоремой:
Теорема I. Произведение любого конечного числа делителей
единицы области целостности I само является делителем еди-
единицы. Наоборот, если произведение конечного числа элементов
из I есть делитель единицы, то каждый из этих элементов
также есть делитель единицы.
Пусть е1 ег — делители единицы, а в*1, ..., е-1—обратные
к ним элементы. Тогда
Следовательно, е, ... а, есть делитель единицы.
Если а1 ... аг = е — делитель единицы, то аг ... are-1 = l.
Отсюда
t. e. at — также делитель единицы.
Определим теперь термин множитель. Если отличный от нуля
Элемент а из области целостности / можно записать в виде
а = Ьс> A)
§ 7. РАЗЛОЖЕНИЕ НА МНОЖИТЕЛИ В ОБЛАСТИ ЦЕЛОСТНОСТИ 37
где b и с также принадлежат /, то эти элементы Ь, с называются
множителями элемента а, а элемент а — кратным элементов Ь и с.
Если элемент а записан в форме A), то говорят, что он разложен
на множители b и с. Если хотя бы один из множителей есть делитель
единицы, то разложение называется тривиальным. Поскольку каж-
каждая область целостности / имеет по крайней мере один делитель
единицы elf любой элемент из / допускает хотя бы одно тривиаль-
тривиальное разложение
й = е1(е-1а).
Элемент области целостности /, не являющийся делителем единицы,
может как иметь, так и не иметь нетривиальные разложения. Эле-
Элемент, допускающий лишь тривиальные разложения, называется про-
простым элементом области целостности /. (В случае, когда за /
взято кольцо многочленов К[х], простыми элементами будут непри-
неприводимые многочлены ненулевой степени.) Докажем, что если произ-
произведение «j ... аг нескольких элементов из I является простым,'
то один из его множителей — простой элемент, а остальные —
делители единицы. Действительно, если
b = аг .. . аг
и каждый из элементов at — делитель единицы, то делителем еди-
единицы является и элемент Ь (см. теорему I), что противоречит опре-
определению простого элемента. Следовательно, по меньшей мере один
из аи скажем av не является делителем единицы. Тогда, поскольку
b—-простой элемент, разложение
b = <*! (а2 ... аг)
должно быть тривиальным. Но ах не является делителем единицы;
отсюда следует, что я2 ... аг — делитель единицы, а потому, в силу
теоремы I, все а2, а3, ..., аг должны быть делителями единицы.
Говорят, что элемент а области целостности / полностью раз-
разложен, если он выражен в виде конечного произведения
а = а1 ... аг,
п котором каждый множитель а{ — либо делитель единицы, либо
простой элемент. По теореме I, мы можем соединить все множи-
множители, являющиеся делителями единицы, в один элемент, обладающий
тем же свойством. Обозначим его греческой буквой и поставим на
первом месте, так что в записи
<* будет делителем единицы, a ai аг — простыми элементами.
В частных случаях а может, конечно, оказаться равным единице.
Два полных разложения одного и того же элемента
а = а«} ... а,., а = $Ьх ... Ь^
38 ГЛ. I. КОЛЬЦА. И ТЕЛА
называются эквивалентными, если r = s и если после соответствую-
соответствующей перестановки множителей
где Sj sr — делители единицы. Введем, далее, следующее опре-
определение. Область целостности, в которой каждый отличный от нуля эле-
элемент может быть полностью разложен, причем все полные разложения
каждого фиксированного элемента эквивалентны, называется областью
с однозначным разложением.
Хорошо известный пример такой области — кольцо целых чисел.
Мы сейчас приведем пример кольца, в котором не все элементы
будут делителями единицы и которое не будет областью с одно-
однозначным разложением.
Рассмотрим множество 5 комплексных чисел, допускающих запись
вида
где а и р — действительные целые числа.
Нетрудно проверить, что это множество замкнуто относительно
операций сложения и умножения и. представляет собой область цело-
целостности. Эта область целостности является, конечно, подкольцом
кольца всех комплексных чисел. Введем для рассматриваемых чисел
норму, полагая по определению
Очевидно, что Af(a) — всегда неотрицательное число. Легко устана-
устанавливаются следующие свойства этой нормы:
(I) N(a) = 0 тогда и только тогда, когда а = 0;
N(a)=l тогда и только тогда, когда a = =tl;
N(a) ф 2 для всех а из S;
N(a) = 3 тогда и только тогда, когда a = ±Y— 3;
jV(a)=4 тогда и только тогда, когда а = ±:2
Y
или а = rt I rt Y — 3.
(II) N{a)N[b)=*N(ab).
Из последнего свойства вытекает, что если ab=\, то
так как jVA)=1. Следовательно,
N(a) )
откуда, согласно (I),
* а=±1, Ь = ±1.
Таким образом, делителями единицы рассматриваемого кольца яв-
являются только числа -j-1 и — I,
§ 7. РАЗЛОЖЕНИЕ НА МНОЖИТЕЛИ В ОБЛАСТИ ЦЕЛОСТНОСТИ 39
Далее, если
п = а1 ... пг
— такое разложение некоторого числа а из 5, в котором ни один
из множителей не является делителем единицы, то из равенства
N(a)=*N{aJ... N{ar)
вытекает, что число г множителей не может превосходить количества
простых множителей натурального числа N{a). Отсюда следует, что
каждое число а из кольца 5 допускает полное разложение.
(III) Числа ±2 и ±\±Y — 3 являются простыми. Действи-
Действительно, допустим, что какое-нибудь из них можно записать в виде
произведения be, где оба множителя не являются делителями единицы.
Поскольку нормы рассматриваемых чисел равны 4,
Но N(b) > 1 и N(c) > 1; следовательно,
что невозможно, так как, согласно (I), кольцо 5 не содержит эле-
элементов с нормой, равной 2. Тем самым доказано, что все исход-
исходные числа — простые.
Поскольку единственными делителями единицы в 5 служат
числа 1 и —1, невозможно равенство
где е — делитель единицы. Следовательно, разложения
4 = 2 ¦ 2 = A + V =Г3)A — /:=Г3)
не эквивалентны. Таким образом, кольцо 5 не является областью
с однозначным разложением.
Вернемся к области целостности / и предположим, что она яв-
является областью с однозначным разложением. Докажем, что любые
два элемента a, b из I имеют единственный, с точностью до мно-
множителя, являющегося делителем единицы, наибольший общий дели-
делитель. Условимся называть два простых элемента р и q эквивалент-
эквивалентными, если существует делитель единицы в, удовлетворяющий условию
р = щ.
Предположим теперь, что некоторый элемент с является делителем
другого элемента d, так что
d = ce.
Пусть
С = fC, ... С„
ГЛ. I. КОЛЬЦА И ТЕЛА
— полные разложения элементов с, d, e, где, как мы условились
выше, f> 8, в обозначают делители единицы, а все остальные мно-
множители являются простыми. Поскольку
Ых ... de = isct ... crex ... et,
мы заключаем, что r-\-t = s и что простые элементы сх сг
эквивалентны г различным простым элементам из dlt ..., da.
Предположим теперь, что
а = <хаг ... аг и Ъ = pftj ... b8
— полные разложения двух элементов а и Ь из /; согласованием
нумерации простых множителей и умножением их, в случае необхо-
необходимости, на дополнительные множители, являющиеся делителями еди-
единицы, можно добиться, чтобы выполнялись равенства
at=*bt (/ = 1. 2 f)
и чтобы для всех, j и k, больших t, никакие а^ и Ьк не были экви-
эквивалентны друг другу. По доказанному выше, каждый делитель эле-
элемента а является произведением некоторого делителя единицы и опре-
определенного числа множителей а4. Подобным же образом, каждый
делитель элемента b представляет собой произведение делителя еди-
единицы на некоторое число множителей ?i# Из того, что / есть область
с однозначным разложением, следует, что если d — общий делитель
элементов а и Ь, то его можно записать в виде
d — bah ... ач,
где 1 <; /г < /а < ... < /г .^ t. Таким образом, d оказывается дели-
делителем элемента
D — ax ... at,
который, в свою очередь, является делителем элементов аи*. Этот
элемент D называется наибольшим общим делителем элементов а и Ь;
он определен однозначно с точностью до множителя, являющегося
делителем единицы.
Докажем теперь следующую теорему:
Теорема II. Если аи ..., ап — элементы из I, то суще-
существует элемент d, служащий делителем каждого из элементов af
и такой, что любой общий делитель всех at служит его дели-
делителем. Этот элемент определен однозначно с точностью до мно-
множителя, являющегося делителем единицы.
Мы будем называть такой элемент d наибольшим общим делите-
делителем элементов ах ап.
Теорема, очевидно, уже доказана для случая п = 2. Предположим,
что она справедлива для п—1 элементов а1 ап_г из /.
Пусть dn — наибольший общий делитель этих элементов. Обозначим
через d наибольший общий делитель элементов йц и ац. Элемент dn
§ 7 РАЗЛОЖЕНИЕ НА МНОЖИТЕЛИ В ОБЛАСТИ ЦЕЛОСТНОСТИ 41
служит делителем всех элементов а1( .... ап_х. Следовательно, d—
общий делитель элементов ах ап-\> ап- С другой стороны,
если е— произвольный общий делитель элементов alt ..., йп-г, ап, то
он является делителем элементов dn и ап, а потому и элемента d. Нам
остается доказать единственность элемента d. Если d' — другой эле-
элемент из /, обладающий теми же свойствами, что и d, то d' является
делителем элементов а1 ап, а следовательно, и элемента d,
так что
d = ad',
где а принадлежит /. Аналогично и
где b — элемент из /. Следовательно,
d == abd.
Отсюда вытекает, что
ab—\,
т. е. а и b—делители единицы.
Мы закончим этот параграф следующей важной теоремой:
Теорема III. Если К есть поле, то К [х] является областью
с однозначным разложением.
Прежде всего покажем, что каждый многочлен степени ге > О
из К[х] можно разложить в произведение конечного числа простых
множителей. Доказательство легко проводится индукцией по п;
При ге = 1 нечего доказывать, так как если многочлен / имеет
степень 1 и если f = gh, где g и h — многочлены степеней соответ-
соответственно / и т, то
Следовательно, либо g, либо h имеет степень 0 и потому является
делителем единицы. Это означает, что разложение f = gh тривиально,
откуда вытекает, что /—простой многочлен.
Предположим теперь, что наше утверждение справедливо для всех
многочленов степени, меньшей ге. Пусть / — многочлен степени п.
Если / неприводим, то он уже выражен в виде „произведения" простых
множителей. Допустим поэтому, что / приводим, т. е. что
где g и А — многочлены степеней соответственно / и т, причем
1-\-т~п
По сделанному предположению, многочлены g и h можно разложить
в произведения конечного числа простых множителей. Следовательно,
это верно и для многочлена /.
42
ГЛ. I. КОЛЬЦА И ТЕЛА
Докажем теперь, что все разложения многочлена / на простые
множители эквивалентны. Другими словами, мы докажем, что если
/ — многочлен степени п, допускающий два разложения в произведе-
произведение простых множителей
то r = s и, после возможной перестановки множителей,
Si = 4ifi С—1 г),
где ft — множители нулевой степени. Доказательство вновь проведем
индукцией по я. Для я = 1 утверждение тривиально, так как все
многочлены первой степени неприводимы. Предположим, что утвержде-
утверждение верно для всех многочленов степени, меньшей п. Поскольку
«Д.../,="?*!¦... А. A)
Д является делителем многочлена gt или многочлена $gs ... g8
(§ 6, теорема I). Если он является делителем второго многочлена,
то по той же теореме заключаем, что Д— либо делитель g2, либо
делитель многочлена $g3 ... gs. Продолжая это рассуждение, мы
убеждаемся, что Д является делителем либо одного из множителей git
либо множителя C. Этот последний случай, однако, невозможен, так
как Д имеет положительную степень, в то время как C — нулевой
степени. Следовательно, после возможной перенумерации множите-
множителей g{ можно считать, что
Поскольку gt (так же как и Д) неприводим, множитель fj должен
быть делителем единицы. А так как К[х] есть область целостности,
то мы можем сократить обе части равенства A) на Д, после чего
получим
«Л •••/r
Это равенство связывает между собой два многочлена степени, мень-
меньшей п. По нашему индуктивному предположению,
г—l=s—1, т. е. r = s,
и, после соответствующей перестановки множителей,
gi = t<A 0 = 2, ...,г),
где ff — делители единицы. Теорема доказана.
§ 8. Разложение на множители в кольце многочленов
Основной теоремой настоящего параграфа, доказательство которой
будет опираться на три приводимые ниже леммы, является
Теорема I. Если I—область с однозначным разложением,
то 1[х] — также область с однозначным разложением.
§ 8. РАЗЛОЖЕНИЕ НА МНОЖИТЕЛИ В КОЛЬЦЕ МНОГОЧЛЕНОВ 43
Пусть /—отличный от нуля многочлен из 1[х]; обозначим через d
наибольший общий делитель его коэффициентов. Тогда многочлен /
можно записать в виде
где g — многочлен из 1[х], для которого наибольший общий делитель
коэффициентов равен 1 (или, что то же, любому другому делителю
единицы). Такой многочлен называется примитивным. Очевидно, что
оба множителя g и d определены однозначно с точностью до делителей
единицы. Важность примитивных многочленов видна из следующей
леммы:
Лемма 1. Произведение двух примитивных многочленов есть
примитивный многочлен.
Пусть
+ + +
— два примитивных многочлена. Допустим, что их произведение fg
не является примитивным многочленом. Тогда коэффициенты про-
произведения имеют наибольший общий делитель d, не являющийся
делителем единицы. Если р — один из простых множителей элемента d,
то на р делятся все коэффициенты многочлена fg. Но /— примитив-
примитивный многочлен, поэтому не все его коэффициенты делятся на р.
Пусть аг—первый из коэффициентов, не имеющих р своим дели-
делителем. Аналогично, пусть Ь8 — первый из коэффициентов многочлена g,
не делящихся на р. Рассмотрим коэффициент при xr+s в произведе-
произведении fg. Он равен
сг+8 = *А4-Дг-Л+1+Дг+А-1 + • • • +«(&+»•+*r+A ==aA+i>c.
где с — некоторый элемент из /. По предположению, р является дели-
делителем сг+8. Следовательно, и произведение arb8 имеет р своим дели-
делителем. Но в силу единственности разложения элементов в /, простыми
множителями произведения arba служат простые множители эле-
элемента аг и простые множители элемента Ь8. Поэтому либо аг, либо ba
делится на р. Мы пришли к противоречию. Наше предположение,
что многочлен fg не примитивен, оказалось, таким образом, ложным.
Пусть К— поле частных области целостности /. По теореме III § 7,
К \х) есть область с однозначным разложением. Мы используем этот
факт и свойства примитивных многочленов для доказательства тео-
теоремы I. Пусть о — многочлен из К[х]:
? = «о+ 4х + • • • + V*.
где
44
ГЛ. I. КОЛЬЦА И ТЕЛА
Приведем коэффициенты многочлена <р к общему знаменателю
Ъ = Ьо ... Ьп.
Если
ct = b0 ... Ьь^аф^ ... bn
и
f=co + 4x+ ...+спхп,
то
т b '
где многочлен / принадлежит 1[х]. Если теперь еще положить
где g— примитивный многочлен, то можно выразить многочлен «о
в виде
а
© = -г &.
b s
Лемма 2. Примитивный многочлен g определяется ненуле-
ненулевым многочленом ® однозначно с точностью до множителя, являю-
являющегося делителем единицы области целостности I.
Предположим, что <p = -rg" и одновременно ? — -[h, гДе g
и h — примитивные многочлены кольца 1[х]. Тогда
adg = bch;
следовательно, ad — делитель всех коэффициентов многочлена bch.
Но из примитивности многочлена h вытекает, что наибольший общий
делитель всех коэффициентов многочлена bch есть be. Поэтому
be = sad,
где е принадлежит /. Подобным же образом и be является дели-
делителем ad, т. е.
ad = г'be,
где г' — элемент из /. Из полученных равенств заключаем, что
bead = (ее') bead.
Так как <р — ненулевой многочлен, а /—область целостности, то
«/=1,
т. е. е-—делитель единицы. Таким образом,
?- = e/z,
и лемма доказана,
§ 8. РАЗЛОЖЕНИЕ НА МНОЖИТЕЛИ В КОЛЬЦЕ МНОГОЧЛЕНОВ 43
Если теперь многочлен ^ из К[х] определяет примитивный много-
многочлен h и 4* = -з- К то
По лемме 1, многочлен gh примитивен. Следовательно, в силу леммы 2,
примитивным многочленом, определяемым многочленом »ф, является gh.
Тем самым доказана
Лемма 3. Если в — неприводимый многочлен из К[х], то соот-
соответствующий ему примитивный многочлен из 1[х] также непри-
неприводим, и наоборот.
Теперь мы можем перейти к доказательству самой теоремы I.
Пусть/—многочлен из 1[х], и пусть <!¦—наибольший общий делитель
его коэффициентов. Представим многочлен / в виде
и рассмотрим F как многочлен, принадлежащий кольцу К[х\, кото-
которое, как мы знаем, является областью с однозначным разложением.
Пусть простыми множителями многочлена F в К [х] являются
?i. • • •. ?)•• Последние многочлены определены однозначно с точ-
точностью до множителей, принадлежащих К. Если
где Ft — соответствующие примитивные многочлены из 1[х], то, со-
согласно предыдущей лемме, Ft неприводимы в 1[х]. Далее,
р а\ ... ar p p
Г *~ bt ... Ьг Г1 • ' • Гг>
откуда
Ьх ... brF = at ...arFt... />.
Поскольку многочлены F, Fv .. ., Fr примитивны, произведение
Ьх . .. br является делителем произведения ах ... аг, и наоборот. Сле-
Следовательно,
at ... ar = *bx ... Ьг,
где в — делитель единицы кольца /. Поэтому
f=tdFx...Ft.
Записав гй в виде
erf =в 8^ ... da,
где dv ..., ds— простые элементы из /, мы разложим многочлен /
в произведение
/=8rft ... dsFl ... Fr
простых множителей (8 — делитель единицы). Пусть
/ = ее1 ... е8- 0х ... ОГ'
гл. i. кольца й тёлА
— другое представление многочлена / в виде произведения неприво-
неприводимых множителей из 1[х] (s— делитель единицы). По лемме 3,
многочлены Ft и Qj неприводимы в кольце К [х], и потому, так как
К [х] — область с однозначным разложением, мы должны после соот-
соответствующей перестановки множителей иметь r = rr и
О, =
(«i — элементы из К). Но тогда, по лемме 2,
«< = Ч,
гДе е4 — делитель единицы кольца /. Следовательно,
bdt ... de — ге± ... еьггх ... ег,
где 8 и ;ввх ... &г — делители единицы, а й% и е$— нет. Но / есть
область с однозначным разложением. Поэтому s = s' и, после возмож-
возможной перестановки множителей,
di = 6te4
(9i — делители единицы кольца /). Этим доказано, что и 1[х] — область
с однозначным разложением.
Простой индукцией отсюда выводится
Теорема II. Если К — поле, а К[хх, ..., хг] — кольцо, полу-
полученное присоединением к атому полю г неизвестных хи ..., хг,
то К [хь ..., хг] есть область с единственным разложением.
§ 9. Примеры тел
Первым шагом в построении пространств, геометрию которых мы
будем изучать, всегда является выбор некоторого тела К. Поэтому
целесообразно закончить настоящую главу несколькими примерами тел.
(а) Мы уже отмечали, что комплексные числа образуют коммута-
коммутативное тело (поле) относительно обычных законов сложения и умно-
умножения.
(б) Мы знаем, что действительные целые числа образуют область
целостности /. В силу § 4, эту, область целостности можно расши-
расширить до поля отношений, которым, очевидно, будет поле рацио-
рациональных чисел.
Оба эти тела коммутативны и не имеют характеристики. Теперь
мы дадим пример тела конечной характеристики.
(в) Пусть р — простое число. Мы видели в § 2, что обычные целые
числа, приведенные по модулю р, образуют куммутативное кольцо
с единицей. Нуль 0 является представителем множества всех целых
чисел, кратных р, а единица 1 — представителем множества чисел,
сравнимых с 1 по модулю р. Покажем, что каждый отличный от нуля
элемент этого кольца регулярен. Если а — целое число, не делящееся
§ 9. ПРИМЕРЫ ТЕЛ 47
на р, то а и р взаимно просты. Следовательно, мы можем найти
такие целые числа b и с, что
ab—pc—\. .
Если теперь
а' = а (mod р), Ь'' s ? (mod p\
то
Тем самым доказано, что целые числа, рассматриваемые По модулю
простого числа р, образуют поле. Это поле, очевидно, является полем
характеристики р. Приведенный пример показывает также, что суще-
существуют поля, состоящие лишь из конечного числа элементов.
(г) Пусть /—область целостности с элементами а, Ь Ее
поле частных К состоит из „дробей" д/? (ЬфО). Кольцо 1[х], со-
состоящее из многочленов
есть область целостности. Существует также область целостно-
целостности К [х], состоящая из многочленов
Мы покажем, что поля частных областей целостности 1[х] и К[х\
изоморфны.
Действительно, каждому элементу
/_ ао + а1х+...+апхп
g h + hx + ... + bmxm
поля частных кольца J[x] однозначно соответствует элемент поля
частных кольца К[х\, записываемый таким же точно образом. Если
fig' — другое представление того же элемента поля частных кольца / [х],
то fg'=f'g, так что дроби fig и f\gf равны в обоих этих полях.
Наоборот, каждый многочлен из К\х\
можно
где
Пусть,
записать в
подобным
виде
т
ci — К "'
с = Ь0...
же образом,
,_do + d1x
т
с
bn.
+ ... +d
d
nXn f
c'
x...bn,
mX™ g
d
48
ГЛ. I. КОЛЬЦА И ТЕЛА
Тогда в поле частных кольца К[х] мы будем иметь
jf_ d (c0 + с\х + • • • + СпхП)
так что дробь <р/ф определяет некоторый элемент поля частных
кольца 1[х\. Если, аналогично,
причем
то
«/-¦jr.
c'dfg'= cd'fg.
Это означает, что элементы поля частных кольца 1[х\, соответствую-
соответствующие дробям «р/Ф и ?'!?• совпадают. Соответствие между элементами
обоих полей частных оказывается, таким образом, взаимно одно-
однозначным. Без труда проверяется, что это соответствие есть изоморфизм.
Поле частных кольца многочленов К [х] будем обозначать через К (х).
Оно называется полем рациональных функций неизвестного х над
полем К. По доказанному выше, поле рациональных функций от х%
над полем К (хх) изоморфно полю частных кольца многочленов К[хг, х%\
(и может быть идентифицировано с ним). Это поле будем обозначать
через К(хи л;2). Продолжая подобным образом далее, мы увидим,
что поле
К(*1 xr-l) (*r) — К{*1 *г)
изоморфно полю частных кольца /С^, .... хг\. Это поле называется
полем рациональных функций от неизвестных хх хг над
полем К. Характеристика этого поля, очевидно, совпадает с характе-
характеристикой поля К.
(д) В заключение мы приведем один пример некоммутативного
тела.
Пусть К—поле действительных чисел. Рассмотрим множество Q
матриц [определение матриц см. в § 2, пример (д)], имеющих вид
а 8 — $ — f\
-8 а 7 —Р
& —Т а —8
где а, р, "V, 8 — действительные числа. Очевидно, что сумма двух
матриц из Q будет вновь матрицей из Q. Если а и b — две матрицы
из Q, то уравнение
§ 9. ПРИМЕРЫ ТЕЛ 49
имеет решение
х = Ь — а,
также принадлежащее Q. Таким образом, множество Q представляет
собой группу по сложению. Далее, если
а 8 — р —-Л /а* ?* — р* — т*
8 а Т-Р1 „ а*_-8* а* Т* -Р*
я-> р _т а —8 и а- р* _т* «* _5*
т Р 8 а/ у т* р* 8*
то их произведение равно
Р s ~
— s р
q —r
г q
где
р = аа* — рр* — Y[* —
s = 8а*—¦ур* 4- Рт* +а8*;
таким образом, и аа* принадлежит Q.
Поскольку умножение матриц ассоциативно и дистрибутивно отно-
относительно сложения, множество Q представляет собой подкольцо кольца
всех квадратных матриц четвертого порядка. Нулем кольца Q является
матрица с а = р = ^ = 8 = 0, а единицей — матрица с а = 1,
C = f = 8 = O. Если теперь а^О и а* определяется значениями
а* = а (а2 + р2 + т2 + 52)-1,
8* = — 8 (а« + р2 + Т2 + 8*).
то непосредственно проверяется, что
аа* = а*а = 1.
Таким образом, каждый отличный от нуля элемент из Q регулярен;
следовательно, Q есть тело.
Обозначим через 1, i, j, k матрицы, определяемые соответственно
следующими значениями параметров:
а = 1, р = т = 8 = 0,
Р=1. т = 8 = а = °.
Т=1, 8=а = р = О,
8=1, о = р = т = 0.
4 Зак. 1230. В. Ходж и Д. Пидо
50 ГЛ. I. КОЛЬЦА И ТЕЛА
Тогда при очевидном „поэлементном" определении умножения матрицы
на число записанный выше элемент а из Q можно представить в виде
а произведение
(« + р;+ту + щ («* + Р*/ 4- т V+8**)
можно вычислить путем почленного умножения и использования
равенств
В частности, так как ij=?ji, тело Q некоммутативно. Это тело обычно
называется телом кватернионов.
Главами
ЛИНЕЙНАЯ АЛГЕБРА, МАТРИЦЫ, ОПРЕДЕЛИТЕЛИ
В этой главе мы будем изучать свойства некоторого множества
элементов, комбинации из которых по определенным правилам дают
элементы того же множества; при этом используются элементы неко-
некоторого тела. В приложениях, рассматриваемых в последующих главах,
это тело будет обычно предполагаться коммутативным и не имеющим
характеристики. Однако основные результаты настоящей главы
получаются без таких предположений, и если явно не указано
противное, высказываемые утверждения будут относиться к общему
случаю произвольных тел.
Начинаются все построения с выбора некоторого тела, которое
всюду в дальнейшем будет обозначаться буквой К. Мы будем часто
называть К основным телом.
§ 1. Линейная зависимость
Выбрав основное тело К, рассмотрим множество элементов L
(не обязательно принадлежащих К), обладающее следующими свой-
свойствами.
(I) В L определен закон композиции, обозначаемый знаком -\-,
относительно которого L представляет собой аддитивную группу;
нуль этой группы обозначим через 0.
(И) Каждому элементу из К соответствует операция, переводящая
любой элемент из L снова в элемент из L; если а — элемент тела К,
а и — элемент из L, то в результате применения к U операции,
соответствующей а, получается элемент из L, который мы будем
обозначать через аи.
(III) Описанные выше операции удовлетворяют следующим правилам:
(а) lu = u,
(б) а (а -|- v) = аи -\- ач,
(в)
(г)
Множество L, обладающее этими свойствами, называется левосто-
левосторонней линейной системой над К.
4*
52 гл. п. линейная алгебра
Из определения линейной системы легко выводятся некоторые
дальнейшие ее свойства. Во-первых,
u-f-0u= la + 0u = (l-|-0)u=ltt = u
для любого и из L. Поэтому для любого и из L выполняется соот-
соотношение
0и = 0.
Следствие.
и + (— 1) и = lu + (— l)u = Ou = О,
т. е. элемент (—1)н является элементом, противоположным к и
(в смысле определения, действующего в аддитивной группе).
Во-вторых, если а — отличный от нуля элемент из К, то
u -j- «О = аа~1п -\~аО = а(а-1и-\~О)==а (а^и) = и,
поэтому
д0 = 0.
Этот результат, как мы видели выше, верен и для а = 0.
Полученный результат допускает обращение. Если
аи = 0
, то
u = lu = (а-^а) и = а~1 (аи) = а-'О = 0.
Таким образом, из равенства
вытекает, что либо а = 0, либо и = 0.
Следствие. Еели
аи = bu a u Ф 0,
то
если же
au — av и
то
Аналогичным образом определяется правосторонняя линейная си-
система; записывать результаты соответствующих операций мы будем
также аналогично, располагая лишь элемент из К справа от элемента
из L. Доказанные выше результаты справедливы, конечно, и для
правосторонней линейной системы. В случае, когда тело К коммута-
коммутативно, мы можем не делать различия между право- и левосторонними
линейными системами, считая, что
аи == иа,
§ 1. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 53
и говорить просто о линейных системах. Однако в последующем
изложении коммутативность тела К не будет предполагаться.
Достаточно, очевидно, ограничиться рассмотрением левосторонних
линейных систем, ибо каждому свойству таких систем отвечает соот-
соответствующее свойство правосторонних линейных систем. Для краткости
всякий раз, когда это не будет сопряжено с возможностью ошибоч-
ошибочного понимания, мы будем называть левостороннюю линейную систему L
просто линейной системой.
г элементов щ, .. ., и,, линейной системы L называются линейно
зависимыми над телом К, если в К существуют такие элементы
«j аг, не все равные нулю, что
В противном случае исходные элементы называются линейно неза-
независимыми.
Заметим, что всякая конечная система элементов из L, содержа-
содержащая 0, не может быть линейно независимой: если и1, ..., иг — осталь-
остальные элементы этой системы, то заведомо справедливо равенство
Если система ulf ..., пг линейно независима, то любая ее под-
подсистема а< , ..., щ также линейно независима. Действительно,
линейная зависимость подсистемы влечет за собой линейную зависи-
зависимость всей системы.
Про элемент v из L, который можно выразить в виде
говорят, что он линейно зависит от ux ur. Множество всех
элементов из L, линейно зависящих от Uj иг, будем обозначать
символом L (u1( .... и,.). Нуль 0 принадлежит каждой такой системе.
Докажем следующую теорему:
Теорема I. Множество I(Uj ur) является линейной
системой.
Действительно, если и и v принадлежат этому множеству, т. е.
и = а1щ-!г...+агаг
и
v = b1u1-{-...-\-brur,
то
u-f v = (<*! +6J Uj + ¦••+К + *г) и^-
Следовательно, u-j-v также принадлежит этому множеству. Ана-
Аналогично,
аи = (аа^щ + ... +(адг) и,,
т. е. и аи принадлежит этому множеству. Поскольку, наконец, про-
противоположным к и, как мы видели, является элемент (— 1) и,
54 ГЛ. 11. ЛИНЕЙНАЯ АЛГЕБРА
то L(ttt, .... ur) есть аддитивная группа, замкнутая относительно
умножения на элементы из К. А это и означает, что L(u1( . ••', «г) —
линейная система.
Теорема II. Если и, иг линейно независимы, то каждый
элемент из Ь(щ, .... иг) однозначно записывается в виде
Наоборот, если такая запись для каждого элемента из L(uv .. .,иг)
однозначна, то элементы щ ог линейно независимы.
Действительно, пусть для некоторого элемента v из L (щ, .. •, ur)
имеются две записи
и
v = bju,. 4- • • • + Mr-
Тогда
0 = К — ^)Ul+...+(ar — br)nr,
откуда* ввиду линейной независимости и1( .. ., ur вытекает, что
at=bt 0=1, .... г).
Наоборот, предположим, что указанное представление элементов
единственно и что
аА + • • • + агпг = О*
Тогда наряду с записью
будет справедлива и запись
v = (*i + <*i) ut + .. - + {br + ar) nr.
Но в силу единственности должны выполняться равенства
bi + a^bt (/=1 г),
откуда
в< = 0 (/=1 г).
Этим доказана линейная независимость элементов щ ur.
Теорема III. Если vlt ..., va принадлежат L(uit ..., ur),
a w1t .... w( принадлежат L(vv .... vs), mo w1( ..., w, также
принадлежат L (u1( ..., u,.).
Действительно, из равенств
(/=1 s)
следует, что
+ ... ~\-cirur (i = 1 *),
§ 1. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 55
где
Теорема IV. Каждое конечное множество элементов uv ..., ur,
не состоящее сплошь из нулей, содержит такое подмножество
линейно независимых элементов щ, щ , что
Будем доказывать эту теорему индукцией по г. Теорема очевидна
при г= 1, так как в этом случае, по условию, щфО. Предположим
теперь, что теорема справедлива для г — 1 элемента и рассмотрим
элементы щ пг. Если эти элементы линейно независимы, то возь-
возьмем в качестве требуемого подмножества само множество щ иг.
Предположим поэтому, что исходные элементы линейно зависимы и
что
где по крайней мере одно из а{ не равно нулю. Если акф0, то
Ufc = — аи ejOi— —аи ак^щ_х — аи я^+хи*+1— ...—а* агиг.
Из элементов и, uk_j, ufc+1 ur по крайней мере один от-
отличен от нуля, так как в противном случае мы имели бы пк = 0.
Поэтому мы можем применить к L (ии ..., щ.^ ufc+1, .... ur) ин-
индуктивное предположение, согласно которому существует такое под-
подмножество линейно независимых элементов и»,, ..., и< , что
Очевидно, что I(Uf, u<) содержится в L(uv ..., u,.). Наобо-
Наоборот, каждый элемент v из L(ut ur) может быть записан в виде
V =
и потому лежит в
I(Ult .... Ufc,!, Uk
Следовательно,
и теорема доказана.
Говорят, что элементы Vj, ..., vs (не обязательно линейно неза-
независимые) образуют базис линейной системы Ь(щ, .... ur), если
.... vs) = I(u1( .... u,).
= L(U<1, .... U<g),
56 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
Если элементы, составляющие базис, линейно независимы, базис на-
называется минимальным. Мы докажем, что все минимальные базисы
системы L(uv . .<, иг) имеют одно и то же количество элементов;
это число называется размерностью линейной системы L(nv ..., иг).
Важнейшим шагом в доказательстве этого утверждения является
результат, известный под названием теоремы о замене. Эта теорема
имеет много приложений в алгебре.
Теорема V. Если v± vs — линейно независимые элементы
системы L (nlt .... иД то существует такое подмножество
Uix, ..., щ элементов базиса щ, .... иГ1 что если мы в исход-
исходном базисе заменим элементы этого подмножества на ylt ..., vs,
то новое множество из г элементов также будет базисом си-
системы L (t^, .... иу).
Докажем эту теорему индукцией по s. Предположим, что
теорема справедлива для vv .... v,_t, и пусть этими элементами
замещены элементы щг, .... и< базиса (здесь ix /в-1
1Г — некоторая перестановка чисел 1 г). По предположению,
/.(«!, .... nr) = I(v1, .... У,.,, u<f, .... u,r).
Ho vg принадлежит этой линейной системе; поэтому
vs = OjYi + • • • + «s-iV,-! + с,Ща+ • • • + агщг. A)
Коэффициенты as, . .., ar не могут все равняться нулю, так как
в противном случае равенство A) устанавливало бы линейную зави-
зависимость элементов vlt ..., ve. He нарушая общности, можно считать,
что а8ф0 (для чего нужно, может быть, переставить индексы
у щ , ..., щ ). При этом условии из равенства A) заключаем, что
aig = — ag-laivi — ... — ag-4-iv*-i + «Г1*» —
- e.-le.+i««.+l - • • • - в.-Чя1г- B)
Но vlf .... vs_j, vs, uig+l щг принадлежат L(vt ve_lF
Щ , .... u< ); поэтому, в силу теоремы HI,
L(vt v,_lt va, u<f+1, .... ^ЕЦт,, .... vt_lf ufg, .... u<fj.
С другой стороны, равенство B) показывает, что и^ принадлежит
) у
e_!, vg) uig+i mr).
» •••, ve_1( ve, и<>+1, .... va), а потому
Следовательно,
L(v1 v,_!, ufg u
ve_j, ve, u«f+1, .... u<r).
§ 1. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ 57
Эти же рассуждения применимы без изменений к случаю s= 1, в ко-
котором лишь не делается предварительной замены. Поэтому теорема
доказана.
Следствия:
1. Если щ иг — минимальный базис системы L(uit ..., ur),
a Vj vr — совокупность г произвольных линейно независимых
элементов этой линейной системы, то
?(Ui nr) = L(v1 vr).
2. Любые г-\-\ элементов системы L(nv .... аг) линейно за-
зависимы.
Действительно, если среди элементов vx vr+1 линейной си-
системы L(ut иг) найдется г линейно зависимых, то следствие 2
не требует доказательства. Предположим теперь, что v1( ..., vr ли-
линейно независимы. По теореме о замене, L (vlt ..., vr) = L (щ, ..., u,.),
а так как, по условию, vr+1 принадлежит этой линейной системе, то
чем и доказана линейная зависимость элементов vv ..., vr+v
Заметим, что это доказательство не требует предположения, что
Uj иг образуют минимальный базис системы L (u1( ..., ur).
Теорема VI. Все минимальные базисы линейной системы
L (ulf ..., иг) состоят из одного и того же числа элементов.
Пусть vv .... vn и Wj wm — два минимальных базиса си-
системы. Тогда
L(ulf .... ur)==
Если п > от, то согласно следствию 2 предыдущей теоремы,
v1( .... vn линейно зависимы; аналогично, из предположения, что
от > п, вытекает линейная зависимость элементов wlt .... wTO. Но,
по определению минимального базиса, его элементы линейно незави-
независимы; поэтому т = п. Как было указано выше, это число называется
размерностью линейной системы. Предыдущая теорема имеет (в силу
теоремы V) очевидное
Следствие. Если L, М — линейные системы конечных раз-
размерностей I, от и L^M, то I <! от. Если Lc M и 1 = от, то
L = M.
Приведем важный пример левосторонней линейной системы над
телом К-
Рассмотрим множество строк
(«1 «»).
каждая из которых состоит из и элементов я4 тела К. Две строки
(«1 ап) и (pt, .... bn)
будем считать равными тогда и только тогда, когда
at = bi\ (t=l n).
58 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
Если заданы две строки
и = (а1,..., ап) и v = (bv .... bn\
то мы определим их сумму a-\-v равенством
а произведение аи, где элемент а принадлежит телу К, — равенством
аи = (ааг аап).
Очевидно, что относительно введенных операций строки из п эле-
элементов образуют левостороннюю линейную систему. Если
«i = (i. о, о о>,
«, = @, 1, 0 0),
*« = @, 0, 0 1),
то элементы ult й2, .... ип линейно независимы, причем любую
строку и = (flj ап) можно записать в виде
и = аЛ+•••+<*»"„•
Следовательно, множество строк из п элементов представляет собой
линейную систему конечной размерности п, причем элементы at ип
составляют ее минимальный базис.
Элементы введенной линейной системы называются обычно лево-
левосторонними векторами, или левосторонними п-векторами, если
требуется подчеркнуть размерность системы. Что же касается всей
системы векторов, то мы ее будем называть левосторонним вектор-
векторным пространством. Аналогично можно определить правосторонние
векторы, а в случае коммутативности основного тела К— просто
векторы.
Теорема VII. Каждая левосторонняя линейная система
L (Uj, .... ura) размерности п изоморфна системе левосторонних
п-векторов.
Так как линейная система имеет размерность п, то и1, ..., ип
линейно независимы. Следовательно, по теореме II, каждый эле-
элемент и этой системы представим единственным образом в виде
и = <?»!+•••+<W C)
Тем самым элементу и соответствует однозначно определенный вектор
(аи..:,ап). " D)
Обратно, любой вектор вида D) однозначно определяет эл мент ис-
исходной линейной системы, а именно, элемент C). Доказательство того
факта, что это взаимно однозначное соответствие представляет собой
изоморфизм, тривиально.
§ 2. МАТРИЦЫ 59
Нужно .отметить, что соответствие между элементами линейной
системы и я-векторами зависит от выбора минимального базиса ли-
линейной системы.
Ниже в настоящей главе и в дальнейших приложениях нам при-
придется встречаться с необходимостью одновременного рассмотрения
свойств конечного числа подсистем некоторой линейной системы L,
каждая из которых имеет конечную размерность. Если мы выберем
минимальные базисы во всех этих подсистемах, то они в совокуп-
совокупности составят конечное множество элементов из L. Эти элементы
определят подсистему V системы L, имеющую конечную размер-
размерность и содержащую в себе все исходные подсистемы. Все наши
построения не будут выводить за пределы системы L'. Поэтому мы
можем заранее предположить, что имеем дело с линейной системой L'
конечной размерности. По теореме VII, система V изоморфна неко-
некоторому векторному пространству. На этом основании мы будем обычно
говорить об элементах из V как о векторах, и в этом смысле про-
проводимые в следующих параграфах рассуждения относятся к векторам.
Мы не будем делать точных указаний о размерности рассматривае-
рассматриваемого векторного пространства, так как наши результаты не будут
зависеть от ее величины; только иногда придется предполагать, что
размерность „достаточно высока".
§ 2. Матрицы
Матрицей из р строк и q столбцов над телом К (или матрицей
типа р X q, или р X <7-матрицей) называется прямоугольная таблица
из рд элементов тела К. В примере (д) § 2 гл. I мы встретились
с частным случаем, в котором К было полем комплексных чисел,
причем р совпадало с q.
Теория матриц тесно связана с теорией векторов, и мы будем
пользоваться результатами предыдущего параграфа для установления
свойств матриц. Указанная связь реализуется следующим образом.
Рассмотрим в некотором векторном пространстве конечной, но доста-
достаточно высокой размерности (предположение о ней нам не потребуется
уточнять) систему из q левосторонних векторов йг, . ¦., «д. С помощью
матрицы А мы можем, исходя из этих q векторов, определить р век-
векторов vt, ..., vp, полагая
(* = 1, ..., р). A)
60 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
Как мы знаем,.
L(vv ..., vp)cL{ttt aq). B)
Каждый из векторов vt однозначно определяется векторами щ и ма-
матрицей А. Мы будем говорить, что система векторов в1( .... uq
преобразуется с помощью матрицы А в систему vv ..., vp. Отме-
Отметим, с другой стороны, что при наличии соотношения B) матрица А
однозначно определена в том и только том случае, если ttv ..., ач
линейно независимы. Это непосредственно следует из теоремы II § 1.
Системы равенств, подобные A), будут часто встречаться в этой
книге, и потому целесообразно ввести для них более краткую запись.
Если мы обобщим понятие матрицы так, что в качестве ее элементов
будем допускать векторы вместо элементов тела К, и через U и V
обозначим соответственно матрицы
то систему равенств A) можно будет заменить одним равенством:
V = AU. C)
Позднее мы увидим, что запись AU для р X 1-матрицы
«и «1 + • • • + аи ич
получается в качестве частного случая применения правила умноже-
умножения матриц. Наконец, вместо обычной записи <7Х 1-матрицы, такой,
как U, для экономии места удобнее следующая условная запись:
U=\a1, .... а,];
здесь прямые скобки означают, что стоящие в них элементы должны
быть записаны в виде матрицы из одного столбца.
Пусть теперь В — некоторая другая р X ^-матрица над К; опре-
определим с ее помощью р векторов wt wp, где
[wlt .... wp] = BU.
Тогда
vi + wi = {aii-\-bil)a1-\-... -\-{aiqL-\-biq) uq (/= 1 p).
Эти равенства можно кратко переписать в виде одного соотношения
V-\-W=(A-\-B)U,
§ 2. МАТРИЦЫ 61
если определить сумму двух р X ^-матриц равенством
Нетрудно заметить, что р X ^-матрицы при таком определении
сложения образуют аддитивную группу. Нулем этой группы является
нулевая р X ^-матрица, т. е. матрица, все элементы которой равны
нулю. Не будет недоразумений, если мы обозначим эту матрицу
через 0.
Пусть теперь А — некоторая р X ^-матрица над телом К, а В —
произвольная q X /"-матрица над тем же телом. Пусть заданы г век-
векторов ии ..., аг и пусть vv ..., vq — векторы, определяемые ра-
равенством
V = BU,
где
U=[uu .... аг\ и V = [vv ...,vq].
Далее, рассмотрим систему векторов
W=\wu .... wp],
определяемую равенством
W^AV.
Тогда
L(wlt .... w^ci^, .... vq)<=.L{uu ..., иД
и, следовательно, существует р X г-матрица С, удовлетворяющая
соотношению
Как мы видели в теореме III § 1,
где
сц=?а<Фы ('= * Г, 1= 1. ¦ • ¦• О- D)
Формальное исключение V из равенств
W=AV, V=BU,
62 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
приводящее к записи
W=A(BU) =
подсказывает следующее определение: произведением АВ матриц А
и В называется р X /"-матрица С, элементы которой определяются
соотношениями D). Мы видим, что произведение р X <7-матрицы на
г X s-матрицу определено лишь при q = г и что результирующей
является р X «-матрица. Если матрицы АВ и В А обе определены,
они не обязаны быть равными.
Заметим, что о. матрице АВ говорят, что она получена из А умно-
умножением на матрицу В справа, или из В умножением на А слева.
Матрицы не образуют кольца, так как сумма двух матриц опре-
определена лишь в том случае, когда обе они являются р X ^-матрицами,
а произведение двух матриц определено лишь тогда, когда число
столбцов первой матрицы равно числу строк второй матрицы. Если
мы ограничимся рассмотрением лишь квадратных я X «-матриц, то
получим кольцо, как это будет установлено в следующем параграфе;
однако некоторые свойства ассоциативности, дистрибутивности и ком-
коммутативности верны и для произвольных прямоугольных матриц.
Пусть А, А1 и i42 обозначают р X ^-матрицы, В, Bt и В2 — qX,r-
матрицы, а С—гХ$-матрицу. Если
ВС = D, AD = E,
то
г
dij = 2 Ьцсц (t = 1, ..., q; j = 1 s),
и потому
а а г
e{j = 2 «<« duj = S 2
u=l «=1*=I
(!=i p\; = i s),
где F = (ftj) = АВ. Следовательно,
А (ВС) = (АВ) С,
и рассматриваемое произведение допускает поэтому запись ABC,
которая не может вызвать каких-либо недоразумений. Это ассоциа-
ассоциативный закон умножения матриц.
Прямым подсчетом проверяется, что
(Д + Л2) В = АХВ ~\- Аф.
Этими равенствами установлены дистрибутивные законы для матриц.
§ 2. МАТРИЦЫ . 63
Пусть А есть рХ?-матрица, a t\ у, Д, .... У/ —нату-
—натуральные числа, удовлетворяющие неравенствам
Мы можем образовать из матрицы Л новую матрицу типа р' X ?'
путем вычеркивания в А всех элементов, лежащих вне строк с номе-
номерами ilt t2 у и вне столбцов с номерами jv /2 jq'- Полу-
Получаемая матрица называется подматрицей матрицы А.
Пусть теперь pt pa, qu ..., qt— натуральные числа, удо-
удовлетворяющие соотношениям
Обозначим через Ац подматрицу матрицы А, расположенную в стро-
строках с номерами
и в столбцах с номерами
3-Х
2
Эта подматрица Ац является pt X ^-матрицей. Для исходной ма-
матрицы мы будем употреблять следующую запись, имеющую очевид-
очевидный смысл:
А
\An ... AJ
Про матрицу А можно сказать в таком случае, что она разбита на
клетки, соответствующие числам рх pa, qv .... qt.
Если В есть q X /"-матрица и гх ги — натуральные числа,
и
удовлетворяющие соотношению 2 ri — г> т0 мы можем разбить В на
клетки, соответствующие числам qv . .., qt, rlt .... /•„, и записать В
в виде
#=l
¦ ¦ ¦ *1,Л
Клетка А{]е является р{ X ^-матрицей, а клетка В^ — ?s X ^-ма-
^-матрицей. Следовательно, определено произведение AikBy^, предста-
64 ¦ ГЛ. П. ЛИНЕЙНАЯ АЛГЕБРА
вляющее собой pt X /"^-матрицу. Мы можем поэтому определить
матрицу Ctj равенством
t
Рассмотрим элемент, стоящий в /-й строке и от-м столбце матрицы C{j.
Он равен
где
2lPa + И к=^Г
о=! о=1
Таким образом,
/С1( ... С,„\
E')
\Cgl .. . Csu/
является просто разбиением произведения С = /Ш на клетки, соот-
соответствующие числам plt ..., рв, гх /•„. Мы можем, следова-
следовательно, рассматривать А и В как sy^t- и ?X и-матрицы, элемен-
элементами которых служат также матрицы, а их произведение АВ нахо-
находить с помощью соотношений E) и E').
Это правило подобно определению D) обычного произведения
матриц. Но нужно помнить, что правило E)—E') применимо только
в том случае, если разбиение матриц А и В на клетки произведено
так, как указано выше.
Аналогичные, но более простые рассуждения показывают, что
если А и В — две рХ?-матрицы, разбитые на клетки, соответ-
соответствующие одной и той же системе чисел,
/Ап...Аи\ iBu...Blt\
Л= • • • • . В= • • • ¦ Ь
\aa...aJ \вл...вн1
то
п ... Alt-\-Btt \
Идея рассмотрения матриц, разбитых на клетки, часто исполь-
используется. Однако мы будем применять этот прием только для описан-
описанных выше операций, причем во всех случаях элементы рассматривае-
рассматриваемых клеток будут принадлежать некоторому телу.
§ 3. КВАДРАТНЫЕ МАТРИЦЫ 65
§ 3. Квадратные матрицы
Матрица, число строк которой совпадает с числом столбцов, на-
называется квадратной. Если ограничиться рассмотрением одних лишь
и X и-матриц (при фиксированном и), то любые две из них можно
будет складывать или перемножать, причем в результате вновь будет
получаться п X «-матрица. Выведенные в § 2 свойства матриц дают
возможность утверждать, что пХ "-матрицы над телом К об-
образуют кольцо. Пример (д) из § 2 гл. I показывает, что это кольцо
некоммутативно и обладает делителями нуля. Оно имеет единицу,
которой служит единичная матрица
¦1 0 ...
О 1 ... О
^0 0 ... 1
( 0 при i ф j,
в«~1 1 при/= 7.
Символ 8„, определенный таким образом, часто употребляется в ал-
алгебре. Он называется символом Кронекера.
В соответствии с терминологией, введенной в § 3 гл. I, «X га-
матрица А называется регулярной, если она имеет обратную ма-
матрицу А~1, т. е. такую, что
АА'1 = А-^А = Еп.
Из развитой в предыдущей главе теории колец мы знаем, что ма-
матрица не может иметь двух различных обратных. Нетрудно видеть,
что если матрицы Аи В регулярны, причем обратными к ним являются
соответственно А'1 и В, то регулярно и их произведение АВ, при-
причем обратной для него является матрица В Л. Действительно,
в силу ассоциативного закона,
Аналогично и
(В-1А
Докажем теперь две теоремы, дающие необходимые и достаточ-
достаточные условия регулярности п X «-матрицы А.
Теорема 1. п%п-матрица регулярна тогда и только тогда,
когда она преобразует систему из п линейно независимых век-
векторов в систему из п линейно независимых векторов.
A) Пусть -и .-, оп — система из п линейно независимых ве-
векторов. Предположим, что п векторов
Vt = вйях + • • • + в|»я» (/=.1, .... я)
5 Зак. 1230. В. Ходж и Д. Пи до
66 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
линейно независимы. По следствию 1 из теоремы V § 1,
L(vt vn)=L(u1 и„).
Следовательно,
где by принадлежат телу К. Отсюда
и »
hvi + • • • + 2
]Е ijhi + + 2
и и
= 2 v^«i + • • • + 2
Из линейной независимости каждой из систем их, ..., ип и vx vn
следует, что оба эти равенства должны быть тождествами, т. е. что
п п
В матричной записи это дает
Таким образом, матрица А = (a{j) имеет обратную, т. е. регулярна.
B) Предположим теперь, что А регулярна, и пусть В — обратная
к ней матрица. Пусть аи .... ап — система линейно независимых
векторов. Рассмотрим векторы
Очевидно, что
L(vu .... vj?L(ut «
Но
п п
*<л + • • • + *гп»»=2 Vji«i + • • • + 2
J=l ^=1
отсюда
?(«i «.)Ei("i *
и, следовательно,
Так как векторы иг ап линейно независимы, то, по следствию
теоремы VI § 1, и vt vn линейно независимы. Этим доказатель-
доказательство теоремы закончено.
Если дана /?Х?-матрица C = (ci}), то мы можем рассматривать р
ее строк
§ 3. КВАДРАТНЫЕ МАТРИЦЫ 67
как р левосторонних 9"вект0Р0В< Мы будем говорить о них как
о q-векторах, определяемых строками матрицы С; при этом мы
всегда будем рассматривать их как левосторонние векторы. Второй
критерий регулярности матрицы дает
Теорема II. «Xй'матрица А регулярна тогда и только
тогда, когда п-векторы, определяемые строками этой матрицы,
линейно независимы.
Как и в предыдущей теореме, обозначим через uv ..., ип
п линейно независимых векторов, а через vu ..., vn — векторы,
в которые и{ преобразуются с помощью матрицы А.
A) Предположим, что и-векторы (а^ atn) линейно незави-
независимы. Тогда, если
2*^ = 0 (; = 1 я),
то мы должны иметь bt = 0 (t=l и). Допустим теперь, что
vx vn удовлетворяют соотношению
из него следует, что
п п
2 *АА + • • • + 2 hainun = 0.
Но ult ..., ип линейно независимы, поэтому
2=o (; = i я).
откуда вытекают, как мы только что отметили, равенства
*< = 0 (г=1 я).
Таким образом, vu ..., vn линейно независимы, а отсюда, по тео-
теореме I, следует, что матрица А регулярна.
B) Предположим теперь, что А регулярна. Тогда vv ..., vn
линейно независимы. Допустим, что и-векторы (ап, ..., а{п) линейно
зависимы; в таком случае в теле К существуют элементы bx,...,bn,
не все равные нулю, удовлетворяющие условиям
Тогда
i.
= 2 V.i«i + • • • + 2 btainun = 0 ut + ... + 0 un ¦¦
5* * •
68 ГЛ. И. ЛИНЕЙНАЯ.-АЛГЕБРА
что означает линейную зависимость векторов vt vn. Из полу-
полученного противоречия мы должны заключить, что «-векторы, опреде-
определяемые строками матрицы А, линейно независимы.
Аналогичными рассуждениями доказывается
Теорема III. Если А есть рУ^ п-матрица и если лево-
сторонние п-векторы, определяемые ее строками, порождают век-
векторное пространство размерности г, то при условии, что векто-
векторы их, .... ип линейно независимы, пространство L {vv ..., vp), где
имеет размерность г.
Рассмотрим векторы, определяемые строками матрицы А:
аг = («<1. .-., ain) (i=l, .... р).
Векторы .а( , .. , ais, выбранные из ах ар, будут линейно за-
зависимы или независимы одновременно с соответствующими векторами
vti, ..., vt . Действительно,
в том и только в том случае, когда
5 *<а</ = 0 (У=1 «).
*» {в
так как и1, .. ., и„ линейно независимы.
Отсюда следует, что если максимальное число линейно независи-
независимых векторов из аи ..., ар есть г, то максимальное число линейно
независимых векторов из vt vp также равно г. Теорема до-
доказана.
Теорема IV. Если А — некоторая р X п-матрица и если р
левосторонних векторов, определяемых строками этой матрицы,
линейно независимы, то р < « и существует такая (я — р) X я-
матрица В, что п X п-матрица
регулярна.
Мы видели выше (стр. 58), что в качестве минимального базиса
пространства всех «-векторов можно взять систему из п векторов
Следовательно, максимальное число линейно независимых «-векторов
равно «. Поэтому р ^ п. Пусть теперь uv ..., ип — система из п
линейно независимых векторов, и пусть
- . . . -\-ainun (?= 1 р).
§ 4. ПРЕОБРАЗОВАНИЯ МАТРИЦЫ 69
Как было установлено при доказательстве предыдущей теоремы, эти
векторы vlt . .., vp линейно независимы. Применяя теорему о замене
(теорема V § 1), мы заключаем, что существует такая перестановка
ilt .. ., in чисел 1 я, что если положить
^ = «4, G=Р+1 и). -:—
то векторы vlt ..., vn будут образовывать базис пространства
L(ut м„). Этот базис будет минимальным. Следовательно, если
«« = «йв1+-"+в*»а» (*=!,. ¦¦¦. и),
то, по теореме I, матрица C — (cfj) регулярна. Но
где В есть (я — р) X «-матрица, h-я строка которой имеет вид
Это доказывает теорему.
§ 4. Преобразования матрицы
Пусть А есть некоторая р X ^-матрица, и пусть щ, .... а? —
система из q линейно независимых векторов; они преобразуются
с помощью матрицы А в р векторов, которые мы обозначим через
v1 vp. Как мы знаем,
L(Pu •••> vp)cL{ut uq).
При рассмотрении векторных пространств L (vt, ..., vp) и
L (ult .. ., aq) мы имеем возможность изменять их базисы, не из-
изменяя самих пространств. Так как векторы ut uq были, по
предположению, линейно независимы, то новая система векторов
«1, ..., Uq представляет собой минимальный базис для L(ut,..., uq)
в том и только в том случае, если фигурирующая в равенстве
A)
(где, в обозначениях § 2, i/=[at aq], U* = [til, . . ., ua])
q X ^-матрица Q регулярна (§ 3, теорема I).
Если и ^ vp линейно независимы, то аналогичное сообра-
соображение применимо и к L(vt vp). Система vi vP является
минимальным базисом для L(vu '. . ., vp) в том и только в том слу-
случае, когда
V* = PV, B)
70 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
где Р — регулярная р X ^-матрица. В этот результат потребовалось
бы внести изменения, если бы векторы vt ¦»„ были линейно
зависимыми. Однако в рассматриваемых случаях Р всегда будет
регулярной р X ^-матрицей, и если V* = PV, то V^P V*. Сле-
Следовательно,
Ц«Г vl)^L(vt vp)cL(vl vp),
так что
\..., v*p) = L(г/j vp).
Таким образом, достаточным условием того, что равенство B) опре-
определяет замену базиса в L(vv ..., vp\ является регулярность ма-
матрицы Р. Простые примеры показывают, что это условие в случае
линейной зависимости векторов vu ..., vp не необходимо.
В случае, когда Q и Р — регулярные матрицы, говорят, что
соотношения A) и B) определяют допустимые преобразования ба-
базисов иг uq и i/j vp пространств L(uv .... uq) и L{v1 vp).
Такие допустимые преобразования приводят к замене матричного
равенства
V=AU
(связывающего vv . .., vp с ut и?) равенством
V* = A*U*,
где
А* == PAQ.
Заметим, что
(б) если A* = PAQ (Р и Q регулярны), то A = P-1A*Q-1;
(в) если А* = PAQ и Л** = P*A*Q*, то А** = (Р*Р) A (QQ*).
Таким образом, соотношение между Л и Л* рефлексивно, симмет-
симметрично и транэитивно; следовательно, оно является соотношением экви-
эквивалентности (гл. I, § 2).
Целью настоящего параграфа является установление некоторой
канонической формы для р X ^-матриц. Иначе говоря, мы определим
такую систему р X ^-матриц, что:
A) никакие две матрицы этой системы не будут эквивалентны
между собой в установленном выше смысле;
B) для каждой р X «^-матрицы будет существовать эквивалент-
эквивалентная ей матрица, принадлежащая этой системе.
Начнем с доказательства существования числовой характеристики,
инвариантной относительно введенного соотношения эквивалентности.
Обозначим черев гА максимальное число линейно независимых
векторов среди ^-векторов, определяемых строками матрицы Л.
Если все эти ^-векторы являются нулевыми, то гА = 0. По тео-
теореме III § 3, это число гА равно также максимальному числу линейно
§ 4. ПРЕОБРАЗОВАНИЯ МАТРИЦЫ 71
независимых векторов из числа vv ..., vp. Другими словами,
гл совпадает с размерностью пространства L (vlt ..., v ). Но
Поэтому г& равно также максимальному числу линейно независимых
векторов в системе v{, ..., гу Следовательно, гА = гд,. Заметим
теперь, что равенствами
PAU и У*
определяются одни и те же векторы пространства
L(uv .... ид) = ?(и?, .... aq).
А это означает, что число линейно независимых строк матрицы РА
совпадает с числом линейно независимых строк матрицы А* = PAQ
и что оба эти числа равны числу линейно независимых векторов
системы v*, ..., г/* которое, как мы установили, совпадает с гА .
Условившись называть число гА построчным рангом матрицы А,
мы можем высказать следующую теорему:
Теорема I. Построчный ранг матрицы А равен построчному
рангу матрицы PAQ, где Р и Q—любые регулярные матрицы.
Эта теорема охватывает и частные случаи Q — E^ или Р = Ер;
в этих случаях получаются соответственно матрицы РА и AQ. Таким
образом, при умножении матрицы А справа или слева на регуляр-
регулярную матрицу ее построчный ранг не изменяется.
Замена векторов vt, ..., vp теми же векторами, взятыми в неко-
некотором другом порядке v{ vt , является преобразованием
с регулярной матрицей Pv В самом деле, каждая подстановка чисел
1, ..., р имеет обратную, и потому существует матрица, обратная
к Pv Выберем матрицу Pt так, чтобы первые гЛ из переставленных
векторов были линейно независимы. Обозначим переставленные век-
векторы через
•»i,i (У==1 Р)-
Тогда в силу того, что векторы
линейно зависят от первых гА векторов, мы имеем
ГА
72 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
Пусть
V1 • • • ьр, гА
ЕГА
Поскольку
матрица Р2 регулярна. Если мы положим
и обозначим преобразованные векторы через v%1, .. ., г»,,^, то векторы
vu (/=1 гя)
будут линейно независимыми, а остальные — нулевыми:
v2J = 0 U = rA+l р).
Так как
= AJJ,
где положено Р2Р1А = А2, и так как векторы и1г .... aq линейно
независимы, то последние р — гА строк матрицы Л2 состоят сплошь
из нулей. Мы можем поэтому написать
где С есть гА X ^-матрица. По теореме о замене, мы можем заме-
заменить гА векторов из числа их, ..., и линейно независимыми векто-
векторами v9<1, ..., v2ir и таким образом получить новый базис для
L{u1 uq). Но прежде чем делать это, сделаем преобразование
которое лишь переставляет векторы at, ..., uq так, что подлежащими
замене оказываются первые гА векторов. Замена запишется в виде
преобразования
§ 4. ПРЕОБРАЗОВАНИЯ МАТРИЦЫ 73
с регулярной матрицей Q2. В итоге мы получим, что
*ЭД9\„ /ZT
О
где D = (dy) = CQjQ2. Рассмотрим первые гл равенств, задаваемых
последним матричным соотношением. Так как
то этими равенствами будут
2.< J=l Ч *.J ' ¦¦" А-
Но векторы и%1 n9q линейно независимы. Поэтому
Таким образом,
\0/ \О О
т. е.
гА О
) о,
Из регулярности же матриц Рх, /\, Qx, Q2 следует, что и матрицы
Р=:Р^Р1 и Q = QXQ^ регулярны. Тем самым доказана
Теорема II. Если р X Ц-матрица А имеет построчный ранг гА,
то А эквивалентна матрице
О О
Иногда бывает удобно осуществлять приведение матрицы А к этой
канонической форме последовательным выполнением элементарных
шагов — так называемых элементарных преобразований. Элементар-
Элементарными преобразованиями базиса (не обязательно минимального) wlt ..., wr
векторного пространства L(wv ..., wr) называются
A) перестановка двух векторов wf, wf
(II) умножение произвольного базисного вектора wt на отличный
от нуля элемент из К;
(III) прибавление к произвольному базисному вектору любого век-
вектора, линейно зависящего от остальных г — 1 векторов базиса.
Каждое из этих преобразований базиса может быть выражено
равенством
74 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
с регулярной матрицей R, так как для каждого из них легко построить
обратное преобразование, которое также будет элементарным. Отсюда
следует, что последовательное выполнение нескольких элементарных
преобразований базиса, приводит к замене базиса на эквивалентный
и является обратимым.
Рассмотрим теперь равенство
V=*AU,
или, что то же, систему равенств
я
«< = S<V^ («=1 Р)-
Если гА ф О, то существует по крайней мере один элемент матрицы А,
скажем а^, отличный от- нуля. Применением элементарных преобра-
преобразований типа (I) к базисам и1г ..., uq и vr vp мы можем полу-
получить новые базисы, обозначим их через и1л, . .., ulq и vltl, ..., vliP,
такие, что в соответствующем соотношении
будем иметь а1Л1 = ау ф 0. Преобразованием типа (II), примененным
к atl, мы можем добиться того, чтобы а1Л1 стало равным 1. Затем осу-
осуществим преобразование типа (III) базиса н1Л, ..., ali3, определяемое
равенствами
я.
S
и2 . = ut j (j = 2 q).
Это преобразование приведет к следующему матричному равенству:
где
Л = E я)«
\С В)
а С — некоторая (р — 1) X 1 -матрица,
Проведем затем следующее преобразование базиса vltl, ..., V\,p'-
Это преобразование можно осуществить в виде последовательности
нескольких преобразований типа (III). После этого получаем соотно-
соотношение
§ 4. ПРЕОБРАЗОВАНИЯ МАТРИЦЫ 75
где
(Ех О
А*-{ о ву
Поскольку максимальное число линейно независимых строк матрицы Л3
совпадает с этим числом для А, т. е. равняется гА, мы сразу по-
получаем, что построчный ранг матрицы В равен гА — 1.
Покажем теперь с помощью индукции, что матрицу А можно
привести к канонической форме последовательными элементарными
преобразованиями базисов пространств L(vv ..., vp) и /.(«j uq).
При rA = 0 нечего доказывать, так как в этом случае А — нулевая
матрица. Предположим теперь, что утверждение справедливо для
матриц, построчный ранг которых меньше гА. По доказанному выше,
А можно привести с помощью элементарных преобразований к виду
ON
О Bj
где В имеет ранг гА—1. По предположению индукции, мы можем
привести матрицу В к канонической форме с помощью элементарных пре-
преобразований, примененных к г/2>2 v%]) и а22, .... u%q. Но эти
элементарные преобразования можно рассматривать и как элементарные
преобразования базисов г»2Л, i/2i2, .... v%p и а21, и22 a2g.
Таким образом, наше утверждение доказано.
В качестве следствия получается
Теорема III. Каждое допустимое преобразование
базиса векторного пространства L(ult ..., uq) размерности q
является результатом конечной последовательности элементар-
элементарных преобразований.
Действительно, мы можем применить доказанное выше утверждение
к системам векторов н* и* и иу . .., uq и привести матрицу Р
к канонической форме. Предположим, что соответствующей последо-
последовательностью элементарных преобразований с матрицами Qv ..., Qa,
осуществленных над векторами а*, ..., и* и системой элементар-
элементарных преобразований с матрицами Rt Rb, осуществленных над век-
векторами «J uq, первая система векторов переводится в v*, ..., v*,
а вторая — в vt, .. ., vq. Если матрица, выражающая соотно-
соотношение между г»* и v., имеет каноническую форму, то справедливы
равенства
«1 = "« ('=! />).
Но, в силу регулярности Р, rp=*q. Следовательно, равенство
U* = PU
76 ГЛ. ГГ. ЛИНЕЙНАЯ АЛГЕБРА
переходит в
V* == EaV.
Но
Поэтому
QaQa-i ¦ ¦ • QiPRT1 • • • RbliRb1 = Ev
откуда
P = QT1...Q?Rb...Rl.
Поскольку вместе с Qj и матрица QJ соответствует элементарному
преобразованию, теорема доказана.
§ 5. Ранг матрицы
До сих пор мы строили теорию матриц, базируясь на рассмотре-
рассмотрении левосторонних векторов; в частности, мы и строки рХр-матрицы
рассматривали как левосторонние <7-векторы. Теперь мы посмотрим,
какие получаются результаты, если рассматривать правосторонние
векторы.
Теорию правосторонних векторов можно непосредственно вывести
из результатов § 1. Пусть xv ..., хр — система из р таких векто-
векторов. Они называются линейно независимыми над К, если из равенства
х1а1-\-...-]гхрар = 0 (а{?К)
всегда следуют равенства
д. = 0 (/=1 р).
Если
У = ЖА+•••+*&*
то говорят, что у линейно зависит от хх, .... хр. Затем можно полу-
получить теоремы, аналогичные теоремам I—VII § 1; заметим, что в ана-
аналоге теоремы VII будет устанавливаться изоморфизм между множеством
правосторонних векторов размерности р и множеством строк
К V-
для которых определено умножение на элементы из К справа.
Произвольная р X <7-матрица А = (а^) преобразует р правосторон-
правосторонних векторов х1г ..., хр в q векторов ylt .... yq, где
р
2 (j = i. •••. я)-
yj
Отправляясь от этого равенства, можно вывести результаты, подобные
полученным в §§ 2—4. Самый важный из них, с нашей точки зре-
зрения, заключается в том, что если xt xp- линейно независимы, то
§ 5. РАНГ МАТРИЦЫ 77
максимальное число линейно независимых векторов среди ух yq
равно максимальному числу линейно независимых столбцов матрицы А,
рассматриваемых как правосторонние векторы. Мы назовем это
число постолбцовым рангом матрицы А. Как и в § 4, можно пока-
показать, что если матрица А имеет постолбцовый ранг sA, то существуют
регулярные матрицы Р и Q, удовлетворяющие соотношению
PAQ = t
\ 0 0.
Но мы видели в § 4, что построчный ранг матрицы А равен построч-
построчному рангу матрицы PAQ, который, очевидно, совпадает с sA. Сле-
Следовательно, справедлива '
Теорема I. У каждой py^q-матрицы А максимальное число
линейно независимых строк, рассматриваемых как левосторонние
векторы, равно максимальному числу линейно независимых столб-
столбцов, рассматриваемых как правосторонние векторы.
Это число rA = sA мы будем называть рангом матрицы А. Напом-
Напомним, что, по теореме II § 3, п X «-матрица регулярна тогда и только
тогда, когда ее ранг равен «.
Строки матрицы А мы можем рассматривать и как правосторонние
векторы, а столбцы — как левосторонние векторы, если поменяем
ролями строки и столбцы. Будем называть транспонированной матри-
матрицей по отношению к матрице A q X р-матрицу
где
Очевидно, что максимальное число линейно независимых строк матри-
матрицы А', рассматриваемых как левосторонние векторы, равно максималь-
максимальному числу линейно независимых столбцов матрицы А, рассматривае-
рассматриваемых также как левосторонние векторы, а максимальное число линейно
независимых столбцов матрицы А', рассматриваемых как правосторон-
правосторонние векторы, совпадает с максимальным числом линейно независимых
строк матрицы А, также рассматриваемых как правосторонние век-
векторы. По предыдущей теореме, эти числа равны и дают ранг матрицы А'.
В случае коммутативности тела К левосторонние и правосторонние
векторы идентичны, и потому справедлива
Теорема II. Если основное тело К коммутативно, то ранг
произвольной матрицы А совпадает с рангом транспонированной
матрицы А'.
Заметим, что в случае некоммутативности К эта теорема, вообще
говоря, несправедлива. Действительно, по предположению, К содержит
по крайней мере два таких элемента а и Ь, для которых
ab Ф да.
78 ГЛ. П. ЛИНЕЙНАЯ АЛГЕБРА
Оба эти элемента отличны от нуля. Рассмотрим 2 X 2-матрицу
\р abj'
Если
то
pa-\-qab = 0.
Отсюда
— qba -j- qab = 0,
т. е.
q (ab — ba) — 0.
Поскольку К есть тело и ab ф ba, мы заключаем, что q = 0. Поэтому
р = — qb = Q, Следовательно, строки матрицы А, рассматриваемые
как левосторонние векторы, линейно независимы, и ранг ее равен 2.
С другой стороны, уравнение
A, a)p-\-(b, ab) q = 0
удовлетворяется при p — b, q = — 1, так что ранг матрицы А' равен 1.
Часто применяется следующая
Теорема III. Каждая pXq-матрпца А ранга г содержит
подматрицу типа г X г и ранга г. Ранг любой подматрицы ма-
матрицы А не превосходит г.
Поскольку А — матрица ранга г, она имеет г линейно независи-
независимых строк. Каждая из остальных строк линейно зависит от этих г
строк. Матрица В, определяемая г линейно независимыми строками,
является г X ^-матрицей ранга г. Вспоминая доказательство теоремы IV
§ 3, мы видим, что существует такая (с/ — г) X ^-матрица С, что
матрица
регулярна, причем А-я строка матрицы С имеет вид
где (it iq) — некоторая перестановка чисел 1 q. Так как
матрица D регулярна, ее ранг равен q, и потому ее столбцы, рас-
рассматриваемые как правосторонние векторы, линейно независимы.
В частности, линейно независимы столбцы с номерами ^ ir. Но
эти столбцы содержат в последних^ — г) строках матрицы D только
нули. Отсюда вытекает линейная независимость столбцов г X /"-мат-
/"-матрицы /, состоящей из ^-го, ..., /г-го столбцов матрицы В. Таким
образом, матрица / имеет ранг г, чем доказана первая часть теоремы.
§ 6. ОДНОРОДНЫЕ ЛИНЕЙНЫЕ УРАВНЕНИЯ 79
Допустим, что матрица А имеет подматрицу F ранга s > г, F со-
содержит s линейно независимых строк. Пусть эти строки расположены
в /j-й у8-й строках матрицы А. Поскольку s > г, существуют
такие элементы bt из К, не все равные нулю, что
2 *«««, = 0 (;=1 q).
Но так как написанные равенства распространяются, в частности, и
на столбцы, в которых расположена подматрица F, то отсюда выте-
вытекает линейная зависимость строк матрицы F, вопреки предположению
об их независимости. Это противоречие доказывает вторую часть
нашей теоремы.
§ 6. Однородные линейные уравнения
Пусть А — матрица типа р X Ч наД телом К. Рассмотрим строки
(xlt .... xq), удовлетворяющие уравнениям
Если У = (у1, •'••, Уд) и z = (z1, ..., zq) — две такие строки, то
строка
уь+zc = (^ 4- ^ic yj> 4- v)
также удовлетворяет уравнениям A) при любых ? и с из /С. Это
означает, что строки {хх xq), удовлетворяющие уравнениям A),
образуют правостороннее векторное пространство. Каждый вектор
этого пространства называется решением системы A) левосторонних
однородных линейных уравнений. В этой системе строка (х± xq)
называется неизвестным. Такое соглашение делается особенно есте-
естественным, если записывать систему A) в матричной форме
Ах = 0, B)
где
у* Г V* ^ 1
Пусть А — матрица ранга г. Тогда существуют регулярные мат-
матрицы Р и Q, удовлетворяющие соотношению
PAQJE'
О 0>
Пусть y = [yv . . ., yq\ — решение уравнения B) и z = Q~ly. Тогда
Отсюда заключаем, что
80 ГЛ. И. ЛИНЕЙНАЯ АЛГЕБРА
С другой стороны, пусть zr+1 zq— произвольные элементы не-
некоторого расширения тела К и пусть г = [0 0, zr+l, ..., zq],
y = Qz. Тогда
fEr ON
Итак, все решения уравнения B) находятся следующим образом: если
Z = [0, . . ., 0, Zr+1, . . ., Zg],
где ггл.ъ ..., zq — неизвестные, то произвольное решение у уравне-
уравнения B) получается путем соответствующей специализации этих не-
неизвестных в выражении Qz.
Если мы положим
*» = № 0, 8л>г+1 8М] (А = г+1, .... q),
то получим минимальный базис пространства решений. Таким образом,
пространство решений имеет размерность q — г.
Обозначим это пространство, состоящее из правосторонних векто-
векторов, через R; далее, через L обозначим пространство левосторонних
векторов, определяемых строками матрицы А. Если
а = К aq)
— некоторый вектор из L, то мы можем написать
р
2
Если у — вектор из R, то
р р
• • • + «д .Уд = 2 РРц?1 +•••' + 2 Р
2 2
Векторы а и у называются полярными.
Аналогично может быть развита теория правосторонних однород-
однородных линейных уравнений
2*А, = о (j=i,...,s). C)
Можно доказать, что если матрица
имеет ранг t, то решения системы C) образуют левостороннее вектор-
векторное пространство размерности q — t. В частности, рассмотрим случай,
§ fl. ОДНбРОДНЫЁ ЛИНЕЙНЫЕ УРАВНЕНИЯ 81
когда столбцами матрицы В являются правосторонние векторы, обра'
зующие базис пространства R решений системы B). Тогда
и решения системы C) образуют левостороннее векторное простран-
пространство размерности
q — t = r.
Но отсюда следует, что каждый вектор из L является решением
системы C) и, следовательно, что L представляет собой пространство
решений системы C).
Таким образом, пространства L и R дуальны, каждое из них
определяет другое однозначно.
Закончим настоящий параграф следующей теоремой, доказательство
которой опирается на предыдущие результаты.
Теорема 1. Если А— матрица типа /?Х? и ранга гА, В—
матрица типа qy^r и ранга гв, то С — АВ является pYj-мст-
рицей, ранг rG которой удовлетворяет неравенствам
(I) Поскольку матрица В имеет ранг гв, существуют регулярные
матрицы Q (типа q~X.q) и R (типа г X г), удовлетворяющие соотно-
соотношению
(B о)*' D)
По теореме I § 4, матрицы
С* = С/?-1 и A* = AQ E)
имеют ранги га и гА. Положим
Л* = 04*Л*2),
где Л* —матрица типа рХ.гв, а Л* — типа />Х(<7 — гв^- Матрица Л*
имеет га линейно независимых столбцов, рассматриваемых как право-
правосторонние векторы. Отсюда следует, что Л* имеет по крайней мере
га— (9 — гв)
линейно независимых столбцов, так как каждое множество, состоящее
из гА столбцов матрицы Л*, содержит не менее гА—(q — гв) столб-
столбцов из А*. Следовательно, ранг матрицы (Л* 0) больше или равен
га+гв— Я-
Но
(Л* 0) = (Л; Лр (ЕЪ ^ = AQ (*?> ^ = ABR-i - C/?-i = С*
С Зак. 1230. В. Холж в Л- Пидо
ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
[мы использовали здесь равенства D) и E)]. Так как С* имеет ранг гс,
то из последней цепочки равенств следует, что
(II) Решения уравнения
Сх = 0 F)
образуют правостороннее векторное пространство R размерности г—го.
Если у— некоторое решение уравнения
Вх = 0, G)
то
Су = АВу = 0.
Итак, каждое решение уравнения G) является решением и уравнения F).
Но решения уравнения G) образуют векторное пространство 5 раз-
размерности г — гв. Поскольку Sc/?, выполняется неравенство
г - го'<
отсюда
Если вместо уравнений F) и G) рассмотреть уравнения
хС = 0 и хА = 0,
то получится соотношение
го<гА.
Таким образом,
ro<min(rA, rB),
чем и завершено доказательство теоремы.
§ 7. Матрицы над полем
В §§ 7—10 этой главы мы будем предполагать, что основное
тело К коммутативно, т. е. является полем. Ббльшая часть резуль-
результатов, которые мы получим, не зависит от характеристики поля, но
некоторые теоремы будут установлены лишь для случая поля без
характеристики. Если не оговорено противное, то под К мы будем
понимать произвольное поле без каких-либо ограничений, наложенных
на его характеристику.
В таких предположениях ранг матрицы А совпадает с рангом
транспонированной матрицы Л7 (§ 5, теорема 2). В частности, если
А — регулярная «Х«-матрица, то и А' — регулярная п X я-матрица.
п X я-матрица ранга, меньшего п, называется вырожденной, так
что термины „невырожденная матрица" и „регулярная матрица" —
синонимы.
S 7. МАТРИЦЫ НАД ПОЛЕМ 83
Установим, как получается транспонированная матрица для произ-
произведения АВ матрицы А типа /?Х<7 и матрицы В типа ^Х*"- Пусть
АВ = С = (су),
где
Су — ^J **ik"kj \l — ^ > ¦ • • > P' J — ^t • • • i '/•
Если С — матрица, транспонированная к С, то
3 Q Q
Л=1 Л=1 *=1
так как тело К коммутативно. Следовательно,
С = В'А'.
Пусть теперь Л — невырожденная яХ^-матрица. Тогда матрица А'
также невырождена и потому имеет обратную
Поэтому
А'В = В А' = Еп,
откуда
Но (Л')' = Л; следовательно,
В'Л = ЛВ' = Еп,
т с
В'^Л-1, или В = (Л-1)'.
Итак, для невырожденной матрицы А
Матрицу (Л') мы будем обозначать через Л и называть ее допол*
нительной матрицей для Л.
Итак, мы имеем три способа построения новых лХ^-матриц из
заданной невырожденной «Х^-матрицы: образование обратной, транс-
транспонированной и дополнительной матриц. Обозначим через 5 операцию
перехода к обратной матрице, через Г — к транспонированной, через
U — к дополнительной. Тогда, очевидно,
ST=TS=U
6*
84 Рл. Н. Линейная алгЁбРА
где Е — тождественная операция, оставляющая матрицу А без изме-
изменений. Операции Е, S, T, U составляют, таким образом, абелеву
группу.
Отметим еще следующие непосредственно проверяемые свойства
этих операций:
(ляу-^-я-м-1,
(АВ) = АВ,
где А и В — «Х^-матрицы. Первое свойство справедливо как для
регулярных, так и для нерегулярных матриц. Оба первых свойства
имеют место для матриц над любым телом К, и только в последнем
случае нужно требовать, чтобы К было полем.
§ 8. Определители
Если основное тело К коммутативно, то можно ввести в рассмо-
рассмотрение определители и притом точно так же, как они строятся в слу-
случае поля комплексных чисел. При этом и большинство свойств опре-
определителей с элементами из любого поля подобно соответствующим
свойствам определителей в случае поля комплексных чисел. Мы
ограничимся кратким обзором главных результатов, которые нам по-
понадобятся в дальнейшем.
Начнем с определения некоторых часто употребляемых символов.
(I) Символ
г I"» (или s,- л )
in
отличен от нуля лишь в случае, если строка i1 in является пе-
перестановкой первых п натуральных чисел. При этом
если подстановка ( . . ; ) четна (гл. I, § 1),
и
s*l""*n __ в< { j
если эта подстановка нечетна.
Нам будет удобно употреблять обе записи введенного символа.
В теории тензоров они имеют разные значения, но мы различать эти
записи не будем.
(II) Символ
отличен от нуля лишь в случае, если строки iv ..., ip и д, ..., ]р
являются перестановками одного и того же множества из р различ-
§ 8. ОПРЕДЕЛИТЕЛИ
85
ных целых чисел, лежащих между 1 и л. В этом случае (. .р)
VI • • • 1р/
является подстановкой р'элементов. По определению,
(«Г-
если эта подстановка четна, и
в противном случае. Очевидно, что
(и)
Знак («) под символом 8 обычно опускается, если это не может
вызвать недоразумений.
Пусть теперь A = (a{j) — матрица типа «Хя- Ее определитель |Л|
выражается равенством
«12 ... ах
й21
• а>ш
.*. —
i1=i V_i
Из этого определения непосредственно следует, что если B = j
матрица типа pY^q, а А — ее подматрица типа яХя, элементы кото-
которой расположены в /г-й, ..., in-H строках и jt-u jn-u столбцах
матрицы В, то
ftJ=i лп=1 й»; И "И
Каждый такой определитель называется минором порядка п мат-
матрицы В.
Теорема I. Если А — матраца типа «Х«, а А' — транспо-
транспонированная к ней матраца, то
\А\ = \А'\.
В разложении определителя | А | рассмотрим произвольный член
в котором г1 '"S фО. Здесь ix in — некоторая перестановка
чисел 1, .... п, которой соответствует (гл, I, §jl) подстановка
1 2 ...» \
86
ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
Пусть
1 2 ... я
Jl /й • • • In,
— обратная подстановка. Обе эти подстановки имеют одинаковую
четность, и потому
_*i --• *« _Л •¦• in
Путем перестановки сомножителей в произведении д<д ... ain«
получаем, что
мы
Отсюда вытекает справедливость равенства
Наоборот, каждое произведение вида
в котором 8-символ не равен нулю, однозначно определяет член
в выражении для определителя |Л|. Поэтому
п п
:2...
Теорема II (Лапласа). Имеет место равенство
аиам ... а1п
...а.
'p + 1
... а,-
где jv .... jn—некоторая фиксированная перестановка чисел
1, ..., п. Суммирование проводится по всевозможным разбиениям
системы чисел 1, ..., п на две подсистемы
L < i <...</ в / < < i
(так что всего в сумме С% слагаемых), a pf = 1 или — 1 в соот-
соответствии с четностью или нечетностью подстановки ( .
§ 8. ОПРЕДЕЛИТЕЛИ
87
Путем перестановки сомножителей а^ в членах выражения для \А\
мы получаем
n n
— У, . . . 2j 8 i '" Паъ,л, . . . uj.
Но
Поэтому
'»,*•-*п.
В сумме, стоящей справа, рассмотрим те члены, в которых строки
Aj kp являются перестановками чисел iv ..., ip, а строки
?p+i> •••> *п — перестановками чисел ip+1 in. Всего таких чле-
членов, очевидно, /?!Х(га — РУ> а сумма их равна
... д.
Следовательно,
v • • • \>,
' ' ' *
«Л ¦ ¦ ¦ \jp
a yx • • ¦ V,
a. . ... a,
*p+l3p+l %p+l3n
ai j ••• ai j
Этот результат обычно называют разложением определителя по
]\-му jp-му столбцам.
Опираясь на теорему I, получаем подобное же разложение опре-
определителя по р выбранным строкам.
Теорема III. Определитель с двумя одинаковыми столбцами
{строками) равен нулю.
В случае п = 2 прямой подсчет показывает, что
а а
b Ъ
Теперь предположим, что в определителе из п строк и я
столбцов («>2)^Л-й и fc-й столбцы тождественны, Разложим
ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
определитель по этим двум столбцам:
а„ ... а.
\*
i,h
а. , ... а. .
аи1 • • • апп
Здесь h, k, Уц, .... У„ — некоторая перестановка чисел 1, .... п. Но
при любых значениях it и г2; пбэтому теорема в применении к столб-
столбцам доказана. Соответствующий результат для строк вытекает из
доказанного на основании теоремы I.
Разложим | Л | по й-му столбцу:
*ге,1
дп,Л-1 ал,й + 1 • • • av,n
Обозначив коэффициент при aih в этом выражении через Ahi, будем
иметь
п
\А | = 2 aihAM.
4 = 1
С другой стороны, при h=hk
п
2 а«^м = 151,
где В — матрица, получающаяся из А, если в ней на место
А-го столбца поставить (вторично) А-й столбец. По теореме III,
|5| = 0. Итак,
Если бы мы произвели разложение по строке, то получили бы
аналогичное равенство
Коэффициент Aji назызается алгебраичещим ддполщшем элемента atj
? \А\.
§ 8. ОПРЕДЕЛИТЕЛИ
89
Докажем теперь следующую теорему.
Теорема IV. Если А, В, С — матрицы типа п'Х.п и С = АВ,
то
Если С = (су) =
\ = \А\.\В\.
Л.Д т0
±
n n n n
2 J, J2
Теорема V. Если А — матрица с п столбцами, а В — ма-
матраца с п строками, то произвольный манор порядка t матрицы АВ
разен сумме, каждый член которой предстазляет собой произ-
произведение минора порядка t матрацы А на манор того же порядка
матрицы В.
Пусть Л = («у) — матрица типа р X л,' В = С by) — матрица типа
п X Я, так что С = (с^) = АВ является р X ^-матрицей.
Каждый минор D порядка t матрицы С имеет вид
Это означает, что
p p
= 2.--2
Д
Д
=2-..2
. «,„><»«... v,>
«,,„><»«
90
ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
Но
ahh
.. . a.
''¦•¦•'*
¦ ¦ ¦ a
hut
где суммирование 2 проводится по Сп системам из различных чисел
в
gx < ... < gt, которые могут быть выбраны из множества 1, .. ., п.
Поэтому
"«1»1 • • • ahi
Vi
Итак, мы доказали, что
==2
где суммирование проводится по всем системам gt < g0 < ... < gt.
Именно в такой записи мы будем пользоваться этой теоремой впо-
впоследствии.
В следующем параграфе нам потребуются приводимые ниже зна-
значения некоторых определителей. Они могут быть легко получены
разложением определителей по строкам или столбцам.
а± О ... О
0
... О
О 0 ...ап
Этот определитель имеет отличные от нуля элементы лишь на глав-
главной диагонали: аи = аь а% = 0 (I ф j).
ах 0 ... О ... О ... О
О ... О ... О
0 а.,
0 0
0 0
О
0
О 0 ... О ,,. О ,
в».
§ 8. ОПРЕДЕЛИТЕЛИ 91
Отличные от нуля элементы стоят только на главной диагонали и еще
в одном месте (a{i = ait ahk = а для некоторой специальной пары
индексов A, k).
(f) Если А — (a{j), где
atj = \i (l <А<<«; i= 1 я; j = 1, ..., га),
то
Теперь перейдем к рассмотрению преобразований матрицы А,
соответствующих рассмотренным в § 4 элементарным преобразованиям
базиса векторного пространства. Эти преобразования таковы:
(а) перестановка двух строк матрицы А, скажем й-й и А-й;
(б) умножение элементов й-й строки на некоторый элемент из К;
(в) прибавление к элементам /г-й строки линейной комбинации
соответственных элементов других строк.
Преобразование (а) эквивалентно умножению матрицы А слева на
матрицу
в=(Кр) а /=1 «).
где
(К AJ = A А—1.Л, А+1 k—l,h.k+l «)•
Другими словами, матрица В получена из единичной матрицы пере-
перестановкой ее А-й и ft-й строк. Как видно из (f), |5| = — 1.
Таким образом, определитель при перестановке двух строк умно-
умножается на — 1.
Преобразование (б) эквивалентно умножению матрицы А слева
на матрицу
(bt 0 ... О
о v..o
о о ... ьп
где ^=1 при 1фк и bh = a. Согласно (ос), \В\ = а. Таким обра-
образом, при умножении элементов одной аз строк определителя на
элемент а этот определитель умножается на а.
Преобразование (в) можно расчленить на отдельные преобразования,
заключающиеся в прибавлении к элементам А-й строки соответствен-
соответственных элементов какой-нибудь одной из других строк (скажем k-u),
умноженных на одно и то же число (скажем bk; k принимает значе-
значения 1, ..., А — 1, A -J- 1 п). Для данного k это преобразование
эквивалентно умножению матрицы А слева на матрицу В типа (f3),
рассмотренного выше. При этом все элементы, стоящие по главной
диагонали матрицы В, равны 1, а элемент, стоящий в А-й строке
и k-u столбце, равен Ьк (все другие элементы матрицы В равны 0).
Таким образом, |?|= 1? и поэтому прибавление к элементам одной
92 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
из строк матрицы А линейной комбинации соответственных
элементов остальных строк не меняет величины определителя \ А |.
Все эти преобразования можно совершать и над столбцами
матрицы. При этом, если некоторое преобразование над строками
можно свести к умножению матрицы А слева на матрицу В, то
соответствующее преобразование над столбцами можно осуществить
путем умножения матрицы А справа на матрицу В1', транспонирован-
транспонированную по отношению к В. Но | В\ = | В' \,- Поэтому полученные выше
результаты остаются в силе, если в них всюду заменить слово „строка"
словом „столбец".
Остановимся теперь на некоторых свойствах алгебраических допол-
дополнений Ajt элементов ау определителя. Если
А = (а{)),
то матрица
называется присоединенной для А. Мы видели выше, что
п п
2 а,кАы = 2j амАт = ЬКк\А\.
Следовательно,
АА* = А*А = | А | Еп.
Поэтому, если | А \ ф 0, матрица
является обратной к А. Определитель этой матрицы равен
В самом деле, так как
то
откуда
Наоборот, если А имеет обратную матрицу В, то
|Л|-|Я| = 1,
и, следовательно,
\А\ФО.
Тем самым доказана
Теорема VI. Матрица А типа nyin невырождена тогда и
толгко тогда, когда ее определитель \А\ отличен от нуля.
Рассмотрим теперь случай, когда | А \ = 0. Мы имеем
г»
§ й. бпРЁДЁлЙтЁлИ
Но алгебраическое дополнение Ajq само является (с точностью до
знака) определителем, содержащим все строки и столбцы определи-
определителя \А\ за исключением q-ft строки и У-го столбца. Если умножить
предыдущее равенство на алгебраическое дополнение элемента ahk
в Aj4 и просуммировать затем по всем следующим значениям п:
q—\,q-\-\,...\n,
то получится равенство
где Ajg (I обозначает определитель, получающийся из A.g заменой
элементов а№ на аи для всех значений /. Так как
а при других значениях i
то равенство (¦*) приводится к виду
AitlAkp—AkqAjp = 0.
Таким образом, любые две строки (два столбца) присоединенной ма-
матрицы А* пропорциональны, и потому имеет место
Теорема VII. Если | А | = 0, то все миноры присоединенной
матрицы А*, кроме миноров первого порядка, равны нулю.
Теперь мы докажем следующую теорему:
Теорема VIII (Якоби). Справедливо равенство
¦ • ¦ Ahin
гйе /j, ..., /„ и y'j у'и — любые перестановки последователь-
последовательности чисел 1, .... и.
Пусть 5^—матрица, полученная из А перестановкой г-й и/-й
строк матрицы А. Если, в соответствии с обычными обозначениями,
элементы матрицы В*, присоединенной для В, обозначить через Brs,
ГЛ. П. ЛИНЕЙНАЯ АЛГЕБРА
то, как легко видеть,
Brs =
— Аг
0 =? «> А
Основываясь на этих равенствах, легко доказать, что из справедли-
справедливости доказываемого равенства для матрицы В вытекает справедли-
справедливость его и для матрицы А (и наоборот). Подобное же утверждение
верно, конечно, и в отношении матрицы, получающейся из А переста-
перестановкой двух столбцов. Поэтому, .если мы докажем теорему для слу-
случая, когда
k=ik = k {k=\ и),
то отсюда будет следовать справедливость теоремы в общем виде.
При р = 1 теорема верна по самому определению Ап. Если р > 1
и | А | = 0, то утверждение следует из теоремы VII. Предположим,
что \А\ФО. Тогда
ani
о
о
о
о
*p+l.p
anp
и потому
Ап . . . Aip
А\ =
ап,п
\А\р.
Отсюда вытекает нужное равенство, так как | А \ Ф 0.
В качестве частного случая этой общей теоремы получаем, что
\A*\ = \A\n-J.
Ранее мы уже видели (см. теорему VI), что п X «-матрица А не-
невырождена и, следовательно, имеет ранг п тогда и только тогда, когда
определитель | А | отличен от нуля. Теперь мы найдем новые связи,
ОПРЕДЕЛИТЕЛИ
существующие между минорами и рангом произвольной матрицы.
Если А — матрица типа р X Я и ранга г, то существует по крайней
мере одна ее подматрица типа г X Л имеющая ранг г, а каждая ее
подматрица типа s X s, где s > г, имеет ранг, не превосходящий г
и потому меньший s (§ 5, теорема III). По теореме VI отсюда сле-
следует, что определитель любой s X s-подматрицы (s > г) равен нулю.
Итак, справедлива
Теорема IX. Матрица А типа рХ<7 имеет ранг г тогда и
только тогда, когда А обладает отличным от нуля минором поряд-
порядка г, в то время как все миноры более высоких порядков равны нулю.
Если А = {аф — матрица типа р X Ч и ранга г, причем
то матрица
имеет ранг г. Следовательно, векторы, определяемые ij-й, ..., ir-9i
строками матрицы А, линейно независимы. Но так как А — матрица
ранга г, то векторы, определяемые строками матрицы А, порождают
пространство размерности г. Поэтому все строки матрицы А линейно
зависят от /j-й, ..., /г-й строк. Отсюда вытекает, что для решения
системы уравнений
нужно решить ее подсистему, соответствующую значениям / =
Для упрощения записи положим
и рассмотрим систему
Для нее
Изменяя нумерацию неизвестных, мы можем добиться, чтобы было
j = р (р = 1 г). Обозначим через В${ алгебраическое дополне-
дополнение элемента Ьц в определителе
bn... brr
ГЛ. И. ЛИНЕЙНАЯ АЛГЕБРА
Если (jfj, .... xq) — решение системы
*a = ° ('=1 О, C)
то
S2
т. е.
*п • • • К л-1
bn ... br ¦/t._1 brj br Jl+1 . .. brr
D)
Наоборот, если xr+1, ..., xq — произвольные элементы из К,
а хх хг выражаются через них с помощью равенств D), то
прямой подстановкой можно проверить, что строка {хг, ..., #g)
представляет собой решение системы C). Таким образом, мы полу-
получили точное описание всех решений системы A).
Теорема X. Система неоднородных уравнений
а
2 а*& = с{ (i= 1, .... р)
тогда и только тогда разрешима, когда матрицы
имеют одинаковый ранг.
Условимся называть матрицы, о которых говорится в формули-
формулировке теоремы, соответственно матрицей коэффициентов и расширен-
расширенной матрицей. Ранг расширенной матрицы не может быть меньше
ранга матрицы коэффициентов. Если система уравнений имеет реше-
решение, то последний столбец расширенной матрицы является линейной
комбинацией остальных столбцов. Отсюда следует, что ранг расши-
расширенной матрицы в этом случае равен рангу матрицы коэффициен-
коэффициентов. С другой стороны, если ранги обеих матриц совпадают, то по-
последний столбец расширенной матрицы линейно зависит от первых q
столбцов. Если равенства
с* = 2«<&- ('=1. •¦•. Р)
выражают эту линейную зависимость, то строка (ilt .... ?g) является
решением заданной системы.
Ни один из доказанных в настоящем параграфе результатов не
требует никаких предположений о характеристике поля К. Мы завер-
завершим этот параграф теоремой, справедливой для полей К, характери-
§ & ОПРЕДЕЛИТЕЛИ
стика которых отлична от 2. Сначала введем следующее определение!
Матрица А типа «Xя называется симметрической, если
' '-- " JTTL i
и кососимметриЧесИоА, если
Если А кососимметрична, тб
[Л| = |-Л'Н|-?
Следовательно, если п нечетно, то
При условии, что характеристика поля К отлична от 2, отсюда
вытекает соотношение
Для полей характеристики 2 эта теорема неверна. Действительно,
в случае поля характеристики 2 матрица
/ah g\
A = [h b f
\g f
кососимметрична, так как любой элемент / такого поля удовлетво-
удовлетворяет соотношению
/= —/.
Но
| А | == abc + ар + bg- + ей2,
а это выражение не для любых а, Ь, с, /, g, h из К равно нулю.
Например, при
имеем
Проведенное краткое изложение теории определителей содержит
основные результаты из используемых в последующих главах. Мы
показали, что почти все теоремы, доказываемые обычно в учебниках
для случая определителей, элементами которых являются действитель-
действительные или комплексные числа, справедливы для определителей над
произвольным полем. Многие теоремы, посвященные специальным ме-
методам вычисления, а также нахождению значений определителей спе-
специальных типов (например, определителей Вандермонда), которые
можно найти в учебниках, легко выводятся из приведенных выше
теорем, относящихся к определителям над произвольным полем.
В случае необходимости такие специальные результаты будут в даль-
дальнейшем предполагаться известными.
7 Зак. 1230. В. Ходж и Д. Пидо
ГЛ. il. ЛИНЕЙНА^ АЛГЕБРА
§ 9. Х-матрицы
Пусть К—поле, а А.— неизвестное над К. В последующих гла-
главах мы будем часто встречаться с матрицами, элементы которых явля-
являются многочленами от к. Целесообразно заранее установить несколько
часто используемых результатов, относящихся к таким матрицам.
Строго говоря, до сих пор мы определили лишь матрицы над
некоторым телом. Однако можно рассматривать матрицы и над любой
областью целостности /, скажем над К [к\. Основные свойства таких
матриц можно вывести из предыдущего простым рассмотрением их
как частного случая матриц с элементами из поля частных данной
области целостности /. Сложение и перемножение матриц с элемен-
элементами из / вновь дают матрицы такого же типа.
Матрица, элементы которой принадлежат области целостности
К [к], называется k-матрицей. А-матрицу типа /tX«» имеющую
обратную, которая также является А-матрицей, будем называть обра-
обратимой А-матрицей порядка п.
Теорема I. k-матрица М типа яХ« обратима тогда и
только тогда, когда ее определитель \ М \ является отличным от
нуля элементом поля К.
(I) Пусть матрица М обратима и TV—обратная к ней матрица.
Поскольку элементами матриц М и N служат многочлены от к,
определители этих матриц также являются многочленами от к. Пусть
где многочлен /(А) имеет степень г, a g(k) — степень s. Так как
то
т. е.
Но в левой части этого равенства стоит многочлен степени r-\~s,
в то время как в правой — многочлен нулевой степени. Следовательно,
г = s = О,
так что /(А) и g(k)— отличные от нуля элементы поля К.
(II) Предположим, что \М\—т, где т — отличный от нуля эле-
элемент поля К- Пусть М = (/иу). Положим
тп
mnX
^._. ,_ 99
Тогда матрица Ы^={пц) будет Х-матрицей и (§ 8, теорема VI)
Определим эквивалентность Х-матриц. Две Х-матрицы А к В
типа р~Х.д называются эквивалентными, если существуют такие
обратимые А-матрицы М и N порядков р и q, что
A = MBN. A)
Это соотношение рефлексивно, так как
А = ЕрАЕг
Из A) вытекает, что
где М~х и N~x — обратимые Х-матрицы (ввиду обратимости М и Л/).
Поэтому введенное соотношение симметрично. Наконец, если,
кроме A), выполняется также равенство
B = PCQ,
где матрицы Р и Q обратимы, то
A = (MP)C(QN),
где матрицы МР и QN также обратимы. Поэтому рассматриваемое
соотношение транзитивно. Таким образом, оно является соотношением
эквивалентности.
Поставим задачу определения канонической формы для всех Х-ма-
Х-матриц типа р X Я- Как и в § 4, под этим мы понимаем выделение
некоторой системы Х-матриц типа pX.q, такой, что:
(а) никакие две матрицы этой системы не эквивалентны между
собой,
(б) для любой Х-матрицы типа р X Я в нашей системе суще-
существует эквивалентная ей матрица (эту матрицу мы будем называть
канонической формой данной матрицы).
Очевидно, что если мы сумеем построить такую систему матриц
и найдем способ определения канонической формы для любой Х-ма-
Х-матрицы типа рУСя, то тем самым мы получим метод для решения
вопроса, эквивалентны или нет две заданные Х-матрицы.'
Нашим первым шагом будет рассмотрение некоторых простых
операций над Х-матрицей А. Они известны под названием элемен-
элементарных преобразований (ср. § 4) и приводят к Х-матрицам, экви-
эквивалентным матрице А.
(I) Пусть kt kp — некоторая перестановка чисел 1, .... р;
рассмотрим р X /^-матрицу ' #
7*
i66 гл. и. линейная
Тогда \P\ = z*zl, и матрицу В = РА можно получить из А путем
осуществления подстановки
'1 2 ... р \
k Ь Ь I
1 2 * • ' р/
над ее строками. Следовательно, элементарное преобразование ма-
матрицы А, состоящее в перестановке ее строк, переводит А в экви-
эквивалентную матрицу.
(II) Перестановка столбцов матрицы А также преобразует А
в эквивалентную матрицу. Доказательство этого факта подобно только
что проведенному; новая матрица будет иметь вид AQ.
(III) Рассмотрим р X /^-матрицу R = (/-у), определяемую следую-
следующим образом:
'«*=/}(*) G=1 h — 1, A + l. •••, Р),
где fj(k) — многочлен из К [к], и, наконец,
где а — ненулевой элемент из К. Определитель | R | равен а, и
потому R— обратимая А-матрица. Матрица B = RA, эквивалентная
матрице А, получается из А путем умножения ее й-й строки на а
и последующего прибавления к этой строке первой строки, умно-
умноженной на /Х(Х), второй строки, умноженной на /2(а), ..., (h—1)-й
строки, умноженной на /ft_j(i), (Л —[— 1)-й строки, умноженной на
A+l W. • • • • Р"й строки, умноженной на fp (A).
(IV) Если произвольный из столбцов матрицы А умножается на
отличный от нуля элемент из К и к этому столбцу прибавляются
другие столбцы, умноженные на многочлены от л, то получается ма-
матрица, эквивалентная А и имеющая вид AS. Доказательство этого
утверждения аналогично приведенному в (III).
Мы покажем теперь, как можно упрощать матрицу последова-
последовательно осуществляемыми элементарными преобразованиями вплоть до
приведения ее к канонической форме.
Пусть А — произвольная А-матрица типа р X ?• Если эта матрица —
нулевая, то любая эквивалентная ей матрица также будет нулевой,
и потому никакое упрощение невозможно. Поэтому можно считать,
что по крайней мере один элемент матрицы А отличен от нуля.
С помощью перестановок строк и столбцов легко добиться, чтобы этот
элемент стоял в верхнем левом углу матрицы. Пусть этот элемент ап,
рассматриваемый как многочлен от А, имеет степень р. Покажем, что
если многочлен ап не является делителем всех остальных элементов
матрицы А, то существует эквивалентная А матрица С, у которой
элемент си отличен от нуля и имеет более низкую степень, чем ап.
§ 9. Х-МАТРИЦЫ 101
Наше преобразование будет распадаться на несколько элементарных
преобразований.
(а) Если для некоторого у элемент ап не является делителем эле-
элемента а1}-, то в соответствии с алгоритмом деления
где многочлен с (к) отличен от нуля и имеет меньшую степень, чем ап.
Вычтем из у'-го столбца первый столбец, умноженный на Ь (к), и затем
поменяем местами первый и у-й столбцы. Мы придем таким обра-
образом к матрице, эквивалентной А и имеющей в левом верхнем углу
элемент с (к).
(б) В случае, если при некотором I элемент ап не является дели-
делителем для а{1, мы поступаем таким же образом со строками вместо
столбцов.
(в) Предположим, что ап является делителем всех отличных от
нуля элементов первой строки и первого столбца, но не является
делителем элемента a^Qi, k > 1).. Пусть ait=:bia11 и a±j=lCjau.
Тогда, если мы вычтем из г'-й строки первую строку, умноженную
на bt (для каждого / > 1), и затем из у'-го столбца первый столбец,
умноженный на Cj (для каждого j > 1), то придем к матрице В,
эквивалентной А и такой, что
*и = ап. bu = ° U > 0. hi = 0 (/ > 1).
Элемент blt попрежнему не является делителем элемента bhli. Теперь
остается прибавить А-ю строку матрицы 5 к ее первой строке и
повторить прием (а). В результате получим матрицу С, эквивалент-
эквивалентную А, с элементом сп, отличным от нуля и имеющим более низкую
степень, чем ап.
Поскольку в описанном выше процессе показатель степени эле-
элемента, стоящего в левом верхнем углу, уменьшается, этот процесс
может быть повторен лишь конечное число раз. В конце концов мы
получим матрицу — обозначим ее через В, — эквивалентную А и такую,
что элемент Ьп является делителем каждого элемента Ь^. Как пока-
показано в (в), можно считать, что
Итак, последовательностью элементарных преобразований мы перевели
матрицу А в эквивалентную матрицу
0 ... 0
PAQ=
V
о ьп .. ¦ ьм,
Где Ьц является делителем всех остальных элементов
102
ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
Если подматрица
2
... bp
ненулевая, мы применим к непрописанный выше процесс и получим
эквивалентную матрицу
-22 О'
О <
где каждый элемент подматрицы С2 содержит элемент г22 в качестве
множителя. Тогда
О
/1 0\ /1 0\ /*"
(о р>Ч J±
О
так что элементарные преобразования подматрицы Ва можно рассматри-
рассматривать и как элементарные преобразования матрицы А. Продолжая этот
процесс, мы переведем матрицу А в эквивалентную матрицу, в кото-
которой все элементы вне главной диагонали равны нулю, а каждый
элемент главной диагонали является делителем всех последующих.
Если, наконец, умножить каждую строку этой матрицы на соответ-
соответствующую отличную от нуля постоянную, то в окончательном итоге
получим, что А эквивалентна матрице
(Е1(к) 0 ... 0 ... 0V
0 ?¦„(*)... 0 ...0
0
0
0
О
B)
о ...о/
где Е((к) (i=l г) — многочлен от к, имеющий старший коэф-
коэффициент + 1, причем Ei(k) является делителем многочлена Ei+1(\).
Поскольку эквивалентные А-матрицы имеют одинаковые ранги, а ранг
матрицы MAN есть, очевидно, г, то г является рангом и матрицы А.
Введем обозначение
Очевидное обобщение теоремы V § 8 приводит нас к соотношению
'¦ifa ... rrti^t
ix
<
*
Отсюда следует, что если Dt(k) — наибольший общий делитель мино-
миноров порядка t матрицы А, то Df(k) является также делителем каждого
§ 9. Х-МАТРИЦЫ ЮЗ
минора порядка t матрицы $. Но, в силу обратимости матриц М и. N,
равенство
MAN= $
можно переписать в виде
Поэтому наибольший общий делитель миноров порядка t матрицы §
является делителем каждого минора того же порядка матрицы А.
Следовательно, с точностью до множителя из К этот наибольший
общий делитель совпадает с Dt(k). Поэтому, в силу свойств много-
многочленов Е{(к),
Dt(k) = E1(\)E%(k) ... Et(k).
Следовательно, если мы положим D0(k)=l, то будем иметь
Этот последний результат показывает, что многочлены Е{(к) одно-
однозначно определяются наибольшими общими делителями миноров разных
порядков матрицы Л. Условимся называть многочлены Е{(к) инвариант-
инвариантными множителями матрицы А. Нами доказана
Теорема II. Если А есть к-матрица типа pX.q и ранга г,
a Et(k) Ег(к) — ее инвариантные множители, то существуют
такие обратимые к-матрицы М и N, что
(Ех (к)
0
0
V ¦ ¦
0
0 .
E,(k).
0 .
0 .
.. 0
.. 0
.. Er(k)
.. 0
...0\
...0
... 0
...0
Так как матрица, обратная к обратимой л-матрице, также обратима,
то справедлива
Теорема III. Две к-матрицы А и В типа рУСд эквивалентны
тогда и только тогда, когда их инвариантные множители со-
совпадают.
Таким образом, матрицы вида B) могут служить искомой канони-
канонической формой, к которой приводимы любые л-матрицы типа рХ.д.
Если поле К таково, что каждый многочлен f(k) из К [к] может
быть разложен в К [к] на линейные множители, то иногда бывает
удобнее вместо инвариантных множителей пользоваться элементар-
элементарными делителями. Они определяются следующим образом. Пусть
Ех (к) = (к — «/"(к - а2)е" ...(к- а/и
104 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
где все е^^-0 и где X— alt ..., X — as — совокупность различных
линейных множителей многочлена Ег (X), так что erj > 0 (j = 1, ...'., s).
Тогда те из множителей
(X - в!)*", (X - «О"" (Я - «./" (X — О,)'*»,
у которых показатели е^ отличны от нуля, называются элементар-
элементарными делителями матрицы А. Как мы видим, они вполне опреде-
определяются инвариантными множителями.
Пусть теперь, наоборот, нам заданы элементарные делители
матрицы А
(к — «У\ (к — <х)а\ .... (к - ар (Й1 > д2 > .. . > at),
(A — 8)л", (X — 8)*, ... (rfj^rf,^...)
и ее ранг г. Каждый инвариантный множитель Et(k) должен быть
произведением этих делителей. Поскольку Ег(к) содержит ?»(Х)
в качестве множителя (i < г), многочлен Ег (к) должен содержать
наивысшую степень X — а, наивысшую степень X — Р и т. д. Другими
словами,
Ег (к) = (X — а)а' (X — РN' ... (X — 8)*.
Подобным же образом
Er_j(X) = (X — <х)«=(X — $)ь-- ... (X — 8)*i,
так как Ег_1(\) имеет своими делителями все Е{(к), для которых
i< г— 1, и т. д. Если на каком-то шаге все элементарные делители,
являющиеся степенями двучлена X — а, окажутся исчерпанными, то
последующие многочлены Е{ (X) не будут иметь X — а своим дели-
делителем. Подобное утверждение справедливо и для X — р, и т. д. Когда
все вообще элементарные делители окажутся уже использованными,
оставшиеся инвариантные множители (если таковые будут) нужно
положить равными 1. Таким образом, мы доказали следующую тео-
теорему, аналогичную теореме III:
Теорема IV. Необходимым и достаточным условием эквива-
эквивалентности двух k-матриц типа р X Я является совпадение их
рангов и элементарных делителей.
В последующих главах часто будет применяться
Теорема V. Пусть Аи В— две к-матрицы типа п X«,
имеющие вид
А \ А Д R1 Д
где Ар Л2, Вг, Д2 — матрицы типа пХ" над К, причем В1 невы-
невырождена. Тогда эквивалентность матриц А и В равнозначна
§ 9. ^МАТРИЦЫ 105
существованию невырожденных матриц Р и Q над К, удовлетво-
удовлетворяющих условию
PAQ = В.
Из эквивалентности матриц А и В вытекает существование таких
обратимых Х-матриц М и /V, что
MAN = B.
Пусть Х=В2Вг1. Тогда, если
где Mt — матрицы над К, и если мы положим
то будем иметь
М = (\Еп — Х)р + Р = (кЕн - В-Л
где
Подобным образом, полагая Y = Bi1Ba, записывая матрицу N в виде
и вводя в рассмотрение матрицы
найдем, что
где
Используя полученные результаты, находим, что
B = (M — BP1)A(N—Q1B) — B =
= MAN— MAQXB — BPtAN-\- BP^
так как 7H4/V=.B. Таким образом,
PAQ — B = BRB, (*)
где
106 ГЛ. II. ЛИНЕЙНАЯ АЛГЕБРА
Поскольку М и N—обратимые Х-матрицы, R представляет собой
Х-матрицу. Предположим, что R не является нулевой матрицей:
Тогда в равенстве (-*) левая часть имеет относительно X степень, не
большую 1, в, то время как правая часть имеет степень ?-|-2>-2. Это
противоречие показывает, что R = 0, "и потому
PAQ = В.
Так как Р и Q не зависят от X, то
PAtQ = Bt и PA2Q = Я2.
Наконец, из невырожденности матрицы Bt следует невырожденность
матриц Р и Q. Теорема доказана.
§ 10. Несколько теорем
Мы заключим настоящую главу несколькими результатами, необхо-
необходимыми для дальнейшего. Некоторые из них опираются на теоремы,
которые более уместно доказывать в последующих главах. Во избе-
избежание повторений мы приведем здесь эти теоремы без доказательств.
Если А — матрица типа «X" над К, то А-матрица
А-1Еп
называется ее характеристической матрицей, а определитель по-
последней
— характеристическим многочленом матрицы А. Корни характери-
характеристического уравнения
называются характеристическими числами, или собственными зна-
значениями матрицы А.
Пусть
Рассмотрим присоединенную матрицу для матрицы А — 1Еп. Она пред-
представляет собой Х-матрицу, элементами которой служат многочлены
от X степени ге выше (п—1)-й. Следовательно, эта матрица допу-
допускает запись
где В{ — матрица типа геХ« наД К. Напомним, что произведение
матрицы на присоединенную равно единичной матрице, умноженной
§ 10. НЕСКОЛЬКО ТЕОРЕМ JQ7
на определитель исходной матрицы. Поэтому
Приравнивая коэффициенты при одинаковых степенях к в обеих ча-
частях этого равенства, получаем, что
АВ2 — В1 = а%Еп,
Умножим эти равенства слева соответственно на Еп, А, Л2 Ап
и затем сложим их. Получим матричное соотношение
Этот результат обычно формулируется в виде следующей теоремы:
Теорема I. Квадратная матрица удовлетворяет своему
характеристическому уравнению.
Заметим, что из определения характеристического многочлена,
согласно которому
следует, что
Поэтому к = О является характеристическим числом в том и только
в том случае, когда матрица А вырождена.
Введем теперь понятие квадратного корня из матрицы. В пред-
предположении, что основное тело К не только коммутативно, но и алге-
алгебраически замкнуто (это означает, что каждый многочлен <р (х) из
К [х] можно разложить в К[х] в произведение линейных множителей),
мы докажем в следующей главе такую теорему (гл. III, § 8, теорема II):
Если <о(х) — многочлен из К\х\, обладающий тем свойством,
что <о@)Ф 0, и если г — произвольное фиксированное натурел;-
ное число, то существует такой многочлен g{x), что [g (x)]r — х
делится на <о (х).
Применим эту теорему в случае г = 2, взяв в качестве много-
многочлена ® (а:) характеристический многочлен f(x) невырожденной ма-
матрицы А. В силу теоремы, мы можем найти такой многочлен g(x), что
Так как /(Л)-=0, то
Тем самым доказана
108 ГЛ. Н. ЛИНЕЙНАЯ АЛГЕБРА
Теорема II. Для любой невырожденной матрицы А над алге-
алгебраически замкнутым полем К существует такая матрица X,
что
Наконец, введем понятие минимального многочлена матрицы А.
Если
ф (Х) = А»+ «1Х»->+ ...+„„,
— многочлен наинизшей степени, для которого
то мы будем называть ^(К) минимальным многочленом матрицы А.
Пусть
— те инвариантные множители матрицы А — кЕп, степень которых
больше 0. Мы увидим в § 2 гл. VIII, что существует матрица
/в,+1 о ... о
0 Дв+а ... 0
\ о о ... вя
такая, что
(а) ? = Р~1АР, где Р-—некоторая невырожденная матрица над К',
(б) \Bi — IE | = ± Et (k) (i = s -j- 1 и).
А именно, нужно лишь положить
О 1 0 ... 0
0 0 1 ... 0
если
По теореме I,
Et(Bt) = 0.
Мы утверждаем, что Е{(к) является минимальным многочленом для
матрицы В{. В самом деле, заметим прежде всего, что r-я степень
матрицы В( при г < г{ имеет вид
§ id. нЕСкблькО ТЕОРЕМ
где А — нулевая (г{ — г) X /"-матрица, Err — единичная матрица
с rt — r строками и столбцами, а В и С —матрицы типов г^г и
f X (f< -"" г)> элементы которых являются многочленами относи-
относительно а{1. Пусть теперь
— многочлен степени 5 над /С, причем 5 < rt. Тогда f(B{) предста-
представляет собой гг X /уматрицу, имеющую на (s-(-I)-m месте в первой
строке элемент, равный bs. Следовательно, /(В^) отлична от нуля.
С другой стороны, если g(k)— такой многочлен над К, что
g (В{) = 0, то мы можем записать
где степень Ь(к) меньше г{. Но
Отсюда следует, как мы доказали выше, что ?(А) = 0. Итак, g(k)
имеет Ег(Х) своим делителем. Предположим теперь, что F(X) — такой
многочлен над К, что F(A) = 0. Тогда
/F(BS+1) 0 ... О
0 0 ... F(Bn)l
= ^ся- м/3) = р-^сл) я = о
и, следовательно,
Поэтому /^(Х) должен иметь многочлены ?g+1(A), ?8+2(Х), ..., ?И(А)
своими делителями. Наоборот, если F(k) имеет эти многочлены своими
делителями, то F (В) = 0. Поскольку же Е{ (к) — делитель много-
многочлена Ej{k) с j > i, то мы приходим к следующей теореме:
Теорема III. Если А — матрица типа »ХЛ Н(*Э К и если
инвариантными множителями матрицы А — кЕп являются
ЯДА) Еп(к), то Еп(к) — минимальный многочлен для А. Ра-
Равенство /(Л) = 0 справедливо для тех и только тех многочленов
/(а.) над К, которые имеют Еп(к) своим делителем.
f л А В А Ш
АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
В этой главе мы предполагаем, что все рассматриваемые тела
коммутативны, т. е. являются полями.
§ 1. Простые алгебраические расширения
В § 9 гл. I мы познакомились со способом расширения поля К,
заключавшемся в присоединении неизвестного х. Теперь мы опишем
другой метод расширения произвольного поля АГ.
Пусть f(x)— неприводимый многочлен степени п из К[х]. Мы
установим с помощью f(x) некоторое соотношение эквивалентности
в К[х].
Два многочлена а(х) и Ь(х) из К [х] будем называть эквивалент-
эквивалентными, если
где с(х) принадлежит К[х]. Это соотношение, очевидно, обладает
свойствами рефлексивности, симметричности и транзитивности и по-
потому действительно является соотношением эквивалентности (см. § 2
гл. I). Многочлены из К[х] тем самым оказываются разбитыми на
классы. Условимся класс эквивалентных многочленов обозначать через
\а(х)}, где а(х) — любой многочлен из этого класса.
Пусть а(х), а' ^ — эквивалентные многочлены и b(x), b'(х) —
также эквивалентные многочлены: '
Тогда
a'
и
а' (х) Ь' (х) = a(x)b (x) + g (*)/(*),
где
g(x) = a (х)d(x) + b(x)c(x)-\-c(x)d(x)f(x).
Поэтому мы можем с помощью равенства
-_i^_____ * *' ЯР°стыЕ АЛГЕБРАИЧЕСКИЕ РАСШИРЕНИЯ Ш
однозначно определить операцию сложения классов» а с помощью
равенства
И*)} {*(*)}«{<!(*)*(*)}
— операцию умножения классов. Без труда проверяется, что классы
образуют абелеву группу по сложению и что умножение ассоциа-
ассоциативно, коммутативно и дистрибутивно относительно сложения. Это
означает, что классы образуют коммутативное кольцо относительно
введенных законов композиции. Нулем этого кольца является класс
{0}, т. е. класс многочленов, делящихся на f(x). В кольце суще-
существует и единица — класс {1}.
Пусть теперь {g(x)\— произвольный ненулевой класс. Тогда
g(x) не делится на fix). Отсюда ввиду неприводимости f{x) сле-
следует, что наибольший общий делитель многочленов f(x) и g(x) при-
принадлежит К. Поэтому существуют такие многочлены а(х) и д(х),
для которых
Это означает, что
{«(*)}{*(*)} = {!}.
т. е. что каждый отличный от нуля элемент кольца классов эквива-
эквивалентных многочленов имеет обратный элемент. Таким образом, рас-
рассматриваемое кольцо оказывается полем. Это поле мы будем обо-
обозначать через К'.
Для элементов ос, ji исходного поля К равенство
{«} = {?}
имеет место тогда и только тогда, когда а — (J делится на f(x),
т. е. когда а = [3. Следовательно, классы вида {а} образуют под-
подполе поля К', изоморфное К. Отсюда на основании теоремы I § 2
гл. I заключаем, что существует расширение К* поля К, изоморф-
изоморфное К'. Поле К* определено однозначно с точностью до изоморфиз-
изоморфизмов, при которых элементы из К отображаются в себя.
Пусть 5 обозначает элемент поля К*, соответствующий элементу
[х] из К'. Тогда, если g(x) — некоторый многочлен из К[х], то
g(k) соответствует {g(x)}. В силу алгоритма деления,
где gx (х) — многочлен степени, меньшей п. В случае если сам мно-
многочлен g (х) имеет степень, меньшую п, нужно положить h {х) = 0,
gi(x) = g(x). Так как
то
Отсюда следует, что каждый элемент ч\ из К* можно записать
в такой форме:
ГЛ. lit. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
Конечно, и наоборот, правая часть этого равенства при любых эле"
ментах <х0 аи_1 из К представляет собой некоторый элемент
из К*. Поскольку элемент /(?) поля К* соответствует элементу
\f(x)} поля К', из равенства
{/(*)} = {0}
следует, что
Пусть ^(л:) — произвольный многочлен над К, для которого
Тогда
и, следовательно, ^(л:) делится на f(x). Поэтому F(x) либо является
нулем, либо имеет степень, не меньшую п. Отсюда следует, что
запись A) для элементов из К* однозначна. Таким образом, равен-
равенством A) устанавливается весьма удобный способ представления эле-
элементов из /С*. Используя это представление, имеем
Для нахождения произведения мы пишем
-= «оРо 4- («oPi 4- «iPo) 6 + • • • + «.-iP-168»-2
и затем, пользуясь соотношениями
0 = 6-/E) = тоб1" + Ti6r+1 + • • • + Т»^+г (г = я —2, я —3, ..., 0),
выражаем ^2и~2 через ?"~2, ..., ?2"-, потом Е-"-3 через 1п~3,.... ?а»-*
и т. д., добиваясь, в конце концов, исключения из выражения всех
степеней X с показателями, превосходящими п—1.
Проиллюстрируем сказанное двумя простыми примерами. Если
К—поле рациональных чисел и
/<*) = ** —2,
то К* есть поле чисел вида
где а и b — рациональные числа. Здесь К* отлично от К- Если же
К— поле комплексных чисел, то каждый многочлен степени выше
первой приводим и никакого расширения по указанному способу для
поля К построить нельзя.
Описанные выше расширения называются простыми алгебраиче-
алгебраическими расширениями.
§ 2. РАСШИРЕНИЯ1ПОЛЯ ЦЗ
§ 2. Расширения поля
Мы рассмотрим теперь ряд общих свойств расширений произволь-
произвольного поля К. Начнем с определения эквивалентных расширений.
Расширения Kt, /С2, ... поля К называются эквивалентными, если
они изоморфны и притом так, что каждый элемент расширений
Ки АГ2, .. ., лежащий в поле К, соответствует самому себе.
Пусть К* — какое-нибудь расширение поля К, и пусть \ — эле-
элемент из К*. Мы говорим, что элемент \ алгебраичен над К, если
существует такой ненулевой многочлен f(x) из К[х\, что
Неалгебраические элементы называются трансцендентными над К-
Само собой разумеется, что каждый элемент а из поля К алге-
алгебраичен над К. Действительно, нужно лишь положить
Теорема I. Если элемент 5 алгебраичен над К, то в кольце
К[х] существует неприводимый многочлен f(x), определенный
однозначно с точностью до отличного от нуля множителя из К
и такой, что
В силу алгебраичности элемента S над К, в К[х] существует
такой ненулевой многочлен g(x), что
?(О = о.
Пусть
g(x) = gi(x)gi(x)...gr(x)
¦— разложение этого многочлена на неприводимые множители. Тогда
принадлежат К* и
Но К* является полем и потому не имеет делителей нуля. Следова-
Следовательно, для некоторого /A<^г-^>) выполняется равенство
Положим
Если А (х) — произвольный неприводимый многочлен, для которого
то либо
й (*) = «/(*) <«€*).
либо h(x) и f(x) взаимно просты. В последнем случае существуют
многочлены а(х) и Ь(х), удовлетворяющие условию
8 Зак. 1230. В. Ходок и Д. Пидо
i i4 гл. in. Алгебраическая зависимость ]
!
1
по отсюда вытекает равенство
которое ввиду обращения левой части в нуль противоречиво. Следо- \
в ательно, многочлен /(*) определен однозначно с точностью до отличу
ного от нуля множителя из К. Этот многочлен называется характер,
ристическим многочленом элемента \ относительно поля АГ.
Пусть 6 вновь обозначает некоторый элемент расширения К*
поля К- Рассмотрим все те элементы поля К*, которые можно полу-
получить из ? и элементов поля К с помощью операций сложения, вычи-
вычитания и умножения (примененных в конечном числе). Такие элементы
можно записывать в виде
+«1е+...+«>, ' О)
где а4 принадлежат полю К. Очевидно, что эти элементы образуют
коммутативное кольцо с единицей, которой служит единица поля К.
Если ц, С — два элемента этого кольца, то их произведение в этом
кольце совпадает с их произведением в К*, и потому ?? = 0 лишь
в том случае, когда либо ч\, либо С является нулем. Таким образом,
рассматриваемое кольцо есть область целостности. Мы будем обо-
обозначать ее через K[i]. Заметим, что К\Ц — К тогда и только тогда,
когда \ принадлежит К. Поскольку К [?] есть область целостности, она
может быть вложена в некоторое поле — поле частных (гл. I, § 4).
Мы обозначим это поле через К(?) и будем называть его полем,
полученным присоединением элемента I к полю К.
Случай (I). Пусть элемент I алгебраичен над К, и пусть /(*) —
его характеристический многочлен, а п — степень этого многочлена.
Если
то мы можем записать, что
где ^(л;) имеет степень, меньшую п. Тогда
Мы видим, что каждый элемент из К[?\ может быть представлен
в форме A), где г<[ге—1. Это представление единственно, так как
если бы мы допустили существование двух различных представлений
для некоторого элемента, то отсюда вытекало бы существование не-
ненулевого многочлена h(x) степени, меньшей п, и такого, что
й(?) = 0, вопреки теореме I.
Таким образом, область целостности К[\\ эквивалентна простому
алгебраическому расширению поля К, определенному многочленом f(x)
S 2. РАСШИРЕНИЯ ПОЛЯ
см. § 1). Отсюда, в частности, следует, что K[i\ есть поле, и потому
В качестве важного следствия получаем теорему:
Теорема II. Если ^ и 52 — два элемента некоторого рас-
расширения поля К, алгебраические над К и имеющие один и тот
же характеристический многочлен, то К{^) и АГ(?2)— эквива-
эквивалентные расширения поля К-
Случай (II). Предположим теперь, что элемент ? трансцендентен
над К. Тогда
«о+«i«+ • • •+«& = % + №+ • • • + № («г, Рв Ф 0)
в том и только в том случае, если r = s и а< = р4(/ = О, 1, ...,г).
Следовательно, кольцо К[\\ эквивалентно области целостности К[х),
и потому поле АГ(?) эквивалентно полю рациональных функций от
неизвестного х над полем К- Поле K(i) в этом случае носит назва-
название простого трансцендентного расширения поля К.
В обоих случаях ЛГ(?) является, очевидно, наименьшим расшире-
расширением поля К, содержащим ?. Могут существовать, конечно, расши-
расширения поля К, являющиеся собственными подполями поля АГE). но
они не будут содержать элемента ?. Например, если 5 трансценден-
тен над К, то
Приемы, использованные выше, можно распространить на случай
наименьшего расширения поля К, содержащего некоторую конечную
систему dj Ъп элементов из К*. Элементами такого расшире-
расширения являются те элементы поля К*, которые получаются применением
операций сложения, вычитания, умножения и деления (исключая
деление на нуль) к iv ..., \п и элементам из К. Получающееся в ре-
результате поле обозначается через К($х, ••-, $„)• Оно, очевидно, не
зависит от порядка в системе Sx %п. Можно определить поле
К$и ...,?„) и индуктивно: K(Zlt ..., ?г) есть поле, полученное
присоединением ?г к полю /С($1( .... 1г_г) (г = 2 п).
Некоторые из элементов $г могут быть алгебраическими над К.
В связи с этим обычно будет удобно располагать элементы ^ в си-
системе Ej, ..., \п по некоторому правилу. Если все ?< алгебраичны,
то никаких условий на их расположение мы накладывать не будем.
Если же некоторые из %i трансцендентны над АГ, мы возьмем один из
таких элементов в качестве ?г Если $< \г трансцендентны над
K?i) (а следовательно, и над К), мы примем один из них за ^
и т. д. Таким образом, в этом случае элемент ?х трансцендентен над К,
элемент lg трансцендентен над #(*-,, ..., 6e_t) (s — 2 г), а эле-
элементы &г+1 ?и алгебраичны над К^, .... Sr)-
При таком соглашении поле К(^, • • •, ir) эквивалентно полю
рациональных функций от неизвестных xlt ..., хг с коэффициентами
8*
116 ГЛ. III. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
из К (гл. I, § 9). Мы доказали ранее это утверждение для слу-
случая г—\. Предположим, что оно справедливо для r = s — 1.
Тогда K(it ?e_j) эквивалентно полю рациональных функций
К{хи ..., Xg,.,). Но
Поскольку элемент ls трансцендентен над K(tlt .... is-i), поле
К(\х, ..., Eg-iXEg) эквивалентно полю K{\lt .-., i.-i)(x^, а следо-
следовательно, и полю
K(xt *e_i)(*g) = A;(*i xg).
Элементы ?lf ..., Sr называются независимыми неизвестными над АГ.
В настоящей книге мы будем встречаться только с расширениями
поля К, получаемыми присоединением к К конечного числа элемен-
элементов Sx $п.
§ 3. Расширения конечной степени
Говорят, что расширение АГ* поля К имеет конечную степень,
если в К* существует система из конечного числа таких элементов
$1? • • •, ?я> что каждый элемент yj из К* может быть представлен
в форме
где коэффициенты ах, ..., ап принадлежат полю К> Про элементы
\и .. ., \п говорят, что они образуют базис расширения К* над К.
Этот базис называется минимальным, если из равенства
следует, что
<*i = 0 (i = 1 я).
Очевидно, что элементы расширения К* образуют линейную систему
!($! $„) над АГ (гл. II, § 1). Поэтому, если К* есть расши-
расширение конечной степени над К, то мы можем утверждать, что К*
обладает минимальным базисом и что число элементов во всех мини-
минимальных базисах К* одно и то же (гл. II, § 1, теорема VI). Это
число называется степенью расширения К* относительно К.
Теорема I. Если К* — расширение поля К, имеющее конеч-
конечную степень п, то каждый элемент из К* алгебраичен над К,
причем степень его характеристического многочлена не выше п.
Пусть %v ..., \п — минимальный базис поля АГ* над К. Тогда,
если ч\ — некоторый элемент из К*, то ч${ также принадлежит К*,
причем
& А+& ( 1 )
§ 3. РАСШИРЕНИЯ КОНЕЧНОЙ СТЕПЕНИ
117
Система линейных уравнений
(ап — •*!) xi + • • • + «1А = О,
anlxl + • • • " (ann — 1@ xn — 0
имеет в поле К* нетривиальное решение, а именно, ($t,
Следовательно,
«И —"»! «12 • • • «1»
Многочлен
Л21
ап„ ... апн —
- х а.
0.
'12
¦л: ... ао
аП1
ненулевой, так как его старшим членом является (—\)пхч. Итак,
элемент -ц удовлетворяет уравнению
и поэтому является алгебраическим над К. Кроме того, его характери-
характеристический многочлен служит делителем многочлена F(x); следова-
следовательно, степень характеристического многочлена не может превосхо-
превосходить п.
Расширение К* поля К, каждый элемент которого алгебраичен
над К, называется алгебраическим расширением поля К. Мы дока-
доказали, что каждое расширение конечной степени является алгебраи-
алгебраическим. Докажем теперь следующую теорему:
Теорема II. Если элементы^, ..., \п расширения К* поля К
алгебраичны над К, то К$х У — алгебраическое расширение
поля К.
Докажем прежде всего, что каждый элемент ч\ из К(Ъ1г -.., 1„)
может быть представлен в форме суммы
i1=o
in=o
где коэффициенты а<, ...,я принадлежат К, a rt гп — натураль-
натуральные числа, не зависящие от элемента i\. Докажем этот результат
с помощью индукции. Предположим, что он справедлив для KiSv ¦ • •
• • • > &n-i)- ^3 алгебраичности элемента \п над К следует его алге-
браичность и над К (f,v..., $n-j). Пусть гп — степень его характе-
характеристического многочлена по отношению к последнему полю. Тогда,
118 ГЛ. III. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
поскольку поле КA± ?„) получено присоединением 1„ к полю
AT(?lF ..-., ln-i)> каждый элемент t\ из К(^± ?„) может быть
записан в форме
где 0< принадлежат K(^v .... Sn-i)- Но, по предположению индукции,
е,= 2 ... "S «*, ...w^1 ...&!1 (/ = о rn-i),
где числа rlt ..., rn_t не зависят от 64, а потому и от ц, а коэф-
коэффициенты a*j ...<„_!< принадлежат полю К. Следовательно,
Ч- 2 ¦•• 2 Ч ». *J& • • • &•
Это доказательство справедливо и прил=1. Тем самым наше утвер-
утверждение доказано.
Отсюда видно, что /у2 ... гп элементов
образуют базис расширения Ar(?t !!„)• Поэтому, в силу теоремы I,
все элементы из К (Zt 5„) алгебраичны над АГ. Следовательно,
согласно определению, поле К{^ 5„) является алгебраическим
расширением поля К', теорема доказана.
Предположим теперь, что среди %v .... \п первые г элементов
?j, ...,%,. — независимые неизвестные над К, остальные же Sr+1, ...,
..., ?и алгебраичны над К(^, ¦-., У- Тогда поле AT(?t SJ
будет алгебраическим расширением поля /("(^ %). Оно назы-
называется полем алгебраических функций, а его элементы ¦—алгебраи-
¦—алгебраическими функциями от неизвестных %i ^.
Теорема III. Если К* — некоторое расширение поля К, то
элементы из К*, алгебраические над К, образуют поле К', причем
Кс. К'с. К*.
Если % и т| — элементы из К*, алгебраические над К, то, по преды-
предыдущей теореме, алгебраическими будут и.все элементы поля АГ(?, ч\).
Следовательно, элементы i — f\ и $т), как принадлежащие К(%, ч\),
алгебраичны над К. Это означает, что элементы из К*, алгебраиче-
алгебраические над К, образуют область целостности, содержащую в себе К
в качестве подкольца. Далее, если элемент % алгебраичен наД К и
отличен от нуля, то I принадлежит К(?) и потому также алгебраи-
алгебраичен над К. Таким образом, множество алгебраических элементов
из К* представляет собой поле К'. Очевидно, что К с: К' с К*.
Теорема IV. Если К* — некоторое расширение поля К, а К' —
§ 3. РАСШИРЕНИЯ КОНЕЧНОЙ СТЕПЕНИ 119
подполе поля К*, все элементы которого алгебраичны над К, то
каждый элемент из К*, алгебраический над К', алгебраичен и над К.
Мы не предполагаем, что поле К' содержит в себе К- Пусть % —
некоторый элемент из К*, алгебраический над К', и пусть
f-1+.-•+%
— его характеристический многочлен относительно К'. Рассмотрим
поле /((%, .... у\п, ?). Каждый его элемент можно записать в виде
суммы
Но для каждого i имеет место равенство
С= 2 ••• 1 «51...vi?"'---'bv'1Di ...«.€*).
так что поле К (tJj, . - •, •*]„, 5) имеет конечный базис над полем К
и, следовательно, по теореме I, является алгебраическим расширением
поля К. Таким образом, элемент X алгебраичен над К-
Введем теперь понятие алгебраической зависимости. Элементы
?, \г расширения К* поля К называются алгебраически зависи-
зависимыми над К, если в К[xlt ..., хг] существует такой ненулевой
многочлен f(x1, . .., хг), что
В противном случае элементы называются алгебраически независи-
независимыми над К-
В случае г -= 1 элемент ^ алгебраически зависим над К тогда и
только тогда, когда он алгебраичен над К- Рассуждение, аналогичное
проведенному в доказательстве теоремы I § 2, показывает, что если
элементы ^ \г алгебраически зависимы над К, то существует
неприводимый многочлен f(xv ..., jtr\ для которого
f<h U = o.
В случае алгебраической независимости элементы ^, ..., \г можно
считать независимыми неизвестными; /C(?i> •••> ?>•) является полем
рациональных функций от этих неизвестных.
Как мы уже отмечали выше, в K(Xi ?„) существуют неизве-
неизвестные, которыми можно считать $х, ..., %г, обладающие тем свойством,
что сами они алгебраически независимы над К, а любой элемент из
/((&! 6„) алгебраичен над AT(?i, ..-, ?,-)• Если в некотором рас-
расширении К* поля К существует система из конечного числа элемен-
элементов 6t lr, алгебраически независимых над К и таких, что каж-
каждый элемент ч\ из К* алгебраичен над ЛТ^, ..., ?г)> то мы говорим,
что поле К* обладает конечным алгебраическим базисом над К.
120 ГЛ. III. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
Поскольку элементы 5lt ..., \г алгебраически независимы над К, про
них говорят, что они образуют минимальный алгебраический базис.
Некоторые свойства расширений с конечным алгебраическим бази-
базисом над К подобны свойствам линейных систем конечной размерности
(гл. II, § 1). Мы сейчас распространим на рассматриваемую область
теорему о замене.
Теорема V. Если (тц, ..., t\s) — алгебраический базис расши-
расширения К* поля К, a d Z.t — система алгебраически независи-
независимых элементов поля К*, то t^.s и, при соответствующей нуме-
нумерации 'элементов ч\г г\8, система (Сх Ct, ц(+1, •-., i}s)
представляет собой алгебраический базис для К*-
Начнем с рассмотрения случая, когда ?=1, Поскольку элемент С,
лежит в К*, он алгебраически зависим над /((¦%, ..•, т)8)- Поэтому
существует такой ненулевой многочлен f(xv ..., xs+1), что
Если бы 5 было равно нулю, то элемент Ci был бы алгебраичен
над К, вопреки условию теоремы. Следовательно, s~^\.
Это означает, что в многочлене f(xu ..., xg+1) действительно
присутствует хотя бы одно из неизвестных хи ..., х8. Мы можем
предположить элементы ч\{ упорядоченными так, что присутствует не-
неизвестное х±. Тогда элемент tjj алгебраически, зависим над полем
#Сн» ^2. •••• Чв)- По условию, каждый элемент \ из К* алгебраичен
надА"(%, .-., vj8). Но мы теперь знаем, что элементы тц, %, .... yj8
алгебраичны над АГС^, f\it .... т)8). С помощью теоремы IV заклю-
заключаем, что ? алгебраически зависим над К (Clf %, ..., чв). Этим тео-
теорема для t = 1 доказана. Дальше поведем рассуждения индукцией по t.
Из определения алгебраической зависимости непосредственно сле-
следует, что если элементы ^ С* алгебраически независимы над К,
то и любая их подсистема алгебраически независима. В частности,
независимые!, ..., ^t_v Поэтому из предположения, что наша теорема
справедлива для t—1 элементов Q, вытекает неравенство t—l<!s,
и мы можем считать элементы r\v ..., ч\а расположенными так, что
система
(Cj, .... С*_!, fit -Цз)
представляет собой алгебраический базис для К* над К- Поскольку
элемент (,t лежит в К*, он алгебраичен над АГ(С1( ..., C*_i, *u, •••
7jg). Это означает, что существует ненулевой многочлен
) Для которого
Если бы t— 1 было равно s, то отсюда следовало бы, что элементы
Cj, .... С( алгебраически зависимы, вопреки предположению. Итак,
t— 1 < s, т. е.
S 3. РАСШИРЕНИЯ КОНЕЧНОЙ СТЕПЕНИ 121
Далее, по крайней мере одно из неизвестных xt ха должно
присутствовать в f(x1 xs+1), так как иначе элементы ^ С(
были бы алгебраически зависимы над К. Предположим элементы т^
упорядоченными так, что присутствует xt. Тогда элемент i\t алге-
браичен над
По предположению индукции, каждый элемент ? из К* алгебраичен
над полем K(Zit • • >, C(_t, i\t> • • •> ""is)- Но нам известно, что Сх, ...
.-., ^_±, tit ъ алгебраичны над K((.v .... С{, >]г+1> ...., г),).
Следовательно, с помощью теоремы IV мы можем сделать* вывод,
что % алгебраичен над /С(СХ, ..., Cf, i\t+1, .... ?jg). Итак, система
(ClF . - •, С(, ^(+i> • • • > ¦"!«) представляет собой алгебраический базис
для К*, чем и доказана теорема.
Из первого утверждения теоремы следует, что каждая система
из t элементов, где t > s, должна быть алгебраически зависимой.
Предположим теперь, что система (-%, ..., i\s) является минимальным
базисом для К*, и пусть (^ С8') — другой минимальный базис.
Тогда
s'<s и s<s',
так что
s = s'.
Таким образом, число элементов минимального алгебраического
базиса поля К* относительно К одно и то же при Любом выборе
минимального базиса. Мы будем называть это число размерностью
(или степенью трансцендентности) расширения К*относительно К-
Теорема VI. Если \v ..., lr — минимальный алгебраический
базис расширения К* поля К, а С — произвольный элемент из К*,
то в /С[Jtj, ..., хг+1] существует ненулевой неприводимый много-
многочлен f(xt xr+1) такой, что
/& *„ 0 = 0.
Если g(xv ..., хг+1) — произвольный другой многочлен, для кото-
которого
то
g(xv .... xr+1) = f(xt, .... xr+1)h(xv ..., xr+1),
где многочлен h(x1, ..., хг+1) принадлежит K[xi *r+il-
В силу алгебраичности С над К(it, ¦¦-, Sr), в K[xv ..., Jfr+]]
существует такой неприводимый многочлен f(xit ..., *r+1), что
№ V. 0-0-
Пусть теперь g(xv ..., хг+1)—^^произвольный многочлен, удовлетво-
удовлетворяющий условию g(llt .. ., \г, С) = 0. Поскольку многочлен f(xit ...
..., xr+i), рассматриваемый как элемент кольца К(хг xr) [xr+l].
122 ГЛ. Ш. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
неприводим1), многочлен g(x1, ..., хг+1), также рассматриваемый
как элемент кольца K(xt хг) [хг+1}% либо имеет f(xt -*V+i)
своим делителем, либо взаимно прост с ним.
Случай (I). Пусть
„(г г \ fiY r \ h(x\, .... -уг-и)
s \xi, • • •» xr+i) — J \xi> • • • > xr+v k(xb .... х ) '
Тогда
Так как К[х1 лгг+1] — область с однозначным разложением,
а многочлен f(xt xr+i) неприводим и содержит члены с хг+11
то многочлен k(xt xr) должен являться делителем многочлена
h(xlt..., х,.+1). Следовательно, после сокращения на k(xit..., xr)
получаем
Случай (II). Пусть/(*! ,. .., хг+1) и g(xu.. ., х,.+1) взаимно просты
как многочлены из K(xt ,..., хг) \х,.+1\. Тогда в K(xt хг) [х,.+1\
существуют такие элементы a(xlt..., xr+1) и Ь(ху, ...,хг+1), что
!+ ilt..., Xr+1)=l.
Пусть
x Л —
a / x x \ _ B(xi,..., xr+i)
P^l Xr+1>— B, (jf, Xr) >
где A(xlt. .., xr+l) и B{xl xr+1) лежат в К [xt ,. . ., лг,.+1],
') Действительно, из
) () Хг+1)
получаем
откуда, так как K[xt -*r+i] — область с однозначным разложением (см.
теорему II § 8 гл. I), а многочлен /(jcj, ..., -*rr+i) неприводим, следует, что,
скажем,
=f(xu .... лгг+1) ч)[ (хи .„, дггЧ1);
после сокращения на f(xlt ..., хг+{) получаем
"> (х{ хг) = ч[ (хх хпх) ч>2 (хх jrr+i).
Поэтому t(>j и tp2 не зависят от Jtr+i, и тем самым разложение (¦*) оказыт
вается тривиальным. — Прим. перев.
§ 4. РАЗЛОЖЕНИЕ МНОГОЧЛЕНОВ НА МНОЖИТЕЛИ 123
а Лх(*!,..., хг) и В1(х1',..., хг) — в К1х1у..., хг]. Тогда
iBj^i, .... xr)A(xlt ..., xr+1)f(x1 xr
= Л1(х], ..., лдя^х, xr),
и поэтому
6,.
5r,C) = 0.
Следовательно, элементы ^ ?r оказываются алгебраически зави-
зависимыми над К, вопреки условию теоремы. Таким образом, единственно
возможным остается первый случай, и теорема доказана.
§ 4. Разложение многочленов на множители
Пусть f(x) — неприводимый многочлен из К[х]. Воспользуемся
им, как в § 1, для построения алгебраического расширения Ф
поля К. По теореме об остатке (гл. I, § 6),
так как /(?) = 0; здесь ft(x) принадлежит кольцу К(?)[х]. Таким
образом, когда мы расширяем поле К До /C(S), многочлен f(x) ста-
становится приводимым. Более обще, пусть F(x) — некоторый много-
многочлен степени п из К[х], причем
F(x) = F1(x)Fs(x)... Fk(x),
где ' множители Ft (x) неприводимы и имеют степени ni > 0
(/ = 1, .... h). Тогда
к
» = 1
Если п{ > 1 для некоторого i, то мы можем построить алгебраиче-
алгебраическое расширение поля К, в котором многочлен Ft (x) уже будет при-
приводимым. Другими словами, мы можем найти такое алгебраическое
расширение К' поля К, над которым F(x) разлагается по меньшей
мере на k-\-l множитель. Идя далее по этому пути, мы получим,
наконец, алгебраическое расширение К* поля К, такое, над кото-
которым F(x) разлагается в произведение п множителей первой степени.
Многочлен с коэффициентами из заданного поля, допускающий пред-
представление в виде произведения линейных множителей, называется
вполне приводимым над этим полем. Таким образом, доказана
Теорема I. Для любого многочлена f(x) из К[х] существует
алгебраическое расширение поля К} над которым f(x) вполне
приводим.
124 ГЛ. III. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
Эта теорема занимает в нашей книге место „основной теоремы
алгебры", утверждающей, что если К-—поле комплексных чисел, то
каждый многочлен из К\х] вполне приводим над К-
Поле К, обладающее тем свойством, что каждый многочлен из
К[х] вполне приводим над К, называется алгебраически замкнутым.
Примером такого поля может служить поле комплексных чисел.
В последующих главах мы часто будем начинать с рассмотрения
алгебраически замкнутого поля К. Но мы не можем ограничиться
лишь такими полями, так как присоединение к полю К неизвестного
приводит нас к полю, не являющемуся алгебраически замкнутым.
Например, если К—поле комплексных чисел, ахну—неизвестные,
то многочлен х2-\-у-—1, рассматриваемый как многочлен от у,
неприводим над К(х). Мы вынуждены поэтому заниматься полями,
не являющимися, вообще говоря, алгебраически замкнутыми. При-
Приведем, однако, формулировку следующей интересной теоремы.
Теорема II. Для любого поля К существует алгебраически
замкнутое алгебраическое расширение К*. Это расширение К*
определяется полем К, с точностью до эквивалентности, одно-
однозначно.
Такое поле К* называется алгебраическим замыканием поля К-
Нам не придется использовать этой теоремы, и поэтому мы опускаем
ее доказательство, которое довольно сложно.
Рассмотрим снова произвольное поле К. Пусть в нем задан много-
многочлен
F(x) = F1(x)... Fk(x)
степени п. Множители Ft (x) предположим неприводимыми много-
многочленами из К[х]. Пусть К[ и К*г — два произвольных расширения
поля К, над каждым из которых F(x) вполне приводим. Пусть
— У и
— разложения F(x) на множители соответственно над К[ и над lC%-
Изучим взаимоотношения между расширениями К(\х 1п) и
f (%>•••> "Чп)- Эти поля являются подполями соответственно полей Ki
и Ki. Так как мы не будем выходить за пределы этих подполей,
то можно считать, что
Тогда и поля К\ и id будут алгебраическими расширениями поля К
(§ 3, теорема II). Мы докажем, что они эквивалентны над К.
Доказательство поведем индукцией по п. При п = 1 нечего дока-
доказывать, так как в этом случае К\ == К1 =? К. Пусть теорема справедлива.
§ 4. РАЗЛОЖЕНИЕ МНОГОЧЛЕНОВ НА МНОЖИТЕЛИ 125
для многочленов степени, меньшей п. Если рассматриваемый многочлен
имеет в К[х] линейный множитель х— ос, то
и справедливость теоремы следует из предположения индукции.
Поэтому мы предположим, что степень каждого из неприводимых
множителей F{(x) нашего многочлена ^(л:) больше 1, так что среди
элементов ^ ,...,?„ и -% ,. . ., т\п нет принадлежащих полю К.
Так как К*х — поле, то К\[х\ есть область с однозначным разло-
разложением, и потому линейными множителями многочлена Fx(x) являются
некоторые из множителей х — ?4. После возможного изменения нуме-
нумерации множителей мы можем считать, что х — ?г является делите-
делителем F1(x), так что /71E1) = О. Подобным же образом можно считать,
что /71(yj1) = O. По теореме II § 2, поля /C(SX) и /(("%) эквивалентны.
Поэтому и кольца К(^)[х] и KinJlx] эквивалентны, так что если
— разложение F(x) на множители в K($i)[x\, причем FfJ(x) — не-
неприводимые многочлены с коэффициентами из /C(?j), то
— соответствующее разложение ^(л:) на множители в /С (%)[.«]; здесь
множители F*p^(x) являются многочленами, соответствующими Ff^(x)
при изоморфизме колец К(Ьг)[х] и Kin^lx]. Но F(x) имеет теперь
линейный множитель х — \х в кольце К^\х\ и множитель х — f\t
в K(i\!)lx]. По предположению индукции, расширение, получаемое
присоединением ?2 %п к К(^), изоморфно расширению, получае-
получаемому присоединением г\2 ,..., ч\п к К (ч\{), причем этот изоморфизм
таков, что элементам из /С(^) отвечают элементы из /((%), уже на-
находящиеся с ними в соответствии в силу эквивалентности полей
К (У и' К (-%). Следовательно, К& У и /<:(% ,..., irjn) —
эквивалентные расширения поля К.
Если F(x) — многочлен степени п из К[х] и если над некоторым
расширением поля К
то поле K(lv ..., in) называется полем разложения многочлена F(x).
Таким образом, доказана
Теорема III. Поле разложения многочлена F(x) из К[х]
определено однозначно с точностью до эквивалентности над К.
Мы можем применить эти теоремы для иллюстрации важного за-
замечания, состоящего в том, что если заданы два расширения Кх и /С2
некоторого поля К, то может и не существовать такого расширения К*
поля К, которое содержало бы Kt и К2 в качестве подполей. Для
ГЛ. ill. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
того чтобы показать это, выберем в кольце К[х] неприводимый много-
многочлен F (х) степени п > 1, а за К\ и /С2 возьмем эквивалентные, но
не совпадающие поля разложения многочлена F{x), пересекающиеся
лишь по полю К- Предположим, что ?t ,.'.., \п — корни многочлена F(x)
в К1г а "»)!,. ..,"»)„ — в К%. Тогда ?;?=•*)_/ при любых / и j. Если
бы К* являлось полем, содержащим оба расширения Кг и /С2, мы
имели бы над К*
Но отсюда следует, что
и потому 7)j==cfc для некоторого &, вопреки предположению.
Если F(x)— ненулевой многочлен из К[х], то элемент S, принад-
принадлежащий К или некоторому его расширению, такой, что F(?) = 0,
называется корнем, или нулем многочлена ^(л:). Докажем следующую
теорему:
Теорема IV. Два многочлена аз К[х\ обладают общим кор-
корнем в том и только в том случае, если их наибольший общий
делитель имеет положительную степень.
Пусть ^(л:) и G(x) — многочлены из К'[х\, d(x) — их наибольший
общий делитель. Тогда в К\х] существуют такие многочлены а{х),
b(x), f(x) и g(x), что
A)
= d(x)f(x), Q(x) = d(x)g(x). B)
Пусть К* — такое расширение поля К, над которым ^(л:) и О (л:)
вполне приводимы. Тогда и d(x) вполне приводим над /<¦*. Если
L—общий корень многочленов ^(д:) и G(x), то, в силу равенства A),
6 служит корнем и для d (х). И наоборот, если ; — корень многочле-
многочлена d(x), то из соотношений B) мы выводим, что I является общим
корнем для F(x) и О(х). Теорема доказана.
Заметим, что наибольший общий делитель многочленов F(x) и G(x)
можно найти путем проведения некоторых операций в К \х\ (гл. I, § 6),
в то время как общий корень этих многочленов, если таковой вообще
существует, может лежать в некотором алгебраическом расширении
поля К, определяемом многочленом d{x).
Теория полей разложения обширна, и большая ее часть выходит
за пределы этой книги. Мы закончим настоящий параграф ознаком-
ознакомлением с симметрическими функциями корней многочлена.
§ 4. РАЗЛОЖЕНИЕ МНОГОЧЛЕНОВ НА МНОЖИТЕЛИ 127
Пусть jCj хп— система п независимых неизвестных над /С,
и пусть
r1=xt-j-...+xre,
сч =ЗД + ЗД+ • • • ~\~xn-ixn>
Мы называем си с2,.. ., сп элементарными симметрическими
функциями от xt ,..., хп. Они, очевидно, не изменяются при всех л!
подстановках неизвестных xt,..., х„. Вообще, произвольный много-
многочлен из К [хх ,..., хп] называется целой симметрической функцией
от Xj хп, если он остается неизменным при всех п\ подста-
подстановках неизвестных xlt..., xn. Мы докажем, что каждый такой
многочлен можно выразить через элементарные симметрические функ-
функции. Говоря более точно, будет доказана
Теорема V. Каждая целая симметрическая функция /(х,, ...
.... хп) от xt хп лежат в К[сх, .... сп].
Назовем суммарной степенью выражения Х\ х* . .. х,? число
п
2 rit а суммарной степенью многочлена f(xx хп) — наибольшую
из суммарных степеней отдельных его членов Х\Х% ... jcnn, коэффи-
коэффициенты вГ1Г, _., г при которых отличны от нуля. Теорему будем
доказывать индукцией по п, а при каждом п — индукцией по суммарной
степени многочлена f(xv ..., хп).
В случае п=1 имеем cl = x1 и, следовательно, К[хг] = К[сх].
Утверждение теоремы в этом случае тривиально. С другой стороны,
если f(xlt ..., хп) — многочлен суммарной степени 1, то
/(*i. ¦¦¦,xn) = alx1-]- ...-\-anxn-\-b.
Поменяем местами xt и Xj. Из симметричности f(xit ..., хп) будет
следовать, что а{ = aj. Таким образом,
т. е. f(xu ..., хп) лежит в K[ct cn\. Поскольку справедли-
справедливость теоремы для п = 1 установлена, мы предположим, что она верна
и для целых симметрических функций от xv ..., xn_v Но мы знаем,
что она справедлива для целых симметрических функций суммарной
степени 1 от xv .... хп. Поэтому предположим, что она верна, когда
суммарная степень равна k — 1, и докажем теорему для симметриче-
симметрических многочленов f(xlt ..., хп) суммарной степени k.
Запишем многочлен f(xt хп) в следующем виде:
128 1 'Л. IH. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
где коэффициенты в /0, ..., fk принадлежат K\xt jcn_j].TlpH
подстановках элементов xv ..., хп, оставляющих хп неподвижным,
/(*! хп), как симметрический многочлен, остается неизменным.
Но это означает, что /0 Д остаются неизменными при любых
подстановках xlt ..., xn_v Другими словами, многочлены /0 fk
представляют собой целые симметрические функции от jCj, ..., хп_1.
По предположению индукции, каждый из этих многочленов, и в ча-
частности /0, может быть записан в виде многочлена от элементарных
симметрических функций неизвестных хи ...,хп_х. Введя обо-
обозначения
" 1= ¦*• 1~г • • • ~т~хп-\,
"¦ч — х\хъ~л~ х\хъ~\~ ••• ~т~хл -\>хп-\>
®п-1 Х1хъ •••хп-\>
мы получим, что
fo = ?O(dl Jn-l)-
Заметим, что
ct = dt + xndt_t (/=1 я). • C)
Но
/ \Х\г • • • . Хп) = /0 -)- ХпГ (ЛГ1 , . . . , Хп),
а из C) следует, что
o0(cv ..., cM_1) = ®0(d,, .... </„..,) + д;„Ф0(д;1, .... х„).
Поэтому
f(xl, •••. Хп) — ?О(С1 сп--д =
= xH[F{xl хн) — Ф0(х, *„)}. D)
Суммарная степень <?0(с1г ..., сп_х), рассматриваемого как многочлен
от хи . .., хп, равна суммарной степени <?0(dit .. ., dn_1), а послед-
последняя совпадает с суммарной степенью многочлена /0. Следовательно,
поскольку эта степень не превосходит k, суммарная степень много-
многочлена, стоящего в правой части равенства D), также не может пре-
превосходить k. Но левая часть равенства D) является целой симметри-
симметрической функцией от хи ..., хп\ поэтому правая часть должна, кроме хп,
иметь множителем произведение ххх2 ... хп_,. Следовательно, мы
можем записать:
= *! ... xnG(x1 xn) = cnQ(xl хп),
где многочлен О(хи ..., хп) симметричен по х1..., хп и имеет
суммарную степень <^& — п. По предположению индукции,
§ 4. РАЗЛОЖЕНИЕ МНОГОЧЛЕНОВ НА МНОЖИТЕЛИ 129
и поэтому
+ K«i сп)-
Таким образом, f{x1 х„) принадлежит кольцу К\сг сп].
Теорема доказана.
Эта теорема употребляется главным образом для установления связи
между коэффициентами многочлена и его корнями. Присоединяя
сх сп к полю К, мы получаем поле К*, являющееся подполем
расширения К(хи ..., хп). Рассмотрим в К*[х] многочлен
/ (дс) = х» — Cjx«
В кольце K(xlt .... хп)\х] этот многочлен можно записать в виде
и теорему V можно рассматривать как теорему, устанавливающую
некоторое свойство поля разложения многочлена f(x).
Рассмотрим, с другой стороны, многочлен
F(x) = х» — vlJC»-i +...+(- 1)"»„
из К [х]. Обозначим через Jx Ъп его корни в некотором расшире-
расширении К* поля К. Каждый элемент поля разложения /fFlt ..., Sn) много-
многочлена F {х) может быть записан в виде многочлена от ^ \п
с коэффициентами из К (§ 3, теорема II). Пусть а (^ ?„) обо-
обозначает такой многочлен. Он называется симметрической функцией
корней fij, .... $„, если a(Xj, ..., х^) является целой симметрической
функцией неизвестных xlf ..., хп. По теореме V,
а(хи ..., xn) = b(clt .... с„),
где i {сх, ..., с„) — многочлен с коэффициентами из К. Следовательно,
специализация х{ -> lt (t = 1, ..., я) дает
а (^ .... У = * (•*,, vn).
Этим доказана
Теорема VI. Если F(x) — многочлен из К [х], то любая симме-
симметрическая функция его корней принадлежит полю К.
Может, однако, случиться, что а (^ ..., &„) принадлежит К,
в то время как многочлен a [xt xn) не симметричен.
Теорема VII. Если г\ — некоторый элемент поля разложения
многочлена F(x), то характеристический многочлен элемента ч\
над К вполне приводим в указанном поле разложения.
Пусть %х, ..., $п попрежнему обозначают корни многочлена F (х) и
¦Ч = в(&1 К),
где а{хх хп) принадлежит кольцу К[хи ..., хп]. Далее, через
«4*1 *п) (/=1 «О
9 Зак. 1230. В. Ходж и Д. Пидо
130 ГЛ. ill. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
обозначим результат применения подстановки неизвестных xt хп
к многочлену a (xv .... хп). Рассмотрим многочлен
и!
[х — с< (xt, .... хп)\ = xnl + bxxn- + ... + bnX.
Его коэффициенты ft4 являются, "очевидно, целыми симметрическими
функциями от х1 хп. Поэтому многочлен
лежит в кольце К\х]. Но <р(т]) = О, и потому характеристический
многочлен элемента тг) является делителем многочлена <?(х). Поскольку
» (х) полностью приводим над полем разложения многочлена F (х), то тем
же свойством обладает характеристический многочлен.
Закончим этот параграф следующей теоремой.
Теорема VIII. Элементарные симметрические функции су сп
от п независимых неизвестных над К сами алгебраически не-
независимы над К-
Обозначим неизвестные через ху, .... хп. Если п = 1, то ct = хх
и утверждение теоремы тривиально. Поведем доказательство теоремы
индукцией по п, используя обозначения теоремы V. По предположе-
предположению, rfj dn-i алгебраически независимы над К. Допустим, что
ci> •••. сп алгебраически зависимы. Тогда существует соотношение
+ t
Q ^ _J ... —т~ ®tCn — О
где о{ принадлежат K[ct, ..., сп_1] и не все равны нулю. Положив
в этом тождестве хп = 0, найдем, что
(?(d1 dn-i> ty — *?o(ci> •••> cn-i) ==?o(^i» •••> <'»-i)==^
является тождественным нулем. Поэтому из допущения, что»^,..., сп) =
= 0, мы получаем
? (q сп) = сп$ (си .... сп) = 0,
откуда
Повторяя это рассуждение, мы последовательно обнаружим, что
?i> ?2> ¦••> ?« тождественно равны нулю. Теорема доказана.
§ 5. Дифференцирование многочленов
Пусть х — неизвестное над полем К, а
¦— многочлен из К [х]. Тогда, если h — некоторое новое неизвестное, то
)—/(*)—«<>—"о + а1 К* + А)—*1 + • • • + «п 1С* + h)n—хП\в
§ 5. ДИФФЕРЕНЦИРОВАНИЕ МНОГЙЧЛЁНОВ
и потому¦
f(x + h)—f(x) ,,, ч , , , ,ч
h f (x) + hg(x, h),
где g(x, h) — многочлен из К[х, h], а
f'{x) = at + 2а2х + За3л:2 + ... + шпх^.
Многочлен f'(x) называется производной от f(x) по х. Для произ-
производной часто употребляются также обозначения
d f( \ df
1х~/{-Х) и rfj-
Предположим, что /' (л:) = 0. Тогда
Если К — поле без характеристики, то эти равенства означают,
что
«1 = «2 == • • • = «я = °,
и, следовательно, f(x) = а0, т. е. f(x) принадлежит полю К. Наоборот,
если f(x) лежит в К, то /'(л:) = 0.
Если же К — поле характеристики р, то равенство f (х) = 0 озна-
означает, что коэффициенты а( равны нулю для всех /, не делящихся на р.
Таким образом, в этом случае f(x) лежит в К[хр\. Наоборот, если
f(x) принадлежит кольцу /С[а^], то его производная равна нулю. Это
отличие полей с конечной характеристикой от полей без характери-
характеристики имеет много важных последствий и заставит нас вскоре огра-
ограничиться рассмотрением лишь полей без характеристики.
Начнем с вывода ряда формальных следствий из правила диффе-
дифференцирования. Если
то непосредственно видно, что
+... + (я+n) ^„Х"*»-1 =• (а, + 2а2л; +... + папх^) X
X (Ро + Pi* + ¦ • • + $г»Хт) + («0 + «1* + ¦ • • + V) X
Отсюда в качестве непосредственного следствия получаем, что для
любого натурального г справедливо равенство
9*
ГЛ. ili, АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
Распространим определение производной на любые рациональные
функции от х. Пусть
y~
так что yg(x) = f(x). Определим у' формально с помощью уравнения
Отсюда
/ (х) М' (х) _ f (х) g(x)-f (х) g> (x)
В случае, когда g(x) служит делителем для f(x), частное у оказы-
оказывается многочленом h(x), и можно проверить, что при этом
Операция дифференцирования может быть повторена любое конечное
число раз. Условимся через /<*' (х) обозначать 5-ю производную от/(л:).
Нетрудно проверить следующие соотношения:
(а)
(б)
(в)
(je»]W = п(ге— 1) ... (п —
если f(x)-—многочлен степени, меньшей г;
(г) если К—поле характеристики р и r^-р, то
Это следует из (б), так как при г>р по крайней мере одно из
чисел п, п—1, ..., п — г-\-\ кратно р.
(д) если К*'—некоторое расширение поля К и многочлен f(x)
принадлежит кольцу К[х], то производная от f(x) в К* \х] совпадает
с производной от f{x) в К[х].
Если f(xt хп) — многочлен из К[хи .... хп], то мы можем
рассматривать его как многочлен из К(хи ..., хг_и хг+1 л:п) \хг\
и тем самым определить его производную по хг. Она называется
частной производной от f(xx xn) по хг и обозначается через
При п = 1, очевидно,
Поскольку
*1 Хп)'
д/ = df
... хпп)
. хг1х %
т -I m .. т
r xU ¦.. хпп
§ 5. ДИФФЕРЕНЦИРОВАНИЕ МНОГОЧЛЕНОВ 133
то при г ф s имеем
д3 { »», т
тгтасх\
Это соотношение становится тривиальным при r = s. Подобным же
образом убеждаемся в том, что
д
Поэтому для каждого из этих выражений можно употреблять более
простую запись:
Поскольку многочлен /(лгх хп) является суммой членов вида
ах^ ... х™п, мы получаем отсюда коммутативный и ассоциативный
законы:
дхг \ dxs dxtJ ^i' *' •' х»>) — дхг dxa \dxt
Следующий результат справедлив без оговорок лишь для полей
без характеристики. Прежде всего заметим, что обычный элементар-
элементарный вывод формулы
где суммирование распространяется на все системы неотрицательных
целых чисел ги ..., гп, дающих в сумме г, сохраняет силу для
любого поля К без характеристики.
Пусть теперь
* Хп)
\ ... ГП\ дхп ш _, дхп
Символически это можно записать так:
Мы докажем теорему:
134 ГЛ. III. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
Теорема Тэйлора. Если /(jq хп)—-произвольный мно-
многочлен суммарной степени N из К[х± хп], то
N
/(¦«1+Л xn~^yn) = 1^i^Arvxf(x1, хп).
Проверим прежде всего эту теорему для п = 1. Если
то
?[2 • 1 • «2 + 3 • 2 • а8
Г=0
Продолжим доказательство методом индукции, предполагая, что
утверждение справедливо для всех многочленов с числом неизвест-
неизвестных, меньшим п. Если положить
д V
то прямым подсчетом проверяется, что
^yxf\xi> • • • > хп):=^
По предположению индукции,
N
1
8 = 0
применение же теоремы Тэйлора для случая п = 1 дает
9 * ^ 1 f Qt a
uyxj \Л1 Ля-1> лп~т~Уп) —' 7j (| Уп , + uyxj V-*ii
§. 5. ДИФФЕРЕНЦИРОВАНИЕ МНОГОЧЛЕНОВ 135
Поэтому
N N-8
/<*i + Ух. ¦ • •. хп +уп) ¦= 2 i 2 7Г -У» А °ЬКХ1 *»)•
а=о ' t=0 xn
Суммирование справа проводится по точкам плоской целочисленной
решетки, лежащим внутри и на границе равнобедренного прямоуголь-
прямоугольного треугольника с катетами длины N. Эти точки можно исчерпать,
проходя по параллелям к гипотенузе. Другими словами, положим
s-\-t=r @<;<г)
и заставим г изменяться от 0 до N. Тогда
N г
(г —1)\ "KynJ7*~ D»x
как было установлено выше. Этим теорема доказана.
Рассмотрим теперь некоторые приложения операции дифференци-
дифференцирования к теории корней многочленов.
Теорема I. Пусть f(x)—многочлен положительной сте-
степени п из кольца К[х], и пусть К* — такое расширение поля К,
над которым многочлен f (х) вполне приводим. Тогда многочлен j (x)
обладает в К* меньшим чем п числом различных корней в том
и только в том случае, если либо наибольший общий делитель
многочленов f(x) и f'(x) имеет степень, большую нуля, либо
/'W = 0.
Последний случай возможен лишь для поля К с конечной харак-
характеристикой.
Необходимость. Предположим, что многочлен f(x) вполне при-
приводим в К* [х] и что
f(x) = а(х — У». ... (х — у»*- (яц > 0),
где все корни %lt ..., %г различны. Тогда
/' (*) = а 2 Щ (х - у». ... (х — у1"! ... (х ~ %г)тг,
и потому либо /' (л:) — нулевой многочлен, либо при
ти . .., ms > 1, ms+1, .,., mr = 1
ГЛ. III. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
произведение
служит общим делителем для f(x) и f'(x) в кольце К* [х]. По-
Поскольку f(x) и f(x) не взаимно просты в К*[х], они не могут быть
взаимно простыми и в К\х\ (гл. I, § 6, теорема II).
Достаточность. Рассмотрим сперва случай, когда /' (х) — нуле-
нулевой многочлен. Тогда, как мы видели в начале настоящего параграфа,
поле К должно иметь характеристику. Если его характеристикой
служит число р, то f{x) лежит в кольце К[хр]. Пусть
где <?(у) принадлежит кольцу К [у]- Существует такое расширение К'
поля К, над которым многочлен <о(у) вполне приводим:
Существует также' расширение К* поля К', содержащее такие эле-
элементы Ej, ..., \f, что
# = % (/=1 г).
Далее, поскольку К* — поле характеристики р, прямой подсчет по
формуле бинома Ньютона показывает, что
Поэтому в К* [х]
Следовательно, многочлен f(x) вполне приводим в К* [х] и имеет не
более г различных корней.
Предположим теперь, что f'(x) ф 0 и что многочлены f(x) и f'(x)
имеют общий множитель #(.*:) положительной степени. Так как сте-
степень многочлена /' (х) равна п ^— 1, то g (х) имеет степень т < п.
Поскольку
f(x) = g
то
Но g"(Jf) является делителем и для f (х). Поэтому на него делится
и произведение gr(x)h(x). Так как многочлен h(x) — не нуль, то
произведение может обратиться в нуль лишь в случае, если gf(x)
есть нуль. Доказательство, проведенное выше, показывает, что g(x)
является в этом случае р-й степенью некоторого многочлена в соот-
ветстьующем расширении К'[х] кольца К\х\, так что в этом рас-
расширении f{x) имеет кратный множитель. Если g1{x) — не нуль, то
% 6. ПРИМИТИВНЫЕ ЭЛЕМЕНТЫ 137
в силу того, что произведение g'(x)h(x) делится на g(x), много-
многочлены g(x) и h(x) должны иметь общий делитель, так как g'(х)—
многочлен меньшей степени чем g(x). Следовательно, и в этом слу-
случае f(x) обладает кратным множителем. Итак, в обоих случаях для
соответствующего расширения К' мы имеем
где некоторые mt > 1. Производя дальнейшее расширение поля К',
мы придем к такому полю К*, над которым каждый множитель /4 (х)
вполне приводим, как этого и требует теорема.
Закончим настоящий параграф следующей теоремой:
Теорема II. Если К—поле без характеристики, то все
корни любого неприводимого в К[х] многочлена f(x) различны.
Над полем разложения многочлена f{x) мы можем записать:
Нужно доказать, что все \v ..., \п различны. Если бы это было не
так, то, в силу предыдущей теоремы, многочлены f(x) и f'(x) имели бы
общий делитель. Поскольку же f'(x) имеет меньшую степень,
чем f(x), a f(x) неприводим, общего делителя у этих многочленов быть
не может. Предположением, что К есть поле без характеристики, мы
исключили случай обращения производной f'(x) в тождественный
нуль.
§ 6. Примитивные элементы алгебраических
расширений
В теореме I § 3 мы установили, что каждое расширение конеч-
конечной степени поля К является алгебраическим расширением этого поля.
С другой стороны, как видно из § 1, простое алгебраическое
расширение поля К является расширением конечной степени. Мы
теперь уточним эту связь между расширениями конечной степени и
простыми алгебраическими расширениями с помощью следующей тео-
теоремы:
Теорема I. Если К — поле без характеристики, то каждое
его расширение К* конечной степени является простым алгебраи-
алгебраическим расширением.
Так как К* есть расширение конечной степени, то :
где Tj, ...., ти — алгебраические над К элементы. Доказательство
теоремы поведем индукцией по п. При п=\ поле /C(tj) .явдаш'тЪя
алгебраическим расширением поля К, определяемым характеристиче-
характеристическим многочленом элемента Tj (§ 2, теорема I). Поэтому ггредпо-
138 ГЛ. III. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
ложим, что теорема справедлива для K(tt t«_i)- Это означает,
что в поле /((ij *n-i) существует такой элемент С, что
Мы должны показать, что К (С, т„) также является простым алгебраи-
алгебраическим расширением поля К- Таким образом, нам нужно рассмотреть
лишь случай п==2, т. е. доказать теорему для поля К(Ь, у\). Этим
будет обеспечено проведение индукции и в общем случае.
Пусть f(x) и g(x)— характеристические многочлены элементов
$ и т) относительно поля К. Предположим, что над расширением К'
поля К выполняется равенство
/(*) = (* — St) ... (х — ?„),
причем можно считать, что ? = \ и t\ = т]1. Так как результат, ко-
который мы хотим доказать, тривиален в случае, когда п или т
равно 1, то мы можем предполагать, что п> 1 и /те > 1.
Так как /С—поле без характеристики, а многочлены /(л:) и g(x)
неприводимы, то корни ^ \п все различны, так же как и корни
""lii • • • > Ът (§ 5, теорема И). При Ь,Ф 1 T]ft ф i\, и потому уравнение
(I)
для каждого значения i имеет единственное решение д; = Сд., кото-
которое лежит в К'. Поле /С, как не имеющее характеристики, содержит
бесконечно много различных элементов. Мы можем поэтому найти
Э нем элемент с, отличный от всех принадлежащих полю К решений
cik (i= I «; ft = 2, .... от)
уравнений A). Для этого элемента с
^-\-С1\кф1-\-сг[ (i=l n; k = 2 от).
Обозначим через 6 элемент из K(l, t\), определяемый равенством
Так как 6 принадлежит K(l, t\), то поле /С(9) лежит в /С($, ч\). Мы
докажем, что и наоборот, поле K(l, f\) лежит в К(Ъ), так что эти
поля совпадают.
Мы знаем, что
Положим
/(9 — cx) = h{x).
Многочлен h{x) принадлежит кольцу Кф)[х]. Многочлены h{x) и
^(д:) имеют в К' [х] общий делитель x — i\. Он является также
наибольшим общим делителем, так как из допущения, что х — %
§ 7. ДИФФЕРЕНЦИРОВАНИЕ АЛГЕБРАИЧЕСКИХ ФУНКЦИЙ 139
(для некоторого k > 1) служит общим делителем, следовало бы, что
А Ы =/С»-«!*) = 6,
т. е. что для некоторого i
откуда
вопреки определению с. Таким образом, многочлены g(x) и А (л:) из
AT (в) [л:] имеют х— f\ своим наибольшим общим делителем в К' [х].
Отсюда вытекает, что их общий наибольший делитель в
. имеет вид
+ = а(х — ц) [а,
и значит, элемент •*) лежит в поле AT (в). Но из равенства
следует, что и 6 принадлежит ATF). Мы показали тем самым, что
поле AT(S, t\) лежит в AT(9). Этим завершено доказательство теоремы.
Элемент % расширения AT* поля К называется примитивным эле-
элементом расширения AT*, если АТ* = АТ(?). Таким образом, каждое
расширение конечной степени поля без характеристики обладает при-
примитивным элементом.
§ 7. Дифференцирование алгебраических функций
В § 5 мы определили частные производные многочлена из
K[xv ...,xn] по неизвестным х1г ..., хп. В предположении, что
К—поле без характеристики, мы покажем теперь, как можно
расширить это определение, чтобы можно было говорить о частных
производных алгебраической функции i\ от неизвестных xt, ..., хп.
Опираясь на это, мы докажем важный критерий алгебраической
независимости системы элементов заданного функционального поля.
Пусть К* — алгебраическое расширение поля К(хх, ..., хп), и
пусть Y] — некоторый элемент этого расширения. Как было сказано
в § 3, элемент ч\ называется алгебраической функцией неизвестных
хх хп. По теореме VI § 3, существует неприводимый многочлен
f(xt, .... хп, у), однозначно определенный с точностью до ненуле-
ненулевых множителей из К, такой, что
/С*!,...., хп, 'П) = 0.
Любой многочлен g (xv ..., хп, у), удовлетворяющий условию
?(*i. ••-, хп, к)) = 0» a-.v
имеет многочлен f(xv ..., хп, у) своим делителем. Но элементы
xt хп алгебраически . независимы над AT. Следовательно,
140 ГЛ- Ш. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
многочлен f(xv ..., хп, у) действительно содержит у, и потому
^/(*i хп, у)фО,
поскольку К—поле без характеристики. Обозначим через
результат подстановки ч\ вместо у в многочлен -^-f(xi хп> У)-
Этот последний не может содержать f(xt, ..., хп, у) в качестве
множителя, и потому
/(ххп>
После этих предварительных замечаний мы можем определить частные
производные дг[/дх{ уравнениями
^v .... х„, f\)^ + j^.f(xv '.... хп, -п) = 0 (/=1 «).
Заметим, что если F(xv ..., хп, у) — произвольный многочлен, для
которого
F(xu ..., хп, ti) = 0,
то
F{xi *„, y) = G(xu ..., хн, y)f(xt хп, у),
так что
-F(jcv .... хп, y)*H + -±F(Xl хп, .у) =
-/(*!• • •... xn,y)[~f G(xt *п.У)щ± д% G(xlt.... хп,у)\
+ (~1 ( y V* \j\ I — f I V* V* \)\ ~ 1 г f ( Y V \f\
.\j \^Ла у . • » j "^ fit У) I л J \ 11 * * * i tit —V/ 3~~~ I Л У \ 1 * * * *• w* j' i
Следовательно,
di) ч 1> "' l/ dX{ ' ox/ *¦ ™ "
В частном случае, когда элемент ч\ лежит в поле K(xlt ..., хп),
наше определение производных &f[jdXi совпадает с определениями § 5.
В самом деле, если
Ь -...Хп)
/i h{xb...,xny
где многочлены g{x^ xn) и h(xt xn) взаимно просты, то
характеристическим многочленом элемента г\ является
/(*1 хп, y) = h(xv .... xn)y — g(xv ..., хп),
§ 7. ДИФФЕРЕНЦИРОВАНИЙ АЛГЕБРАИЧЕСКИХ ФУНКЦИЙ 14i
и наше новое определение производной приводит к прежней формуле
dfj 1 Г, . . д , ,
~dxl~~[h{Xl дг„)Р1П(х* Xn>dTtg(Xl' •••' Хп'~~
— g{xt;..., xn)~h(Xl *
Поскольку размерность поля К* равна п, минимальный базис этого
поля образуется любыми п алгебраически независимыми элементами
из К*. Пусть такими элементами будут S1, ..., Sn. Тогда, по тео-
теореме VI § 3, существует однозначно определенный неприводимый
многочлен F(xlt ..., хп, у) такой, что
Как и выше, можно показать, что
и определить дч\1д\% уравнениями
Мы хотим установить связь между частными производными d-qfdxt
и дч\/д1{. Для этого придется начать с доказательства одной леммы.
Пусть $!,..., %г — система г элементов некоторого алгебраического
расширения поля К без характеристики. Обозначим через ft (x) харак-
характеристический многочлен элемента ?< относительно поля К и докажем
следующее утверждение.
Если F(xt хг) — произвольный многочлен из кольца,
К[JCj,...., хг], обладающий тем свойством, что
то в K\xv ...rxr] существуют многочлены
Л(хх хг) и Вг(xlt .... х,) (i = 1, .... r),
удовлетворяющие условиям
г
А(х1 xr)F(xlt .... хг) = 2Bi(*i xr
Частный случай этого утверждения для г = 1 содержится в тео-
теореме I § 2, и поэтому мы можем продолжать доказательство по индук-
индукции. Итак, предположим, что теорема справедлива для r — s—1.
Рассмотрим вместо поля К его простое алгебраическое расширение К (?8).
Над этим новым полем прежние характеристические многочлены ft (jc)
(/=!,..., s—1) элементов lu ..., $8-1 могут оказаться уже
142 ГЛ. III. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
приводимыми. Но поскольку КA8) одновременно с К является полем без
характеристики, только один неприводимый множитель каждого харак-
характеристического многочлена fi(x) может обратиться в нуль при спе-
специализации х -*¦ Ъ{. Представим ft (х) в виде
где <?i(xs, х) и tyi(xs, х) — многочлены из кольца K[xs, x], причем
?*E8> х) неприводим в K(Zs)[x] и
что
й(дг1( ..., xs_l, ;я) г (jfj, ...,
По предположению индукции, в K(ia)[x1 xa-i\ существуют
такие многочлены
*8-1, U и bt(xlt .... x8_lt У (/=1 s— 1)(
0)
Так как /iC(Ss)—простое алгебраическое расширение поля К, то мы
можем считать [см. формулу A) § 1], что а (xv ..., х8) и Ь{ (хх xs)
принадлежат K[xt xs]. Умножим теперь равенство A) на такой
множитель, чтобы каждый многочлен <?*(?„, х{) превратился в (
При этом A) примет вид
8-1
i), B)
i=l
где
(; = i /—1, /+1, ••¦. * —1).
Если мы положим
S-1
A (xt хв) = а (xt xs) Ц ^ (-«8. Jf<),
то будем иметь
Что же касается многочлена
- у у- \ V* ft (у Г \ f (v \ /"}\
С1» •••> xa_v XJ Xj'->i\X\, •••, Xb)Ji\Xi), (о)
§ 1. ДИФФЕРЕНЦИРОВАНИЕ АЛГЕБРАИЧЕСКИХ ФУНКЦИЙ 143
то он, в силу B), обращается в нуль при специализации
ха -*¦ ls.
Но это означает, что при той же специализации обращается в нуль
суммарный коэффициент при каждом произведении степеней неизвест-
неизвестных х1г ..., ха_г в многочлене C). Следовательно, каждый такой
коэффициент имеет вид 0 (xa)fa (ха). Поэтому многочлен C) равен
В„(хх, .... xa)fg (xs), где В8 (xt х8) принадлежит К\х1ш .... xs].
Таким образом,
s
I, ¦ . ., л^ I ^л», ¦ • ¦, "&)' j!Li i v"!! • • • > &/Л v i/t
и наша лемма доказана.
Пусть теперь щ ч\п — система элементов алгебраического
расширения К* поля К(х1г ..., хп), причем эти элементы алгебраи-
алгебраически независимы над К, и пусть С — произвольный элемент из К*.
По теореме VI § 3, существуют такие однозначно определенные не-
неприводимые многочлены f(xlt ..., хп, г) и g{y1 уп, г), что
/0*1 хп, С) = О и g (f\u ..., fln, С) = 0.
С другой стороны, существуют однозначно определенные неприводи-
неприводимые многочлены ft (xu .... хп, у4), для которых
h(Xi хп, •»].•) = О (г=1, ..., «).
Применим доказанную выше лемму, взяв поле К(х1 хп) вместо
поля К и поле К* вместо расширения поля К. Согласно лемме,
мы можем найти многочлены
А(х, у, z) = A(xlf .... хп, yt уп, г),
В{(х, у, г) = В{(х1 хп, yit ..., уп, z)
и
С(х, у, z) = C(xlt ..., хп, у1 уп, z),
удовлетворяющие условию
М*> У. z)g(yu .... уп, г) =
, у, z)ft(xv ,.., хп, yi) + C(x, у, z)f{xlt . .., хп, z),
причем
144 гл. lit. Алгебраическая зависимость
Дифференцируя это равенство по хи у^ z и подставляя t\j и С
вместо у$ и г, получим:
п
О = 2 Bt (*. Ч. О g^ /* (*. 1*) + С (х, % С) ^-/(*, С), D)
С) = С(*. 71, C)J/(jt, С). F)
Так как А (х, т), ?) Ф 0 я dg (i\, Q/d? =^ 0, то из равенства F) сле-
следует, что и С(х, t\, ?)фО.
Мы знаем также, что df(x, Qldr, ф 0. Поэтому с помощью соот-
соотношения f(x, С) = 0 и равенств D), E) и F) находим, что
>v д
С(х,г,Л)~/(хЛ)
, к), С) | * G), С) ?i~g (т|, С)
Последнее выражение представляет собой сумму
*1
Следовательно, доказана
Теорема I. Пусть т\1г...,1\п — произвольный минимальный
алгебраический базис над полем К для некоторого алгебраического
расширения К* поля К(х1 хп). Если С — произвольный эле-
элемент из К*, то
п
дх{ ij {
Так как полученный результат не связан с конкретным выбором
алгебраического базиса xv ..., хп поля К*, то эта теорема дает
общее правило для нахождения частных производных от С по эле-
элементам одного базиса xv ..., хп, когда известны частные производные
по элементам другого базиса %, .. .,•»)„. В частности,
»
а^_. _ \1дх{ dT]fe
дх4 ~~ *j — Z4 дъь дх,'
J k-l J
§ 1. ДИФФЕРЕНЦИРОВАНИЕ АЛГЕБРАИЧЕСКИХ ФУНКЦИЙ 145
Тем самым мы получили
Следствие. Матрицы.
взаимно обратны.
Частные производные dC/d-r^ (г= 1, ..., п) были нами определены
лишь в случае, когда задан минимальный базис %,..., vjn. Если же
% t\r — произвольные элементы поля К*, а С — произвольный
элемент из К*, алгебраически зависящий от них, то неприводимый
многочлен f(yv .. •,)>,¦, z), для которого
не есть
т)г> С)«О,
может не быть единственным. Если dfj(X. = \df(y, z)/dz] y=,,
нуль и если мы определим oX/d^\j формально из уравнения
то из доказательства теоремы I, в котором не использовалась алге-
алгебраическая независимость элементов r\v ..., ч\п, получим, что
ill— V ^дг[}
дх{ АЛ di\j dxt'
1
Этот результат иногда полезен п конкретных задачах.
Пусть теперь л^ хп — произвольный минимальный базис не-
некоторого поля алгебраических функций, и пусть %,...,%. — си-
система из г элементов этого поля. Тогда г X «-матрица
\дх.
называется матрицей Якоби функций %,..., i\r относительно неиз-
неизвестных хи...,хп. При г = п определитель матрицы Якоби назы-
называется якобианом функций t\lt ..., ч\п по *( *„ и обозначается
через
d(xlt...,xn)'
Теорема II. Пусть х1 хп — минимальный базис поля К*
алгебраических функций, а •»), т}„—система п элементов
из К*. Тогда %, ...,"*]„ алгебраически независимы в том и только
в том случае, если
d(i •»)„) , о
10 Зак. 1230. В. Ходж и Д. Пидо
i46 ГЛ. HI. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
(I) Пусть элементы т^ г\„ алгебраически зависимы, и пусть
>"->Уп) — ненулевой многочлен, обладающий тем свойством,
что
По крайней мере один из элементов i\lt ..., i\n алгебраически зависит
от остальных. Пусть таким элементом будет, например, т]„. Тогда
мы можем предположить, что /(% %-i> Уп) является ненулевым
неприводимым многочленом из кольца
Поскольку K(t\v .. .,f\n_±) — поле без характеристики, мы имеем
Далее, из того, что выражение f(f\lt.. .,f\n_v ?)п) является нулем
поля К*, вытекают равенства
Но
дх( ЛвА df\j dx{'
Поэтому мы получаем систему равенств
откуда ввиду того, что не все dfjdt\j являются нулями, следует, что
(II) Предположим теперь, что элементы т^ цп алгебраически
независимы. Тогда мы можем принять их за элементы минимального
базиса поля К*. Производные dxtl&i\j однозначно определены. По
следствию из теоремы I,
д(хь...,}
и потому
д (*ъ ..., хп)
Для более общего случая имеет место
Теорема III. Если хи...,хп — минимальный базис поля К*
алгебраических функций, а %, ..., i\r — система г элементов из К*,
то эти элементы ¦%,..., ч\г алгебраически независимы тогда и
§ 8. несколько полезных теорем 147
только тогда, когда ранг матрицы Якоба функций щ, ..., i\r no
неизвестным xv ..., хп равен г.
Предположим, что матрица Якоби имеет ранг г. По теореме IV
§ 3 гл. II, она может быть расширена до регулярной п X я-матрицы,
причем элементами добавляемой части матрицы будут
V"(p3=r+1 п' ^=1 л)'
где («г+ц •••>*'») — некоторая перестановка чисел (г-\- 1, ...-,«).
Следовательно, по предыдущей теореме, элементы
и в частности •%,...,ч\г, алгебраически независимы.
Для доказательства необходимости сформулированного условия
предположим, что т^, ...,?],. алгебраически-независимы. Тогда г^.п,
и по теореме о замене (§ 3, теорема V) мы можем найти из числа
элементов хи ..., хп такую систему п — г элементов, скажем
\ = \ (р — г+1, .'...л),
что (%, ...,т|п) будет минимальным базисом поля /С*. Но тогда
d(*i *п) '
и строки матрицы
(
должны быть линейно независимыми. В частности, линейно незави-
независимы первые г строк, и потому ранг матрицы Якоби функций
Y)t, ..., f[r по х± хп равен г. Это завершает доказательство теоремы.
Наконец, отметим следующую теорему, являющуюся непосредствен-
непосредственным следствием результатов, содержащихся в теореме I:
Теорема IV. Если (xv ..., *„), (yt уп) a (zt zn)~
три минимальных базиса поля К* алгебраических функций, то
имеют место соотношения
д{гь ¦.., *„) _ 3(g] гп) д(yt уп)
д{хх,...,хп) д(у! ,уп) д(хь.,.,хп)'
д (Уь • • •,Уп) _д (*i х„) __ t
х„) d(j, у„)
% 8. Несколько полезных теорем
Мы закончим эту главу доказательством нескольких теорем, ко-
которые будут использованы в следующих главах.
Теорема I. Если К—поле, содержащее бесконечно много
элементов, и если
<Pi(*i хп) (/=1 г)
Ю»
J48 ГЛ. ili. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
— система г ненулевых многочленов из K[xt xn], то в поле К
существуют элементы си ....,сп, удовлетворяющие условиям
сп)ф0 (Ы г).
Достаточно рассмотреть лишь случай г=1, так как если поло-
положить г
Ф (*1 *п) =
то из неравенства
будет следовать, что
<P«(Ci 0=^0 ('=1 г).
Дли Одного многочлена ®(jfj хи) доказательство проведем
индукцией по я. Пусть «= 1, и пусть <в(хх) имеет степень т(т'^-О),
т. е.
Согласно § 4, существует такое расширение К* поля /С, над которым
многочлен ?(лгх) вполне приводим:
где ?!,..., \m — однозначным образом определенные элементы поля К*.
Поскольку же К с К* и поле К содержит бесконечно много элемен-
элементов, в К существует элемент си отличный от всех элементов ?t \m.
Для него
так как сх Ф lt и К* не содержит делителей нуля.
Предположим теперь, что теорема верна для многочленов от п— 1
неизвестных. Пусть
(х1 хп_х)
¦—ненулевой многочлен из K[xv ..., хп\. Можно считать, что и
%(,хи ..., хп_г) — ненулевой многочлен. Согласно предположению
индукции, мы можем найти в К элементы clt ..., cn_t так, чтобы
<?0(cv ..., cn_t) было отлично от нуля. Теперь остается лишь приме-
применить к многочлену <?(с1г ..., сп_и хп) доказательство, проведенное
выше для случая п = 1.
Следствие. Теорема заведомо справедлива для поля К без
характеристики. Действительно, в этом случае К содержит" поле рацио-
рациональных чисел и поэтому имеет бесконечно много элементов.
Теорема II. Если К есть алгебраически замкнутое поле без
характеристики, <э(х) — многочлен из К[х], для которого
§ 8. НЕСКОЛЬКО ПОЛЕЗНЫХ ТЕОРЕМ 149
а г — заданное натуральное число, то существует такой много-
многочлен f(x), что разность \f(x)\r — х делится на <?(*).
Ввиду алгебраической замкнутости поля К, мы можем записать
¦?(*) = «ЦОс-У*,
где Sj \k — различные элементы из К. Определим многочлены
gx (x) gk (X) с помощью равенств
• • •
где $'/г обозначает элемент поля К, удовлетворяющий соотношению
($УГ) *"=?<. В поле К такой элемент существует, поскольку это поле
алгебраически замкнуто. Прямой подсчет показывает, что \g{(x)]r—л:
делится на (л: — ?<)"*• Запишем многочлен <р(лг) в виде
<р (х) = (*-
где <р< (дг) уже не имеет х — lt своим множителем. В силу взаимной
простоты ?i(x) и (л: — 5<)8f, существуют такие многочлены а{(х)
и ?>j(at), что
gi (¦*) _ gt (x) at (х) чц (х) ¦ g{ (х) Ь{ (х) (х — ?<) ** _
<р(лг) ч(х) "г
Используя это тождество, получаем
(х) (
gt (х) щ (х)
Если мы запишем
& (дг) д< (лг) _ и г ч 1
где А{ (х) — многочлен степени, меньшей s(, то будем иметь
Следовательно,
(x) (x
а поскольку [?«(*IГ — х делится на [х — %дн, тем же свойством
обладает и [А{(х)^(х)]г — х. Рассмотрим теперь многочлен
150 ГЛ. III. АЛГЕБРАИЧЕСКАЯ ЗАВИСИМОСТЬ
Так как для всех }ф1 многочлен А}(х)Ч}(х) имеет (х— ^)8* своим
множителем и так как [Ai(x)yi(x)]r— х делится на (х— ^)8<,то на
(х — ?<)"' делится и [/(дг)Г — х. Это верно для всех значений i от 1
до k, и потому [f(x)]r — дг содержит в качестве множителя произ-
к
ведение JJ(jc — У*. Но а принадлежит К и отлично от нуля. Следо-
Следовательно, [/(jc)]1" — х делится на ?(лг). Теорема доказана.
Нужно отметить, что многочлен f(x) имеет меньшую степень чем
<?(х). Однако f(x) не определен требованиями теоремы однозначно.
Мы можем, например, положить
где ^ (х) — произвольный многочлен, a et гк — система из k эле-
элементов ПОЛЯ К, ДЛЯ КОТОрЫХ 8f=il.
ГЛАВА IV
АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
§ 1. Введение
В этой главе мы будем иметь дело с многочленами от нескольких
неизвестных с коэффициентами из некоторого поля, о котором мы
будем предполагать, что оно содержит бесконечно много элементов.
Пусть f(xx хп), g(xt хп), ... —многочлены из кольца
К[хи .... хп]. Система элементов (iv .... IJ произвольного расши-
расширения К* основного поля К называется решением системы уравнений
A)
g(xlt .... *п) = 0,
если
U-о,
Необходимо заметить, что символы х± хп, фигурирующие
в уравнениях A), играют совсем иную роль, чем раньше. В прежних
наших рассуждениях они изображали независимые трансцендентные
элементы над основным полем, так что, например, равенство
f(xv ..., хп) = 0
означало, что f(xlt .... хп) является нулевым многочленом. Теперь же
эта запись читается как уравнение. Строго говоря, нужно было бы
ввести новую символику и новое наименование для неизвестных.
Однако мы не станем этого делать и не только сохраним те же буквы
для их обозначения, но и будем попрежнему называть их неизвест-
неизвестными. При этом недоразумения не возникнут, если мы будем при-
придерживаться такого соглашения: отдельно стоящий символ f(xv ...
..., хп) обозначает многочлен от неизвестных х1з ..., х„ в старом
смысле. Запись же
/ (xlt .... хп) = О
означает уравнение, где хх хп — неизвестные в новом смысле.
Если же мы хотим выразить тот факт, что многочлен f(xt хп)
является нулевым, т. е. что f(xt, .... хп) тождественно равен нулю,
152 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
то мы будем писать
Главная цель этой главы — установить критерий для суще-
существования решения заданной системы уравнений. Мы будем часто обна-
обнаруживать решение системы сначала в поле К*, являющемся транс-
трансцендентным расширением основного поля К. Однако мы вскоре
увидим, что если система уравнений с коэффициентами из К вообще
обладает решением, то она имеет решение и в некотором алгебраи-
алгебраическом расширении поля К-
Нам придется часто встречаться с однородными уравнениями.
Уравнения системы A) называются однородными, если однородны все
многочлены f(xx, ..., хп), gix^ хп),..., входящие в эти урав-
уравнения. Многочлен f(xt л:п) называется однородным степени г,
если для произвольного неизвестного к
f(lxv .... Un) = }//(*i •*»)•
Все члены такого / (xt xn) имеют одну и ту же общую
степень г. Однородный многочлен часто называют также формой.
Если (?lf .... Sn) — решение системы однородных уравнений, то
и (\lt А?п) будет решением при произвольном А из любого рас-
расширения поля К. Система @, ..., 0) всегда служит решением одно-
однородной системы; это решение называется тривиальным и часто
опускается из рассмотрения. Два нетривиальных решения (^ ?п)
и (% т)„) целесообразно рассматривать как эквивалентные, если
существует такое [*, что
Каждое нетривиальное решение системы однородных уравнений мы
будем отождествлять со всеми эквивалентными ему решениями.
До сих пор мы ничего не говорили о числе уравнений данной
системы и даже не предполагали систему конечной или счетной.
Вопросом о числе уравнений системы мы будем заниматься в следую-
следующем параграфе. Теперь же мы отметим, что существуют два идеала
(§ 2, гл. I), связанных с данной системой уравнений. Рассмотрим
сначала неоднородный случай. Пусть h(xv ..., хп) и k(xt х„) —
два произвольных многочлена, обращаемых в нуль каждым решением
0i U системы A):
Тогда при любом многочлене a (xt хп) из К [xv ..., хп] урав-
уравнения
а(х%, ..., xn)h(x% хц) = 0
§ I. ВВЕДЕНИЕ 153
также удовлетворяются системой (^, .... ?п), ибо
Таким образом, многочлены Л(лгх хп), k(xlt ...,xn), ... обра-
образуют идеал.
Рассмотрим теперь случай, когда уравнения системы A) однородны.
Запишем многочлен из указанного идеала в виде
где Л^ (jCj, .. ., хп) при каждом i есть однородный многочлен сте-
степени г от xt xn. Ввиду предположенной однородности уравнений
системы A), уравнению h(xt хп) = 0 должна удовлетворять
наряду с каждым решением (^ ?п) системы A) также строка
(А^, .. ., А5Я). Это означает, что
Так как в качестве А может быть взят элемент, трансцендентный над
полем /C(?i 6„), то
Таким образом, каждый многочлен указанного выше идеала является
суммой однородных многочленов, также принадлежащих этому
идеалу.
Предположим теперь, что уравнения системы A) могут быть за-
записаны в форме
Л (*i хп) = О,
Рассмотрим многочлены
2<*i(*i. •••• xn)fi(xu •••. хп),
где множители at{xb ..., хп) принадлежат К [хх хп], а сум-
м ирование распространяется каждый раз лишь на конечное число зна-
значений /. Очевидно, что такие многочлены образуют идеал. Каждый
многочлен этого идеала обращается в нуль любым решением системы (J)
и потому принадлежит к первому из построенных нами идеалов.
В случае, когда система A) состоит из однородных уравнений, мы
имеем
+ +(*1 дг„),
где aji (Лф .... хп) — однородный многочлен степени j; следовательно,
i *п) = S 2 «л (*i, • • ¦, V/< (Jff, • • ¦, хп),
154 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
где каждый член внешней суммы является однородным многочленом
и принадлежит идеалу.
Два идеала, построенные нами для системы уравнений A), вообще
говоря, не совпадают, В качестве простого примера, иллюстрирующего
это утверждение, можно привести систему, состоящую из уравнения
Для этого уравнения многочлен xt принадлежит первому идеалу, в то
время как во втором идеале он не содержится.
§ 2. Теорема Гильберта о базисе
Теперь мы докажем, что при рассмотрении (однородных или не-
неоднородных) систем уравнений можно ограничиться изучением систем,
состоящих лишь из конечного числа уравнений. Сначала рассмотрим
общий случай, а затем специально остановимся на случае однородных
уравнений.
Теорема I. В каждом непустом идеале i кольца K[xv ....
..., хп] существует конечная система многочленов gi(xlt ..., хп)
(/=1, ..., г), такая, что любой многочлен F(xx хп) из I
может быть записан в форме
F(xv .... #nKs2 e<C*i, ¦ • •• xj gi{x1 хп),
где многочлены аг(х^, .... хп) принадлежат кольцу K[xi3 ..., хп\.
Про такую систему многочленов gt (xt хп) говорят, что она
образует базис идеала I. Очевидно, что если gt(xu ..., хп)
лежат в i, то при любом выборе а((х1 хп) из К[х± хп]
многочлен F(xt xn) также лежит в i.
Теорему докажем индукцией по я. При п — 0 утверждение три-
тривиально. В этом случае К[х1 хп] — К. Если i состоит из одного
нуля поля К, нечего доказывать. Если же 1 содержит ненулевой эле-
элемент а поля К, то он содержит и любой другой элемент |3 из К,
так как (J = (Ра"°) а. Для доказательства теоремы достаточно положить
здесь g± = a.
Предположим теперь, что утверждение теоремы доказано для
идеалов кольца K[xlt ..., хп_1]. Запишем элементы идеала i кольца
К[хи .... хп] в виде многочленов от хп с коэффициентами из
К[х1} ..., хп_г). Рассмотрим коэффициенты при старших степенях хп
в различных многочленах. Пусть
F(xi, ..., xn)^f1(x1 xn-i) xn-\-j2 (*! -"-n-i) xn -{-••••
Докажем, что многочлены fx(xt, .... xn_t) образуют идеал кольца
K[xv ..., хп_г]. Для этого наряду с F(xt xn) рассмотрим
любой другой многочлен из i
8 2. ТЕОРЕМА ГИЛЬБЕРТА О БАЗИСЕ 155
Пусть, например, а>>р. Тогда
F(x1 хп) — x*n*O(*i дс^зз
= l/i (*i, • • •. xn-i)—gi (*i, • • •. *«-i)l J&+ .. •
является многочленом из 1 со старшим коэффициентом
Д (Xj, ..., Jfn_j) — Si(xi> ••'> xn-v-
Аналогично, если с (jq xn-i) —- любой элемент из /С [JCj, .... xn_j],
то многочлен
a(xv .... ^-^C^ jcJsi
™e(*i *n-i)/i(*i *»_i)j?+...
принадлежит идеалу 1 и имеет старшим коэффициентом многочлен
a (-«i *»-i)/i (-^i Jfn-i)-
Отсюда, в соответствии с определением идеала, заключаем, что стар-
старшие коэффициенты многочленов из 1 вместе с нулем образуют идеал
кольца K[xv ..., .*„_!]. По предположению, в этом идеале j суще-
существует конечная система многочленов
?«(*! *n-l) (i=sl Г0>.
обладающая тем свойством, что каждый элемент из j может быть
записан в виде суммы
2 «i(xi *п-1)?<(*1. ••¦- ^«-l).
где многочлены ^(Xj xn-i) принадлежат К [xlt ..., xn_t].
Поскольку <pi(x1 xn-i) лежит в идеале j, в i существует такой
многочлен g{(xv ..., хп), который, если его рассматривать как
многочлен от хп, имеет '^(х^-, .. ., xn_t) своим старшим коэффициен-
коэффициентом. Отберем такие многочлены gf(xlt ..., хп) для всех значений
i=z 1 г0 и обозначим через Л^ степень многочлена gi(x± хп)
относительно хп. Пусть
Л^=тах(^1 NrJ.
Тогда, если
F(xv ..., xn)=f(xt Jcn_1)jc^+...
— произвольный многочлен степени a^-N из i, то можно записать
/(! «l) S i(l „
и поэтому
F(x% *„) —2 «i^i. •••» xn-i)xl~Ni gi(xv •••? xn)
156 гл- IV- АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
будет многочленом из i, имеющим степень, меньшую а. Повторив
этот прием не более а — N раз, мы получим -такие многочлены
*i(jc1,...) хп), что разность
S
будет многочленом из i со степенью, меньшей N.
Рассмотрим поэтому те многочлены из идеала i, которые имеют
относительно хп степень, меньшую N, Покажем, что коэффициенты
при х^-1 в этих многочленах образуют идеал j\ кольца K[xlt .. .
.... хп_г]. Пусть
Тогда 'многочлены
.... xn) — k(x1 *„) =
s [Aj (xv ..., *„_!) — ^(JCj Jfrt-i)!*»^-.-.
принадлежат идеалу i и имеют степени, меньшие Л^. Старшими коэф-
коэффициентами этих многочленов служат
^1 \Х1> • • • > •"'n-l) ~~ ™1 (.•*-!> • • ¦ > -"-n-i)
где a(xv..., xn_t) — некоторый многочлен из K[xlt . . ., x,f_j].
Таким образом, старшие коэффициенты образуют идеал JJt обладаю-
обладающий, согласно предположению индукции, базисом
Пусть многочлены степени N—1, в которых коэффициентами при
я*-1 служат эти <frll+i(x1 *»_i), будут
gr.+i^ Xn)=<fr0+i(Xlt .... Хп^Хп'1-^ ....
Тогда каждый элемент из идеала I, имеющий степень N— 1 отно-
относительно хп, может быть представлен в форме
§ 2. ТЁдРЕМА ГИЛЬБЕРТА 6 БАЗИСЕ
и потому разность
г,-г0
h{xi хп)— 2 «»•„+<(*! xn_1)gr0+i(x1 дгя)
является многочленом из i, степень которого не выше N—2. Повто-
Повторяя этот процесс самое большее N—2 раз, мы получим конечное
число многочленов ^(JCj хп) (/=1, ..., s) из идеала i, обла-
обладающих тем свойством, что при соответствующем выборе многочле-
многочленов ai(xv ..., хп) из кольца К[хи..., хп\ многочлен
&
F(*i хп) — ]S ai(x1 xn)gi(xl хп)
будет иметь нулевую степень относительно хп. Применяя вновь пред-
предположение индукции, мы получим окончательно, что
г
F(.Xj *») = 2«i(*i xH)gi(xl хп). •
Этим теорема Гильберта о базисе доказана.
Пусть теперь нам задана счетная система уравнений
/*(*! *„) = 0 (/=.1, 2,...). A)
Мы видели, что многочлены
S «j (*i Xn)ff (.JCj Хп),
где суммирование распространяется каждый раз лишь на конечное
число значений j, образуют идеал i. Этот идеал обладает конечным
базисом. Пусть базис состоит из многочленов
i хп) {k=\ г).
Поскольку каждый из этих многочленов лежит в i,
gk(xt, .... хп)=з 2 akj(Xi, .... xn)fj(x1
где суммирование производится по конечной системе значений /. Сле-
Следовательно, существует такое s, что
8
2(k=\ Г).
С другой стороны, произвольный многочлен системы A), скажем
/*(*!,..., хп), может быть выражен через gk(x1 xn). Поэтому
¦г
Jt\xl> • • • > лп) — Zj uik \Х1* • • • t хп) &к \Л1> • • • > хп) =^
в
^= ?j Cfj \X\ i • • •! Xn)fj(Xi, . . ., Jtj)J> (^)
J58 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ ^^
где
г
Ctj(Xlt .... ^Э^ ЬШ(ХХ *n)flft,(*i Хп).
k=l
Соотношение B) показывает, что мы можем в системе A) ограни*
читься рассмотрением только первых $ уравнений; многочлены
fj(x1, ..., хп) принадлежат идеалу, порожденному первыми 5 много-
многочленами, и обращаются в нуль любым решением первых s уравнений.
Проведенные рассуждения справедливы как для однородной, J так
и для неоднородной системы A).
Аналогичное применение теорема о базисе находит при использо-
использовании идеала, образованного многочленами, обращающимися в нуль
каждым решением заданной системы уравнений. Пусть
?,(*„ .... хп) (/=1, ..., г)
есть базис этого идеала. Тогда уравнения
gj{x, *«) = 0 (У=1 г) C)
удовлетворяются всеми решениями заданной системы уравнений. Если
— любое из уравнений заданной системы, то многочлен f(xt, . .., хп)
принадлежит рассматриваемому идеалу, и потому
г
f(xit ..., хп)гз 2 e*(*i, • • •. Xjgitei . *„)•
Следовательно, каждое решение системы C) является решением и
исходной системы уравнений. Системы решений тем самым совпа-
совпадают, и мы можем поэтому заданную систему уравнений заменить
конечной системой C).
Если заданная система уравнений однородна, мы можем заменить
ее конечной системой из однородных же уравнений. Действительно,
мы видели в § 1, что если
Хп) » gOj (*1> • • •' Хп) + • • • + gnjj (XV..., Хп),
рДе gij(xv • • •' хп) — однородные многочлены степени /, то эти
однородные многочлены (или формы) gij(xv.:., xn) принадлежат
рассматриваемому идеалу. Следовательно, систему однородных урав-
уравнений можно заменить конечной системой из однородных же урав-
уравнений
.... #п) = 0 (/=1,..., nf, У=1 г).
______ S 3. РЕЗУЛЬТАНТ ДВУХ БИНАРНЫХ ФОРМ i59
§ 3. Результант двух бинарных форм
Доказанное в предыдущем параграфе дает возможность при изуче-
изучении систем алгебраических уравнений ограничиться рассмотрением
конечных систем. Теперь мы приступаем к разысканию условий, при
которых система алгебраических уравнений имеет решение.
В то время как обычно мы рассматриваем уравнения с коэффи-
коэффициентами из заданного основного поля К, теперь существенной частью
нашего метода исследования будет рассмотрение многочленов, коэф-
коэффициенты которых принадлежат некоторому (возможно, трансцендент-
трансцендентному) расширению К' поля К. Если а, C, ..., 8— коэффициенты
уравнений системы, то элементы расширения К', получаемые из а,
?,..., 8 и из элементов поля К с помощью операций сложения и
умножения, образуют некоторую область целостности, являющуюся
подкольцом расширения К'.
5то подкольцо мы будем называть кольцом коэффициентов, а
его поле частных — полем коэффициентов уравнений системы.
Предельным случаем будет такой, когда все коэффициенты
являются независимыми неизвестными над полем К. Кольцом коэф*
фициентов тогда служит К [а, |3, ..., 8], а полем коэффициентов —
AT (а, р, ..., 8), т. е. поле рациональных функций от этих неизвест-
неизвестных. В этом случае система уравнений называется системой с не'
определенными коэффициентами.
Понятие специализации многочленов • было введено в § 5 гл. I.
Пусть
/«(*! *п) = 0 (/=1 s) A)
*
*- система уравнений с неопределенными коэффициентами. Мы по-
построим систему многочленов от коэффициентов (т. е. систему эле-
элементов кольца коэффициентов), обладающую следующим свойством:
система уравнений
А(хх *й) = 0 (j=,l s), B)
полученных из уравнений A) специализацией
имеет решение тогда и только тогда, когда многочлены указанной
системы при этой специализации обращаются в нуль.
В качестве первого шага в этом направлении (хорошо иллюстри-
иллюстрирующего и сам наш метод) мы рассмотрим случай двух однородных
уравнений с двумя неизвестными
/(*„, *!> = (), g(XQ, Xt) = 0.
Для случая одного неоднородного уравнения с одним неизвестным
i 60 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
мы уже показали (гл. III, § 4), что существует такое алгебраиче-
алгебраическое расширение поля коэффициентов, в котором многочлен f(x)
вполне приводим, так что
/(*) =н а (х — ах) ... (х — ocj.
Если К* — некоторое другое расширение поля коэффициентов, в ко-
котором многочлен f(x) также вполне приводим, и если
то, как мы знаем, поля К$1У'..., Ет) и /("(otj ctm) являются
эквивалентными расширениями поля К, причем можно считать мно-
множители перенумерованными так, что элементы Е{ и а( соответствуют
друг другу. Для наших целей нет необходимости различать между
собой ki и at. Таким образом, мы можем считать, -что решениями
уравнения f(x) = 0 являются только at ат.
Если f(x0, Xj) — форма, т. е. однородный многочлен степени т,
то в некотором алгебраическом расширении поля коэффициентов
/(дг0, х,) =з а (р^ — а^) ... фтхг — amxQ).
Единственными же решениями уравнения f(xQ, xt) = 0 (в том смысле,
в каком это вообще можно говорить для однородного случая)
являются
(?!, «!> (?«,. «J-
Пусть мы имеем пару форм от двух неизвестных х0, х1 (такие
формы называют бинарными) с неопределенными коэффициентами
над К:
Тогда
f(x0, xt) а а^Т + aixT'% + ... -J- атхУ, ) C)
g (xQ, xj зв Ьох? + ^jc? * + + *** J
"Г • • • "Г "пх1 х0 = Xl S \хо> Xlh
§ 3. РЕЗУЛЬТАНТ ДВУХ БИНАРНЫХ ФОРМ
161
Обозначим через R определитель квадратной матрицы
п строк
т строк
D)
h К ьп\
Если выписанные выше т -\-п равенств умножить на алгебраические
дополнения соответственных элементов некоторого столбца матрицы D)
и затем сложить, то получится тождество
где Ara (jc0, Xj) и Br8 (x0, xt) — формы соответственно степеней п — 1
и да — 1с коэффициентами из кольца К[а0, ..., am,bQ bn\. Таких
тождеств получится по одному для каждой пары неотрицательных
чисел г, s, удовлетворяющих условию r-\-s = m -\- п — 1. В част-
частности,
RxT?n~l^A(xQ, xt)f(x0, x^ + S^o, xJg&Q, xj; F)
здесь r = 0,s = m-\-n — 1..
Рассмотрим теперь некоторую специализацию форм C) в К' [х0, jcJ,
где К' — произвольное расширение поля К. Если при этой специа-
специализации определитель R не обращается в нуль, то система из спе-
специализированных уравнений
не имеет нетривиальных решений. В самом деле, допустим, что
система обладает решением (с0, ct), где, скажем, со=?О. Тогда
равенство F) дает
что противоречит предположению.
Рассмотрим теперь случай, такой специализации форм C), при
которой определитель R обращается в нуль. Тогда строки матрицы D),
рассматриваемые как векторы, линейно зависимы. Это означает, что
мы можем найти в К' элементы
не равные нулю одновременно и такие, что
1М»-1 — c0V0 — СЛ — • • • — «m-!««-! = 0.
И Зак. 1230. В. Ходж и Д. Пндо
162 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
где через и0, ..., un_v v0, . .., vm_t обозначены строки матрицы D).
Следовательно, мы получаем систему равенств
G)
^-1«« —Ст-А =0. j
Если ввести обозначения
d(X0, X^^Vr'+'-
то равенства G) дадут соотношение
<*(*0> Xl)f(X0' *l) = C(*0. Xl)g(XQ, Xi)>- (8)
так как равенства G) выражают просто совпадение коэффициентов
при лг**+и~1 х™'гП-'1 в обеих частях этого соотношения.
Разложим' обе части тождества (8) на неприводимые в К' [xQ, xt\
множители. По теореме о единственности разложения (гл. I, § 7),
каждый неприводимый множитель одной стороны должен встречаться
в разложении и другой стороны. Поскольку степень многочлена
d(x0, xt) не превосходит п — 1, по крайней мере один из множи-
множителей многочлена g(x0, xt) должен являться множителем и много-
многочлена f(x0, xt). Следовательно, при R — 0 формы f(x0, xj и g(x0, xt)
имеют общий множитель положительной степени. Каждое решение
уравнения, полученного путем приравнивания этого множителя нулю,
является решением и нашей системы уравнений
f(x0, *!) = (>,
Указанный общий множитель можно найти в К' [х0, xt] посредством
алгоритма Эвклида. Решение же рассматриваемых двух уравнений
лежит в некотором алгебраическом расширении поля К'.
Условимся называть определитель R результантом рассматривае-
рассматриваемых бинарных форм (или уравнений). Нами доказана следующая
Теорема I. Необходимыми достаточным условием существо-
существования решения двух однородных уравнений с коэффициентами из
поля К' является равенство нулю их результанта. Это решение,
если оно существует, лежит в некотором алгебраическом рас-
расширении поля К'.
Этой теоремой можно воспользоваться для получения соответ-
соответствующей теоремы для двух любых многочленов из К'\х\. Пусть
§ 3. РЕЗУЛЬТАНТ ДВУХ БИНАРНЫХ ФОРМ 163
Превратим эти многочлены в однородные введением нового неизвест-
неизвестного у; мы получим формы
g(x, J) = V"+ • •
Пусть R— результант этих двух форм. При Р1фО система уравнений
/(*) = 0. *(*)=»<> (9)
не может иметь решений. Действительно, из существования у нее
решения х = с следовало бы, что система однородных уравнений
f(x, y) = 0, g(x, y) = 0
имеет решение (с, 1).
При R = 0 система однородных уравнений обладает решением.
Пусть им будет (с, d). Если AфО, то это решение эквивалентно
решению (cd-1, 1), и тогда х = сй~1 будет решением системы (9).
Это рассуждение не проходит при d = 0. Прямая же подстановка
d==0 в формы f(x, у) и g(x, у) показывает, что в этом случае
а0 = 0 и Ьо = 0. Записывая R в виде определителя, мы видим, что
и наоборот, при а0 = Ьо = 0 результант R равен нулю. Итак, имеет
место
Теорема II. Необходимым условием существования общего
решения двух неоднородных уравнений (9) является равенство
R = 0. Это условие будет и достаточным, если дополнительно
предположить, что старший коэффициент хотя бы одного из
уравнений отличен от нуля.
Из соотношения F) видно, что результант двух многочленов f(x)
и g(x) всегда можно представить в следующей форме:
A0)
где А(х) и В(х) — многочлены от л с коэффициентами из кольца
коэффициентов многочленов f(x) и g(x).
В заключение настоящего параграфа укажем, как аналогичными
методами получить условия, при которых две бинарные формы f(x0, xt)
и g(x0, хх) [см. C)] имеют общий множитель степени не ниже t.
Пусть такой общий множитель существует, т. е.
f(x0, xt)mf^x0, xt)d(x0, xt)
и
g(x0, x1)ss
где
/,(*„, Xl)
и
Si (xo. XJ = V?-' + • • • + cn_t**-*.
Из тождества
Si(xo> xi)f(xo> xi)=A(xo> xi)e(xo> XJ
11*
164
ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
следуют соотношения
=0.
A1)
Поэтому между строками (т-\~п — 2t-f- 2)У^(т -f- n —1-\- 1)-матрицы
In a* п . ...0\
О й0 ал ...... ст ... О \
A2)
существует линейная зависимость. Это означает, что ее ранг не пре-
превосходит т-\-п — 2^-f-l. Наоборот, если ранг этой матрицы меньше
т-\-п—2/-|-2, то ее строки линейно зависимы, и поэтому в поле
коэффициентов можно найти элементы dQ, ..., dm_t, cQ, ..., cn_t,
не равные нулю одновременно и такие, что имеют место соотноше-
соотношения A1). Следовательно, для f^{xu, xt) и ^(Хц, xt), обозначающих
те же формы, что и выше, имеем
o> xi)f(xo> xi)=fi(xo- xi)S(xo> xi)>
откуда на основании теоремы о единственности разложения много-
многочленов выводим, что f(xQ, JCj) и g(x0, xt) имеют общий множитель
степени не ниже t. Итак, справедлива
Теорема Ш. Необходимым и достаточным условием наличия
у форм f(x0, xt) и g(xQ, Xj) общего множителя степени не
ниже I является равенство нулю всех миноров порядка т-\-п —
— 2t-{-2 матрицы A2).
§ 4. Некоторые свойства результанта
Пусть av .... <х
К
— две системы неизвестных над
основным полем К, а си ..., ст, dlt .... dn — элементарные сим-
симметрические функции этих двух систем:
n-lPn,
§ 4. НЕКОТОРЫЕ СВОЙСТВА РЕЗУЛЬТАНТА 165
Пусть а0, Ьо — два новых неизвестных. Положим
at = (—\)iaoci (t=l /re),
bt = {-\)<bbdt (/=1 и).
Если мы введем
-f- аххт- '+...-)-«,„
то будем иметь
f{x) == а0 (х" — Clx~-г + eg**-" + • • • + (~ l)m О
и
Обозначим через R результант многочленов f(x) и g(x). R является
элементом кольца К\а0, ..., ат, Ьо, ..., Ьп]. Зафиксируем это
записью
R = R(a0 ат, Ьо, .... Ьп).
Из представления результанта в виде определителя следует, что
результант является однородным многочленом степени и относительно
а0, ,.., ат и однородным же многочленом степени т относительно
Ьо, ..., Ьп. Действительно, каждый член результанта содержит один
элемент из каждой строки и один элемент из каждого столбца опре-
определителя. Главная диагональ определителя дает произведение а%Ь™
в качестве одного из членов результанта R. В силу сделанных выше
замечаний,
Я («о ат, h bn) =
= вЭД»«A, -с, ±см, 1, -dv,.., ±dn).
Но /?A, —с1 ±сп, 1,—dlt .... ±dn) — элемент кольца
K[<xt, • • •, ««,, Pi, • • •, Р»1
и может рассматриваться как многочлен от а4 с коэффициентами
из ATfo-j, .... at_lt a{+1, .... ат, $t р„]. Этот многочлен обра-
обращается в нуль при каждой из специализаций
так как f(x) и g(x) при этом приобретают общий множитель. Отсюда
и из того, что все $v ..., f)n попарно различны, следует, что рас-
рассматриваемый многочлен от <х( содержит множитель
166 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
Проведенные рассуждения справедливы для каждого значения I,
и потому
ЯA, — си ..., ±ст, 1, — dt ±dn),
рассматриваемый как многочлен из кольца K[at ат, р1( . . ., $п\,
содержит множителем произведение
л R(а0, ..., ат, b0, .... bH) — произведение
то п
Но
следовательно,
откуда
Подобным же
т
4=1
с
о
образом
т
т
' ^ 1 1
п
?Т
.. «
_, /.
п
B)
C)
так как
i = 1 ¦ i = 1
Выражение B) может быть прочитано как однородный многочлен сте-
степени т от коэффициентов Ьо, ..., ?„ многочлена g(x). Коэффициент
каждого члена этого однородного многочлена представляет собой
произведение а™ на некоторую симметрическую функцию от alt .. ., <хж.
Поэтому (гл. III, § 4, теорема V) произведение 5 является формой
степени т относительно д0, . .., Ьп с коэффициентами, представляю-
представляющими собой многочлены от о0, с}, .... ст. Из равенства же C) мы
заключаем, что 5 можно также рассматривать как форму степени п
относительно а0 ат с коэффициентами, являющимися многочле-
многочленами от b0, dlt ..., dn. Сопоставляя оба эти результата, мы видим,
что 5 — элемент кольца К[а0, ..., ат, Ьо Ьп\, представляющий
собой однородный многочлен степени п относительно а0, . . ., ат и
однородный же многочлен степени т относительно Ьо Ьп. Из соот-
соотношения B) также следует, что одним из членов формы 5 является а»?™.
§ 4. НЕКОТОРЫЕ СВОЙСТВА РЕЗУЛЬТАНТА 167
Мы уже заметили ранее, что результант
— аост>
рассматриваемый как многочлен от а0, b0, а.и ..., ат, |3j, .... р„,
содержит S в качестве множителя. Таким образом,
R (ао> — аоси • • •. — аост, К, — *odlt ..., ± *orfre) = ST,
где Г—некоторый многочлен от а0, ?0, а1( .... <*,„, р1( ..., (Jn,
который должен быть симметрическим относительно а1; ..., ато и
S, $п. Следовательно, Т можно выразить в виде многочлена
от а0, b0, ct cm, dt dn. Сравнивая степени левой и правой
частей и учитывая (гл.. III, § 4, теорема VIII), что д0, b0, cv ..., cm,
dx, ..., dn алгебраически независимы над полем К, мы убеждаемся,
что Т лежит в К. Следовательно, выражая 5 в виде многочлена от
я0, ..., ат, Ьо, ..., Ьп, мы получаем соотношение
R(а0, а1г .... ат, д0, .... bn) = S-T
между at и bj, которое должно быть тождеством. Из совпадения
коэффициентов при а%Ь™ в обеих частях этого равенства следует,
что 7= 1. Итак,
т п
R = dS
Ш «.) == (-' I)"" bt T\f(h) = «Ц U(«i - У- D)
— 1 J— \ % — 1J — 1
Рассмотрим теперь произвольную специализацию
коэффициентов многочленов f(x) и g(x). Пусть корнями специали-
специализированных многочленов будут соответственно I, 6ТО и; %» ..., ¦»)„.
Тогда ввиду того, что специализация
ао -* ^о- ьо
связана со специализацией
а
мы получаем соотношение
Покажем, далее, что результант R изобарен относительно of и bj и
что его вес /?а?е« тп. Это означает, что для произвольного члена
са^а\' . .. a*mbl° ... bf» результанта
R(aQ, ..., а(И, bQ, .... *п) ;
168 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
имеет место равенство
т п
2 Г1Г -\- 2 sJa == тп-
О О
Для доказательства этого утверждения рассмотрим для R представле-
представление D). Подставляя в него a< = Xotf, ?j = Х^-, где X — неизвестное,
мы получим
/^ =s Qq ^?0 JlJlv^i rj) ==~ ^0 ^о Ц. Л I. \&4 — rj)»
ГЩ^Й> ПД
т. е.
где # — результант многочленов
Но эти многочлены можно переписать в форме
J(x) = аох
~g(x) == b^x
так что
R = R(a0, Xa, ктат, b0, Щ \nbn) =
Этим наше утверждение доказано.
В дальнейших приложениях нам придется рассматривать случай,
когда коэффициенты ait bj являются формами из области целост-
целостности K[tv ..., Е„], полученной путем присоединения неизвестных
Ej Es к основному полю К- Предположим, что степень af равна h -\- i,
где h — некоторая константа, и что степень bj равна k -\- j, где k — также
константа. Так как R является однородным многочленом (степени п)
относительно а{ и однородным многочленом (степени т) относи-
относительно bj, то степень члена
результанта R равна
t=0 f=0
= hn-\-km-\- mn,
так как /? изобарен и имеет вес тп. Следовательно, R является
степени nh-j-mkrj-mn из !<\\, ..., 6в|,
§ 5. РЕЗУЛЬТАНТ СИСТЕМЫ БИНАРНЫХ ФОРМ 169
§ 5. Результант системы бинарных форм
Рассмотрим систему из г однородных уравнений
Предположим сначала, что коэффициенты уравнений этой системы
являются независимыми неизвестными над полем К. Пусть /{(х0, лг,) —
многочлен степени mt и т = max [ти .... тг]. Введем обозначения
Р=1 г),
где а{ и bt — новые неизвестные. Рассмотрим вспомогательную систему
уравнений
«<(*0, ж,) = 0 (/=1 2г). B)
Ясно, что если при некоторой специализации коэффициентов в каком-
либо расширении К' поля К система A) имеет нетривиальное реше-
решение, то обладает решением и система B). Наоборот, если система B)
имеет нетривиальное решение (с, d), так что
то, поскольку at и bit а также хотя бы один из элементов с, d
отличны от нуля, имеют место равенства
ft (с, d) — 0 (i=l г),
т. е. и система A) обладает нетривиальным решением. Таким обра-
образом, для нахождения условий, при которых система A) обладает реше-
решением при некоторой специализации коэффициентов в К', достаточно
найти соответствующие условия для системы B) при той же специа-
специализации. Это мы осуществим путем объединения уравнений системы B)
в два уравнения.
Введем \г новых неизвестных и, u.2r, vt vSr и рас-
рассмотрим многочлены
Результант R(u, v) этой пары бинарных форм Ф(х0, х}) и W(x0, хг)
является многочленом от аи ...,u2r, vu .... vSr. Коэффициент при
*!¦•• u&vi •-¦vir
имеет вид
170 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
где ds — многочлен от коэффициентов исходных форм /< (х0, хг). Эти
многочлены d^, . .., dN образуют систему результантов системы
однородных уравнений A).
Если при некоторой специализации коэффициентов система A)
обладает решением, то решением обладает и система B),. а потому
и пара уравнений
Ф(*о, *,)=»<), W(x0, *,)='0.
Тогда R (a, v) = 0. Но это означает, что обращаются в нуль все
коэффициенты Ds. Так как at и bj — неизвестные, то отсюда сле-
следует, что
<*! = 0 dN = 0.
Обратно, если все ds равны нулю, то формы
Ф(*о, *,) и W(x0, jfj)
имеют общий делитель, который может быть найден алгоритмом деле-
деления (гл. I, § 6) и потому является элементом кольца
K'(ait bjt u8, vt)[x0, xt].
Можно считать, что этот общий делитель лежит в К' [ait bj, us, vt] [x0, xj
и не делится ни на какой элемент кольца К'[ait bj, a8, vt]. Далее,
Ф(лг0, Xj) не содержит v1 vir, a W (x0, xj не содержит
ии ..., и^.. Следовательно, любой общий делитель многочленов Ф (х0, xt)
и ЧР" (лг0, Xj) не зависит от ait Vj и потому должен быть общим дели-
делителем форм
<?i(*o. *i) (/=1 2r)-
Поэтому система уравнений B), а вместе с ней и система A), обла-
обладает решением.
На основании соотношения E) § 3 мы имеем
R (и, v) xlx\ =а аГ8 (х0, ху) Ф (х0, агд) -f br8 (х0, хЛ) W (x0, xj, C)
где г -j- s = 2т — 1, a ors (x0, xt) и brs (x0, хх) — формы относи-
относительно x0, jfj, коэффициенты которых являются многочленами от коэф-
коэффициентов Ф(х0, хг) и W (х0, х±). Вспоминая, что Ф(х0, х^ и W (х0, х%)
являются линейными комбинациями форм о4 (л:0, х^, и используя запись
этих последних через исходные формы fi(x0, Xj), мы получим, при-
приравнивая члены с одинаковыми степенями при uit Vj, as, bt в обеих
частях равенства C), что
Как и в случае двух форм, мы можем из доказанного получить
следствия для системы из г уравнений с одним неизвестным. Для этого
мы, как и выше, превращаем уравнения в однородные и образуем
§ 5. РЕЗУЛЬТАНТ СИСТЕМЫ БИНАРНЫХ ФОРМ 171
систему результантов. Затем мы показываем, что если при специали-
специализированных коэффициентах заданная система обладает решением, то
члены системы результантов обращаются в нуль; если же все члены
системы результантов равны нулю, то либо исходные уравнения имеют
общее решение, либо равны нулю старшие коэффициенты всех урав-
ненийТ Таким образом получается следующая
Теорема. Для произвольной системы из г многочленов fi(x),
f.>(x) fr(x) c одним неизвестным и неопределенными коэффи-
коэффициентами существует система многочленов dx dN от коэф'
фициентов исходной системы, обладающая тем свойством, что
при любой специализации этих коэффициентов условия d1 = 0, ...
..., dN = 0 являются необходимыми и достаточными для того,
чтобы либо система уравнений /t (х) = 0, .... fr (x) — 0 имела
решение в соответствующем расширении основного поля, либо стар-
старшие коэффициенты многочленов f1(x), ..., fr(x) были равны нулю.
При этом, если система имеет решение, то она обладает реше-
решением в некотором алгебраическом расширении поля коэффициентов.
Из соотношений D) можно получить выражения для dv .... dN.
Действительно, полагая s — О, мы находим, что
Наконец, распространим на случай произвольного числа форм ре-
результат, доказанный в конце § 4 для двух форм/(л:о, xt), g(x0, xt),
коэффициенты которых сами являются формами из K[Zlt ¦ ¦ •, У- Рас-
Рассмотрим г форм
и предположим, что коэффициент при Xixi в fit(x0, xt) является фор-
формой степени hk-\-j из К[\ U-
Пусть А = тах[А1, ..., hr]. В качестве подготовительного шага
к определению системы результантов для многочленов ff(x0, xt) вве-
введем в рассмотрение формы аь Ьх относительно \ \s с неопреде-
неопределенными коэффициентами, имеющие степени соответственно h — ht-\-
-j- m — ntf и h — hit и с их помощью построим формы
{
94- (дг0, xj =ва{х7 {ft (х0, х,),
Коэффициент при хг kx:, в <?ft (x0, xj является формой степени h+j
относительно Ц Sd. Следовательно, мы можем применить к
172 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
формам
Ф (х у Л =
2Г
, xt)
1
результат § А. Поэтому коэффициент при щ} ... u2?rVi .. . v-if
в R(a, v), имеющий вид
является формой степени 2/n«-f-/»2 относительно 11, .... %8. Наконец,
из того, что а{, bj — формы относительно ?1( ..., ?gI следует, что и
dt являются формами относительно Et 18.
§ 6. Система результантов для системы однородных
уравнений с несколькими неизвестными
Приступая к изучению системы из г однородных уравнений с я-f-1
неизвестным
Ji \хо' •' • > хп> — и \1 — ' > • • • > ' Л У1)
мы вновь начнем со случая, когда все коэффициенты являются незави-
независимыми неизвестными. Введем два новых неизвестных ?0, $г и положим
х( = %x'i (i — 0, .... я — 1),
Тогда мы получим из системы A) систему однородных относительно
'о- ^i уравнений
( = 1 г). B)
Коэффициент при Ц^ многочлена fi(lox'o, .... $0J5,'8_i, lx) является
формой степени j относительно х0, ..., хп_\. Если мы теперь по-
построим систему результантов уравнений B), используя доказанное в пре-
предыдущем параграфе, то получим систему форм di(xn, ..., xre_i)
(/=1 N), относительного, •••. -^и-ь с коэффициентами, при-
принадлежащими кольцу коэффициентов системы уравнений A). Эта си-
система форм обладает следующими свойствами.
(I) й?Р<==2
}
для некоторых целых р;. Здесь а^^, Ьх) — формы относительно !¦„,
\х с коэффициентами из кольца, содержащего Хо, .,., х«_ь К и
§ Ь. йийтеМа РЁЗУльтАлтбв 173
коэффициенты уравнений A).
(И) если при специализации (х0, ..., х„-{)-*-(х0 xn-i)
di(x0 ~хя_1) = 0 (/=1 ДО,
то система специализированных уравнений B) имеет решение, и на-
наоборот. Этот результат остается справедливым для любой специализации
коэффициентов системы уравнений A), если при этом коэффициенты
форм dt(x0 *re-i) специализируются соответствующим образом.
Далее, если система уравнении B) имеет при специализации
(*о *»-0 ->• (л:0 *„_.,) решение (с, d), то (сх0, .... схп_г, d)
будет, очевидно, решением системы уравнений A). Наоборот, пред-
предположим, что система A) обладает решением (х0, ..., хп). Если среди
jc0, ..., xn_t имеется отличный от нуля элемент, то система уравне-
уравнений B) имеет при специализации (х'о, .... х'п_{)-*¦ (х0, ..., хп_г)
решение A, хп). Если же хо= ... =гхп_г = 0, хп Ф 0, то система
уравнений B) имеет решение @, хп) при произвольной специализации
х0) •••, -fn-i- Следовательно, в этом случае
d^xi .... лг^_О = 0 (i=f, ..., N).
Мы видим, таким образом, что необходимым и достаточным условием
существования решения системы A) является наличие решения системы
уравнений
<*<(*о *«_i) = 0 (i=l, .... N).
Так как эти уравнения однородны и xt = 50лгг-, то это условие совпа-
совпадает, с условием существования решения системы уравнений
di(x0 *„_!> = 0 (/=! Л0. C)
Мы видим, что если система C) имеет решение, алгебраическое над
полем коэффициентов, то таким решением обладает и система A).
В качестве последнего вспомогательного шага, подводящего нас
к теореме I, рассмотрим обратное преобразование, связывающее xt с Xi,
x't^xfr1 (i = 0 я—1),
к = *п.
и применим его к тождеству
з
Оно превратится при этом в
Xn)
dfxt'1 v- *-У' — V
174 Рл. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
где Ьц(х0, .... хп)— форма относительно х0, ..., хп, коэффициен-
коэффициентами которой служат многочлены от ^. Умножая обе части на соответ-
соответствующую степень элемента ?0, мы получим тождество
di(x0 *ra-i)C = 2CyM*o. •••> xn)fj{x0 хп);
приравнивая в нем члены с одинаковыми степенями ?0, приходим, на-
наконец, к тождеству
rf«(x0, .... xn_t)= S^i(*o xn)fj(xo< ••¦' xn)- D)
Теперь мы можем доказать следующую теорему:
Теорема I. Пусть дана система
fdx0, •••> *п) = 0 (/=1,...., г) A)
однородных уравнений с неопределенными коэффициентами, и пусть
7 ••¦, *«) = ° (»=1 г) E)
— система уравнений, получающаяся из A) при некоторой задан-
заданной специализации коэффициентов. Тогда существует конечная
система многочленов du ..., dk от коэффициентов уравнений
системы A), обладающая следующими свойствами:
(I) для некоторого значения т
г
A(х0 = 2j а^(х0, .... xn)fj(x0, ..., хп),
где коэффициенты многочленов а^(х0, ..., хп) принадлежат кольцу
коэффициентов системы уравнений A);
(II) необходимое и достаточное условие существования решения
системы E) в каком-нибудь алгебраическом расширении поля ко-
коэффициентов заключается в том, что при рассматриваемой спе-
специализации многочлены dt обращаются в нуль.
Для случая п = 1 эта теорема доказана в § 5. Далее мы поведем
доказательство по индукции. Исходя из системы уравнений A),
построим систему форм di{x0, ..., xn_t), для которых выполняются
соотношения D) и которые обладают тем свойством, что система C)
имеет решение в том и только в том случае, если решением обла-
обладает система A). Это свойство остается в силе при любой специали-
специализации коэффициентов.
Рассмотрим теперь систему из N однородных уравнений
D<(*o *n-i) = 0 (/-= 1 Л0 F)
с неопределенными коэффициентами, в которой каждый из многочле-
многочленов Dt(x0, ..., хп_д имеет ту же степень, что и йг(хй хп-д-
§ 7, НЕОДНОРОДНЫЕ УРАВНЕНИЯ 175
Применяя предположение индукции к системе уравнений F), мы
можем построить такие многочлены ?<(/ = 1 k) от коэффициен-
коэффициентов уравнений системы F), что
?«*Г = 2Му(*о *n-i)ty(*o *«-i) C'=l k) ¦
и что произвольная специализация системы F) обладает решением
в том и только в том случае, если при соответствующей специали-
специализации многочлены Ei обращаются в нуль.
Мы можем провести специализацию коэффициентов уравнений
системы F) в два приема. Сначала специализируем их так, чтобы
формы Df (х0,... ,лгге_1) превратились в dt (л:0,... ,xn_t), а затем осуще-
осуществим ту специализацию коэффициентов многочленов di{xu xn-i)>
которая приводит от системы A) к системе E). Первая специализа-
специализация индуцирует некоторую специализацию
Et-+dt (i=l ft)»)
для Ег. В силу равенства D),
= 2 %(х *
ац cfkfk (xc xn); G)
здесь 2 aijcjk — форма от х0, .. .,xn с коэффициентами из кольца
коэффициентов уравнений системы A).
При проведении дальнейшей специализации, приводящей от си-
системы A) к системе E), мы получаем и новую специализацию для d(.
Обращение di в нуль является необходимым и достаточным условием
существования решения у специализированных уравнений C) в неко-
некотором алгебраическом расширении поля коэффициентов [т. е. в неко-
некотором алгебраическом расширении поля коэффициентов уравнений
системы E)]. Последнее, в свою очередь, необходимо и достаточно
для существования решения системы E) в некотором алгебраическом
расширении поля коэффициентов. Тем самым теорема доказана.
Кроме того, из предположения, что система E) имеет какое-нибудь
решение, ввиду равенства G) вытекает, что все rf4 равны нулю и,
следовательно, что система уравнений E) имеет решение в некотором
алгебраическом расширении поля коэффициентов уравнений этой си-
системы.
§ 7. Неоднородные уравнения с несколькими неизвестными
Теперь с помощью метода, подобного использованному в § 6, мы
решим вопрос об условиях существования решения системы неодно-
неоднородных уравнений
ffi(*i. ¦.¦-,*„) = 0 (г=1 г) A)
!) Не следует смешивать эти d( с формами di(x0,.. .,х„-{). — Прим.
перев. .
176 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
с коэффициентами из основного поля К- Напомним, что приведенное
в § 5 условие для случая п = 1 было только необходимым. Доста-
Достаточным же оно оказывалось лишь при дополнительном предположении,
что действительные степени рассматривавшихся там уравнений совпа-
совпадали с их номинальными степенями. Мы сделаем подобное предпо-
предположение и сейчас, но даже и после этого останутся некоторые труд-
трудности. Действительно, пусть дан многочлен gi(xu .. .,хп) степени т(.
Допустим, что он имеет степень /и* как многочлен относительно хп
с коэффициентами из кольца К[хи ...,хп_1]. Запишем его в таком
виде:
где at(xlt .. .,хп_1) — многочлен степени т{ — т\ из K[xit . . •,хп_1].
По нашему предположению, этот многочлен отличен от нуля. Если
мы применим результаты § 5 к системе A), рассматриваемой как
система уравнений относительно неизвестного хп, то получим систему
многочленов
"-i\xi xn-i) \1 — * *)•
обладающую следующими свойствами:
г
.'=1 3
(И) необходимым условием существования решения уравнений
(здесь xt — некоторая специализация неизвестных xt) является выпол-
выполнение равенств
hi(xl *»_i) = 0 (i=l, ...,s);
(III) при
либо уравнения (З) имеют общее решение, либо
Для избежания последней возможности мы поступим следующим
образом. Пусть и1,...,ия_1—система п—1 независимых неизвест-
неизвестных; положим
Уп == хп'
Тогда
it ....xJ — Gtiy^ ..., vM),
§ 7. НЕОДНОРОДНЫЕ УРАВНЕНИЯ 177
где G{(ylt .. ...уп) — многочлен степени mf от уг уп с коэф-
коэффициентами из кольца К\ил «n-il-
В этот многочлен _у™< входит с коэффициентом g\(u1, ..., un_v 1),
где gi{xi хп) представляет собой сумму членов многочлена
gt (jCj, ..., хп), имеющих степень т^ Применим результаты § 5 к
уравнениям
О«СУ, Л) = 0 (« = ¦! г), D)
рассматриваемым как уравнения относительно уп. Мы получим тогда
многочлены
с коэффициентами из кольца K[alt ..•,un_1\ такие, что
г
V) nt(yt л-1)э.2
i
(il) необходимым и достаточным условием существования решения
системы уравнений
О«(Л. --.У»-!. ^п) = ° (/=1. ..-..Г)
является справедливость соотношений
Здесь неприятная возможность, о которой была речь выше в пункте (III),
исключена, так как
а это — ненулевой элемент кольца AClKj, •••,ип_1].
Существует (гл. III, § 8, теорема 1) такая специализация их ип_г
неизвестных и1( ..., ип_и что
g\{ttlt...,un_lt \)ФЪ (i=rl,.:.,r).
Поэтому только что установленный результат сохраняет силу и при
специализации Uj-^Mj ип_1-*-ип_1. В дальнейшем мы будем
предполагать, что эта специализация уже осуществлена.
Каждое решение х[ х'п системы A) приводит к решению
(xi — и^п, ..., хп) системы D), а следовательно, и к решению
'
(х[ — ихх'п х'п-х — ап_1хп)
системы уравнений
Я,(л Л_!) = 0 (i=l, ...,s). E)
] 2 Зак. 1230. В. Ходж н Д. Пидо
178 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
Наоборот, каждое решение (y'v .¦•,y'n_]) системы E) определяет
некоторое решение системы, получающейся из D) путем специализа-
специализации ' у^у'и :.-,уп-1 -*Уп-и а решению (у\, .. .,у'п) системы D)
соответствует решение {у\ + щу'п j'n-i + Un-i/n, /n) системы A).
Таким образом, мы показали, как построить систему уравнений D)
ел — 1 неизвестными, существование решения которой является не-
необходимым и достаточным условием для существования решения
исходной системы уравнений A) с я неизвестными. Повторение этого
приема п раз позволяет решить вопрос о существовании решения
заданной системы уравнений A).
Теорема I. Если уравнения
?i(*i хп) G= 1 г) A)
не обладают общим решением, то существуют такие многочлены
A(xi хп), что
г
21 Л* С* *n)?<(*i. ...,*») =1-
Для случая п — 1 это утверждение уже доказано [§ 5, E)], так
что дальнейшее доказательство можно вести по индукции. Пред-
Предположим, что наше утверждение верно для уравнений с я — 1 неиз-
неизвестными, в частности, для выписанных выше уравнений E). Из того,
что система уравнений A) не имеет решения, следует, что система
уравнений E) также не имеет решения, а потому существуют такие
многочлены Bi(y1, . . -,уп-{), что
a
is 21 я* (л yni)^i(yi j'n-i)-
Используя найденные выше свойства многочленов Н1(у1 уп-\)>
мы получаем
*^i^ni) jyi yj\
ss 21Q (л уп)О]{у1 Уп),
3 = 1
где
i [ уп).
Заменяя yt на xt — uixn (t = 1, .. .,n— 1) и уп на хп, мы приходим
к соотношению
г
1=21 Ai(Xl Xn)gi{Xu .... Хп),
§ 8. ТЕОРЕМА ГИЛЬБЕРТА О КОРНЯХ 179
где _
At(xv ..., хп)^С{(х1 — и1хп, .... хп).
Этот важный результат будет использован в следующем параграфе.
Так как необходимости в применении других свойств неоднородных
уравнений у нас не будет, то мы ограничимся изложенным.
§ 8. Теорема Гильберта о корнях
Пусть задана система неоднородных уравнений
/<(*i *«) = 0 (/«I, .... г) A)
с коэффициентами из поля К, и пусть g(xlt ..., хп) — такой нену-
ненулевой многочлен, что
для каждого решения 1г %г системы A), алгебраического над
основным полем. Докажем теорему Гильберта о корнях.
Теорема I. Существуют такие многочлены ai(x1 xn) и
такое натуральное s, что
[g(xlt ..., xn)\s =э2 at(x1 xjfi(xlt .... хп).
Введем новое неизвестное z и рассмотрим систему, состоящую из
уравнений A) и уравнения
*g(*i «я)—1=0. B)
Эта система не может обладать решением ни в каком алгебраическом
расширении поля К, так как для любого такого решения левая часть
уравнения B) обращается в — 1. Но отсюда следует, что решение не
может содержаться ни в каком расширении поля К, так как из суще-
существования такого решения вытекало бы обращение в нуль системы
результантов, а потому и наличие решения в некотором алгебраиче-
алгебраическом расширении поля АГ. Следовательно, по теореме I § 7, суще-
существуют такие многочлены
Mxi хп, z), B{xv ..., хп, z)
в кольце K[xv ..., хп, г], что
хп, z)[zg{xl хп)— 1].
Это тождество сохранит силу, если мы в него вместо г поставим
\g(xn •••> Хп)}-1. Таким образом,
г
..., хп, g-^fdx^ хп).
i — l
12*
180 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
Умножая обе части этого тождества на достаточно большую степень
многочлена g(xu ..., лгп), мы получим требуемый результат:
[g(xit ..., Х„)]"г=2 ai(xv ••¦•. O/<(*i хп), C)
где а{(Х! хп) — многочлены из кольца К[х1г .... хп\.
Отсюда получается непосредственно, что если A) — система одно-
однородных уравнений, a g(x1, ..., хп) — форма степени т, обращаемая
в нуль всеми нетривиальными решениями системы A) из некоторого
алгебраического расширения поля К, то в соотношении C) многочлены
ai{x1 хп) будут формами степеней ms — т(, где /п<— степень
многочлена fi(x1, .... xj).
§ 9. Идеал результантных форм
Прием, с помощью которого мы находили систему результантов
для однородных уравнений, не симметричен относительно неизвестных
х0, ..., хп. Мы исключали эти неизвестные в некотором определен-
определенном порядке. Другой порядок исключения легко может привести
к некоторой новой системе результантов. Кроме того, мы пока ничего
не знаем о числе форм, составляющих систему результантов. Теперь
мы покажем, что для я-f-l однородных уравнений с в-)-1 неизве-
неизвестным можно всегда указать систему, состоящую из одного резуль-
результанта. Что же касается случая меньшего числа уравнений, то здесь
вообще не требуется никаких условий для их разрешимости в некото-
некотором расширении основного поля. Проводимые при этом рассуждения
будут основываться на рассмотрении результантных форм.
Пусть задана система однородных уравнений
U (*0. • • • • хп) = 0 (< = 1, ..., г),
где
/<(*о *«Kv • • ¦ +<»аГ' (/= 1, ¦.., г)
и все коэффициенты являются неопределенными. В § 6 мы уже встре-
встречались с многочленами dlt ..., dx от коэффициентов форм f{, обла-
обладающими тем свойством, что
2 j0 xn)fj(x0 хп)
для некоторых х и k; здесь Aj — многочлены от х0, ..., хп с коэф-
коэффициентами из кольца коэффициентов исходных уравнений. Мы исполь-
используем это свойство многочленов dt для определения результантных
форм.
§ 9. ИДЕАЛ РЕЗУЛЬТАНТНЫХ ФОРМ 181
Каждый многочлен Т (alt ..., аг, . .., со, шг) из кольца
К[аи ..., шг], для которого выполняется соотношение
г
7Xfc = 2j Aj(XQ, . . . , Хп) fj(XQ, . . . , Хп) A)
при некотором выборе т и k (Aj — многочлены от х0, .... хп с коэф-
коэффициентами из кольца K[a]t ..., а>г]), называется резулыпантной
формой. Многочлены dt d^ из § 6 все удовлетворяют этому
условию. Результантные формы можно определить и по-другому. За-
Запишем многочлены /j в виде
ft ^ а^Хо -f- .. • + <°iXn ^=fi -\- a>tXn .
Тогда при подстановке в равенство A) значений
*
•«= —4г B)
хп%
все ft обратятся в нуль, и, следовательно,
Наоборот, если для некоторого многочлена T(ait ..., аг, .. ., o>lf ..., шг)
выполняется соотношение C), то, произведя разложение по возрастаю-
возрастающим степеням выражений
получим ¦
.3: ¦": Т: . V
J\ | 1 /l /г I • I J Г
-'¦i«i «г -4 -4V'
После умножения последнего равенства на необходимую степень не-
неизвестного хп, в силу условия C), мы получим
г
0, .... хп).
182 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
А это означает, что Т является результантной формой. Итак, от равен-
равенства A) мы приходим к равенству C), а от C) возвращаемся к A).
При этом неизвестное jxk заменяется на хп. Но индекс я не может
играть в этом процессе никакой особой роли. Отсюда заключаем, что
из справедливости равенства A) для некоторого хк вытекает справедли-
справедливость аналогичного соотношения и для любого k (k = 0, 1, ..., ti).
Совокупность всех результантных форм может быть использована
в качестве системы результантов однородных уравнений
fi(x0 хп) = 0 (/=1 г). D)
Действительно, если после некоторой специализации коэффициентов
система D) имеет нетривиальное решение, то в результате подста-
подстановки этого решения в соотношение A) его правая часть обратится
в нуль. Но так как не все х{ равны нулю, то обратится в нуль и Т,
где Г-—произвольная результантная форма. С другой стороны, если
все результантные формы обращаются в нуль при заданной специали-
специализации коэффициентов уравнений системы D), то результантные формы
dj d#, составляющие систему результантов уравнений D), также
обращаются в нуль, и потому система уравнений D) обладает нетри-
нетривиальным решением. Как мы увидим сейчас, результантные формы
образуют идеал кольца многочленов К[аи ..., <ог]. Любой базис этого
идеала (см. § 2) может служить системой результантов для уравне-
уравнений D).
Если S(alt ..., шг) и Т(аи ..., <ог)—две результантные формы,
a R(av ..., о>г) — произвольный элемент из К\ах, .... <ог], то формы
S(«j, ..., <вг) — Т(ах <ог) и R(at шг) 5 (at шг)
также являются результа нтными формами, так как
Следовательно, результантные формы образуют идеал кольца К [alt ...
.... шг]. Мы будем называть этот идеал идеалом результантных
форм.
Если произведение двух элементов кольца K\av ..., шг] лежит
в этом идеале, то в нем содержится по крайней мере один из сомно-
сомножителей. Действительно, если этими элементами являются R(av ...
.... шг) и и{ах о,.), то
«(- -§)¦"{- '§)-"¦
§ 9. ИДЕАЛ РЕЗУЛЬТАНТНЫХ ФОРМ 183
Здесь по крайней мере один из сомножителей левой части должен
быть равным нулю, и потому один из многочленов является резуль-
тантной формой. Идеал, обладающий таким свойством, называется про-
простым. Докажем теперь следующую теорему:
Теорема I. Если число г форм fi меньше л. —|— 1, то отличных
от нуля результантных форм не существует.
Пусть Т—отличная от нуля результантная форма. Это означает, что
в то время как
r(flj аг, ..., a>i ^)Ф°- F)
Покажем, что соотношение такого типа будет справедливо и тогда,
когда коэффициенты ах, .._., <&г не будут уже неопределенными,
а получат специализацию аи ..., юг в К. Рассмотрим прежде всего
специализацию ai^>a1. Может случиться, что
Т(аи .... аг ш, <«г) = 0.
Если это так, то
7>i. •••. «,• «1. «V) = («i — «i)'r'"K °V)
при некотором целом s, причем
Г*(а1( .... ar S.---
Но из тождества
_ s / /J
^ 1' • хтх
следует, что
<• • ¦
так что Г* (д,, ..., дг, (Oj, ..., шг) является ненулевой результант;-
ной формой. Специализируя неопределенные коэффициенты один за
другим, мы каждый раз будем находить отличный от нуля многочлен,
обращающийся в нуль в результате подстановки B), т. е. резуль-
тантную форму. Следовательно, в конце концов мы получим ненуле-
ненулевую результантную форму, не обращающуюся в нуль и при специали-
специализации
Этот вывод получен в предположении, что существует хотя бы одна
отличная от нуля результантная форма. Но поскольку г<и-|-1,
184 . ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
коэффициенты а1 а>г можно специализировать так, чтобь
/*->/*. где
fi = Х<_1 + Хп 0=1 Г).
Существование ненулевой результантной формы до специализацш
влечет за собой существование ненулевого многочлена
для которого
я
77 —
я»1 • ' • ' • тг
X X
а это противоречит алгебраической независимости неизвестных
х0, ..., хг_г, хп. Теорема доказана.
Таким образом, все результанты г однородных уравнений с я-j- 1
неизвестным (г<_п-\-1) тождественно равны нулю, и потому такие
уравнения всегда обладают нетривиальным решением в некотором алге-
алгебраическом расширении основного поля.
Теорема II. Система п-\-\ уравнений с п -\-\ неизвестным
обладает ненулевой результантной формой.
Мы утверждаем, что существует по крайней мере одна такая
форма. Действительно, в противном случае система из п -\- 1 одно-
однородных уравнений обладала бы нетривиальным решением при любой
специализации ее коэффициентов. Однако это не так, ибо суще-
существует очевидная специализация, в результате которой уравнения
принимают вид
*Г< = 0 (/ = 0 и),
а эта система не имеет нетривиального решения. Таким образом,
действительно существует по меньшей мере одна ненулевая резуль-
тантная форма.
Рассуждения, проведенные при доказательстве предыдущей тео-
теоремы, показывают, что в случае г — п-\- 1 не может существовать
ненулевая результантная форма, не зависящая от <оп+1. Противопо-
Противоположное допущение привело бы к алгебраическому соотношению, свя-
связывающему между собой х0, ..., хп.
Поэтому, если мы выберем в идеале результантных форм кольца
K\alt .... «>n+il многочлен наименьшей степени относительно (оп+1,
то эта степень будет положительным числом. Если выбранный много-
многочлен приводим, то по крайней мере один из его неприводимых мно-
множителей принадлежит нашему идеалу ввиду простоты последнего и
имеет ту же наименьшую возможную степень относительно юп+1.
Обозначим эту неприводимую результантную форму через R и дока-
докажем следующую теорему:
10. ff-РЕЗУЛЬТАНТ 185
Теорема III. Каждая резумтантная форма делится на R.
Пусть
R == Ашп+1 -[-•••
есть запись R по убывающим степеням «„.ц, и пусть
— подобная же запись произвольного элемента идеала результантных
форм. Поскольку ja^X, разность
AS — Bo%-+\R==T
также будет элементом идеала и будет иметь меньшую степень
относительно а>й+1, чем многочлен S. Если мы продолжим этот процесс
(заменяя на ближайшем шаге многочлен 5 многочленом Г), то в конце
концов придем к многочлену
Г* == A"S — QR,
который содержится в идеале результантных форм и имеет относи-
относительно <опм степень, меньшую степени R. Такой многочлен обязан
быть нулевым, и потому
т. е. Л*5 делится на R. Но так как многочлен R неприводим и не
может являться делителем многочлена А, не зависящего от а>п+1,
то 5 делится на R. Этим теорема доказана.
Таким образом, эта результантная форма R представляет собой
базис идеала результантных форм в кольце K[alt .... <«„+1]. Поэтому
необходимым и достаточным условием существования нетривиального
решения системы из п-\- 1 однородных уравнений
является обращение в нуль результантной формы R. Мы будем назы-
называть R результантом рассматриваемой системы уравнений.
§ 10. й-результант системы уравнений
Пусть известно, что система однородных уравнений над полем К
7<(*о хп) = 0 (/=1, ..., г) A)
обладает конечным числом решений, и пусть этими решениями в не-
некотором расширении поля К являются
Присоединим к уравнениям A) еще одно уравнение
Л+1 = «о*о-|-... +«„*„=* 0 B)
186 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
с неопределенными коэффициентами. Поскольку коэффициенты ut —
независимые неизвестные,
2 «,«?>=?о а = 1,.... s),
и потому среди результантных форм системы специализированных
уравнений A) и не специализированного уравнения B) имеются
отличные от нуля. Такие результантные формы являются многочле-
многочленами относительно «0 ип. Если Г (и)— один из этих многочле-
многочленов, то
Г (и) xl н= 2 At (х0, ..., хп, u)ft (х0, ..., хп). C)
Но f{ однородны относительно неизвестных «0 ип. Если мы
приравняем друг другу суммы членов одинаковой степени относи-
относительно и из обеих частей тождества C), то получим соотношения,
подобные C), но в них многочлены Г (и) будут уже однородными
относительно «0, .... ип. Эти многочлены Г (и) попрежнему являются
результантными формами, так как для них справедливы соотношения
типа C). Итак, мы можем ограничиться рассмотрением результантных
форм, однородных относительно и0, ..., ап.
Пусть
*i(«) bt{u) D)
есть базис идеала результантных форм уравнений A) и B). Мы можем
считать, что все bt(u) относительно и однородны и имеют ненуле-
ненулевую степень, так как все результантные формы системы A) равны
нулю. Система D) может служить системой результантов для r-j-1
уравнений A) и B).
Результанты этой системы обращаются в нуль при специализации
Щ -»• «i (/ = 0, ..., га)
в том и только в том случае, если некоторое решение системы урав-
уравнений A) удовлетворяет и специализированному уравнению B), т. е.
в том и только в том случае, если
для некоторого значения /. Другими словами, общие корни форм D),
рассматриваемых как формы относительно и0, . .., ип, в точности
совпадают с корнями произведения
(ЛПо
в соответствующем расширении поля /("(;)•
S 10. «-РЕЗУЛЬТАНТ 187
По теореме Гильберта о корнях, с одной стороны,
[*,(я)Г^Л<(«)О(я) (/„1, ..., Q, E)
а с другой —
t
[ о (в)Г = IS «<(«)*«(«). F)
Далее, fa, как линейное формы относительно ис, ..., ип, не-
приводимы. Из соотношений E) следует, что формы bt(u), а потому
и их наибольший общий делитель D(u) имеют своими делителями
линейные формы /yj. Но тождество F) можно переписать в виде
откуда видно, что D(u) не имеет линейных множителей, отличных
от /(,). Таким образом,
D (и) а П («о^ + • • • + ««#YJ (<V > 1 )•
Поскольку D(u) — наибольший общий делитель форм A), состав-
составляющих базис идеала результантных форм уравнений A) и B), то
D(u) является делителем всех результантных форм и, в частности,
делителем членов любой системы результантов /¦ —J— 1 уравнений A)
и B). Тем самым доказана
Теорема I. Линейные формы fa, определяющие решения
системы уравнений A), могут быть найдены путем разложения
на линейные множители (в соответствующем расширении основного
поля) формы D(u), являющейся наибольшим общим делителем всех
результантных форм уравнений A) и B). Эта форма D(u) назы-
называется и-результантом форм ft, ..., fr.
Можно распространить понятие «-результанта и на случай, когда
система A) обладает бесконечным множеством решений. Рассмотрим
уравнения A) совместно с системой линейных уравнений с неопреде-
неопределенными коэффициентами
/г+«2/л ( ) <>
При достаточно большом s системы уравнений A) и G) не обла-
обладают общим нетривиальным решением, так как система уравнений G)
сама по себе при s = и -J- 1 не имеет нетривиальных решений.
Возьмем за s наименьшее натуральное число, при котором системы
уравнений A) и G) не обладают общим решением. Рассмотрим
результантные формы этих уравнений. Обобщая проведенные выше
рассуждения, мы убеждаемся, что достаточно ограничиться рассмот-
188 ГЛ. IV. АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
рением только результантных форм, однородных относительно каждой
из систем неизвестных
и< = (и<0 а{п) (/=1 s).
Если при специализации
«в^-»-»^ (' = ° «)
уравнения A) и G) имеют решение (S^, ..., ln), то все результант-
ные формы Г(их> ..., и8) обращаются при этой специализации
в нуль:
7"(и, «„_!, us) = 0.
Рассуждая так же, как выше, мы убеждаемся, что
2 «.А
является делителем для Т(и1, ..., ия). Если D(a]( ..., us) — наи-
наибольший общий делитель всех результантных форм, то много-
многочлены G) являются делителями для D(ult ..., и8).
Но многочлен D(u1 us), рассматриваемый как форма отно-
относительно Иэд, ивп, имеет лишь конечное число линейных множи-
множителей в произвольном расширении поля. Поэтому система уравнений
Л = 0 (/=1 r + s-1) (8)
обладает лишь конечным числом решений.
ия-результантом системы (8) является D(ult ..., ня). Он может
быть также назван и-результантом системы уравнений A). Во втором
томе, когда будет рассматриваться случай, в котором система A)
определяет неприводимое многообразие, обобщенный и-результант
будет играть важную роль.
ЧАСТЬ II
ПРОЕКТИВНОЕ
ПРОСТРАНСТВО
ГЛАВА V
АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ПРОЕКТИВНОГО
ПРОСТРАНСТВА
§ 1. Введение
Проективное пространство п измерений можно определять двумя
различными способами; один из этих способов — чисто алгебраиче-
алгебраический, другой основан на так называемых „аксиомах инцидентности".
Мы рассмотрим каждый из этих способов в отдельности, посвящая
настоящую главу алгебраическому, а следующую — синтетическому
методам. Одной из основных наших задач будет сравнение обоих
методов в наиболее важных пунктах. Мы начнем поэтому с опре-
определения пространства, более общего, чем то, с которым потом будем
иметь дело. Дальнейшие условия на это пространство будут налагаться
лишь после более или менее детального выяснения их содержания.
При алгебраическом определении проективного пространства при-
приходится начинать с выбора основного тела К. Первоначально мы не
будем налагать на этот выбор никаких ограничений. Тело К может
быть некоммутативным; оно может также иметь конечную характе-
характеристику. Если тело К некоммутативно, мы будем рассматривать
также другое тело К, связанное с К отношением, подобным изомор-
изоморфизму, но имеющим от него одно отличие. Чтобы дать опре-
определение этого отношения, которое мы будем называть инверсным'
изоморфизмом, рассмотрим множество 5 элементов, поставленных
во взаимно однозначное соответствие элементам тела К- Будем обо-
обозначать через а и а соответствующие друг другу элементы из К и S.
Введем в 5 сложение и умножение элементов с помощью формул
a-\-b — a-\-b, ab = фа).
Легко видеть, что множество 5 с так определенными алгебраиче-
алгебраическими операциями будет телом; это тело мы обозначим через К •
Можно сказать, что тело К изоморфно К при обращении порядка
сомножителей в произведении, т. ё. при изменении обозначения для
произведения двух элементов а и b в К. Однако более удобно раз-
различать такой изоморфизм тел К и К, в котором произведению^ ab
соответствует а Ь, от такого, в котором ab соответствует Ьа.
В первом случае мы будем говорить просто об изоморфизме, а во
втором — об инверсном изоморфизме тел К и К- Конечно, в случае
коммутативности К эти понятия совпадают.
192 ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
§ 2. Числовое проективное пространство
Назовем (tt-f- 1)-строкой упорядоченное множество, состоящее из
и -f- 1 элементов (а0> ..., ап) основного тела К, не равных нулю одно-
одновременно. Две (и-{- 1)-строки (<х0 <хп) и ф0, ..., |3П) назовем
эквивалентными справа {слева), если в теле К существует такой
элемент \, что
а{ = РД (а,- = А,р<) при i *= 0, ..., я.
Ясно, что если две (и -)- 1)-строки эквивалентны справа или слева,
то соответствующее X должно быть отлично от нуля, так как в про-
противном случае все а{ равнялись бы нулю. Очевидно, что отношение
правосторонней (левосторонней) эквивалентности рефлексивно, симмет-
симметрично и транзитивно.
Совокупность всех эквивалентных между собой справа (п-\-1)-
строк называется точкой правостороннего проективного числового
пространства размерности п над телом К, а множество всех
таких точек — правосторонним проективным числовым простран-
пространством размерности п над К- Это пространство мы будем обозна-
обозначать символом PN^,(K). Используя вместо правосторонней левосто-
левостороннюю эквивалентность, мы получаем левостороннее проективное
числовое пространство размерности п над К, которое мы будем
обозначать символом PNn(K). Если тело К коммутативно, то
Если К—некоммутативное тело и К—тело, инверсно изоморфное А!",
то две (и4-1)-стРС-ки («0 аи) и (Ро, ..., ?„) над телом К будут
эквивалентными справа (слева) в том и только в том случае, если
соответствующие (я-|- 1)-строки (<х0, .... а„) и (|30, ..., |3П) над
телом К эквивалентны слева (справа). Следовательно, пространства
PNln (К) и PN^, (К) являются подобными во вполне понятном смысле.
Точно так же подобны пространства PNln(K) и PNrn(K). Мы можем
поэтому ограничиться изучением правосторонних пространств: свой-
свойства пространства PNln{K) легко вывести из свойств простран-
пространства PNn(K).
Пусть А = (а^) — произвольная невырожденная (и -f-1) X (ti -f" 1)*
матрица с элементами из тела К. Рассмотрим систему уравнений
(О
и эквивалентную ей систему уравнений
§ 2. ЧИСЛОВОЕ ПРОЕКТИВНОЕ ПРОСТРАНСТВО
где В = ($ц) — матрица» обратная к А. Если (хо\, \;.., хпк)
есть совокупность всех эквивалентных между собой справа (д-f-l)-
строк, то система уравнений A) преобразует эти (»-f- 1)-строки
в совокупность (yQk упК) также эквивалентных между собой
справа (я-{- 1)-строк, т. е. система уравнений A) преобразует точку
правостороннего проективного числового пространства в точку того
же пространства. В силу соотношений B), это соответствие взаимно
однозначно.
Система уравнений A), которую мы обычно будем записывать
в матричной форме
У — •"•*-» C)
определяет проективное преобразование пространства PNn(K)B себя.
Каждой невырожденной (и-f- 1) Х(«+ 1)-матрице А с элементами
из тела К соответствует некоторое проективное преобразование
вида A). Обозначим через Аг и А2 невырожденные матрицы, опре-
определяющие преобразования
У = А,х A,)
и
У = А&. (У
Пусть некоторая точка х под действием преобразования AХ) пере-
переходит в точку у = Алх, которая затем под действием преобразова-
преобразования Aе) переходит в точку z = >la-y = >l2>l1Jc. В конечном счете
точки х и г будут связаны соотношением*
Так как (гл. II, § 3) матрица А^Аг невырождена, то произведе-
произведение двух проективных преобразований пространства PNn(K), опре-
определяемых формулами AJ и A2), тоже будет некоторым проективным
преобразованием этого пространства. Таким образом, справедлива
Теорема!. Проективные преобразования пространства PN^t (К)
А себя'образуют группу.
Проективные преобразования пространства PNln{K) определяются
аналогичным образом. Необходимо только отметить, что в этом слу-
случае уравнение преобразования, соответствующего матрице Л, имеет вид
У = хА. D)
где х vi у являются 1Х(«-+-1)-матрицами.
Пусть К* — произвольное расширение тела К- Точки простран-
пространства PNn(K) образуют тогда некоторое подмножество множества
точек пространства РЫ„{К*). Проективные преобразования простран-
пространства PNn(K*) соответствуют невырожденным (и-j-l)X(t4-1)-ма-
трицам над телом К*, причем некоторые из этих матриц будут матри-
матрицами над телом /С.. Проективные преобразования, соответствующие
этим последним матрицам, образуют некоторую подгруппу группы
всех проективных преобразований пространства PNn(K*)>- Под
13 Зак. 1330. В. Хадж н Д. Пвдо
1Э4 ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
действием преобразований из этой подгруппы точки простран-
пространства PNn(K) переходят в точки этого же пространства. Мы будем
говорить, что пространство PNn{K*) является расширением про-
пространства PNn(K), соответствующим расширению К* тела К, а группа
проективных преобразований пространства PN^(K*)— расширением
группы проективных преобразований пространства P
§ 3. Проективное пространство размерности п
Пусть 5 — некоторое множество, элементы которого поставлены
во взаимно однозначное соответствие с точками пространства PN^(K).
Через Т обозначим само это соответствие, так что если А — про-
произвольный элемент множества S, а В — произвольная точка из PN^ (К),
то Т(А) есть соответствующая элементу А однозначно определенная
точка пространства PN*(K), а Т~1(В)— соответствующий точке В
однозначно определенный элемент из 5. Любая строка (а0Х, ..., а„А,)
множества эквивалентных между собой (справа) (п~\- 1)-строк, опре-
определяющих точку Т(А), называется строкой координат элемента А.
Рассмотрим теперь проективное преобразование пространства
PN^(K). Пусть точка Т(А) пространства PN*(K), соответствующая
элементу А множества 5, преобразуется при этом в Т (А). Получен-
Полученное соответствие между элементами А множества 5 и точками Т(А)
пространства PNn(K) также будет взаимно однозначным. Этим соот-
соответствием в множестве 5 устанавливается некоторая новая система
координат. Таким образом, каждое проективное преобразование про-
пространства PNn(K) определяет в 5 некоторую систему координат.
Различные системы координат, получаемые таким путем, мы будем
. называть допустимыми системами координат в 5. Поскольку, как
было отмечено в § 2, проективные преобразования составляют группу,
при замене первоначального соответствия Т между 5 и PN^{K) любым
другим соответствием V, определяющим некоторую допустимую си-
систему координат, в 5 получается то же самое множество допустимых
систем координат.
Множество 5 с определенным для него множеством допустимых
систем координат называется правосторонним проективным про-
пространством размерности п над К. Элементы множества 5 назы-
называются точками этого пространства. Такое пространство мы обо-
обозначим через P,j(/Q, но иногда будем применять и другие обозначения.
Так, если К является полем, причем известно, каким именно, то для
обозначения проективного пространства размерности и мы будем
использовать символы [л], Sn, Sn. Обозначение Sn особенно удобно
в тех случаях, когда одновременно рассматривается несколько проек-
проективных пространств.
§ 3. ПРОЕКТИВНОЕ ПРОСТРАНСТВО РАЗМЕРНОСТИ Л
Если (х0 хп) — строка координат точки Р пространства
Рп(К) в заданной допустимой координатной системе, то координаты
Оо» • • • • Уп) этои точки в любой другой допустимой системе опре-
определяются системой равенств
где А = (а^) — некоторая невырожденная (л -J- 1) X (я ~Ь 1)-матрица
над телом /С. Система уравнений, определяющая преобразование
координат в пространстве Рп(К), может быть записана в матричной
форме
А
причем каждая невырожденная (« -J- 1) X (л + 1)-матрица над К опре-
определяет одно такое преобразование.
Выясним теперь, как расширяется пространство Рп(К) при рас-
расширении тела К до К*- В § 2 мы видели, как расширяется при
этом пространство PN?(K). Вложим множество 5 в некоторое мно-
множество 5*, элементы которого могут быть поставлены во взаимно
однозначное соответствие с точками пространства PN^iK*) таким
образом, чтобы элементы множества S*, принадлежащие S, соответ-
соответствовали точкам пространства Р^(К*), принадлежащим PN^(K).
Такое вложение возможно: множество S* можно образовать, напри-
например, из элементов множества 5 и точек пространства РМп(К*), не
принадлежащих PN^{K). Используя заданное соответствие между 5*
и PNniK*) и проективные преобразования пространства РМ„(К*),
мы построим проективное пространство Рп(К*) размерности и, точ-
точками .которого являются элементы множества S*, содержащие про-
пространство Рп{К). Среди допустимых систем координат пространства
Рп{К*) имеются и такие, которыми индуцируются допустимые си-
системы координат в Р„ (К).
В дальнейшем нам часто придется заменять тело К некоторым
его расширением К*. При этом мы будем предполагать, что про-
пространство Рп(К) расширяется до Рп(К*), как описано выше. Резуль-
Результатом этого расширения является добавление к пространству Р„(К)
новых точек и соответствующее расширение группы его допустимых
преобразований.
Пусть мы имеем в пространстве Рп(К*) некоторую систему коор-
координат, в которой точки пространства Рп(К) определяются коорди-
координатами из тела К. Рассмотрим координаты (во, .... ая) точки R
пространства Рп(К*).
13*
ГЛ. V. АЛГЁБ^АИЧЁСкбЁ ОПРЕДЕЛЕНИЙ
(I) Если для некоторого элемента А* из тела К* все элементы
«>• (/=-0 «)
принадлежат телу К, то точка /?, принадлежащая в этом случае Р^(К),
называется рациональной точкой пространства Рп(К).
(II) Если для некоторого к* каждый элемент а*к* алгебраичен
над телом К, то точка R называется алгебраической точкой про-
пространства Рп(К).
(III) Если, наконец, для всех А,* из К* по крайней мере один из
элементов а*А* трансцендентен над телом К, то R называется
трансцендентной точкой пространства Р„(К).
Этим мы закончим описание построения правостороннего проек-
проективного пространства Рп(К). Метод построения левостороннего проек-
проективного пространства Рп (К) теперь очевиден, и читатель легко сможет
вывести связь между пространствами Р1п(К) и Рп(К), где К — тело,
инверсно изоморфное телу К-
§ 4. Линейная зависимость в Рп(К)
Рассмотрим k -j- 1 точек
АО, .... А"
пространства Р'п(К)- Обозначим через
(с*,..., сф (/ = 0 k)
их координаты в некоторой допустимой координатной системе. Мы
будем говорить, что точки Л°, .... Ан линейно зависимы в Р*(К),
если в теле К существуют элементы А,о Хк, не равные нулю
одновременно и такие, что
2^ = о (/=о и). A)
Для того чтобы линейную зависимость можно было рассматривать
как свойство самих точек Л°, ..., Л*, надо показать, что это опре-
определение не зависит от выбора координат точек А0, ..., Лй в рас-
рассматриваемой системе координат и что оно не зависит от выбора
самой допустимой системы координат.
Для доказательства первого утверждения предположим, что
($1, .... р^) — другие координаты точки Л1 в заданной допустимой
координатной системе. Тогда
где (!< — некоторый отличный от нуля элемент тела К. Из соотно-
соотношения A) получаем, что
j
3=0
§ 4. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ В Р„ (Я) 197
Следовательно, если некоторое соотношение вида A) выполняется при
определенном выборе координат в заданной допустимой системе, то
некоторое соотношение такого же типа будет выполняться и при
любом другом выборе координат в той же координатной системе.
Рассмотрим ' теперь произвольное допустимое преобразование си-
системы координат, определяемое равенством
У = Сх, B)
где С — (ffj) — некоторая невырожденная (я -\- 1) X (я + 1)-матрица
над телом AT. В новой координатной системе координаты (|3* C^)
точки А* будут определяться соотношениями
8S
р = 0
Но тогда, как это следует из равенства A),
i=o <=op=o
Следовательно, если в некоторой допустимой системе координат
выполняется соотношение A), то аналогичное соотношение будет вы-
выполняться и в любой другой допустимой системе. Таким образом,
линейная зависимость точек пространства Р^{К) является свойством
самих этих точек, не зависящим от выбора допустимой системы коор-
координат.
Вспоминая сказанное в гл. II относительно линейной зависимости
векторов, мы можем дать две различные формулировки условия линей-
линейной зависимости точек А0 Аи:
(а) Пусть (а* а?) (/=0,..., k) — координаты точек
А0 ',..., Аь в заданной допустимой системе координат. Для того
чтобы эти точки были линейно зависимы, необходимо и доста-
достаточно, чтобы были линейно зависимы k-\-\ правосторонних век-
векторов
(<,-¦¦• О ('=о *)•
(б) Для того чтобы точки Л° ,..., Ак были линейно неза-
независимы, необходимо- и достаточно, чтобы ранг матрицы
был равен k-\-l.
Непосредственным следствием сказанного является
Теорема I. При т>п-f- 1 любые т точек пространства Р^{К)
линейно зависимы.
198 гл- v- АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Можно ввести обычные обозначения, условившись через А* обо-
обозначать фиксированную (/t-f- 1)-строку в классе всех эквивалентных
между собой (я-{-1)-строк, определяющих координаты точки А*
в заданной координатной системе. Преобразование B) определяет
тогда одну из координатных строк точки А* в новой системе коор-
координат. Эту строку мы также будем обозначать через А*. Далее,
для общности мы введем еще умножение точки А* = («о ,..., <хи)
справа на отличный от нуля элемент X тела К с помощью равенства
А'к = (ао\ агаХ), так что символы А* и А*\ будут представлять
одну и ту же точку. Теперь равенство A) можно переписать в виде
2
{=0
причем наличие такого соотношения не зависит от выбора до-
допустимой системы координат.
Если ц — отличный от нуля элемент тела К, то любая точка А,
для которой
называется линейно зависящей от точек А° Аи.
Если k = n, то полагая в заданной допустимой системе координат
^ = (««,. 8* »«,..., 8,„) = @, 0,..., 1 0)
(/ = 0 я),
мы получим п -j- 1 линейно независимых точек. Так как произволь-
произвольная точка
А = (% ап)
может быть представлена в виде
то .каждая точка пространства Р„(К) будет линейно зависеть от
этих п +1 точек А0 Ап. Мы будем говорить, что эти точки
образуют репер рассматриваемой системы координат.
Свойства линейной зависимости точек можно вывести из свойств
линейной зависимости векторов (гл. II, § 1). Нам нет необходи-
необходимости проводить подробно доказательства, так как эти свойства сразу
получаются из соответствующих теорем для векторов. Если А1
имеют указанный выше смысл, то основные результаты можно сфор-
сформулировать в виде следующих предложений:
Теорема П. Если точки Л°, ..., Ак линейно независимы и
если точка
А\ = 2
I 4. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ В р?(АГ) igg
линейно зависит от них, то (k-\- 1)-строка(\0, ..., Xft)определена
однозначно с точностью до эквивалентности.
Теорема III. Если точки &>,... Bh линейно зависят от точек
А0, ..., Ак, а точка Р, в свою очередь, линейно зависит от
В0, ..., Bh, то точка Р линейно зависит также и от А0, ..., Л*.
Теорема IV. Во всяком конечном множестве точек Л°, ..., Л*
можно найти такое подмножество А", ..., А к линейно неза-
независимых точек, что каждая точка, линейно зависящая от
А0, ..., Аи, будет линейно зависеть и от А{% ..., А{ь.
Теорема V. Если точки В0, ..., Bh линейно независимы,
причем каждая из них линейно зависит от точек А0,..., A*, mok^.k
и в последнем множестве можно выделить k — h таких точек
Л**+', ..., А{ь, что каждая точка, линейно зависящая от
Л°, ..., Л*, будет линейно зависеть от В°, ..., Bh, Л^+1, .... Л**.
(Теорема о замене.)
Если точки Л° Л* пространства Р^(К) линейно независимы,
то совокупность всех точек из Р„(К), линейно зависящих от этих
точек, составляет k-мерное линейное подпространство. Одномерное
линейное подпространство мы будем называть прямой, двумерное —
плоскостью. Из первой части теоремы о замене следует, что при
h > k любые h -f- 1 точек линейного подпространства размерности k
линейно зависимы. С другой стороны, в этом подпространстве имеется
по крайней мере одно множество из k -f-1 линейно независимых точек
Л°, ..., Ан. Если В°, . .., Вк — любое множество из k -\- 1 линейно
независимых точек этого подпространства, то из второй половины
теоремы о замене вытекает, что линейное подпространство, определяемое
точками В0 Въ, совпадает с подпространством, определяемым
точками Л°, ..., Ак.
" .Каждое множество из k -\- 1 линейно независимых точек fe-мерного
линейного подпространства называется базисом этого подпространства.
Используем приведенные выше результаты для доказательства
того факта, что k-мерное линейное подпространство является
пространством Р^(К). Действительно, пусть Л°, ..., Л**-*— произ-
произвольный базис итого линейного подпространства; тогда каждая его
точка Q определяется равенством вида
где (k-\- 1)-строка (Хо Хк) определена точкой Q однозначно
с точностью до правосторонней эквивалентности. Этим устанавли-
устанавливается некоторое взаимно' однозначное соответствие между точками
рассматриваемого линейного подпространства и точками пространства
). Выясним теперь, что произойдет, если базис этого линейного
200
ГЛ. У. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
подпространства заменить некоторым другим его базисом В? , Вк.
Мы имеем
Следовательно,
а* = 2 2 Ак*ыа*
;=0 Л=0
В силу линейной независимости точек А0, ..., Ак, это соотношение
должно быть тождеством. Следовательно, матрицы
В = (ру) и Л = («у)
взаимно обратны. Отсюда вытекает, что обе они должны быть
невырожденными.
к
Далее, если Q = 2 ^*^». то мы имеем
о
где
Следовательно, переход от базиса А°, ..., Ак к новому базису
В°, .... Вк производит в соответствующем пространстве PNrk (К)
проективное преобразование C). Обратно, любое проективное пре-
преобразование в Pltft(K) соответствует некоторой замене базиса линей-
линейного подпространства. Таким образом, fe-мерное линейное подпростран-
подпространство является пространством Р\ (К), причем каждая допустимая система
координат в Pfc(K) соответствует некоторому выбору базиса в этом
линейном подпространстве.
Из теоремы III получается непосредственно, что если Sh есть
А-мерное линейное подпространство, определяемое базисом В0, ..., Bh,
причем все В* содержатся в некотором линейном подпространстве Sk,
то каждая точка из Sh содержится в Sk. Таким образом, подпро-
подпространство Sb целиком содержится в Sk. Мы будем писать в этом
случае
'Очевидно, что если Sa с Sb и Sb с 5С, то Sa с Sc, и если 5а с Sb
и Sb = Sa, то Sa = Sb.
Из теоремы IV следует, что любые к -\- 1 точек содержатся в не-
некотором Sh (А -< А). При этом h < к тогда « только тогда, когда эти
точки линейно зависимы.
Пусть, далее, Sp и 5? — два линейных подпространства простран-
-стаа Р^(К), и пусть точки Р°,...... /V .составляют -базис в S» #
$ 4. ЛИНЕЙНАЯ ЗАВИСИМОСТЬ В р? (*) 201
точки С/3, ..., Q9 — базис в Sr Если p-\-q-\-2 точек Р°л ...t Р*%
Q0, ..., QQ линейно зависимы, так что
то подпространства Sp и 5„ имеют точку пересечения. Действительно,
р
ввиду линейной независимости точек Р° Рр, сумма 2 ?*А.* °г"
0
лична от нуля; по аналогичной причине отлична от нуля и сумма
а р
2 Q*V-i- Поэтому 2 P*^t является точкой подпространства Sp, кото-
0 О
р й
рая, ввиду равенства 2 P*h = -~ 2 QV*. линейно зависит от точек
о о
Q0, .... <?« и, следовательно, содержится в Sr
В заключение мы отметим тот тривиальный факт, что если Р и
Q — различные (а значит, линейно независимые) точки пространства
Р'п(К), то точка P-\-Q отлична от каждой из этих точек Р и Q;
следовательно, каждое Sj непременно содержит по крайней мере
три точки, так как две точки оно заведомо содержит. Результаты
этого параграфа можно сформулировать в виде следующих предло-
предложений.
В Рп (К) имеются линейные подпространства размерностей 0, 1,
2, ..., и, причем нульмерными подпространствами являются точки.
Между некоторыми парами Sh и Sk этих подпространств может
иметь место отношение инцидентности, когда одно из этих подпро-
подпространств „содержится" в другом („принадлежит" другому, „лежит"
в нем), скажем Sh S Sk. Это отношение подчиняется следующим
условиям:
I.' Если ShcSk и Sk с Sh, то Sk = Sh.
II. Если SpcSq и Sqc Sr, то Sp с Sr.
р-\-\ точек линейно зависимы, если существует содержащее эти
точки.линейное подпространство Sq, для которого q <р.
III. Каждое Sj содержит по крайней мере три различные точки.
IV. Для любых р -\-1 линейно независимых точек существует по
крайней мере одно содержащее их Sp.
V. В каждом Sp существует по крайней мере одно множество из
р -\~ 1 линейно независимых точек.
VI. Если р-\-\ линейно независимых точек Р° Рр содер-
содержатся в некотором Sq, то любое содержащее эти точки Sp содержится
в этом 5_.
VII. Пусть Sp и 5? — любые два линейных подпространства раз-
размерностей р и q. Если р-\-\ точек Р°, ..., Рр, принадлежащих Sph
линейно независимы, как и q -f-1 точек Q°,..., Qv, принадлежа-
202 ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
щих Sq, и если p-\-q-\-2 точки Р°, ..., F0, Q0, .... QQ линейно
зависимы, то существует по крайней мере одна точка R, лежащая
одновременно в Sp и в Sq.
VIII. Существует по крайней мере одно множество из п -j- 1 ли-
линейно независимых точек, но любые т точек при /га >«-}-! линейно
зависимы.
На самом деле мы доказали много больше, но сейчас нам важно
подчеркнуть именно то, что правостороннее проективное пространство
удовлетворяет приведенным выше условиям, которые мы будем назы-
называть свойствами инцидентности.
В следующей главе мы будем исходить из совокупности не опре-
определяемых элементов, которые будут называться линейными подпро-
подпространствами размерностей 0, 1, 2, ... . Мы будем постулировать
существование между некоторыми парами этих подпространств отно-
отношения с, удовлетворяющего приведенным выше условиям I и II.
Предложение, сформулированное после условия II, будет принято
нами при этом за определение линейной зависимости. Затем мы нало-
наложим условия III — VIII. Отметим, что число и появляется лишь
в условии VIII. В главе VI основной нашей задачей будет доказатель-
доказательство того, что эти линейные подпространства размерностей 0, 1,2,...
могут быть представлены в виде линейных подпространств пространства
Рп (К) над некоторым надлежащим образом выбранным телом К. При
и>2 это будет непосредственно следовать из постулатов I — VIII.
При и = 2 для этого будет необходим некоторый дополнительный
постулат. Случай я = 1 не интересен.
Для левостороннего пространства Р\(К) теория линейной зависи-
зависимости строится аналогично. Если
А* = (а* а<) (/=0 k)
— система k-\-l точек из Р\ь(К), то линейно зависящими от них
будут точки
Sm* = (S*<«o 2 **«*)¦
оо о
Все теоремы, доказанные в настоящем параграфе для Рп(К), можно
доказать и для Рп(К) при соответствующих формальных изменениях.
В частности, мы получим те же самые свойства инцидентности. Сле-
Следовательно, если ограничиться случаем и > 2, можно доказать, что
свойствами инцидентности определяется левостороннее проективное
пространство. Отсюда вытекает, что левостороннее проективное про-
пространство можно рассматривать как правостороннее, и наоборот
Объяснение этого обстоятельства связано с особенностями нашего
метода построения проективного пространства на основании свойств
инцидентности. Мы будем строить некоторое тело. Как мы увидим
§ 5. УРАВНЕНИЯ ЛИНЕЙНЫХ ПОДПРОСТРАНСТВ 203
далее, для этого возможны два пути, приводящие к телам, инверсно
изоморфным друг другу. Если тело К инверсно изоморфно телу К,
то существует некоторое взаимно однозначное соответствие между
точками пространств Ргп{К) и Рхп{К) и взаимно однозначное соответ-
соответствие между их допустимыми системами координат. Выбирая соот-
соответствующие допустимые системы координат в Р'п(К) и Ргп(К), мы
получим соответствующие точки
Точка
(«I «») и (а* агп).
пространства Рп(К) будет отвечать при этом точке
B al^u • • •. 2 «n^i)
пространства Ргп (К). Следовательно, точкам пространства Р1п (К), ли-
линейно зависящим от данных т точек из Р^(#)> отвечают точки
из Рп (К), линейно зависящие от т соответствующих точек. Таким
образом, для любого свойства подпространств Sa, Sb, ... из Pln(K),
инвариантного относительно любых допустимых проективных пре-
преобразований этого пространства, имеется соответствующее свойство
подпространств Sa, Sb, .. . из Ргп (К), также инвариантное относи-
относительно любого допустимого проективного преобразования в Ргп (К)-
Мы будем говорить, что эти два пространства проективно тожде-
тождественны.
§ 5. Уравнения линейных подпространств. Двойственность
Рассмотрим правосторонее проективное пространство Ргп (К) и
левостороннее проективное пространство Р1п (К)- В каждом из них за-
зафиксируем совершенно произвольно некоторую допустимую систему
координат. Будем рассматривать эти две системы как ассоциирозан-
Лые. Теперь можно следующим образом сопоставить с любой дру-
другой допустимой системой координат Ргп(К) некоторую вполне опре-
определенную допустимую систему координат в Р1„(К). Если формула
преобразования выбранной системы координат в пространстве Ргп(К)
к некоторой новой системе имеет вид
у = Ах,
то преобразование соответствующей координатной системы в про-
пространстве Р1п(К) в координатную систему, ассоциированную с новой
системой в Ргп{К), будет иметь вид
У = х'А-\
где х' и У являются, конечно, 1 X (п-\- 1)-матрицами.
204 гл- v- АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Можно без труда проверить, что такое сопоставление допустимых
систем координат двух пространств является взаимно однозначным и
что если в качестве исходной взять любую пару ассоциированных
координатных систем, то это сопоставление будет определяться ана-
аналогичным правилом.
Рассмотрим теперь линейное подпространство Sh пространства
Рп(К). Пусть точки А0, ..., Ак образуют базис этого подпростран-
подпространства и
— координаты точки А* в заданной допустимой координатной си-
системе. Рассмотрим систему уравнений
2
Так как (я+ 1)Х(*+ 1)-матрица (ар имеет ранг к-\-\ [§ 4, (б)],
то решения системы однородных уравнений A) образуют левосто-
левостороннее векторное пространство размерности я — к (гл. II, § 6).
Будем считать ненулевые векторы этого пространства координатными
строками точек некоторого линейного подпространства в ассоцииро-
ассоциированной системе координат в пространстве Р1п{К). Обозначим это под-
подпространство (размерность его равна п — k—1) через Еп-л-ь Если
(йо «п) («=1, •••, n — k)
есть базис подпространства ?n-*-i, то ранг (л — k) X («+ 1)-мат-
рицы (вй равен я — к. Из уравнений A) вытекает, что
2М = 0 О'=1 n — k; A = 0 k). B)
Но так как ранг матрицы (aj) есть п — k, то система уравнений
24^ = 0 (i=l,..., я — к)
удовлетворяется векторами некоторого правостороннего векторного
пространства размерности к -\- 1. Ненулевые векторы этого простран-
пространства являются координатными строками точек некоторого fc-мерного
линейного подпространства в Ргп(К). В силу соотношения B), это
подпространство содержит точки А0, ..., Ак и, следовательно, совпа-
совпадает с Sk. Таким образом, подпространство Sk определяет ?n-*-i
и, обратно, Sn-ft-i определяет Sk.
Мы покажем теперь, что это свойство, характеризующее связь
двух пространств Sk и' Sn-s-ь не зависит от сделанного перво-
§ 6. УРАВНЕНИЯ ЛЙНЕЙНЬВГГ1бДГ1РбЙт4>АН<^В
начально выбора ассоциированной пары систем координат в Рп(К) и
в Р1ЛК).
Чтобы убедиться в этом, мы прежде всего заметим, что связь
между подпространствами Sh и ?п_*_1 может быть выражена сле-
следующим образом. Уравнение
п
2 и{х4 = О
i = 0
удовлетворяется для каждой точки (н0, ..., ип) из En-fc-i при лю-
любом выборе точки (лг0 хп) в Sk, и обратно. Если мы выполним
преобразование координат
у = Ах
в пространстве Ргп{К) и ассоциированное преобразование
•у = иА'1
в пространстве Р1п(.К), то, замечая, что и и г» являются 1 Х(я+1)-
матрицами, получим
п п
2 V/Vi = vy — и А-1 Ах = их = 2 и<*< = О-
о о
Следовательно, свойство, характеризующее связь подпространств Sk
и En-fc-i» остается инвариантным при переходе к любой другой
паре ассоциированных систем координат.
Подпространства Sk и Sn-ft-i называются дуальными друг
другу.
Если взять любые п — k точек подпространства 2П_*_1, обра-
образующих его базис и имеющих в некоторой допустимой координатной
системе в пространстве Р1п(К) координаты
(«о, •••, Кп) 0'== 1 я — *),
то точки из P'niK), принадлежащие SH, будут удовлетворять системе
уравнений
24^ = 0 (/=1, .... п — k) C)
в ассоциированной системе координат. Мы будем называть систему
C) системой уравнений подпространства SH.
Пусть дана произвольная система уравнений
40 (/=1,2,...). D)
ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Рассмотрим в Рп(^Г) подпространство, линейно зависящее от точек
(«о «») (*=1. 2,...).
Если это Xn-ft-it то решениями системы уравнений D) служат точки
дуального подпространства Sk; следовательно, система уравнений D)
определяет данное Sk. На алгебраическом языке это можно выразить
так: если матрица коэффициентов некоторой системы линейных
однородных уравнений D) имеет ранг п — к, то эти уравнения
определяют некоторое подпространство Sk.
Рассмотрим теперь два линейных подпространства Sp и Sq про-
пространства Рп(К), определяемых соответственно системами уравнений
п
2 u\*i=° (* =1 п—р)
2^ = 0 (/=1,..., n~q).
Допустим, что Bл— р — g)X (fl-\- 1)-матрица
v = (v{j)] E)
(I) [« =
имеет ранг я— к. Тогда эти две системы уравнений в совокупности
определяют некоторое подпространство Sk. Каждая точка подпростран-
подпространства Sk принадлежит Sp и Sa одновременно, и обратно, каждая точка,
общая для Sp и Sq, принадлежит Sk. Назовем Sk пересечением под-
подпространств Sp и Sq. Мы можем сформулировать теорему:
Т е о р е м а I. Пересечение двух линейных подпространств является
линейным подпространством.
Если ранг матрицы E) равен п — k, то 2л — р — q точек
(«о »п) 0=1, ..-, п — р),
(«о fl«) (*'=1 ti — q)
из Р1(К) линейно зависят от л — к из этих точек и, следовательно,
подпространства ?п_р_1 и ln_g_lf дуальные к5?и Sq, содержатся
в подпространстве Sn-ft-n дуальном к Sk. При этом не существует
меньшего подпространства, содержащего одновременно En-p-iи Sn-g-r
Действительно, любое подпространство, содержащее оба эти подпро-
подпространства, должно содержать 2л—р — q точек F), из которых л — к
линейно независимы. Наименьшее линейное подпространство, содержа-
содержащее оба данных линейных подпространства, назовем их суммой. Мы
доказали следующий результат:
Теорема II. Подпространство, дуальное пересечению двух
линейных подпространств, является суммой подпространств,
дуальных этим подпространствам (м обратно).
$ 6. УРАВНЕНИЯ ЛИНЕЙНЫХ ПОДПРОСТРАНСТВ 20?
В качестве следствия получаем:
Если Sp Э 5в, то 2»-p-i ? Sn-g-r
Найдем теперь связь между размерностями пересечения Sk и суммы Sr
двух линейных подпространств Sp и Sq. Пусть А0, ..., Ак есть базис
этого пересечения. По теореме о замене, мы можем найти такие базисы
Р°, .... Р* подпространства Sp и Q0, ..., Qa подпространства Sq, что
Р* = А< = (? (/ = 0 к).
Очевидно, что любое подпространство, содержащее точки Р°, .... Рр,
Qk+l, .... Qq, содержит Sp и Sa, а поэтому и их сумму Sr. Отсюда
следует, что
Проведя аналогичное рассуждение для дуальных подпространств
Лп-p-i и ln-q-i и их суммы, которой, согласно теореме II, является
Sn-s-i. мы получим
п-к— 1<(я —р_ 1) + (я — ?-1)-(д — г—1),
т. е.
и окончательно
Следовательно, имеет место
Теорема III. Если подпространства Sp и Sq пересекаются
по Sk, то суммой Sp a Sq является некоторое линейное подпро-
подпространство размерности p-\-q — к.
Эта теорема останется справедливой и для непересекающихся под-
подпространств, если условиться считать в этом случае k = — 1.
Мы установили некоторое соответствие между пространствами
РГп(К). и Р1п(К), при котором меньшему из подпространств Sk соот-
соответствует большее из подпространств ?n_k_lt пересечению соответ-
соответствует сумма, а сумме — пересечение. Если мы установим для Р^(К)
некоторое предложение, основанное только на свойствах линейных под-
подпространств, их пересечений и сумм, то это соответствие даст воз-
возможность немедленно получить соответствующую теорему для Рп(К)
без каких-либо доказательств. В силу исторических причин, это соот-
соответствие между свойствами пространств Рп(К) и Р1п(К) называется
принципом двойственности для проективного пространства.
Если К есть тело, инверсно изоморфное телу К, то между про-
пространствами Р1п(К) и Рп{К) имеется соответствие, при котором линей-
линейным fc-мерным подпространствам соответствуют линейные ft-мерные
подпространства, пересечениям соответствуют пересечения и суммам —
суммы. Следовательно, в силу принципа двойственности, доказав для
Рп(К) любую теорему относительно линейных подпространств 5О, Sb,...,
ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
их пересечений и сумм, мы автоматически получим соответствующую
теорему для Рп(К) относительно его линейных подпространств Sn_a_u
8п-ь-и • • ^_их сумм и пересечений. В случае коммутативного тела К,
Очевидно, К = К и, следовательно, в Р^ (К) будет верна соответствую-
соответствующая двойственная теорема. Далее, если некоторая теорема справедлива
при любом основном теле К, то она будет верна, в частности, и для
РГп(К) и, следовательно, в Я»(/<) опять будет справедлива соответ-
соответствующая двойственная теорема.
Этот последний случай — самый обычный. В дальнейшем мы будем
доказывать теоремы следующих категорий:
1) верные для всех основных тел К,
2) верные для всех основных полей К,
3) верные для всех основных полей данной характеристики,
4) верные для всех алгебраически замкнутых полей.
Заметим, что если тело К принадлежит к одному из четырех пере-
перечисленных типов, то инверсно изоморфное тело К будет такого же
типа, и, следовательно, для каждой теоремы, доказанной в Рп(К), мы
будем иметь в Ргп{К) двойственную теорему.
§ 6. Теорема Дезарга
В этом параграфе мы рассмотрим известную теорему Дезарга отно-
относительно двух перспективных треугольников в Рп(К)- Для того чтобы
избежать повторений в следующей главе, мы выведем эту теорему и
обратную к ней теорему из приведенных в § 4 свойств инцидентности.
Отметим предварительно некоторые очевидные следствия из свойств
инцидентности, используемые в настоящем параграфе. Более полное ис-
исследование теоремы Дезарга будет проведено в начале следующей главы.
Каждое подпространство 5Х (прямая) содержит по крайней мере
три различные точки. Две различные точки определяют единственную
прямую. Каждое 52 (плоскость) содержит три линейно независимые
точки. Если прямая / определяется точками Р°, Р1, а прямая т — точ-
точками Q°, Q1, причем точки Р°, Р1, Q°, Q1 линейно зависимы (т. е. рас-
рассматриваемые прямые компланарны), то эти прямые имеют по крайней
мере одну общую точку R. Через произвольную точку Р плоскости it
можно провести по крайней мере три различные прямые. Действи-
Действительно, если Р, Q, R— линейно независимые точки плоскости «, то
прямая QR содержит по меньшей мере одну точку, отличную от точек Q
и R. Пусть это будет точка 5. Тогда PQ, PR, PS — различные пря-
прямые, проходящие через точку Р. Покажем, наконец, что если А, В, U—
три различные коллинеарные точки плоскости it, то в этой плоскости
можно найти прямые а, Ь, и, проходящие соответственно через точки А, В
и U, отличные от прямой AU и не проходящие через одну точку.
Действительно, пусть X—такая точка плоскости it, что точки X, A, U
линейно независимы. Тогда прямая XU содержит некоторую точку К,
§ в. ТЕОРЕМА ДЕЗАРГА 209
отличную от X и U. Прямые а = АХ, b = BY и и = UX удовлетво-
удовлетворяют сформулированным условиям.
Нам понадобятся еще следующие теоремы относительно S$: каж-
каждая • прямая либо лежит в плоскости, либо имеет с этой плоскостью
единственную общую точку; две различные плоскости в 58 пересе-
пересекаются по прямой; через данную прямую проходят по меньшей мере
три различные плоскости.
Обратимся теперь к теореме Дезарга. Условимся предварительно
о следующей терминологии. Три точки коллинеарны, если существует
по крайней мере. одна содержащая их прямая (если эти точки совпа-
совпадают, существует, возможно, больше чем одна такая прямая). Тре-
Треугольником, или треугольником в собственном смысле слова, мы будем
называть тройку неколлинеарных точек.
Два треугольника ABC и А'В'С называются перспективными
относительно точки О, если. тройки точек ОАА', ОВВ' и ОСС
коллинеарны. Заметим, что точка О не всегда определена однозначно
(например, в случае, когда А = А' и В = В'). С помощью этих
определений сформулируем теорему Дезарга.
Теорема I. Если два треугольника ABC и А'В'С перспек-
перспективны, то точки пересечения прямых АВ м А'В', ВС и В'С,
С А и С А' лежат на одной прямой I. . .
Обратным предложением к теореме Дезарга будет
Теорема II. Если ABC и А'В'С — два таких треугольника,
что точки пересечения прямых АВ и А'В', ВС и В'С, СА и С А'
лежат на одной прямой I, то эти треугольники перспективны.
Заметим, что в обеих теоремах вся конфигурация расположена
в некотором двумерном или трехмерном линейном подпространстве
(так как точки А, В, С неколлинеарны, размерность этого простран-
пространства не меньше 2). Действительно, например, в теореме I должны
существовать три прямые а, Ь, с, проходящие через точку О и содер-
содержащие соответственно точки Ли А', В и В', С и С. На этих прямых
возьмем по точке Р, Q, R, отличной от О. Тогда четверка точек О, Р,
Q, R определит некоторое подпространство Sr (г <^ 3), содержащее точки
О,.Р, Q, R, и, следовательно, точки О, А, А', В, В', С, С, а зна-
значит, и всю конфигурацию. Прямая / содержится в этом Sr. Заметим
также, что если г = 3, то две плоскости, определяемые тройками
точек А, В, С и А', В', С, различны (если исключить тривиальный
случай, когда А = А', В = В', С = С).
В теореме II каждый из треугольников ABC, А'В'С определяет
некоторую плоскость. Обозначим эти плоскости через и и я'. Прямая/
пересекает прямые АВ, ВС и С А. Так как точки А, В и. С некол-
неколлинеарны, то по крайней мере две из этих точек пересечения раз-
различны. Следовательно, прямая /, имеющая по крайней мере две общие
точки с плоскостью it, содержится в «. Аналогично, / содержится
и в it'. Так как плоскости i и / имеют по крайней мере одну общую
прямую, то их суммой будет некоторое подпространство Sr (г ^ 3).
14 Зак. 1230. В. Ходж и Д. Пидо
210 ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Точка О должна содержаться в этом Sr (если исключить тривиальный
случай, в котором А = А', В = В', С = С).
Мы можем, следовательно, ограничиться рассмотрением двух слу-
случаев: 1) г = 3 и 2) г =2. В первом случае плоскости it и тс', опре-
определяемые точками А, В, С и А' В' С, различны, во втором они
совпадают. . .
Теорема I. Первый случай. Прямые а, Ь, с, содержащие точки
О, А, А'; О, В, В'; О, С, С, попарно различны, так как иначе они
все лежали бы в одной плоскости. Следовательно, любые две из этих
прямых определяют некоторую плоскость. Точки В, С, В', С лежат
в плоскости, определяемой прямыми Ь и с. Следовательно, прямые ВС
и В'С имеют по крайней мере одну общую точку Р. Аналогично,
существует общая точка Q прямых СА и С А' и общая точка R пря-
прямых АВ и А'В'. Эти три точки Р, Q, R лежат одновременно как
в плоскости it, так и в плоскости it'. Но плоскости it и тс', поскольку
они содержатся в Ss, должны пересекаться по некоторой прямой,
которая и будет прямой /. Эта прямая единственна. Действительно,
допустим, что существует прямая /', отличная от прямой / и удовлетво-
удовлетворяющая условиям теоремы. Прямая /' не может принадлежать одно-
одновременно плоскостям « и я'. Допустим, что она не принадлежит
плоскости it. Тогда она пересекает плоскость it в одной точке, через
которую должны проходить прямые АВ, ВС и СА, что невозможно,
так как точки А, В и С неколлинеарны.
Теорема //. Первый случай. Прямая / должна быть линией пере-
пересечения плоскостей it и it'. Так как прямые ВС и В'С имеют общую
точку, точки В, В', С, С линейно зависимы, следовательно, пря-
прямые ВВ' и СС имеют по крайней мере одну общую точку. Если эти
прямые имеют больше чем одну общую точку, то четыре точки В,
В', С, С коллинеарны и должны, следовательно, принадлежать линии
пересечения / плоскостей тс и it'. В последнем случае точки А и А'
не могут принадлежать /. Так как прямые. АВ и А'В' пересекаются
на прямой /, мы получаем, что В = В'. Аналогично, С = С, и потому
в рассматриваемых треугольниках совпадают две пары соответственных
вершин. Но тогда эти треугольники должны быть, очевидно, перспек-
перспективными относительно любой точки прямой, соединяющей оставшуюся
пару вершин.
В случае, когда совпадает одна пара соответственных вершин, напри-
например А и А', прямые ВВ' и СС, пересекаясь, не совпадают и рас-
рассматриваемые треугольники перспективны относительно точки О пере-
пересечения этих прямых.
Наконец, остается случай, когда никакая пара соответственных
вершин не совпадает и, следовательно, каждая из прямых АА', ВВ' ,СС
определена, причем каждая имеет единственную точку пересечения
с каждой из остальных. Пусть О есть точка пересечения прямых ВВ'
и СС. Допустим, что точка О не принадлежит прямой АА'; тогда
точки О, А, А' определяют плоскость, содержащую прямые АА',
§ 6. ТЕОРЕМА ДЕЗАРГА 211
ВВ', СС, и потому те =«'. Но это противоречит предположению.
Следовательно, прямая АА' проходит через точку О, и треуголь-
треугольники ABC и А'В'С перспективны относительно этой точки.
Обратимся теперь ко второму случаю, когда оба треугольника
лежат в одной плоскости. Прежде чем рассматривать общий случай,
мы разберем некоторые возможные здесь частные случаи.
Теорема 1. Если точки во всех трех парах А и А', В и В', С и С
совпадают, то теорема тривиальна. Если совпадают две из них, ска-
скажем В = В' и С = С, то прямая ВС удовлетворяет требованиям тео-
теоремы. Если совпадают точки всего одной пары, скажем А = А', то
прямая," соединяющая эту точку с любой точкой, принадлежащей пря-
прямым ВС и В'С (по крайней мере одна такая точка существует),
•удовлетворяет требованиям теоремы. Далее, если прямые ВС и В'С'
совпадают, тогда как никакая пара соответственных вершин не сов-
совпадает, то ВС и В'С будет единственной парой совпадающих соот-
соответственных сторон. В этом случае прямая АВ пересекает прямую А'В'
точно в одной точке R, прямая С А пересекает прямую С А' точно
в одной точке Q и прямая QR удовлетворяет требованиям тео-
теоремы.
Допустим теперь, что соответственные вершины А и А', В и В', С и С
различны, но точка О совпадает по крайней мере с одной из этих
вершин, скажем с А. Тогда прямая В'С удовлетворяет требованиям
теоремы. Это же верно и в том случае, когда одна из вершин, ска-
скажем В', совпадает с несоответственной вершиной А и с точкой О.
Наконец, если две вершины, например В и С, совпадают, не сов-
совпадая с точкой О, то прямые ВС и В'С должны совпадать, и мы
возвращаемся к уже рассмотренному случаю.
Остается рассмотреть общий случай, когда все семь точек А, В, С,
А', В', С, О различны и соответственные стороны, такие, как ВС
и В'С, также различны. Однако сначала мы рассмотрим различные
частные случаи, которые могут представиться при доказательстве тео-
теоремы II.
Теорема II. Рассмотрим всевозможные случаи совпадения пар
точек Ак А', В и В', Си С'. Если все три пары совпадают, теорема три-
тривиальна. В случае совпадения двух пар, скажем В = В' и С — С
при А Ф А', треугольники перспективны относительно любой точки,
лежащей на прямой АА'. Если совпадают точки только одной пары,
скажем А = А', но В Ф В' и С ф С, то треугольники перспективны
относительно (любой) точки, общей прямым ВВ' и СС. Далее, если
совпадают две соответственные стороны, скажем ВС = В'С, то тре-
треугольники перспективны относительно той точки этой прямой, которая
коллинеарна с точками А и А'.
Допустим далее, что прямая / совпадает с прямой ВС. Тогда пря-
прямая С А' должна проходить через точку С, прямая А'В' — через
точку В, и треугольники перспективны относительно точки А'. Нако-
Наконец, если совпадают две несоответственные стороны, скажем ВС = С А',
14*
212 ?Л- V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
но при этом они не совпадают с /, то С = С, и мы возвращаемся
к уже рассмотренному случаю.
Остается рассмотреть, следовательно, только общий случай этой
теоремы, когда семь прямых АВ, ВС, СА, А'В', ВС, С А' и / все
различны и точки А и А', В и В', С и С' также различны.
Рассмотренные частные случаи иллюстрируют сформулированные
выше теоремы. Приведенные доказательства непосредственно вытекают
из свойств инцидентности. Мы докажем теперь эти две теоремы для
общего случая, но в предположении, что я>2, так что существует
точка, не лежащая в плоскости it = u'.
Теорема I. Общий случай. Так как существует точка, не лежащая
в плоскости те, то существует и некоторая прямая к, проходящая
через точку О и также не лежащая в плоскости я. Возьмем на пря-
прямой А. две различные точки V и V, отличные от точки О. Прямые VV
и АА' пересекаются в точке О и, следовательно, лежат в одной пло-
плоскости. Они не совпадают, так как прямая VV = к не лежит в пло-
плоскости it. Следовательно, прямые VA и VA' имеют единственную
общую точку А*. Так как в рассматриваемом нами общем случае
А Ф А' и прямая VA не лежит в плоскости it, то точка А* не при-
принадлежит плоскости it. Она не может лежать и на прямой к, так как
в этом случае мы имели бы, что А = О или А' = О. Аналогично,
прямые VB и VB' имеют единственную общую точку В*, а пря-
прямые VC и V'C имеют единственную общую точку С*. Точки А*, В*
и С* не лежат в плоскости it и отличны от точек V и V. Если бы
точки А*, В*, С* были линейно зависимы, то V, А*, В*, С*
должны были бы лежать в некоторой плоскости, отличной от it. Эта
плоскость содержала бы точки А, В, С, которые были бы, вопреки
предположению, коллинеарными.
Следовательно, треугольники ABC и А*В*С* перспективны отно-
относительно точки V. Но тогда прямая ВС проходит через точку пере-
. сечения Р прямой В*С* с плоскостью it, прямая СА — через точку Q
пересечения прямой С*А* с плоскостью и и прямая АВ — через
точку пересечения R прямой А*В* с плоскостью it.
Аналогично, треугольники А'В'С и А* В* С* перспективны отно-
относительно точки V, и, следовательно, прямые В'С, &А' и А'В' про-
проходят через точки Р, Q и R соответственно. Но точки Р, Q, R лежат
на прямой / пересечения плоскости it с плоскостью А*В*С*, и следо-
следовательно, прямая / удовлетворяет требованиям теоремы.
Теорема II. Общий случай. Проведем через прямую / плоскость пг,
отличную от плоскости it. Пусть Р, Q, R — точки пересечения соот-
соответственно прямых ВС, СА и АВ с прямой /. Если Q = R, точки А
и А' должны совпадать, что не имеет, места в рассматриваемом общем
случае. Следовательно, три точки Р, Q и R различны, и мы можем
провести через них в плоскости it' три прямые, образующие треуголь-
треугольник А*В*С*. Из теоремы, обратной к теореме Дезарга для трехмер-
трехмерного случая, следует, что треугольники ABC и А*В*С* перспективны
i 6. ТЕОРЕМА ДЕЗАРГА 213
относительно некоторой точки V, а треугольники А'В'С и А*В*С*
перспективны относительно некоторой точки V. Если V=V, то
V= V = А* = В* = С*, в то время как точки А*, В* и С*, по
построению, различны. Далее, ни точка V, ни точка V не лежат
в плоскости «, так как в противном случае плоскости п и %' совпа-
совпадали бы. Следовательно, прямая VV определена и пересекает пло-
плоскость тс во вполне определенной точке О. Так как прямые VA и
V'А' пересекаются в точке А*, то прямые VV и АА' должны пересе-
пересекаться в точке О. Аналогично и прямые ВВ' и СС проходят через
точку О.
Таким образом, мы доказали теорему Дезарга и обратную к ней
теорему, причем использовали только свойства инцидентности во всех
случаях, кроме общего случая для размерности 2. В этом последнем
случае мы сделали дополнительное предположение, что плоскость
содержится в некотором пространстве большего числа измерений. Это
дополнительное предположение легко может быть обосновано для
пространств, определенных над некоторым телом К методом, указан-
указанным в § 2. Для этого случая мы дадим простое алгебраическое доказа-
доказательство теоремы Дезарга; предварительно мы покажем, что, допуская
справедливость теоремы Дезарга для плоскости, мы можем вывести
обратную теорему без дополнительных предположений. При этом
надо рассмотреть лишь общий случай.
Пусть прямые ВС: и В'С пересекаются в точке Р, прямые С А
и С А' — в точке Q, прямые АВ и А'В' — в точке R. В общем слу-
случае тройки точек BB'R и CCQ неколлинеарны. Рассматривая два
треугольника BB'R и CC'Q, мы видим, что они перспективны относи-
относительно точки Р. Прямые &R и CQ пересекаются только в точке А',
прямые RB и QC—только в точке А Следовательно, в силу теоремы
Дезарга для плоскости, прямые ВВ' и СС пересекаются на прямой АА'
и треугольники ABC и А'В'С перспективны.
Мы заключим этот параграф простым алгебраическим доказатель-
доказательством теоремы I, справедливым в тех случаях, когда точка О отлична
от вершин по крайней мере одного из рассматриваемых треугольников.
Пусть это будет треугольник ABC. Воспользуемся обозначениями,
введенными в § 4.
• Так как точка А' принадлежит прямой ОА и, по предположению,
отлична от точки А, то в теле К можно найти такие множители а,
Р, f для точек А', В', С, что
Тогда точка
Р*=В' — С' = Вр — Cf
принадлежит прямым В'С и ВС одновременно.
214 ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Аналогично, точка
• Q = С' — А' = Су — Аа
принадлежит прямым С А' и СА, а точка
R = A' — B' = Aa — В$
принадлежит прямым А'В' и АВ. Но
Следовательно, точки Р, Qn R коллинеарны, чем и доказана теорема.
§ 7. Основные построения
Мы рассмотрим теперь некоторые построения, важные для следую-
следующей главы. Они выполнимы в любом Рп{К) при «^-2.
Пусть О и U—две различные точки пространства Р^(К).Ва&ль-
нейшем мы будем считать эти две точки фиксированными. Определим
отличную от точек О и U точку Е, удовлетворяющую условию
Е = O-\-U. Пусть А и В — две точки прямой OU, отличные от U,
и пусть их множители выбраны так, что
А = О + Ш, В = О + Щ.
Мы покажем теперь, как можно построить точки
В обоих случаях само построение мы будем выделять курсивом и
затем обосновывать.
I. Построение O-\-U(а-^-$) (лист I). В произвольной пло~
скости, проходящей через прямую OU, возьмем три прямые а% Ь, и,
проходящие соответственно через точки А, В и U, отличные от
прямой OU и не проходящие через одну точку. Пусть М — точка
пересечения прямых и и а, В' — точка пересечения прямых и и Ь,
А' — точка пересечения прямых ОВ' и a, L — точка пересечения
прямых UА' и Ь. Тогда точкой пересечения Р прямых LM и OU
будет О + [/(ос + Р).
По свойству V инцидентности, если it есть произвольная плоскость,
проходящая через прямую OU, то в плоскости и существует точка X,
неколлинеарная с точками О и U. Тогда точка Y= U-\-X, отличная
от X, не лежит ни на прямой OU, ни на прямой АХ. Следовательно,
АХ, BY и UX—три различные прямые плоскости тг, проходящие
соответственно через точки А, -В, U, отличные от прямой OU и не
проходящие все через одну точку. Таким образом, первую часть кон-
конструкции, т. е. выбор прямых a, b и а, можно осуществить 1). Точки М
') Это было доказано в § 6 на основании только свойств инцидентности.
Здесь мы просто выбираем точку Y на прямой UX.
О=А=А'
О-В А-Р
216 ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
и В/ определены. Точно так же определена и точка А'. Действительно,
если прямая ОВ' совпадает с прямой а, то OB' = AM = с. Но тогда
твиси А, М, О, В' должны быть коллинеарны, т. е. прямая MB'
даням проходить через точку О, и мы получаем, вопреки предполо-
предположению, что и = Of/. Аналогично, определена и точка L. Точки L и М
могут совпадать только в том случае, когда обе они совпадают с точ-
точкой пересечения прямых а и Ь. Но точка М лежит на прямой и,
а прямая и не проходит через точку пересечения прямых а и Ь.
Следовательно, прямая LM определена. Эта прямая не может совпадать
с прямой О U, так как в этом случае точка М должна была бы сов-
совпадать с точкой А и мы имели бы u = OU. Следовательно, будет
определена и точка Р пересечения прямых LM и OU. Мы покажем
теперь, что Р — О -\- U(a -f Р).
Это очевидно, если одна или обе из точек А и В совпадают
с точкой О, и мы можем поэтому ограничиться рассмотрением случаев,
представленных на первых двух фигурах. В этих случаях точка А',
как легко показать, будет отлична от точек А и М. Следовательно,
в равенстве
выражающем коллинеарность точек М, А' и А, множители \ и v
отличны от нуля, и мы можем выбрать множители точек А и М так,
чтобы было
М = А -\- А > = О + Ua -\- А'р.
Точка М — Ua = О -\- А'р лежит на прямой MU и на прямой О А'.
Она совпадает, следовательно, с точкой В', т. е.
Но тогда В' — В = О-(-Л> — О — Щ = А'у.— ?/р, т. е. точка!,
принадлежащая прямым A'U и В'В, имеет вид
Следовательно,
М — L =
есть точка, лежащая на прямых LM и OU, т. е. точка Р. Отсюда
P
+ ( + P)
II. Построение O-\-Ua$ (фиг. 1). В произвольной плоскости,
проходящей через прямую OEU, возьмем три прямые а, Ь, и,
проходящие соответственно через точки А, В и U, отличные от
прямой OU и не проходящие через одну точку. Пусть Р — точка
пересечения прямых и и a, Y — точка пересечения прямых и и Ь,
X—точка пересеченая прямых EY и a, Q — точка пересечения
прямых ОХ и Ь. Тогда прямая PQ пересекает прямую OU в точке
§ 7. ОСНОВНЫЕ ПОСТРОЕНИЯ 217
По определению, точка Е = О -\- U отлична от точек О и U.
Выбор прямых а, Ь и и, как и в построении I, возможен. Точки Р
и Y различны и не лежат на прямой OU. Точка X пересечения пря-
прямых EY и а определена. Действительно, если EY — a, то точка Y
должна совпадать с точкой пересечения прямых а и Ь. Но точка Y
лежит на прямой и, а прямые a, b
и и не проходят через одну точ-
точку. Далее, точка X отлична от
точки О, ибо точка X лежит
на прямой EY, не совпадающей
с прямой OU, так как точка Y
не лежит на прямой OU. Сле-
Следовательно, прямая ОХ опреде-
определена. Точка Q определена как
точка пересечения прямых ОХ
и Ь. Действительно, если ОХ = ^^^g^
= Ь, то мы должны иметь пре- . 1
жде всего В = О. В этом случае и г' "
точки X и Y должны лежать на прямой Ь, и так как прямая XY пере-
пересекает прямую OU в точке Е, а прямая b отлична от QU, то мы полу-
получаем, что й = В = О, вопреки предположению. Следовательно, точка Q
определена. Если бы, далее, точка Р совпадала с точкой Q, то она
была бы точкой пересечения прямых а и Ь. Но так как точка Р лежит
на прямой и, то это противоречит тому, что прямые a, b и и не про-
проходят через одну точку. Следовательно, прямая PQ определена, а так
как точка Р не лежит на прямой OU, прямая PQ пересекает прямую
OU во вполне определенной точке R. Докажем, что R — О -\-Uafi
(на листе II показаны возможные частные случаи).
Доказательство снова тривиально для тех случаев, когда одна из
точек А или В совпадает с О или Е. Поэтому мы можем ограни-
ограничиться случаем, когда точки А и В отличны от О и Я. Если точка
А не совпадает с Е, то точки Р, А и X попарно различны. Действи-
Действительно, Р лежит на прямой и и не совпадает с U. Следовательно, Р
не принадлежит прямой OU и потому не может совпасть с точкой А.
Если Р = Х, то точки Е, Р и Y коллинеарны. Но прямая PY сов-
совпадает с прямой и, не содержащей точки Е, что приводит к про-
противоречию. Наконец, так как точка X лежит на прямых а и EY, то
она может совпасть с точкой А, лишь если А = Е, что противоречит
сделанному предположению. Следовательно, в соотношении
выражающем коллинеарность точек Р, А и X, все множители A, jj-, v
отличны от нуля.
Если точка В не совпадает с точкой О, то [5 Ф 0 и мы можем
выбрать множители точек Р и X так, что
§ 8. УСЛОВИЕ КОММУТАТИВНОСТИ
219
Тогда
т. е. эта точка лежит на прямых PU и EX. Следовательно,
Поэтому точка
у—B =
лежит на прямых YB и Л'О, т. е. совпадает с Q. Наконец, точка
Я —Q = i4p + A"—Л"—О(Р—1) = О+?/«Р
есть точка пересечения прямых PQ и О?/, т. е. R. Таким образом,
§ 8. Условие коммутативности тела. Теорема Паппа
Конструкция, предложенная в последнем параграфе для построения
точки R — О -j- ?/<*р, не симметрична относительно .Д и В; если
ocj3 =? ^a, то при перестановке этих двух точек получается некоторая
точка R' — О -\- Щек, отличная от точки R. Во всех рассмотренных
в последнем параграфе случаях, за исключением первого „общего"
случая, равенство ар = (За выполняется, так как там либо a = р,
либо один или оба из элементов a, p равны нулю или единице.
Ограничимся поэтому рассмотрением первого случая.
Фиг. 2.
Пусть (фиг. 2) прямая OY, как и на фиг. 1, пересекает прямую
а в точке Я', прямая XU пересекает прямую b в точке Q'. Тогда
прямая FQ' пересекает прямую OU в точке R'= О-\- ?/[За>Хледо-
вательно, условие равенства ap = fk эквивалентно тому условию, что
две коллинеарные тройки точек Р'', Я, X и Q, Q', К всегда таковы, что
точка пересечения О прямых P'Y и QX и точка пересечения U
220
ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
прямых XQ' и YP коллинеарны с точкой пересечения прямых PQ
и P'Q'. Мы можем выразить это короче, сказав, что точки пересе-
пересечения прямых, попарно соединяю-
соединяющих накрест точки двух троек
Р, Р, X и Q', Q, Y, коллинеарны.
Изменив обозначения, рассмот-
рассмотрим это предложение само по
У себе. Пусть (фиг. 3) / и /' — две
компланарные прямые, А, В, С и
А', В', С— две тройки точек, лежащих соответственно на прямых /
и /'. Обозначим через Р, Q и R точки пересечения прямых ВС и
В'С, СА' и С А, АВ' и А'В, накрест соединяющих точки этих троек.
Можно непосредственно доказать, что когда точки одной из этих
троек не все различны, точки Р, Q, R (если они определены)
коллинеарны. С другой стороны, если одна или больше из точек
Ф и г. 3.
Р, Q, R не определены, то существует по крайней мере одна прямая,
проходящая через общую точку Р прямых ВС' и В'С, общую точку
Q прямых СА' и С'А и общую точку R прямых АВ' и А'В. Наше
предложение может быть доказано непосредственно также в том
случае, когда какая-нибудь одна из шести точек А, В, С, А', В', С
совпадает с точкой О пересечения прямых / и /'. Заметим, далее,
что если точки Р, Q, R не все различны, то и точки А, В, С, А',
В', С не могут быть все различными и отличными от точки О. Если,
например, Q = R и А ф А', мы получаем, что В = С, В' — С или
А = В = С. В первом случае точка Р не определена, а во втором
R
§ 8. УСЛОВИЕ КОММУТАТИВНОСТИ 21
Если А, В, С и А', В', С— две тройки точек на двух компланар-
компланарных прямых / и /' и если точки пересечения прямых, соединяющих их
накрест, коллинеарны, то мы будем говорить, что справедлива тео-
теорема Паппа. Как мы видели, теорема Паппа всегда справедлива
в тех случаях, когда одна из двух рассматриваемых троек точек
содержит две совпадающие точки или точку, совпадающую с точкой
пересечения О прямых / и /'. Поэтому нам остается рассмотреть
только тот случай, когда ни одно из указанных специальных рас-
расположений не имеет места.
Можно доказать теорему Паппа для случая, когда прямые АА',
ВВ', СС имеют общую точку. Применяя теорему Дезарга к тре-
треугольникам А'ВС и АВ'С, мы получим, что точки О, Q, R кол-
коллинеарны. Аналогично, рассматривая треугольники АВ'С и А'ВС,
мы получаем, что точки Р, О, R коллинеарны. Так как, по пред-
предположению, это тройки попарно различных точек, то четыре точки
Р, Q, R, О коллинеарны.
С другой стороны, если основное тело К некоммутативно, тео-
теорема Паппа не может быть справедливой для всех троек точек. Дей-
Действительно, в этом случае должна существовать пара элементов а и
[3 тела К, для которых а{3 Ф [За. Выполним предложенную выше кон-
конструкцию (фиг. 2) для построения точек R — О~\- ?/оф и /?'=O-f Ща.
Мы видели, что если теорема Паппа верна для троек точек РР'Х
и Q'QY, то R = R' и, следовательно, af} =± [За, вопреки предположе-
предположению. Отсюда мы заключаем, что если теорема Паппа универсально
справедлива в пространстве Р„(К), то К является полем.
Покажем теперь, что и обратно, если основное тело К коммута-
коммутативно, то теорема Паппа универсально справедлива в Рп(К)- Это
можно сделать, показав, что любые две тройки точек могут быть
выбраны в качестве Р, Р', X и Q', Q, Y (фиг. 2). Однако мы приве-
приведем здесь более простое доказательство (см. фиг. 3). Как показано
выше, необходимо рассмотреть только тот случай, в котором точки
А, В, С и А', В', С попарно различны и отличны от точки О пере-
пересечения прямых / и /'. Обозначим точки пересечения соединяющих их
накрест прямых через Р, Q, R. Тогда, так как указанные выше
специальные случаи исключены, точки Р, Q, R попарно различны.
Если прямая QR проходит через точку О, то теорема, обратная к
теореме Дезарга, показывает, что треугольники А'ВС и АВ'С пер-
перспективны. Следовательно, как и выше, получаем, что для троек
точек ABC и А'В'С выполняется теорема Паппа. Предположим, что
прямая QR не проходит через точку О и пересекает прямую /
в точке X, а прямую /' в точке У. Тогда можно непосредственно
доказать, что так как точки А, В, С различны и так как точки А',
В', С также различны, то точка X отлична от точек первой тройки
и точка Y' отлична от точек второй тройки. Можно, следовательно,
выбрать множители точек О, X, Y' так, чтобы выполнялись
222 гл. V. Алгебраическое определение
равенства
+ и В' —
Так как точка R принадлежит прямым АВ' и XY', то
R = A — B'=zX—Y'.
Если теперь
В = О-\-Х% А' = О + !"«',
то прямая А'В пересекает прямую XY' в точке Х$—Y'a'. Но так
как это есть точка R, то ос' = ,8.
Далее, если
С^О + Хч и C = O+Y'i',
то прямая СЛ' пересекает прямую XY' в точке Q = Xf — Y'a'.
Но С А пересекает XY' в точке X— К'-у'. Так как это точка Q,
то if'if = а'.
Рассмотрим теперь точку Р пересечения прямых ВС и В'С. Пря-
Прямая ВС пересекает прямую XY' в точке Xar—Y'i\ а прямая В'С
пересекает прямую XY' в точке Х^ — Y'. Точка Р лежит на пря-
прямой XY'. Следовательно, теорема Паппа справедлива в том и только
в том случае, если
т. е. тогда и только тогда, когда
ТТ' = «' = Tf'if.
Это всегда имеет место, если тело К коммутативно. Мы получили
следующий результат:
Теорема I. Теорема Паппа универсально справедлива в Р\(К)
тогда и только тогда, когда тело К коммутативно.
Существуют, конечно, и другие геометрические теоремы, эквива-
эквивалентные условию коммутативности тела К. Но так как теорема Паппа
является одной из простейших среди них и так как она традиционно
принимается в качестве геометрического эквивалента условия коммута-
коммутативности, мы и оставляем ее в качестве геометрического критерия.
§ 9. Некоторые конечные геометрии
Конструкции, предложенные в § 7, были возможны благодаря тому,
что мы могли провести через заданную точку достаточное число раз-
различных прямых, чтобы сделать точки пересечения некоторых прямых
определенными. Если основное тело К содержит бесконечное мно-
множество элементов, то мы можем через заданную точку О провести
любое число прямых. Действительно, в каждой плоскости, проходящей
через О, существуют две такие точки Л" и У, что О, X и Y линейно
независимы. Из бесконечного множества прямых, соединяющих О
§ 9. КОНЕЧНЫЕ ГЕОМЕТРИЙ
223
с точками X-\-Ya, где а пробегает все элементы тела К, мы всегда
можем выбрать конечное число прямых, удовлетворяющих нашим тре-
требованиям.
Если К— конечное поле, содержащее k элементов (включая 0 и 1),
то прямая XY Содержит k точек Х-\- Yen (где а — элемент поля К)
и точку Y. Через точку О мы можем провести тогда точно k -f-1
прямых (k ~^>2), так что через точку в данной плоскости мы заве-
заведомо можем провести три
различные прямые. Как мы ви-
видели в § 7, этого достаточно
для осуществления предложен-
предложенной там конструкции.
Плоскость, проходящая че-
через точку О, содержит по край-
крайней мере семь точек, а именно
(фиг. 4)
О,Х, Y, О + Х, O-\-Y,
X+Y, О + Л-+Г.
Если К есть поле вычетов по
модулю 2, т. е. поле, состоя-
состоящее только из элементов 0 и
1, то этими семью точками
исчерпываются все точки пло-
плоскости. В этом случае три точки О-\-Х, X-\-Y, O-\-Y колли-
иеарны, так как
О + *+ЛГ + Г + О + К := 2 (О + Л" + >0 = ° •
В следующей главе мы вернемся к этой конечной геометрии из семи
точек.
Если поле К состоит только из элементов 0 и 1, то число точек
пространства Рп(К) равно 2пfl—1. Действительно, в данной допу-
допустимой системе координат это такие точки (ос0 ая), где а4 при-
принимают независимо друг от друга значения 0 и 1. Исключен только
тот случай, когда каждое а{ равно 0. Число точек в Р1п(К) будет тем
же самым, так как в рассматриваемом случае Ргп (К) = Ргп (К).
Таким же образом можно показать, что если К есть поле выче-
вычетов по модулю р, т. е. состоит только из элементов
0, 1 р— 1,
Фиг. 4.
то число точек пространства Prn{K) =
pn+l — \
р — \ '
равно
224 ГЛ. V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
§10. r-кратные пространства
Из многих возможных обобщений пространства Ргп (К) только одно
будет использовано в этой книге. Основное тело К предположим
здесь коммутативным.
Рассмотрим г числовых проективных пространств
PN*t{K) (i=l г).
Пусть
(хЪ x*nt) (i= I г)
— координаты их точек в допустимых системах координат. Упоря-
Упорядоченное множество этих точек
X = (Хо, . . ., ХПо Xq, . . ., Хп%, . . . , Хо, . . ., хнг)-
называется точкой r-кратного числового проективного простран-
пространства PNKl...nr(K).
¦Допустимые преобразования пространства PNn> ... п (К) опреде-
определяются проективными преобразованиями пространств PNn (К),
P{
r
Рассмотрим множество S элементов, которые можно поставить во-
взаимно однозначное соответствие с точками пространства PNni ... п (К).
Это соответствие устанавливает в S некоторую систему координат.
Допустимые преобразования пространства PNHi ... п (К) приводят к но-
новым соответствиям и, следовательно, к новым системам координат в S.
Элементы множества S, рассматриваемые вместе с этими допустимыми
системами координат, образуют r-кратное проективное простран-
пространство Рщ ... п (К)- Таким образом, Рп, ... я (К) есть просто некото-
некоторое множество, поставленное во взаимно однозначное соответствие со
всеми множествами точек (Av ..., Д.), где Ах, ..., Аг — произволь-
произвольные точки пространств P4i (К), ..., Рп (К), причем системы коорди-
координат в Рщ ... „ (К) получаются объединением допустимых систем коор-
координат в каждом из этих пространств.
ГЛАВА VI
СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ПРОЕКТИВНОГО
ПРОСТРАНСТВА
§ 1. Свойства инцидентности
В гл. V мы определили проективное пространство размерности я
над телом К и получили (см. гл. V, § 4) некоторые теоремы, назван-
названные нами свойствами инцидентности. Цель настоящей главы — вы-
выяснить, в какой мере эти свойства инцидентности определяют проек-
проективное пространство.
Прежде всего мы постулируем существование некоторых объектов,
которые будем называть линейными подпространствами размерностей О,
1, 2, ... (или точками, прямыми, плоскостями, ...), и некоторого
отношения, которое может существовать между линейным подпро-
подпространством Sp размерности р и линейным подпространством Sq раз-
размерности q. Если подпространства Sp и 6L связаны этим отношением,
мы будем говорить, что Sp содержится в Sq (или что Sp лежит в Sq),
и писать
Можно записать это соотношение и в виде
Sq => Sp;
оно. тогда читается так: подпространство Sq содержит Sp.
Точки Ро Рр называются линейно зависимыми, если суще-
существует такое линейное подпространство Sq размерности q < p, что
Pi^Sq 0 = 0, .... р).
В противном случае эти точки называются линейно независимыми.
Мы постулируем следующие свойства отношения инцидентности
с (ср. гл. V, § 4):
I. Если Shc Sk и Sk с Sh, то Sk = Sh.
II. Если Sp с Sq и Sq с Sr, то Sp с Sr..
III. Каждая прямая содержит по крайней мере три различные точки.
IV. Для любых р-f-l линейно независимых точек существует по
крайней мере одно содержащее их линейное подпространство размер-
размерности р.
V. Каждое линейное подпространство размерности р содержит
по крайней мере одно множество из р -j- 1 линейно независимых точек.
VI. Если р -\~ 1 линейно независимых точек Ро, ..., Рр содер-
содержатся в некотором Sq, то каждое содержащее эти точки Sp содер-
содержится в этом Sq.
15 Зак. 1230. В. Ходж и Д. Пидо
226 гл> VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
VII. Если р-\-\ точек Ро Рр подпространства Sp линейно
независимы, как и q-\-l точек Q0,...,Qq подпространства Sq,
а Р + Я + 2 точек Ро Рр, Qo, ..., Qq линейно зависимы, то
существует по крайней мере одна точка R, содержащаяся в Sp и Sg
одновременно.
VIII. Существует такое целое число «, что имеется по крайней
мере одно множество из п -\- 1 линейно независимых точек, в то время
как всякие т точек при от>я-[-1 линейно зависимы.
Совместность сформулированных постулатов доказывается примером
проективного пространства, определенного в предыдущей главе.
Мы получим теперь некоторые результаты, касающиеся отноше-
отношения с, линейной зависимости и, позднее, пересечений линейных под-
подпространств.
A) Каждое линейное подпространство Sh содержится в самом себе.
Действительно, в силу свойства V, Sh содержит h -\~ 1 линейно не-
независимых точек. В силу свойства VI, каждое подпространство 5^,
содержащее эти точки, содержится в Sh. Полагая 5а = 5а, получаем
требуемый результат.
B) Если Sp с Sg, то p^.q. Действительно, в силу свойства V,
в Sp существует р-\- 1 линейно независимых точек. В силу свойства II,
они содержатся в Sq. При q < p эти точки были бы линейно зави-
зависимы. Следовательно, p^Cq.
C) Если Sp с Sp, то Sp = S'p. Действительно, пусть Ро, .. ., Рр —
система р -\- 1 линейно независимых точек подпространства Sp; в силу
свойства II, они являются линейно независимыми точками подпростран-
подпространства S'p. Следовательно, в силу свойства VI, S'p с Sp. Отсюда с по-
помощью свойства I получаем, что 5р = 5^,.
Следств ие. Подпространство Sp, содержащее данные р-\-1
линейно независимых точек, определено однозначно и определяется
любыми своими р-{-1 линейно независимыми точками.
Назовем любое множество из р-\~1 линейно независимых точек
подпространства Sp базисом этого подпространства.
D) Пусть рЦ-1 точек Ро, ..., Рр будут линейно независимы-.
Если точки Ро Р8 при s < р линейно зависимы, то точки Ро, ..., Р8
содержатся в некотором подпространстве St, где t < s. Пусть точки
Qo Qt образуют базис этого подпространства. Рассмотрим q-\- 1 =
==р — S + /+1 точек Qo Qt, P8+1 Рр. Если эти точки
линейно независимы, они определяют некоторое подпространство Sq.
Во всяком случае, эти точки содержатся в некотором подпростран-
подпространстве Sr, где г < q < р. Так как подпространство Sr содержит точки
Qo> • • •» Qt> то оно» в СИЛУ свойства VI, содержит St. Следовательно,
ввиду свойства II, подпространство 5Г содержит точки Ро, .... Ps.
Кроме того, Sr содержит точки Ps+1 Pp. Таким образом, все
точки Ро, ..., Рр содержатся в подпространстве 5Г(/• <р). Следова-
Следовательно, эти точки линейно зависимы. Полученное противоречие позво-
§ 1. Свойства ИйцИдёнтнобтй
ляет высказать утверждение, что точки любого подмножества ли-
линейно независимого множества точек линейно независимы.
Следствие. Линейно независимые точки попарно различны.
E) Пусть Ро Р„—базис подпространства 5^, Qq, ..., Qq—
базис подпространства Sq. Если подпространства Sp и 8\ не имеют
общих точек, то из свойства VII следует, что точки Яо Рр,
Qo, ..., Qq линейно независимы. Допустим теперь, что подпростран-
подпространства Sp и Sq имеют по крайней мере одну общую точку. Рассмотрим
множество всех общих точек этих подпространств и обозначим через г
такое целое число (О О <!«), что среди точек, содержащихся в под-
подпространствах Sp и Sq одновременно, найдется по крайней мере одно
множество из г -\- 1 линейно независимых точек Ао, .... Аг, тогда.
как любые т таких точек (m>r-j-l) линейно зависимы. Точки Ао Аг
определяют некоторое подпространство Sr. Так как At с Sp
(i = 0 г), то из свойства VI следует, что Sr с Sp. Анало-
Аналогично Sr с Sq. Следовательно, г < min (р, q). Далее, если точка R
содержится в 5r> i?cSrc Sp, то, ввиду свойства II, R с Sp. Анало-
Аналогично R^Sq. С другой стороны, если точка В содержится в Sp и
Sq одновременно, то точки Ао Аг, В линейно зависимы и, сле-
следовательно, содержатся в некотором подпространстве St {t^r). Но
так как /^ с St(i — 0 г), то и Sr с St и, следовательно, г <Л
Таким образом, t = r и Sr = St. Мы получили, что точка, общие
подпространствам Sp и Sq, составляют некоторое линейное под-
подпространство Sr. Пусть теперь St — любое подпространство, содер-
содержащееся в Sp и Sq одновременно, и Со, ..., С( — базис этого под-
подпространства. Тогда, так как точки этого базиса содержатся в Sp и
Sq, а следовательно, и в Sr, то само St содержится в Sr.
F) Докажем предложение, обратное к постулату VII: если под-
подпространства Sp и Sq имеют по крайней мере одну общую точку (и,
следовательно, содержат все точки некоторого подпространства Sr),
то p-]-q-\~2 точек Ро, ..., Рр, Qo, ..., Qq линейно зависимы. Вос-
Воспользуемся обозначениями, введенными в E). Если р > г, то в Sp
найдется точка, не содержащаяся в Sr, так как в противном случае
мы имели бы Sp с Sr и, следовательно, р <; г. Обозначим через Вг+1
точку подпространства Sp, не содержащуюся в Sr. Тогда точки Ао
Ar, Br+i должны быть линейно независимыми, так как в противном
случае мы могли бы, как и выше, показать, что точка Вг+1 содер-
содержится в Sr. Таким образом точки Ао, ..., Аг, Вг+1 определяют не-
некоторое подпространство Sr+V содержащееся в Sp. Если р^>г-\-\,
то мы можем таким же образом найти в Sp другую точку, скажем Вг+2,
так что точки Ао Аг, Вг+1, 5г+2 будут линейно независимыми.
Продолжая таким же образом, мы получим для подпространства Sp
некоторый базис Ао, ..., Аг, Вг+1 Вр, в котором г-\-\ первых
точек составляют базис подпространства Sr. Аналогичным образом мы
можем получить некоторый базис Ао Аг, Сг+1, .... Cq подпро-
подпространства Sq. Если точки Ао, ..., Аг, Вг+1 Вр, Сг+1 Сд
15*
f Л. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
линейно независимы, то они определяют некоторое линейное подпро-
подпространство размерности p-\-q — г. Во всяком случае, эти точки опре-
определяют некоторое подпространство St (t ^ р -\- q — г). Так как это St
содержит точки Ао, .... Аг, Вг+1 Bq, то оно содержит все Sp
и, следовательно, ввиду свойства II, оно содержит точки Ро, ..., Рр.
Точно так же оно содержит и точки QQ, ..., Qq. Таким образом, в St
содержатся все точки Ро, .... Рр, Qo, ..., Qq (t*Cp-\-q—r<p^\-q-\-l).
Значит, эти точки линейно зависимы.
G) Мы докажем теперь, что на самом деле точки Ао, ..., Аг,
Вг+1, ..., Вр, Сг+1, ..., Cq линейно независимы. Предположим, что
они линейно зависимы. В силу выбора точек Ао А,.,
Вг+1, .... Вр, эти точки линейно независимы и определяют некото-
некоторое подпространство Sp. Точки Cr+1 Cq образуют подмноже-
подмножество множества линейно независимых точек. В силу D), эти точки
линейно независимы и определяют, следовательно, некоторое подпро-
подпространство Sq_r_v Ввиду свойства VII, подпространства Sp и 5в_г_х
имеют общую точку, скажем /?. Так как Ct ? Sq (/ = /- —j— 1 q),
то 5g_r_1 ? Sq. Следовательно, точка R содержится в Sq и в Sp
одновременно. В силу E), она содержится в Sr. Так как подпро-
подпространства Sr и Sq_r_t имеют общую точку R, то точки \, ..., Аг,
Сг+1, ..., Cq должны, в силу F), быть линейно зависимыми. Это
противоречие доказывает линейную независимость точек Ао А,.,
Вг+1, .... Вр, Cr+1 Cq. Следовательно, эти точки определяют
некоторое подпространство Sp+q_r. Полученный результат остается
в силе и в том случае, когда подпространства Sp и Sq не имеют
общих точек, если, как в начале п. E), положить г = — 1. Ясно, что
Sp ? Sp+q_r kSjC Sp+q_r. С другой стороны, если Sk есть любое
линейное пространство, такое, что 5рс5к и Sq ? Sk, то все точки
Ао Аг, Зг+1 Вр, Cr+1 Cq содержатся в Sk. Следова-
Следовательно, Sp+q_rcz Sk. Таким образом, подпространство Sp+q_r содер-
содержится в каждом линейном подпространстве, содержащем Sp и Sq
одновременно. Если мы назовем это подпространство суммой, а под-
подпространство Sr — пересечением подпространств Sp и Sq, то мы по-
получим следующий результат:
Теорема I. Размерность г пересечения двух линейных под-
подпространств Sp и Sq связана с размерностью t их суммы соот-
соотношением
В силу свойства VIII, существуют п -\-1 линейно независимых
точек. Пусть это будут точки Ао Ап. Они определяют неко-
некоторое Sn. Если R есть произвольная точка, отличная от этих точек,
то, снова используя свойство VIII, получаем, что точки Ло, ...; Ап,
R линейно зависимы и, следовательно, содержатся в некотором
Sm (m < я). Так как Л(с5мA = 0, .... «), то Sn ? Sm и, в силу B),
п-^т. Следовательно, Sm = Sn, т. е. все точки (так же, как и все
§ 1. СВОЙСТВА ИНЦИДЕНТНОСТИ 229
прямые, плоскости ,...) содержатся в Sn. Совокупность всех точек,
прямых, плоскостей , ..., содержащихся в Sn, называется инцидент-
постным пространством размерности п.
. Совокупность п -\- 1 линейно независимых точек пространства Sn
называется симплексом. Пусть точки Ао, ..., Ап образуют симплекс.
Тогда точки Ао Л»-!, А{+1, .... Ап линейно независимы и
определяют некоторое подпространство (или гиперплоскость) 5Л_1=24,
которое мы будем называть гранью этого симплекса.
Имея в виду дальнейшие применения (§ 6), мы докажем, что
существует некоторая точка Е, не лежащая ни на одной из граней
симплекса Ао Ап. Доказательство проведем индукцией по я.
При п = 1 это непосредственно следует из свойства III. Предполо-
Предположим, что мы доказали эту теорему для пространства размерности
я—1. Тогда, в частности, она будет верна для Е°, т. е. для грани
симплекса, не содержащей точку Ао. Пусть Е12 ... п-—точка грани Е°,
не лежащая ни на одной из граней симплекса Alt ..., Ап этого под-
подпространства. Так как любая точка, содержащаяся в ?° и ?' (i > 0)
одновременно, лежит на некоторой -грани этого симплекса, то точка
^12 ••• п не содержится ни в одной ?*(i>0). Точка Ао не содер-
содержится в Е°, поэтому точки Ао и Et<, ... п должны быть линейно
независимыми. Они определяют, следовательно, некоторую прямую /0.
Эта прямая не может содержаться ни в Ео, так как точка Ао не
лежит в Е°, ни в E'(i= 1, ..., я), так как точка Еп ... п не лежит
в Е*. Эта прямая пересекает грани Е*(г = О и) во вполне опре-
определенных точках Еп ... ,„ Ао, ..., Ао. Далее, прямая /0 содержит
по крайней мере одну точку Е, отличную от точек Ао и Еп...п.
Эта точка и удовлетворяет нашим требованиям.
Пусть теперь /0 . .. /„ — любая перестановка чисел 0, ..., п.
Рассмотрим точки А( , ..., А{ (k^> 0). Эти точки линейно неза-
независимы. Следовательно, если бы точки Aik At , Е были ли-
линейно зависимыми, то точка Е содержалась бы в подпространстве,
определяемом точками А{ Л» , и, значит, в ?*\ что невоз-
невозможно. Следовательно, рассматриваемые п — k -\- 1 точек определяют
некоторое 5n_fc. Далее, точки А^, ..., Aik определяют некоторое Sk,
а так как суммой Sk и Sn_k является все пространство Sn, то под-
подпространства Sk и Sn-k имеют в точности одну общую точку. Обо-
Обозначим эту точку через Я<„... <fc. Точки Eio... <fc, Aik+1,..., Aln
линейно независимы.
Если бы точка Et ... { содержалась в одной из граней сим-
симплекса Ai А( подпространства Sk, скажем в грани, опреде-
о к
ляемой точками Aiv .. ., Аг то Sn_k должно было бы содержаться
в подпространстве, определяемом точками Ait А{ , Аг Аг
т. е. в ?4 Следовательно, подпространство ?*" содержало бы точку Е.
230 ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Это противоречие доказывает, что точка 2?fd...<fc не лежит ни в одном
из (k — 1)-мерных подпространств, определяемых точками А^ Аг ._
Atj^,....Aik. ' -
Мы получаем таким способом 2n+1 — 1 точек Е^...^, включая
точки Ei = Ai и Ео... п = Е. Необходимо отметить, что каждое
инцидентностное пространство размерности п содержит по крайней
мере одно такое множество точек, причем все эти точки различны.
Рассмотрим теперь подпространство Sk, определяемое точками
Ац Ai%. Используем точку Е^...{ , не лежащую ни на одной
из граней симплекса Aia, .... Ait чтобы построить точки Ejo...j ,
где у0 j8 есть любое подмножество множества индексов i0 ik.
Расположим индексы 10 ik так, что (Jo Л) = ('о '«)•
Тогда точка Ejo...j будет точкой пересечения подпространства, опре-
определяемого точками А^, ..., Ai6, с подпространством, определяемым точ-
точками Е^... tк, А( , ..., At . Но это последнее является пересечением
подпространства, определяемого точками Aiu Аи, т. е. под-
подпространства Sk, с подпространством, определяемым точками Е,
\+х Ain. Отсюда следует, что ?}„...^ = Eju ...ig) так что
этим путем мы не получаем никаких новых точек.
В дальнейшем мы всегда будем предполагать, что « > 1. Случай
п = 1 не представляет интереса. В самом деле, все, что мы можем
вывести из свойств инцидентности при я—1, состоит в том, что
существуют по крайней мере три точки и что две точки линейно
независимы тогда и только тогда, когда они различны.
§ 2. Теорема Дезарга
Теорема Дезарга — основная в настоящей главе. Так как доказа-
доказательство этой теоремы и теоремы, обратной к ней, при п > 2 было
получено в § 6 гл. V на основании только свойств инцидентности,
то мы можем считать эти теоремы для случая п > 2 доказанными.
Теорема I. Если ABC и А'В'С—-два перспективных тре-
треугольника, то точки пересечения прямых АВ и А'В', ВС и В'С,
С А и С А' лежат на одной прямой I.
Теорема II. Если ABC и А'В'С — два треугольника, для
которых точки пересечения прямых АВ и А'В', ВС и В'С, С А
и С А' лежат на одной прямой I, то эти треугольники перспек-
перспективны.
Мы будем называть теоремы I и II теоремой Дезарга и теоремой,
обратной к теореме Дезарга.
При « = 2 эти теоремы были выведены из свойств инцидентности
лишь в некоторых частных "случаях. Хотя связь между предложен-
предложенным в § 6 гл. V алгебраическим доказательством и свойствами инци-
§ 2. ТЕОРЕМА ДЕЗАРГА . 231
дентности сразу не ясна, однако a priori мы не имеем оснований пола-
полагать, что при п = 2 эти теоремы не вытекают из свойств инцидент-
инцидентности. Тем не менее, мы укажем сейчас такую совокупность точек
и прямых, для которых будут справедливы свойства инцидентности
при п = 2, но для которых не будет верна теорема Дезарга. Этот
пример построен Мультоном.
Предварительно рассмотрим евклидову плоскость в прямоугольных
декартовых координатах (х, у) и некоторое множество кривых, кото-
которые мы назовем /.-кривыми. Эти Л-кривые определяются уравнением
т)(х — а),
где т, а — действительные числа, а функция f(y, m) определена
условиями: .
(I) если от<0, то f(y, m)=\;
(II) если т > О, то f(y, т) = 1 при у < О,
f(y, т) = 2" при у > 0.
Условимся также считать, что при т = со прямая х = а является
/.-кривой и что при от = 0, а = оо прямая у = Ь также является
/.-кривой.
Очевидно, что каждая /.-кривая вполне определена своей частью,
расположенной в полуплоскости у~^-0, или частью, расположенной
в полуплоскости у < 0. Кроме того, если для некоторой t-кривой
т > 0 и она, следовательно, не является прямой линией, то прямая,
соединяющая любые две точки этой кривой, имеет положительный
наклон. Учитывая это, легко видеть, что существует L-кривая, соеди-
соединяющая любые две точки А, В плоскости, причем этими точками
она однозначно определена. Действительно, если обе точки А и В
лежат в области у ^- 0, то верхняя половина соответствующей 1-кри-
вой есть верхняя', половина проходящей через точки А и В прямой,
и этим L-кривая определена однозначно. Аналогичный результат полу-
получается и для того случая, когда обе точки А и В лежат в области
у <; 0. Допустим, что точка А лежит в области у > 0, а точка В —
в области у < 0. Если прямая АВ имеет отрицательный угловой
коэффициент, то единственной /.-кривой, проходящей через точки А
и В, является прямая АВ. Пусть, наконец, угловой коэффициент
прямой АВ положителен. Если точка А имеет координаты (xv yj,
то обозначим через А' точку с координатами (*,, 2j/j) и через М.
точку пересечения прямых А'В и у = 0. Тогда полупрямая МА будет
определять /.-кривую, проходящую через точки А и В.
Покажем, что любые две различные /.-кривые . ¦ .. ,
, т)(х — а) -и y = nf(y, h)(x — b) -:
(от Ф п) имеют единственную общую точку. Это очевидно, если оба
числа щ и п отрицательны или, согласно сказанному выше, если
232 гл- VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
одно из чисел т, п отрицательно. Еслк числа т, п оба положительны,
то решая систему уравнений
у*=т(х — а), у — п(х — Ь),
мы находим, что у = тп(Ь— а)/(и — т), а решая систему уравне-
уравнений
/ = ¦1 т(*' —а), / = -*.„(*'— 4),
находим, что у' = -~-тп(Ь—¦ а)Цп — т). Таким образом, ординатой
точки пересечения рассматриваемых /.-кривых является у, если дробь
(Ь—аI(п — т) отрицательна, и у', если эта дробь положительна.
Это и доказывает наше утверждение, причем мы получаем, кроме
того, что через любые две точки проходит одна и только одна /.-кри-
/.-кривая.
Если т = п, то соответствующие /.-кривые либо совпадают, либо
не пересекаются. В последнем случае мы будем называть их парал-
параллельными.
Способ превращения обычной евклидовой плоскости в проективную
путем добавления бесконечно удаленных элементов хорошо известен.
В этой проективной плоскости теорема Дезарга будет, конечно, спра-
справедливой. Мы можем теперь таким же методом получить некоторое
множество элементов, для которых выполняются все наши постулаты
(при я = 2), но теорема Дезарга не имеет места. Чтобы отличать
точки и прямые этого пространства от точек и прямых исходной
евклидовой плоскости, мы их будем называть Точками и Прямыми.
Все точки евклидовой плоскости будем считать Точками. Кроме того,
каждому множеству параллельных между собой /.-кривых мы сопо-
сопоставим некоторую новую Точку (бесконечно удаленную), которую
будем рассматривать как Точку каждой кривой этого- множества.
Далее, Прямыми у нас будут все /.-кривые евклидовой плоскости и,
кроме того, еще одна, бесконечно удаленная Прямая, соединяющая
все бесконечно удаленные Точки. Теперь совсем нетрудно доказать,
что для Плоскости, содержащей все эти Точки и Прямые, а также
для самих этих Точек и Прямых выполняются введенные в § 1 свой-
свойства инцидентности.
В этой Плоскости мы построим конфигурацию, для которой не
верна теорема Дезарга. Эта конструкция содержит некоторые точки
и прямые евклидовой плоскости, выступающие как Точки и Прямые.
Важно отметить различие между точками и прямыми, с одной сто-
стороны, и Точками и Прямыми, с другой. Проверка справедливости для
Точек и Прямых элементарных геометрических утверждений может
быть предоставлена читателю.
Возьмем два треугольника ABC и А'В'С' (фиг. 5), для которых
прямые АА', ВВ', СС' параллельны оси. С* К, точки С и С, для про-
§ 3. ПРОЕКТИВКО СВЯЗАННЫЕ ЛИНЕЙНЫЕ РЯДЫ
233
стоты, лежат на оси OY, точка А — на оси ОХ и точки пересече-
пересечения соответственных сторон лежат в верхней полуплоскости на пря-
прямой UVW, параллельной оси ОХ. Предположим, что угловые коэф-
коэффициенты прямых ВС, В'С, С А', СА отрицательны, а прямых АВ
и AfB' — положительны. Тогда Прямые А А', ВВ', СС параллельны
и, следовательно, проходят через одну Точку. Прямые ВС и В'С
пересекаются в Точке U,
Прямые С А и С'А' — в Точ-
Точке V. Прямая АВ совпадает
с полупрямой АВ (так как
точка А лежит на оси ОХ)
и проходит через Точку W.
В то же время, если точ-
точки А' и В' лежат по раз-
разные стороны от оси ОХ,
то прямая А'В' проходит
через точку W, и, следо-
следовательно, Прямая А'В' не
может проходить через Точ-
Точку W, Таким образом, ABC
и А'В'С — два перспектив-
перспективных треугольника, Точки пе-
пересечения соответственных
сторон которых не лежат
на одной Прямой.
Мы показали, что при
п = 2 теорема Дезарга не
следует из свойств инци-
инцидентности. Подобный же
простой пример показывает (как и можно ожидать), что теорема,
обратная теореме Дезарга, также не всегда имеет место в S.2.
Геометрии, в которых не верна теорема Дезарга, послужили
объектом большого числа исследований. Но так как эти геометрии
не являются геометриями в смысле гл. V, мы не будем их здесь
касаться. Добавим к нашим постулатам
Villa. При я = 2 справедлива теорема Дезарга.
Мы должны принять в качестве нового постулата только теорему 1
этого параграфа: обратная к ней теорема II, как мы видели в § 6
гл. V, вытекает из теоремы I.
§ 3. Проективно связанные линейные ряды
Совокупность точек Р, Q, R, ... прямой / называется рядом
точек прямой / (линейным рядом). Совокупность прямых р, q,r, .. .,
проходящих через одну точку L, называется пучком прямых. Из
свойств» инцидентности вытекает> что если О — любая точка, не
234 ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
лежащая на прямой /, и V—любая прямая плоскости, содержащей точку О
и прямую /, не проходящая через точку О, то прямая /' должна
пересекать в определенной точке каждую прямую пучка О(Р, Q,
R, ...). Этим на прямой V определяется новый ряд точек Р', Q',
/?', .... Мы будем говорить, что эти ряды точек на прямых / и /'
перспективны с центром в О, и писать
(Р, Q, R, ...)^(/3', Q', R', •••)•
Перспективность устанавливает некоторое взаимно однозначное соот-
соответствие между точками прямых / и /'.
Если прямая / содержит только k точек, то прямая /' тоже содер-
содержит только k точек. В этом случае каждая прямая плоскости содер-
содержит точно k точек. Через точку О, а также через любую другую
точку плоскости проходит точно k прямых этой плоскости. В силу
свойства III, k ;> 3. Мы уже видели, что существуют геометрии,
в которых плоскость содержит только конечное число точек. Поэтому
наши методы должны принимать во внимание и эти конечные гео-
геометрии, в частности случай k = 3. Свойствами инцидентности в этих
случаях обеспечивается существование в плоскости по крайней мере
семи точек, причем существуют конечные геометрии, в которых пло-
плоскость содержит точно семь точек (гл. V, § 9).
Возвращаясь к понятию перспективности, предположим, что между
точками прямой /' и точками прямой /" установлена некоторая дру-
другая перспективность с центром в (У. Прямая F должна пересекать
прямую V, но она не обязана лежать в плоскости 0A), содержащей
точку О и прямую /. Заданные перспективности мы запишем следую-
следующим образом:
(P. Q, R, ...)^(Р/, С/, R', ...)^V'. ОТ, ЯГ, ...)•
При этом между рядами точек на прямых / и /" устанавливается не-
некоторое взаимно однозначное соответствие, которое не обязательно
будет перспективным; мы будем говорить, что эти линейные ряды
проективно связаны, или просто проективны. В этом случае будем
писать
(Р, Q, R, ...)Л(Я", Q", R", ...)•
Описанный процесс можно продолжать. Мы будем говорить, что
два линейных ряда проективны, если их точки могут быть поста-
поставлены во взаимно однозначное соответствие посредством конечной
цепочки перспективностей. Ясно, что при перспективности различные
точки проектируются в различные. Следовательно, если два линей-
линейных ряда проективны, то различным точкам одного ряда соответ-
соответствуют различные точки другого.
Важной задачей теории проективных рядов является установление
условий, при которых два заданных линейных ряда, точки которых
§ 3. ПРОЕКТИВНО СВЯЗАННЫЕ ЛИНЕЙНЫЕ РЯДЫ
235
поставлены во взаимно однозначное соответствие, связаны цепочкой
перспективностей. Следующая теорема является первым шагом на
пути решения этой задачи. Мы будем называть последовательность
перспективностей проективным соответствием.
Теорема I. Если две тройки различных точек Pt, Qlt /?, в
р3> Q3> /?3 {фиг. 6) лежат на дзух различных прямых lt и /3,
то существует проективное соответствие, переводящее тройку
Pi, Qi, #i в тройку Ра, Qs, /?3.
Так как точки Р1г <?,, Rt различны и прямая /, отлична от пря-
прямой /3, то на прямой /3 лежит самое большее одна из этих точек.
Аналогично, не более одной из
точек Р3, Qa, /?3 лежит на
прямой lv Следовательно, мы
всегда можем выбрать две точ-
точки, не обязательно соответст-
соответственные, скажем Рг и Q3, ни
одна из которых не лежит на
прямых /j и /8 одновременно.
Прямую Рх(?3 обозначим че-
через /2.
Прямая QjQj отлична от
прямых 1Л и /2. Возьмем на ней
произвольную точку Ои не ле-
жащую ни на одной из этих
прямых, и пусть прямая 0^
пересекает прямую /2 в точке
/?2 [точки Ол и /?! лежат в плоскости 0,(/2)]. Так как прямые /3
и /2 пересекаются, то прямые PtP& и /?2/?3 тоже пересекаются. Их
точка пересечения 02 однозначно определена, так как P3=?RS и пря-
прямая РгР3 имеет с прямой 4 единственную общую точку. @2 не обя-
обязательно отлична от (?!•) Имеем
Фиг. 6.
Непосредственным следствием этого является тот факт, что между
двумя рядами точек одной и той же прямой может быть установ-
установлено проективное соответствие, являющееся результатом не более
чем трех перспективностей. При этом три различные произвольно
выбранные точки прямой могут быть поставлены в соответствие
трем различным произвольно выбранным точкам этой прямой.
Можно подумать, что проективное соответствие, установленное
между прямыми /j и 4. представляет собой довольно специальный
случай, так как оно является результатом только двух перспектив-
перспективностей. Что это не так, видно из следующей теоремы.
Теорема II. Если ряд точек прямой 1г связан цепочкой из т
перспективностей с рядом точек прямой /т+1 Ф lit то это
236
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
проективное соответствие эквивалентно самое большее двум пер-
спективностям.
Предварительно нам придется доказать две вспомогательные тео-
теоремы. Рассмотрим последовательность, состоящую из двух перспек-
тивностей между прямыми /j и /2 и прямыми /2 и /3. Мы будем на-
называть прямую /2 промежуточной прямой в проективном соответствии
между прямыми 1г и /3. Прямые /j и /2 должны пересекаться; пусть
Z.12 — их точка пересечения, а ?23— точка пересечения прямых /2 и/а.
Точки Z,12 и 123 могут быть как различными, так и совпадающими.
В случае их совпадения справедлива
Теорема Ш. Если прямые /1( /2, /3 (фиг. 7) проходят через
одну точку и 1У Ф /3, то последовательность из двух перспектив-
ностей между точками прямых /, и /3 (с промежуточной пря-
прямой /2) эквивалентна одной перспективности.
Пусть
(Р OF? } ^ (Р О /? "^
11 '' и ' ' Л 2> 2> 2> ' '
и
Если ОJ = О23, то доказывать нечего. Поэтому можно предполо-
предположить, что Oj2 ф О23. Рассматривая тройки точек Р,, Р2, Р8 и
Qu Q$> Qs> мы видим, что
они перспективны с цент-
центром в точке Ln = 1^3. Если
обе эти тройки образуют
треугольники в собственном
смысле, то мы имеем общий
о/ / I \ случай теоремы Дезарга, и
стороны РгР3 и QjQ3 пере-
пересекают прямую 0^0^, со-
соединяющую оба центра пер-
перспективности, в некоторой
точке, скажем О. Таким
образом, прямые Q,QaH R^Ra
проходят через точку О пе-
пересечения прямых Oj2O?g и
PtPs. Следовательно,
(Р О /? V0
~(Р О J? \
Яз
Фиг. 7.
Если точки Р1% Р2> Р3 коллинеарны, что будет в случае, когда
точка Р, лежит на прямой ОпОйЪ, то в качестве точки О можно
§ 3. ПРОЁКТИВНО СВЯЗАННЫЕ ЛИНЕЙНЫЕ РЯДЫ 237
взять точку пересечения прямой QtQa с ОпО^ = Р^Р^РЬ. Если обе
тройки точек Ри Р^, Р3 и Qv Q2, Qs коллинеарны, то 0^ = 0^.
С другой стороны, если ?j2 ф 1^, то мы имеем следующую тео-
теорему:
Теорема IV. В последователь поста двух перспективностей
между точками прямых 1г и 1а (фиг. 8) промежуточная прямая /2
может быть заменена любой другой прямой /», соединяющей две
точки прямых 1г и /8, не являющиеся ни соответственными, ни
совпадающими.
Для доказательства мы дважды применим предыдущую теорему.
Пусть /2 — прямая, проходящая через точки Х± прямой 1^ и К3 пря-
прямой /3. По предложению, точки Хх и К3 различны и не являются
Ф и г. 8.
соответственными в проективном соответствии между прямыми 1Х и /3.
Допустим сначала, что точка Хх не соответствует точке ?23 пересе-
пересечения прямых /2 и /8. Так как точка Z23 сама себе соответствует
в перспективности между прямыми /2 и /а с центром в 028, то прямая
XjI2S не проходит через точку О12. -Прямую X^L2S обозначим
через /2. Эта прямая удовлетворяет требованиям теоремы, так как
точки Х: и L2S не являются соответственными.
Мы можем спроектировать ряд точек (Р2, ...) прямой /2 из
точки О12 на ряд точек (Р'2, ...) прямой l'2. Действительно, пря-
прямая /2 лежит в плоскости Z.93(/i)= On(l^). Посредством двух пер-
перспективностей с центрами в 012 и 0^ мы устанавливаем проективное
соответствие между рядами точек (Ра. • • •) прямой /2 и (Р3, • •.)
238 ' 1"Л. Vl- СИНТЕТИЧЕСКИЕ ОПРЕДЕЛЕНИЙ _
прямой /3. При этом прямые l2, /2 и /3 проходят через одну точку.
В силу предыдущей теоремы, на прямой О12О23 найдется такая
точка о'з, что
Аналогично, так как точки Хг и Y3 не являются соответственными
и точка Х1 сама себе соответствует в перспективности с центром в О12
между" прямыми 1Х и 4, то прямая ЛГ1У8 = /2 не проходит через
точку Ой- Если мы теперь спроектируем из 0^ ряд точек (Рг, •••)
прямой l-i на ряд точек (Ра, ¦••) прямой ll,. то снова, в с-илу пре-
предыдущей теоремы, так как прямые ll, 4, 1\ проходят через одну
точку, сможем найти такую точку Оц, лежащую на прямой 0,202з и,
следовательно, на прямой 0^0^, что
Таким образом, прямая ll удовлетворяет требованиям теоремы, и ее
можно использовать вместо /2 в качестве промежуточной прямой.
Если точка Хг соответствует точке ?23, то это рассуждение не
проходит. Если точка Z.J2 не соответствует точке Ys, мы можем до-
доказать теорему, попрежнему беря в качестве первой промежуточной
прямой вместо f2 прямую Z.12K8. Остается случай, когда точка Хх
соответствует точке 123, а точка 112 соответствует точке Y3. Рас-
Рассмотрим этот случай.
На прямой /j имеется по крайней мере одна точка, отличная от
точек Ijg и Xv Пусть такой точкой будет Tv Если прямая /3 пере-
пересекает прямую /j и Гх есть точка пересечения, то точка Г3 пря-
прямой /8, соответствующая точке Ту, отлична от Тх, кроме случая,
когда прямая O12OW проходит через точку Тг. Предположим, что
прямая 0i2O23 проходит через Тг и что Т1 = Т3. Возможны два
случая:
(I) Существует точка Za прямой /3, отличная от точек Г3, L&, К3.
В этом случае мы можем перейти от промежуточной прямой /2 к про-
промежуточной прямой /2, беря в качестве промежуточных прямых по-
последовательно прямые
ни одна из которых не соединяет соответственные точки и не про-
проходит через точку пересечения прямых 1Х и /3.
(II) Каждая прямая содержит только три точки. Тогда ряды точек
прямых 1г и /3 перспективны с центром в точке пересечения прямых
ATjZgg и K8Z.12, т. е. в точке 012= Oi3. Однако случай, когда
012 = О23, тривиален.
§ з. пРОЕктИвно Связанные линейные
23S
Наконец, если прямые /х и /3 пересекаются и точки Г3 и 1\ раз-
различны или если прямые lt и /3 не пересекаются и точка Г3 соответ-
соответствует точке Tlt мы заменяем в рассуждении (I) точку Z3 точкой Т3.
Этим заканчивается доказательство теоремы IV.
Теперь мы в состоянии закончить доказательство теоремы II.
Для этого рассмотрим сначала случай четырех прямых llt /2, /3, /4
(фиг. 9) с рядами точек (Рх, . ..). (^а. • ¦ •). (^3. • • •), (.Р» • • •) на
них. Пусть
л
(Р \ ы
Фиг. 9.
По определению перспективности, /t и /2 — различные пересекающиеся
прямые. Точно так же различны прямые /2 и /3 и прямые /3 и /
Совпадения прямых lx, /2, /8,
/4, согласующиеся с этими
ограничениями, возможны и
должны быть приняты во
внимание.
Мы докажем прежде
всего, что если 1Х и /4 —
различные прямые, то можно
перейти от линейного ряда
(Pj, ...) к линейному ряду
(Р4,...) при помощи двух
перспективностей. Заметим
сначала, что в том случае,
когда каждая прямая рассматриваемой конфигурации содержит
только три точки, этот результат следует из рассуждения, проведен-
проведенного при доказательстве теоремы I. В самом деле, каждый из рядов
на прямых lt и 14 состоит в этом случае из трех точек и эти ряды
находятся во взаимно однозначном соответствии. Используя рассуж-.
дение, проведенное при доказательстве теоремы I, сразу получаем,
что от ряда точек прямой 1Х к ряду точек прямой /4 можно перейти
при помощи двух перспективностей.
При доказательстве общего результата мы можем ограничиться
случаем, когда каждая прямая рассматриваемой конфигурации содер-
содержит по крайней мере четыре различные точки. Рассмотрим сначала
некоторые частные случаи взаимного расположения прямых 1и /2,
'а. к-
(I) Прямые /х, /2, /3 различны, но проходят через одну точку.
В силу теоремы III, мы можем перейти от линейного ряда (Рх, ...)
к линейному ряду (Ра, ...) посредством одной перспективности. Тре-
Требуемый результат очевиден.
(II) Прямые /2, /3, /4 различны, но проходят через одну точку,
Этот случай аналогичен случаю (I).
240 ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЙ ^
(III) Прямые lt и /3 совпадают, прямая /4 не проходит через точку
L19 = L%i. В этом случае существует прямая l\, проходящая через
точку 112, отличная от прямой 1Л и пересекающая прямую /4 в неко-
некоторой точке, отличной от возможной точки пересечения прямых /2
и /4 и от точки прямой /4, соответствующей точке 112 прямой /2.
В силу теоремы IV, мы можем заменить прямую /а прямой l\ и тем
самым свести этот случай к случаю (II).
(IV) Прямая /2 совпадает с /4, прямая /j не проходит через точку
Z2:J = Z.34. Этот случай аналогичен случаю (III).
(V) Прямая /х совпадает с 1а, прямая /2 совпадает с /4. Пусть / —
любая прямая, проходящая через точку Z.12 = Z.2;! = Z.34> отличная
от прямой 1Х = /3 и от прямой /2 = /4. Из некоторой точки V, пло-
плоскости прямых 1± и / спроектируем ряд точек (Pj, ...) прямой lt на
ряд точек (Р, . . .) прямой /. Тогда
Используя теорему III, получаем
(Р, ...)^(РО ...) (/=1, 2, 3, 4)
$, V;i, Vt. Таким
для соответственным
образом,
(Л
образом
L. •••)Д1
выбранных
(P,...)V-±(
точек 1
Р„ •••)•
Снова применяя теорему III, мы получаем, что ряды точек прямых
1± и /4 в этом случае перспективны.
В рассмотренных выше случаях были учтены все возможности,
которые могут иметь место, когда прямые 1и /2, /3 или прямые /2,
/3, /4 проходят через одну точку. Остается" рассмотреть представлен-
представленный на фиг. 9 общий случай и случай, когда либо прямые llt /2, /4
различны и проходят через одну точку, либо прямые llt /3, /4 раз-
различны и проходят через одну точку. Эти последние возможности не
могут иметь места одновременно, так как иначе мы имели бы один
из уже рассмотренных случаев. Мы должны рассмотреть лишь тот
случай, когда прямые llt /2, /4 не проходят через одну точку (в то
время как прямые 1Х, /3, /4 могут проходить или не проходить через
одну точку). Случай, в котором прямые 1±, /2, /4 проходят, а пря-
прямые 11г /а, /4 не проходят через одну точку, получается переменой
ролей прямых /2 и I.. Наше рассуждение охватывает, конечно, общий
случай.
Так как прямые lv /2, /4 не проходят через одну точку, мы
можем заменить прямую 1.6 некоторой прямой /3. соединяющей точку ?12
с некоторой точкой прямой 1А, не лежащей на прямой /2 и не соот-
соответствующей в ряде точек прямой /4 точке Z.12, рассматриваемой как
^ §4. гАрМбнйчёскАЙ сопряженность 241
точка прямой /2. Тогда прямые tti /2j l\ будут проходить через одну
точку и мы можем применить рассуждение, проведенное в случае (I).
Этим заканчивается доказательство теоремы II для т = 3.
Рассмотрим теперь т перспективностей, т. е. общий случай тео-
теоремы II. Если каждая прямая содержит только три точки, то можно
поступать как при т — 3. Поэтому такой случай можно исключить.
Если в последовательности прямых
(т > 2)
найдется прямая 1{, отличная от /j+3, то мы можем применить резуль-
результат, полученный при т = 3 для понижения числа перспективностей
в этой последовательности. Так мы поступаем до тех пор, пока не
лридем к двум перспективностям или к тому, что
h = h+s («=1 от —2).
В этом случае т > 3, так как, по предположению, lt ф 1т+1. Пря-
Прямые /}, /2, /3 должны быть различными. В силу теоремы IV, мы можем
заменить прямую /2 некоторой другой прямой /г, не изменяя ни одной
из остальных прямых /{. Тогда, так как ? Ф /6, мы можем, исполь-
используя результат для т = 3, снова уменьшить число перспективностей
в последовательности. Таким образом, во всех случаях мы можем
понизить число перспективностей до двух. Это и доказывает
теорему.
Следствие. Взаимно однозначное проективное соответствие
между двумя рядами точек одной и той же прямой может быть
получено в результате не более чем трех перспекттностей.
§ 4. Гармоническая сопряженность
На прямой / (фиг. 10) возьмем две различные точки А и В.
Если С — любая точка • прямой /, мы построим новую точку D пря-
прямой / следующим образом. ^
В плоскости я, проходящей через прямую /, возьмем три прямые
а, Ь, с, пересекающие прямую / соответственно в точках А, В, С,
отличные от прямой / и не проходящие через одну точку. Так как
в плоскости и через каждую точку проходят по-крайней мере три
различные прямые, выбор прямых а, Ь, с возможен. Пусть прямые
b и с пересекаются в точке Р, прямые с и а — в точке Q, прямые
а и b — в точке R. Тогда точка А отлична от точки Р, а точка
В — от точки Q. Так как точки А, В, Р, Q лежат в одной пло-
плоскости и не коллинеарны, прямые АР и BQ пересекаются. Точку их
шересечения обозначим через S. Эта точка 5 должна быть отлична
.от /?, так как точка В отлична от А. Прямая RS пересекает пря-
прямую / во вполне определенной точке D. Это и есть искомая точка.
Нетрудно проверить, что если С = В, то D = В, и если С = А,
то D = А. В этих случаях построение точки D не зависит от выбора
16 Зак. 1230. В. Ходж и Д. Пндо
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
прямых а, д, с. Мы докажем теперь, что и тог Да, когда точка С
отлична от точек А к В, положение точки D не зависит от выбора
прямых а, Ь, с в плоскости; иными словами, положение точки D
зависит только от упорядоченной тройки точек А, В, С.
Фиг. 10.
Рассмотрим сначала тот случай, когда на прямой / имеются всего
три точки А, В, С. Тогда точка D должна совпадать с одной из
этих точек. Если D — A, то точки R, S, Q, А должны быть кол-
линеарны и, следовательно, Q = S или Q = А. Но если Q = S,toR = P
и прямые а, Ь, с проходят через одну точку, что противоречит усло-
условию; если Q = А, то С = А, что снова противоречит условию. Ана-
Аналогично, невозможно и равенство D — В, так что остается единствен-
§ 4. ГАРМОНИЧЕСКАЯ СОПРЯЖЁННОСТЬ 243
ная возможность D = C. Следовательно, в этом случае положение
точки D также не зависит от выбора прямых а, Ь, с.
Мы можем теперь ограничиться рассмотрением случая, когда на
прямой / (а значит, и на каждой прямой) имеются по крайней мере
четыре точки и через каждую точку в каждой плоскости, проходя-
проходящей через эту точку, проходят по крайней мере четыре прямые.
Рассмотрим произвольную плоскость тс' (не обязательно отличную от it),
проходящую через прямую /, и проведем в ней три прямые а', Ь', с',
проходящие соответственно через точки Л, В, С. Пусть эти прямые
отличны от прямой / и не проходят через одну точку. Мы повторим
предложенную выше конструкцию, обозначая точки, соответствующие
точкам Р, Q, R, S, через Р1, Q', R', S'. Точку пересечения прямых
R'S' и / обозначим через ГУ.
Рассмотрим прежде всего случай, когда прямые а и а', Ь и Ь',
с и с' различны. Соответственные стороны треугольников PQR и
P'Q'R'. пересекаются в коллинеарных точках Л, В, С. В силу тео-
теоремы, о'братной к теореме Дезарга, эти треугольники перспективны.
Если Р = Рг, то, вопреки предположению, Ь = Ь' и с = с'; по ана-
аналогичной причине Q Ф Q' и R ф R'. Таким образом, прямые РР',
QQ', RR' определены и пересекаются в некоторой точке О. Если
две из этих прямых совпадают, скажем QQ' = RR', то QR = Q'R',
т. е. а —а', что противоречит условию. Следовательно, точка О
определяется любыми двумя из этих трех прямых.
Далее, соответственные стороны треугольников PQS и P'Q'S'
пересекаются в точках В, А, С, и, следовательно, эти треугольники
перспективны. Поэтому точки S, S' и точка О пересечения прямых
РР' и QQ' коллинеарны, и треугольники QRS и Q'R'S' перспек-
перспективны с центром в точке О. Предположим сначала, что SQ ф S'Q'.
Так как прямая SQ пересекает прямую S'Q' в точке В и прямая QR
пересекает прямую Q'R' в точке Л, то, в силу теоремы Дезарга,
прямые RS и R'S' пересекаются на прямой ВА = I. Так как пря-
прямая RS пересекается с прямой / только в точке D, а прямая R'S'
пересекает прямую / только в точке D', то D = D'.
Если SQ = S'Q', но SP ф S'P'', то мы можем взять треугольники
PRS и P'R'S' вместо QRS и Q'R'S' и доказать, что D = Dr. Если
SQ = S'Q' и SP = S'P', то S = S' и прямые QQ' и РР' пересе-
пересекаются в точке S. Так как треугольники PQR и P'Q'R' перспек-
перспективны, то прямая RR' проходит через точку 5 = 5' и, следова-
следовательно, прямая RS = R'S' пересекает прямую / в той же самой
точке D.
Это доказательство может не пройти, если прямые а' и а, Ь' и Ь,
с' и с не все различны. Если, например, с' — с, то треугольники
PQR и P'Q'R' перспективны с центром в точке пересечения пря-
прямых RR' и с, а треугольники PQS и P'Q'S' перспективны с цен-
центром в точке пересечения прямых SS' и с. Но так как РР = QQ',
то мы не можем вывести отсюда, что треугольники QRS и Q'R'S'
16*
244 Гл. Vi. СИнтЕтичЕскбв бпРедблйнИЕ ^
перспективны. В этом случае нам придется изменить доказатель-
доказательство.
Заметим, что если с = с', то плоскости и и тс' совпадают. Пока-
Покажем, что если прямые а и а', Ь и Ь', с и с' не все различны, то
существует по крайней мере одна тройка прямых а*, Ь*, с*, прохо-
проходящих через точки А, В, С, удовлетворяющих требованиям конструк-
конструкции и таких, что прямые а и а*, Ь и Ь*, с и с* и аналогично пря-
прямые а' и а*, Ь' и Ь*, с' и с* различны. Случай, когда с = с',
является типичным. Так как через каждую точку прямой / проходят
по крайней мере четыре различные прямые плоскости т, то мы можем
найти прямые а* и Ь*, проходящие соответственно через точки Л
и В, отличные от прямых /, а, а' и /, b, b'. Пусть прямая Ь* пере-
пересекает прямую а* в точке R*. Так как с = с', то в плоскости тс
существует по крайней мере одна прямая с*, проходящая через
точку С и отличная от прямых с = с', /и CR*. Прямые а*, Ь*, с*
удовлетворяют нашим требованиям. Используем их для построения
точки D*. В силу доказанного выше, Z) = D*, и аналогично D' = ?>*.
Отсюда следует, что D = D'.
Однозначно определенная указанным образом точка D называется
гармонически сопряженной с точкой С относительно точек А
и В и обозначается через
D = (A, B)!C.
Из построения ясно, что
D = (B, A)/C.
Мы докажем теперь, что
= (B, A)\D.
Чтобы построить точку, гармонически сопряженную с точкой D отно-
относительно точек А к В, проведем через точки Л, В и D соответ-
соответственно три прямые AQR, BSQ и DSR, образующие треуголь-
треугольник QSR. Тогда прямые BR й AS пересекутся в точке Р, а пря-
прямая QP пересечет прямую / в точке, гармонически сопряженной
с точкой D относительно точек А и В (или В и Л). Так как это
есть точка С, то требуемый результат доказан.
Мы видели в § 3 (теорема I), что между двумя тройками колли-
неарных попарно различных точек А, В, С к А', В', С может быть
установлено некоторое проективное соответствие. Докажем, что в
этом соответствии точка (Л, В)/С отвечает точке (Л', B')jC'. Дей-
Действительно, если С = А или С = В, то С = А' или С' = В', и
в этих случаях результат очевиден. Мы можем, следовательно, пред-
предполагать, что точки Л, В, С (и, следовательно, точки А', В', С)
различны. Так как каждое проективное соответствие является резуль-
результатом конечного числа перспективностей, то достаточно рассмотреть
только линейные ряды Л, Б, С и Л', В', С различных прямых /
и /', перспективные друг другу.
§ 4. ГАРМОНИЧЕСКАЯ СОПРЯЖЕННОСТЬ
245
(I) А = А' (фиг. 11). Пусть рассматриваемые линейные ряды пер-
перспективны с центром в R. Чтобы построить точку D = (A, B)jC,
проведем через точки А, В, С прямые AR, ВВ', СВ' так, чтобы
А'1
образовался треугольник B'QR. Так как прямые АВ' и BQ пересе-
пересекаются в точке S, то прямая RS пересекает прямую / в требуемой
точке D. .Чтобы построить точку D' = {A', B')/C, через точки А',
В', С проведем прямые
A'QR, B'QC и C'CR, обра-
образующие треугольник CRQ.
Так как прямые А 'С и B'R
пересекаются в точке В, то
прямая BQ пересекает пря-
прямую /' в точке D'. Сле-
Следовательно, D' = S. Таким
образом, четверки точек (А,
В, С, D) и {А', В', С, D')
перспективны с центром в R.
(II) В = В'. Этот случай
непосредственно сводится к
случаю (I), так как
(А, В)!С = (В, АIС.
Фиг. 12.
(Ill) C = C (фиг. 12).
Если прямые АВ' и А'В
пересекаются в точке 5,
прямая RS пересекает прямую / в точке D, а прямую /' в точ-
точке ?>', мы можем построить точку (Л, В)/С при помощи пря-
прямых АА', ВВ' и С А'В', а точку (Л', B')jC — при помощи прямых
246
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
А' А, В'В и CAB. Отсюда сразу вытекает, что D ==¦ (A, B)jC и
D' = (A', B')\C. Следовательно,
(А, В, С, D)^(A', В', С, D').
(IV) Пусть прямые / и /' пересекаются в некоторой точке, от-
отличной от точек А, В, С, А', В', С' (фиг. 13). Предположим, что
(А, В, C,D)-%-(A', В', С, ГУ),
где D = (А, В)/С. Для доказательства того, что D' = (А', В')/С, про-
проведем прямую СА' и обозначим через Dt точку пересечения ее
Фиг. 13.
с прямой ODD', а через Bt — точку пересечения С А' с прямой ОВВ7.
Так как
(А, В, C,D)jt(A', В1г С, DJ
и D = (A, B)jC, то из (III) следует, что D1 = (Af, BJ/C. Так как
{А,ВХ,С. Djj^iA', Б', С, D'),
то из (I) вытекает, что ГУ = (А', В'IС.
Полученные результаты обычно формулируются в виде следующей
теоремы:
Теорема I. Свойство гармонической сопряженности является
проективным инвариантом.
§ 4. ГАРМОНИЧЕСКАЯ СОПРЯЖЕННОСТЬ
247
Важным следствием этой теоремы является
Теорема II. Если существуют три различные точки А, В, С,
такие, что С = (А, B)jC, то для любой другой тройки точек
А', В', С, в которой А' Ф В', мы имеем С = {А1, ВО/С
Это очевидно, если С = А' или С = В'. Если точка С отлична
от точек А' и В', то существует некоторое проективное соответ-
соответствие, переводящее точки А', В', С' в точки А, В, С. В силу тео-
теоремы I, точка {A1, B')jC переходит при этом в (А, В)/С. Так как,
по условию, последняя точка совпадает с С, мы должны иметь
С = 04', ВО/С.
Этот случай мы будем называть специальным.
Чтобы более полно охарактеризовать связь между парами точек
А, В и С, D, удобно определить (А, В)/С при А = В. Это опреде-
определение изменяется в зависимости от обстоятельств. В специальном
случае мы принимаем в качестве D = (A, A)/C произвольную точку
прямой. В неспециальном случае, по определению, (Л, А)/С есть
точка А, если СфА,-а произвольная точка прямой, если С = А.
Й.
Q'
Р'
Фиг. 14.
Докажем теперь, что если D = (А, В)/С, то А = (С, D)jB. Легко
видеть, что если точки А, В, С, D не все различны, то это вытекает
из определения гармонической сопряженности с приведенными выше
условиями. Мы должны, следовательно, рассмотреть только тот слу-
случай, когда А, В, С, D — четыре попарно различные точки прямой /.
Пусть, в обозначениях фиг. 10, прямая PD пересекает прямую RA
в точке С/, а прямая QD пересекает прямую RB в точке f (фиг. 14).
Прямые RD, АР и BQ проходят через точку S, так что стороны
треугольников RAB и DPQ должны пересекаться в коллинеарных
точках. Следовательно, прямая P'Qf проходит через точку С.
24g _. _ГЛ..У1. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ,
Чтобы построить точку (С, D)IB, проведем через точки D, С
и В прямые DP*, СР и ВРР', образующие треугольник PP'Q*
Прямые DP и СР' пересекаются в точке Q', прямая QQ" пересекает
прямую / в искомой точке, которая, следовательно, совпадает с точ-
точкой А. Суммируя изложенное выше, получаем следующую теорему:
Теорема III. Свойство гармонической сопряженности сим-
симметрично относительно точек А, В и точек С, D, а также от-
относительно пар (А, В) и (С, D).
Мы можем назвать пары точек (Л, В) и (С, D) гармонически
сопряженными парами. В специальном случае свойство гармониче-
гармонической сопряженности не особенно интересно, но во всех остальных
случаях оно является весьма важным.
Для неспециального случая мы не можем обобщить теорему I § 3
и найти проективное соответствие, при котором четыре различные
точки А, В, С, D одного линейного ряда соответствуют четырем раз-
различным точкам А', В', С, D' другого. Действительно, если ?) =
— {А, В)/С, но D' Ф (А1, В')/С', то существование такого проектив-
проективного соответствия противоречило бы теореме I.
Наконец, если пары (А, В) и (С, D) гармонически сопряжены
и О — произвольная точка, не лежащая на прямой ABCD, то рас-
рассмотрим прямые а = ОА, д== ОВ, с = ОС и d = OD. Если /'—
произвольная прямая, лежащая в плоскости этих прямых, не прохо-
проходящая через точку О и пересекающая эти прямые соответственно
в точках А', В', С, D', то
(А, В, С, D)-%-(A', В', С, D').
Таким образом, пара точек (Аг, В') гармонически сопряжена с парой
(С, D'). Мы выразим это свойство пучка прямых а, Ь, с, d, говоря,
что пара прямых (о, Ь) гармонически сопряжена с парой (с, d).
§ 5. Две проективно инвариантные конструкции
Рассмотрим снова конструкции, описанные в § 7 гл. V, и пока-
покажем, что они являются проективно инвариантными. Значение их за-
заключается в том, что они могут быть использованы для построения
некоторого тела, при помощи которого мы будем вводить в инци-
дентностное пространство координаты (§§ 7, 8).
На прямой / возьмем три различные точки О, Е, U. Пусть А
и В — две точки прямой /, отличные от U.
Конструкция I. В плоскости ъ, проходящей через пря-
прямую I, проведем три прямые а, Ь и и, отличные от прямой /,
не проходящие через одну точку и проходящие соответственно
через точки А, В и U. Пусть Р — точка пересечения прямых и
и a, Q — точка пересечения прямых и и b, R — точка пересече-
пересечения прямых OQ и a, S—точка пересечения прямых b и UR.
Тогда прямая PS пересекает прямую I в определенной точке Т,
§ 6. ПРОЕКТИВНО ИНВАРИАНТНЫЕ КОНСТРУКЦИИ 249
После обоснования этой конструкции мы покажем, что положе-
положение точки Т зависит только от точек О, U, А, В и не зависит от
выбора прямых а, Ь, а. Первая часть построения — выбор трех пря-
прямых а, Ь, а — выполнима, потому что, как мы уже видели в § 3,
в плоскости те через каждую точку проходят по крайней мере три
различные прямые. Точка Q не может совпасть с точкой О, так что
прямая OQ определена. Точка R определена, так как даже если
А = О, то Р ф Q. Так как точка R лежит на прямой а, то R Ф U и,
следовательно, прямая UR определена. Точки Р и S различны, а со-
соединяющая их прямая отлична от прямой /, так как прямая и не про-
проходит через точку пересечения прямых а и b и не совпадает с пря-
прямой /. Следовательно, прямая PS пересекает прямую / в определен-
определенной точке Т и, поскольку прямая PS отлична от прямой и, Тф U.
„Общий" случай этого построения иллюстрируется фигурой I на
листе III» Мы покажем сначала, что положение точки Тне зависит от вы-
выбора прямых а, Ь, а в следующих частных случаях, в которых точки О,
А, В не все различны (нумерация относится к фигурам листа III):
II. А — ВфО. Выполняя обычное построение гармонически со-
сопряженной точки с использованием только прямых этой фигуры, мы
видим, что Г=(Л, .10/0.
III. О = А. Очевидно, что Т=В.
IV. О = В. Здесь 7= Л.
V. А = В = О. Мы видим, что Т=О.
Если при некотором проективном соответствии точкам О, А, В, U
отвечают точки О', А', В', W, то в рассмотренных выше частных
случаях точке Г отвечает точка Т', так как совпадающие точки
соответствуют совпадающим и гармонически сопряженные точки —
гармонически сопряженным. Таким образом, в этих случаях наша
конструкция проективно инвариантна.
. Предположим теперь, что точки О, А, В, U различны. Докажем,
что Р, Q, R, S — различные точки, никакие три из которых не
коллинеарны. По построению, Р и Q — различные точки. Далее,
OQ ф Ь и точка Q не лежит на прямой а. Следовательно, точка R
не лежит на прямой Ь и, в частности, R ф Q, Если R = Р, мы дол-
должны были бы иметь QR = QP; но прямая QR пересекает прямую /
в точке О, а прямая QP — в точке U. Так как О ф U, то отсюда
следует, что R ф Р. Далее, поскольку U ф A, UP Ф UR. Так как
U Ф В, то точки Q и 5 различны. Наконец, точка R не лежит на
прямой Ь и, следовательно, 5 ф R. Мы получили, что Р, Q, R, S —
различные точки, никакие три из которых не коллинеарны.
Если бы точка R лежала на прямой /, она должна была бы сов-
совпадать с точкой А, а прямая OQ совпадала бы с прямой /, т. е.
точка Q должна была бы лежать на прямой /, что не имеет места.
Аналогично, если бы точка 5 лежала на прямой /, то она должна
была бы совпадать с точкой В, а точка R должна была бы лежать
на прямой I, что, как мы видели, также не имеет места. Таким
О А
вт и о
А=В Т
O-A'R
U 0=В
Ш
IV
• § s. проективно инвариантные конструкции 251
образом, ни одна из точек Р, Q, R, S не лежит на прямой /. Эти
факты помогут нам сделать более ясными некоторые моменты в
нижеследующих доказательствах.
Мы должны доказать, что если те' — произвольная плоскость, про-
проходящая через прямую / (эта плоскость может совпадать с тс) и
а', Ь', и' — прямые плоскости тс', проходящие соответственно через
точки А, В, U, отличные от прямой / и не проходящие через одну
точку, то приведенная выше конструкция с прямыми а', Ь', а' вместо
а, Ь, и дает точку Т, совпадающую с точкой Т.
Случай (I): я^и', В силу теоремы, обратной к теореме Дезарга,
треугольники PQR и P'Q'R' перспективны, так как их соответст-
соответственные стороны пересекаются в коллинеарных точках О, A, U. Тре-
Треугольники SQR и S'Q'R' также перспективны. Следовательно, пря-
прямые РР', QC/, RR', SS' проходят через одну точку, так что тре-
треугольники SPQ и S'P'Q' перспективны. Поэтому прямые SP, S'P*
a UB проходят через одну точку, т. е. Т = Т'.
Случай (II): it = ir'. Если вся конфигурация содержится в неко-
некотором пространстве размерности я > 2, то единственность точки Т
устанавливаем, дважды применяя (I); обе конструкции в плоскости
я = я' сравниваются с конструкцией в некоторой плоскости, прохо-
проходящей . через прямую / и отличной от плоскости т = it'. Но при
я = 2 мы должны поступить иначе. Мы устанавливаем сначала един-
единственность точки Т для трех случаев, в которых имеют место два и
только два из совпадений а = а', b = b', и = и'. При этом мы за-
заметим, что в плоскости я найдутся по крайней мере три прямые, от-
отличные от прямой / и проходящие через любую из точек А, В, U,
так как, по предположению, прямая / содержит по крайней мере четыре
различные точки О, А, В, U. Читатель сможет без труда доказать, что
от прямых а, Ь, и можно перейти к прямым а', Ь', и' в несколько
шагов, изменяя каждый раз лишь одну из этих прямых. Таким образом,
нам остается рассмотреть только три следующих частных случая:
(На): a = ar, b — b', и Ф и' (фиг. 15). Пусть прямая PS пере-
пересекает прямую QR в точке Y. Очевидно, что прямая XY гармони-
гармонически сопряжена с прямой XU относительно несовпадающих пря-
прямых ХА и ХВ. Точно так же прямая ХУ гармонически сопряжена
с прямой XU относительно прямых ХА и ХВ. Поэтому точки X, Y, Y'
коллинеарны и, следовательно, треугольники PQY и P'Q'Y' пер-
перспективны относительно точки X. Так как прямая PQ пересекает
прямую P'Q' только в точке U, а прямая QY пересекает прямую Q'Y'
только в точке О, то из теоремы Дезарга следует, что точка пере-
пересечения прямых PY и P'Y' лежит на прямой OU, т. е. что T—V.
(Иб): а —а', ЬфЬ', а = и' (фиг. 16). Рассмотрим треугольники
QRS и Q'R'S'. Их соответственные стороны пересекаются в точках
U, В, О. Следовательно, эти треугольники перспективны. Но пря-
прямая QQ' пересекает прямую RRr в определенной точке Я; поэтому
точки^Р, 5 и S' коллинеарны п\Т=Т'.
252
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
(Пв): афа'.Ь — Ь', а — а' (фиг. 17). Треугольники PRS и P'R'S'
перспективны относительно точки Q. Так как прямая PR пересекает
прямую P'R' только в точке А, а прямая RS прямую R'S' — только
Фиг. 15.
в точке U (если 5 = S', то /? = /?', так как О Ф U, и тогда а = о'),
то из теоремы Дезарга следует, что точка пересечения прямых PS
и fS' лежит на прямой AU. Отсюда Т= Т.
,а-а'
Фиг. 16.
В рассмотренных трех специальных случаях единственность точки Т
полностью доказана.
Перейдем теперь к доказательству проективной инвариантности
точки Т; точнее, мы докажем, что если имеется некоторое проектив-
$ 6. п^оЁктйвнб инвариантные конструкций 253
ное соответствие между прямыми / и /', такое, что
(А, В, U, О,...)Л(А', В', U', О',...),
и если Т есть точка, построенная применением конструкции 1 к точ-
точкам А', В', U', О', то
(Л, В, U, О, Т, . ..)д(/!', В'. U', О', Г,...)-
Достаточно доказать инвариантность этой конструкции относительно
перспективности.
Если в>3 и ряды точек на прямых / и /' перспективны с цен-
центром в V, то существуют плоскости я и я', проходящие соответ-
соответственно через прямые / и /' и не содержащие точки V. Выполним
Фиг. 17.
конструкцию I на прямой / в плоскости я и спроектируем конфигура-
конфигурацию, построенную в плоскости я, из точки V на плоскость я'. Полу-
Полученная фигура будет представлять собой конструкцию I на прямой /',
и, таким образом, проективная инвариантность точки Т доказана.
Если п = 2, мы должны поступить иначе. Как было уже сказано,
достаточно рассмотреть только тот случай, когда точки А, В, О, U
попарно различны. Предположим, что А, В, О, U и А', В', О', W —
два ряда точек, расположенных соответственно на прямых / и /' и
перспективных с центром в V.
Случай (I): 0 = 0' (фиг. 18). Для построения точки Т исполь-
используем в качестве а, Ь, и прямые АV, BV, UB'. Тогда прямая PQ пере-
пересекает прямую / в точке Т. Для построения точки V используем
прямые AV, BV, U'B, проходящие соответственно через точки А',
В', U'. При этом прямая SR пересекает прямую /' в точке 7*. Пусть
254
ГЛ. Vt. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
прямые PB'U и SBU' пересекаются в точке X. Прямая ОХ будет,
очевидно, гармонически сопряженной с прямой OV относительно пря-
прямых / и /'. Аналогично, если прямая A'U пересекает прямую AU'
в точке Y, то прямая О К бу-
будет гармонически сопряжена с
прямой OV относительно (пря-
(прямых / и /'. Следовательно, точ-
\.и> ки О, X и К коллинеарны и
прямая XY пересекает прямую
ВВ' в точке (В, B')/V. Проек-
Проектируя эту конфигурацию из
точки X, мы видим, что пря-
мая XY пересекает прямую АА'
в точке (Р, S)/V. Проектируя
же из точки Y, получаем, что
прямая XY пересекает прямую
ВВ' в точке (Q, R)/V. Следо-
Следовательно, точка Z пересечения
прямых PQ и SR лежит на
прямой XY. Далее, соответст-
венные стороны треугольников
T'U'R и TUQ пересекаются
в точках Y, Z и О. Следовательно, в силу теоремы, обратной к те-
теореме Дезарга, прямая TV проходит через точку V пересечения
прямых UU' и QR.
Случай (II): Us= W (фиг: 19). Для построения точки Т в каче-
качестве а, д, и используем соответственно прямые AV, BV, I'. Если
Ф и г. 18.
Фиг. 19.
прямая ОВ' пересекает прямую AV в точке R, а прямая UR пря-
прямую BV в точке S, то прямая A'S пересекает прямую / в точке Т.
Для построения точки Т используем прямые AV, BV, I. Если пря-
прямая О'В пересекает прямую AV в точке R', а прямая UR' пере-
§ 5. ПРОЕКТИВНО ИНВАРИАНТНЫЕ КОНСТРУКЦИИ
255
секает прямую BV в точке 5', то прямая AS' пересекает прямую /'
в точке V. Пусть прямая B'R пересекает прямую A'S в точке X,
а прямая BR' прямую AS' в точке X'. Тогда прямая VX, как и VX',
будет гармонически сопряжена с прямой VU относительно VA и VB.
Следовательно, точки V, Хп X' коллинеарны. Аналогично, если BR'
пересекает В R в точке 1," a AS' пересекает A'S в точке М, то
прямые UL и UM обе являются гармонически сопряженными с пря-
прямой UV относительно UO и UO'. Таким образом, точки U, L и М
коллинеарны. Рассмотрим теперь треугольники ОХТ и О'Х'Т.
Соответственные стороны их пересекаются в коллинеарных точках
М, U, L. Значит, эти треугольники перспективны. Но прямые 00'
и XX' пересекаются только в точке V. Следовательно, точки Т, V и V
коллинеарны.
Случай (III). Точка пересечения прямых / и /' отлична от точек
О и U (фиг. 20). Соединим точки О' и У и обозначим через А* и
В* точки пересечения прямой
O'U с прямыми VA и VB.
Отправляясь от точек О', А*,
В*, U, построим точку Т".
В силу результата для случая
(II), прямая ТТ* проходит че-
через точку V, а в силу резуль-
результата для случая (I), прямая
Т*Т тоже проходит через
точку V. Следовательно, пря-
прямая TV проходит через точ-
точку V, и доказательство проек-
проективной инвариантности конст-
конструкции I закончено.
К изучению этой конструк-
конструкции мы вернемся позднее. За-
Заметим, однако, что при задан-
заданных точках О и U точка Т
определяется точками А и В независимо от порядка, в котором
берутся эти точки, т. е. что точка Т симметрична относительно
точек Л и Б. Действительно, после доказательства инвариантности
точки Т мы можем в качестве и использовать прямую USR. В един-
единственном случае, который нужно рассмотреть, именно, когда АфО,
ВфО, мы получаем ту же самую точку Т.
Конструкция II. В плоскости % через прямую I {фиг. 21)
проведем три прямые а, Ь, и, проходящие соответственно через
точки А, В и О, отличные от прямой I а не проходящие через
одну точку. Пусть Р—точка пересечения прямых и a a, Q —
точка пересечения прямых и и b, R — точка пересечения прямых
EQ и a, S — точка пересечения прямых OR и Ь. Тогда прямая PS
пересекает прямую I в определенной точке Т.
Ф и г. 20.
256 ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
После обоснования этой конструкции мы покажем, что положение
точки Т зависит от точек А, В, U, О, Е, но не зависит от выбора
прямых а, Ъ, и. Как и в конструкции I, мы можем выбрать три
прямые а, Ь, и, удовлетворяющие указанным выше условиям. Точки
Р и Q различны, и ни одна из них не лежит на прямой /. Точка пе-
пересечения R прямых EQ и с однозначно определена. Действительно,
в противном случае EQ = а и точка Q должна совпадать с точкой
Фиг. 21.
пересечения прямых а и Ь, так что прямые а, Ь и и должны про-
проходить через одну точку, а это не имеет места. Далее, точка R
отлична от точки О, так как точка R лежит на прямой EQ, которая
не совпадает с прямой /, потому что точка Q не лежит на этой пря-
прямой. Следовательно, прямая OR определена. Точка пересечения 5
прямых OR и Ь определена. Действительно, в противном случае мы
имели бы, что OR = b, так что В—О. А так как точка Q лежит
на прямой Ь, мы имели бы также, что QR = Ь и ? = В. Но равен-
равенство Е=Вг=О невозможно, так как точка Е отлична от точки О.
Таким образом, точка 5 определена и не совпадает с точкой Р, так
как точка Р не лежит на прямой Ь. Следовательно, прямая PS опре-
определена. А так как точка Р не лежит на прямой /, то прямая PS
пересекает прямую / в определенной точке Т. Наконец, ТфЦ. Дей-
Действительно, если T=U, то S = Q и QR=*SR. Отсюда следует,
что О = Е, что противоречит условию.
Чтобы доказать независимость положения точки Т от выбора
плоскости и и прямых а, Ь, а, мы рассмотрим сначала несколько
случаев, в которых точки Л, В, U, О, Е не все различны. Эти слу-
случаи иллюстрируются фигурами листа IV.
(I) Если А = О или В=О, то из построения видно, что Т—О.
(II) Если А = Е, то мы видим, что Т—В.
(III) Если В — Е, то мы получаем, что Т=А.
(IV) Предположим, что А = В, но что точки А и В отличны от
точек О и Е. Пусть О' = Е, U' = A = B, А' = О, В' = U. Заменяя
в конструкции I четыре точки О, U, А, В точками О', U', А', В',
17 Зак. 1230. В. Ходж в Д. Пвдо
258
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
проведем прямые ORS, UQP, BSQ соответственно через точки А', В',
U'. Используя эти прямые вместо прямых а', Ь'', и' конструкции I,
получаем, что прямая PS пересекает прямую / во вполне определен^
ной точке 7". Таким образом, положение точки Т= Т не зависит
от выбора прямых, проходящих через точки А, В, U, и является
проективным инвариантом по отношению к точкам О, Е, А — В, U.
При доказательстве единственности точки Г и ее проективной инва-
инвариантности, мы можем ограничиться теперь рассмотрением случая,
в котором точки О, Е, U, А, В попарно различны и, следовательно,
каждая прямая содержит по крайней мере пять точек. При этом
точка Т будет отлична от точек О, А, В, U.
Как и в конструкции I, можно показать, что в этом случае точки
Р, Q, R, S — различны и никакие три из них не коллинеарны. Кроме
того, ни одна из этих точек не лежит на прямой ./. Пусть тс' — про-
произвольная плоскость, проходящая через прямую /. Через точки А, В, U
проведем прямые а', Ь', а', не проходящие через одну точку и не
совпадающие с прямой /. Выполним построение точки Т и покажем,
что Т= Т.
Случай (I): ъфъ'. Треугольники PQR и P'Q'R' перспективны,
так как их соответственные стороны пересекаются в коллинеарных
точках Е, A, U. Аналогично, треугольники QRS -и Q'R'S' перспек-
перспективны, так как их соответственные стороны пересекаются в точках
О, В, Е. Следовательно, треугольники PQS и P'Q'S' перспективны,
и, значит, прямые PS, P'S'
и UB проходят через одну
точку, т. е. Т=Т'.
Случай (II): it = it'. Если
вся конфигурация содержит-
содержится в некотором пространстве
размерности п > 2, то, ис-
используя результат случая (I),
можно установить един-
единственность точки Т, сравни-
сравнивая обе эти конструкции с
некоторой третьей кон-
конструкцией в плоскости, пре-
преходящей через прямую /
и отличной от плоскости
•гс = it'. При п = 2 мы
должны поступить иначе.
Рассмотрим сначала три част-
частных случая;
(На): афа', b = b',u = u' (фиг. 22). Треугольники PRS и PrR'Sr
перспективны с центром в точке Q. Прямые PR и P'R' различны
и пересекаются только в точке А. Далее, RS=j=R'S'. Действительно,
если R = R', то /? = /?' = Л, и тогда Е = А вопреки условию. Ана-
Ф и г. 22.
§ Б. ПРОЕКТИВКО ИНВАРИАНТНЫЕ КОНСТРУКЦИИ
259
и
Фиг. 23.
логично, если 5 = S', то 05 = OS' =-.0R = OR', и, следовательно,
прямая RR' проходит через точку О, так что О — Е, что также про-
противоречит условию. Поэто-
Поэтому в случае RS = R'S' мы
должны иметь RR' = 55',
откуда Е = В. Так как это
не имеет места, то прямые
RS и R'S' пересекаются в
определенной точке О. При-
Применяя теорему Дезарга к
треугольникам PRSn P'R'S',
мы видим, что точка пере-
пересечения прямых PS и P'S'
лежит на прямой ОА, т. е.
Т= Г.
A16): а=а',ЬфЬ', и = а'
(фиг. 23). Так как ЬфЬ',
то Qt^Q' и. следовательно,
R^R'. Кроме того, RR'=
= афи = С}0,'. Далее, пря-
прямые QR и Q'R' пересекаются
в точке Е, прямые RS и ,
R'S'—в точке О, а прямые QS и Q'S''— только в точке В. Следо-
Следовательно, треугольники QRS и Q'R'S' перспективны. Но прямые QQ'
и RR' пересекаются только в
точке Р. Следовательно, точ-
точки Р, S, S' коллинеарны и
Т=Т'.
(Ив): а = а', b = b', ифи'
(фиг. 24). Пусть прямые а и b
пересекаются в точке X, пря-
прямые PS и RQ — в точке Y,
прямые P'S' и R'Q' — в точ-
точке Y'. Пусть прямая RS пере-
пересекает прямую и в точке V,
а прямая R'S' пересекает пря-
прямую и' в точке V'. Треуголь-
Треугольники RQV и R'Q'V перспек-
перспективны, так как их соответ-
соответственные стороны пересекаются
в точках U, О и Е. Так как
прямые RR' и QQ' Пересе-
Ф и г. 24.
каются только в точке X, то прямая VV также проходит через
точку X. Далее, прямая XY гармонически сопряжена с прямой XV
относительно прямых ХА и ХВ, а прямая XY' гармонически сопря-
сопряжена с прямой XV относительно той же самой пары прямых. Так
17*
200
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
как XV = XV, то точки X, Y, У коллинеарны. Рассмотрим теперь
треугольники PYQ и P'Y'Q'. В силу только что доказанного, эти
треугольники перспективны с центром в точке X. Так как прямая PQ
пересекает прямую P'Q' только в точке U, а прямая YQ— прямую Y'Q'
только в точке Е, то точка пересечения прямой PY с прямой P'Y'
должна лежать на /. Следовательно, Т= Т.
Доказав, что Т=Т в этих частных случаях, мы можем перейти,
как и выше, в конструкции I, к доказательству того, что Т=Т
для любых двух конструкций в одной плоскости, выполненных для
одних и тех же попарно различных точек О, Е, U, А, В. Так как
через каждую из точек А, В, U проходят по крайней мере четыре
прямые, отличные от прямой /, мы можем перейти от первой кон-
конструкции ко второй посредством нескольких замен одной из прямых
а, Ь,.и. При каждой замене точка Гостается неизменной, так как каждый
раз мы имеем один из рассмотренных выше частных случаев; в ко-
конечном счете мы получаем прямые а', Ь', и' второй конструкции.
Докажем теперь, что если имеется некоторое проективное соответ-
соответствие, при котором
(О, Е, U, A, В,...)^(О', E, U', А', В',...),
и если точка Т получается применением конструкции II к точкам
О', Е', W, А', В', то
(О, Е, U, А, В,'Т)-^{О', Е', U\ А', В', Г). •
Нам достаточно рассмотреть только тот случай, когда рассматривае-
рассматриваемые линейные ряды перспективны с центром в некоторой точке V.
Мы можем предполагать,
что точки О, Е, U, А, В
попарно различны, так как
случаи, в которых точки А
или В совпадают с точка-
точками О или Е, или А = В, уже
были рассмотрены. Предпо-
Предположим сперва, что
(I) 0 = 0' (фиг. 25).
Чтобы построить точки Т
и V, используем прямые
VAA' и VBB' сначала в ка-
качестве а и Ь, а затем в
качестве а' и Ь'. Пусть пря-
прямая ЕА' пересекает прямую
1 и г. 23.
Q'l
р р
VB в точке Р. Прямую UP
примем за и, точку пересе-
пересечения ее с прямой а обозначим через Q. При этом прямая QB' пере-
пересечет прямую / в точке Т. Пусть прямая Е'А пересекает прямую VB
в точке Р'. Прямую И'Р' примем за и', точку пересечения ее с пря-
§ 5. ПРОЕКТИВНО ИНЕАРИАНТНЫЕ КОНСТРУКЦИИ 231
мой а' обозначим через Q'. При этом прямая Q'B пересечет пря-
прямую /' в точке Т'. Пусть прямая ЕА' пересекает прямую Е'А
в точке X, прямая ВТ пересекает прямую В'Т в точке Y и прямая PQ
пересекает прямую P'Q' в точке Z. Наконец, точку пересечения
прямых FQ и /' и точку пересечения прямых P'Q' и / обозначим
соответственно через Н' и Н.
Рассмотрим треугольники А'РН' и АР Н. Из того, что их соот-
соответственные стороны пересекаются в точках Z, О и X, мы сможем
заключить, доказав коллинеарность этих точек, что прямая НН' про-
проходит через точку V. Но коллинеарность тонек сразу вытекает из того
факта, что треугольники EPU и E'P'U' перспективны относительно
точки V, так как соответственные стороны этих треугольников пере-
пересекаются в точках Z, О и X. Треугольники H'QB' и HQ'B также пер-
перспективны относительно точки V. Так как соответственные стороны их
пересекаются в точках Y, О, Z, то отсюда следует, что точки О, X, Y
и Z коллинеарны. Ясно, что прямая ОХ гармонически сопряжена
с прямой OV относительно прямых / и /'. Если прямая ТТ пересе-
пересекает прямую ВВ' в точке К, то прямой, гармонически сопряженной
с О К относительно прямых / и /', будет прямая OY, совпадающая
с ОХ. Следовательно, OK=OV, и прямая ТТ проходит через
точку V.
(II) Пусть теперь U=U'. Этот случай может быть получен из
только что рассмотренного, так как если мы переименуем точки
О, Е, U, А, В, полагая
(О, Ё, U, A, B) = (U, E, О, В, А),
и построим точку Г, отправляясь от точек О, Е, U, А, В, то полу-
получим, что Т= Т. Таким образом, проективная инвариантность точки Т
при U = U' вытекает из рассмотрений предыдущего случая.
Наконец, пусть прямые / и /' пересекаются в некоторой точке,
отличной от точек О и U. Обозначим через /* прямую O'U и про-
проведем доказательство в два этапа, рассматривая сначала линейные
ряды на прямых / и /*, а .затем — на прямых /* и /'. Этим доказа-
доказательство проективной инвариантности точки Г заканчивается, как и
в случае конструкции I.
Проведенные доказательства инвариантности точек Т, полученных
посредством применения конструкций I и II, могут быть при п = 2
значительно упрощены, если предположить, что каждая прямая содер-
содержит бесконечное множество точек. В этом случае можно обеспечить,
чтобы все необходимые точки пересечения в доказательствах един-
единственности были определены. С другой стороны, предположение, что
мы рассматриваем не специальный случай, упомянутый в § 4, также
приводит к упрощениям. Однако нашей целью было провести дока-
доказательства, справедливые при я = 2, без использования этих предпо-
предположений.
-262
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
В заключение этого параграфа сделаем некоторые замечания отно-
относительно рассмотренных конструкций. Заметим, что в „общих" слу-
случаях конструкций I и II фигурируют четыре лежащие в одной плоскости
точки Р, Q, R, S, никакие три из которых не коллинеарны. Эти
точки образуют четырехугольник с тремя парами противоположных
сторон PQ, RS; PS, QR; PR, QS. Точки пересечения Z, X, Y этих
пар противоположных сторон называются диагональными точками
четырехугольника, а прямые, соединяющие диагональные точки, —
его диагоналями.
Используя обычное построение точки (R, S)/Z, мы видим, что эта
точка является точкой пересечения прямых RS и XY. Следовательно,
точки X, Y и Z коллинеарны тогда и только тогда, когда мы имеем
специальный случай.
Пусть / — произвольная прямая плоскости, отличная от сторон
рассматриваемого четырехугольника. Она пересекает стороны четы-
четырехугольника в шести точ-
точках, образующих три пары,
из которых каждая соответ-
соответствует паре противополож-
противоположных сторон. Мы можем вы-
выбрать три точки из шести,
по одной из кажцой пары,
восемью различными спосо-
способами. Эти тройки можно
сопоставить по две так, что
объединенные тройки будут
покрывать все множество из
шести точек. Стороны рас-
рассматриваемого четырехуголь-
четырехугольника, которым принадлежат
точки данной тройки, либо
образуют треугольник, либо
проходят через одну точку. В первом случае мы будем называть
тройку треугольной, во второй — точечной. Например, на фиг. 26
тройка А, В, С является треугольной, а тройка А', В', С — точечной. Если
заданная тройка является треугольной (точечной), то тройка, с кото-
которой она сопоставлена, является точечной (треугольной). Если две
тройки имеют одну общую точку, они будут одинакового типа. Если
же они имеют две общих точки, то это тройки противоположных
типов.
Может, конечно, случиться, что рассматриваемые пары не вполне
различны. Предположим, например, что С = С (=Z). Тогда тройку
А, В, С можно рассматривать и как треугольную и как точечную. Это
относится и к тройке А', В', С. Тройки А, А', Сив, В', С, кото-
которые тоже имеют одну общую точку, можно рассматривать как состоя-
состоящие из двух треугольных троек каждая.
S
с-
Фиг. 26.
§ 6. РЕПЕР 263
Наши конструкции I и II являются, по существу, конструкциями
для построения по заданным пяти точкам шестой точки сеченая
четырехугольника некоторой прямой (/).
В конструкции I одна пара состоит из дважды взятой точки U,
а другая — из точек Л и В. Конструкция дает метод для определе-
определения третьей пары по заданной одной из ее точек, а именно, по
точке О. Тот факт, что треугольные тройки являются точечными
тройками, и обратно, объясняет, почему конструкция точки Т сим-
симметрична относительно точек Л и В. В конструкции II заданные
точки объединены в пары (О, U) и (Л, В) и дан один из членов Е
третьей пары. Задача состоит в построении точки Г так, чтобы
точки Е, В, LJ образовывали точечную тройку.
Обозначим сечение четырехугольника конструкции II через
Q{OEA, UTB), .
где О, Е, А есть точечная тройка, U,T,B — треугольная тройка, а точки
О к U, ? и Г, А н В являются соответственно точками пересечения
пар противоположных сторон четырехугольника PQRS с прямой. Мы
доказали, что свойство множества шеста точек быть сечением
некоторого четырехугольника Q(OEA, UTB) инвариантно при лю-
любом проективном соответствии.
§ 6. Репер
В и-мерном инцидентностном пространстве существует по крайней
мере одно множество из п-\-\ линейно независимых точек. Мы усло-
условились называть такое множество симплексом. В § 1 было доказано,
что существует точка Е, не принадлежащая ни одной из граней
симплекса ,Л0 Ап, и определены 2й*1 — 1 точек ?».... i,, каждая
из которых является единственной точкой пересечения подпростран-
подпространства Sn_k, определяемого точками Aik+V ..., Ain, E, с подпростран-
подпространством Sk, определяемым точками Ai0 Aik. Точка E{0...ik не
принадлежит ни одной из граней симплекса Ai0 ... Aik подпростран-
подпространства Sk. При этом Е{ — А( и Е0...п = Е (см. фиг. 27).
Мы определим теперь некоторое множество из п(п-\- 1)/2 точек Ftj
{i, j = 0 п; i ф j). Так как точки Л4 и Aj различны и точка Еу
отлична от каждой из этих точек, то точка, гармонически сопряжен-
лая с E}j относительно точек Л,: и Aj, однозначно определена. Она
всегда отлична от точек Л< и Aj и совпадает с ?"у тогда и только
тогда, когда мы имеем специальный случай (см. § 4). Обозначим эту
гармонически сопряженную точку через F^ = Fj{.
Чтобы построить точку F^, рассмотрим плоскость A(AjAh, про-
проходящую через прямую AtAj (фиг. 28). В этой плоскости через
точки Аь Aj и Ец проведем прямые Л^ъ AjAk, EfjAk, образующие
треугольник АкЕцкЕ$к. Так как прямые АгАк и А^Еф пересекаются
264
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
в точке Еп., то прямая EikE^k проходит через точку (At, А3)/Е^, т. е.
через^ точку Fy. Эю верно для всех значений k.
Предположим сначала, что мы рассматриваем неспециальный слу-
случай. Тогда точки Е^, Е1к, Eki не коллинеарны. Треугольники
Ап
?oi,
A, 1,2 *г
Фиг. 27.
и EjkEkiEi}- перспективны относительно точки Ei]k. Следовательно,
точки пересечения их соответственных сторон __ коллинеарны, т. е.
Фиг. 28.
точки Fik, Fki, Fi}- лежат на одной прямой. В специальном случае
точки E{j, Fjh, Ем коллинеарны и, следовательно, точки Fi:- = Etj,
Fik*=E,k и Fj,t = Eki тоже коллинеарны.
§ Г. РЕПЕР 265
Докажем теперь, что все п(п-^\I2 точек F{j лежат в некото-
некотором Sn_1. Этот результат уже установлен для случая, когда п = 2.
Докажем эту теорему индукцией по п. Предположим, что теорема
верна для соответствующей конфигурации, лежащей в ?° — грани,
противоположной вершине Ао, т. е. предположим, что точки Fy
(i, 7 = 1, ..., п) лежат в некотором Sn_9. Если все точки Foi
лежат в этом 5ге_2, то результат очевиден. Допустим, что точка Fol
не лежит в этом 5ге_9. Тогда точка Fm и подпространство Sn_2
определяют некоторую гиперплоскость Sn_1. Рассмотрим точку F0{.
Так как точки Fo(, Fo:, Fxi коллинеарны, а точки Fm и Flt лежат
в 5n_j и различны, то и точка FOt лежит в этом Sn_r Теорема
доказана.
Легко видеть, что точки F{j не могут все лежать в подпростран-
подпространстве Sk при k-Cn — l. Действительно, если предположить, что это
так, и если Ао — вершина симплекса, не принадлежащая этому Sk,
то эта вершина Ао и подпространство Sk определяют некоторое
подпространство S*+1. Это Sk+l содержит Ао и точку Fou отличную
от точки Ао. Следовательно, Sk+1 содержит прямую А0А{ и, в част-
частности, содержит точку At. Таким образом, подпространство Sk+X
{к -\- 1 < п) содержит все точки Ао, . . ., Ап, вопреки предположению
о линейной независимости этих точек. Полученные результаты остаются
справедливыми и в специальном случае.
Точки Eto...ik были построены при помощи вершин Ао, ..., Ап
и точки Е. Докажем, что обратно, если задано произвольное под-
подпространство 5П_,, не содержащее какой-нибудь из вершин, скажем Ait
то мы можем найти такую точку Е, что все точки Ftj, построенные
при помощи точки Е, будут принадлежать этому 5П_Г Пусть прямая A{Aj
пересекает Sn_t в точке F^. Если
то мы докажем, что все гиперплоскости
Ао, ..., Л(_!, Af+i, ..., Aj_i, Aj^lt ..., Ап, Cfj
пересекаются в одной точке Е (в специальном случае мы определяем
точку Ejj как такую точку, в которой прямая А{А^ пересекает Sn_1).
Пусть сначала п-*=2. Если мы имеем специальный случай, в ко-
котором Еу = (Л^, Aj)lF'у = F'jj, то построим точку Еф, проводя пря-
прямые АгАк, AjAk, Fi:jF:!kFki соответственно через точки Ait Aj, F4)
так, чтобы образовался треугольник АкРыР^к. Если Е^к есть точка
пересечения прямых Л^Р^- и AjFkU то прямая АкЕцк проходит через
точку (Ait Ajj/Fij = Ец. Так как FH = Еы, Fkj = Ekj, то очевидно,
что точка Еф удовлетворяет поставленным требованиям. Если мы
имеем не специальный случай, то Ец ф Fy и
Ak = {Eik, Fa)IAt, Ak = (Ejk, FJk)IAj.
Следовательно, прямые A{Ajt Е{кЕ^, FikF3le проходят через одну
точку, т. е. прямая» EikFjk проходит через точку Fy. Рассмотрим
266 гл- VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
треугольники AtAjAk и Е^ЕыЕц. Их соответственные стороны пере-
пересекаются в коллинеарных точках Fjk, FM, F^. Следовательно, в силу
теоремы, обратной к теореме Дезарга, эти треугольники перспек-
перспективны относительно некоторой точки Eijk, и эта точка удовлетворяет
поставленным требованиям. Легко доказать, что если бы точка Еин
лежала на одной из сторон треугольника А^АЪ то прямая FjkFk{F{3-
содержала бы одну из вершин этого треугольника, что противоречит
предположению.
Допустим теперь, что наше утверждение верно для каждой грани ?',
и построим соответствующие точки ?o...*-i, «+i ...п- Если 1ф}, то
лрямые A^?0...i-i, i+i-..п и AiE0...j-i, j+i ...п имеют общую точку
Д>... <-i, <+i...i-i, я-i...n- Следовательно, прямые Л«Е0...«-1, «+i...n
и AjEo... j-uj+i ...п пересекаются. Это верно для всех значений i nj.
Так как все эти прямые не могут лежать в одной плоскости, то они
все должны проходить через некоторую точку Е. Эта точка не лежит
ни на одной из граней ?*. От точки Е и вершин Ао Ап мы
вернемся к точкам Fy, выполнив конструкцию, приведенную в начале
этого параграфа.
Рассмотренную конфигурацию .мы будем называть репером про-
пространства.
Как мы видели (§ 3, теорема I), между двумя рядами точек
прямых / и /' можно установить такое проективное соответствие, при
котором три различные наперед заданные точки прямой / переходят
в три различные наперед заданные точки прямой /'. Кроме того, мы
видели, что эту теорему нельзя обобщить на произвольные четыре
пары соответственных точек. Но мы не знаем пока, будет ли такое
проективное соответствие однозначно определено заданием трех пар
соответственных точек.
Можно установить некоторое соответствие между рядами точек
любых двух прямых AtAj и AhAk нашего репера так, чтобы точки
Аи Aj, Ejj отвечали соответственно точкам Ah, Ak, Ehk. Мы хотим,
однако, сделать это таким образом, чтобы выполнялось следующее
условие: если AtAj, AhAk и AtAm— три прямые, между которыми
установлены такие соответствия, и если точка Ру отвечает точке Phk,
а точка Phk— точке Р1т, то точка Рц также отвечает точке РЬп
{,Рц, Ptik, Рш принадлежат соответственно прямым A(Aj, АьАк и АгАт).
Делаем это следующим образом.
Пусть Tjk — оператор проектирования прямой AtAj на прямую
АцАк из вершины Fjk, которая в специальном случае совпадает с Ejk.
Результат последовательного выполнения проектирования Т}ц и проек-
проектирования Т\1 или Ти будем обозначать соответственно через TJkTii
или через TJkTu. Заметим, что произведение TJkTbC определено в том
и только в том случае, если
(г, к) = (а, Ь) или (i, k) = (b, a).
§ 6. РЕПЕР
267
Так как оператор TjkTkj состоит из проектирования прямой AiAj на
прямую AtAk и последующего обратного проектирования, мы будем
писать 7^7^=1, где 1, как обычно, обозначает тождественное
преобразование.
Теперь мы можем перейти от точек (Ait Aj, Е^) к точкам
(Ah, 'А^, Enk) при помощи нескольких проектирований Т"с. Мы хотим
показать, что это соответствие между рассматриваемыми линей-
линейными рядами не зависит от выбора последовательности проек-
тирозаний. Сначала рассмотрим преобразование точек прямой A^Aj,
определяемое следующим образом: *
(I) TjicTijTii — Hij. Пусть Pij — произвольная точка прямой AiAj
(фиг. 29), и пусть прямая F^Py пересекает прямую AtAk в точке PkU
FijPut пересекает А$Ак в точке Pjk, a F^P^ пересекает A{Aj
в точке Р'ц. Нц является преобразованием точек прямой AtAj в точки
прямой AtAj. Легко видеть, что
Рассмотрим теперь произвольную точку Ру прямой A(Aj. Легко
доказать, что точки Рц, Ры, Pjky Pij попарно различны.
Пусть прямая PkiPij пересекает прямую Р-^тРц в точке К. Дока-
Докажем сначала, что прямая АкК проходит через точку Е^. Мы можем
построить точку, гармони-
гармонически сопряженную с точ-
точкой F{j относительно А{ и
Aj, проводя прямые А{Ак,
AjAk, F^PjcfP^ через точки к_ РЛ1
Ait Aj, Ftj. Отсюда сле-
следует, что прямые A{Pjk и
AjPki пересекаются на пря-
прямой, соединяющей точку Ак
с точкой (А{, Aj)/F{j, т. е.
с точкой Etj. Рассмотрим
теперь треугольники AiAjAk
и PjkPkiK (которые являются
треугольниками в собствен-
собственном смысле слова, даже в
специальном случае). Их
соответственные стороны пе-
пересекаются в точках Fjk, Fki,
F(j, и, следовательно, в си- Фиг 29
лу теоремы, обратной к тео-
теореме Дезарга, прямые AtPjk и AjPki пересекаются на прямой АкК,
которая должна поэтому совпадать с прямой AkEtj.
Треугольники EikEjkAk и РцРцК перспективны, так как их соот-
соответственные стороны пересекаются в к оллинеарных точках Fjk, FM, F^,
268 rjI- VI- СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Следовательно, прямые EikPj- и Е-кР^ пересекаются на прямой
KAk = ЕцАь- Треугольники Ец,Е^Ак и Pi-P'ij К также перспективны,
так как их соответственные стороны пересекаются в точках Р^,
Ры, Fij- Следовательно, прямые ЕаРц, Е^Рц и КАк— EfjAk про-
проходят через одну точку. Из этих результатов мы получаем простую
конструкцию для преобразования Н^\ пусть прямая РцЕ^ пересекает
прямую AjfEjj в точке Q; тогда EiJcQ пересекает AtAj в точке Р^.
Мы получаем также следующие свойства преобразования Я^-:
Далее, мы имеем
(а) Яу = Я,,,
(б) (Я,/=1.
7 Л Т* rrii т_Т *Т»? rriff «ч,? i-pi
}кПЦс= 1;кПы= ljkUjJkiljk
Т. е.
(в) ТрНнс =• HijTjif.
Наконец, если Ah — любая вершина, отличная от Аи Aj, Ak, и
плоскость А(А;Ак проектируется из Fnk на плоскость АгАЛъ, то
точки Аь А.;, Ар, Pjj, Fjk, F,p Fik проектируются соответственно
в точки At, Aj, Ah, P,j, Fih, Fy, Fih. Следовательно, конфигурация
прямых плоскости AtAjAk, определяющая преобразование Я,-,-, проекти-
проектируется в конфигурацию прямых плоскости А{А;АЬ, определяющую
преобразование в этой плоскости. Так как точка Р,$ проектируется
в точку Рц, то преобразование Я„- не зависит от третьей вершины Ак,
при помощи которой оно определено.
Заметим, между прочим, что если мы имеем неспециальный слу-
случай, так что Ejj Ф F^j, то Pi- можно определить как {Е^, F^/P^.
Второй тип преобразования есть Т?кТ\ъ. Мы докажем, что
(H)TJkTih=TJh. Пусть 7& (/>„) = Л* и Tih(Pik) = Pih. Мы
хотим доказать, что Т]ь(Pi3) = Pjh- Предположим, что Р{,-фЕц, так
как в противном случае результат тривиален. Треугольники РцР^Р^
и Ej$EikEih перспективны относительно точки At. Следовательно, их
соответственные стороны пересекаются в коллинеарных точках. Двумя
из этих точек являются Fjk и Fkh. Следовательно, прямая FjkFkh про-
проходит через точку пересечения прямых PijP,h и EfjEih. Но прямые
Ei}Eib и FlkFkh пересекаются только в точке Fjb, а значит, прямая
PijPih проходит через Fih. Таким образом, Т*Н(Р^) = Р1Н.
Наконец, если числа i, j, h, k попарно различны, мы докажем, что
(III) TjkTih = т{ьТ$к. Оба рассматриваемые преобразования пере-
переводят ряд точек прямой A4Aj (фиг. 30) в ряд точек прямой AhAk
так, что точки А{, Ei0-, Aj преобразуются соответственно в точки
§ 6. РЕПЕР
269
Ah, Ehk, Ak. Пусть P;j — любая другая точка прямой AtAj, и пусть
т1*(Рц) = Р№ Ткгп{Рш) = Рмс-
Если Т1н(Рф = Р^н, то мы докажем, что Т% (Pjh) = Рш.
Прямая PijPjh проходит через точку Fih, а прямая PikPhk про-
проходит через точку Fih. Следовательно, эти две прямые (если, как мы
предположили, Ру ф Аь то
эти прямые различны) лежат ЛА;
в одной плоскости. Поэтому
прямые P4Pik и PjhP№ пе-
пересекаются. Так как одна
из них лежит в плоскости
AtAAk, а другая —в пло-
плоскости AhAAk, то эти пря-
прямые могут пересечься только
на линии пересечения этих
плоскостей, т. е. на прямой
AjAk. Но так как PtJ Ф Aj,
то прямая Pi:Pik пересекает
AjAk только в точке Fjk. Сле-
Следовательно, прямая PjnPf,k
проходит через Fjk, т. е.
(jk) b»
Мы используем эти три Ф и г. 30.
типа преобразований для то-
того, чтобы доказать основную теорему этого параграфа. Рассмотрим две
последовательности преобразований Тгк, которые переводят ряд точек
прямой ApAq в ряд точек прямой Л,д\ак, что точки Ар, Epq, Aq пре-
преобразуются соответственно в Аг, ЕГа, А_. Мы хотим доказать, что
результирующие преобразования тождественны. Пусть
—-одна последовательность преобразований, а
тр „г-
1 ql' I m'n' • • •
— другая. Так как
{Tqi'Tm'n' ¦ • ¦) =(. . . Tn'm' T'lq),
то достаточно доказать следующую теорему:
Теорема I. Результат любой последовательности преобразо-
преобразований Tjic, преобразующих прямую АаАъ в себя таким образом,
что точки Аа, Аь (и, следовательно, точка ЕаЬ) остаются на
месте, язляется тождественным преобразованием.
Пусть последовательность содержит только два преобразования.
Для того чтобы точки Аа и Аь сами себе соответствовали, эти преоб-
270 ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
разования должны иметь вид или Тье^сь, или ТасТса. Как мы уже
видели, каждое из этих преобразований является тождественным.
В случае если последовательность содержит более чем два преобра-
преобразования, рассмотрим любую подпоследовательность трех из них. Если
двум соседним преобразованиям выбранной тройки отвечают одни и
те же верхние индексы, то мы можем заменить эти два преобра-
преобразования одним, используя результат (II). Значит, остается рассмотреть
только последовательность вида
Здесь может представиться несколько случаев.
(а) l = j, m = i. В силу (I), эту последовательность можно за-
заменить на Нц. Если этому предшествует |одно из преобразований
последовательности, то им должно быть либо Г*,-, либо TJ. В обоих
случаях мы можем использовать результат (I) (в), чтобы продвинуть
преобразование Н^ по направлению к началу последовательности. Если
оно уже достигло этого положения, то это должно быть преобразо-
преобразование НаЪ.
(б) / = у, m Ф L Тогда
Tfj = (в силу (III) )
* =7?,7? (в силу (II))
(в) Если 1ф j, мы имеем, аналогично,
Т]кт!1Тгкт=^кт1т= (в силу (III»
= Т{гт}т. (в силу (II))
Таким образом, во всех трех случаях мы можем уменьшить число
преобразований в последовательности. Вся последовательность преоб-
преобразований может быть приведена к одной из следующих форм:
(НаЬУ, {На1)'т%с, {НаЬ)°ПеТсаЬ (о = 0 или 1).
Только первое из этих преобразований оставляет точки Аа и Аь
на месте, и то только тогда, когда о = 0. Следовательно, мы можем
привести любую последовательность преобразований к тождественному
преобразованию, что и доказывает теорему.
Эта теорема дает возможность установить Однозначно определен-
определенное проективное соответствие между рядами точек любых двух пря-
прямых АаАь и A{Aj так, чтобы точки Аа, ЕаЪ, Аь отвечали точкам Ait
Еу, Aj. Это проективное соответствие будет использовано в даль-
дальнейшем. Мы будем обозначать его через Tff. При этом Т$> = 1 и
*Ъа = Наъ.
§ 7. АЛГЕБРА ТОЧЕК НА ПРЯМОЙ
271
§ 7. Алгебра точек на прямой
В § 5 мы рассмотрели две проективно инвариантные конструкции.-
Мы используем их теперь для построения некоторого тела, при
помощи которого в следующем параграфе введем в нашем простран-
пространстве координаты.
Эти конструкции зависят от выбора трех, различных точек О, Е, U
на некоторой прямой /. Выбор этих точек мы назовем установлением
шкалы на прямой /. Каждой из наших конструкций определяется
некоторая точка прямой / для любых двух точек А и В этой прямой,
ни одна из которых не совпадает с точкой U. Определяемые точки
также всегда отличны от U. Мы имеем, следовательно, два закона
композиции для точек прямой /, отличных от точки U. Рассмотрим
эти законы композиции отдельно.
Конструкция I симметрична относительно точек А и В. Получае-
Получаемую при помощи нее точку обозначим через А-\-В. Покажем, что
этот закон сложения ассоциативен.
Пусть А, В, С—три точки прямой /. Если одна из этих точек
совпадает с точкой О, то наше утверждение очевидно. Поэтому мы
можем ограничиться случаем, в котором все эти точки отличны от О.
Для построения точки Т—А-\-В выполним обычную конструкцию,
используя обозначения § 5. Чтобы построить точку Г-j-C, проведем
через Т прямую TSP и предположим, что прямая 05 пересекает
в тс гт
Фиг. 31.
прямую UQ в точке Q', которая непременно отлична от 5 (фиг. 31).
Если прямая CQ' пересекает прямую US в точке S', то прямая PS'
пересекает / в точке Т, причем
На той же фигуре прямая QS' пересекает прямую /в точке Т'=В-\-С.
Построим точку А -\- Т при помощи прямых ARP, TS'Q и ORQ.
272
ГЛ. VI. СИЛТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Тогда прямая PS' пересечет прямую / в точке А -\~ Т'. Но это точка Т.
Следовательно, А + (В -\- С) ~ (А -\- В) -\- С.
Мы уже видели, что если А — произвольная точка прямой /, отлич-
отличная от U, то
Покажем теперь, что для любых двух точек А и В прямой /
(отличных от точки U) существует такая точка X прямой /, также
отличная от U, что
Достаточно показать, что существует такая точка Y, что
A-\-Y=O.
Действительно, если точка У обладает этим свойством, то точка
удовлетворяет нашим требованиям. Пусть А' = (О, U)jA. Тогда, при
обычном построении гармонически сопряженной точки (фиг. 32), пря-
прямые ARS и A'PQ проходят
через точки А и А', прямая
ORQ пересекается с ними
соответственно в точках R
и Q, прямые UQ и UR пе-
пересекают их в точках S и
Р, а прямая PS пересекает
прямую / в тачке А-\-А'.
Следовательно,
Ф и г. 32.
и А' является искомой точ-
точкой Y. Так как A-\-Y—O,
то мы будем обычно обо-
обозначать точку Y через —А,
а точку 5-f-( — А) через
В — А. Мы доказали сле-
следующую теорему:
Теорема 1. Точки прямой I, отличные от точки U, образуют
коммутативную группу относительно сложения.
Рассмотрим теперь конструкцию II § 5, которая также дает неко-
некоторый закон композиции для точек прямой /, отличных от точки U.
Мы будем называть его умножением и введем обозначение Т—А • В.
Докажем, что это умножение ассоциативно. Легко проверить, что
если одна из точек А, В, С совпадает с О или Е, то
А •(Й-С) = (Л В)-С.
§ 7. АЛГЕБРА ТОЧЕК НА ПРЯМОЙ
273
Следовательно, мы можем предполагать, что ни одна из точек А, В, С
не совпадает с О или с Е (фиг. 33). Проведем через О и U две
прямые OU' и UU', пересекающиеся в точке U'. Через точку А
проведем прямую ARP, пересекающую прямые OU' и UU' соответ-
соответственно в точках R и Р. Пусть, далее, прямая ER пересекает пря-
прямую UU' в точке Q, QB пересекает OU' в точке S, ES пересекает
прямую UU' в точке Q', a CQ', пересекает OU' в точке S''. Пусть,
наконец, прямые PS, QS' и PS' пересекают прямую / в точках Т,
Г к Т.
Рассматривая четырехугольник PQSR, мы видим, что Т=А-В,
а из четырехугольника PQ'S'S — что Т — Т-С. С другой стороны,
из четырехугольника QQ'S'S мы видим, что Т = ВС, а из четы-
четырехугольника PQS'R — что Т = А • Т. Следовательно,
Умножение, кроме того, дистрибутивно относительно сложения:
С-(А-\-В)=С-А+С-В.
Докажем это. В плоскости, проходящей через прямую /, возьмем
точку Z и точку Y, лежащую на прямой ZU (фиг.. 34). Проведем
прямые YB, YА и ZC. Пусть прямая YE пересекает прямую ZC
в точке С, а прямая ОС пересекает прямые YB и YA соответственно
в точках Р' и Р. Пусть, далее, прямые ZP' и ZP пересекают пря-
прямую OU соответственно в точках В' и А', прямые UP и UP1 пе-
пересекают прямые ZP' и ZP в точках R' и R и те же самые пря-
прямые пересекают YP' и YP в точках Q' и Q.
Так как соответственные стороны треугольников PQR и P'Q'R'
пересекаются в коллинеарных точках U, Z, Y, то из теоремы, обратной
18 Зак. 1230. В. Ходж и Д. Пидо
274
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
к теореме Дезарга, следует, что прямая QQ' проходит через
точку пересечения F прямых РР1 и RR'. Далее, если прямые CY
и CZ пересекают прямые QQ' и RR' в точках Н и К, то прямая
КН проходит через точку пересечения U прямых YZ и Q'R', так
О Е
как соответственные стороны треугольников YHQ' и ZKR' пере-
пересекаются в коллинеарных точках F, Р', С
Теперь мы.можем доказать нашу теорему. Обозначая точки пере-
пересечения прямых QQ' и RR' с прямой / соответственно через 5 и М,
мы видим из четырехугольника QPQ'P', что S^=A-\-B, а из четы-
четырехугольника CFHK— что M—CS — C'(A-{-B). С другой сто-
стороны, рассматривая четырехугольники CPYZ, С P'YZ и P'RPR',
получаем, что А' = С • А, В' = С • В и М = А' -\- В'. Мы доказали, та-
таким образом, равенство
С-(А-\-В) = С ¦
Точно так же можно доказать, что
(Л-j- В) • С = Л
Как мы уже видели в § 5,
В.
С.
Следовательно, точка Е ведет себя как единица относительно умно-
умножения. Наконец, если А есть произвольная точка прямой /, отличная
от точки О (и от U), мы можем построить обратную ей точку А*,
такую, что
А А* = Е = А*-А.
§ 1. алгебра точек на прямой-
275
Фиг. 35.
Построение точки Л*, так же как и доказательство ее свойств,
ясно из фиг. 35.
Полученные результаты показывают, что в множество точек пря-
прямой /, без точки U, можно ввести два закона композиции — закон
сложения и закон умножения, относительно которых эти точки обра-
образуют тело. В этом теле точка
О является нулем, точка Е—
единицей. Мы суммируем
полученные результаты в
виде следующей теоремы:
Теорема II. Точки пря-
прямой I, отличные от U, обра-
образуют тело относительно
законов композиции,опреде- А
ляемых конструкциями I
и II.
Прежде чем переходить
к дальнейшему, докажем
используемый ниже резуль-
результат относительно построения
элемента Л*, обратного к Л-
Пусть прямые RS и QP пересекаются в точке Z (фиг. 36), а [пря-
[прямые QS и RP — в точке X, и пусть прямая ZX пересекает прямую /
в точке F. Так как прямая ZE является гармонически сопряженной
с прямой. ZX относительно
прямых ZP и ZR, то F =
= (О, U)/E. Далее, прямые
XS и XR гармонически со-
сопряжены относительно пря-
прямых ХЕ и XZ. Следова-
Следовательно, точки Л* и Л гар-
гармонически сопряжены отно-
относительно точек Ей F. Иными
словами, мы имеем (если
исключить специальный слу-
случай) следующую теорему:
Теорема III. Если
точка F гармонически со-
сопряжена с точкой Е отно-
относительно точек О и U, то
точка Л*, обратная к А,
может быть определена как гармонически сопряженная с точ-
точкой А относительно Е и F.
Возвращаясь теперь к рассмотрению построенного тела, мы заме-
заметим, что оно было определено посредством выбора на прямой / упо-
упорядоченной тройки точек О, Е, U. Обозначим определяемое этими
Ф и г. 36.
18*
276 f л. Vi. сйнтётическое|6п1>едеЛ6нйй
точками тело через К (О, Е, U). Если О', Е', U' — любая другая
упорядоченная тройка точек на прямой /', то мы можем таким же
образом построить тело К (О', Е', U'). Далее, существует проектив-
проективное соответствие, переводящее ряд точек прямой / в ряд точек пря-
прямой /' так, что точки О, Е, U переходят соответственно в точки О',
Е', U'. При этом, если точки Р, Q,... первого ряда (отличные от
точки U) соответствуют точкам Р1, Q',... второго ряда, то точка Р -f- Q
соответствует,точке Р' -\- Q' и точка Р ¦ Q соответствует точке Р' • Q'.
Действительно, мы доказали, что конструкции I и II проективно
инвариантны. Следовательно, между элементами тел К (О, Е, U)
и К (О', Е', U') существует некоторое взаимно однозначное соответ-
соответствие, являющееся изоморфизмом.
В частности, существует некоторое проективное соответствие,
отображающее прямую / на себя так, что точки О, Е, U остаются
на месте. Этим определяется некоторый автоморфизм тела К (О, Е, U),
который будет тождественным только в том случае, если соответ-
соответствующее проективное преобразование является тождественным про-
проективным преобразованием.
Так как все тела, которые мы можем построить посредством
установления шкалы на произвольной прямой / в пространстве Sn,
изоморфны между собой, мы можем назвать любое тело, изоморфное
им, телом этой геометрии. Существует, конечно, и другое тело,
для которого сложение определяется, как и выше, посредством кон-
конструкции Г, а умножение — посредством конструкции II с изменением
ролей точек А и В. Это второе тело инверсно изоморфно (гл. V, § 1)
телу геометрии.
§ 8. Представление инцидентностного пространства
в виде пространства Рп(К)
Теперь мы можем ввести в пространстве Sn систему координат.
Для этого мы прежде всего выберем некоторый репер (§ 6),
используя введенные выше обозначения. На каждой прямой A{Aj
имеются три точки Аи Aj, Е^. Возьмем их в качестве точек О, U, Е
и определим с их помощью соответствующее тело так, как это де-
делалось в предыдущем параграфе. Все получаемые таким путем тела
изоморфны друг другу, а определенное в § 6 преобразование Т%%
устанавливает некоторый изоморфизм между телами
К(Аа, ЕаЬ, Аь) и К(АС, Eed, Ad)
однозначным образом. Это означает, что если К есть тело геомет-
геометрии, то мы имеем для каждого выбора а и b однозначным образом
установленное соответствие между точками прямой АаАь (отличными
от точки Аь) и элементами тела К, при котором точка Аа соответ-
соответствует нулю. Элемент тела К, соответствующий точке Р прямой АаАь,
§ 8. ПРЕДСТАВЛЕНИЕ ИНЦИДЕНТНОСТНОГО ПРОСТРАНСТВА 277
мы будем называть координатой точки Р в шкале (Аа, ЕаЬ, Аь)
или, короче, если это не может привести к недоразумению — коор-
координатой точки Р. Координатой точки ЕаЬ всегда будет 1.
Если точка Р отлична от точек Аа и Аъ и а есть координата
точки Р в шкале (Аа, ЕаЬ, Аь), то координата а* этой точки в шка-
шкале {Аь, ЕЬа, Аа) в неспециальном случае определяется следующим
образом. Преобразование 7ta переводит точку Р в точку Р*, причем
точки Р и Р* гармонически сопряжены относительно точек ЕаЬ
и Fab (§ 6) (конечно, это преобразование переводит точку Р*
в точку Р). Но (§ 7, теорема III) если точки Р и Р* гармонически
сопряжены относительно точек ЕаЬ и Fah, то соответствующие эле-
элементы тела К взаимно обратны. Так как координата точки Р*
в шкале (Аа, ЕаЬ, Аь) является координатой точки Р в шкале (Аь,
ЕЬа, Аа), то координатой точки Р в этой последней шкале будет
элемент а* —а'1. Следовательно, справедлива
Теорема I. Если Р — произвольная точка прямой АаАь, от-
отличная от точек Аа и Аь, а а и а* — ее координаты в шкалах
(Аа, ЕаЬ, Аь) и (Аь, Еы, Аа), то аа* = 1.
Эта теорема верна также и в специальном случае, исключенном
в предыдущем доказательстве. Чтобы убедиться в этом, заметим
сначала, что в специальном случае конфигурация фиг. 36 обладает
следующими свойствами: точки Р, Е, S коллинеарны и лежат на
сторонах треугольника OZU. Следовательно, прямые OP, ZE и US
проходят через одну точку. Обозначим эту точку через Т. Далее, точки
Z, Е, X коллинеарны. Идентифицируем теперь эту конфигурацию с кон-
конфигурацией фиг. 29, отождествляя точки О, U, Z, Т соответственно
с точками Аи Aj, Ak, Е^к. При этом точки Е, Р, S отожде-
отождествляются с точками Eij, Ejk, Eki. Мы видели в § 6, что если Ру
есть произвольная точка прямой AtAj, то точка Р'ц, отвечающая
точке Pfj в преобразовании H,j, переводящем точки Аь Е^, А$ соот-
соответственно в точки Aj, Ej(, At, получается из условия, что точка
пересечения прямой Е1кР^- с прямой Е<ЬР'^ лежит на прямой АкЕ^.
Вернемся теперь к фиг. 36 с установленной выше идентификацией.
Точка А', соответствующая точке А, находится следующим образом:
если прямая АР пересекает прямую ZE в точке X, то прямая XS
пересечет прямую / в точке А'. Но отсюда следует, что А* = А'.
Таким образом, теорема I остается справедливой и в специальном случае.
Рассмотрим теперь произвольную точку Р пространства и пред-
предположим сначала, что она не лежит ни на одной из граней сим-
симплекса Ао, ..., Ап. Используя точку Р вместо Е в конструкции § 6,
получим последовательность точек
Pi.Pii.PiSt
где точка Р,- ... < лежит в ^-мерном подпространстве, определяе-
определяемом точками Ai A{ но не лежит ни на одной из граней
278
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
симплекса, образуемого этими точками. Так как точка Ру = Pj{ лежит
на прямой A4Aj и отлична от точек At и А], то она имеет некото-
некоторую координату в каждой из шкал (А{, Efj, Aj) и (Aj, E$h А{).
Обозначим эти координаты соответственно через pjt и pfy, тогда,
в силу доказанной выше теоремы,
— 1-
Теорема< Н. Если числа i, j, k попарно различны, то
Пусть прямая FjkPki (фиг. 37) пересекается с прямой AtAj
в точке Qki, а прямая FMQki пересекается с прямой AjAk в точке Rki.
Очевидно, что TjkPk{ = Rk{ и, следовательно, координатой
точки Rki в шкале (Aj, Ejk, Ak) будет р{к. Аналогично, если
прямая PijFki пересекает прямую
AjAk в точке Qfj, то TfkPtj = Qfj,
и координатой точки Q,-;- в шкале
(Aj, Ejk, Ak) будет p{j.
Пользуясь этими предвари-
предварительными замечаниями, докажем
следующую лемму:
Лемма. Точка пересечения
прямых QkiEjk и PvPjk лежит
на прямой А^Ак.
Точка Ejk, гармонически со-
сопряженная с Fjk относительно Aj
и Ак, может быть построена при
помощи прямых AjAit AkA{ и
FjkQkiPH. Следовательно, прямые
AjPM и AkQki пересекаются в не-
некоторой точке X, лежащей на
прямой AtEjk.
Рассмотрим теперь треугольники EjkPjkAt и QkiPijAk. Их соот-
соответственные стороны пересекаются в точках Рф, X, Aj. Эти точки
коллинеарны, и, следовательно, треугольники перспективны. Центр
перспективы Y лежит на прямой А{Ак и является точкой пересече-
пересечения прямых QkiEjk и PijPjic- Это и доказывает лемму.
Мы возьмем теперь (Aj, Ejk, Ak) в качестве шкалы на прямой
AjAk и построим произведение Rki • Pjk при помощи конструкции И,
используя четырехугольник F^YQ^P^. Прямая AjAk пересекает пары
противоположных сторон этого четырехугольника в парах точек Aj,
Ац'> Rki> Pjk'y Щъ Qij- Следовательно,
поэтому
ф и r 37
§8. ПРЕДСТАВЛЕНИЕ ИНЦИДЕНТНОСТНОГО ПРОСТРАНСТВА 279
или, в силу теоремы I,
PikPKjPji = PtjPji — 1,
что и доказывает теорему.
Далее, если х0 есть произвольный отличный от нуля элемент
тела К, положим
Тогда, так как
т. е.
мы получаем, что
Совокупность эквивалентных между собой справа (п-\- 1)-строк
(х0, xit .... хп),
определяемых для различных элементов х0, дает координаты точки Р
относительно заданного репера.
Предположим теперь, что точка Р лежит в подпространстве,
определяемом точками At , ..., Л< , но не лежит ни на одной из
граней определяемого этими точками А-мерного симплекса. Если мы
построим репер этого подпространства, отправляясь от точки Е{ ... < ,
мы получим, как и выше, совокупность эквивалентных между собой
(А-|- 1)-*строк (xt , . ..', xi ) в качестве координат точки Р относи-
относительного репера этого fe-мерного подпространства. Координаты
(Уо> • • • > Уп) точки Р относительно репера пространства Sn опреде-
определятся тогда следующим образом:
У< = xt (i = i0, .... /j),
yt => 0 (/ Ф1О ik).
Мы видим, что если точка Р не лежит ни на одной из граней сим-
симплекса Ао Ап, то это определение совпадает с введенным выше
определением координат точки Р. Действительно, если (у0 уп)
— координаты точки Р, то равенство yt = 0 имеет место тогда и
только тогда, когда для каждого j Ф i подпространство, определя-
определяемое точками
¦^0 ^f-li -"f+l "j-l> j + i> ••¦> ¦"»> ' '
пересекает прямую AtAj в точке Aj или когда все эти точки
линейно зависимы. В самом деле, это пересечение является точкой
Рф а в шкале (Лу, Ец, А{) координатой точки Рц будет ptj — ytyj .
Если Рц = Aj, то
280 гл- VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
и, следовательно, yt — 0. Иными словами, для того чтобы точка Р
лежала в подпространстве, определяемом точками Ai , .... At., и не
лежала ни на одной из граней этого симплекса, необходимо и до-
достаточно, чтобы точки
Ао, ..., At_lt А{+1, ..., Aj_t, Aj+1 Ап, Р (i'¦ Ф /0, ..., ik)
были линейно независимы и определяли подпространство, пересекаю-
пересекающее прямую A{Aj в точке Л;, где j принимает значения /0 ik.
Если точка J3 не лежит в подпространстве А< А{ , то
ft+1 П
подпространство А(к , ..., Ai t P пересекает подпространство
Aia, . .., Aifc в некоторой точке Pio...ik с координатами (z0, ..., zn)t
где
г*1 = У^ V = ° fe)> ztj^0 (У = ^+1 я).
Доказательство этого факта мы оставляем читателю.
Покажем теперь, что любая совокупность эквивалентных между
собой справа (п -f- \)-строк соответствует одной и только одной
точке Р пространства.
Пусть (х0, ..., хп)—произвольная («-f~ 1)-строка этой совокуп-
совокупности. Если
то точка" Р должна принадлежать й-мерному подпространству, опре-
определяемому точками /4<о, . .., А(к. Мы можем, следовательно, пред-
предположить, что ни одно из х{ не равно нулю.
На прямой A0At установим шкалу (Ло, Еф А(). Пусть Р4 — точка
прямой A0At, имеющая в этой. шкале координату х^1. По предпо-
предположению, Р1,ф Ai{i=0, .. ., п). Покажем, что п гиперплоскостей,
определяемых точками At,..., A{_u Ai+1,..., An, Pit имеют
единственную общую точку Р. Мы докажем это индукцией по п.
При п = 2 результат тривиален, ибо две прямые пересекаются
в единственной точке. Предположим, что теорема верна для (п—1)-
мерных подпространств, в частности для подпространства, определяе-
определяемого точками Ао An_v Тогда п— 1 подпространств S^-i, опре-
определяемых точками
At, ..., At_lt Ai+1 Ап, Pf 0=1, .... и — 1),
пересекаются по некоторому подпространству 5^.. Последнее, по пред-
предположению, пересекается с подпространством Sn_t, определяемым точ-
точками Ао, ..., Ап_и в единственной точке R. Действительно, под-
подпространство 5re_i пересекает подпространство Sn_lt определяемое
точками Ао Ап_1г по подпространству 5„_в, определяемому точ-
точками Ах Ai_v A{+1, ..., An_v Pt. Точка R не лежит ни на
одной из граней симплекса Ао, .... Ап_у Далее, прямая AnR не лежит
§ 8. ПРЕДСТАВЛЕНИЕ ИНЦИДЕНТЫОСТНОГО ПРОСТРАНСТВА 281
в подпространстве Sn-i, определяемом точками Ар ..., Л»^, Рп. Сле-
Следовательно, она пересекает это подпространство в единственной точке,
которая и будет искомой точкой Р. Очевидно, что точка Р имеет
координаты (х0 хп).
Теперь мы выведем условие коллинеарности трех точек. Докажем
следующую теорему:
Теорема III. Три точки Р = (х0, .... хп), Q = (y0, -..,.у„)
и R = (z0 zn) коллинеарны тогда и только тогда, когда ранг
матрицы
щ
*» Уп *п I
меньше трех.
Если ранг матрицы A) равен единице, то три (я-f- 1)-строки, опре-
определяемые столбцами этой матрицы, эквивалентны, и три точки Р, Q
и R совпадают. Обратно, если эти точки совпадают, то ранг матрицы,
очевидно, равен единице. Следовательно, этот случай мы можем опу-
опустить.
Аналогично, при доказательстве необходимости условия мы можем
опустить случай, когда две из взятых точек совпадают.
Если ранг матрицы A) не меньше двух, то в ней найдутся по
крайней мере две линейно независимые строки. Без ограничения
общности мы можем предположить, что линейно независимы первые
две строки. Тогда для того, чтобы эта матрица имела ранг 2, необхо-
необходимо и достаточно, чтобы все остальные ее строки линейно зави-
зависели от первых двух.
(I) Докажем сначала, что условие, сформулированное в теореме 111,
необходимо. В силу только что сказанного, для этого достаточно про-
проверить, что если Р, Q, R — различные коллинеарные точки, такие,
что левосторонние векторы (х0, у0, z0) и (хи ylt zt) линейно незави-
независимы, то все остальные строки матрицы A), рассматриваемые как
левосторонние векторы, линейно зависят от этих двух. Прежде всего
мы покажем, что эта упрощенная форма предпосылки влечет за собой
то, что прямая PQR не пересекает подпространства, определяемого
точками Л2, .... At_v A{+i, ..., Лп(г>2). Если точки Р, Q, R
все лежат в этом подпространстве, то'
и, следовательно, первые две строки матрицы A) состоят из одних
нулей, вопреки предположению. Предположим, далее, что прямая PQR
пересекает подпространство, определяемое точками А2, ..., Л<_л,
Ai+1 Ап, в одной точке. Тогда подпространство 5„_2, содержа-
содержащее указанное подпространство и прямую PQR, пересекает плоскость
282 гл- VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
AqA^ в единственной точке, скажем в 5. Если точка Р лежит в под-
подпространстве А,, ..., A{_lt Ai+1, .... Ап, то
*0 = *1 = Xi =
а если она не лежит в нем, то будет определена точка Poli, совпа-
совпадающая с S. Аналогичное рассуждение можно применить и к точ-
точкам Q и R. Следовательно, во всех случаях
где лючка S имеет координаты
тому ранг матрицы
xi Ух
* i У i
равен 1. Мы получили, что первые две строки матрицы A) линейно
зависимы, вопреки предположению.
Так как из линейной независимости векторов (х0, у0, г0) и (xv yt, zt)
вытекает, как было показано, что прямая PQR не пересекает под-
подпространства, определяемого точками Л2, А3 Ai-i, At+i> • • •» А»>
то коллинеарные точки Poli, Q01i, Rol{ различны. Для упрощения за-
записи обозначим эти точки через Р', Q', R'. Покажем теперь, что из
коллинеарности этих трех точек вытекает, что f'-я строка мат-
матрицы A) линейно зависит от первых двух ее строк.
Если прямая P'Q'R' лежит на одной из сторон треугольника
А0А{Аи то
Xj — yj = Zj = О (У = 0, 1 или /)
и матрица
(Ч Уо zo\
Л «, B)
имеет ранг 2. Если это не имеет места, но прямая P'Q'R' проходит
через одну из вершин симплекса А^А^А^ скажем через вершину Aj,
то предположим сначала, что все точки Р', Q', R' отличны от точки Aj.
Тогда
где (/, h, k) есть некоторая перестановка из @, 1, i). Действительно,
проектируя точки Р', Q' или R' из точки Aj, мы получим одну и
ту же точку на стороне АкАн. Таким образом, две строки матрицы
§ 8. ПРЕДСТАВЛЕНИЕ ИНЦИДЕНТНОСТНОГО ПРОСТРАНСТВА
283
рассматриваемые как левосторонние векторы, линейно зависимы.
Следовательно, ранг ее должен быть меньше трех. Но эта матрица
равна произведению
xi
xh
xk
Уз
Уь
Ук
г'\
1
J
xkl
0
0
Ук1
0
0
0
г*1
т. е. произведению матрицы B), строки которой, возможно, пере-
переставлены, на некоторую невырожденную матрицу. Поэтому ранг
f матрицы B) должен быть меньше трех.
С другой стороны, если Р' = Aj, то
fxi У} Ч
хн Ун *н
где
Кхь ук z,
УпУъ
Отсюда, как и выше, мы получаем, что ранг матрицы B) равен двум.
Следовательно, нам остается рассмотреть случай, в котором пря-
прямая P'Q'R' не проходит ни через одну из вершин треугольника
Фиг. 38.
Ах "о
А0А^. Пусть прямая /' = P'Q'R' (фиг. 38) пересекает стороны тре-
треугольника A0AtAi в точках UQ, Uu Uit и пусть X — произвольная
точка прямой /'. Предположим сначала, что точка X отлична от
Uo," Ui и U{. Обозначим точку пересечения прямых Ао X и А±А(
284 ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ^
через Xti и точку пересечения прямых А{Х и AqA^ через Х01. Пусть
прямая Хии± пересекает прямую A0At в точке М, прямая EltU{ пере-
пересекает прямую A0At в точке L и прямая F^L пересекает прямую АхАг
в точке М. При этом точки Uo, Uv Uo U M зависят только от
прямой /' и не зависят от выбора на ней точки X.
Установив шкалу (Alt Eti, At) на прямой АгАи мы построим
произведение М • Хц следующим образом. Через точки М, Xlit Бц
проведем прямые MF&, XltU± и EUUV Тогда, при обычной конструк-
конструкции, прямая FMN пересечет прямую А^Ац в искомой точке S = М ¦ Xti.
Если мы обозначим элемент основного тела К, соответствующий
точке Y прямой АхАи через у, мы будем иметь
mxix = s.
Переходя от прямой А^А{ к прямой АХАО посредством преобразова-
преобразования Г}о, получаем, что L ¦ Х'ц = N в шкале (Аг, Е10, Ао). Если в той же
самой шкале мы построим N-\-Xoi, используя четырехугольник
Хц, мы получим, что M-\-XQl = U{, т. е.
Отсюда следует, что если (?0, .... 5„) — координаты точки X, то
«^ + ^о = «in-
Заметим, что эта формула остается справедливой и в том случае,
если точка X совпадает с одной из точек Vo, Ut или Ut. Действи-
Действительно, если X=UQ, то N=U( и L-Xu^Uu так что m\i = ui\i
и $о = 0. Если Х= Ub то 5i = 0 и «, = jc01. Наконец, пусть Х= Uv
и пусть прямая F^U^ пересекает прямую -^o^i в точке U\- Тогда
точки L и и[ гармонически сопряжены относительно точек Ао и Ау
Но элементами тела К, соответствующими точкам L и ?Д в шкале
(Alt Е10, Ао), являются соответственно т и a1 = xoi. Следовательно,
т = — х^, Ej = 0, и наша формула снова справедлива.
Так как формула C) справедлива для всех точек прямой /', то
она верна, в частности, в том случае, когда точка X совпадает
с одной из точек Р1, Q' или R'. Следовательно, строки матрицы B)
линейно зависимы, так что эта матрица снова имеет ранг 2.
Применяя этот результат для / = 2, .. -, п, мы получаем, что
если точки Р, Q, R коллинеарны, то строки матрицы
Уп гп
# I. ПРЕДСТАВЛЕНИЕ ИНЦИДЕНТнбСТНОГО ПРОСТРАНСТВА 286
линейно зависят от первых двух строк. Следовательно, ранг этой
матрицы равен двум. Мы доказали, что наше условие необходимо;
докажем теперь его достаточность.
(II) Предположим, что ранг матрицы меньше трех, и докажем,
что точки Р, Q, R коллинеарны. Если (re-f-1)-строка, определяемая
произвольным столбцом матрицы, эквивалентна {п-\- 1)-строке, опре-
определяемой некоторым другим ее столбцом, то точки Р, Q, R не
являются попарно различными, и теорема тривиальна. Необходимо,
следовательно, рассмотреть только тот случай, когда точки Р, Q, R
различны.
Точка Р = (х0, ..., хп) не может лежать на каждой грани сим-
симплекса Ао, .... Ап. Предположим, что она не лежит, например, на
грани Аг Ап. Тогда х0 ф 0. Для того чтобы точки Р, Q, R
были коллинеарны, необходимо и достаточно, чтобы прямые PQ и PR
пересекали грань Аи ..., Ап в одной и той же точке. Если прямые
PQ и PR пересекаются с этой гранью в точках Q' и R', то, в силу
доказанной выше первой части теоремы, точка Q' линейно зависит
от точек Р и Q и удовлетворяет уравнению у'о = 0, где положено
Q' — (у[, . . •, y'J. Следовательно, в силу (I),
Q' = @, У[ /J = @, Л - xxx?yv ..., уп - хпх-%).
Аналогично,
R' = @, z[,..., z'J = @, zv - xiX~\ zn- xnx~\).
Далее, так как матрица
Ао 0 0 \
У\ *i = *i Л *t 11 0 1 0
\0 0 1
х.
\Хп Уп *п!
п Уп
является произведением исходной матрицы на некоторую невырож-
невырожденную матрицу, ее ранг равен рангу исходной матрицы. По пред-
предположению, этот ранг меньше трех. Следовательно, столбцы первой
матрицы линейно зависимы. Так как х0 ф 0, то это может быть
только в том случае, если ранг подматрицы
'У\
X
равен 1, т. е. если -Q' = /?'. Следовательно, точки Р, Q, R колли-
коллинеарны, и обе части теоремы III доказаны.
286 Гл- VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Теорема IV. Точки
Pi = (*<н. *и хт) (' = ° О
тогда и только тогда линейно зависимы, когда ранг матрицы
D)
• • • хпг'
меньше г -f-1.
Мы доказали эту теорему для случая г = 2. Предположим теперь,
что она верна для г точек, и применим индукцию.
Необходимость. Допустим, что рассматриваемые г -f-1 точек
линейно зависимы. Если какие-либо г из этих точек также линейно
зависимы, то, в силу индуктивного предположения, соответствующие
столбцы матрицы D) линейно зависимы. Ранг этой матрицы должен
быть тогда меньше г -\- 1.
Если никакие /--точек не являются линейно зависимыми, то пер-
первые г. точек этого множества из г-\-\ точек определяют некоторое
подпространство Sr_lf которое содержит оставшуюся точку Р,.. В.этом
подпространстве Sr_t точки Р, Рг^1 определяют некоторое под-
подпространство Sr_2, которое пересекается прямой РОРГ в некоторой
точке R. В силу индуктивного предположения, мы имеем в обычной
символике (гл. V, § 4)
и, с другой стороны,
Отсюда 2 Pfa = 0. а это означает, что столбцы матрицы D) ли-
о
нейно зависимы и, следовательно, что ее ранг меньше г -\-1.
г
Достаточность. Пусть равенство 2 'V* = 0 выражает линей-
о
ную зависимость столбцов матрицы D). Тогда существуют по край-
крайней мере два А^, не равных нулю. Если таких kt только два, то
соответствующие точки Р4 совпадают. В тех случаях, когда какие-
нибудь из точек Р{ совпадают, теорема очевидна. Если отлично от
нуля более чем два множителя К{, скажем Хо, к± и л2, то точки Р0Х0 +
г
4-Pj^.j и —2 Pi^i совпадают. Следовательно, точки Ро, Рг и
2
Р2, ..., Рг определяют пересекающиеся подпространства, и поэтому,
в силу результата F) § 1, точки Ро, Ри ..'., Рг линейно зависимы.
§ 8. ПРЕДСТАВЛЕНИЕ ИНЦИДЕНТНОСТНОГО ПРОСТРАНСТВА 287
Так же как в гл. V, мы получаем, что точки ^-мерного подпро-
подпространства Sk — это в точности те точки, которые удовлетворяют п — k
линейно независимым левосторонним линейным уравнениям.
Мы доказали, что точки инцидентностного пространства ?„ могут
быть поставлены во взаимно однозначное соответствие с точками не-
некоторого проективного числового пространства /W? (К) таким об-
образом, чтобы точки пространства ?п, содержащиеся в некотором Sa,
соответствовали тем точкам из PN^(K), которые удовлетворяют п—а
линейно независимым левосторонним линейным уравнениям. Далее,
пусть
у = Ах, х = Ву Е
— проективное преобразование пространства PN^ (К). Это дает нам
некоторое новое соответствие между точками пространства ?» и точ-
точками (у0, ..., уп) пространства РЛ/? (К). Необходимое и достаточ-
достаточное условие коллинеарности трех точек пространства ?п состоит по-
прежнему в том, чтобы соответствующая матрица их _у-координат
имела ранг меньше трех (как мы знаем, ранг матрицы является
инвариантом невырожденного преобразования).
Далее, пусть А\ (i = 0, ..., п) — точки пространства ?п, соответ-
соответствующие точкам пространства РЛ/? (К) с координатами (8<0, ..., btn),
и пусть Е'— точка пространства vn, соответствующая точке
A, 1, .... 1) пространства PNn(K). Тогда мы можем построить
новый репер пространства ?п, используя точки Ло, .... Ап, Е' вместо
Ло, ..., Ап, Е. Пусть Р'—произвольная точка пространства ?п> не
лежащая ни на одной из граней нового симплекса, и пусть соответ-
соответствующая точка пространства PN^ (К) (или короче, строка у-коор-
динат точки Р') есть (у0 _у„). Мы докажем, что, используя
изложенные выше методы, можно построить такую систему координат
пространства ?П) в которой точка Р' также будет иметь координаты
СУо. •••• Уп)-
Прежде всего очевидно, что если гиперплоскость
л' л' а' л' л' я' п'
Ао /W-.1, А{+1, .... Лг_!, Aj+i, . . ., А„, Р
пересекается с прямой AiAj в точке Рц, то точка Р^ имеет ^-коор-
^-координаты
(О О, Л, 0 yjt 0, .... 0)«=
= @ 0, yiyj\ 0 1, 0, ..., 0).
В самом деле, существует взаимно однозначное соответствие между
точками прямой AiAj (отличными от Aj) и элементами тела К, даю-
дающего _у-координаты этих точек, при котором точка At соответствует
нулю и точка E{j соответствует единице. Применим теперь основную
''Л- VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
конструкцию к точкам прямой AtAj, выбирая в качестве шкалы
{Ai, E?i}; A:). В силу результатов § 7 гл. V, мы видим, что
если точки Q, R этой прямой соответствуют элементам q, r тела К,
то точки Q-\-R и Q-R соответствуют элементам q-\-r и qr тела К.
Следовательно, между телом, определяемым выбранной шкалой
(At, E'i-, Aj) на прямой А\ Aj, и телом К мы можем установить не-
некоторый изоморфизм.
Далее, если _у-координатами произвольной точки Q прямой A%A-j
являются
(О, .... О, q, 0, ..., 1, 0 0),
то обозначим через R точку прямой А(Аь, имеющую _у-координаты
(О 0, д, 0 0, .... 1, .... 0).
Тогда прямая q'r' пересекает прямую AjA'k в точке /\/t с коорди-
координатами
@, .... 0, 0, .... 1, .... —1, .... 0).
Из этих результатов следует, что если мы выберем шкалу (Ло, Е'ои а[),
скажем, на прямой A'0Ai и построим тело так, как это описано в § 7,
то изоморфизм между построенным телом и телом К геометрии можно
будет установить таким образом, чтобы получаемые при этом коор-
координаты точки Р01 совпали с ее _у-координатами. Используя преобра-
преобразования Tjit, мы можем получить координаты точек на любом ребре
АуАт репера. Получаемые при этом координаты точек будут совпа-
совпадать с их _у-координатами. Следовательно, для всех точек Р' так
определенные координаты будут совпадать с их _у-координатами.
Наш метод введения системы координат в ?« привел к устано-
установлению взаимно однозначного соответствия между точками про-
пространства vn и точками правостороннего проективного числового
пространства PN^(K). Более того, как мы только что видели,
каждому проективному преобразованию пространства AV? (К) отве-
отвечает некоторая новая система координат. Но мы не можем
утверждать, что, обратно, каждая система координат, введенная
описанным в этом параграфе способом, получается из исходной си-
системы посредством некоторого проективного преобразования простран-
пространства PNniK).
В самом деле, рассмотрим систему координат (х0, ..., хп), по-
построенную так, как описано в начале этого параграфа. Она устана-
устанавливает некоторый изоморфизм между точками Р прямой А0Аи от-
отличными от точки Аи и элементами р тела геометрии. При этом
изоморфизме точки Ао и Е01 отвечают соответственно нулю и единице.
Однако между точками прямой AOAV отличными от Ах, и элементами
тела К может существовать другой изоморфизм, удовлетворяющий
g 9. Ограничения на геометрию 289
тем же условиям, при котором точка Р соответствует элементу р
тела К, не обязательно совпадающему с р. Этот изоморфизм отобра-
отображает точку Ло на О, точку Е01 на единицу, точку P-\-Q — на
p-\-q и точку Р • Q на pq. Если мы построим, как описано выше,
некоторую систему координат, используя преобразование Tju, мы по-
получим некоторую систему координат инцидентностного пространства,
не получающуюся из PN^(K) при помощи соответствующего проек-
проективного преобразования. Например, пусть К — поле комплексных чисел
и р — число, комплексно сопряженное с р. Пусть координатами точки
(лг0 хп) в новой системе координат будут (х0 хп). Это
преобразование не является проективным, так как оно преобразует
прямую х2 = хъ = . . . = хп = 0 в себя, причем каждая действитель-
действительная точка этой прямой остается неподвижной (нетождественное
проективное преобразование прямой имеет только конечное число непо-
неподвижных точек).
Таким образом, пространство ?„ может быть представлено в виде
некоторого проективного пространства Рп(К). Наш метод введения
координат в 2П Дает все допустимые системы координат в Рп(К) и,
возможно, другие координатные системы.
У читателя может возникнуть вопрос: как мы получаем именно
правостороннее проективное пространство, отправляясь от свойств
инцидентности, в которых нет упоминания о право- или левостороннем?
В частности, почему левостороннее проективное пространство Ргп(К),
для которого выполняются свойства инцидентности, можно рассматри-
рассматривать и как правостороннее проективное пространство? Ответом на
это служит определение произведения А • В в § 7. Мы можем поме-
поменять ролями точки А а В в этой конструкции и получить в качестве
тела геометрии инверсно изоморфное тело. Используя это тело, мы
представим пространство J\n в виде левостороннего проективного
пространства.
§ 9. Ограничения на геометрию
Мы показали, что пространство, определяемое свойствами инци-
инцидентности, может быть представлено в виде проективного пространства
в смысле определения гл. V и что на самом деле определения гл. V
тождественны с определениями настоящей главы. Для дальнейшего
изучения свойств проективного пространства удобно теперь наложить
на это пространство некоторые новые ограничения. Введение этих
дополнительных условий эквивалентно наложению соответствующих
ограничений на тело геометрии.
А. Тело К коммутативно. Существует несколько способов для
выражения этого условия. В § 8 гл. V мы видели, что эквивалентной
формой этого ограничения является требование, чтобы в геометрии
была справедлива теорема Паппа. В настоящем параграфе мы
19 Зак. 1230. В. Ходж и Д. Пидо
290
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
рассмотрим другие формы того же ограничения. Докажем сначала сле-
следующую теорему:
Теорема 1. Если в инцидентностном пространстве размер-
размерности 2 справедлива теорема Паппа, то в нем справедлива и
теорема Дезарга.
Из § 6 гл. V следует, что достаточно рассмотреть только „общий"
случай, в котором вершины двух треугольников ABC и А'В'С и
центр перспективы О попарно различны (фиг. 39). Обозначим точки
Ф и гЛ39.
пересечения соответственных сторон треугольников АВС^а 'А'В'С
через Р, Q, R. Г.;
Пусть прямая QR пересекает прямую ОВ в точке f, а прямая АР'
пересекает прямую А'С в точке L и прямую ОС в точке М. Пусть,
далее, LB' пересекает АВ в точке N. Рассмотрим две тройки кол-
линеарных точек О, А, А' и L, В', N. В силу теоремы Паппа, точка
пересечения ON и A'L лежит на прямой P'R — QR. Следовательно,
точки О, Q и N коллинеарны. Далее, рассмотрим тройки точек 0,М,С
и А, В, N. В силу теоремы Паппа, точка пересечения прямых MN и
ВС лежит на прямой QR. Наконец, рассмотрим тройки О, М, С и L, В', N.
В силу теоремы Паппа, точка пересечения прямых В'С и MN лежит
на QR. Следовательно, ВС и В'С проходят через точку пересечения
прямых MN и QR, а это и означает справедливость теоремы Дезарга.
Вместо условия VIII (а) (§ 2), в котором постулируется справед-
справедливость теоремы Дезарга для п = 2 (для плоскости), мы введем теперь
новое условие:
IX. Справедлива теорема Паппа.
Б. К есть поле без характеристики. Пусть (О, Е, U) — неко-
некоторая шкала на прямой /. Определим множество точек Еи ?2, .. ¦'
§ 10. СЛЕДСТВИЯ ИЗ ТЕОРЕМЫ ПАППА
291
(фиг. 40) равенствами
г = Е.
Если характеристика поля равна р, то точки О, Elt ..., Ep_t попарно
различны, но ?_ = О. В частности, если р = 2, то Е2 — Ъ и, сле-
следовательно, — ? = ?, от-
откуда
?• (О
Фиг. 40.
Таким образом, мы имеем
рассмотренный в § 4 сгее-
циальный случай, в кото-
котором диагональные точки
четырехугольника колли-
неарны.
Обратно, в специаль-
специальном случае соотношение
A) выполняется и ?2 = О,
так что характеристика
поля К равна 2. Мы до*-
бавляем новый постулат:
X. Все точки Е, ?2,
Ей, . .. попарно различны.
Наконец, иногда мы будем требовать, чтобы поле К было алге-
алгебраически замкнутым. Инцидентностное пространство ?п может быть
представлено в виде проективного пространства Рп{К). Мы знаем (гл. III,
§ 4, теорема II), что существует единственное поле К, являющееся
пересечением всех алгебраически замкнутых полей, содержащих К-
Мы можем вложить пространство Рп(К) в пространство Рп(К)
(гл. V, § 3). Следовательно, пространство ?» может быть вложено
в некоторое вполне определенное пространство ?п над полем К- Мы
назовем ?п алгебраическим замыканием пространства ?„. Наш
последний постулат можно тогда сформулировать так: простран-
пространство 2» совпадает со своим алгебраическим замыканием. Короче,
мы будем формулировать это в виде постулата:
XI. Поле геометрии (или основное поле) алгебраически замкнуто.
В дальнейшем мы всюду будем предполагать справедливость по-
постулатов I—X. Кроме того, в начале каждой главы мы будем специ-
специально указывать, предполагается ли справедливость также и посту-
постулата XI.
§ 10. Следствия из предположения о справедливости
теоремы Паппа
Как уже было отмечено, существует несколько геометрических
предложений, эквивалентных условию коммутативности основного тела.
19*
292 г л- VI. СИНТЕТИчЕСКОЕ.ОПРЕДЁЛЕнИЕ
Мы выбрали теорему Паппа, так как она может быть сформулиро-
сформулирована без особых предварительных объяснений.
Более важный результат, эквивалентный коммутативности основного
тела (и, следовательно, теореме Паппа), касается проективного соот-
соответствия между линейными рядами. Мы уже видели (§ 3), что
между двумя линейными рядами можно установить проективное соот-
соответствие так, чтобы три различные точки одного ряда отвечали трем
различным точкам другого. С другой стороны, если мы зададим че-
четыре точки А, В, С, D одного ряда и четыре точки А', В', С, D'
другого ряда, то может и не существовать никакого проективного
соответствия, при котором точки А, В, С, D отвечают точкам А',
В', С, D'. Мы докажем теперь следующую теорему:
Теорема I. Для того чтобы проективное соответствие между
двумя линейными рядами однозначно определялось заданием трех
пар соответственных точек, необходимо и достаточно, чтобы
была справедлива теорема Паппа.
Необходимость. Предположим, что проективное соответствие
однозначно определяется заданием трех пар соответственных точек.
Пусть А, В, С и А', В', С (фиг. 41) — две тройки точек на двух пря-
прямых / и /', пересекающихся в точке О. Точку 'пересечения прямых В'С
и ВС обозначим через Р, точку пересечения С А' и С А — через Q
и точку пересечения А'В и АВ' — через R.
(а) Если рассматриваемые тройки точек перспективны с центром
в некоторой точке V, то ясно, что каждая из прямых OP, OQ, OR
будет гармонически сопряжена с прямой О V относительно прямых /
и /'. Следовательно, точки Р, Q и R коллинеарны, и теорема Паппа
справедлива без каких-либо дальнейших предположений.
Предположим, далее, что прямая, соединяющая две из точек Р,
Q, R, скажем Q и R, проходит через точку О. Тогда, если пря-
прямые ВВ' и АА' пересекаются в точке Vs, то прямая OV3 гармони-
гармонически сопряжена с прямой OR относительно / и /'. Если СС' пересе-
пересекает АА' в точке V2, то прямая OV2 гармонически сопряжена
с прямой OQ относительно / и /'. Следовательно, OV8 = OV% и
l/g = К2, т. е. рассматриваемые тройки точек перспективны и точка Р
лежит на прямой QR.
(б) Если эти тройки точек не перспективны, то для доказатель-
доказательства теоремы Паппа мы воспользуемся предположением о том, что
проективное соответствие определяется заданием трех пар соответ-
соответственных точек. Пусть прямая QR пересекает прямую / в точке L и
прямую /' в точке М'. Тогда, в силу только что доказанного, точки
L, М' и О попарно различны. Пусть АА' пересекает QR в точке S.
Прямую LM'QR обозначим через /*.
По предположению, существует единственное проективное соот-
соответствие между рядами точек на прямых / и /', такое, при котором
точки А, В, С отвечают соответственно точкам А', В'-, С. Это про-
проективное соответствие может быть определено при помощи двух
§ 10. СЛЕДСТВИЯ ИЗ ТЕОРЕМЫ ПАППА
293
перспективностей:
(А, В, С,...) д (S, R, Q,.. .)*.(А', В', С, ...).
Если точку О рассматривать как принадлежащую /, то на /'
найдется единственная соответствующая ей точка. Точка О при пере-
переходе от / к /' через прямую /* посредством указанных выше пер-
перспективностей преобразуется в М' и затем опять в М. Аналогично,
Фиг. 41.
точка L прямой / соответствует точке О прямой /'. Так как, по
предположению, рассматриваемое проективное соответствие однозначно
определено парами точек А и А', В и В', С и С, то L и М' одно-
однозначно определены самим проективным соответствием. Следовательно,
прямая /* однозначно определена, причем она содержит точки Q и R.
Выбирая в качестве центров перспективности точки В и В', най-
найдем, что прямая RP пересекает прямую / в точке L, а прямую V
в точке М'. Таким образом, точки R и Р также лежат на прямой /*.
Следовательно, Р, Q и R коллинеарны, и теорема Паппа доказана.
Достаточность. Предположим теперь, что теорема Паппа спра-
справедлива. Нам придется сначала доказать следующую лемму:
Лемма. Если I и I' — различные прямые, проходящие через
точку О (фиг. 42), и если ряды точек (Р, Q, R, О, ...) и (P't Q',
R', О, ...) прямых I и V проективно связаны, причем точка О
прямой I соответствует точке О прямой I', то эти линейные
ряды перспективны.
Очевидно, что если рассматриваемые линейные ряды перспективны,
Тр точк,а, О прямой / соответствует точке О прямой /'. Далее, мы
294
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
можем перейти от ряда точек прямой / к ряду точек прямой /' по-
посредством не более чем двух перспективностей (§ 3). Если мы
можем перейти от одного ряда к другому посредством только одной
перспективности, то доказывать нечего. Пусть таких перспективно-
перспективностей будет две. Обозначим промежуточную прямую через /*. Если
прямая /* проходит через точку О, то ряды точек на / и /' будут
перспективны (§ 3, теорема III). Предположим, что прямая /*
пересекает / в точке Р и /' в точке С/, причем точки Р, Q', О
различны. Мы переходим от
ряда точек прямой / к ряду
точек прямой /* посредством
некоторой перспективности
с центром в L, а затем от ряда
точек прямой /* к ряду
точек прямой /' посредством
перспективности с центром
в N. Легко доказать, что
точки Р и Q' не будут со-
соответственными в этом проек-
проективном соответствии. Если
L = N, то ряды точек на /
и /' перспективны с центром
в L = N. Если ЬФ N,ro пря-
Ф и г. 42. мая LN должна проходить
через точку О, так как точка
О прямой / соответствует точке О прямой /'. Пусть LQ' пересекает /
в точке Q, NP пересекает /' в точке Р' и LQ' пересекает NP
в точке М. Если R — произвольная точка прямой / и R' — соответ-
соответствующая точка прямой /', то LR и NR' должны пересекаться в не-
некоторой точке R* прямой /*. Применяя теорему Паппа к тройкам
точек L, О, N и Р, R*, Q', мы видим, что прямая RR' проходит
через точку М. Так как R и R' — произвольная пара соответствен-
соответственных точек, то отсюда следует, что рассматриваемые линейные ряды
перспективны с центром* в М, чем лемма и доказана.
Вернемся теперь к нашей основной теореме. Пусть (Р, Q, /?,...)
и (Р', Q', R',...) — ряды точек двух различных прямых / и V
(фиг. 43). Предположим, что между этими линейными рядами имеются
два проективных соответствия 1^ и П2, отображающие точки Р, Q,
R соответственно в точки Р', Q', R'. Если некоторая пара соответ-
соответственных точек, скажем Р и Р', совпадает с точкой пересечения
прямых / и /', то, в силу леммы, 1\ и П2 на самом деле являются
перспективностями с центром в точке пересечения прямых QQ' и RR'.
В этом случае П1==П2. Так как три пары соответственных точек
предполагаются различными парами, то мы можем выбрать на / и /'
точки, скажем Q и R', отличные от возможной точки пересечения
прямых / и /' и не являющиеся соответственными. Мы можем теперь
§ 10. СЛЕДСТВИЯ ИЗ ТЕОРЕМЫ ПАППА 295
перейти от ряда точек прямой / к ряду точек прямой /' при помощи
двух перспективностей, при которых прямая QR' является промежу-
промежуточной прямой /* в обоих проективных соответствиях П1 и П2
(§ 3, теорема IV). Пусть центрами перспективности для 11Х будут
точки О и О'. Если^Т—произвольная точка прямой I и X'— точка
О'
Фиг. 43.
прямой /', соответствующая точке К в проективном соответствии IIj,
то
(Р, Q, R, Х)?(Р*, Q*, /?*, Х*)^(Р', Qr, R', X'),
где Q* = Q и #* — R'.
Далее, пусть X—точка прямой /', соответствующая точке X
в проективном соответствии П2, и пусть прямая О'Х пересекает
прямую /* в точке X*. Тогда
(Р*. Q*. R*, Х*)?(Р\ Q', R', XO\(P, Q, R, X) (в П9).
Так как Q* = Q, то, в силу леммы, линейные ряды (Р*. Q*, /?*, X*)
и (Р, Q, R, X) должньЛбыть*перспективными. Центром перспектив-
перспективности должна быть точка О. Следовательно, точки О, X, X* кол-
линеарны, т. е. X* = X* и X' = X. Отсюда следует, что Ut = П2-
Если линейные ряды (Р, Q, /?,...) и (Р/, Qf, R', ...) лежат на
одной и той же прямой /, то, спроектировав второй ряд на некото-
некоторую прямую /', мы получим линейный ряд (Рх, Qu Rlt ...)• Если
между линейными рядами (Р, Q, /?,...) и (Рг, Q', /?',...) суще-
существуют два различных проективных соответствия, то должно быть
два различных проективных соответствия и между линейными рядами
(Р, Q, R, • • •) и (Plt Qv /?j, ...), а мы только что доказали, что
это не так. Этим завершается доказательство теоремы I.
296
ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Рассмотрим теперь несколько примеров проективных соответствий
между точками прямой /.
В конструкции I для А-\-В (§ 5) зафиксируем точки А, О,
U и прямые а, и (фиг. 44). Этим вполне определится точка Р.
Предположим, что точка Q также зафиксирована. Тогда точка R
будет вполне определенной и прямая Ь определится как QB. Если
точка В пробегает ряд точек
Ь (В) прямой OU, то точка 5
будет пробегать ряд точек
E) прямой UR так, что
Аналогично,
и, следовательно,
Фиг. 44.
Если на прямой / мы введем обычным способом координаты, принимая
в качестве шкалы (О, Е, U), и если точка А получит при этом
координату а, точка В — коор-
координату х и точка Т— координа-
координату х', то мы будем иметь
х' = х+а. A)
Мы доказали, что такого типа
преобразование точек прямой /
является проективным.
Рассмотрим теперь конструк-
конструкцию II, зафиксировав точки О,
Е, U, A, P, Q и, следовательно,
точку R. Ограничимся при этом
случаем, когда А ф О (фиг. 45).
Возьмем прямую QB в качестве Ь.
Тогда точки В, S, Т будут пробегать соответственно ряды точек
прямых /, OR и /, причем
А В
Фиг. 45.
так что
§ 10. СЛЕДСТВИЯ ИЗ ТЕОРЕМЫ ПАППА 297
Если при определении координат с помощью указанной шкалы коор-
координатами точек А, В, Т будут соответственно а, х, х', то
х' = ах. B)
Это преобразование также является проективным.
Наконец, зафиксируем точки О, Е, U, Q, R (фиг. 46) в кон-
конструкции § 7 гл. VI для элемента А*, обратного к А. Тогда точки
A*, S, Р, А будут пробегать
ряды точек на прямых /, ОЙ,
UQ и / так, что
(A*)A(A).
Если координатами точек А и О "Щ ~/\ р ^^-^7/
Л* будут соответственно jc и
л;', то
хх = 1, ^о;
и это преобразование тоже бу- Фиг. 46.
дет проективным.
Три рассмотренных проективных преобразования являются весьма
важными. Если мы посмотрим, во что переходит точка U при про-
проективных преобразованиях, определяемых соответственно формулами
A), B) и C), мы заметим, что при преобразовании A) точка U
переходит сама в себя, при преобразовании B) точка U также пре-
преобразуется сама в себя, если а Ф 0, и при преобразовании C) точка U
преобразуется в О. В поле К не существует элемента, соответствую-
соответствующего точке U. Точке U удобно сопоставить символ оо, обладающий
следующими свойствами:
(I) оо -f- a = оо,
(II) а оо = оо (а ф 0),
(III) 1/оо=0, 1/0 = оо.
Это обычные свойства „бесконечности", принимаемые в элемен-
элементарной алгебре.
Рассмотрим теперь в некоторой системе координат на прямой /
дробно-линейное преобразование
D)
где а, Ь, с, d — элементы поля К, не равные нулю одновременно.
Если ad = bc, то это преобразование приводится к виду д/ = const,
где константа в правой части есть либо элемент поля К, либо оо.
При этом х' не зависит от х. Мы этот случай исключаем,
рим теперь два случая.
298 гл- VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
(I) с = 0. Ни один из элементов а или d не может быть равен
нулю и %
, а , Ь
х ^ 1 х~^ 1'
Полагая хх = ax\d, можно переписать это равенство в виде
х' = х1 -\- bid, xt = axjd.
Мы можем перейти от л; к л;' посредством преобразования1 типа B),
переводящего х в xt, с последующим преобразованием типа A), пере-
переводящим хх в х'. Так как оба преобразования являются проективными,
¦то ясно, что при с = 0, adфO формула D) определяет проективное
преобразование.
(II) с Ф 0; ad ф be. Мы можем перейти от л к / при помощи
следующих преобразований:
xt == ex, x<i = x1-\-d, хз — ^< х±— —-—-x-z> * = xi~г 7"'
являющихся соответственно преобразованиями типов B), A), C), B),
A). Так как каждое из этих преобразований проективно, то и пре-
преобразование D) также будет проективным. Таким образом, мы полу-
получили теорему:
Теорема II. Преобразование, определяемое в некоторой си~
стеме координат на прямой I равенством
cx
где а, Ь, с, d — элементы поля К и ad ФЬс, является проектив-
проективным.
Мы покажем теперь, что каждое проективное преобразование на
прямой / может быть представлено некоторым уравнением такого вида.
Выясним сначала, во что перерсодит точка х = сю при каждом из пяти
проективных преобразований, на которые разложено преобразование
, ах-\-Ь п
х = cx + d ' ^еРвые два оставляют эту точку инвариантной, третье
преобразует ее в нуль, четвертое оставляет нуль инвариантным, а
пятое преобразует его в ale. В конечном счете точка оо преобразуется
в точку х' = а/с. Мы получили новое свойство символа оо:
ах 4-Ь а
izrt
Теперь предположим, что при некотором проективном преобразовании
точки 0, 1, оо переходят соответственно в точки р, q, r. Ясно, что
преобразование
§ 10. СЛЕДСТВИЯ ИЗ ТЕОРЕМЫ ПАППА 299
переводит 0 в р, 1 в q и, в силу приведенного выше соотношения,
оо в г. В силу теоремы I, это преобразование будет проективным,
так как выражение
отлично от нуля, если р, q, r попарно различны. Но проективное
соответствие однозначно определяется заданием трех пар соответ-
соответственных точек. Следовательно, E) представляет искомое проектив-
проективное преобразование, т. е. имеет место следующая теорема:
Теорема III. Каждое проективное преобразование точек пря-
прямой I определяется равенством вида
* ~~ cx + d'
где а, Ь, с, d — элементы поля К и ad Ф be.
В качестве непосредственного следствия этой теоремы мы полу-
получаем, что проективное преобразование, в котором (xt, xty, (х2, х'2),
(xs, x'3) — пары соответственных точек, определяется уравнением
(х — хя)(х2—х1) {х' — х'ъ)(х'2 — х[)'
Изменим систему координат на прямой /. Пусть х — координата
текущей точки в исходной системе координат, для которой шкалой
служит (О, Е, U), так что эти точки имеют соответственно коорди-
координаты лг = О, 1, оо. Пусть, далее, (О', Е', U') — новая шкала на пря-
прямой /. Этим не фиксируется сама по себе новая система координат,
так как мы еще должны установить изоморфизм между множеством
точек прямой /, отличных от U', и элементами основного поля К,
при котором точки О' и Е' соответствуют элементам 0 и 1. Этот
изоморфизм устанавливается не всегда единственным способом.
Например, если К есть поле комплексных чисел, то, заменив каж-
каждый элемент поля К комплексно сопряженным числом, мы удовлетво-
удовлетворим всем условиям и получим новую систему координат. Мы можем,
однако, определить некоторый специальный изоморфизм следующим
образом. Существует единственное проективное преобразование точек
прямой /, переводящее точки О, Е, U соответственно в точки О',
Е', U'. Если при этом точка Р преобразуется в Рг, отнесем точке Р'
элемент jC, являющийся координатой точки Р в исходной системе
координат. Очевидно, что это соответствие между точками прямой /
и элементами поля К будет изоморфным и координатами точек О'
и Е' будут соответственно 0 и 1.
Выразим теперь координату у точки X в новой системе коор-
координат через ее координату х в исходной системе. Пусть К есть
точка прямой /, удовлетворяющая условию
(О, Е, U, К)л(СК, Е', U'; X).
300 ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Это условие определяет Y однозначно. В качестве у возьмем коорди-
координату точки Y в исходной системе координат. Так как это соответ-
соответствие между точками X и Y является проективным, то, в силу
теоремы III,
где а, Ь, с, d — элементы поля К и ad Ф be.
Далее, рассмотрим проективное соответствие между двумя раз-
различными прямыми / и /', при котором
(О, Е, U, Р,...)Л(О'> Е', U', Р', ...).
Если на прямой / имеется система координат со шкалой (О, Е, U),
то проективное соответствие между прямыми / и /' устанавливает
на V некоторую систему координат со шкалой (О7, Е', U') таким
образом, что координаты соответственных точек обоих линейных
рядов равны. Это проективное соответствие определяется равенством
в двух рассматриваемых системах координат.
Мы подчеркнули тот факт, что выбор шкалы (О, Е, U) на пря-
прямой не фиксирует сам по себе систему координат на этой прямой.
Однако, имея определенную систему координат на произвольной пря-
прямой / со шкалой (О, Е, U), мы можем определить единственную
систему координат на любой прямой /' относительно любой заданной
на этой прямой шкалы (О', Е', V), используя однозначно опреде-
определенное проективное преобразование, отображающее точки (О, Е, U)
на (О', Е', V). Системы координат на прямых / и /', подчиненные
этому условию, будем называть связанными системами координат.
Зафиксируем раз навсегда некоторую систему координат на опре-
определенной прямой / рассматриваемого пространства. Для краткости
будем называть каждую систему координат, связанную с выбранной
системой на прямой /, связанной системой. Если точки Ао, .... Ап, Е
образуют репер, то, используя связанную систему координат на пря-
прямой AtAj со шкалой (Аи Eijt ЛД можно определить координаты
в пространстве так, как указано в § 8. Мы будем называть такую
систему координат шкальной координатной системой пространства.
Пусть теперь т — произвольная прямая пространства. Она не
может пересекать все подпространства Sn_2, порождаемые верши-
вершинами Ал Ал репера. Предположим, что она не пересекает
подпространства, определяемого вершинами Л2 Ап. Тогда, если
она пересекает гиперплоскость х0 = 0 в точке Р, а гиперпло-
гиперплоскость xt = 0 — в точке Q, то точки Р и Q различны. При соответ-
соответствующем выборе множителей мы будем иметь
§ 10. Следствия ИЗ теоремы пАппа 301
и
Q=(l, 0, q2, .... qn).
Положим
Эта точка лежит на прямой PQ и в подпространстве Sn_t, опреде-
определяемом точками Л2, ... Ап, Е. Далее, пусть
X = (-^си • • • > хп)
— произвольная точка прямой т, отличная от точки Р. Тогда х0 ф 0,
и мы можем написать
Мы получили некоторое взаимно однозначное соответствие между
точками X прямой PQ, отличными от точки Р, и элементами %
поля К. Покажем, что это соответствие определяется связанной
системой координат на прямой т со шкалой (Q, R, Р).
Спроектируем ряд точек прямой т из подпространства Sn_2,
определяемого точками Л2 Ап, на прямую AOAV Точки Q, R, Р
спроектируются соответственно в точки Ао, Eol, Alt точка X спроек-
тируется в точку A, I, 0, ..., 0) со шкальной координатой \. Это
и доказывает наше утверждение.
Пусть теперь L, М, N—любые три различные точки прямой т\
выберем множители их координат так, чтобы было
Тогда, если
и
Р
то
так как точки Р и Q различны.
Итак, точка X прямой т может быть представлена в виде
где
Поскольку последнее равенство есть соотношение типа D), отсюда
следует, что соответствие между точками X прямой т и элемен-
элементами т) поля К (и оо) определяется при помощи связанной системы
координат на прямой т со шкалой (L, M, N).
Произведем теперь допустимое преобразование координат
302 ГЛ. VI. СИНТЕТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ
Бели в исходной системе
и
где
то новыми координатами
где
L =
ЛГ=*
*=(
точек
L =
лг=
/
/
(/0> . . .
(«о. • •
¦*о» • • •
L, N,
(/о, • • •
г
(/to» • •
п
п
, /й),
. •«»).
-0, .... и),
Л" будут
. /п).
•, tln),
и, следовательно,
Jfi = /.' + п'(г\ (i = 0, .... re).
Таким образом, соответствие между точками ЛГ прямой /и и эле-
элементами i\ поля К (и оо) не меняется при допустимом преобразова-
преобразовании координат. Так как этот результат справедлив для любой пря-
прямой пространства, то отсюда следует, что допустимое преобразование
системы координат изменяет только репер, используемый при построе-
построении шкальной координатной системы. Наконец, так как шкальная
координатная система однозначно определена заданием репера
Ао, ... Ап, Е и допустимое преобразование однозначно определено
(с точностью до общего множителя), если заданы точки с новыми
координатами A,0 0),@,1 0), ...,@,0 1),A,1 1),
то совокупность преобразований координатных систем от одной
из связанных систем к другой совпадает с множеством допусти-
допустимых преобразований координат.
ГЛАВА VII
ГРАССМАНОВЫ КООРДИНАТЫ
Мы возвращаемся теперь к введенным в гл. V алгебраическим
методам. В дальнейшем мы будем предполагать, что основное тело К
коммутативно и не имеет характеристики. Основной причиной рас-
рассмотрения в гл. V более общих тел являлось то, что это делало
более ясным проведенное в гл. VI исследование свойств инцидент-
инцидентности.
В настоящей главе нет необходимости предполагать, что поле К
алгебраически замкнуто, так как все алгебраические операции, кото-
которыми мы будем пользоваться, рациональны.
§ 1. Линейные подпространства
В § 4 гл. V мы дали определение линейного ^-мерного подпро-
подпространства пространства Ргп{К), а в следующих параграфах получили
некоторые элементарные свойства линейных подпространств. Мы ука-
указали, как для пространства P^iK) могут быть получены аналогичные
определения и свойства. Очевидно, что если тело К коммутативно,
то эти определения и свойства в обоих случаях одинаковы.
В этой главе нет необходимости явно указывать основное поле.
Рассматриваемое пространство мы будем обозначать через [я], его
линейные подпространства — через Sa, Sb, .... где нижний индекс
указывает на размерность.
Напомним, что если в некоторой заданной допустимой системе
координат мы имеем
А = (ао, • • •, аи) (' = 0. • • •. k),
то точки А° Аи линейно зависимы тогда и только тогда, когда
ранг матрицы
меньше k -\- 1. По определению, точка (а0, ..., <х„) линейно зависит
от точек А0, .... Ак в том и только в том случае, если в поле К
304 1*л. Vii. грассмановы координаты
существуют такие элементы Хо, ..., \к, что
к
Мы видели также, что в линейном ft-мерном подпространстве суще-
существует множество из к-\-\ линейно независимых точек, но при
h > к -f- 1 не существует никакого множества из h независимых то-
точек.
Пусть теперь А0, ..., Ак — базис подпространства Sk. Точки
В°, ..., Вк подпространства Sk могут быть представлены в виде
к
B*~^kjAJ ('-0 к).
Как мы видели, точки В0, ..., Вк образуют базис подпространства Sk
в том и только в том случае, если матрица
невырождена. Пусть
Очевидно, что подпространство Sk, порождаемое точками Л°, . . ., Ак,
определяется (во вполне понятном смысле) матрицей А, или, если
матрица А невырождена, матрицей
5 = АЛ.
Таким образом, подпространство Sk определено совокупностью экви-
эквивалентных между собой (к-\-1)У_(п-{-1)-иатрки. А, В, ... . Здесь
эквивалентными матрицами считаются такие, которые получаются
одна из другой при умножении слева на некоторую невырожденную
квадратную матрицу.
Рассмотрим допустимое преобразование системы координат
п
x*i = 2 lijXj (i = 0 п),
или, в матричной записи,
х* = рх.
Если в новой системе координат
At _ (a*i aH\
то
п
§ 2. ГРАССМАНОВЫ КООРДИНАТЫ
305
и, следовательно, в новой системе координат подпространство Sk
определяется множеством матриц, эквивалентных матрице
A* = (a*t)*=AP/. A)
Таким образом, линейное подпространство Sk пространства [и]
в заданной допустимой системе координат определяется множеством
эквивалентных между собой (в указанном выше смысле) (&-f-l)X
X(«-J-1)-матриц. Закон преобразования этих матриц при преобразо-
преобразованиях допустимой системы координат определяется равенством A).
Однако для многих целей задание подпространств при помощи мно-
множества эквивалентных матриц не является наиболее удобным методом.
Цель настоящей главы состоит в изучении более удобных систем
координат fc-мерных подпространств пространства [я]. Эти коорди-
координаты, введенные впервые Грассманом, при & —0 совпадают с опре-
определенными выше координатами точек.
§ 2. Грассмановы координаты
Выберем и зафиксируем в пространстве [я] некоторую систему
координат. Тогда подпространство Sk пространства [п] будет опре-
определяться множеством эквивалентных между собой (k-\- 1) Х(»+ 1)-
матриц А, В, .. ., имеющих ранг k-f-1. Пусть
В = АА,
где Л — некоторая невырожденная (к -\- 1) X (к + 1)-матрица. Рас-,
смотрим (к-\- 1)Х(&+ 1)-подматрицу матрицы А, образованную
столбцами с индексами /0, ilt .... ik, и соответствующую подматрицу
матрицы В. Мы имеем
Приравнивая определители обеих частей этого равенства, получим
где 1Л | — определитель матрицы Л; он отличен от нуля и не зави-
зависит от выбора индексов /0 1к. Перепишем полученное равенство
в виде
20 Зак. 1230. В. Ходок и Д. Пндо
306 гл- VII. ГРАССМАНОВЫ КООРДИНАТЫ
Так как ранг матрицы А равен Аг —|— 1, то хотя бы для одной сово-
совокупности индексов /0 , ik
и тогда
bia ... ik Ф 0,
Далее, из элементарных свойств определителей следует, что если
индексы i0 ik не все различны, то
и если /0, ..., j]t — любая перестановка индексов i0 ik, то
где е = —[— 1 или — 1 в зависимости от того, будет ли эта переста-
перестановка четной или нечетной.
Из этих рассуждений ясно, что множество эквивалентных между
собой матриц А, В определяющих подпространство Sk, опре-
определяет также множество эквивалентных между собой С*+^-строк
(• • •, сца... и» •••)»(•¦•> bia... iv .'*".). Грассмановыми координатами
подпространства Sk мы будем называть любую из этих эквивалентных
между собой С*+*-строк. До сих пор, говоря о координатах точек,
мы предполагали, (I) что каждая точка имеет строку координат,
определенных однозначно, с точностью до общего множителя, и (II)
что каждая (»+ 1)-строка выражает координаты некоторой точки.
Это второе свойство не выполняется для грассмановых координат.
В дальнейшем мы увидим, что за исключением случаев, когда k = 0
или k — n—1, С*;Ц-строка (..., а^ ... ^, ...) дает координаты
некоторого подпространства Sk только в том случае, если элементы
°*о ••• *ь удовлетворяют некоторым алгебраическим соотношениям.
Первое из сформулированных выше свойств координат сохраняется.
Очень важно также доказать, что различные подпространства Sk и
Sk не могут иметь одни и те же координаты. Для этого мы пока-
покажем, как получить уравнения п — k линейно независимых гиперпло-
гиперплоскостей, проходящих через заданное подпространство Sk, и устано-
установим, что получаемые уравнения зависят только от координат подпро-
подпространства Sk.
Предположим, что подпространство Sk определяется базисом
А* = (а*0 с?) (* = 0, .... k),
и пусть грассмановыми координатами подпространства Sk будут
(• • ч Pi0... ik, • • •)• По крайней мере одна из этих координат не
равна нулю. Пусть
Л..- ::к * 0.
§2. ГРАССМАНОВЫ КООРДИНАТЫ 307
Для того чтобы точка (л:0, ..., хп) лежала в Sk, ранг матрицы
к
¦ • <*п
¦¦ Хп,
должен быть равен Л-j-l. Определитель подматрицы, образованной
столбцами с индексами i0, ..., ik+lf должен быть в этом случае
равен нулю. Разложив этот определитель по элементам последней
строки, мы получим уравнения
к+1
Каждое из таких уравнений, написанных для всевозможных комби-
комбинаций индексов i0, .... ik+1, или выполняется тождественно, или опре-
определяет гиперплоскость, содержащую все точки подпространства Sk.
Следовательно, совокупность полученных 0?\ уравнений определяет
некоторое линейное подпространство, содержащее Sk. Для того чтобы
установить, что эти уравнения определяют в точности само подпро-
подпространство Sk, достаточно показать, что среди них можно найти п—к
линейно независимых.
Рассмотрим то из уравнений этой системы, для которого
('о» • • •> f"*+i)=== С/о> • • •• Jk> Л
где / — отличное от /0, .... ]к целое число, удовлетворяющее нера-
неравенствам 0 <[/<;«. Это уравнение имеет вид
2(
Так как каждая из грассмановых координат кососимметрична отно-
относительно своих индексов, мы можем переписать это уравнение в виде
или в виде
%...УА-2 xhpjo... ih_liib+v.. Jk = 0. B)
Пусть (j0 jk, jk+1 у„) есть некоторая перестановка чисел
(О п). Рассмотрим уравнения B) для значений
У =A+i in-
Матрица коэффициентов этих уравнений является (и — ft)X(»+l)-
матрицей. Ранг ее равен п — к, так как определитель подматрицы,
20*
308
ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
образованной столбцами с индексами/к+1, ..., jn, равен (j)j0... j )n~*,
т. е. отличен от нуля. Отсюда вытекает, что система уравнений B)
определяет п — k линейно независимых гиперплоскостей и, следова-
следовательно, определяет Sk.
Таким образом, система уравнений подпространства Sk определяется
его грассмановыми координатами. Отсюда следует, что никакие два
различных й-мерных подпространства не могут иметь одни и те же
координаты.
В заключение этого параграфа рассмотрим действие допустимого
преобразования координат в пространстве [п] на грассмановы коорди-
координаты подпространства Sk. Как мы видели в § 1, преобразование
л:* = Рх C)
переводит матрицу А, определяющую подпространство Sk, в матрицу
А* = АР'.
Следовательно, в силу теоремы V § 8 гл. II,
л, ...** =
*0
*к
4s
«
So -v
4,fiah • • • Zi^l
24ft«ft • • • 2
h ft
» hk
что равно
2
Pb0 ... К
D)
Таким образом, допустимое преобразование координат в простран-
пространстве [п] индуцирует некоторое линейное преобразование грассмано-
вых координат fe-мерного подпространства. Элементами матрицы этого
преобразования служат миноры (А+1)-го порядка матрицы Р. Обра-
Образуем матрицу, в которой все миноры, получаемые из одних и тех же
к -\- 1 строк (или столбцов) матрицы Р, поставим в одной и той же
строке (или в одном и том же столбце), а в строках и столбцах
элементы расположим в лексикографическом порядке, т. е. так, как
располагаются слова в словаре. Полученная C*+J X С*+*-матрица на-
называется (k-\-l)-u ассоциированной матрицей для матрицы Р и
обозначается через Р(*+1). Из приведенных выше рассуждений легко
следует, что
§ 3. ДУАЛЬНЫЕ ГРАССМАНОВЫ КООРДИНАТЫ 309
Если Р = Еп+1 (единичная матрица), то, очевидно,
Таким образом, полагая Q = Р~г, мы получаем из равенства E), что
0 (?„
и, следовательно, матрица
является обратной для р(*+1).
Ассоциированные матрицы будут играть важную роль в дальней-
дальнейшем, когда мы будем рассматривать их как определяющие некото-
некоторый специальный тип преобразований в ассоциированном Af-мерном
пространстве, где N-\-l=C*+\.
§ 3. Дуальные грассмановы координаты
Подпространство Sk может быть определено не только при по-
помощи k-\-\ содержащихся в нем линейно независимых точек, но
также при помощи п — k проходящих через него линейно независи-
независимых гиперплоскостей. Пусть в заданной допустимой системе коор-
координат подпространство Sk имеет грассмановы координаты
(• • •. Pi, ... ir • ¦ •).
и пусть
— уравнения «¦—k линейно независимых гиперплоскостей, содержа-
содержащих Sk. Если положить
?
то систему уравнений A) можно переписать в матричной форме:
Ux = 0. A')
Эта система определяет подпространство 5fc, и так как гиперплоско-
гиперплоскости A) линейно независимы, то (я — k)y^(n-\-l)-uatpuu.a U имеет
ранг п, — k. Уравнение произвольной гиперплоскости, проходящей
через Sk, является линейной комбинацией уравнений A). п — k таких
гиперплоскостей, определяемых матричным уравнением
Vx = Q,
в том и только в том случае являются содержащими Sk линейно не-
независимыми гиперплоскостями, если существует такая невырожден-
невырожденная (га — к) X (и — &)-матрица М, что
310
ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
т. е. если, в терминах § 2, матрицы U и V эквивалентны. Таким
образом, подпространство Sk может быть определено также сово-
совокупностью эквивалентных между собой (п — й)Х(я-|-1)-матриц.
Если мы рассмотрим, как в § 2, преобразование координат
л:* = Рх, B)
то система уравнений, определяющих подпространство Sk, примет вид
= 0,
а совокупность эквивалентных между собой матриц U, V, ... пе-
перейдет в совокупность эквивалентных между собой матриц UP-1,
VPi
Далее, определители (я — &)Х(Л — ?)-подматриц этих эквива-
эквивалентных между собой матриц U, V, ... задают класс эквивалентных
у
C
между собой Cn+1-строк. Вид общего члена этого класса может быть
определен с помощью матрицы U. Положим
я?-* ... и*-*
C)
Тогда подпространство Sk будет определяться совокупностью
(. .., р^ ••• *п-к, . • .),
которые мы будем называть его дуальными грассмановыми коорди-
координатами.
Легко показать, что различные подпространства Sk и S'k не могут
иметь одинаковые дуальные координаты. Если (л:0, ..., хп) — про-
произвольная точка подпространства Sk, то
n—ft п
»=1 J=0
где Xlt ..., Яи_к — произвольные элементы поля К. Полагая
!*:¦ ... и ¦ -
31 3n-lt-\
an-* ... и"-*
/I Jn—Jr
§ 3. ДУАЛЬНЫЕ ГРАССМАНОВЫ КООРДИНАТЫ 311
мы получаем уравнение
2pA-V*-i^ = 0. D)
Если индексы ]г, ..., jn_k_t будут принимать всевозможные значе-
значения, то система уравнений D) определит некоторое линейное под-
подпространство, содержащее Sk. Как и в предыдущем параграфе, мы
теперь покажем, что в этой системе можно найти п — к линейно не-
независимых уравнений, и тем самым убедимся, что это линейное под-
подпространство совпадает с Sk.
Так как матрица U имеет ранг п—k, то существует по крайней
мере одна ненулевая дуальная координата. Предположим, что
и рассмотрим п— k уравнений, получающихся из равенства D), когда
индексы }v ..., Jn-h-i принимают значения из множества alf ..., ап_к.
Если at — пропущенный при этом элемент, то из равенства D) по-
получаем
2 р«,... «,-i«<+t - °n-kiXj = о,
т. е.
а
п-к
или
pa'-an-ilXa 4-
a
Полагая /=1, ..., п — k, мы получаем п — k линейно независимых
уравнений, так как определитель подматрицы (re — ft)X(w+ ^-матри-
^-матрицы коэффициентов, соответствующий столбцам аи ..., ап_к, равен,
очевидно,
и, следовательно, отличен от нуля. Таким образом, и дуальные ко-
координаты подпространства Sk определяют его однозначно.
Дуальные координаты тесно связаны с обычными грассмановыми
координатами.определенными в § 2. Это показывает следующая теорема:
Теорема I. Пусть (i0, ..., /„) — любая перестановка чисел
@, ..., я). Тогда, если грассмановы координаты подпространства
Sk равны (. .., р<„ ... { , ...), а дуальные грассмановы координаты
этого подпространства равны (..., p'ft+i'" *», ...), то существует
такой отличный от нуля элемент р поля К, что
•" *• =¦ РР<. tk. E)
312
ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
Элементы <7<о---< определяются этими равенствами. Доказательство
теоремы состоит из двух частей. Сначала мы покажем, что преобразо-
преобразование B) координат пространства [п] индуцирует невырожденное ли-
линейное преобразование координат qia...ik такого же вида, как инду-
индуцируемое преобразование координат р<0...<й (ср. § 2). Затем пока-
покажем, что матрицу Р можно выбрать так, что в новой системе коор-
координат равенство
для некоторого р станет очевидным. Справедливость теоремы будет
следовать из того факта, что координаты (..., р* . , ...) и
(,..,q*t t, ...) при каждом допустимом преобразовании про-
странства [и] изменяются одинаковым образом.
Так как преобразование B) превращает систему уравнений под-
подпространства Sk в систему
то при
будем иметь
*»-fc
= 2
:п-к
^* ' ' ' *
Следовательно,
v..*., 2
ft+1
... о.
. .. з .
§ 3. ДУАЛЬНЫЕ ГРАССМАНОВЫ КООРДИНАТЫ
313
,...jfj,...ik
О. . ... О
}k+l ft+1
JJ.(... ... о.
где суммирование распространяется на все Сп%\ различных разбие-
разбиений (/0 Jk)Uk*i in) перестановки (Jo jn).
В силу теоремы VIII § 8 гл. II,
Ч
n*fc+l
где \Р\ есть определитель матрицы Р. Следовательно,
Ьо...<„
fy,...:
F)
Сравнивая этот результат с формулой D) § 2, мы видим, что допу-
допустимое преобразование координат пространства [»], определяемое ра-
равенством B), с точностью до отличного от нуля общего множителя,
индуцирует то же самое линейное преобразование координат
(..., ^<|(< ,...), что и координат (..., р<о< , ...).
Далее, в силу теоремы V § 4 гл. V, в пространстве [га] суще-
существует такая допустимая система координат, в которой точки А0, ..., А",
образующие базис подпространства Sk, совпадают с вершинами
Х*°, ..., Х*к репера допустимой системы координат. Предположим,
что преобразование B) есть преобразование к этой координатной си-
системе. Тогда подпространство Sk будет определяться (k -j- 1) X (п~\~ 1)"
матрицей
'1 О ... О ... 0^
0 1 ... 0 ... 0
\0 0 ... 1 ... 0/
и, следовательно, р* Л=1 и р* { = 0, если строка (/0 .„.
не является перестановкой чисел @, ..., k). Далее, подпространство 5»
га гмгтампй vnanuAUutt
вляеся перестановкой чисел @
определяется системой уравнений
314 ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
т. е. (я — &)Х(я+1)-матрицей
/О ... 10 ... 0V
О ... О 1 ... О
... О 0 ... 1/
и, следовательно, а*. . = р**+* ••¦ п= 1 и о* . =±р***:+1 ••• *п = 0,
если (/0, ..., ik) не является перестановкой чисел @, , k). Итак,
в этом случае
_* _*
Отсюда следует, как показано выше, что в каждой допустимой си-
системе координат для соответствующего значения р имеет место соот-
соотношение E).
Принцип двойственности (гл. V, § 5) проливает новый свет на
связь между грассмановыми координатами подпространства Sk и его
дуальными грассмановыми координатами. Если точки
Л' = (а< <) (/=0 к)
образуют базис подпространства Sk, то система уравнений
определяет дуальное подпространство SM-fc-i- Следовательно, если
(..., P<u...<fc, ...) и (..., р{>-*п-к, ...)
являются соответственно грассмановыми и дуальными грассмановыми
координатами подпространства Sk, a
являются грассмановыми и дуальными грассмановыми координатами
подпространства Ee-*-i» T0» очевидно,
и, следовательно, в силу доказанной теоремы,
Используя эти результаты, можно получить свойства грассмано-
вых координат, дуальные к известным свойствам. Например, из того
факта, что система уравнений подпространства Sk имеет вид
§ 4. СВОЙСТВА ГРАССМАНОВЫХ КООРДИНАТ 315
сразу следует, что если
— ненулевой вектор, то он определяет координаты некоторой точки
подпространства Sn_k_v грассмановы координаты которого равны
(..., д{ i ,...)• Придавая целым числам (Д Jn-k-i) BCe"
возможные значения, мы получаем множество точек подпространства
•Sn-fc-i> содержащее базис этого подпространства.
§ 4. Элементарные свойства грассмановых координат
Условие
раа =0
для заданных индексов (а0 ак) легко интерпретируется как не-
некоторое геометрическое свойство подпространства Sk с грассмано-
выми координатами (..., р, t ,...). Действительно, если
Л< = (а<, .... а<) (/ = 0 к)
есть базис подпространства Sk, то это условие состоит в том, что
о о
= 0.
Из этой формы условия мы получаем, что в поле К существуют
элементы Яо, ..., Кк, не равные нулю одновременно и такие, что
к
Зл,а$ = 0 (у = а0 а»)
<=о
ft
Отсюда следует, что координаты точки 2 ^И* пространства 5fc удо-
влетворяют условиям
•"¦a0 s== •"¦а1 = . . . = АГа^ = 0.
Эти последние уравнения определяют некоторое подпространство
¦Sw-ft-i> базис которого состоит из л — к вершин репера. Рассмат-
Рассматриваемое условие является достаточным для того, чтобы подпро-
подпространство Sk пересекалось с этим Sn_k_v Обратно, если Sk пересе-
пересекается с Sn_k_t, то одна из точек базиса подпространства Sk, ска-
скажем Л*, может быть выбрана в Sn_k_it и тогда
316 ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
а потому
Этот результат обобщается следующей теоремой:
Теорема I. Пусть а0, , аа — различные целые числа
(s -f-1 < k -\-1), выбранные из множества О, ..., п, и пусть Sn_g_t—
линейное подпространство, определяемое системой уравнений
хпо = ... = ха^ = и.
Для того чтобы подпространство Sk пересекалось с подпростран-
подпространством Sn_a_1 no подпространству, размерность которого не
меньше k — s, необходимо и достаточно, чтобы выполнялись
соотношения
при всевозможных комбинациях индексов /g+1, ..., ik.
Очевидно, что нам достаточно рассмотреть только множества
(tg+1, .... ik), состоящие из различных чисел, каждое из которых
отлично от всех чисел а0, ..., аа. Поскольку случай s = k уже
рассмотрен, мы можем предположить, что s < k.
Пусть пространства Sk и 5И_Я_] пересекаются по некоторому
линейному подпространству, размерность которого не меньше k — s.
Тогда можно найти k — s -f-1 линейно независимых точек подпростран-
подпространства Sk, содержащихся в Sn_s_v причем эти точки As, As+1 Ak
можно включить в некоторый базис подпространства Sk. При этом
а* = 0 (i = s, .... k; j = а0 ая).
Отсюда следует, что в матрице А = (aj), определяющей подпростран-
подпространство Sk, столбцы, соответствующие индексам а0, ..., а8, имеют не-
ненулевые элементы только в первых s строках. Ранг подматрицы,
образованной этими столбцами, будет, следовательно, не больше
чем s, и потому эти столбцы как векторы линейно зависимы. Сле-
Следовательно, столбцы, соответствующие индексам (а0 as,
/я+1 ik), тоже линейно зависимы и
Pao...asis+1...ik^ •
Этим доказана необходимость сформулированного условия. Для
доказательства достаточности вспомним, что каждое подпростран-
подпространство Sk пересекает подпространство Sn_a_t по некоторому линейному
подпространству размерности, не меньшей k — s— 1. Мы можем, сле-
следовательно, так выбрать точки Aa+1, ..., Ак, содержащиеся в Sn_s_1,
чтобы выполнялись равенства
aj = O (/ = s+l k; j = a0, ..., as).
§ 4. СВОЙСТВА ГРАССМАНОВЫХ КООРДИНАТ
317
Тогда будем иметь
•Л+i-V
<х„,... aa
•&-«Г
.„
<
Это легко следует из элементарных свойств определителей.
Все определители
s+l
4
не могут быть одновременно равны нулю, потому что если бы это
было так, то последние к— s строк матрицы А были бы линейно
зависимыми. Поскольку к— s > 0, отсюда следовало бы, что ранг
матрицы А меньше ft-j-1, что противоречит предположению. Таким
образом, из равенств
в вТ-1 К
следует, что
«а. ¦ • ¦ «а
= 0.
Отсюда получаем, что в поле К существуют элементы Хо кк,
S
не равные нулю одновременно и такие, что точка
2
<=0
подпро-
странства Sk, не зависящая линейно от точек Аа+Х Ак, содер-
содержится в Sn_s_v Следовательно, подпространства Sk и 5n_g_1 имеют
по крайней мере к — s-\-\ общих линейно независимых точек и,
значит, пересекаются по некоторому подпространству, размерность
которого не меньше к — s. Этим завершается доказательство тео-
теоремы.
Покажем теперь, как определить базис подпространства Sk, если
заданы его грассмановы координаты (..., pt .,...). Пусть
Рао...а —какая-нибудь ненулевая координата; положим
к
хЧ==Ра а 1 а (г== 0> ••¦. ^! / = 0, ...,«). A)
Так как
то (и-|- 1)-строка В{ = (х1, ..., х*п) представляет некоторую точку,
которую мы обозначим через В*. Поскольку
318
ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
В1 содержится в подпространстве Sn_H, определяемом системой
уравнений
*i = О (J = а0 a{_v ai+1 cQ. B)
Покажем, что В* является единственной точкой пересечения подпро-
подпространства Sk с этим Sn_jf Из равенства
Л=0
Л=0
следует, что точка В*
^
2
Л=0
содержится в Sk. Если 5 — не
единственная точка пересечения Sk с подпространством Sn_]e, опре-
определяемым системой уравнений B), то должна существовать по край-
крайней мере одна прямая, общая этим подпространствам, причем эта
прямая, поскольку она содержится в Sn_k, должна пересекаться
с подпространством Sn_H_lt определяемым системой уравнений
*/ —0 (У = йо й*)-
Но тогда это подпространство 5n_fc-1 пересекается с Sk, и, в силу
теоремы I,
вопреки предположению. Таким образом, В* — единственная точка
пересечения подпространства Sk и подпространства Sn_1c, определяе-
определяемого системой уравнений B).
Покажем теперь, что точки 5° Вк, определяемые этим спо-
способом, образуют базис подпространства Sk. Так как каждая из этих
точек В* содержится в Sk, то достаточно доказать, что эти ft -j-1
точек линейно независимы, т. е. что ранг матрицы
S 4. СВОЙСТВА ГРАССМАНОВЫХ КООРДИНАТ
319
равен k-\-l. Подматрица матрицы X, столбцы которой соответ-
соответствуют индексам а0, ..., ак, имеет вид
X...aft 0 ... О \
о
о
(ибо х1а = р ). Так как р -> " ф 0, то эта подматрица не-
вырождена. Таким образом, ранг матрицы X равен к-\-\ и точки
В0, ..., Вк образуют базис подпространства 5fc.
В качестве непосредственного следствия этого результата полу-
получаем, что в поле К существует такой отличный от нуля элемент р,
что при всех выборах индексов (/0, ..., ik)
>...<,.
Если мы положим
то это равенство примет вид
Отсюда
Далее, положим /;- = а^ для всех /, кроме j = ^, и, v
последнее множество состоит из s элементов. Тогда
где
Х„о
В каждом из столбцов, соответствующих индексам ait все эле-
элементы, кроме xi , равны нулю. Так как определитель можно разло-
разложить по элементам такого столбца и так как элементы х* =р
расположены на главной диагонали, то
/
320
ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
т. е.
чв-1
xl... х\
t го
В качестве дуального результата получаем способ построения
базиса семейства гиперплоскостей, проходящих через Sk. Этот базис
можно получить также, воспользовавшись результатами § 2. Если
(а0, ..., а„) есть четная перестановка, составленная из чисел @ и),
то, по предположению,
В силу сказанного в § 2 [см. B)], система уравнений
к
Ра„... akXt — Л Pa, ... o/t_1Jofc+] ... ajXah = 0 («' — Лк+1 й„)
определяет некоторый дуальный базис подпространства Sk. Так как
для данных значений ( мы можем положить
= k-]-\, .... и),
А.... afc_l0A+1 ... а, =
причем
то наша система уравнений приводится к виду
к
1 j | » jti хаь —' " U — К -~Г i > • • ¦ > п)>
2l
ft=o
или, короче,
¦ 2 р«й+1 - vi*v+i - anXi=о a = *+i »).
где добавлены члены с нулевыми коэффициентами. Положив
мы сможем переписать уравнения подпространства Sk в виде
п
^^ tljX^ = О \J == К —г- 1, . . ., flj.
Матрица
D)
... и^
§ 4. СВОЙСТВА ГРАССМАНОВЫХ КООРДИНАТ
321
определяет подпространство Sk, причем
«ЙГ ¦ ¦ ¦ «*?!
Так как
то
ррак+1-а„
=
ра*+
=
1--ап
0 р
0
0
°fcfl •" ап . . .
0
0
0
и, следовательно, предыдущий результат можно переписать в виде
1 к 4-1 II %п
"
При ij = cij для всех у, кроме j = t, и, v, ..., «;, мы получаем по-
прежнему, что если множество (*, и, v w) состоит из 5 эле-
элементов, то
и/* ... я,**
E)
Наконец, отметим следующую связь между элементами aj, опре-
определяемыми равенством D), и элементами xl определяемыми приве-
приведенным выше равенством A).
(I) Если j > k и i ^ ft, то
(II) Если г, у > ft, /^=7 и /, т < ft, / ф т, то
(III) Если г > ft и / < ft, то
21 Зак. 1230. В. Ходж и Д. Пидо
322 ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
Эти результаты мы используем теперь для получения необходи-
необходимых и достаточных условий, при которых заданное подпространство
Sk пересекается с заданным подпространством 5Л по некоторому под-
подпространству размерности, не меньшей t.
§ 5. Некоторые теоремы о пересечениях и суммах
Пусть подпространство Sh имеет координаты (..., Pio...ih, • ¦ •)•
а подпространство Sk— дуальные координаты (..., ^**+i'"*»,...).
Мы докажем следующую теорему.
Теорема I. Для того чтобы подпространства Sh и Sk пере-
пересекались по линейному подпространству размерности, не меньшей
t, необходимо и достаточно, чтобы выполнялись соотношения
^ V ..*,*••• <•»-. = ° A)
при любом выборе aft+1, .... an_s, p0 $h_e, где s = h — +
Из равенств A) получается совокупность достаточных условий,
если мы ограничим выбор индексов aft+1, .... an_8 всевозможными
сочетаниями, составленными из чисел ак+1, .... ап, и выбор ин-
индексов р0, .... рЛ_8—всевозможными сочетаниями, составленными
из чисел Ьо bh, где п — k чисел ак+и .... ап и h-\-\ чисел
Ьо, ..., bh выбираются из множества 0, ..., п так, что
й B)
Очевидно, что если
для всех множеств (й„_8+1 ап), (*Л_в+1 bh), то условие A)
выполняется. Мы должны, следовательно, рассмотреть только такие
множества ак+1 ап\ b0,..., bh, для которых имеет место
условие B).
Если положить
то систему уравнений, определяющих подпространство 5ft, можно
будет записать в виде
0 (/ = А+1 п),
и точки
х* = D, .... 4) (' = 0 h)
§ 5. ТЕОРЕМЫ О: ПЕРВСВЧВНИЯХ И СУММАХ
323
будут образовывать базис подпространства Sh. Каждая точка, при-
А
надлежащая Sh, может быть представлена в виде2*а*°- Она содер-
0
жится в Sk в том и только в том случае, если
п h
^-o (/ = /5+1,...,»). C)
=0 0=0
Эти уравнения относительно (Ло Х„) определяют (h-\-l)-
h
строки, для которых соответствующие точки ^) к„ха содержатся в Sk.
о
Таким образом, для того чтобы подпространства Sh и Sk пересека-
пересекались не менее чем по подпространству St, необходимо и достаточно,
чтобы система уравнений C) имела не менее t-\- 1 независимых ре-
решений. Следовательно, ранг матрицы
п
Bj UjXi)
может быть равен самое большее h — t (гл. II, § 6). Для того
чтобы это имело место, необходимо и достаточно, чтобы все миноры
порядка s = h — *+1, составленные из этой матрицы, были равны
нулю. Таким образом, необходимые и достаточные условия сводятся
к равенствам
х=о
х=о
2
х=о
= О
D)
для всевозможных выборов индексов ilt ..., ia из (ft -\- 1 и) и
индексов jt j8 из @ Н). Последний определитель, в силу
теоремы V § 8 гл. II, равен
К \
-•:
Далее, в силу равенства E) предыдущего параграфа,
= 8
21"
324 ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
где h — k — s чисел afc+1, ..., ая_4 выбраны из множества aftM, ...
..., ап, причем их выбор однозначно определен множеством ix ia
Никакие два различных множества /х is не дают одного и того
же набора aft+1, ..., an_e) и в, равное -\-1 или —1, однозначно
определено множеством /j is. Аналогично, используя равенство
C) последнего параграфа, получаем
к •••
X?'
— в' (Pb О" X ...
где числа ро, ..., рЛ_8 выбраны из множества ?>0, ..., &ft, причем
их выбор и значение г' = ± 1 однозначно определены множеством
Д У8. Мы можем, следовательно, написать вместо D) равенство
E)
При этом на множитель ее', не зависящий от kt, . .., ka, можно со-
сократить. Используя равенство B), получаем, что необходимые и до-
достаточные условия E) эквивалентны равенствам A) при всевозмож-
всевозможных выборах индексов aft+1, ..., ап_а из чисел aft+1, ..., an и ин-
индексов ро ph_g из чисел ?0, .... ?Л. Это доказывает теорему.
Мы получим теперь одну формулу, связанную с суммами и пере-
пересечениями линейных подпространств. Пусть подпространство Sh имеет
координаты (. .., Pio...i , ...), а подпространство Sk — координаты
(• • •. Я<«..лк, •••)• ^ак обычно, обозначим дуальные координаты под-
подпространства Sh через (.. .,р*л+1""Х...), а дуальные координаты
подпространства Sk — через (..., q*it+v*nt ...). Пусть
*« = (**, .... х\) (/ = 0 К)
— базис подпространства Sh, а
— базис подпространства Sk. Для того чтобы подпространства Sh
и Sk пересекались, необходимо и достаточно, чтобы существовали
элементы Хо, ..., kh и |а0, ..., [Aft, не равные нулю одновременно и
такие, что
§ 5. ТЕОРЕМЫ О ПЕРЕСЕЧЕНИЯХ И СУММАХ
325
Таким образом, необходимое и достаточное условие состоит в том,
что ранг матрицы
1 vO v-0 \
Х0- • -Хп\
V*.. V*/
F)
должен быть не больше h-\-k-\-\, так как строки ее линейно за-
зависимы. Следовательно, все миноры порядка h-{-k -\- 2, составлен-
составленные из этой (Л -|— ft —}— 2) X (»-f- 1)-матрицы, должны быть равны
нулю. Если мы рассмотрим минор, образованный столбцами с индек-
индексами /0 4+ft+i. и разложим его по формуле Лапласа (гл. II, § 8,
теорема 2), мы получим
1s i("*+ft+i i'—h
~~
Можно проверить, что эти условия эквивалентны условиям, устанав-
устанавливаемым теоремой I.
Если подпространства Sh и Sk не пересекаются, то точки х°
xh, у ук линейно независимы (гл. V, § 4) и определяют
сумму этих двух подпространств. Следовательно, миноры порядка
{h -\- k -\- 2) матрицы F) являются грассмановыми координатами суммы
этих двух подпространств. Мы можем записать эти координаты в виде
*»—'fc+lH-lР*°—*ъ 4+Г"
Пренебрегая общим множителем, можно переписать эти равенства
в виде
(8)
где суммирование распространяется на все перестановки /0, ...
. .., jh+lc+1 индексов г0 ih+k+v знак плюс соответствует четной и
знак минус — нечетной перестановкам.
Введя дуальные координаты, будем иметь
q
326 ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
где (;0 Jh+k+u ih+k+i tn) — четная перестановка чисед^
(iQ in). Следовательно, *
Отбрасывая общий множитель ± 1, можно переписать это равенство
в виде
Другая форма этого соотношения:
Доказательство справедливости этого равенства, вытекающего из ра-
равенства (8), мы предоставим читателю. Пользуясь принципом двой-
двойственности или проводя точно такое же рассуждение, мы можем
показать, что если h -J- k > п и
j 3vhn-h-k
то равенство /V"'«n-A-fc — о (для всех iv ..., /2n-/»-s) выражает
условие того, что подпространства Sh и Sk пересекаются по некото-
некоторому подпространству размерности, большей h-\-k — п. Если эти
подпространства пересекаются по (h-\-k — д)-мерному подпростран-
подпространству, то координатами их пересечения будут (..., /*г"^п-*-*, ...)¦'
Для ha...ih ._ могут быть найдены эквивалентные формулы.
Теперь мы получим координаты проекции подпространства Sk из
вершины Sh на подпространство Sn_h_-j. Предположим, что подпро-
подпространство 5Л не пересекает Sk. Эта проекция будет тогда пересе-
пересечением суммы подпространств Sh и Sk с Sn_h_v Координаты суммы
подпространств Sh и Sk определяются равенствами
Если подпространство Sn_h_1 имеет координаты (..., s°"'" *, ...),
то координаты (..., ^...< , ...) пересечения этой суммы с 5П_Л_Х
определяются равенствами
it 1 = 2 2 2 8?0> * -?»Г" V "V, ,^ **"' "<Л-
я jtwin* "ft я
i 5. ТЕОРЕМЫ О ПЕРЕСЕЧЕНИЯХ И СУММАХ
327
При h = О координаты проекции подпространства 5S из точки
п
b = (b0 ?>„) на гиперплоскость 2 Btxt — 0 могут быть полу-
0
чены проще. Пусть
х* = (х*0 х*) (/ = 0 к)
— базис подпространства Sk. Так как точка b не содержится в Sk,
то точки Ь, х° хк линейно независимы. Следовательно, точки
У ук, где
также линейно независимы. Но так как
2 вм=д s vj - B Bjxfy д=о,
tf i i
то точки У, .... _у* содержатся в гиперплоскости 2 #«*i = 0.
Таким образом, эти точки, содержащиеся в проекции подпростран-
подпространства Sk на гиперплоскость, могут быть приняты в качестве базиса
рассматриваемой проекции. Следовательно,
*<„. •¦<,=
А
... Ьх
где
Последний определитель равен
1-0 v0
*ч • • ¦ л.
,«\ь
— А 2л о,
... х\
*
Подставляя значение к*, находим, что
и,... ik=Дй+1л„... «t—Дй 2 2 b4BlPia... <y_iMi+i... v
Мы доказали, что имеет место
Теорема II. Координаты (..., tia... *ft, ...) проекции It-мер-
It-мерного подпространства (..., р< ...< , ...) из точки (Ьо, ..., Ь,^ на
гиперплоскость
Вох0+...-\-Впхп = 0
328 ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
определяются равенствами
4. - *к = ДЛо - ik—2 2 (-
где
§ в. Квадратичные /^-соотношения
Мы показали, что каждое ft-мерное подпространство Sk в задан-
заданной допустимой системе координат имеет некоторые координаты
(•••¦ Pio...ik, • • •)• Но отсюда не следует еще, что всегда Сп+1 эле-
элементов pt^.j , кососимметричных относительно их индексов и не
равных нулю одновременно, служат координатами некоторого под-
подпространства Sk. В действительности этого и нет, за исключением
тех случаев, когда k = 0 или k = n — 1. Мы должны теперь уста-
установить, какими алгебраическими соотношениями, если таковые вообще
существуют, связаны координаты произвольного подпространства Sk.
Покажем сначала, что не существует никаких линейных соотно-
соотношений. Предположим, что выражение
является однородной линейной формой от Сп\\ независимых неиз-
неизвестных Р{0...{ (кососимметричных относительно их индексов), та-
такой, что
2 «<o...yv..*ft=° (О
ia-..ik
всякий раз, когда неизвестные Р<„...« заменяются координатами
Ри..л произвольного ft-мерного подпространства. Покажем, что все
коэффициенты «<„...<- должны быть равны нулю. Например, пока-
покажем, что иа>...ак равно нулю.
Рассмотрим ft-мерное подпространство, определяемое Дс —|— 1 точ-
точками
*'«=<# О е=° *)•
Мы сразу замечаем, что если iQ, ..., ik не образуют перестановку,
составленную из чисел а0 ак, то
С другой стороны, /?„..,„== 1. Поэтому соотношение A) приводится к
§ 6. КВАДРАТИЧНЫЕ р-СООТНОШЕНИЯ
329
Таким образом, мы имеем теорему:
Теорема I. Координаты k-мерных подпространств простран-
пространства [п] не удовлетворяют никакому линейному соотношению
вида
Существуют, однако, соотношения более высокой степени, кото-
которым удовлетворяют координаты каждого подпространства Sk про-
пространства [в]. Предположим, что А отлично от 0 и я — 1, и усло-
условимся обозначать через F(P) любой однородный многочлен от С„Х1
независимых неизвестных Pt...< (предполагаемых кососимметрич-
ными относительно индексов), а через F(p) — результат подста-
подстановки вместо неизвестных Р»о...« координат Рго..л подпростран-
подпространства Sk. Мы будем искать такие ненулевые формы F(P), что F(p) — 0
для каждого подпространства Sk из [л].
Пусть /j, ..., 4 — система k различных чисел, выбранных из
множества 0, ..., п, и jQ jk+l— система k~\-2 различных
чисел, выбранных из этого же самого множества. Положим, по опре-
определению,
и докажем, что
2
для каждого подпространства Sk.
Пусть
— базис заданного подпространства Sk. Тогда
к+1
х=о
. . . а? а?
% • • ¦ ai
X
X
... а"
, ... «¦." а" . . . а.
'¦> h-i h+\ hi
Обозначив через А* алгебраическое дополнение элемента сф в опре-
делителе
а» .. . о* а*
330
ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
мы получим
к к+1
; V V (- ¦
|i=0 Х=0
а°. ... а°. а» . . . aj
*> 'Х-1 'Х+1 Jft
a*1 ... a* a? ... a .*
|j.=0
'ft+i
a9 ... a» ... a»
a? ... a* ... a?
Jo i Jb
Так как каждый определитель в этой сумме имеет по две равных
строки, то все слагаемые обращаются в нуль, и, следовательно,
*,...«* *...*+1</0 = О. C)
Это соотношение упрощается, если среди чисел /t ik со-
содержатся некоторые из чисел /0, .... j%+v Если
то
а все остальные члены исчезают. Так как, по предположению, не-
неизвестные кососимметричны относительно их индексов, мы имеем
= Р^... уЛ... v*+i~ Pi' ••• V'A - V*+i= °-
В этом случае нет никаких соотношений. Нетривиальные соотноше-
соотношения, содержащие три члена, получаются, если
/о Л+1 = г*1 'ft-i« '» т> п-
Полагая 1к = А, находим, что
Ftl... ^ Л ...ift+1(P) = (- О* ft,... «j.jwft,... «Л_1*» +
и, следовательно,
Pi, ... «j.j
i,
0.
Мы получим теперь другую форму соотношения C). Если под-
подставить
'о> • • •> 's-l> 's + i> • • •> 'fc> гв/о» • • •> Jk
§ 6. КВАДРАТИЧНЫЕ ^-СООТНОШЕНИЯ 331
вместо
fi> • • •> '»> 'e+l *ft> JO' Jl< • • •» /fc+i
для произвольного s, О <; s <; k, то соотношение C) примет вид
F - 4(р) = Л» - W.« - V.P* - '* +
x?i(~1)Х;?<0 - *•-»*•+! - Vx-Ал...^_л...}к = о.
или
(— 1 )*"><„... ikPjo.
(последнее — в силу кососимметричности координат относительно их
индексов). Таким образом, соотношение C) всегда может быть при-
приведено к виду
Соотношения (З) или D) мы будем называть квадратичными р-со-
отношениями.
Докажем теперь следующую теорему:
Теорема II. Если С„Х\ элементов (..., р< ,{ ...) поля К,
не равных нулю одновременно, кососимметричны относительно их
индексов и удовлетворяют квадратичным р-соотношениям, то
существует k-мерное подпространство, координатами которого
служат (..., ?<,...<ft, -..)•
Если такое подпространство существует, то оно единственно.
Так как все координаты не могут быть равны нулю, мы можем
предположить, что
0
Для упрощения обозначений положим
Л< = / (/ = 0 к).
Из доказательства будет ясно, что этот метод можно распространить
на произвольное множество с0 ак. Мы имеем
А>...й#0.
Поскольку мы имеем дело с однородными координатами, можно
предположить, что ^0...»= 1. Если
bj*=Po...t-ifl+i...k A = 0, .... ft; j = 0 й),
то мы докажем, что Дг —|— 1 точек
В' = $ ltd (/ = 0,...,*)
332
ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
определяют ft-мерное подпространство, обладающее заданными ко-
координатами.
Так как bi =¦ ро... и = 1 (/ = 0. • • •, Щ, то подматрица, образо-
образованная первыми k-\-l столбцами матрицы (bj), является единичной.
Следовательно, ранг этой матрицы равен k -\- 1, и точки В° В*
определяют /f-мерное подпространство, которое мы обозначим че-
через Sk. Если положить .
то грассмановыми координатами подпространства Sk будут
(•••. ^<0...i,> ¦••)• Мы должны доказать, что
К
(Для
/0,
Так как /><„...< кососимметричны относительно их индексов, то этот
результат не зависит от порядка индексов. Пусть в множестве ин-
индексов /0, .... ih содержатся целые числа llt /2, ..., /s, превосхо-
превосходящие к, и пусть
'<)••••• 'fc —0'*,--> Л—^> А>ЛН~^»-##» /а — 11'в» Л"I"" *
Так как
то определитель, представляющий q^ ... { , может быть разложен по
элементам каждого из столбцов, индекс которого равен номеру зани-
занимаемого им места. Такой столбец содержит только один отличный от
нуля* элемент, находящийся на главной диагонали и равный единице.
Замечая, какие именно строки и столбцы удалены при этом упроще-
упрощении из рассматриваемого определителя, мы находим в конце концов,
что
¦•• 1к
E)
Наша теорема теперь доказывается индукцией по s.
Если s = 0, то
/0, .... ik = 0, .... k
и
Если s= 1, то
§ 6. КВАДРАТИЧНЫЕ р-СООТНОШЕНИЯ
333
так что при s=l теорема также справедлива. Мы предположим по-
поэтому, что pia... ik = qta... ik при s < t, т. е.
Пусть теперь s = t. Так как Pi0... i удовлетворяют квадратичным
^-соотношениям, то мы получаем из равенства D), что
к
ir_,Jtr+1 ... <к Po ... MV+i ••• *•
Pio ... ihPo ... * =
причем г находится в нашем распоряжении @ < г < k). Выберем г
так, чтобы i, было равно lt. Тогда
кроме значений j=j1 jt, которые являются единственными, опу-
опущенными из множества 0 к. Если, например, j=J\, то
Pi0 ... i _xjxi ,. ... ik имеет лишь t— 1 индексов, не принадлежащих
множеству @, .. ., k). Следовательно, в силу индуктивного предпо-
предположения,
Рч- W
i.o rO tO to ,o
bi0 ¦¦¦ Vibhbir+l ...bib
Тс к к к к
bit--- btr_x bh bif+1 ...b
¦¦»
*-l
hh-i
Это равенство получается после разложения предыдущего определи-
определителя по элементам последнего столбца, единственный отличный от
нуля элемент которого равен bi\=\. Далее, /?0 л = 1 - А так как
У=А и h — hy то мы имеем po...j-ц j+i... к~ bix. Отсюда, в силу
334
ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
квадратичного р-соотношения, получаем
= ,! (-1)
4- tA
и теорема для s = t доказана. Этим завершается доказательство тео-
теоремы II.
Мы получили, таким образом, условия, необходимые и достаточ-
достаточные для того, чтобы система (..., p{0...tk, ...) элементов поля К
могла служить строкой координат некоторого /f-мерного подпростран-
подпространства. Точнее, мы нашли некоторые определенные условия — /?-соотно-
шения, — которым удовлетворяют координаты ft-мерного подпростран-
подпространства. Возникает вопрос, имеются ли другие соотношения, связывающие
координаты /f-мерного подпространства? Полный ответ на этот вопрос
составляет содержание следующего параграфа.
§ 7. Теорема о базисе
Этот параграф посвящен доказательству следующей теоремы:
Теорема I. Если F(P) есть произвольный однородный много-
многочлен от неизвестных Pio...t , удовлетворяющий условию
F(p) =
для всех подпространств Sk, то
%
О)
где F^...« jo...jk+1(P) — квадратичные формы, определенные ра-
равенствами B) § 6, a Ai1...ik,ia...jk+1(P) —однородные многочлены
от неизвестных Я<0...< .
Для доказательства определим общее /f-мерное подпространство
пространства [п] как /f-мерное подпространство, определяемое к -\- 1
точками
>о, .... *») (i = 0 к),
где b\ — система (/г —[— 1) (Дс —}— 1) независимых неизвестных над основ-
основным полем К. Очевидно, что если F(P) — произвольная форма, для
§ 7. ТЕОРЕМА О БАЗИСЕ
335
которой
,к .к
-о.
то это соотношение останется справедливым и в том случае, если bj
выбираются каким-либо специальным образом. В частности, это будет
верно, если в качестве точек (Ьо, • • •, Ьп) выбираются « -j- 1 линейно
независимых точек произвольно заданного «-мерного подпространства.
Следовательно,
F(p) = 0
для каждого подпространства 5S. Обратно, если
для каждого 5ft, то
обращается в нуль при всех частных значениях b\. Так как этот много-
многочлен от (»-|- 1) (я-f-1) неизвестных b\ обращается в нуль при под-
подстановке" любых значений неизвестных, то он тождественно равен нулю
(гл. III, § 8, теорема I). Поэтому для того, чтобы форма F(P) удо-
удовлетворяла условиям теоремы, необходимо и достаточно, чтобы вы-
выполнялось равенство F(p) = 0, где (..., р»0,..<., ...) — координаты
общего «-мерного подпространства.
Пусть F(P) — форма, удовлетворяющая условиям теоремы. Сгруп-
Сгруппируем в F(P) все произведения степеней, изобарические по каждому
из индексов 0, ...,«, т. е. рассмотрим все произведения степеней,
в которых индекс 0 встречается Хо раз, индекс 1 встречается Xt раз
и т. д. Если обозначить через Д,...* (Р) сумму всех таких членов,
то
Пусть теперь ?}0'=0, .... «;/=0 «)—система(л-f l)(«-f-l)
неизвестных, р0, ..., рп—система п-\-\ других неизвестных, и пусть
336 ГЛ. VH. ГРАССМАНОВЫ КООРДИНАТЫ
Тогда (..., pio...{k, ...) и (..., qia.,.ik,-..) — координаты общих
й-мерных подпространств. Следовательно,
Так как р0, ..., рп — независимые неизвестные над полем K(bj), то
отсюда следует, что
для любых Хо кп. Следовательно, справедлива
Теорема II. Каждая форма F (Р), удовлетворяющая условиям
теоремы I, является суммой форм, изобарических по каждому
из индексов 0 пи также удовлетворяющих условиям тео-
теоремы I.
Для доказательства первой теоремы мы можем, следовательно,
ограничиться формами F(P), изобарическими по каждому из индексов.
Применим теперь двойную индукцию. Предположим сначала, что k
зафиксировано, an изменяется. Если п = k-\- 1, то подпространство Sk
является гиперплоскостью, определяемой единственным линейным урав-
уравнением
Его координатами служат
Po...i-Х <+1...»+! = (-I)*"**1 p' = (-1)*-<+Ч-
Так как at могут принимать произвольные значения независимо друг
от друга, то не существует ненулевой формы F(P), удовлетворяющей
условию
для каждого подпространства Sk из [ft+1].
Следовательно, мы можем сделать индуктивное предположение,
что теорема I верна для координат й-мерных подпространств в [п — 1],
или эквивалентное предположение, что эта теорема верна для форм F (Р),
в которых ни одно из действительно содержащихся в них неиз-
неизвестных Pio..,i не имеет индекса п.
Предположим теперь, что многочлен F(P), изобарический по
каждому из индексов, является изобарическим веса т относительно
индекса п и степени t относительно неизвестных Р^..лк- В силу
сделанного выше индуктивного предположения, теорема I верна при,
х = 0. Мы сделаем другое индуктивное предположение, что теорема
верна для изобарических форм F{P), вес которых относительно
индекса п меньше х.
Обозначим через
$ 7. ТЕОРЕМА О БАЗИСЕ
337
результат подстановки координат Ръ...^ подпространства Sk вместо
Pi». .ib B многочлен
дР(Р)
Пусть bj (i = 0, ..., k\ j = О, ..., n) — независимые неизвестные, и
пусть
Тогда, если О(Р) есть произвольная форма от Р%„..лк (G(p) может
и не обращаться в нуль], мы положим
и получим, что
dg(b) _ у Ri dQ(p)
где
а+г
Следовательно,
к
Sui dg(b)
h db\
dG(p)
i=o
B)
Так как
и pj являются независимыми неизвестными, то f(b) тождественно
равно нулю и, следовательно,
В силу равенства B), мы можем переписать это соотношение в виде
=0
22 Зак. 1230. В. Ходж и Д. Пидо
338 ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
Следовательно, п форм
^fia «.-о — I,
удовлетворяют условиям нашей теоремы. Так как каждая из них
является изобарической веса т—1 относительно индекса я, то мы,
в силу индуктивного предположения, получаем
r2 <¦¦¦ v^
где h = 0, ..., п — 1.
Мы имеем в виду вывести равенство A) из равенств C), при-
применяя к обеим частям этих равенств оператор
я —1
и суммируя затем по h от А = 0 до h = n—1.
Рассмотрим сначала действие этого оператора на левую часть
равенства C). Используя свойства изобаричности многочлена F(P) и
теорему Эйлера об однородных многочленах, получаем
A=0 m
л=о г >о-"«й_г'»
Но..,^_1Ир,,.,^1й
л=о »» г »
mo...mk_1n
Пусть теперь aQ, .... ак — некоторое множество чисел, выбранных
из совокупности @, . .., п). Рассмотрим слагаемое суммы E), соот-
соответствующее индексам
то> •••. "lit-\ = ao °ч-1> аи\ ак> А==й4.
§ 7. ТЕОРЕМА О БАЗИСЕ
339
В силу соотношения B) § 6, соответствующими членами суммы E)
будут
к
,. Vя"
Следовательно,
л-1
дР, ,
а г
У V
я It 1
d*F(P)
dF(P)
- ¦»
a ГУ , Fl-¦¦¦'.-'«-¦I.<p>-
Так как ?^-т: и мы предполагаем, что г>0, то коэффициент
многочлена Р(Я) в равенстве F) отличен от нуля.
Рассмотрим теперь действие оператора на правую часть равен-
равенства C). Мы имеем'
= Я* И* ... v л...
22*
340 ГЛ. VII. ГРАССМАНОВЫ КООРДИНАТЫ
Из этого равенства и равенств C) и F) мы получим равенство A),
если сможем доказать, что
является линейной комбинацией форм Fa,...t^ba¦ ¦•ьк.1 (Р) при любом
выборе индексов ^, ..., ik, j0, ..., jk+1 и h.
(I) Если h отлично от i1, ..., ik и от /0, ..., Д+1, то ясно, что
(II) Если h равно, например, ilt но h ф jQ, ..., Д+ц то легко
видеть, что.
(Ill) Если h равно, например, /0, но А =? ilt ..., ./fc, то
(IV) Наконец, если А равно, скажем, i^—Jq, to
ОЛ[^... v л... i»+1(/3)]=/7»«1... «fc. л ...^+1
Этим завершается доказательство теоремы I.
ГЛАВА VIII
КОЛЛИНЕАЦИИ
В этой главе основное тело К снова предполагается коммутатив-
коммутативным и не имеющим характеристики. Нет необходимости сразу же
считать его алгебраически замкнутым, но в дальнейшем нам придется
наложить и это ограничение.
§ 1. Проективные преобразования
Пусть Sm и Sn — два различных проективных пространства раз-
размерностей т и п над полем К. Выберем некоторую допустимую систему
координат х в пространстве Sn и у в пространстве Sm. Рассмотрим
систему уравнений
п
yt = S atjXj (i = О т\ atj ? К),
имеющую в матричной форме вид
у = Ах. A)
Мы можем предположить, что (от-}- 1) X (л-f- 1)-матрица А является
ненулевой. Система уравнений A) относит каждой точке (х0, ..., xj
пространства Sn, координаты которой не удовлетворяют системе урав-
уравнений
1 = 0
некоторую точку (_у0, ..., ут) пространства Sm. Точки, удовлетво-
удовлетворяющие указанной системе уравнений и называемые особыми точками
пространства 5П, образуют линейное подпространство размерности п — г,
где г — ранг матрицы А.
При г = п-\^\ особых точек не существует и уравнения A) опре-
определяют невырожденное проективное преобразование пространства Sn
в пространство Sm. Необходимым условием для того, чтобы такое пре-
преобразование было возможно, является выполнение неравенства т^-п.
При г <[ п система уравнений A) определяет вырожденное проек-
проективное преобразование пространства Sn в пространство Sm. Пусть
теперь
х = Рх* B)
342 ГЛ. VIII. КОЛЛИНЕАЦИИ
есть некоторое допустимое преобразование координат в пространстве Sn, a
y = Qy* C)
— допустимое преобразование координат в пространстве Sm. В новых
координатах проективное преобразование A) принимает вид
т. е.
у* = Q-
Как следует из теоремы II § 4 гл. II, можно найти такие матрицы Р
и Q, что
где г — ранг матрицы А. Число г называется рангом преобразования.
Мы получили следующую теорему:
Теорема I. Каждое проективное преобразование простран-
пространства Sn в Sm, имеющее ранг г, при соответствующем выборе
координатных систем в пространствах Sn и Sm может быть
представлено в виде
yi = Xi (i = 0 г—1), Л = 0
Этот вид системы A) мы будем называть каноническим. При
изучении геометрии проективного преобразования бывает удобно
использовать именно каноническую форму его системы уравнений. Не
делая пока этого, рассмотрим точки пространства Sm, лежащие в гипер-
гиперплоскости
Эти точки при проективном преобразовании A) получаются из
точек пространства Sn, лежащих в гиперплоскости
где
т
ttj = 2 о&ъ U = о, • • •. »)•
4=0
Последняя система уравнений в матричной форме имеет вид
и = A'v, D)
где А' — матрица, транспонированная к А. Уравнением D) определяется
некоторое проективное преобразование гиперплоскостей простран-
пространства Sm в гиперплоскости пространства Sn. Это преобразование
мы будем называть дуальным по отношению к проективному преобра-
§ 1. ПРОЕКТИВНЫЕ ПРЕОБРАЗОВАНИЯ 343
зованию A). Преобразованиями координат B) и C) индуцируются
дуальные преобразования
и* == Р'и, v* = (/v.
Следовательно, дуальное преобразование D) в новой системе коор-
координат имеет вид
и* = р'и = P'A'v = Р'А' (ф-1 v* = (Q
Таким образом, соотношение между проективным преобразованием
и дуальным к нему преобразованием сохраняется при преобразовании
координат. Этот результат непосредственно виден и из геометрического
определения.
Если точечное преобразование задано в канонической форме, то
дуальное преобразование также будет иметь каноническую форму
Ui — Vt (i=0, ..., г—-1), и< = 0 (/>г).
Прежде чем изучать геометрию проективных преобразований при
произвольных т, п и г, рассмотрим простой случай, когда
т = п = г— 1.
Канонические формы будут тогда иметь вид
y{ = xf (< = 0 п); **< = •»< (/ = 0 к).
При этом каждой точке пространства Sn (гиперплоскости простран-
пространства- Sm) соответствует некоторая точка пространства Sm (гиперпло-
(гиперплоскость пространства Sn), и наоборот. Обратное преобразование в этом
случае также будет проективным преобразованием (Sm в Sn). Линейно
независимым точкам или гиперплоскостям соответствуют линейно неза-
независимые точки или гиперплоскости, а линейно зависимым точкам или
гиперплоскостям — линейно зависимые точки или гиперплоскости.
Следовательно, каждому подпространству Sk пространства Sn соот-
соответствует вполне определенное ft-мерное подпространство 5fc простран-
пространства Sm, причем каждое подпространство S'je пространства 5Щ полу-
получается из вполне определенного подпространства Sk пространства Sn>
Если Sk определяется точками
(*о,"..., *») A = 0 А)
пространства Sn и имеет грассмановы координаты (..., p^...i., •••).
то Sk будет определяться точками
(*о *») ('" = 0 А)
пространства Sm. Следовательно, его грассмановыми координатами
будут (..., qio...ik, ...), где
1 ••• 'к
344 ГЛ. VIII. КОЛЛИНЕАЦИИ
Отсюда следует, что рассматриваемое проективное преобразование
переводит подпространство Sk с координатами (..., р^... <fr> ...) в под-
подпространство 5^ пространства Sm с координатами (..., Pia...ik, ...)
для каждого значения к. В частности, при к = т — 1 подпростран-
подпространство Sn_1
(«о й«)
пространства Sn преобразуется в подпространство Sm_i
(«о и»)
пространства Sm, причем это преобразование гиперплоскостей про-
пространства Sn в гиперплоскости пространства Sm является обратным
к определенному выше дуальному проективному преобразованию гипер-
гиперплоскостей.
Займемся теперь изучением проективного преобразования ранга г,
переводящего Sn в пространство Sm, где т и п произвольны и г > 0.
В обоих пространствах выберем системы координат так, чтобы рас-
рассматриваемое проективное преобразование определялось системой урав-
уравнений канонического вида
Л-0 (/>/¦).
•} E)
Дуальное преобразование будет тогда определяться системой урав-
уравнений
at=*vt (/ = 0, .... r—l), \
«, = 0 (,>Г). J <6>
Особыми точками пространства Sn, т. е. точками, не имеющими
образов, будут точки пространства Sn_r с координатами
**=»0 (/ = 0, .... r — l).
Мы будем называть это Sn_r особым подпространством простран-
пространства Sn. Геометрическое место тех точек пространства Sm, которые
являются образами точек пространства Sn, определяется системой урав-
уравнений
и, следовательно, является линейным (г—1)-мерным подпростран-
подпространством ?,._!. Мы назовем его образом пространства Sn при задан-
заданном преобразовании.
Рассмотрим теперь дуальное преобразование F). Его ранг также
равен г. Гиперплоскости пространства Sm, не имеющие образов, опре-
определяются системой уравнений
4 = 0 (/ = 0, .... r—l).
§ 1. ПРОЕКТИВНЫЕ ПРЕОБРАЗОВАНИЯ 345
Эти гиперплоскости пересекаются по подпространству Sr_i« Анало-
Аналогично, гиперплоскости пространства Sn, являющиеся образами гипер-
гиперплоскостей пространства Sm, проходят через особое подпростран-
подпространство Sn_r.
Системой уравнений E) определяется некоторое невырожденное
проективное преобразование Г* подпространства Sr-1 из Sn, опре-
определяемого системой уравнений
в Sr-i! системой уравнений F) с i = 0, ..., г—1 определяется
преобразование, дуальное к Т*. Свойства этого невырожденного пре-
преобразования подпространства Sr-i в Sy.j непосредственно следуют
из рассмотренных выше свойств невырожденных проективных преобра-
преобразований.
Рассмотрим теперь свойства преобразования E), вытекающие из
свойств преобразования Т*. Две точки (лг0, ..., хп) и (х0 х'п)
пространства Sn, не принадлежащие особому подпространству Sn_r,
преобразованием E) переводятся в одну и ту же точку пространства Sm
в том и только в том случае, если
x{ = kxi (i = 0, ..., г—I).
Геометрически последнее условие означает, что эти точки имеют оди-
одинаковые проекции (jc0, ..., хг_1г 0, .... 0) из особого подпростран-
подпространства Sn_r на Sr_v Далее, каждая точка Р пространства Sn, не содер-
содержащаяся в 5П_Г> содержится вместе с этим Sn_r в некотором под-
подпространстве 5п_г+1. Отсюда следует, что точка Q подпространства Sn,
не содержащаяся в Sn_r, в том и только в том случае имеет в Sm
тот же образ, что и точка Р, если точка Q содержится в подпро-
подпространстве Sn_r+1, определяемом точкой Р. Тем самым каждому под-
подпространству <Sn_r+1 пространства Sn, содержащему особое подпро-
подпространство Sn_r, поставлена в соответствие некоторая определенная
точка в 2r_i, и обратно. Мы можем назвать это соответствие между
подпространствами Sn_r+1, содержащими Sn_r, и точками подпро-
подпространства Sr_j проективным соответствием. Легко видеть, что при
этом соответствии (п — г-\- 1)-мерные подпространства пространства Sn,
проходящие через особое подпространство Sn_r и содержащиеся в неко-
некотором (»— r-j-fc-f- 1)-мерном подпространстве, также проходящем
через Sn_r, соответствуют точкам некоторого ft-мерного подпространства
из ?,._!• В частности, гиперплоскости пространства Sn, проходящие через
особое подпространство Sn_r, соответствуют (г — 2)-мерным подпро-
подпространствам из 2Г_1.
Свойства дуального преобразования F) пространства Sm в про-
пространство Sn получаются аналогично. Если П — произвольная гипер-
гиперплоскость пространства Sm, не содержащая подпространство ?r-i.
и если IT — соответствующая гиперплоскость пространства S
n,
346 ГЛ. VIII. КОЛЛИНЕАЦИИ
проходящая через особое подпространство Sn_r, то для того, чтобы дру-
другая гиперплоскость Пх пространства Sm имела тот же самый образ П',
что и П, необходимо и достаточно, чтобы гиперплоскости II и Пх
пересекали Lr_t по одному и тому же (г — 2)-мерному подпростран-
подпространству. Каждому подпространству 5Г_2 из Sr_t соответствует вполне
определенная гиперплоскость пространства Sn, проходящая через осо-
особое подпространство Sn_r. Это соответствие между (г — 2)-мерными
пространствами из И^_1 и гиперплоскостями пространства Sn, прохо-
проходящими через особое подпространство Sn_r, совпадает с тем, кото-
которое получено выше при прямом преобразовании.
Посмотрим, что происходит в том случае, когда пространства Sn
и Sm совпадают; обозначим их в этом случае через [я]. Тогда при
преобразовании A) точка Р пространства [п] переходит в другую
точку Р* того же самого пространства, и вообще каждое подпро-
подпространство Sk пространства [л], не пересекающее особого подпростран-
подпространства Sn_r, преобразуется в другое подпространство Sk.
Важно понимать различие между преобразованием пространства [л]
и преобразованием координат. Преобразование координат есть соот-
соотношение между двумя строками координат одной и той же точки.
Рассматриваемое же соответствие есть соотношение между строками
координат двух различных точек.
. Преобразование типа у = Ах, отображающее пространство [и]
в себя, называется коллинеацией в [я]. Проективная геометрия изу-
изучает свойства геометрических фигур, инвариантные относительно
коллинеаций.
Вся оставшаяся часть этой главы будет посвящена коллинеациям.
§ 2. Коллинеаций
Выберем в пространстве [п] над полем К некоторую допустимую
систему координат и рассмотрим коллинеацию, определяемую систе-
системой уравнений
л2
или, в матричной записи,
у = Ах. A)
Пусть в пространстве [п] задано преобразование координат
Координаты точек х, у преобразуются в х*, у*, причем
х = Рх*, у = Ру*,
и, следовательно, в новых координатах рассматриваемая коллинеация
определяется уравнением
§ 2. КОЛЛИНЕАЦИИ 347
Коллинеация, дуальная к A) (ср. § 1), имеет вид
и = A'v, B)
где и = (и0, .. ., ап) есть гиперплоскость, содержащая каждую
точку х, образ у которой при преобразовании A) лежит в гипер-
гиперплоскости v = (v0, ..., vn). Если А — невырожденная матрица, то
равенство B) может быть переписано в виде
v = Au, C)
где
Коллинеация C) преобразует гиперплоскость и в такую гипер-
гиперплоскость v, которая содержит образы у всех точек х, принадлежащих
гиперплоскости и, и только эти точки.
Преобразование координат
х = Рх*
превращает уравнение B) в
н* =
а уравнение C) — в
Учитывая действие преобразования координат на уравнения A),
B) и C), определим подобие коллинеаций пространства [«]. Две кол-
линеации
у = Ах и у = Вх
подобны, если существует такая невырожденная матрица Р с элемен-
элементами из поля К, что
Отношение подобия, очевидно, рефлексивно и симметрично. Кроме
того, если
C = Q~15Q (где Q — невырожденная матрица),
то
следовательно, это отношение также и транзитивно. Оно является,
таким образом, отношением эквивалентности. Связь между подоб-
подобными коллинеациями состоит попросту в том, что одна коллинеация
превращается в другую при некотором невырожденном проективном
преобразовании
х — Рх*
пространства [п\.
Наши основные задачи состоят в следующем.
1. Установить необходимые и достаточные условия подобия двух
коллинеаций.
ГЛ. VIII. КОЛЛИНЕАЦИИ
2. Найти канонические формы коллинеаций пространства [»], т. е.
найти множество коллинеаций, обладающих следующими свойствами:
а) никакие две коллинеаций из этого множества не эквивалентны,
б) каждая коллинеация эквивалентна одной из коллинеаций этого
множества.
Канонические формы выбираются так, чтобы по ним легко можно
было судить о геометрических свойствах коллинеаций. Докажем
следующую теорему:
Теорема I. Две коллинеаций
у —Ах и у = Вх
тогда и только тогда подобны, когда Х-матрицы А~\Еп+1 и 5—Х?п+,
имеют одинаковые инвариантные множители (или, если поле К
алгебраически замкнуто, одинаковые элементарные делители).
В силу теоремы III § 9 гл. II, для эквивалентности Х-матриц
^ ^g и в — ХЯя+1 в смысле § 9 гл. II необходимо и доста-
достаточно чтобы они имели одинаковые инвариантные множители. Если
это так, то BkE
где М и N— некоторые Х-матрицы. В силу теоремы V § 9 гл. II,
из последнего равенства вытекает существование невырожденных
матриц Р и Q над полем К, удовлетворящих соотношению
Отсюда следует, что
В = PAQ,
Поэтому Р = <?-»,
и, следовательно, о^п-^лп
Предположим теперь, что поле К алгебраически замкнуто. Заме-
Заметим прежде всего, что каждый из определителей
|Л-Х?я+1| и \В-ХЕп+1\
представляет собой многочлен степени и-f-l со старшим членом
Следовательно, эти многочлены являются ненулевыми, а ранги мат-
матриц A — lEnii и 5 —Х?п+1 равны И+1- Таким образом, утверж-
утверждение теоремы I для случая алгебраически замкнутого поля К выте-
вытекает из теоремы IV § 9 гл. II.
Обозначим через Е^(\), ..., ?П+1(А) инвариантные множители
матрицы А — А?„+1. и ПУСТЬ степень многочлена ?<(Х) равна />
§ 2. КОЛЛИНБЛЦИИ
349
п+1
Так как
то
П+1
2 /•< = »+1,
а так как многочлен Et(K) делит Е{+1(\), то
Допустим, что
ri — гч = ¦ ¦ • = гв = О,
но
Положим
'8+1
Et (А) = Х'<+ вй
и рассмотрим riX/VMaTPH1*y
0
0
0
1
0
0
0 ...
1 ...
0 ...
0
0
1
—а,
¦iH ¦
лп
Докажем, что инвариантными множителями матрицы Bt — \Еп
являются
1.1,.... 1. ад>.
Для этого рассмотрим миноры порядка t, составленные из мат-
матрицы Bt — ЪЕГ.. При 1<!^<г< возьмем минор, образованный 1-й,
2-й, ..., ?-й строками и 2-м, 3-м, ..., (?-|- 1)-м столбцами этой матрицы.
Этот минор порядка t равен, очевидно, единице. Следовательно,
наибольший общий делитель миноров порядка t матрицы Bi — \Ert
имеет при 1 <[ t < rt нулевую степень. Если же t = rit то
а это и доказывает наше утверждение.
Пусть теперь В будет (и-f- 1)Х(Я+ 1)-матрицей
/B
в+1
о в
0
8+2
о
о
D)
о о
350 ГЛ. VIII. КОЛЛИНЕАЦИИ
Докажем, что матрица В — кЕп+1 имеет инвариантные множители
Ех (А) Ей+1(к) Еп+1(Х).
Мы можем произвести элементарное преобразование (гл. II, § 9) лю-
любой подматрицы Bt—kEr (s-\- 1 <;?<[«-|- 1) матрицы В — кЕп+1,
не затрагивая при этом строк и столбцов других подматриц, так как
эти подматрицы не имеют общих строк и столбцов. Следовательно,
каждую подматрицу можно привести к канонической форме при
помощи элементарных преобразований самой матрицы В — кЕп+1.
В то же время посредством других элементарных преобразований эту
матрицу можно привести к виду
/Е, 0 ... 0
0 Еа+1(к) ... 0
0 ... Еп+1(к),
Так как многочлен Et(k)— делитель многочлена Ei+1(X), то из того,
что инвариантные множители являются наибольшими общими делите-
делителями соответствующих миноров, ясно, что последняя матрица имеет
инвариантные множители
1, 1, ..., 1, cg+1(A), ..., Еп+г(к),
ЗД), .... Eg(k), E.+l(\), .... Еп+1(\).
Таким образом, матрица В — А?п+1 эквивалентна матрице А —^Еп+1,
ибо она имеет те же инвариантные множители (гл. Н, § 9, тео-
теорема III).
Канонической формой коллинеаций, подобных коллинеации A),
будем считать
у = Вх,
где В — матрица, определенная равенством D). Мы получили сле-
следующий результат:
Теорема II. Если матрица А — кЕп+г имеет инвариантные
множители
Et(k), .... En+1(k)
и если матрица В определена равенством D), то коллинеация
у = Ах
подобна коллинеации у = Вх, причем последнее уравнение может
быть принято в качестве канонической формы коллинеаций, по-
подобных коллинеации A).
Если основное поле К алгебраически замкнуто, обычно удобнее
в качестве канонических принимать другие формы коллинеации,
§ 2. КОЛЛИНЕАЦИИ
351
используя вместо инвариантных множителей элементарные делители.
Пусть матрица А — А?ге+1 имеет элементарные делители
(А — ai)e' (А — «л)е*4
В настоящий момент нам нет необходимости делать различие между
равными и неравными между собой at. В силу рассмотренных в § 9
гл. II свойств элементарных делителей,
е<>0 (/=1 к)
и
ei+ ¦¦¦ +efc = «+1-
Пусть Св(а) есть еXе"матрица
a 1 0 ... О 0)
0 a 1 ... 0 0
0 0 0 ... a 1
0 0 0 ... О a
Тогда матрица Се{а) — \Ее имеет единственный элементарный дели-
делитель (Л — а)е. Действительно,
а определитель {е—1)-го порядка, полученный вычеркиванием в рас-
рассматриваемой матрице последней строки и первого столбца, равен
единице.
Пусть теперь С есть (п-\- 1) X (я-{-1)-матрица
/Св1(а,) 0 ... О
О СеДа2)... О
E)
О
О ... Сек(*к)
Методом, аналогичным использованному при доказательстве теоремы II,
мы можем доказать, что элементарными делителями матрицы
С — А?п+1 являются
'(А —«О (А —«»А
Это дает следующий результат:
Теорема III. Если элементарными делителями матрицы
А — А?п+1 являются
(A —ej)ei (A-«»)'*,
/ко коллинеация A) подобна коллинеации
352
ГЛ. VIH. КОЛЛИНЕАЦИИ
где С есть построенная при помощи этих элементарных дели-
делителей матрица E). Эта коллинеация служит канонической фор-
формой коллинеаций, подобных коллинеации A).
Необходимо отметить, однако, что геометрически две коллинеации
ру — Ах (р Ф 0),
заданные в одной и той же допустимой системе координат, произ-
производят одно и то же преобразование точек, прямых, ... простран-
пространства [п\. Следовательно, две коллинеации
у = Ах и . у = Вх
подобны в геометрическом смысле, если элементарные делители ма-
матриц А~ХЕп+1 и В— А.?п+1, т. е.
таковы, что при надлежащем их расположении
где ji — отличный от нуля элемент поля К-
В следующих параграфах этой главы мы будем предполагать, что
поле К алгебраически замкнуто.
§ 3. Неподвижные точки и гиперплоскости невырожденной
коллинеации
Пусть в пространстве [п] над алгебраически замкнутым полем К
задана некоторая коллинеация. Мы можем тогда, как и в § 2, вы-
выбрать такую допустимую систему координат, в которой эта колли-
коллинеация имеет вид
У = Сх, A)
где
c =
Се, К)
0
0
0
СеЛЧ)
а.
0
0
0
0
1 0 .
а 1 .
0 0 .
0 0 .
.. 0
.. 0
. . а
.. 0
с
0
0
1
а
0
0
5ft(°
§ а. неподвижные точки и гиперплоскости 353
Элементарными делителями матрицы С —X?fn+1 являются
Их называют обычно элементарными делителями самой коллинеа-
коллинеации A). Заметим, что если исходная коллинеация определяется равен-
равенством
то существует такая невырожденная матрица Р, что
С = Р~*АР.
Следовательно,
I С - кЕп+11 = \А - кЕп+11 = ( Ц
Подставляя к = 0, получаем
| С | = | Л | = «?'... а**.
В этом параграфе мы будем предполагать, что рассматриваемая кол-
коллинеация является невырожденной, т. е. что
\А\.ФО.
Из этого предположения следует, что все собственные значения at
отличны от нуля.
Подматрицы Ce[(af) в канонической форме A) могут располагаться
по главной диагонали матрицы С в каком угодно порядке. Однако
нам будет удобно располагать их в таком порядке, чтобы:
(I) подматрицы Св{(а{), соответствующие равным собственным зна-
значениям а<, стояли рядом и
(II) при at = aj и et<^ej подматрица Ce(<xt) предшествовала под-
подматрице С„^(а,).
Во всем дальнейшем изложении мы будем предполагать, что под-
подматрицы расположены именно таким образом.
Точка (z0, ..., гп) пространства [л] называется неподвижной
точкой колл.инеации A), если при этой коллинеации она преобразуется
сама в себя. Условие это можно выразить равенством
Cz = pz,
где р — отличный от нуля элемент поля К. Система уравнений
имеет решение (z0 zn) в том и только в том случае, если
(гл. II, § 8)
' | 0
23 Зак. 1230. В. Ходж и Д. Пидо
354
ГЛ. VIII. КОЛЛИНЕАЦИИ
т. е. если р является собственным значением коллинеации. Пусть
Р = «1 и ¦ .
«1 = «2 = • • • = а«.
«< Ф «* (* > О-
Система уравнений, определяющих неподвижную точку, соответствую-
соответствующую собственному значению р = а1( имеет вид
B.1)
B.2)
B.t)
Из уравнений B.1) мы получаем последовательно
из уравнений B.2), так как a1 = a2, получаем
и т. д.; из уравнений B,.t) находим, что
*e, + ... + et_1+l = Of •••• ^e, + ...+et-l =0.
Наконец, рассматривая последнее уравнение и двигаясь от него в обрат-
обратном направлении, найдем, что
Следовательно, у неподвижной точки (z0, ..., гп), соответствующей
собственному значению alf все координаты, кроме
S 3. НЕПОДВИЖНЫЕ ТОЧКИ И ГИПЕРПЛОСКОСТИ 355
равны нулю. Обратно, можно непосредственно показать, что если все
координаты точки {z0 zn), кроме только что перечисленных, равны
нулю, то эта точка удовлетворяет системе уравнений B) и, следова-
следовательно, является неподвижной.
Если А0,...,Ап — вершины репера нашей системы координат,
то из последнего результата вытекает, что неподвижные точки, соот-
соответствующие собственному значению а1 матрицы С, образуют линей-
линейное (t— 1)-мерное подпространство, порождаемое вершинами Ао, А^,
Лв1+е„ ..., Лв1+...+е . Мы будем называть его фундаментальным
подпространством коллинеации, соответствующим собственному зна-
значению аг
Неподвижные точки, соответствующие любому другому собствен-
собственному значению матрицы С, находятся аналогичным образом. При этом
непосредственно получается следующая
Теорема I. Пусть о^— произвольное собственное значение
матрицы С, и пусть
— ее подматрицы, соответствующие собственному значению at,
Тогда неподвижные точки, соответствующие at, образуют фун-
фундаментальное подпространство, порождаемое точками
и, следовательно, лежат в некотором s-мерном подпространстве.
Так как каждое фундаментальное подпространство определяется
некоторым множеством вершин репера и так как никакие два из
этих множеств, соответствующих различным собственным значениям,
не. имеют общих точек, мы получаем следующий результат:
Теорема П. Фундаментальные подпространства, соответ-
соответствующие различным собственным значениям, не пересекаются.
Более того, они линейно независимы, т. е. если их размерности
равны тх тг, то их сумма является подпространством раз-
г
мерности г — 1+2 Щ-
1
Далее, из теоремы I следует, что сумма всех фундаментальных
подпространств есть подпространство, определяемое вершинами
и, следовательно, имеет размерность k — 1. Отсюда
Г—
1
Сумма всех фундаментальных подпространств совпадает со всем про-
пространством [п] в том и только в том случае, если k = n -j- 1, т. е. если
е1^е% = ... =ек=1.
23*
356
ГЛ. VIII. КОЛЛИНЕАЦИИ
Этот случай, в котором все элементарные делители линейны, мы
будем иногда называть неспециальным. Специальным случаем будет
тот, в котором по крайней мере один из элементарных делителей
имеет степень выше первой.
Коллинеацией A) каждое ^-мерное подпространство SK преобра-
преобразуется в другое А-мерное подпространство $*, состоящее из всех
образов у точек х подпространства Sk. Это доказывается точно так
же,- как в случае невырожденного проективного соответствия между
двумя различными и-мерными пространствами. В частности, при
й = я—1, если Sk есть гиперплоскость
и = (и0 и„),
a S/c—гиперплоскость
это преобразование определяется уравнением
v = Cu.
C)
Гиперплоскости w = (w0, ..., wn), соответствующие самим себе
в этой коллинеации, удовлетворяют системе уравнений
pw = Cw (р Ф 0).
Мы приходим, таким образом, к исследованию элементарных делите-
делителей матрицы
С — \Еп
Так как
/ бв,(е4) 0 ... 0
с= о св!(од... о
1 о
а-1
— а-2
а-"
0
•
0
а
— а
-1
-2
0 .
0 .
а-l .
..0
.. 0
..0
то легко показать, что элементарными делителями матрицы С —.
являются
(Х_ оГ1)* (Л — а*1)8*.
С целью упрощения записи заметим, что равенство Cw = pw (для"
некоторого р Ф 0) выполняется тогда и только тогда, когда Cw = sjw
§ 3. НЕПОДВИЖНЫЕ ТОЧКИ И ГИПЕРПЛОСКОСТИ
357
(для некоторого о). Следовательно, чтобы получить неподвижные
гиперплоскости коллинеации C), достаточно рассмотреть неподвижные
гиперплоскости дуального преобразования
и = C'v. D)
Матрица С — А?и+1 имеет, очевидно, те же элементарные делители,
что и матрица С — А.?п+1, т. е.
(Х-а,)8' (А —«»)'*•
Поэтому неподвижная гиперплоскость (w0 wn), соответствующая
собственному значению av определяется следующей системой уравнений:
E.1)
E.2)
E.t)
аЛ =W»-i-
Из уравнений E.1) мы последовательно находим, что
затем из уравнений E.2) E.t) получаем, что
«Ч+е„_2 = 0, .... вдв, = 0
так как «! = ... = «*, и, наконец, получаем, что
Следовательно, неподвижные гиперплоскости должны содержать точки
"О •"e,-2i "в! ¦"eJ + e,-2
¦Лв1+ ... +ef_i> • • ч ¦"е^ ... +ef-2i -^ej+ ... +е(> • • •> -"п»
358 ГЛ. VIII. КОЛЛИНЕАЦИИ
и обратно, каждая гиперплоскость, содержащая эти точки, удовлет-
удовлетворяет уравнению D).
Эти точки определяют некоторое линейное подпространство Sn_t,
а проходящие через него гиперплоскости образуют звезду с верши-
вершиной Sn_t. Эта звезда гиперплоскостей дуальна к множеству непо-
неподвижных точек подпространства St_lt и свойства этой звезды могут
быть выведены с помощью принципа двойственности из свойств мно-
множества неподвижных точек, соответствующих собственному зна-
значению av
Каждому из различных собственных значений матрицы С соот-
соответствует своя звезда неподвижных гиперплоскостей; для определения
звезды неподвижных гиперплоскостей, соответствующих данному соб-
собственному значению, можно пользоваться правилом, аналогичным
теореме I:
Теорема III. Если а{ — любое собственное значение матрицы С
{или С) и
— подматрицы матрицы С, соответствующие собственному зна-
значению ait то неподвижные гиперплоскости, соответствующие alt
образуют звезду, вершиной которой является сумма точек
•"О -^8,+ ... +e^-l> ^6,+ ... +eg, ¦••» ^e,+ ... +е?+1-2, •••.
АЪ+ ... +ег+8_1 А*,+ ... +eg+g-2 А»,+ ... +е2+8, •-., Ап.
При а{ = oij- и et < е$ мы условились ставить подматрицу Се< (af)
матрицы С раньше Ce.(aj)- Предположим, что
eq == • • • == ед+*:= Ь eqH+l' • • •> гд + 8 ^ *•
Тогда, в силу теорем I и III, пространство Ss неподвижных точек,
соответствующих собственному значению af, и вершина Sn_e_t звезды
неподвижных гиперплоскостей, соответствующих тому же собственному
значению, пересекаются по подпространству Se_t_v определяемому
точками
Аналогично, подпространство неподвижных точек, соответствующих
произвольному собственному значению а^ (о^ Ф at), лежит в вершине
звезды, соответствующей собственному значению а{. Это дает следую-
следующий результат:
Теорема IV. Фундаментальное подпространство неподвижных
точек, соответствующих любому данному собственному значе-
значению а, лежит в вершине звезды, соответствующей любому дру-
другому собственному значению, и пересекает вершину звезды, соот-
соответствующую собственному значению а, по. подпространству
§ 3. НЕПОДВИЖНЫЕ ТОЧКИ И ГИПЕРПЛОСКОСТИ 359
размерности р—1, где р есть число нелинейных элементарных
делителей вида (X — а)8 (е > 1).
В качестве непосредственного следствия получаем, что если кол-
линеация неспециальна, то вершина фундаментальной звезды,
соответствующей любому данному собственному значению, яв-
является суммой фундаментальных подпространств, соответствую-
соответствующих остальным собственным значениям.
Пусть теперь St_t и Sn_t — фундаментальное подпространство и
вершина фундаментальной звезды, соответствующие собственному
значению at матрицы С. Предположим, что
.. <е4. F)
Пусть, . далее, х — произвольная точка пространства [п], у — Схн
z = y—alx = (C—a1En+1)x. G)
Точка z, очевидно, коллинеарна с точками х и у, а из равенства G)
следует, что она является образом точки х при коллинеации с мат-
матрицей С — <*iEn+i- Так как \С — ax En+t | = О, то эта коллинеация
является вырожденной. Точка z однозначно определяется равенством
G), если исключить случай, когда
Сх = atx,
т." е. когда х лежит в St_v Если х не лежит в St_lt то из равен-
равенства G) следует, что координаты точки z удовлетворяют системе
уравнений
т> е. что точка z лежит в Sn_t.
Легко видеть также, что если х* — произвольная точка подпро-
подпространства St, содержащего точку х и подпространство Sti_v то образ
точки х* при коллинеации G) совпадает с точкой z, и это соответ-
соответствие между ^-мерными подпространствами, проходящими через St_t,
и точками г подпространства Sn_t является проективным. Мы дока-
докажем этот результат, который можно сравнивать с аналогичным ре-
результатом § 1, используя символические обозначения для точек. Если
точки
Л)> ^i» • • • > ^*-i
образуют базис подпространства St_u то
«i^ ('==0 t— 1).
Пусть Р — произвольная точка, не содержащаяся в St_1. Тогда произ-
произвольная точка х* подпространства St, содержащего Р и St_lt опре-
определяется равенством
360 ГЛ. ViU. КОЛЛИНЕАЦИИ
при соответствующих kt и [1 из поля К. Далее,
Сх* =* S *« с (Pt) 4-1* с (Р) = «г s я,р,
о о
и, следовательно, точка
г = Сх* — ахх* = р [С (Р) — <?,Р] (8)
не зависит от выбора точки х* в подпространстве 5<. Если точка Р
выбирается в некотором подпространстве 5^_f, не пересекающем 54_г,
то она определяет подпространство St и сама им однозначно опре-
определяется. Так как подпространство 54-1 является суммой точек
то мы можем выбрать точку Р в подпространстве S'n-t, порождаемом
остальными вершинами репера. Система уравнений (8) при произволь-
произвольном выборе точки Р в Sn-t дает вполне определенную точку г, лежа-
лежащую в Sn_t. Обратно, если мы рассмотрим эту систему уравнений
в предположении, что точка г содержится в Sn_t, то увидим, что
эта система разрешима относительно координат точки Р. В предпо-
предположении, что точка Р содержится в 5^_$, решение будет единствен-
единственным. Следовательно, соответствие между ^-мерными подпространствами,
проходящими через St_v и точками г подпространства Sn_t можно
считать проективным.
Рассмотрим теперь действие исходной коллинеации A) у — Сх на
подпространство St, определяемое точкой Р и подпространством не-
неподвижных точек 5(_j. Так как
то точки подпространства St преобразуются в точки подпростран-
подпространства St, определяемого образом точки Р при коллинеации A), и под-
подпространством St_v Так как равенство
z =y — alX* = ii [С(Р) — V4
дает точку, содержащуюся в Sn_t и не зависящую от выбора точки х*
в St, то это соответствие между подпространствами St и St является
перспективностью с центром в z.
Предположим теперь, что в условии F) s меньше t, так что кол-
линеация A) имеет и нелинейные элементарные делители, соответ-
соответствующие собственному значению а1. Тогда подпространства St_t
и Sn_t будут пересекаться по некоторому (t — s—1)-мерному под-
подпространству, скажем St_8_v Если г есть точка подпространства
St-e-i и S* — однозначно определенное t-мерное подпространство,
проходящее через St_x и отвечающее точке z в описанном выше
§ 3. НЕПОДВИЖНЫЕ ТОЧКИ И ГИПЕРПЛОСКОСТИ 361
проективном соответствии, то образ подпространства St при коллиг
неаиии A) перспективен подпространству St с центром в г. Так как
этот образ содержит St_u а точка г лежит в St_x, то он должен
совпадать с St. В терминах алгебры можно сказать, что если
причем все z4, кроме
равны нулю, то, решая систему уравнений (8) относительно коорди-
координат (х0 хп) точки Р и не налагая пока на Р никаких ограни-
ограничений, мы найдем
где каждое xt остается произвольным. Эти точки Р заполняют под-
подпространство St, соответствующее точке г. При таком выражении
координат точки Р становится очевидным тот факт, что коллинеация A)
преобразует точку Р в точку с координатами такого же вида. Таким
образом, мы получили снова, что подпространство St при коллинеа-
ции A) переходит само в себя.
. Предвосхищая теорему VI, мы можем сказать, что коллинеация A)
индуцирует некоторую коллинеацию в подпространстве S/. Эта инду-
индуцированная коллинеация такова, что St содержит подпространство 5t-1
неподвижных точек, соответствующих собственному значению а1§
Следовательно, число элементарных делителей (\ — a^ft должно рав-
равняться /. Так как 2/< = *+1> ™ коллинеация A) в подпростран-
1
1
стве St не имеет неподвижных точек, лежащих вне St_v Отсюда
следует, что система элементарных делителей этой индуцированной
коллинеации состоит из t— 1 элементарных делителей (X — а^ и одного
квадратичного элементарного делителя (А — o^J.
Рассмотрим теперь преобразование G), где х — произвольная точка
пространства [п\, не содержащаяся в фундаментальном подпростран-
подпространстве. Ее образ при коллинеации A), т. е. точка у~=Сх, не совпадает
с х. Рассмотрим р точек
у — а{х (/=1 р),
где р — число различных собственных значений матрицы С. Они
являются теми точками, в которых прямая ху пересекает вершины
фундаментальных звезд, соответствующих собственным значениям
at ар. Этот линейный ряд точек вместе с точками х и у проективно
связав с любым другим линейным рядом из p-f-2 точек, построенных
таким же образом, с помощью коллинеации A) (гл. VI, § 10). Заме-
Заметим, что если прямая ху лежит в вершине некоторой фундаментальной
362 ГЛ. VIII. КОЛЛИНЕАЦИИ
звезды, то и точки х ну = Сх должны лежать в этой вершине. Обратно,
если точка х лежит в вершине фундаментальной звезды, соответ-
соответствующей, например, собственному значению ах, то должны выпол-
выполняться равенства
а значит, и равенства
Следовательно, точка у тоже лежит в этой вершине. Все вершины
на самом деле являются неподвижными подпространствами коллинеа-
ции A). Это легко следует из того, что любая гиперплоскость, про-
проходящая через некоторую вершину, является неподвижной гиперпло-
гиперплоскостью и что пересечение любого числа неподвижных гиперплоскостей
является неподвижным подпространством. Возвращаясь к упомянутым
выще линейным рядам, мы получаем следующий результат:
Теорема V. Если произвольная точка х пространства [п]
при коллинеации у = Сх преобразуется в точку у ф х, то пря-
прямая ху пересекает вершины всех фундаментальных звезд этой
коллинеации. Пусть точка х не лежит в некоторой вершине,
и пусть Аи ..., А9 — однозначно определенные точка пересечения
прямой ху с этими вершинами. Тогда, если у* есть образ при
коллинеации у = Сх произвольной точки х*, не лежащей в не-
некоторой вершине,, причем у* Ф х*. и если прямая х*у* пересекает
фундаментальные вершины соответственно в точках Аи ..., Лр,
то линейные ряды х, у, At Af и х*, у*, А\ A*t проек-
тивно связаны.
В заключение этого параграфа отметим два простых результата,
часто используемых в дальнейшем.
Теорема VI. Если подпространство Sk при некоторой колла-
неации преобразуется в себя, то можно считать, что мы имеем
коллинеацаю в самом Sk.
Свойство подпространства S^ преобразовываться в себя при колли-
коллинеации A) инвариантно относительно любого допустимого преобразо-
преобразования координат. Действительно, пусть одно из линейных уравнений,
определяющих Sk, в матричной записи имеет вид
и'х = 0. (9)
Тогда, так как точка у = Сх также лежит в Sk, то
а'Сх = 0. A0)
Допустимое преобразование координат х = Рх* превращает уравне-
уравнение (9) в
v'x* = Q, . (9')
§ 3. НЕПОДВИЖНЫЕ ТОЧКИ И ГИПЕРПЛОСКОСТИ 363
где v = P'u, а уравнение A0) — в
v'P-WPx* = 0. A00
Последнее в точности выражает условие, что гиперплоскость, опре-
определяемая уравнением (90, должна проходить не только через х*, но
и через
у* =.Р-1СРх*.
Но это — коллинеация A), выраженная в новой системе координат.
Таким образом, наше утверждение доказано.
Мы можем, следовательно, выбрать систему координат так, чтобы
подпространство Sk определялось системой уравнений
Тогда, если рассматриваемая коллинеация в этой системе координат
имеет вид
п
.У* = 2 «у*,- 0 = 0, ...,«),
мы получаем для каждой точки (х0, ..., хк, 0, .... 0) подпростран-
подпространства Sk, т. е. при любом выборе х0, .... хк, систему уравнений
2 <*<**/ = 0 (*«=* + 1 я).
Отсюда следует, что
Таким образом, наше преобразование в подпространстве Sk опре-
определяется системой уравнений
к
yi=^atJXj (i = 0, .... ft),
j=o
задающей некоторую коллинеацию в самом Sk. Неподвижными точ-
точками этой индуцированной коллинеации являются только содержа-
содержащиеся в Sk неподвижные точки исходной коллинеации.
Теорема VII. Длн каждой коллинеации существуют по край-
крайней мере одна неподвижная точка и одна неподвижная гипер-
гиперплоскость.
Достаточно доказать, что существует неподвижная точка. Суще-
Существование неподвижной гиперплоскости будет следовать отсюда в силу
принципа двойственности. Но так как каждая коллинеация имеет по
крайней мере одно собственное значение, а для каждого собственного
значения имеется по крайней мере одна неподвижная точка, то теорема
очевидна. Отметим/что существуют коллинеации, имеющие в точности
364
ГЛ. VIII. КОЛЛИНЕАЦИИ
одну неподвижную точку. В качестве примера укажем коллинеацию
элементарным делителем которой служит (А — а)п+\ а единственной
неподвижной точкой является A, 0, ..., 0).
§ 4. Неподвижные Л-мерные подпространства невырожденной
; коллинеации
Коллинеация
у = Ах A)
индуцирует преобразование грассмановых координат Л-мерных под-
подпространств пространства [я], определяемое, в силу результатов § 2
гл. VII [см. D)], равенствами
ho...ik— , **
'о Зк
Pk-ir
B)
Поэтому неподвижные Л-мерные подпространства коллинеации A)
можно определить как ^-мерные подпространства, удовлетворяющие
системе уравнений
4 h
и квадратичным р-соотношениям [гл. VII, § 6, D)]:
к
¦«л
Pta — tkPh — ik —
Однако этот метод не очень удобен. Одна из трудностей состоит
в том, что качественное описание неподвижных точек коллинеа-
коллинеации A) пространства [п] не является само по себе достаточным для
того, чтобы дать возможность качественно определить неподвиж-
неподвижные точки преобразования B), рассматриваемого как коллинеацня
в (C»+i—1)-мерном пространстве. Если, например, я = 3 и
0 0 0\
о р о о
.0 0 ? 0
0 0 8;
причем 9, р, 1, & попарно различны, то полное качественное описа-
описание неподвижных точек коллинеации A) заключается в утверждении,
§ 4. НЕПОДВИЖНЫЕ ПОДПРОСТРАНСТВА
365
матрицы А, т. е.
что существуют четыре неподвижные то"Гки, являющиеся вершинами
некоторого симплекса. Но при k = 1 уравнения B) приводятся к виду
Я = Вр,
где В есть вторая ассоциированная матрица А**
ар О О О О
О аТ О О О
О 0 а8 О О
О 0 0 'ft О
О 0 0 0 р8
0 0 0 0 0
01
о
о
о
о
(гл. VII, § 2). Эта коллинеация пространства [5], если все эле-
элементы главной диагонали Матрицы В различны, имеет шесть непод-
неподвижных точек, расположенных в вершинах некоторого симплекса.
Но если, скажем, ар = fS, то эта коллинеация имеет бесконечное
множество неподвижных точек. Не все из них удовлетворяют квад-
квадратичным р-соотношениям и, следовательно, не все представляют не-
неподвижные прямые в пространстве [3].
Поэтому для определения неподвижных й-мерных подпространств
коллинеации мы применим другой метод. Начнем с того факта (§ 3,
теоремы VI и VII), что если некоторое подпространство Sk при кол-
коллинеации переходит в себя, то в нем индуцируется некоторая кол-
коллинеация, имеющая по крайней мере одну неподвижную точку, кото-
которая является неподвижной точкой и исходной коллинеации. Таким
образом, нам придется рассмотреть только Л-мерные подпространства,
пересекающие фундаментальное подпространство заданной коллинеации.
Пусть Р — произвольная точка фундаментального подпространства,
соответствующего собственному значению а1. Рассмотрим проходящее
через эту точку й-мерное подпространство, неподвижное при рас-
рассматриваемой коллинеации. Наше исследование будет сильно упро-
упрощено следующей теоремой:
Теорема I. Если Р—произвольная неподвижная точка кол-
коллинеации A), то можно найти такую допустимую систему
координат, в которой эта коллинеация определяется уравне-
уравнениями канонического вида
у = Сх, C)
где
Причем точки Р служит одной из вершин репера.
366 ГЛ. VIII. КОЛЛИНЕАЦИИ
Как в § 3, предположим, что
ai = аз = • • • = а* =f= а< (*' > О
и что et -^ ej, если i < j <] t. В силу результатов § 2, можно найти
такую допустимую систему координат, в которой эта коллинеация
определяется уравнением канонического вида C). Фундаментальное
подпространство неподвижных точек, соответствующих собственному
значению alt определяется вершинами
репера. Пусть точка Р содержится в этом фундаментальном подпро*
странстве, так что
Предположим, что
Х< = 0 (/</»— 1),
но
Найдем такое преобразование координат, которое, не меняя преобра-
преобразования C), переводит точку Р в вершину A^+...+е . нового
репера.
Систему уравнений коллинеации C) можно записать подробно,
как в § 3 [см. B)]. Мы здесь рассмотрим только часть этой си-
системы:
D. т)
¦+eTO-i amXe,+ ... +ет-1
= Л X
¦ +ет т+1 в,+ ...+вж
" D.Ж+1)
(
Выполним преобразование координат, действующее только на коор-
координаты, содержащиеся в этих уравнениях. Положим
х*
§ 4. НЕПОДВИЖНЫЕ ПОДПРОСТРАНСТВА 367
X*ei+...+e{_1+j — ^m-lXel+...+e{_1+i С/ — ет «< О
для каждого значения i от i = /и -\-1 до г = f. Тому же преобразо-
преобразованию подвергнем и координаты у.
: Система уравнений коллинеации в новой допустимой системе
координат получится, если умножить уравнения D. i) на km_t и
вычесть из каждого из первых ет уравнений соответствующее
уравнение системы D. т), умноженное на k{_v Остальные уравнения
коллинеации не меняются. Отсюда сразу следует, что новые урав-
уравнения коллинеации — это в точности исходные уравнения, в кото-
которых х к у заменены на х* и у*, т. е.
у* = Сх*.
Непосредственно проверяется, что в новой системе координат точка Р
служит вершиной Aei+..,+e _ нового репера. Таким образом, наша
теорема доказана.
Предположим теперь, что неподвижная точка Р коллинеации C)
служит вершиной Ав,+ ...+е _ репера. Рассмотрим прямую, прохо-
проходящую через точку Р и через произвольную точку х простран-
пространства [я]. Коллинеация C) преобразует эту прямую в прямую, про-
проходящую через Р и через образ у = Сх точки х при коллинеации C),
.так как точка Р является неподвижной. Эти две прямые пересекают
грань
репера в точках
•*-«!+•••+efn_1-l» 0, Хв1+... +efJJ_1+l> •••» хп)
Если (лг0, .... хп-1) и (у0 Уп-i) — координаты этих точек
в такой системе координат, репер которой содержит вершины
Ао, ..., Ае^+ ... +e>n_1-i, Ав1+ ...+em_j+i'i •••» An,
лежащие на грани хв1+...+е _., то точки х и у будут связаны
соотношением
У = Сх, E)
где С есть «X «-матрица, которая следующим образом получается
из матрицы С: _
(I) если ет = 1, то С получается из С опусканием единственных
строки и столбца, входящих в подматрицу Се (ат),
368 ГЛ. VIII. КОЛЛЙНВАЦИИ
(II) если еот> 1, то матрица С получается из С заменой под-
подматрицы С„ (а,„) на Cem-i(.oim), т. е. опусканием (et-\-...
... -\-ет_1-\- 1)-х строки и столбца матрицы С.
Очевидно, что неподвижная прямая, проходящая через точку Р,
соединяет эту точку с неподвижной точкой коллинеации E), лежа-
лежащей в гиперплоскости
0
и обратнб. Вообще, каждое неподвижное ^-мерное подпространство,
содержащее Р, является суммой этой точки и некоторого непод-
неподвижного (k — 1)-мерного подпространства коллинеации E), содержа-
содержащегося в грани репера, противоположной точке Р, и обратно. Для
построения теории неподвижных ^-мерных подпространств невырож-
невырожденной коллинеации можно применить индукцию по k.
Формальное, в полной общности, изложение теории неподвиж-
неподвижных й-мерных подпространств несколько сложно, хотя оно и не
содержит каких-либо серьезных трудностей алгебраического или
геометрического характера. В конкретных случаях требуемые резуль-
результаты обычно получаются достаточно просто. Мы ограничимся здесь
описанием свойств неподвижных прямых пространств [п]. Это тре-
требует изучения неподвижных точек коллинеации E).
Мы видели, что. в коллинеации C) каждая подматрица Се (а<)
соответствует некоторой вершине A3l+...+e репера, являющейся
неподвижной точкой, а фундаментальное подпространство неподвиж-
неподвижных точек, соответствующих собственному значению а^, является
суммой вершин, соответствующих подматрицам Св< (<*<)> Для которых
а,= а^. Все эти вершины, соответствующие подматрицам, за исклю-
исключением точки Р = Лв1+...+е содержатся в грани #е,+ ...+е _^
Непосредственно видно, что если Ah есть вершина, ассоциируемая
с подматрицей Се (а.]) матрицы С, и j ф т, то Ah является также
вершиной, ассоциируемой с подматрицей Се (aj) матрицы С. При
рассмотрении вершины, соответствующей подматрице Свт(ат) (вспом-
(вспомним, что at = ... = <хт = ... = at), могут представиться два случая.
(I) Если ет=\, то матрица С получается из матрицы С просто
отбрасыванием матрицы Се (ат)- В этом случае вершина, соот-
соответствующая коллинеации E), пропадает.
(II) Если ет > 1, то матрица С получается из С заменой под-
подматрицы Сет (ат) на Се _ (ат). Вершиной, соответствующей последней
матрице, будет точка Ав1+...+ет_1+1.
В первом случае неподвижными точками преобразования E) яв-
являются в точности неподвижные точки преобразования C), лежащие
на грани хв1+...+е _, = 0- Точка, соответствующая произвольному
собственному значению а матрицы С, соответствует также собствен^
4. НЕПОДВИЖНЫЕ ПОДПРОСТРАНСТВА
ному значению а матрицы С. Во втором случае неподвижными точ-
точками, ассоциируемыми с собственными значениями матрицы С, отлич-
отличными от etj, будут те самые точки, которые отвечают соответствую-
соответствующим собственным значениям матрицы С. Неподвижные же точки
коллинеации E), соответствующие собственному значению av обра-
образуют (t— 1)-мерное подпространство, определяемое вершинами
Ао, Ав1, ..., Aei+ ...+em_2, Ael+...+em_1+U
Ае,+ ...+вт, •••> Аэ,+ ... +ef_l.
Отсюда, вспоминая наши рассуждения при изучении неподвижных
точек коллинеации E), получаем следующий результат.
Теорема II. Если вершина Ав1+... +е репера соответствует
подматрице Сет(ат) матрицы С, то каждая из неподвижных
прямых коллинеации C), проходящих через Лв1+...+в _1, либо
соединяет эту точку с некоторой другой неподвижной точкой
коллинеации C), либо {если ет > 1) содержится в t-мерном под-
подпространстве, соединяющем проходящее через Авх+..,+е фун-
фундаментальное подпространство St_t неподвижных точек преобра-
преобразования C) с вершиной Ав1+ ... +е _ _ц.
Применяя эту теорему в случае ет> 1, получаем, что ^-мерное
подпространство, которое соединяет фундаментальное подпростран-
подпространство St_v соответствующее собственному значению <xv с вершиной
A*,+ ...+e _+i. должно быть неподвижным. Это непосредственно
следует из уравнений коллинеации. Так как в этом новом резуль-
результате вершина Ае + ... +е +1 не играет особой роли, мы получили,
очевидно, более общую теорему: пусть
тогда подпространство St, соединяющее подпространство St_t с про-
произвольной точкой подпространства, определяемого вершинами
является неподвижным. Последний результат можно сопоставить
с результатом, полученным в § 3 и дающим координаты точки Р
в неподвижном подпространстве St, проходящем через St_1:
Р — (хй' х\> •¦•< x«-i> хв> zs> 0, ..-, О, xsi.e^^,
Эти два результата совпадают.
Непосредственным следствием изложенного является
Теорема III. Если коллинеация неспециальная, то каждое
ее неподвижное k-мерное подпространство определяется k-\-\
неподвижными точками.
24 Зак. 1230. В. Ходж и Д. Пидо
370 гл- VIII. КОЛЛИНЕАЦЙЙ
Наконец, заметим, что если коллинеация имеет нелинейные
элементарные делители, то существует неподвижная прямая,
содержащая только одну неподвижную точку. Если, в использован-
использованных выше обозначениях, s < t, то прямая
является неподвижной и содержит только одну неподвижную точку
Лв1+...+е • Этот результат будет полезен для дальнейшего.
В нашем исследовании геометрии неподвижных точек и подпро-
подпространств невырожденной коллинеации использовались индексы е1,..., ек
и равенства собственных значений; величины же собственных значе-
значений не входили в наши результаты. Геометрические свойства колли-
коллинеации будут, таким образом, в достаточной мере определены, если
мы зададим числа еи ..., ек (сумма которых равна п\-1) и укажем,
какие из них относятся к равным собственным значениям. Мы. сде-
сделаем это, введя для коллинеации символ Сегре. Этот символ содер-
содержит индексы ех eh, записанные внутри квадратных скобок
в каком угодно порядке, подчиненном только тому условию, что ин-
индексы, соответствующие равным собственным значениям, поставлены
рядом и заключены в круглые скобки. Таким образом, в простран-
пространстве [3] имеются следующие типы невырожденных коллинеации:
[1, 1, 1, 1], [A, 1), 1, 1], [A, 1), A, 1)], [A, 1, 1), 1], [A, 1, 1, 1)],
[1, 1, 2], [A, 2), 1], [A, 1),2], [A, 1, 2)],
[2, 2], [B, 2)],
[1, 3J, [A, 3)],
[41.
Записывая (х, у, z, t) вместо (х0, xlt x2, хй) и обозначая вершины
репера через X, Y, Z, Т, мы получим канонические формы этих
коллинеации соответственно в следующих видах:
(I) х' = ах, / = ?у, z'=y, t' = U.
Неподвижными точками являются вершины X, Y, Z, Т; неподвиж-
неподвижными прямыми — их суммы; неподвижными плоскостями — грани
соответствующего симплекса.
(II) х' = ах, у' = ау, z' = iz, f = Ы.
Неподвижными точками являются точки прямой XY и точки Z и Т.
Неподвижными прямыми — суммы любых двух неподвижных точек.
Неподвижными плоскостями — плоскости, содержащие по трилинейно
независимые неподвижные точки. В частности, существует пучок
неподвижных плоскостей, проходящих через прямую Z Т.
(III) Х' = ах, ,у'=*ау, г1 = T*, f = T*. '
Неподвижные точки лежат на прямых XY и ZT, неподвижные прямые
и плоскости получаются так же, как и в (II). В частности, имеются
_ § 4. НЕПОДВИЖНЫЕ ПОДПРОСТРАНСТВА 371
пучки неподвижных плоскостей, проходящих через прямые XY и ZT.
(IV) х' = ах, у' = ay, z' = az, f = Ы.
Неподвижные точки заполняют плоскость XYZ. Точка Т также
является неподвижной. Неподвижные прямые и плоскости получаются
как в (II). В частности, всякая плоскость, проходящая через точку
Т, будет неподвижной.
(V) дг' = алг, / = ау, zr = az, if = at.
Это — тождественное преобразование.
(VI) х' = ах, / = fo>, *' = t* + *, f = 4t.
Неподвижными точками являются точки X, Y, Z, неподвижными пря-
прямыми— YZ, ZX, XY и, кроме того, ZT. Неподвижными плоско-
плоскостями— YZ T, XZT, XYZ.
(VII) х'=ах, У=лу~\-г, z'^az, f— Ы.
Фундаментальными подпространствами являются прямая XY и точка Т.
Неподвижные прямые соединяют либо две неподвижные точки, либо
точку прямой ZX с точкой Y. Все плоскости звезды с вершиной YT
являются неподвижными, плоскость XYZ также неподвижна.
(VIII) х' = ах, у' = «у, г' = чг-\-1, f = ft.
Неподвижными точками являются точка Z и точки прямой XY. Не-
Неподвижные прямые либо проходят через две неподвижные точки,
либо совпадают с прямой ZT. Неподвижными плоскостями являются
плоскости, проходящие через прямую ZT, а также плоскость XYZ.
(IX) х' = ах, у' = ау, z' = a.z~\-t, f = at.
Неподвижные точки заполняют плоскость XYZ. Неподвижные прямые
либо лежат в этой плоскости, либо проходят через точку Z. Каж-
Каждая плоскость, проходящая через точку Z, является неподвижной.
(X) х' = ах+у, у'^ау, z'^z\t, f = $t.
Неподвижными точками являются точки X и Z, неподвижными пря-
прямыми— прямые XY, XZ, ZT, неподвижными плоскостями — плоско-
плоскости XZT к XYZ.
(XI) х' = а.х-\-у, / = ау, z' = az-\-t, f = at.
Неподвижные точки образуют фундаментальное подпространство XZ.
Неподвижные прямые соединяют точки (а, 0, с, 0) и @, а, 0, с).
Все неподвижные плоскости проходят через прямую XZ.
(XII)
Неподвижными точками являются точки X, Y, неподвижными пря-
прямыми— прямые XY и YZ, неподвижными плоскостями — плоскости
24*
гл. Vni. коллйнеацйИ
YZT и XYZ.
(XIII) *' = «*, / = ау-|-,г, z' = az-\-t, t' = at.
Неподвижные точки образуют фундаментальное подпространство XY,
неподвижные прямые лежат в плоскости XYZ и проходят через
точку Y. Неподвижные плоскости образуют звезду с вершиной YZ.
(XIV) x' = ax-j-y, y' = «y + z, z' = o.z-\-t, t' = a.t.
Точка X является единственной неподвижной точкой, прямая XY —
единственной неподвижной прямой, плоскость XYZ — единственной
неподвижной плоскостью.
§ 5. Циклические коллинеации
Очевидно, что невырожденные коллинеации пространства [я| об-
образуют группу. Поставим вопрос, какие элементы этой группы (если
такие вообще существуют) имеют конечный порядок. Другими сло-
словами, нас будут интересовать такие невырожденные коллинеации
у = Ах, A)
для которых при некотором целом значении т коллинеация у = Атх
является тождественным преобразованием. Это эквивалентно условию
Ат = kE (k ф 0).
Если это условие выполнено, то A) называется циклической кол-
ланеацией порядка т. Последовательные образы Рх, Р2, ... произ-
произвольной точки Р пространства [п\ образуют в этом случае конечное
множество, содержащее самое большее т точек, так как Рт = Р.
Если т = 2, то коллинеацию A) часто называют инволютивным
преобразованием точек пространства [я], а при п = 1 про пару точек
Р и Рг прямой говорят, что они находятся в инволюции друг
к другу.
Мы покажем, что если коллинеация A) циклична, то все элемен-
элементарные делители матрицы А линейны. В конце § 4 мы видели, что
если матрица А имеет нелинейный элементарный делитель, то суще-
существует двойная прямая, содержащая только одну двойную точку.
Коллинеация, индуцированная на этой двойной прямой, также должна
быть циклической, и ее порядок должен быть делителем т. Выбрав
систему координат, в которой эта прямая определяется уравнениями
х% = и, . .., хп = и,
мы сможем предположить, что эта индуцированная коллинеация
имеет каноническую форму. Так как на рассматриваемой прямой
§ 5. ЦИКЛИЧЕСКИЕ КОЛЛИНЕАЦИИ 373
имеется только одна двойная точка, то эта каноническая форма должна
иметь вид
соответственно нелинейкому элементарному делителю. Применяя эту
коллинеацию т раз к точке (х0, х^, мы получаем коллинеацию
у, =
которая будет тождественным преобразованием в том и только в том
случае, если
Так как основное поле К не имеет характеристики и а Ф О, то по-
последнее равенство невозможно. Следовательно, если коллинеация A)
циклична, то все ее элементарные делители линейны.
Запишем теперь коллинеацию A) в канонической форме, которая,
в силу линейности элементарных делителей, будет иметь вид
/а, О 0 ... О
О о\, 0 . . . О
\х.
\0 О 0 ... аВ41/'
Как легко видеть, условие, что коллинеация A) циклична и имеет
порядок т, сводится к равенству
для некоторого k, отличного от нуля. Этот результат можно сфор-
сформулировать в виде следующей теоремы:
Теорема I. Коллинеация
тогда и только тогда является циклической порядка т, когда
элементарные делители матрицы А — Я?п+1 линейный собствен-
собственные значения матрицы А удовлетворяют уравнению
где k — некоторый отличный от нуля элемент оснозного поля.
Это условие можно также выразить через инвариантные множи-
множители;
374 ГЛ. VIII. КОЛЛИНЕАЦИИ
Теорема II. Коллинеация
тогда и только тогда является циклической порядка т, когда
инвариантные множители матрицы А — ХЕя+1 не имеют крат-
кратных делителей и каждый инвариантный множитель 'является
делителем многочлена X™ — h, где k — некоторый отличный от
нуля элемент основного поля.
Эта последняя теорема справедлива также и в том случае, когда
основное поле К не является алгебраически замкнутым. В самом деле,
пусть А— невырожденная матрица над произвольным полем К без
характеристики. Предположим, что коллинеация A) циклична и имеет
порядок т. Тогда
A* = kl>n+1 (ft 6 Ю-
Пусть теперь К' — некоторое алгебраическое расширение поля К,
над которым характеристический многочлен матрицы А вполне при-
приводим. Тогда каждый инвариантный множитель матрицы А — ХЕи+1
также будет вполне приводимым. Рассуждение, проведенное при до-
доказательстве теоремы III § 2, показывает, что над полем К' эту
коллинеацию можно привести к канонической форме, полученной
в случае алгебраически замкнутых полей. Проведенное выше рас-
рассуждение показывает тогда, что условия, сформулированные в тео-
теореме II, необходимы и достаточны для того, чтобы выполнялось ра-
равенство
Am — Ьр
где k есть элемент поля К.
§ 6. Некоторые частные виды коллинеаций
В этом параграфе мы рассмотрим некоторые частные виды кол-
коллинеаций, представляющие геометрический интерес, причем огра-
ограничимся случаем алгебраически замкнутого основного поля К. Неко-
Некоторые из результатов, которые мы получим, являются частными
случаями теорем, доказанных в § 3, например теоремы V.
Рассмотрим сначала неспециальную коллинеацию, имеющую только
два фундаментальных подпространства неподвижных точек Sa и Sb.
Поскольку эта коллинеация неспециальна, мы имеем (§ 3, тео-
теорема II)
а-\-Ь-\-\=п.
Символ Сегре этой коллинеаций
1A, 1 1), О. 1...., 1I
§ 6. ЧАСТНЫЕ ВИДЫ КОЛЛИНЕАЦИЙ 375
содержит а-j-l единиц в одной скобке и Ь-\-\ единиц в другой.
В канонической форме рассматриваемая коллинеация имеет вид
Уо
Ух
Уа
Уа+1
= ах0,
—— 1АЛу j
"" Г A •
Уп ~ ?Хп,
где а Ф р. Прямая, соединяющая произвольную точку х, не лежащую
в Sa или Sb, с ее образом у, пересекает Sa в точке z=y— fix и
Sb в точке t=y — ах. Если х* — любая другая точка пространства
[п], не лежащая в неподвижном подпространстве, и точки у*, z*, t*
получены как указано выше, то линейные ряды (х, у, z, t) и (х*,
у*, z*, t*) проективно связаны.
Геометрически мы можем осуществить эту коллинеацию следую-
следующим образом. Предположим, что нам заданы непересекающиеся фун-
фундаментальные подпространства Sa и Sb и пара Р, Q соответственных
точек, не являющихся неподвижными. Пусть прямая PQ пересекает
подпространство Sa в точке R и подпространство Sb в точке S. Точ-
Точку В, соответствующую заданной точке А, находим следующим образом.
Если А содержится в одном из неподвижных подпространств, то
В — А. В противном случае сумма точки А и подпространства Sa
является некоторым (я-|-1)-мерным подпространством, скажем So+1.
Так как а-\-1=п — Ь, то подпространство ?a+i пересекает под-
подпространство Sb по крайней мере в одной точке. Если ?a+i пере-
пересекает Sb по подпространству Sc (с > 0), то подпространство Sa,
которое содержится в ?a+i. должно пересекать подпространство Sa,
также содержащееся в Safl. Но тогда должны пересекаться и под-
подпространства Sa и Sb, что противоречит предположению. Таким
образом, подпространства ?a+i и Sb имеют только одну общую
точку. Пусть это будет точка D. Тогда прямая AD, принадлежащая
подпространству So+1> пересекает Sa в некоторой точке С. Таким
образом, ACD есть прямая, проходящая через точку А и пересекаю-
пересекающая подпространства Sa и Sb одновременно. Она является единствен-
единственной прямой с этими свойствами. Действительно, если AC'D' — дру-
другая такая же прямая и если точка С лежит в Sa, а точка D' —
в Sb, то эта прямая содержит две точки А и С подпространства
Sa+1 и, следовательно, принадлежит ?о+1. Поэтому точка D' лежит
и в Sa+1 и в Sb. Значит, D' = D и ACD = AC'D'.
На прямой ACD имеется единственная точка В такая, что
(А, В, С, D)/\(P, Q, R, S),
Она ж будет искомой точкой Bs
376 ГЛ. VIII. КОЛЛИНЕАЦИИ
Так как рассматриваемая коллинеация неспециальна, то ее непо-
неподвижные й-мерные подпространства являются подпространствами,
определяемыми k -\- 1 неподвижными точками. Других неподвижных
подпространств не существует (§ 4, теорема III). Следовательно, эти
подпространства либо представляют собой суммы некоторых подпро-
подпространств Sar и Sb> соответственно пространств Sa и Sb, где
с' + V + 1 = к (а' > О, V > 0),
либо содержатся в Sa или в Sb. В частности, каждая гиперплоскость,
проходящая через Sb(Sa), соединяет Sb(Sa) с некоторым Sa-1(Sb_1),
содержащимся в Sa(Sb), и, следовательно, является неподвижной.
Как вытекает из рассмотрения дуального преобразования, подпростран-
подпространства Sa и Sb являются вершинами звезд неподвижных гиперпло-
гиперплоскостей.
Рассмотрим частный случай, когда a -f- Р = 0. Коллинеация будет
в этом случае циклической порядка 2. Если точка Р преобразуется
в Q, то Q преобразуется в Р, и, в использованных выше обозначе-
обозначениях, (Р, Q, R, S) есть гармонический линейный ряд. Это инзолю-
тивный случай.
Другой частный случай, представляющий интерес, — когда а = 0,
Ь = п—1. Наше построение точки, соответствующей заданной точке,
становится при этом очень простым. Коллинеация в этом случае на-
называется гомологией, а специальный случай гомологии, в котором
а -(-13 = 0, — инволютивной гомологией.
Рассмотрим теперь некоторые коллинеации, имеющие только одно
фундаментальное подпространство неподвижных точек. Ограничимся
коллинеациями, символ Сегре которых имеет вид [A, 1, .... 1, 2)].
Сначала рассмотрим случай п = 1. Уравнения коллинеации в этом
¦ случае принимают вид
С проективной точки зрения это та же самая коллинеация, что и
У1 = *v
Элементарным делителем последней коллинеации является (X — I)9;
отсюда следует, что любая коллинеация на прямой с символом
Сегре [2] в соответственно выбранной системе координат может быть
представлена в виде
Следовательно, все эти коллинеации проективно эквивалентны.
Обратно, если на прямой задана коллинеация с одной неподвиж-
неподвижной точкой, скажем X, и парой соответственных точек Р и Q, то.
§ 6. ЧАСТНЫЕ ВИДЫ КОЛЛИНЕАЦИЙ 377
этим определено преобразование описанного выше типа. Предполо-
Предположим, что точки X, Р, Q различны. Тогда существует такое пре-
преобразование координат, при котором в новой координатной системе
^¦=A, 0), Р = A, 1) и Q = B, 1). Пусть рассматриваемая кол-
линеация в этой системе координат определяется уравнениями
Тогда, так как A, 0) есть неподвижная точка, должно быть f = 0.
Так как х — единственная неподвижная точка, то коллинеация имеет
только один элементарный делитель степени 2. Следовательно, 8 = or.
Наконец, так как точка A, 1) преобразуется в B, 1), то a-f-,3 = 28
и, следовательно,
Таким образом, рассматриваемая коллинеация проективно эквива-
эквивалентна следующей:
Уо = *о + *1.
Л = xv
Такая коллинеация иногда называется переносом на прямой; в неод-
неоднородных координатах уравнение переноса имеет вид
Коллинеация типа [A, 1 1, 2)] в пространстве [п] опреде-
определяется системой уравнений
y0 *= ax0,
У\ =°х1,
Уп-Ч = а-^и--2>
A)
Уп =«*«•
Ее неподвижные точки образуют фундаментальное подпространство
Если неподвижное подпространство Sk определяется системой урав-
уравнений
Еа,Л-0 (/-0,..., n-k-\),
то система уравнений A) показывает, что
п
а
, . . ., n — k — l)
378 ГЛ. VIII. КОЛЛИНЕАЦИИ
для каждой точки (х0, .. ., хп) подпространства Sk. Если хп = О
для каждой точки из Sk, то Sk содержится в фундаментальном
подпространстве коллинеации A). Если хп отлично от нуля для каждой
точки подпространства Sk и если это подпространство непо-
неподвижно, то
Следовательно, подпространство Sk проходит через точку
Л = @, 0 0, 1, 0).
Обратно, из уравнений видно, что если подпространство Sk проходит
через эту точку, то оно является неподвижным (ср. § 4).
Из уравнений A) следует, что точка Р преобразуется этой кол-
линеацией в точку
т. е. что точки А, Р, Q коллинеарны. Если точка Р не является
неподвижной, так что точки А, Р и Q различны, то на прямой APQ
индуцируется некоторая коллинеация. Эта коллинеация имеет только
одну неподвижную точку, а именно А. Следовательно, эта коллинеа-
коллинеация является переносом, при котором точка А неподвижна и Р пре-
преобразуется в Q. Этими условиями перенос вполне определен.
Рассмотрим теперь произвольное подпространство 5„_2, содержа-
содержащееся в фундаментальном подпространстве, но не проходящее через
точку А. Произвольная гиперплоскость, проходящая через 5П_2, пре-
преобразуется в другую гиперплоскость, также проходящую через 5И_2.
В частности, сумма Р и 5И_2 преобразуется в сумму Q и 5„_2.
Пусть произвольная прямая, проходящая через А, пересекает первую
гиперплоскость в точке Р1, а вторую — в точке Q'. Коллинеация A)
преобразует точку Р' в точку прямой АР', лежащую на второй гипер-
гиперплоскости, т. е. в Q'. Таким образом, выбирая некоторое подпростран-
подпространство 5И_8 в неподвижном подпространстве и задавая пару соот-
соответственных точек Р, Q, мы можем найти пару соответственных
точек Pf, Q' на каждой прямой, проходящей через точку А, и этим
определить перенос на этой прямой. Преобразование A) относит
тогда произвольной точке R такую точку S, в которую R преобра-
преобразуется посредством переноса на прямой AR.
§ 7. Вырожденные коллинеации
В заключение этой главы кратко перечислим вырожденные колли-
коллинеации в пространстве [я]. Рассуждение, проведенное в § 2, показы-
нает, что если основное поле К алгебраически замкнуто, то можно
ныбрать такую систему координат, в которой коллинеация иадеет
« 7. ВЫРОЖДЕННЫЕ КОЛЛИНЕАЦИИ 379
каноническую форму
О С. (а.) ... О 1
A)
\ 0 0 ... Cek(aJ
где
и
так что подматрицы, соответствующие нулевым собственным значе-
значениям, расположены рядом в конце диагонали.
Проведенное в § 3 исследование неподвижных точек сохраняет
силу при одном только уточнении, а именно, что фундаментальное
подпространство «Sfc_ft_1( соответствующее собственному значению,
равному нулю, является теперь подпространством точек, не имею-
имеющих образов. Геометрическое же соотношение между ним и осталь-
остальными фундаментальными подпространствами остается таким же, как
прежде.
Далее, из равенства A) видно, что все точки пространства [п],
имеющие образы, преобразуются в точки подпространства Sn_ft+ft,
определяемого системой уравнений
¦^е, + ...+вл_ь1-13= 0, ^е,+...+е;и.2-1 = 0 Хп = 0. B)
В случае, когда
подпространства Slr_h_1 и Sn_k+h не имеют общих точек и их сумма
совпадает с [п]. Описание коллинеации в этом случае особенно просто.
Точно так же, как в § 3, мы видим, что между (k — /г)-мерными
подпространствами, проходящими через Sk_h_lt и точками подпро-
подпространства Sn_]{+h существует проективное соответствие. Коллинеа-
ция A) может быть тогда описана следующим образом.
Точка х подпространства Sk_b_1 не имеет образа. Если точка х
не лежит в Sk_h_lt то она проектируется из Sk_h_1 в точку
Z = (XO Xn-lc+h> 0 °)
подпространства Sn_k+h. В подпространстве Sn_k+h рассмотрим невы-
невырожденную коллинеацию
380
ГЛ. VIII. КОЛЛИНЕАЦИИ
где
= (z0 zn_krh). Точка
/, 0, .... 0)
подпространства Sn_k+h, получаемая из образа точки г*, будет, оче-
очевидно, образом точки х при коллинеации A).
Если не все индексы eh+1, ..., ек равны единице, то сведение
коллинеации A) к ряду невырожденных коллинеации и проектирова-
проектирований не так просто, потому что подпространства Sk_h_x и Sn_k+h
имеют общие точки. Мы можем, однако, поступить следующим
образом.
Пусть 2«_*+к—подпространство, определяемое системой урав-
уравнений
Оно не имеет точек пересечения с подпространством Sk_h_lt поро-
порождаемым вершинами
Спроектируем произвольную точку х, не лежащую в Sk_h_l,
из подпространства Sk_h_1 в некоторую точку хщ подпространства
ь. Тогда
1-l, 0,
где нули соответствуют первым строкам подматриц
C)
матрицы A). Так как мы хотим рассматривать коллинеацию в под-
подпространстве In_ft+ft, то мы опустим нулевые координаты точки лгA)
и напишем
Произведем теперь в подпространстве ?«_& + & невырожденную колли-
неацию
Ев1 0 . . . О 0 ... О
О Е3,
xi» =
О . ...Е% . .
О .... О Dehhrl.
1° DVW
х(\у
§ f. ВЫРОЖДЕННЫЕ КОЛЛИНЕАЦИЙ
38i
. ., Ев —единичные матрицы и De (циклическая)
О 1 О
О О 1
0 О О ... 1
1 О О ... О
Результатом действия матрицы De является перестановка первой
и последней координат в каждой группе координат точки х*A), соот-
соответствующей подматрице C), так что
Рассмотрим теперь (k — h—1)-мерное подпространство Sft_ft_,, опре-
определяемое системой уравнений
у „ __ „ Г\
' '"* ' h 1 ¦ ¦ • h-i-i
х = . = х — о
= 0.
ei+... + <v_, I n
Это подпространство, очевидно, не пересекает подпространства Sn_k+h,
определяемого системой уравнений B). Если мы спроектируем точку дг* ,
лежащую в Sn_fc+ft, из подпространства Sft_ft_1 на Sn_k+h (замечая,
что подпространство ?n_ft+ft не пересекается с Zk^h_{), мы получим
точку 5)
где порядок в каждой группе координат, соответствующей подмат-
подматрице C), стандартный. Так как точка Хф) содержится в подпро-
подпространстве Sn_k+h, то координата, соответствующая последней строке
') Если z есть точка подпространства Hlje_-h_i, коллинеарная с точкой х"
из T,n_k+h и точкой лтC) из Sn_k+}1, то, как легко заметить, z = x^ — х*2у
ГЛ. VIII- КбллИНЁАЦЙЙ
каждой из подматриц, отсутствует. Следовательно, опустив нулевые
координаты точки х^, мы получим
Невырожденная коллинеация подпространства Sn_k+h, определяемая
уравнением
У =
преобразует точку х*.1 в образ точки х при коллинеации A).
Заметим, что в каждом из различных проектирований и в каждой
из коллинеации, использованных выше, неподвижная точка колли-
коллинеации A) остается неподвижной точкой. Действительно, координаты
неподвижной точки имеют вид
и, следовательно, не меняются.
Понятие символа Сегре можно распространить и на вырожденные
коллинеации. При этом обычно над индексом е{, соответствующим
нулевому собственному значению, ставят черту. Необходимо заметить,
что в символе Сегре в этом случае должна быть только одна черта,
стоящая над одним-единственным индексом или над одной-единствен-
ной группой индексов, заключенных в круглые скобки. Таким обра-
образом, вырожденными коллинеациями пространства [3]-, если исключить
коллинеацию с нулевой матрицей, у~0, будут:
[1, 1, 1, 1], [A,1), l.jj, [A, 1), 1, 1),_ [A, 1.) A, 1)], [A, 1, 1), 1], [A, 1, 1),.1],
[1,1,2], [1,1, %_ [A,1)^ [A,1), 2],
[Х A, 2)Ь_[1, A, 2)], 10.1.2)],
[2,2], [B,2)],
[ЗЛЬ [3.1], [A,3)],
ГЛАВА IX
КОРРЕЛЯЦИИ
В этой главе мы снова будем предполагать, что основное тело К
коммутативно и не имеет характеристики. В каждом параграфе мы
будем указывать, предполагается ли оно также алгебраически замк-
замкнутым.
§ 1. Корреляции
Пусть Sm и Sn — два проективных пространства над полем К
размерностей соответственно тип, В каждом из них выберем неко-
некоторую допустимую систему координат. Тогда, если
есть (т-\- 1)Х(я -\- 1)-матрица с элементами из поля К, то система
уравнений
п
«< = |в«Л (г" = °. •¦•. я).
или, в матричной записи,
v = Ах, A)
относит каждой точке д: пространства Sn, не удовлетворяющей систе-
системе уравнений
Ах = О,
гиперплоскость v пространства Sm с уравнением
---j-vmym = 0.
Если ранг матрицы А равен г, то особые точки пространства Sn,
т. е. такие точки, которые не имеют образов при преобразовании A),
образуют подпространство размерности га— г. Гиперплоскости про-
пространства Sm, соответствующие неособым точкам пространства Sn,
образуют звезду размерности г — 1 и, следовательно, все проходят
через некоторое {т — г)-мерное подпространство пространства Sm.
Обозначим указанные подпространства размерности п — г из Sn и
размерности т — г из Sm соответственно через Sn_r и S.m_r.
Если Р и Q — произвольные невырожденные матрицы порядков
соответственно п-\- 1 и т-\-1 с элементами из поля К, то уравнения
д: = Рх\ y = Qf
гл. ix. корреляций
определяют допустимые преобразования координат в пространствах
Sn и Sm. Соответствующие преобразования координат гиперплоскостей
в этих пространствах будут определяться уравнениями
а* = Р'и, v* = Q'v,
а уравнение A) в новой системе координат примет вид
v* = Q'APx*.
Так как ранг матрицы А равен г, то можно найти такие мат-
матрицы Р и Q, что
/Е,.
Q'AP =
о оУ
Соотношение A) теперь принимает вид
г? = х* (i = 0 г-1),
«J = 0 (i>r).
Подпространство 5„_г определяется уравнениями
а подпространство Sm_r — уравнениями
Рассуждая так же, как в § 1 гл. VIII, мы можем показать, что
все точки произвольного подпространства размерности п—r-f-1,
проходящего через Sn_r, соответствуют одной и той. оке гиперпло-
гиперплоскости, проходящей через Sm_r. Этим устанавливается взаимноодно-
взаимнооднозначное соответствие между (га — г+1)-мергыми подпространствами,
проходящими через Sn_r, и гиперплоскостями, проходящими через Sm_r.
Рассмотрим два (г—1)-мерных подпространства: Sr_1 в Sn, не
пересекающееся с Sn_r, и S^-i в ^m> he пересекающееся с Sm_r.
Существует, очевидно, некоторое соответствие между точками под-
подпространства S,._! и гиперплоскостями [(г — 2)-мерными подпростран-
подпространствами] подпространства Sr_lt при котором точка Р из Sr^ отве-
отвечает пересечению подпространства Sr_i с той из проходящих через
Sm_r гиперплоскостей пространства Sm, которая соответствует точке Р
(и сумме точки Р и подпространства ?„_,.).
Свойства соответствия A) непосредственно вытекают из свойств
соответствия между точками подпространства Sr_t и гиперплоскостями
подпространства <S»-_j. Следовательно, достаточно рассмотреть только
тот случай преобразования A), в котором г=т-\-1=п-\-1.
В этом случае мы имеем невырожденное коррелятивное соответ-
соответствие между двумя различными пространствами Sn и Sm одинаковых
размерностей. Если допустимые системы координат в этих двух про-
§ ь корреляции 385
странствах выбраны согласованным образом, то это соответствие
определяется уравнениями
Vi = х4 (/ = 0, ..., т — «)»
Линейно независимые (зависимые) точки пространства Sn переходят
в линейно независимые (зависимые) гиперплоскости пространства 5,„.
Поэтому точки из Sn, лежащие в некотором линейном подпростран-
подпространстве Sk, преобразуются в гиперплоскости пространства Sm, прохо-
проходящие через некоторое подпространствоSm_k_y Если( .. .,pio... t&, ...)
— грассмановы координаты подпространства Sk, то очевидно, что
координаты (..., qio - **, .. .) подпространства Sm_k_1 определя-
определяются равенствами
?*¦¦•" ** = />«„...<fc.
Действительно, от пространства Sn к пространству Sm мы можем
перейти при помощи проективного преобразования
Уг = хг (» = 0, ..., т)
с последующим дуальным преобразованием в самом пространстве Sm.
Нетрудно получить свойства этого соответствия, но на этом нет необ-
необходимости останавливаться.
В этой главе мы будем заниматься в основном тем случаем,
когда пространства Sm и Sn совпадают. Мы обозначим это простран-
пространство Sm = Sn через \п\. Выбрав в \п\ некоторую допустимую систему
координат, рассмотрим систему уравнений
или, в матричной записи,
и — Ах.
Эти уравнения относят точке д: пространства [л], не лежащей в под-
подпространстве, определяемом уравнением
гиперплоскость и с уравнением
Такое соответствие называется корреляцией в пространстве [га].
Если
х = Ру
есть некоторое допустимое преобразование координат в [л], то
индуцированное преобразование координат гиперплоскостей имеет вид
u = Pv,
25 Зак. 1230. В. Ходж и Д. Пидо
гл- !*• корреляций
где Р = (Р')~1. Система уравнений B) в новой координатной системе
принимает вид
v = Р'и = Р'Лд: = Р'АРу.
Одна из основных задач настоящей главы состоит в определении
канонической формы для матриц А, В эквивалентных в смысле
существования соотношения
В = Р'АР,
где Р — некоторая невырожденная матрица. Решение этой задачи
позволит нам записать в канонической форме уравнение любой задан-
заданной корреляции, что даст возможность изучать ее свойства. Но
сначала мы рассмотрим некоторые касающиеся корреляций предвари-
предварительные понятия, которые, будучи интересными и сами по себе, ока-
окажутся полезными при изучении эквивалентных корреляций.
Корреляция B) устанавливает между, точками хну простран-
пространства [п.] некоторое соответствие, при котором каждой точке д: отве-
отвечают все точки у гиперплоскости и. Точка у в том и только в том
случае соответствует точке х, если у'и = 0, т. е. если
у'Ах = 0. C)
Мы будем говорить, что равенство C) определяет билинейное со-
соответствие между точками х и у, а форму у'Ах, линейную отно-
относительно каждого из неизвестных х и у, будем называть билиней-
билинейной формой. Из равенства C) всегда можно получить равенства B).
Так как C) можно также записать в виде
х'А'у = 0,
то мы видим, что если точка у отвечает точке х в билинейном
соответствии, получающемся из B), то точка х отвечает точке у
в дуальной корреляции
v = A'y. D)
Следовательно, точки х, сопоставленные посредством соотношения B)
гиперплоскостям, содержащим данную точку у, лежат в гиперпло-
гиперплоскости v, определяемой равенством D).
Корреляция B) и дуальная корреляция D) позволяют установить
соответствие между точками, определяющими [посредством равенств
B) и D)] одну и ту же гиперплоскость
А'у = Ах. (б)
Это соответствие геометрически можно интерпретировать следующим
образом. Если z есть произвольная точка, отвечающая точке х
в билинейном соответствии C), то г'Ах = 0. Используя равенство E),
получаем
z'A'y = 0, или y'Az = 0,
I i. коалиций 387
откуда следует, что в билинейном соответствии C) точка у отвечает
точке z. В случае невырожденной корреляции, т. е. когда А — не-
невырожденная матрица, равенство E) определяет коллинеацию
у*=ААх, F)
которую мы назовем коллинеацией, ассоциированной с заданной
корреляцией.
Выполним преобразование координат
Тогда при
В = Р'АР
равенства B), C), D) и E) перейдут соответственно в
и*=Вх*.
у*'Вх* = О,
v* = В'у*
и
В'у* = Вх*.
Следовательно, билинейное соответствие, дуальная корреляция и,
если она определена, ассоциированная коллинеация инвариантно
связаны с заданной корреляцией.
Изучение корреляции B) сильно упростится, если мы одновре-
одновременно будем рассматривать связанные с ней соответствия, определяе-
определяемые равенствами C), D) и E). Мы начнем с рассмотрения специаль-
специального случая, в котором корреляция B) совпадает с дуальной кор-
корреляцией D), т. е. в котором
А'х = р Ах
для всех точек х из [п] (р — некоторый отличный от нуля элемент
поля К). В этом случае
Транспонируя обе части этого равенства, получаем
А = рА\
Следовательно,
Л = рМ
и
Если р = 1, так что А' = А, то А — симметрическая матрица. Кор-
Корреляция B) называется в этом случае полярной. Если р == — 1, так
что А' = —А, то А — кососимметртеская матрица; корреляция B)
называется в этом случае нуль-полярной. Прежде чем изучать
25*
388 гл. IX. корреляций
свойства корреляций общего вида, оказывается более удобным рассмо-
рассмотреть свойства полярных и нуль-полярных корреляций.
В заключение этого вводного параграфа заметим, что при жела-
желании мы можем рассматривать и такое соответствие между двумя
(возможно, совпадающими) пространствами Sn и Sm, при котором
гиперплоскостям из Sn ставятся в соответствие точки из Sm:
или
v = Bu. G)
Очевидно, что свойства такого преобразования гиперплоскостей
в точки могут быть выведены из свойств определенного выше пре-
преобразования точек в гиперплоскости, и поэтому нам нет необходи-
необходимости рассматривать первое отдельно. Заметим, однако, что когда
т — п и обе матрицы А и В невырождены, то преобразование A)
точек в гиперплоскости определяет преобразование
х — A~lv
гиперплоскостей пространства Sm в точки пространства Sn, а пре-
преобразование G) гиперплоскостей в точки определяет преобразование
точек пространства Sm в гиперплоскости пространства Sn.
§ 2. Полярные корреляции
Пусть
и = Ах A)
—уравнение полярной корреляции в некоторой допустимой системе
координат пространства [я]. Билинейное соответствие, связанное с (I),
имеет вид
у'Ах = х'Ау = 0.
Если точки $ и т) удовлетворяют этим уравнениям, т. е.
то эти точки называются сопряженными относительно полярной кор-
корреляции A); точка, сопряженная самой себе, называется самосопря'
женной относительно этой полярной корреляции. Если 5 и t\ — со-'
пряженные точки, то гиперплоскость А\, соответствующая точке 5,
содержит точку т\, а гиперплоскость Ат\, соответствующая точке ц,
содержит точку 5.
Изучение полярной корреляции^ 1) мы начнем с разыскания в про-;
странстве [п] такой допустимой системы координат, в которой урав-[
§ 2. ПОЛЯРНЫЕ КОРРЕЛЯЦИИ 389
нения этой полярной корреляции имеют некоторую стандартную
форму. Для этого существует несколько методов. Мы воспользуемся
одним из них; ниже в этой главе этот метод нам снова понадобится.
Рассмотрим билинейную форму
относительно двух систем неизвестных (дг0, ..., хп) и (у0, ..., уп)
и условимся использовать только преобразования координат следую-
следующего очень специального вида. Будем говорить, что допустимое пре-
преобразование координат пространства [п], определяемое равенством
является треугольным, если все элементы матрицы Р, расположен-
расположенные выше главной диагонали, равны нулю. Легко проверить с помощью
приведенных в гл. II правил образования произведения матриц и
обратной матрицы, что произведение двух треугольных преобразова-
преобразований является треугольным преобразованием и что преобразование,
обратное к (невырожденному) треугольному, также является тре-
треугольным.
Докажем теперь следующую теорему:
Теорема I. Существует треугольное преобразование
приводящее билинейную форму у'Ах к виду
х*. +/ я*
f-2 *2r-l *2r-l *2r-
где (/0 in) — некоторая перестановка чисел @, .... п), г— це-
целое число, удовлетворяющее неравенству O^r<!(ra-f-1)/2, и
c,ir сп — элементы поля К.
При п = 0 нечего доказывать, и мы можем поэтому воспользо-
воспользоваться индукцией по га, предположив, что теорема верна для били-
билинейных форм от неизвестных (х0 хт) и (у0, ..., ут) при т<.п.
Случай (I). Если ain — ani = 0 для всех значений /, то
/Ах= 2 2<
i=0 j=0
В силу индуктивного предположения, существует треугольное пре-
преобразование
п-1 п-1
Хг = 2 4i&, Уг — S Чфо A = 0, ¦¦¦, П — 1),
390
ГЛ. IX. КОРРЕЛЯЦИИ
приводящее билинейную форму
П—1 П-1
2 2
к требуемому виду. Отсюда следует, что треугольное преобразование
у = Ру*,
где
Р =
о
Ы
0
0
г-1,0 *
О О
Яп-U п-1 О
0
0
1
приводит форму У Ах к требуемому виду с in — n и сп = 0.
Случай (II): апп Ф 0. Мы можем написать
п
i=o
п-1ге-1
22 ann(annaij — ainan
< = 0 j=0
Так как ain = ani, то треугольные преобразования
где
1 0
0 1
о
о
о
о
О 0 ... 1 О
\п а\п ••• ап-\,п апп
преобразуют У Ах в форму
п-1 п-1
сп^пК +22 Ьф$],
где сп = ппп и Ьу = апп(аппа^ — ainanj). В силу индуктивного пред-
предположения, существует треугольное преобразование неизвестных
(% E«_j) и (т)о т)п_1), приводящее форму
п-1п-1
2
§ 2. ПОЛЯРНЫЕ КОРРЕЛЯЦИИ 391
к требуемому виду. Это дает нам, как и в 1-м случае, треугольное
преобразование, приводящее форму
»-1п-1
2 2
< = 0 3-й
к желаемому виду. Так как произведение двух треугольных преобра-
преобразований также является треугольным преобразованием, то форма у'Ах
приводится к требуемому виду посредством некоторого треугольного
преобразования.
Случай (III): а,пп = ®, ainz=ani=^ О ДЛЯ некоторого значения /.
Пусть k — наибольшее значение i, для которого ain ф 0. Тогда
ft к п-1 п-1
У Ах=уп (S anix{) + B a{nyt) xn + 2 2 «адУ«^ =
< = 0 4 = 0 <=0 ^ = 0
и-1 »—1
где
ft
4=0
Из последнего равенства следует, что
Подставив это выражение xft через неизвестные х0, ...,
и сделав аналогичную подстановку для ук, мы найдем, что
П-1 П-1
У А + *»•»!* +22 a^ytxj =
O 0
и-l n-l
^«^а + 2' Я/уЛ-к,- + 2'
j0 i0
и-1 п-1
2' 2' afjytXj =
п-1 п-1
= B'
t=0
22
»=0 }=0
п-1
В сумме 2' опущено значение г = k.
1 = 0
392 гл- 1Х- КОРРЕЛЯЦИИ
где b и Ьц — элементы поля К, легко определяемые при непосред-
непосредственной подстановке. Далее, преобразование
и
^к = Zi anixi>
t=0
n-l ft
amxi.
i=0 i=0
?/ = *« (/ = 0, .... *-l, * + l я-1)
является треугольным; следовательно, преобразование, обратное к нему,
также будет треугольным. Выписанная выше форма при этом обратном
преобразовании переходит в форму
П-1 П-1
2' 2'
<0 <0
п-1 п-1
2
Применяя теперь индуктивное предположение к форме 2 2 ^а^Л^
получаем, что она может быть приведена к требуемому виду неко-
некоторым треугольным преобразованием неизвестных
Если обозначить новые неизвестные через
(*0> •••> *fc-Ii 'fe + l *»-l)
и добавить к уравнениям преобразования в соответствующих местах
два уравнения
то новая матрица тоже будет треугольной. Таким образом, форма у'Ах
приводится к форме требуемого вида посредством нескольких тре-
треугольных преобразований. Тем самым теорема доказана.
Использование треугольных преобразований имеет чисто вспомо-
вспомогательное значение. Если нам задана только одна симметрическая
билинейная форма у'Ах, то, используя некоторые допустимые пре-
преобразования, не являющиеся треугольными, мы можем получить для нее
более простую стандартную форму. Применим сначала преобразование
* ?* f.*
x/ — V 0 — '"an • • • •
ft 2. ПОЛЯРНЫЕ КОРРЕЛЯЦИИ
393
к полученной в теореме I форме стандартного вида. Она перейдет
при этом в форму
где
и
J=0
= 2 (i = 0, .... r—I)
= -2 (/ = 0 /¦—1).
Ho (/0 in) есть некоторая перестановка, составленная из чисел
@, .... я). Выполнив преобразование, состоящее только в переста-
перестановке неизвестных, мы получим
где элементы d0, .... ds отличны от нуля. Если произведением всех
использованных преобразований является преобразование
то
dQ 0 ... О О ... О \
О dx. . . О 0 ... О
R'AR = 0 0 ... d, 0 ... О
О О ... О О ... О
О О ... О О ... О
и, следовательно, ранг матрицы А равен г» —J— 1. Таким образом, мы
доказали следующие результаты:
Теорема II. (а) При надлежащем выборе допустимой системы
координат симметрическая билинейная форма у'Ах приводится
к виду
где s-{-l есть ранг матрицы А.
(б) При надлежащем выборе допустимой системы координат
полярная корреляция и — Ах приводится к системе уравнений
Ui^diXi (/ = 0 я),
в которых элементы d0 dB отличны от нуля, a dg+, = .'., =а
— dn = 0; здесь s-\-l—ранг матрицы А,
394 гл. ix. корреляции
Если основное поле К алгебраически замкнуто, мы можем, далее,
выполнить преобразование
X\ = $Xt (/ = 0 s), X*t = Xt (/ = 5+1 я).
Действие этого преобразования сводится к замене каждого t(^)
в приведенной выше теореме единицей. Таким образом, справедлива
Теорема 'III.* Если основное поле К алгебраически замкнуто,
то единственным проективным инвариантом полярной корреляции
является ее ранг. При надлежащем выборе допустимой системы
координат уравнения полярной корреляции ранга s + 1 можно
привести к виду
и( = х{ (/ = 0, .. ., s), uf = 0 (/ = s+l п).
Из приводимых ниже рассуждений следует, что система допустимых
координат, в которых полярная корреляция приводится к виду,
указанному в теореме III, не определена однозначно. Предположим, что
ранг матрицы А в уравнении A) равен s+1 и что s^-О. Пусть
— произвольная точка, не самосопряженная относительно полярной
корреляции A). Тогда
лг«»'/Ы0> Ф 0. C)
Уравнение
х@)'Лдг = 0 D)
определяет некоторую гиперплоскость. Эта гиперплоскость содержит
подпространство Sn_a_v определяемое уравнением
совпадая с этим подпространством при s = 0. В силу C), точка Я<0>
не лежит в гиперплоскости D). Мы можем, следовательно, найти
в этой гиперплоскости га независимых точек, скажем
Pw = (^, .... 4) = лг(Я (/=1 п),
которые вместе с точкой PW составят некоторый симплекс. Возьмем
этот симплекс в качестве репера новой системы координат. Заметим
прежде всего, что
xWAxW=0 (/=1, ..., л).
Пусть уравнением билинейного соответствия, определяемого равен-
равенством A), в новой системе координат будет
Тогда, если x*W есть образ точки х^\ то
§ 2. ПОЛЯРНЫЕ КОРРЕЛЯЦИИ 395
Но
**Ю = (8М, .... Ь1п) (г = 0 га);
следовательно,
boi = 0 (t=l, .... л).
Так как
х* (о/5^@)^0,
то
Поэтому
п п
У*'Вх* = bQQyoxQ+ 2 2 Ьцу\х),
11 ji
и матрица
должна иметь ранг s. Применяя то же самое рассуждение к били-
билинейной форме
мы приходим к следующему результату.
Теорема IV. Если ранг полярной корреляции равен s-j-1,
то репер, относительно которого уравнения этой полярной
корреляции записываются в канонической форме, определяется
следующим образом:
A) существует точка р(°\ не самосопряженная относительно
этой полярной корреляции;
B) существует точка РМ, не самосопряженная относительно
этой полярной корреляции, но сопряженная с точкой PW;
(i -\- 1) существует точка Р'*>, не самосопряженная относительно
полярной корреляции, но сопряженная с точками Р(°) p(*-i);
(s -\~ 1) существует точка ЯМ, не самосопряженная относительно
полярной корреляции, но сопряженная с точками PC) Я8).
(s-j-2) Пусть теперь Pte+D, ..., р(») — система га — s независи-
независимых точек подпространства Sn_s_t, точки которого при рассма-
рассматриваемой полярной корреляции не имеют образов. Тогда мы
можем принять Р(°) Р<и) за вершины репера и, выбрав
соответствующим образом множители, привести уравнения этой
полярной корреляции к виду
ui = xi G = 0, ,.., s), и< = 0 (i = s-j-l, ...,и),
396 гл. ix. корреляции
Свойства полярной корреляции легко выводятся из ее канонического
вида, установленного выше. В частности, заметим, что свойства
полярной корреляции, которую мы рассматривали,
«< = xt (i = О s),
ut = 0 (t = s+l я),
могут быть непосредственно выведены из свойств невырожденной
полярной корреляции
«« = *« (i = 0 s) F)
в подпространстве Ss, определяемом системой уравнений
Подпространство 5п_в_1, определяемое системой уравнений
х0 = ... = xs = О,
называется вершиной полярной корреляции E). Ни для одной из точек
подпространства Sn_a_1 нет соответствующей гиперплоскости в этой
полярной корреляции. Так как гиперплоскость, соответствующая
произвольной точке, не лежащей в Sn_s_1, проходит через Sn_8_t,
то каждая точка подпространства Sn_a_t сопряжена с произвольной
точкой пространства [я], не лежащей в Sn_s_1. Из уравнений также
непосредственно следует, что две точки Р и Q пространства [я], не
лежащие в Sn_s_1, сопряжены относительно полярной корреляции E)
в том и только в том случае, если их проекции из подпространства
Sn_s_1 на подпространство Ss сопряжены относительно полярной
корреляции F).
Геометрическое значение полярных корреляций станет более ясным,
когда мы будем изучать сопряженные точки в главе о квадратичных
формах, во втором томе. Здесь необходимо только заметить, что
точки, сопряженные относительно полярной корреляции
и = Ах,
будут также-сопряженными по отношению к квадратичной форме
х'Ах = О,
и обратно, так как соотношение между точками одно и то же
в каждом из этих случаев. Невырожденная полярная корреляция F)
преобразует точки подпространства Sh, имеющего грассмановы коор-
координаты (. ., pio...i , ...), в гиперплоскости, проходящие через под-
подпространство Ss_k_1 с дуальными координатами (..., q4'"**, ...),
где
§ 2. Молярные корреляций
Это видно из уравнений F). Обратно, образ подпространства Ss__k_t
состоит из гиперплоскостей, проходящих через подпространство Sk.
Подпространства Sk и 5g_fc_, называются сопряженными относительно
этой полярной корреляции. Каждая точка одного подпространства
сопряжена с каждой точкой другого. Докажем теперь следующую
теорему:
Теорема V. Если подпространства Sk и Ss-k_1 сопряжены
относительно некоторой невырожденной полярной корреляции,
то для того, чтобы эти подпространства пересекались, необходимо
и достаточно, чтобы подпространство Sk содержало некоторую
точку Р, сопряженную с каждой точкой подпространства Sk.
Пусть
— независимые точки подпространства Sh. Подпространство Ss_k_1
определяется системой уравнений
Если подпространство Ss_k_t содержит некоторую точку подпро-
подпространства Sk, скажем точку
0=0
то система уравнений относительно к0 Xft
О = 0 J=0
должна иметь решение. Но условие существования ненулевого реше-
решения Яо, ..., Кк этой системы уравнений в точности эквивалентно
условию, что точка
сопряжена с каждой из точек _у(°) у№. При этом точка а:
сопряжена с каждой из точек подпространства Sk. Это и доказывает
теорему, которая геометрически вполне очевидна.
Если вслед за полярной корреляцией
и = Ах,
относящей точкам гиперплоскости, выполнить полярную корреляцию
относящую гиперплоскостям точки, то мы получим коллинеацию
у = В Ах.
Гл. IX.
В заключение исследования полярных корреляций мы докажем
для случая, когда поле К алгебраически замкнуто, следующую
теорему:
Теорема VI. Каждая коллинеация в пространстве [п] является
результатом последовательного выполнения полярной корреляции,
относящей точкам гиперплоскости, и невырожденной полярной
корреляции, относящей гиперплоскостям точки.
Выберем систему координат так, чтобы заданная коллинеация
определялась уравнением канонического вида
Сх,
где
о
и С„(а) есть е X «-матрица
Далее, пусть
О О
где Ве есть е X «-матрица
Тогда
a
0
0
0
в*
0
1
a
0
0
0
Be,
0 ...
1 ...
0 ...
0 ...
• ¦ .
0
0
a
0
0
0
0
0
1
a
\
I
вЙ
e
Befle,
0
0
0
0
1
(«l)
0 .
0 .
1 .
0 .
0
B,jCes
.. 0
.. 1
.. 0
.. 0
(«2)
1
0
0
0
...
0
0
&i нУль-поляРныё
Ho BjCe(a) есть еХе"матРица
О 0 ... О а
0 0 ... а 1
О а ... О О
а 1 ... О О
Так как эта матрица симметрична, то А также симметрична. Далее,
В — не только симметрическая, но и невырожденная матрица, причем
Коллинеация у = Сх является произведением полярной корреляции
в = Ах
и невырожденной полярной корреляции
относящей гиперплоскостям точки.
§ 3. Нуль-полярные корреляции
Нуль-полярные корреляции можно изучать методами, аналогич-
аналогичными тем, которые в § 2 использовались при изучении полярных
корреляций. Рассмотрим сначала приведение уравнений нуль-полярной
корреляции к некоторой стандартной форме посредством надлежащего
выбора допустимой системы координат. Мы докажем теорему, ана-
аналогичную теореме I из § 2, используя те же самые треугольные
преобразования.
Теорема I. Посредством некоторого треугольного преобра-
преобразования
кососимметрическая билинейная форма у'Ах может быть приве-
приведена к виду
где (/0 /2г) — различные числа, выбранные из чисел @, ..., п).
При п = 1 имеем
у'Ах = а01 (yoxt —Л^о)-
Если а01 =а 0, то нечего доказывать. Если а01 Ф 0, положим
/1 О
Р==[о W
4б9 гл. ix. корреляции
и тогда
coi (Уох1 — У Iхо) — У^ —
Этим для га = 1 теорема доказана, и мы можем воспользоваться
теперь методом индукции. Так как матрица А кососимметрична и,
следовательно, апп = 0, нам придется рассмотреть два случая;
Случай (I). Если ain = 0 для всех i, теорема непосредственно
следует из индуктивного предположения (ср. теорему I § 2).
Случай (II). Если не все а(п равны нулю, то пусть k < га — наи-
наибольшее значение /, для которого ain ф 0. Тогда
ft к п-1 п-1
B Wi)rc + 2
Положим
к
'ft == 2j anixi>
i = 0
ti = xt (i = 0, .... ft—1, fe + 1 ra).
Это треугольное преобразование. Поэтому обратное к нему преобра-
преобразование
к-1
хк = — апк ZJ anfcl + апк %к<
о
xi = k (t = 0, .... k— 1, ft+1, .... га)
тоже является треугольным. Так как мы можем написать
ft ft
у'Ах=уп{? ап(х{) — B о»<У«)*п +
Я-1Я-1 й-1 И-1
+ 2' 2' ацу^з + 2' %-л^ — 2'
{=0 1' = 0 J = 0 J = 0
то после преобразования получаем
»_1 n-l
У At = 7)^fc — i\?n + 2' 2
40
4=0 J = 0
n-l ft-l
n-l
2'
i=0
»-i n-l»-i
2' *<Ei)+2' 2'
i-0 <=Oj=O
В сумме 2' опущено значение / = k.
i
____'__ §3. НУЛЬ-ПОЛЯРНЫЕ КОРРЕЛЯЦИИ 401
где bit btj — легко определяемые элементы поля К. Применяя теперь
треугольное преобразование
получим
П-1 »-1
/Ах — туЛк — тнЛп + А 2i
Заканчивается доказательство с использованием индуктивного пред-
предположения точно так же, как в теореме I § 2. Таким образом, тео-
теорема доказана.
Так как ранг матрицы Р'АР равен рангу матрицы А и ранг
рассмотренной в теореме билинейной формы равен 2г, то матрица А
имеет ранг 1г.
При последующем преобразовании, не являющемся треугольным и
только переставляющем неизвестные, билинейная форма у*Ах окон-
окончательно приводится к виду
г-1
<=о
Установив этот результат, мы получаем для нуль-полярных кор-
корреляций следующую теорему:
Теорема II. Нуль-полярная корреляция имеет только один
проективный инвариант — ее ранг, который должен быть чет'
ним. Если этот ранг равен 2г, то система координат может
быть выбрана так, что уравнения нуль-полярной корреляции
примут вид
ttai ==: Хл14 I
(' = 0, .... г—1), A)
Легко показать, что приведение к такому виду неоднозначно. На
доказательстве этого мы не будем останавливаться.
Существенная разница между нуль-полярной и полярной корре-
корреляциями состоит в том, что относительно нуль-полярной корреля-
корреляции каждая точка х является самосопряженной. Действительно,
если А — кососимметрическая матрица, то
х'Ах = (х'Ах)' = х'А'х = — х1 Ах
и, следовательно,
х'Ах = 0.
Иными словами, гиперплоскость в = Ах всегда содержит точку дг.
26 Зак. 1230. В. Ходж и Д. Пядо
402 ГЛ. 'X. КОРРЕЛЯЦИИ
Если две точки х и у сопряжены, т. е.
у'Ах = — х'Ау.= 0, ;
то любые две точки" Xx + jiy и рлг-(-ау соединяющей их прямой
также будут сопряжены. Действительно,
(кх' -(- н-У) А (рх -\- <зу) = Хрлг'Лх 4" кзх'Ау -\- рру'Ах -\- рзу'Ау == 0;
Следовательно, каждая прямая пространства [я], соединяющая пару
точек, сопряженных относительно нуль-полярной корреляции, содер-
содержит бесчисленное множество пар сопряженных точек. Мы имеем
также
.п п ¦ ¦ ¦
0 *= у'Ах =^2 aiiyixi = 2 ayiyiXj—yjXt) — S aijPij> B)
где ('..., Pij, • • •) — грассмановы координаты прямой, проходящей
через две сопряженные точки х и у. Обратно, если хну — две
точки прямой с координатами (.... Рф ...), удовлетворяющими
соотношению-
то мы можем переписать последнее равенство в виде
2E
<=oj=o
где
Ьц
и
Следовательно, нуль-полярная корреляция ассоциируется с системой
прямых (называемой линейным комплексом), грассмановы координаты
которых удовлетворяют соотношению B), и, обратно, каждый линей-
линейный комплекс ассоциируется с вполне определенной нуль-полярной
корреляцией. Геометрия нуль-полярной корреляции является по суще-
существу геометрией линейного комплекса и относится поэтому к линей-
линейной геометрии.
Нуль-полярная корреляция может быть невырожденной только
при нечетном п, и тогда г = (л-(-1)/2. Рассмотрим вкратце этот
случай. Возьмем уравнения в канонической форме
Unj = X
Если
/'=Ы Уп) (/ = 0 k)
— система k-\-1 линейно независимых точек пространства [п],
определяющих подпространство. Sk, то уравнения сопряженного под-
^ S 3. НУЛЬ-ПОЛЯРНЫЕ КОРРЕЛЯЦИИ 403
пространства 5„_к_1, содержащегося в образах всех точек подпро-
подпространства Sk, будут иметь вид
li) = O (i = 0, ..., АО-
Подпространство 5„_й_1 пересекает подпространство Sk в том слу-
случае, если эти уравнения удовлетворяются при подстановке
т. е. если система уравнений
2 2 0&+о& - yhA+4 h = o (i = о к) C)
имеет ненулевое решение (А.о Хк). Здесь (А; —[— 1) X (As —j— 1)-ма-
трица
(««) = Bо (Ж+1.А - Ay* +0)
кососимметрична и, следовательно, если A; -J-1 нечетно, вырождена.
Таким образом, если k четно, система уравнений C) всегда имеет
ненулевое решение, и, следовательно, подпространство Sh пересекает
подпространство Sn_k_v С другой стороны, если k нечетно, то
матрица (aih) может быть невырожденной, и тогда подпространство Sk
не пересекает подпространства 5П_Й_1. В этом легко убедиться, полагая
^ = (8^,..., 84„) (/ = 0 ft),
т. е. рассматривая подпространство Sk, определяемое первыми k -\- 1
вершинами репера. Система уравнений подпространства Sn_1c_l будет
тогда иметь вид
Это подпространство не пересекает выбранного нами подпростран-
подпространства Sk.
Подпространство Sk, совпадающее со своим сопряженным Sn_lc_1,
называется самосопряженным. Такое совпадение может иметь место
только при k = n — k — 1, т. е. при k = г — 1. Обратно, если это
условие выполнено, то существуют самосопряженные As-мерные подпро-
подпространства. Например, As-мерное подпространство, определяемое первой,
третьей, пятой, ..., я-й вершинами репера, будет самосопряженным.
Действительно, системой уравнений, определяющих подпространство,
сопряженное Sk, в этом случае будет
Найдем условие, при котором подпространство Sk с координатами
(•••• Pia...ikt •••) является самосопряженным. Так как при этом мы
26*
404 гл. tx. копуляции
не будем использовать каноническую форму нуль-полярной корреля-
корреляции, .то предположим, что эта нуль-полярная корреляция определяется
уравнением общего вида
и = Ах. D)
Ясно, что для самосопряженности подпространства 5Л необходимо и
достаточно, чтобы любые две точки этого подпространства были сопря-
сопряжены. Следовательно, каждая прямая из Sk должна принадлежать линей-
линейному комплексу
^ 0.
Далее, каждая прямая из Sk является пересечением этого SH и неко-
некоторого Sn_k+1. Пусть (..., 0*о<"**-2| ...)—дуальные координаты
подпространства 5я_к+1. Если Sn_k+l пересекает Sk по подпростран-
подпространству размерности, большей единицы, то мы имеем
2
.
fc2
для всех значений /, _/. Если же это пересечение является прямой, то ее
координатами будут (..., riJt ...). где (гл. VII, § 5)
гц** 2, рщ»...1к_/""<к-*'
*» *Й-2
Отсюда следует, что для самосопряженности подпространства Sk необ-
необходимо и достаточно, чтобы выполнялись равенства
2 2
при всех q<0'"{k-2j являющихся координатами некоторого Sn_k+%. Но
мы всегда можем найти такое подпространство 5„_к+1, для которого
все грассмановы координаты, за исключением одной наперед указан-
указанной, равны нулю. Мы можем, следовательно, переписать необходимые
и достаточные условия самосопряженности подпространства Sk в виде
при любом выборе индексов /0 tft_2.
Последовательное выполнение нуль-полярной корреляции
и = Аж,
относящей точкам гиперплоскости, и нуль-полярной корреляции
относящей гиперплоскостям точки, приводит к коллинеации
у = В Ах.
§ 3. НУЛЬ-ПОЛЯРНЫЕ КОРРЕЛЯЦИИ 405
Если п четно, то обе матрицы А и В вырождены и эта коллинеа-
ция также будет вырожденной. Мы не можем, следовательно, ожидать,
что невырожденная коллинеация представима в таком виде. Но мы
можем поставить вопрос о возможности такого представления при
нечетном п. Мы постараемся, кроме того, выяснить, будет ли любая
коллинеация представима в виде произведения нуль-полярной (поляр-
(полярной) корреляции, относящей точкам гиперплоскости, и полярной (нуль-
полярной) корреляции, относящей гиперплоскостям точки. Очевидно,
что в каждом случае должны выполняться какие-то условия, на-
налагаемые на элементарные делители коллинеации, и что вообще
для возможности такого представления имеются необходимые и доста-
достаточные условия. Так как методы исследования этого вопроса одни и
те же во всех случаях, мы подробно рассмотрим один из них, огра-
ограничившись формулировкой результатов для остальных случаев.
Теорема III. Если п нечетно и основное поле К алгебраи-
алгебраически замкнуто, то коллинеация
в пространстве [п] тогда и только тогда может быть предста-
представлена в виде произведения нуль-полярной корреляции
и = Ах,
относящей точкам гиперплоскости, и невырожденной нуль-поляр-
нуль-полярной корреляции
относящей гиперплоскостям точки, когда элементарные делители
матрицы С — Х?п+1 попарно равны, т. е. имеют вид
(X — а,)9', (X - а,)*; (X — а2)е«, (X - а2)9'; ....
Возьмем матрицу С в канонической форме
) 0 ... О
О СЛаЛ ... О
С =
О О
и найдем условия, при которых существуют такие кососимметри-
ческие матрицы А и В, что
С = ВА. E)
Элементарное рассуждение показывает, что необходимое условие,
которому должна удовлетворять матрица С, состоит в том, что для
каждого элементарного делителя (X — а)е матрицы С — Х?п+1 должен
существовать другой элементарный делитель (X — а)'»_Пусть Р = В.
406 ГЛ. IX. КОРРЕЛЯЦИИ
Тогда элементарные делители матрицы С — А?„+1 будут также эле-
элементарными делителями матрицы
которая является кососимметрической. Следовательно, если X = а есть
собственное значение матрицы С, то ранг матрицы А — аР и, следо-
следовательно, ранг матрицы С—а?п+1 равны п-{-1—2р, где р—неко-
р—некоторое целое число (теорема II). Таким образом, должно существо-
существовать 2р элементарных делителей вида
(А-«У1 (A —a)V
Эти рассуждения не доказывают, однако, что числа е±, ..., е2р попарно
равны, как требуется нашей теоремой; чтобы доказать это, необхо-
необходимо, более подробное исследование.
Разобьем матрицы Ли Р = В~1 на клетки соответственно раз-
разбиению канонической формы матрицы С. Пусть
A = \
...Аы
где АЧ и Pii являются ei X ^-матрицами. Матрицы А и Р кососим-
метричны. Поэтому
(A*J)' = — {АН) и (РЧ)' = — (РЛ). F)
Так как РС = А, то перемножение соответствующих матриц пока-
показывает, что
Пользуясь равенствами F), находим, что
(А*)' = [PiJC (а,-)]' = С' (а,) (/*)' = - С'., (а,) Р*.
Но
при всех значениях /, /. Следовательно,
(а,). G)
§ 3. НУЛЬ-ПОЛЯРНЫЕ КОРРЕЛЯЦИИ 407
Мы воспользуемся этим результатом для определения вида под-
подматриц Pi*. Пусть
' Рц • • • п->ц
И
^ = 0 (А = 1 е{), рт = 0 (h=l ер.
Приравнивая элементы /t-й строки и fe-го столбца обеих частей
равенства G), получаем
ajPhk-\-Ph-lk==aiP№~\~Phk-l {h=\, ..., ef, fe = l, ...» в{). (8)
Предположим сначала, что at ф а:-. Тогда, если в равенстве (8)
h = k = 1, то
и, следовательно,
Далее, если h = 1, k = 2, то равенство (8) дает
откуда
Продвигаясь вдоль первой строки матрицы Pi*, затем вдоль второй
строки и т. д., мы убедимся в том, что если а{ Ф а^, то
PJ* = 0.
С другой стороны, при о^ =" dj равенства (8) принимают вид
Если ef^.ej, то все элементы ряда, параллельного прямой, соеди-
соединяющей элементы рХе. и реи равны между собой, а если ег~^е$, то
равны все элементы ряда, параллельного прямой, соединяющей эле-
элементы pi,e. и реХ. Так как, кроме того, при ^
408
ГЛ. IX. КОРРЕЛЯЦИИ
то мы получаем два вида подматриц Я**: если
0 0 0 ... 0 0 0
, то
а если «t >-«,-, то
0 0 0 .
. 0 0 0
0 0а
0 0 0 ... а Ь с
a b с ... 0 0 0
(9)
. ... О а
. . . О a b
. . О a b с
I
(9)
О ... О a b с
Таким образом, матрица Р делится на диагональные клетки, являю-
являющиеся квадратными матрицами,
/Р1 0 ... О'
О Р2 ... О
у0 0 ... F?)
соответственно системам равных собственных значений
где kr — k. Легко видеть, что так как
то матрица А делится на диагональные клетки аналогичным образом.
Полагая
/Л1 0 ... 0
О Л2 ... О
О 0 ... Аг
мы можем записать соотношение между матрицами А, Р, С в виде
о
о
§ 3. НУЛЬ-ПОЛЯРНЫЕ КОРРЕЛЯЦИИ 409
Для того чтобы матрица Р была невырожденной, должна быть невы-
невырожденной каждая ее подматрица Р*. Выясним теперь, существует ли
невырожденная матрица Р*, образованная матрицами вида (9) и такая,
что обе матрицы Р* и А* кососимметричны. Так как собственные
значения <**, ,+i а*, равны между собой, мы должны обратить
внимание только на индексы еь_ +1, ..., ек. Для упрощения обо-
обозначений опустим в равенстве A0) индексы и подиндексы, переписав
это соотношение в виде
(Св1(аг) 0 ... О
0 CeiK) ... 0
0 0 ... Се]с(ак)
]с
где <хг = а2 = ... = ак, и предположим, что ех <[ е2 ¦<...<! ек.
Мы имеем
/Р» ...
где элементы Pi* являются е^ X ^-матрицами вида (9). Так как ма-
матрица Р кососимметрична, то из равенства (9) следует, что
Р« = 0 (i=l к).
Далее, как в равенстве F),
Если ei = ej, из равенства (9) вытекает, что
pij=:(pijy (И)
и, следовательно,
pij = — pj*.
Образуем теперь из матрицы Р новую матрицу
Q =
беря элемент qtj из левого нижнего угла матрицы РУ. Матрица Q
будет k X А-матрицей, и из равенства (9) следует, что
q{j=0 (если «<<«,),
а из равенства A1) вытекает, что при e( = ej
Пусть
410
ГЛ. IX. КОРРЕЛЯЦИИ
так что индексы е1
ек, которые предполагаются расположенными
S
1р
в порядке возрастания их величин, распадаются на S систем равных
индексов. Тогда
№»¦ 0 ... 0
0 Q22 ... 0
О 0 ... С,
где Qu есть at X й<-матрица, а все подматрицы выше главной диаго-
диагонали являются нулевыми. Поскольку
матрица Q будет невырожденной только в том случае, если все ма-
матрицы Qu невырождены. Так как Q** кососимметрична, она может
быть невырожденной только в том случае, если at четно. Мы пока-
покажем теперь, что матрица Q может быть вырожденной только в том
случае, если вырождена матрица Р. Действительно, если Q — вы-
вырожденная матрица, ее столбцы линейно зависимы. Поставив элементы
матрицы Q в их первоначальное положение в Р, мы убедимся в том,
что все остальные элементы столбца матрицы Р, содержащего q^,
равны нулю. Следовательно, если столбцы матрицы Q линейно зави-
зависимы, то столбцы матрицы Р, содержащие элементы qtj, также
линейно зависимы. Таким образом, если Q вырождена, то и Р также
вырождена. Но поскольку мы предположили, что матрица Р невы-.
рождена, отсюда следует, что все а{ четны, т. е. мы доказали необ-
необходимость условий теоремы о том, что элементарные делители ма-
матрицы С — А.Еп+1 попарно равны:
(к - Ч)\ (X - aj*; (X - <х2)е\ (X - а/', ...
Достаточность этих условий доказывается более просто. Предполо-
Предположим, что k = 2А и что
в равенстве A0,
е\ —
:*2» «3
положим
0
-Ее
0
0
0
0
Ев1
. 0
0.
0
0
0
< ,
0
0
0
-Ее»
0
0
... е
0
0
Я*
0
0
0
... 0
... 0
... 0
... 0
... о
— Е
0
0
0
0
0
§ 4. ПРОСТЫЕ КОРРЕЛЯЦИИ 411
где Et есть t"X /-матрица
.. О
.. 1
.. О О,
Очевидно, что Р{ — невырожденная кососимметрическая матрица;
элементарное вычисление показывает, что матрица А*, определяемая
равенством A0), также кососимметрична. Мы построили, следова-
следовательно, искомые матрицы А и В = Р*1, и теорема доказана.
Другие результаты относительно комбинации нуль-полярной и
полярной корреляций проще выражаются через свойства матриц.
Теорема IV. Пусть задана матрица С. Для того чтобы
существовали кососимметрическая матрица А и невырожденная
симметрическая матрица В, такие, что
необходимо и достаточно, чтобы элементарные делитеш матрицы
С — ХЕга+1, соответствующие ненулевым собственным значениям,
можно было объединить в пары вида (X— а)е, (X-+-<*)"> а число'
элементарных делителей kf, соответствующих нулевому соб-
собственному значению, для каждого данного четного значения f
было четным.
Теорема V. Пусть задана матрица С. Для того чтобы
существовали симметрическая матрица А и невырожденная косо-
кососимметрическая матрица В, такие, что
необходимо и достаточно, чтобы элементарные делители матрицы
С—Х?га+1, соответствующие ненулевому собственному значению
матрицы С, можно было объединить в пары вида (X — а)е,
(X -|- а)е, а число элементарных делителей Х^, соответствующих
нулевому собственному значению, для каждого данного нечетного
значения / было четным.
§ 4. Простые корреляции
Мы рассмотрим теперь корреляции в пространстве [и], не являю-
являющиеся ни полярными, ни нуль-полярными. Предположим, что основ-
основное поле К алгебраически замкнуто, и найдем условия, при которых
корреляция
и = Лх A)
может быть преобразована в
v — By
412 ГЛ. IX. КОРРЕЛЯЦИИ
посредством некоторого невырожденного преобразования
х =*= Ру, или и = Pv
соответственно координат точек и гиперплоскостей. При желании мы
можем рассматривать это преобразование не как преобразование коор-
координат, а как коллинеацию в пространстве [я].
Алгебраически этот вопрос сводится к установлению условий, при
которых существует такая невырожденная матрица Р, что
В^Р'АР. B)
Из равенства B) вытекает, что
В' = Р'А'Р.
Следовательно, если X — неизвестное, то
В — 1В' = Р'(А — \А')Р,
так что матрицы А—\А' и В — ХВ7 имеют один и тот же ранг и
одинаковые элементарные делители. Это дает нам необходимое
условие существования матрицы Р, удовлетворяющей условию B).
Мы покажем теперь, что если матрицы А — ХА' и В — ХВ' невы-
невырождены, то это условие будет также и достаточным.
Мы можем найти элемент d поля К (не равный ± 1) так, чтобы
матрицы
C = A — dA' и D = B —
были невырожденными. Если матрицы А — ХА' и В — ХВ' (обе ранга
п-\-\) имеют одинаковые элементарные делители, то это верно и для
матриц
С — jtC' и D — pD',
где jj. — новое неизвестное, связанное с X равенством
Если существует такая невырожденная матрица Р, что
то
В = A — iP)-1 [D + dD'\ = A — tf8)-i Pf [C+dC] P = P'AP.
Предположим, что матрицы С — цС и D — jtD' имею? одинаковые
элементарные делители. Так как матрицы С и ГУ невырождены, то
существуют (гл. II, § 9, теорема V) такие невырожденные ма-
матрицы R и S, что
S и D' = RC'S.
Из второго равенства получаем
S «¦ ПРОСТЫЕ КОРРЕЛЯЦИИ 413
и, следовательно,
RCS^S'CR',
т. е.
ХС = СХ\
где Х= "SR. Из равенства ХС = СХ' получаем
ХЮ = ХСХ' = С(ХУ,
Х9С = *С (A"'J = С (Х'У,
и, окончательно,
ЛГПС
Следовательно, если /(X) — многочлен из К[к\> то
Но (гл. II, § 10, теорема II) существует такой многочлен f(k), что
если Y = f(X) и, следовательно, YC = CY', то У2 = ЛГ.
Далее,
D = S'CR' = S'CAPS = S'C(YyS = S'CY'Y'S = (S'Y)C(Y'S).
Полагая
p= rs,
будем иметь
D = P'CP.
Таким образом, доказана
Теорема I. Если Л и В — такие (п-\- 1)Х(«+ V)-матрицы,
что при неизвестном X матрицы А — АЛ' и В — кВ' невырож-
невырождены, то для существования невырожденной матрицы Р, удов-
удовлетворяющей условию
В = Р'АР,
необходимо и достаточно, чтобы матрицы А — \А' и В — \В'
имели одинаковые элементарные делители.
Если матрица А (и, следовательно, В) невырождена, то непосред-
непосредственным следствием этой теоремы является
Теорема II. Две невырожденные корреляции
й — Ах и и = Вх
тогда и только тогда эквивалентны, когда подобны ассоцииро-
ассоциированные коллинеациа
у = ААх и у = ВВх.
Возникает вопрос: можно ли найти такую (я-4~1)Х(я+ 1)-мат-
рицу А, чтобы матрица А — \А' имела наперед заданные элементар-
414 ГЛ. IX. КОРРЕЛЯЦИИ
ные делители? Легко видеть, что это не всегда возможно. В самом
деле, пусть элементарными делителями матрицы А — кА' будут
(* —«х)\ .... (X — «*)*.
Если ацфО и (X — а{)"{ является делителем всех миноров у-го яо-
рядка матрицы А — \А', то (Х>—а*N' будет делителем всех миноров
того же порядка j матрицы А' — кА, и обратно. Далее, матрица
А' — кА является транспонированной по отношению к матрице
А — \А', а матрица, транспонированная к Х-матрице, имеет те же
самые элементарные делители, что и исходная матрица. Следова-
Следовательно, если (X — fltf)"* — элементарный делитель матрицы А — \А'
(^ФО), то (Я — а*)*'— также ее элементарный делитель.
Далее, если ал = <х2 = ... == аг = 0, так что АЛ, ..., кег— эле-
элементарные делители матрицы А — кА', соответствующие нулевому
собственному значению, то из равенства
следует, , что степень характеристического многочлена матрицы
А — кА' равна
Отсюда
Мы установили некоторые необходимые условия, которым должны
удовлетворять элементарные делители матрицы А—kAf. Если
а*#±1, то элементарные делители (отличные от Хе<) можно
объединить в пары вида (А. — <х{)% (X — аГ1N^ но при a.t = ±l
соответствующие элементарные делители (к — aj)"i могут объеди-
объединяться сами с собой.
Теперь докажем следующую теорему:
Теорема III. Для существования матрицы А,'при которой
А — ХА' имеет наперед заданные элементарные делители, доста-
достаточно, чтобы выполнялись следующие условия:
(I) элементарные делители, кроме имеющих вид Xе, могут
быть объединены в пары (X — а*/', (X — «Т1)^ (а<=? — !)'>
(II) если элементарными делителями матрицы являются
к\..., Х\ (X —а/i, (k-of1/! (Х-а^Ча-в,-1/-.
то
§ 4. ПРОСТЫЕ КОРРЕЛЯЦИИ
415
Пусть Df(a) есть 2/Х 2/-матрица
(О , . О О
Df(a) =
Тогда
О
О
... О а —X 1
.. . 1—Ха О О
... —X О
. О
. О
\ \—\а —X ... . О О ... . О
Определитель этой матрицы, с точностью до числового множителя, равен
(X — а/(ка-if,
в то время как минор B/— 1)-го порядка, получающийся вычерки-
вычеркиванием первого столбца и (/-+- 1)^й строки, равен
а минор B/— 1)-го порядка, получающийся вычеркиванием первой
строки и (j-\- 1)-го столбца, равен
(Ха—1/.
Так как, по предположению, а ф ± 1, то наибольший общий дели-
делитель всех миноров порядка 2/—1 равен 1, и при а Ф 0 элементар-
элементарными делителями матрицы Df(a) — kD'f(<x) будут, следовательно1),
(X — а/ и (X —а*O.
!) При а = it 1 элементарными делителями являются (X ± if, (X ± if,
no доказательство этого проводится иначе.
416
гл. ix.
Если а = О, проведенное выше рассуждение показывает, что един-
единственным элементарным делителем будет А*". Отсюда следует, что
Dei@) О
о а@)
если
А =
C)
О
то матрица А — АЛ' имеет наперед заданные элементарные делители.
Всякий раз, когда выполняются условия теоремы III, мы будем
считать
и = Ах
[где А — матрица, определяемая равенством C)] каноническим видом
корреляции, имеющей заданные элементарные делители. Действи-
Действительно, матрица А — ХА' невырождена, и мы можем применить тео-
теорему I.
Условия теоремы III, как было показано, необходимы в том слу-
случае, когда матрица А — кА' невырождена и не имеет элементарных
делителей вида (A=tl)e. В этом случае обе матрицы
А-\-А' и А — А'
невырождены. Назовем этот случай простым. Справедлива, таким
образом,
Теорема IV. В случае простой корреляции условия предыдут
щей теоремы необходимы и достаточны.
Заметим, что если п четно, то матрица А — А', будучи косо-
симметрической, вырождена и этот случай не может быть простым.
Мы могли бы расширить понятие простой корреляции, чтобы охва-
охватить и тот случай, когда матрица А — ХА' имеет элементарные
делители (А ± 1)е при условии, что они могут быть объединены
соответствующим образом в пары, но целесообразнее сразу перейти
к приведению к канонической форме корреляции общего вида.
§ 5. Приведение корреляции общего вида
В этом параграфе мы найдем канонический вид корреляции в про-
пространстве [п], не принадлежащей никакой из уже рассмотренных
категорий. Такую корреляцию, которая не является, вообще говоря,
__; S 6. ПРИВЕДЕНИЕ КОРРЕЛЯЦИИ ОБЩЕГО ВИДА 417
полярной, нуль-полярной или простой корреляцией, мы будем назы-
называть корреляцией общего вида. Задачу приведения корреляции
и =:= Ас
к каноническому виду мы рассматриваем как чисто алгебраическую,
используя для ее решения ассоциированную с этой корреляцией били-
билинейную форму У Ах.
Пусть матрицы В и С являются соответственно симметрической
и кососимметрической частями матрицы А, т. е.
В = 1(Л + Л') и С = ±(А-А').
При преобразовании матрицы А в Р'АР матрица В переходит в
\ (Р'АР + Р'А'Р) = Р'ВР,
а матрица С — в-
^ (Р'АР — Р'А'Р) = Р'СР.
Таким образом, наша задача состоит в определении канонического
вида, к которому одновременно могут быть приведены симметриче-
симметрическая и кососимметрическая формы
у'Вх и у'Сх.
Если матрицы В и С обе невырождены, мы имеем рассмотренный
в § 4 простой случай и можем использовать для матрицы А = В-{-С
найденную уже каноническую форму. Если, в обозначениях § 4,
то
у'Вх =^(« + 1)К.У<>*2.-1+.Увв-1*о)+
у'Сх = 1 (а — 1) 10>0*2е-1 — Лв-1*о)+ • • • +СУв-1*в—.УЛ-i
Мы будем обозначать эти выражения соответственно через
27 Зак. 1230- В. Ходж в Д. Пидо
418 гл. ix. корреляций
Если матрица А в канонической форме имеет вид
) 0 ... О
О D9j(«2) ... О
О 0 ... D%^k))
то форма у'Вх равна сумме форм вида р (а, е), отличающихся только
аргументами а, е и неизвестными (у0 Уъе-д< (хо -^e-i)-
Аналогично, форма у'Сх равна сумме форм вида f (а, е). Чтобы вы-
выразить это, мы будем писать
у'Вх = 2 Р (аь ед> у'Сх = 2 7 (я<> ei)~
Используя введенные обозначения, будем считать, что для каждого
P(a»i ei) имеется соответствующее f(ai> e{) с теми же самыми а<
и еь содержащее те же неизвестные и в том же порядке, причем два
члена Р(а<, е^ и р(о^, е3) не содержат одинаковых неизвестных и
точно так же члены f(a«» et) и 7(aj> ej) не содержат одинаковых не-
неизвестных. Результаты § 4 можно теперь сформулировать в виде
следующей теоремы:
Теорема I. Если обе матрицы В и С невырождены, то
симметрическая и кососимметрическая формы у'Вх и у'Сх могут
быть одновременно приведены к каноническому виду 2 Р (а». ед и
2
Мы должны теперь обобщить эту теорему на тот случай, когда
матрица В или матрица С вырождена. Введем пять различных пар
форм:
(I) рл (в) = (yQx2e_t+.У2в_1х0) +
где
00 р8(в) =
Та (*) = (Уох*е -i—Уъе- Iх о) +
+ (Уе-1хе—
§ 5. ПРИВЕДЕНИЕ КОРРЕЛЯЦИИ ОБЩЕГО ВИДА 419
где
р,A) = 0;
(III) р3 (в) =
Тз О) — (УЛ -2 — Уче- 2*l
+ OV^e-B — Уче-ЧХч) + • • • + (Уе-1Хв—УеХе-1).
где
(IV) Р4(в) = (Л*2в
где
(V) рб (е) =
Н-О>1
Тб («) =
Нашей целью является доказательство следующего обобщения
теоремы I:
Теорема II. Если В и С — соответственно симметрическая
и кососимметрическая (п-\-1)У^(п~-\-1)-матрицы, то билинейные
формы у'Вх и у'Сх могут быть одновременно приведены к виду
2 Р (««, ед + 2 Pi (ej) + 2 Ps (e*) + 2 Рз (.4) + 2 Р4 (О + 2
2 if («<, «<) + 2 Ti (ej)+2 Т2 (^)+2 if 8 (ег)+2 т* (в j+2 -Гб (ей)
г j k I m h
при сформулированных выше условиях, наложенных на соответ-
соответственные члены и на входящие в оба выражения неизвестные.
Рассмотрим уравнения
5х = 0, A)
Сх = 0. B)
Пусть они определяют соответственно (гх—1)- и (г2—1)-мерные
линейные подпространства Sri_1 и Srt_lt и пусть эти подпростран-
подпространства пересекаются по некоторому (г0—1)-мерному подпространству
Sro_v Выполним преобразование координат, выбирая новый репер сле-
следующим образом. В подпространстве Sro_t возьмем г0 независимых
27*
420
гл. 1х-
точек Ап_п+1, ..., Ап. В подпространстве Sri_t выберем г*—r0
независимых точек Ап_п+1, .... Лп_»0, а в подпространстве 5,^
еще г2 — г0 независимых точек, не.зависящих от точек Ап_Го+1, ...,
Ап, скажем
Точки ^n-rj-rj+fon ^» линейно независимы и определяют сумму
подпространств Sn_t и 5r,_j. Дополним новый репер, выбирая
п — гх— /-2 —[— /-0 —|— 1 точек пространства [я], не зависящих от уже
выбранных точек, и обозначая их через
Aq, ..., An_Vi_rijrro-
В новой системе координат подпространство
стемой уравнений
ч-i определяется си-
5П_, — системой уравнений
хо= ... =х
и 5г,-:1 — системой уравнений
Х0 =
B)
В этой системе координат форма у'Вх зависит только от неиз-
неизвестных (х0, ..., хп_г), (у0 Уп-г)> а форма у'Сх — только от
неизвестных
xn-ri+l>
Для доказательства теоремы мы произведем несколько преобразова-
преобразований координат, но каждый раз будем следить за тем, чтобы под-
подпространства 5Го_1, 5n_i и Sra_i и в новой системе координат опре-
определялись уравнениями C). Читатель легко докажет, что любое пре-
преобразование координат, обеспечивающее это условие, имеет вид
где
/D О О О'
Е F О О
G О Я О
U- М N ,
а матрицы в первой, второй, третьей и четвертой строках (столб-
(столбцах) имеют соответственно по п — гу—rs + r0 -f-1, г2 — г0, г± — г0
и г0 строк (столбцов).
Доказательство теоремы II проведем индукцией по числу содер-
содержащихся в формах неизвестных х{, yj. Для этой индукции нам будет
удобно наложить на матрицы Р еще одно ограничение, потребовав,
§ 5. ПРИВЕДЕНИЕ КОРРЕЛЯЦИИ ОБЩЕГО ВИДА 421
чтобы элементы матриц F и Н, расположенные выше главной диа-
диагонали, были равны нулю и чтобы было К = ЕГо. Такое преобразова-
преобразование мы будем называть допустимым.
Мы докажем, что формы у'Вх и у'Сх после упомянутого выше
предварительного преобразования могут быть приведены к виду, ука-
указанному в формулировке теоремы II, посредством допустимого пре-
преобразования.
Начнем наше доказательство по индукции с рассмотрения слу-
случая ге=1. Пусть до выполнения какого-либо предварительного пре-
преобразования мы имеем
у'Вх = ауохо + Ъ (уохх+ухх0) + суххх
x = k(yQxt —у±х0).
Нам придется рассмотреть три случая.
(I) Если матрицы В и С невырождены, то ro = гх — г2 = 0. Ника-
Никакого предварительного преобразования не требуется, и каждое невы-
невырожденное преобразование является допустимым. Результат непосред-
непосредственно следует из рассмотрения простого случая, который мы изучали
в§ 4.
(II) Если В = О, С =h 0, то г1 = 2, г0 = га = 0 и форма у'Сх не
меняется существенно при предварительном преобразовании. Допу-
Допустимое преобразование
Но *)*
переводит форму у'Сх в ч2@ и форму у'Вх в f32(l).
Если С = О, В фО, то /-2 = 2, го = г1=1 или г0 = гх = 0. Если
г1=1, то предварительное преобразование приводит форму у'Вх
к виду ауохо, а допустимое преобразование
/о* 0
Но
приводит ее к |38A). Форма.УСл приводится при этом к fs A).
Если /-j = 0, то никакого предварительного преобразования не тре-
требуется и треугольное преобразование, использованное в теореме I § 2,
являющееся в этом случае допустимым, преобразует форму у'Вх
в хоУх~{~х1Уо fT> e> B Pi(l). причем в качестве соответственной формы
можно взять fi(l)l или в ауохо-\-cy±xlt а эту последнюю форму
можно привести посредством некоторого допустимого преобразования
к .Уохо4-.У1Х1- Окончательно мы получаем
(Ill) Охтается рассмотреть только случай, когда матрица С не-
в.ырождена и( следовательно, к отлично от нуля, а матрица В щ-
422 гл-1Х- корреляции
рождена, но отлична от нулевой, так что ас = Ь2. В этом случае
г0 = г2 = 0, гх = 1, и предварительное преобразование приводит
формы у'Вх и у'Сх к виду
dyoxo и
где d и р отличны от нуля. Допустимое преобразование
0 prf-
превращает эти билинейные формы в формы
^о и ''li'o — Vi
вида р4A) и
Мы можем, следовательно, сделать индуктивное предположение,
что теорема II справедлива для пары форм у'Вх и у'Сх, которые
могут быть выражены через неизвестные (у0, ..., ут), (х0, .... хт)
при т < я.
Предварительное преобразовдние приводит формы у'Вх и у'Сх
к виду, содержащему неизвестные (у0 Уп-rJ, (*0 хп-г„),
и не может свести их к меньшему числу неизвестных. В силу ин-
индуктивного предположения, мы можем посредством некоторого до-
допустимого преобразования привести эти формы к каноническому виду,
требуемому в теореме II, если выполнены два условия: 1) г0 > 0 и
2) неизвестные (у0, ..., уп _,.„) и (х0 хп-г0) подверглись некоторому
предварительному преобразованию. Однако на самом деле никакого
предварительного преобразования не требуется, так как в новой
системе координат г'о = О, r[ = rt — г0, г'2 = г2 — г0, и, „если п' =
=» п — г0, то подпространство 5 /_ определяется системой уравнений
х0 = .,. = хп> = 0,
подпространство S / — системой уравнений
хп= . . . —х г i — О
и подпространство 5 / — системой уравнений
х0 = ... = х г г_ I = х I_ I ==...= хпг == 0,
в соответствии с формулами C). Следовательно, допустимое преоб-
преобразование
"И [D о 0>
1 = |? F 0
\О 0
§ S. ПРИВЕДЕНИЕ КОРРЕЛЯЦИИ ОБЩЕГО ВИДА
423
приводит эти билинейные формы от неизвестных (у0, ..., уп-г0),
(х0, .... Jcra_,-0) к требуемому виду. Так как отсюда мы получаем
допустимое преобразование
ID О О О
G О Я О
\0 О О Ег„
неизвестных (у0, ..., уп), (х0, ..., хп), которое также приводит
формы у'Вх и у'Сх к каноническому виду, то наша теорема при
г0 > 0 доказана. Мы можем, следовательно, ограничиться случаем,
когда г0 = 0.
Предположим теперь, что гг > 0. Предварительное преобразова-
преобразование дает
у'Вх = 2
о
то
/с*=2'
п
УСУ/
2
УСУ/
где суммирование 2^ распространяется на значения
о
0, ...,n — r1 — r2; n — r1-j-l,...,n
D)
индексов /, j. Для того чтобы избежать неудобства от введения при
каждом следующем преобразовании новых обозначений для неизвест-
неизвестных, мы будем, если это не может привести к недоразумению, на-
начинать каждый шаг рассуждений опять с неизвестных (х0 хп),
(Уо Уп)-
Используя преобразование § 3 в применении к форме у'Сх, мы
должны рассмотреть только случай (II), в котором не все cin = 0,
так как если с(п = 0 для всех значений i, то, вопреки предположе-
предположению, г0 > 0. Треугольные преобразования, введенные в § 3, допустимы
ввиду отсутствия в форме у'Сх членов Су, для которых либо /, либо j
лежит между п—гг — /+1 и п — rlt включая оба эти значения.
Следовательно, при использовании прежних обозначений наши били-
билинейные формы некоторым допустимым преобразованием приводятся
к виду
/ Сж = S' сц yixi + (УпЧ — Укхц),
424 гл- 1Х- КОРРЕЛЯЦИИ
п-1
где k — один из индексов, выписанных в D), а в сумме 2 опущен
о
индекс k, помимо тех индексов, о которых уже говорилось. Возможны
два случая:
Случай (I): &>я — rv Формы
п-гг п-1
2 hiyixi и 'Я cyy^j
о о
содержат неизвестные
(Хо, . . ., Xk-t, хк+1> • • •, xn-l) и (Уо> • • "> Ук-1> Ук+1 Уп-1)>
для которых
^ = 0, г[ = г^-2, г'2 = г2, п' = п — 2;
мы видим, что эти формы не требуют дальнейшего предварительного
преобразования. В силу индуктивного предположения, эти формы
можно привести посредством некоторого допустимого преобразования
к каноническому виду, и легко видеть, что допустимое преобразова-
преобразование неизвестных (л:0, ..., хк_1г хк+1, ..., хп_^) остается допусти-
допустимым при добавлении к уравнениям преобразования новых уравнений
?й = хк> %п — хп>
поставленных на соответствующие места. Так как
то для случая k > л — гх теорема доказана.
Случай (II):fcO — rt. Так как скпукхп — член преобразуемой
формы УСх, мы должны иметь fe-^л — ri — /. Поскольку преобра-
преобразование координат, переставляющее неизвестные х0, ..., xn-ri-rt и не
меняющее остальных неизвестных xit является допустимым, мы можем
считать, что после соответствующего допустимого преобразования
k = 0. Запишем
/Як = ^4-^0+ 2^Л-^, E)
1
п-1
у'Сх = упХ0 —уохп + 2'
п-1
где сумма 2' берется по значениям
1
1, .... П—Г1 — Г2, Л —Г!-4-1
индексов i, j, и
n—rt n—ri
i= 2 м<. '»i== 2
о ¦ ?
где 2*0 = *ор и Ь^ = Ь^,
§ 5. ПРИВЕДЕНИЕ КОРРЕЛЯЦИИ ОБЩЕГО ВИДА 425
По предположению, ранг матрицы
\
bx bn ?12 ... 01, п-п (б)
\Ьп-г, Ьп-гх,\ Ь„-г1шй ¦ ¦ • bn-r^n-YJ
равен я — гх-\-\. Отсюда следует, что ранг подматрицы
*и ••• *i,»—л
\Ьп-г„1 • ¦ • Ьп-г^п-п
равен я — /\ или я — /"х — 1. Действительно, допустим, что ранг
матрицы G) меньше я — гг — 1. Тогда между строками этой матрицы
должны существовать по крайней мере два различных соотношения
га-г,
2 V>y = o c/=i, .... я —rt)
и
Zj V-i^ij = 0 (/ = 1 ¦ • • • > га —• ri)-
i=l
Если р и а выбраны так, что
2 1 ^^
1 1
то множители
о, Р;
соответственно первой, второй, ... , (я — гх -\- 1)-й строк матрицы (б)
устанавливают между ними некоторую линейную зависимость, и мат-
матрица F), вопреки предположению, оказывается вырожденной.
Случай (На). Предположим, что ранг матрицы G) равен п — гх, и
рассмотрим формы
п-г1 и-1
2 *чУ& и 2'
Для этих форм от неизвестных (хх хп_х), (ух уп_х) мы
имеем
я' —я —2, r[ = r1—\, r'z = rr
Следовательно, никакого предварительного преобразования не требуется
и, по предположению, существует допустимое преобразование, при-
приводящее эти формы к каноническому виду. Уравнения этого п
426 ГЛ. IX. КОРРЕЛЯЦИИ
разования вместе с уравнениями
определяют, очевидно, допустимое преобразование неизвестных
(х0, ..., хп). Однако, прежде чем выполнить это преобразование, мы
сделаем допустимое преобразование
Xq = Xq,
х{ — х{ — с(х0 A=1 я— гг),
х{ = хг (i — n — гг -f-1,...,«)
исходных форм E), чтобы упростить член yot-\-vixo перед выполне-
выполнением описанного выше допустимого преобразования. Мы имеем
i
га—г.
га—
+ 2м
га—г
»•, _ _ га-г,
j biXi — XQ 2± Ь
1
л-с< Л)) (**—*.
у х0) = 2*охо J,
га-п
i
n-r.
уп х0 — у0 хп -
П1 _ __ _ ТО-П-»
' cyyi Xj — Уо 2 с</<
— *<
<> 2
так как л:0 j;0 ^ с^-с^- = 0. В первом выражении мы положили
П —»', 71 —Г, _
^= 2Mi. ^=2btyt.
i i
Далее, так как матрица G) невырождена, мы можем найти такие
константы сх сп-п, что
п-г,
'?1t>ijcj = bi (i= I, .... п — rt).
При этом выражение для формы у'Вх упрощается:
п-г1 _ _ п-гх _ _ _ _ п-г^
2hjyi xj — B bfi)xQy0= py0x0 +
§ S. ПРИВЕДЕНИЕ КОРРЕЛЯЦИИ ОБЩЕГО ВИДА 427
Далее, выполнив допустимое преобразование
x\ = xt (/ = 0, .... /i-l),
А=хп-\- 2
мы получим
n-l
При этом /? не может равняться нулю, так как иначе матрица В
имела бы ранг п — rv а не п — г±-\-\. Следовательно, произведя другое
допустимое преобразование, состоящее в замене р11" х*0 на х*0, мы можем
считать, что р=\. Теперь применим индуктивное предположение к
формам
При этом, как сказано выше, мы получаем некоторое допустимое
преобразование неизвестных (х*, . . ., jc*), (у*, .... у*), которое дает
Так как эти формы окончательно могут быть записаны в виде
у'Вх = р4 A) + 2 Р (««, *,) + S2 Pi (ej).
у'Сх = Т4 A) + 2 Т («*.
то в случае (На) доказательство закончено.
Случай (Нб). Предположим, что ранг матрицы G) равен я—гх—1.
Тогда система уравнений
]S^x, = 0 (t=l, .... и —rt)
»—с,
имеет единственное решение. Для приведения формы 2 Ьцу^х^ к ка-
каноническому виду применим методы § 2. Треугольное преобразование,
определенное в § 2, можно, очевидно, дополнить до допустимого
преобразования неизвестных (х0, ..., хп), (у0,..., уп). Рассмотрим
теперь каноническую (я — гх) X (и — /"^-матрицу, соответствующую
п-г,
приведенной форме 2 ^tjyixj- Так как ранг этой матрицы равен
428 • гл- 'Х- корреляции
п—rt—1, то ясно, что одна из ее строк состоит целиком из нулей.
Это значит, что, при сохранении тех же обозначений, для некоторого
значения А A<!А^я— rt) будут выполняться равенства
[>ih = 0 (/=1 п. — rt),
так что единственным решением выписанной выше системы уравнений
будет
Мы должны рассмотреть два случая: А>я — rt — г2 и А<я—rt—г2.
Случай (Нб^: А>я — гг — г2. Мы имеем в прежних обозначениях
п-г,
У ВХ = yol -j- У]Х0 -f- 2l
= Упх0 — УоХп-\- 2л
1
где в сумме 2* опущено значение Н. Далее поступаем, как в слу-
случае (Ца), делая подстановку
хь — хъ>
л^ —' Х{ \i == n — Г-* —j— i, • • «i <?/•
Это допустимое преобразование; оно дает
га—г, га-г, n-r,
/ п — "~ Г п Х^* ж. i "С* г. Л I XI* ¦ ~ ~
у ljX = Xq yQ [—* л, / \ "i^i ~\ '' "ij i^jl "T~ ?.
11 1
_ _ n—r, _ _ n-r, __ _ n-r,
0 0 1
, _
* b
1
Мы можем найти такие cv ..., ^..j, сЛ+1, •••, cn_ri, что
i
так как матрица коэффициентов этой системы имеет ранг п—rt—1.
Тогда
/Bx = ^Q QttQ+qxj -j- (p^q+q?n) xo + 2*'
^^ i 6. Приведений корреляции 6бщёг6 вида 429
Так как ранг матрицы В равен п—гл -)- 1, то q не может быть равно
нулю. При этом мы имеем
— _ _ _ n1 __ *_ _Яг,~-г, ___ П—г,
У Сх =упх0— у0 хп + 2' СуЛ xj-yo S С</<Я/ — *о 2
П—г,—га
уЛ jyo /Я/ о 2
поскольку я—7-j—г2 < h <[ п—гг Допустимое преобразование
дг'=^ (/ = 0 л —1),
_ п-п-г,
1
не меняет формы /Вх и преобразует форму /Сх в форму
га-1
В качестве окончательного преобразования формы
возьмем
lt = x* (i = 0,..., А—1,
Это допустимое преобразование, в результате которого будем иметь
увх == 7H$й -j- t\hi0 + 2 **/п^,
2
и-1
Сх = f\n% — 'Лоб» + 2'
1
Используя теперь индуктивное предположение, приведем формы
га-r, га-1
и 2'
к каноническому виду посредством некоторого допустимого преобра-
преобразования неизвестных (S^..., &„_1( &„+1 ^.Д (%,..., %_1,
t\h+1 f\n-iO замечая, что никакого предварительного преобразо-
преобразования здесь не требуется. Для этой системы неизвестных
ге' = п — 3, г[ = г1 — 1, г'2 = г2—1.
Преобразование этих неизвестных индуцирует некоторое допустимое
преобразование неизвестных (Ео,..., 5П), A%,.... %). Окончательно
430 f Л. IX. КОРРЕЛЯЦИЙ
мы получаем
у'Вх = yhx0+y0xh + 2 Р (««, «*) + 2 2Р« (*,).
/С* = упх0 —
т. е.
Случай (Пб2): h <[ n — rt — г2. Посредством некоторого допусти-
допустимого преобразования, переставляющего индексы 1 и h, мы в прежних
обозначениях получим
и—г,
у'Вх = _уо? -\- t\x0 4- 2 ЬуУгхз>
2
П-Х
у'Сх == упх0—уохп 4- 2' Ч4У\Х*
1
При исследовании случаев (Па) и (H6j) мы до самого конца не изме-
изменяли формы
и >
а затем приводили их к каноническому виду. В рассматриваемом слу-
случае формы
п—г, п-\
и 2'1
надо привести к каноническому виду уже на этом шаге. Применяя
к этим двум формам индуктивное предположение, возьмем неизвест-
неизвестные в порядке
Х% Xn_ri_rt, Xn_ri_ri^^,. . ., XH_Tl, X^, -^и-ri + i»* " •» ^П—V
Мы видим, что для этих неизвестных
п' = п — 2, r[ = rv r'2 = r2,
и никакого предварительного преобразования не требуется. Кроме
того, допустимое преобразование этих неизвестных индуцирует неко-
некоторое допустимое преобразование неизвестных (х0,..., хп), (у0 уп).
Действительно, все элементы подматрицы Н матрицы допустимого
преобразования, расположенные выше главной диагонали, равны нулю,
и, следовательно, уравнением этого преобразования, поскольку это
касается перемещения неизвестного xlt будет
?i= 2
^ I 5. ПРИВЕДЕНИЕ КОРРЕЛЯЦИИ ОБЩЕГО ВИДА 431
Таким образом, если неизвестное х1 перемещается и добавляются
уравнения
то мы имеем допустимое преобразование неизвестных (л:0,..., хп),
{уо Уп)- ПРИ этом
увх=л5+1*оН-2 Р(««, *<)+2 2 Р«(«Д
уСх*=уях0 — У0*п+2тг(а«.
где Е и t\ содержат те же неизвестные, что и в ранее рассмотрен-
рассмотренном преобразовании, но с другими коэффициентами. Сохраним для
простоты наши прежние обозначения и напишем
п
у'Вх = уо1 + 1\Х0 + 2
п-Х
у'Сх = упх0 —уохп
где формы 2 bijyixj u 2' СцУг*] имеют канонический вид.
Далее мы поступим как в случае (Нб^, полагая /г = 1, и по-
получим
га-г,
2
2
у'Сх = упх0 —уохп + 2'
причем коэффициенты b{j, Сц при этом последнем преобразовании
не меняются. Мы имеем, следовательно,
у'Вх = уохг +У1х0 + 2 Р («„ О + 2 2 ^ (*j).
/Сл: = упх0 —yQxn + 2т («<> «») + 2 2 Т< (^)-
Неизвестные xv y± входят в сумму
но не входят в сумму
Отсюда следует, что неизвестные xv ух входят в некоторый член ^ (ej).
С другой стороны, неизвестные х0, у0, хп, уп не входят ни в одно
из этих двух выражений. Предположим, что хи у± входят в
432 ix ijt. Кбррйляцйй
Соответствующее &(fy) имеет вид
где индексы аи а2, ... отличны от 0, 1, п. Далее, мы можем на-
написать
(Уо*1 +У^о) + (уахаз-\-уа,ха1) + ... = р, (в, -f 1),
где неизвестные ^(е^+1), if< (ejH~ 1) берутся в порядке
хп, хо, Х\, Xul) Хп2,... .
Этим заканчивается доказательство теоремы II для случая гх > 0.
Предположим теперь, что г0 = rt = 0, г2 > 0. В этом случае
исследование проводится почти так же, как при ri > 0, и мы только
укажем, в чем состоит отличие. После предварительного преобразо-
преобразования имеем
п п-гг
у'Вх = 2 btiytxit y'Cx = 2
о и
Можно предположить, что не все bin = 0, так как в противном слу-
случае непосредственно применялось бы индуктивное предположение.
Следовательно, допустимое преобразование, введенное в § 2, дает
либо
ТО-1
у'Вх= 2 b{jyixi~\-kynxn (кфО)
о
либо
га-1
и
И
п-г,
^'CJC = 2 CyytXj.
о
В первом случае допустимое преобразование
Xi = xt (/ = 0,..., и—1)
позволяет считать k = 1 и, применяя индуктивное предположение
к формам
ТО—1 И—>а
2
2 syij
о о
§ в. КАНОНИЧЕСКИЕ ВИДЫ КОРРЕЛЯЦИЙ 433
получить окончательно
Рассмотрим теперь вторую возможность.
Случай (I): &>л-—/. Здесь поступаем точно так же, как
в случае (I), рассмотренном выше, меняя ролями матрицы В и С.
Мы получим, что
2!
Случай (II). Если А <[ я — г2, то перестановка индексов 0 и А;
является допустимым преобразованием, и мы имеем
га-1
у'Вх = 2j buyiX; -\- (ynx0
i
n-r,
у'Сх = 2,
о
Рассмотренные выше при гх > 0 методы применимы, если поменять
ролями матрицы В и С, однако, поскольку матрица С кососимметрична
и, следовательно, всегда четного ранга, здесь возможен только слу-
случай (Нб). Случай A1бх) дает нам
у'Вх = 2 Р К «i) + 22 Р, (ej) + рв A),
Случай (Нб2) приводит к результату в точности такому же, как
в рассмотренном выше случае (Пб2).
Наконец, при /-0 = га = г2 = 0 мы имеем простой случай, к кото-
которому применим метод § 4.
§ 6. Канонические виды корреляций
После приведения форм у'Вх и у'Сх к каноническому виду
i = 1 j=1
ь 8i
расположим содержащиеся в них неизвестные более удобно, так,
чтобы 2et неизвестными, входящими в $(«{, е{) и ч(аи е{), были
28 Зак. 1230. В. Ходж и Д. Пидо
434
Гл. ix.
Уг, (et+.. ¦ + e(_1) У г. (ег+.. . + е()-1-
Расположим затем неизвестные, входящие в р< (ej) и 7< (^), так, чтобы
их индексы превышали индексы неизвестных в $а(еь), "(а(еь), если
а < i или если а = i, но ^ < у. Рассмотрим теперь матрицу А = S -\- С.
Мы имеем, очевидно,
A)
о
где диагональные подматрицы определяются следующим образом.
Матрица De(a) определена в доказательстве теоремы III § 4. Это
2еХ2е-матрица, причем для матрицы De(a) — A.De(a) элементарными
делителями служат (А — а)" и (А — а)" при а =?0 и Xе
Ft(e)(i= I,..., 5) есть матрица билинейной формы
при а = 0.
Легко доказать, что матрицы F{(e) имеют вид:
(I)
1
1 —1
1 — 1
1 —1
1
1 1
1 1
1 1
Уже использованные раньше методы вычисления элементарных
делителей показывают, что элементарными делителями матрицы
§ 6. КАНОНИЧЕСКИЕ ВИДЫ КОРРЕЛЯЦИЙ
435
являются (Л — 1)е и (к— 1)е.
(Н)
— 1
— 1 1
1
1 1
1 1
1 1
— 1 1
— 1 1
Элементарными делителями матрицы F2(e)— \Ff2(e) служат (Х-|- 1)в
и(Х+1)в.
1
1 1
1 1
(III) FA(e) =
1 — 1
1 —1
1 1
Единственным элементарным делителем матрицы Fs(e) — Хга(е)
является (X — IJ8.
(IV) FA (e) =
— 1
-1 1
1
— 1
— 1 1
1 1
1
1
1 \
1 1
1
28*
43E
Гл. 1х. Корреляций
Элементарным делителем матрицы F4(e)— kFi(e) служит (Х + 1J".
Наконец,
(V)
1
1 —1
1
1 —1
0
]
: 1
1 1
: 1 1
1 1
1
ранг Bе-\- \)Х.Bе-\- 1)-матрицы F6(e) — kF'6(e) (где А—неизвестное)
равен 2е.
Далее, если матрица А — АЛ' при неизвестном А невырождена, то
на диагонали матрицы A) нет ни нулевых матриц, ни матриц вида Fb(e).
Мы можем теперь сформулировать теорему III § 4 в ее полной
форме так:
Теорема I. Необходимые и достаточные условия существова-
существования такой матрицы А, чтобы матрица А — АЛ' была невыро-
невырожденной и имела наперед заданные элементарные делители, со-
состоят в следующем:
(I) элементарные делители, отличные от делителей вида
Xе, (X—\f,(X-^-\f, могут быть объединены в пары вида (А—а^/',
(X - «Г1/';
(И) число элементарных делителей вида (X—l/ при данном
четном f четно;
(III) число элементарных делителей вида (X + 1/ при данном
нечетном g четно;
(IV) если заданными элементарными делителями являются
k\..., k\ (X-l/1 (X-l/b, (X + l/1 (X+l/Ч (А-в1)\
- «гх)\
то
Необходимость этих условий является непосредственным следствием
теории приведения к каноническому виду и полученных выше резуль-
результатов, позволяющих определить элементарные делители различных
§ 6. КАНОНИЧЕСКИЕ ВИДЫ КОРРЕЛЯЦИЙ 437
подматриц канонической матрицы A). Достаточность этих условий
очевидна, так как мы можем построить матрицу А вида A), объединив
элементарные делители соответствующим образом в пары.
Каноническая форма A) может быть несколько упрощена. Заметим,
что матрица Fx (е) — X F[ (e) имеет те же самые элементарные дели-
делители (А—1)в, (к — 1)", что и ?>еA). Следовательно, в силу тео-
теоремы I § 4, существует такая невырожденная матрица Р, что
В силу аналогичных соображений, мы можем найти такие невырожден-
невырожденные матрицы Q, R и S, что
И
V О F4(e)
Следовательно, мы можем предполагать, что после соответствующего
преобразования координат матрица A) не содержит подматриц вида
Fx(e) или F2(e) и что при заданных /,-, gt имеется, самое большее,
одно Fs(e) и одно F4(e). В дальнейшем мы будем считать, что такое
преобразование уже выполнено.
Рассмотрим теперь тот случай, когда матрица А—АЛ' при не-
неизвестном А оказывается вырожденной. В канонической форме мат-
матрицы Л число нулевых строк (и столбцов) равно г0> если ранг матрицы
равен п — rQ -j- I, и, следовательно, ранг матрицы
ГА
также равен п — r0 -j- 1. Этот ранг не меняется при преобразованиях
координат, так как
/ Р'АР \ /Р'АР\ /А\
\{P'AP)')\P'A'PjaP'\ArJP'
Если матрица А имеет канонический вид и содержит k подматриц Fb{e),
то ранг матрицы А — \А' есть п — г0 -|- 1 — k. Следовательно, k также
является инвариантом матрицы А. Докажем теперь, что число е-],
появляющееся в подматрице F6(eui) и определяющее число членов
438 х гл. ix. корреляции
формы у'Ах, соответствующих каждой подматрице /^(ej), также яв-
является инвариантом матрицы А. При этом мы предположим, что k > 0.
Рассмотрим линейные комбинации строк матрицы
(А — \А')х.
Положим
п-г„
Ъ = 2 (ач — Xajt)xj (i = 0, .... п — /•„).
Эти линейные формы связаны k независимыми соотношениями, скажем
причем мы можем считать, что dj(X)—многочлены от А. Среди все-
всевозможных соотношений вида B) рассмотрим те, в которых макси-
максимальная степень А в многочленах dQ dn^To наименьшая. Пусть
этот наименьший максимум равен тх, и предположим, что имеется qt
соотношений B) этой степени, скажем
?i. • • • • V
Рассмотрим теперь все соотношения B), не являющиеся соотношениями
вида
1
и среди них снова выделим соотношения наименьшей степени. Пусть
эта степень есть т2. Если
— базис для системы таких многочленов, то рассмотрим соотношения B)
наименьшей степени, не представимые в виде
и т. д. Мы получим некоторую систему многочленов
образующих базис для соотношений B). Докажем, что целые числа
Ч\, •••. 9f> mi wp инвариантны относительно допустимых пре-
преобразований координат. Если
х=Рх
— такое преобразование, то соотношение
§ 6. КАНОНИЧЕСКИЕ ВИДЫ КОРРЕЛЯЦИЙ 439
переходит в
где
Q = (?«) = ?
Так как элементы q{j принадлежат полю К, то степень любого
соотношения не меняется при допустимом преобразовании. Это и
доказывает инвариантность чисел qu ..., q?, m1 mf. Мы будем
связывать эти числа с^,
В канонической матрице A) единственными подматрицами О, для
которых матрица О — XG' вырождена, являются k матриц Ръ(<ф. Так
как все эти подматрицы расположены на главной диагонали матрицы А,
то мы. получаем соотношения B) только из матриц F6(ty, причем
каждой матрице соответствует одно соотношение. Пусть строки и
столбцы матрицы F5(tf) соответствуют неизвестным
Тогда
-1 — \1 л) хю+е+1 "Т"(* "Т" ) •
Соотношением наименьшей степени, связывающим многочлены
». •••» Хт + Ы, СЛУЖИТ
ф, е A + А)%, - A + АN A-Х) Хда+1 -
* ' = О,
и соотношения tylt . . ., фл образуют базис множества соотношений B).
Мы получаем, что если е* < е\ <...<; «*, то
2< | р (^ ),
и, следовательно, целые числа е^, ...., е5к являются инвариантами
матрицы А ртносительно допустимых преобразований координат,
440 ГЛ. IX. КОРРЕЛЯЦИИ
Суммируем полученные результаты:
Теорема II. Пусть А — произвольная (п-\-I) X (п-\-1)-мат-
рица, ранг матрицы (А, А') равен п — г-\-1, ранг матрицы А — кА'
равен п — г—)— 1 — kt и пусть
<W Ък
— некоторый базис системы многочленов наименьшей степени,
встречающихся в левых частях соотношений, связывающих строки
матрацы (А — кА') х. Далее, пусть степень многочлена ty< равна
mit причем
. = ng < . . . = /ttgp = nf (qe = k).
Элементарными делителями матрицы А — кА' пусть будут
(Я-а,), (Х-аГ1) (Х-«Л (Х-^^Ч
«< может равняться ±1 м Д < /2 < ... < Д, g^ < g-a <... < ^с.
+ / 2 +
й существует такая невырожденная матрица Р, что корреляция
и = Ах переводится в корреляцию чз — Ву посредством преобразо-
преобразования х = Ру. Здесь
о
= k и нулевая матрица имеет г строк и столбцов,
§ 7. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА КОРРЕЛЯЦИЙ
441
§ 7. Некоторые геометрические свойства корреляций
Начнем с простой корреляции (§ 4)
и = Ах,
A)
которая была определена как такая корреляция, для которой обе
матрицы А-\-А' и А — А' невырождены. Канонический вид такой
корреляции определяется уравнением A), в котором
D«r@)
Точка х не имеет образа, если она содержится в подпространстве,
определяемом уравнением
Ах = 0. B)
Вспоминая, что Д,(а) есть 2е X 2е-матрица
а
а 1
а 1
а
1 0
1 0
1 0
заключаем, что подпространство, определяемое уравнением B), по-
порождается вершинами
репера и, следовательно, (г — 1)-мерно. Это подпространство можно
назвать фундаментальным подпространством корреляции, соответ-
соответствующим нулевому собственному значению матрицы А — \А'. Ана-
Аналогичное рассмотрение показывает, что образом произвольной точки
(имеющей образ) является гиперплоскость, проходящая через подпро-
подпространство, порождаемое вершинами
442 гл- 'X. КОРРЕЛЯЦИИ
Это подпространство также (г—1)-мерно; как легко видеть, оно
определяется системой уравнений
А'х = 0. C)
Его можно рассматривать как фундаментальное подпространство, со-
соответствующее бесконечному собственному значению матрицы А — КА'.
Заметим, что подпространства, определяемые уравнениями B) и C),
не пересекаются.
Подпространство, определяемое уравнением
{A — а{А')х = 0,
где at — собственное значение матрицы А — АЛ', называется фунда-
фундаментальным подпространством корреляции, соответствующим собствен-
собственному значению <х$. Учитывая, что дуальной корреляцией является
v = A'y, D)
мы видим, что точка х тогда и только тогда имеет один и тот же
образ при корреляциях A) и D), когда она содержится в фунда-
фундаментальном подпространстве, соответствующем некоторому собствен-
собственному значению матрицы А — \А'. Рассмотрим подпространство, опре-
определяемое уравнением
(A-aLA')x = 0,
и предположим, что
0 ф at = <х2 = . . . = at
и
ai Фа, (i>t).
Мы видим, что это подпространство является подпространством St_t,
определяемым вершинами
Корреляция A) преобразует его точки в гиперплоскости, проходящие
через подпространство Sn_t, определяемое системой уравнений
!==0' АГ»Пв+2Д+Д1:ж=0 Xs
Подпространство Sn_t содержит 8г_и а также каждое фундамен-
фундаментальное подпространство, соответствующее собственному значению
матрицы А — \А', отличному от af1. Фундаментальным подпростран-
подпространством, соответствующим af1, является подпространство St-i, по-
порождаемое вершинами
Следовательно, Sn_t и 5^_i пересекаются по подпространству, поро-
порождаемому вершинами
§ 7. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА КОРРЕЛЯЦИЙ ' 443
где числа /t, /2, ..., ft' предполагаются расположенными так, что
/< + 1> /<+2> • • •» Л 5* 1-
Обратимся теперь к корреляции общего вида, которую мы изу-
изучали в § 6. В рассмотренном выше простом случае исключались
собственные значения, равные =Ы. Здесь они появляются. Однако
прежде чем находить фундаментальное подпространство, соответ-
соответствующее собственному значению X = 1, заметим, что при изучении
геометрических свойств произвольной корреляции нам приходилось
рассматривать некоторые геометрические места.
(I) Геометрическое место точек, содержащихся в своих образах,
при корреляции A). Это точки, координаты которых х = (х0 хп)
удовлетворяют уравнению
х'а = х'Ах = 0.
Последнее уравнение можно также записать в виде
(х'АхУ = х'А'х = 0,
или
х'Вх = 0, E)
где В = ^ (А -+- А') — симметрическая часть матрицы А.
(II) Геометрическое место точек, имеющих один и тот же образ
при корреляциях A) и D). Это точки, удовлетворяющие уравнению
(А — «А')х = 0, F)
где а — произвольное собственное значение матрицы А — кА'. Это
геометрическое место было рассмотрено в простом случае. Если х—
произвольное решение системы уравнений F), то
х'Ах = ах'А'х = ах'Ах.
Таким образом, при а ф 1
х'Ах = 0,
и, следовательно, каждая точка, содержащаяся в фундаментальном
подпространстве, соответствующем собственному значению а ф 1,
удовлетворяет системе уравнений E).
Предположим, что матрица А задана в канонической форме, вве-
введенной в § 6, и допустим, что в уравнениях F) а = 1. Тогда
Сх = 0, G)
где С — кососимметрическая часть матрицы А. При решении этой
Систему уравнений ,м.ы замечаем, что Те-И только те.подматрицы Q
444
ГЛ. IX. КОРРЕЛЯЦИИ
матрицы А дают ненулевые координаты, для которых матрица G—G'
вырождена. Такими подматрицами являются
De{\), Fs(e), F6(e).
Следовательно, достаточно рассмотреть случай, в котором
ei A)
I О,
Непосредственным вычислением устанавливается, что базис мно-
множества решений системы уравнений G) образует вершины
Х0> Хе> Х2в,' Х2е,+е,' '"' Я(е, + ...±е,„ , +«.. (^'
точек).
v
(с точек),
Xn
Точка Р = 2 ^%Хг, где суммирование распространяется на индексы,
содержащиеся в приведенной таблице, принадлежит геометрическому
месту точек
х'Ах^ ~
в том и только в том случае, если
aijxix) =
2J
где
2
и /t= ... =/d/=
= О,
Корреляция может быть вырожденной по нескольким причинам.
Рассматривая каноническую форму, мы видим, что матрица Л будет
вырожденной в одном из следующих случаев:
(I) если на главной диагонали имеются нулевые матрицы;
(II) если на главной диагонали имеются подматрицы De@);
(III) если имеются подматрицы Fb{e);
(IV) если выполняется некоторая комбинация условий (I), (II) и (Ш).
§ 1. ГЁометричЁскИЁ свойства корреляций 445
Если корреляция вырождена из-за того, что выполняется только
условие (I), мы будем называть ее корреляцией первого рода. Если
она вырождена из-за того, что выполнены только условия (II) и (III),
мы будем называть ее корреляцией второго рода.
Если корреляция вырождена ввиду условия (I) самого по себе
или ввиду условия (IV), то ее канонической формой будет
о
где Ах — такая (ли -J- 1) X (w Ч~ 1)-матрица, для которой корреляция
и = Atx (8)
в подпространстве Sm, определяемом системой уравнений
...=*„ = О,
либо невырождена, либо вырождена только вследствие приведенных
выше условий (II) и (III). Если Sn_m_1 — подпространство, опреде-
определяемое системой уравнений
х — — у — о
то одна из точек этого подпространства не имеет образа при задан-
заданной корреляции в пространстве [я], но образ любой другой точки,
если он существует, проходит через подпространство Sn_m_l. Полу-
Получаем следующее представление заданной корреляции в простран-
пространстве [л]. Если Р есть произвольная точка, не содержащаяся в Sn_m_x,
то проектируем точку Р из подпространства Sn_m_1 в точку Р'
подпространства Sm. Пусть П' — образ точки Р' при корреляции (8)
в подпространстве Sm и П — гиперплоскость, содержащая П' и Sn_m_v
Тогда П является образом точки Р при заданной корреляции в про-
пространстве [я].
Из этого результата следует, что геометрия произвольной корре-
корреляции в пространстве [я] может быть выведена из геометрии неко-
некоторой корреляции второго рода. Свойства вырожденной корреляции
второго рода проще всего изучать, показав, что такая корреляция
может быть представлена в виде произведения невырожденной кол-
линеации (такого типа, который геометрически особенно прост)
и корреляции (в том же самом пространстве) первого рода. Мы
сделаем это ниже. Таким образом, свойства вырожденных корреля-
корреляций зависят от свойств невырожденных корреляций в некотором под-
подпространстве.
Пусть
а = Ах
— некоторая корреляция второго рода. Предположим, что А — ма-
матрица канонического вида, причем для упрощения обозначений опустим
446 Гл- и. корреляций
подматрицы De(a)(a^0), Fs(e), /=». Пусть D6i@),.... Ое<@)—
диагональные подматрицы, соответствующие собственному значению
к = 0, и
^etei) ^5 tec)
— диагональные подматрицы вида F&(e). Подпространство точек, не
имеющих образа в этой корреляции, определяется уравнением
Непосредственным вычислением находим, что это подпространстве)
есть подпространство St+C_1, порождаемое t точками
и с точками, координаты которых имеют вид
(О, 0 О, 1, 1 1, 0 0).
Каждая из этих с точек получается из некоторой подматрицы F6(g(),
число ненулевых координат равно ?<-{-1, а их положение соответ-
соответствует положению первых gf-\- l строк подматрицы Fb (g{) ма-
матрицы А.
Далее, все гиперплоскости, соответствующие точкам простран-
пространства [я], имеющим образы, проходят через подпространство S?+C_i ,
порождаемое t точками
и с точками
@, 0 0, 1, -1, 1, -^1 ±1, 0 0).
Здесь также каждая из этих с точек получается из некоторой под-
подматрицы /^(gj), число ненулевых координат, которые имеют чере-
чередующиеся знаки, равно gt -f-1, а их положение соответствует поло-
положению первых gi-\-l строк подматрицы F6(g{) матрицы А. Это
подпространство St+e-i определяется, очевидно, системой уравнений
А'х = 0.
Непосредственно доказывается, что подпространства St+C_1 и St+e-x
не пересекаются. Это следует также из того, что если системы
уравнений
Ах = 0 и А'х = 0
имеют общее решение, то целое число г0, введенное на стр. 437
при исследовании канонического вида матрицы, отлично от нуля и,
следовательно, на главной диагонали матрицы А имеются нулевые
§ t. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА КОРРЕЛЯЦИЙ 44?
матрицы. Это противоречит нашему предположению о том, что эта
корреляция второго рода.
При рассмотрении точек, имеющих в дуальной корреляции те же
самые образы, что и в заданной корреляции, мы должны ограни-
ограничиться только подматрицами вида Fb(gj) ^(Sc). так как ма*
трица De @) — Ше @) при к ф 0 невырождена. Система уравнений
имеет решение для каждого значения X. Мы видим, что все такие
решения содержатся в подпространстве
Х0 == Х1 == • • • == ЛГ2(е1+... +et)-l ~ •
2 е+^+1 = ¦ • • = Х2 °
A0)
где
Рассмотрим коллинеацию
= 0 «„—I), A1.2)
где в равенствах (П-0 индекс / изменяется так, что эти уравнения
содержат все остальные координаты. Эта коллинеация, очевидно,
инволютивна. Если мы представим ее в матричной форме
у = Сх, A1)
то будем иметь
С* = ?.«•¦
Эта коллинеация преобразует подпространство Sc+t_1 в 5c+f_i
и оставляет инвариантным пространство, определяемое системой урав-
уравнений A0). Рассмотрим теперь корреляцию
и = АСу. A2)
448 f л. IX. КОРРЕЛЯЦИИ
Так как
« — (АС) (Сх) = АСу = Ах,
то заданная корреляция второго рода представима в виде произве-
произведения невырожденной коллинеации A1) и корреляции A2). Покажем,
что корреляция A2) — первого рода. Действительно, прямым пере-
перемножением этих матриц убеждаемся в том, что матрица АС симме-
симметрична и, следовательно, преобразование A2) должно быть корре-
корреляцией первого рода. Вершиной гиперплоскостей и в корреляции A2)
служит подпространство S'e+t~i, так как в силу того, что матрица С
невырождена, решение системы уравнений
(АС)'у = О
является решением системы уравнений
А'у = 0.
В заключение сделаем несколько замечаний о невырожденных кор-
корреляциях. Их проще всего рассматривать при помощи ассоциирован-
ассоциированной коллинеации
у = ААх. A3)
Точки, прямые, ... , имеющие один и тот же образ при корреляции A)
и дуальной корреляции, будут неподвижными точками, прямыми, ...
коллинеации A3). Поэтому для их получения мы можем использовать
методы, введенные в гл. VIII. Напомним доказанную в § 4 теорему
о том, что элементарные делители матрицы А А — А.?я+], которые
являются элементарными делителями матрицы А — \А', не могут вы-
выбираться произвольно, так как если к = a (a^hrtl) есть собствен-
собственное значение, то А = а~1— также собственное значение. Применение
теоремы V § 3 гл. VIII дает нам интересный геометрический результат.'
Пусть х — произвольная точка пространства [я], не являющаяся не-
неподвижной точкой, и у — ее образ при коллинеации A3). Прямая ху
пересекает все фундаментальные подпространства коллинеации A3).
Точкой пересечения ее с фундаментальным подпространством, соот-
соответствующим собственному значению а, будет
Ал=у — ах.
Мы видим, что точки
находятся в инволюции. Если А = ± 1— собственные значения этой
коллинеации, то Ах и А_%—неподвижные точки инволюции.
Как мы уже видели, корреляция а = Ах, где А — невырожденная
матрица, определяет некоторое преобразование
v = Av A4)
§ 7. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА КОРРЕЛЯЦИЙ 449
гиперплоскостей в точки. Действительно, если точка х лежит в гипер-
гиперплоскости v, то гиперплоскость и проходит через точку у, где
и'у = х'А'у = x'v.
Мы могли бы построить аналогичную теорию корреляций, преобра-
преобразующих гиперплоскости в точки, но в действительности это та же
самая корреляция и —Ах. В частности, коллинеацией, ассоциирован'
ной с корреляцией A4), является
•w == ААо,
и так как
(А А) = А А,
то это есть дуальная форма коллинеации A3).
Наконец, в связи с теорией корреляций представляют интерес
некоторые факты из элементарной теории квадратичных форм. Если
гиперплоскость и, являющаяся образом точки х, содержит точку л;,
то эта точка удовлетворяет уравнению
х'и = х'Ах = О,
или
х'Вх = Ъ, A5)
где
Геометрическое место точек, определяемых уравнению A5), мы на-
назовем квадратичной гиперповерхностью, соответствующей корреля-
корреляции а = Ах. Аналогично, гиперплоскости v, которые содержат свои
образы при корреляции A4), удовлетворяют уравнению
0, ' A6)
Мы видим, что
B = ArDA.
Предположим, что корреляция и = Ах, будучи невырожденной, такова,
что матрицы В и D также невырождены. Точечное уравнение геоме-
геометрического места A6) имеет вид
Для того чтобы оно совпало с геометрическим местом самосопряжен-
самосопряженных точек A5), мы должны иметь
ft/)-1 = В,
29 Зак. 1230. В. Ходж н Д. Пндо
450 гл.- ix. корреляции
где k — некоторый элемент поля К. Определим простые невырожден-
невырожденные корреляции, для которых „огибающая" геометрических мест A6)
дуальна к геометрическому месту A5).
Сформулированные условия можно записать в виде
или -
А А + (ДЛ)-1 = 2 B* - 1) Ёп+\.
Положим
Наше последнее условие приведется к
Следовательно, так как УфХЕп+^ то минимальным многочленом
матрицы Y будет (см. § 10 гл. 11)
^ (Л) = Л2 — 2 Bfe — 1) х -|- 1.
В силу теоремы III § 10 гл. II, <^(к) является последним инвариантным
множителем матрицы Y— кЕп+1, и, следовательно, все ее инвариант-
инвариантные множители служат делителями $(к). Рассмотрим следующие воз-
возможности.
(I) 2k—li^rtl. Если а и а-1 — корни многочлена ty(k), то ни
один из этих корней не равен d= 1. Как было отмечено в § 4, эле-
элементарные делители матрицы У—ЬЕп+1 можно объединить в пары
вида (к— а)е', (А — а-1/3'. Так как произведение всех элементарных
делителей имеет степень п-\-1, то отсюда следует, что число п-\- 1
четно. Наконец, так как последний инвариантный множитель равен
просто (X — а) (к — а), то элементарными делителями матрицы
Y—кЕп+1 являются (к-|-Л)/2 элементарных делителей к — а и
столько же элементарных делителей к — а-1. Таким образом, матри-
матрица А может быть приведена к виду
где в обычных обозначениях
Обратно, легко доказать, что если матрица А имеет такой вид с про-
произвольным а, отличным от 0, -)-1 и -—1, то
§ 7. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА..КОРРЕЛЯЦИЙ
451
где
4а
(II) 2k— 1 = 1. Минимальным многочленом является теперь (к—IJ,
и все элементарные делители матрицы Y — kEnvl имеют вид к—-1
или (А — IJ. Так как, в силу теоремы I § 6, существует четное
число элементарных делителей последнего типа, то матрица А может
быть приведена к виду
/ F (О\
где [см. § 6, (I)]
Мы снова можем доказать, что матрица А, представимая в таком
виде, удовлетворяет всем нашим требованиям.
(Ill) 2k— 1 =— 1. Минимальным многочленом является (A.-J-1J,
и А. = — 1 — собственное значение матрицы Y. Отсюда следует, что
матрица
5=4 (Л + ЛО,
вопреки предположению, оказывается вырожденной.
29*
БИБЛИОГРАФИЧЕСКИЕ ЗАМЕЧАНИЯ
ЧАСТЬ I
Значительная часть материала гл. I—IV может быть найдена в книгах,
посвященных современной алгебре, таких, как книги Алберта [1], Диксона [5],
Маколея [9] и ван-дер-Вардена [10]. Насколько нам известно, изложение
линейной зависимости над некоммутативным телом является новым, и алге-
алгебраическая теория якобианов, построенная в § 7 гл. III, прежде не публи-
публиковалась. В гл. IV мы предпочли использовать термин результантные
формы вместо термина формы инерции, являющегося буквальным пере-
переводом немецкого термина Trugheitsformen.
часть и
Глава V. Изложенный нами метод определения проективного простран-
пространства был использован Лефшецем [8] для случая коммутативного тела и во-
восходит к Веблену и Уайтхеду [llj. Проведенное здесь исследование для
случая некоммутативного тела прежде не публиковалось.
Глава VI. Имеется много работ, посвященных аксиоматическим построе-
построениям проективной геометрии. Полное перечисление этих работ можно найти
в статье Энрнкеса [6] и у Бэкера [2]. Использованные нами методы напо-
напоминают методы Веблена и Юнга [12], но отличаются от них выбором перво-
первоначальных аксиом и введением координатных систем до наложения ограни-
ограничений на тело, из которого берутся координаты. Это оказалось возможным
благодаря изложению в гл. II теории линейной зависимости над некоммута-
некоммутативным телом.
Глава VII. Использование координат линейных подпространств восходит
к Грассману и было развито Плюккером в линейной геометрии. Ссылки на это
имеются в статье Сегре [7]; изложение этого вопроса приведено также
у Бертини [3]. Свойства определителей, являющихся грассмановыми коорди-
координатами, играют важную роль в алгебраической теории инвариантов. Теорема
о базисе из § 7 была впервые доказана Мертенсом. Наше доказательство
аналогично доказательству, предложенному Вейтценбеком [Pros. К. Acad. We-
tensch. Amsterdam, XXXIX A936), 503].
Глава VIII. Геометрическая теория коллинеаций была построена Сегре.
Для справок см. Сегре [7]. Ознакомиться с вопросом можно также у Бер-
Бертини [3]. Изложение в настоящей книге более алгебраично, чем у кого-либо
из этих авторов.
Глава IX. Данное нами описание корреляций, основанное на одновре-
одновременном рассмотрении симметрической и кососимметрической билинейных
форм, берет начало в исследовании двух квадратичных форм, проведенном
Ьромвичем [4], работа которого опирается на результаты Кронекера. Что
касается геометрической стороны вопроса, то здесь необходимо сослаться
на Сегре [7].
БИБЛИОГРАФИЯ
1. Albert A. A., Modern Higher Algebra, Cambridge, 1938.
2. Baker H. F., Principles of Geometry, vol. I, Cambridge, 1922.
3. В e r t i n i E., Geometrla Proiettiva degli Iperspazi, Messina, 1923.
БИБЛИОГРАФИЯ 453
4. В г о m w i с h Т. J. ГА., Quadratic Forms and their Classifica ion by means
of Invariant Factors, Cambridge, 1906.
5. D i с к s о n L. E. .Modern Algebraic Theories, Chicago, 1926.
6. Ency. der Math. Wissenschaften, III, А, В 1, F. Enriques.
7. Ency. der Math. Wissetischaffen, III, С 7, С. Segre.
8. Lef schetz S., Lectures on Algebraic Geometry, Princeton, 1937.
9. M а с a u 1 а у F. S., Algebraic Theory of Modular Systems, Cambridge , 1916.
10. Ван-дер-Варден, Современная алгебра, тт. I и II, М.-Л., 1947-
11. Веблен О. иУайтхед Дж., Основания дифференциальной геометрии,
М., 1949.
12. Veblen О., Young J. W., Projective Geometry, vol. I, Boston, 1910.
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
Аб.елева (или коммутативная) груп-
группа 11
Аддитивная группа 11
Алгебраическая точка проективного
пространства 196
— функция 118
Алгебраически зависимые и незави-
независимые элементы 119
— замкнутое поле 124
Алгебраический базис расширения 119
— элемент 113
Алгебраическое дополнение элемента
определителя 88
— замыкание поля 124
— — пространства 291
— расширение 117
Алгоритм деления 33
Ассоциативный закон 10
Ассоциированные матрицы 308
— системы координат 203
Базис линейной системы 55
— подпространства 199, 226
— расширения 116
Билинейная форма 386
Билинейное соответствие 386
Бинарные формы 160
Вектор 58
Векторное пространство 58
Вершина звезды неподвижных ги-
гиперплоскостей коллинеации 358
—¦ полярной корреляции 396
Взаимно однозначное соответствие 18
Вполне приводимый многочлен 123
Вырожденная коллипеация 359
— матрица 82
Вырожденное проективное преобразо-
преобразование 341
Гармонически сопряженные пары пря-
прямых 248
точек 248
точки 244
Геометрии конечные 222
Гиперплоскость 229
Гомология 376
— инволютивная 376
Грань симплекса 229
Грассмановы координаты 306
Группа 10
— абелева 11
— аддитивная 11
— знакопеременная 13
— некоммутативная 11
— симметрическая 13
Делитель единицы (или регулярный
элемент) 21, 36
— многочлена 33
— нуля правый и левый 21
Диагональ четырехугольника 262
Диагональные точки четырехуголь-
четырехугольника 262
Дистрибутивный закон 14
Дифференцирование алгебраических
функций 139
— многочленов 130
Допустимая система координат 194
Допустимое преобразование базиса
пространства 70
Дуальная корреляция 386
Дуальное преобразование 342
Дуальные грассмановы координаты
310
— подпространства 205
Единица группы 12
— кольца 16, 20
Единичный идеал 20
Закон композиции 10
— сложения 14
— умножения 14
Звезда неподвижных гиперплоскостей
коллинеации 358
Знакопеременная группа 13
Идеал единичный 20
— левый 19
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
455
Идеал несобственный 20
— правый 19
— результантных форм 182
— собственный 20
Изоморфизм колец 18
— обратный 191
Инвариантные множители матрицы
103
Инверсный изоморфизм 191
Инвариант поляряой корреляции 394
Инволютивиая гомология 376
Иноолютивное преобразование 372
Инволюция 372
Инцидентности свойства 202
Инцидентностиое пространство 229
Каноническая форма X-матрицы 99
матрицы 70
преобразования 342
Квадратичная гиперповерхность кор-
корреляции 449
Квадратичные ^-соотношения 331
Квадратная матрица 65
Кватернионы 50
Классы эквивалентных элементов 18
Клетка матрицы 63
Коллинеарные точки 209
Коллинеация 346
— ассоциированная с данной корре-
корреляцией, 387
— вырожденная 359
— невырожденная 353
— неспециальная 356
— специальная 356
— циклическая 372
Кольцо 14
— без характеристики 22
— коэффициентов уравнения 159
—- многочленов 27
Коммутативная (или абелева) груп-
группа 11 .„
Конечные геометрии 222
Координаты грассмановы 306
— точки в заданной шкале 277-
относительно репера 279
Корень (или нуль) многочлена 126
Корреляция 385
— второго рода 445
— нульполярная 387
— первого рода 445
— полярная 387
— .простая 416
Кососимметрическая матрица 97
Коэффициенты многочлена 28
Кратное 33, 37
Левостороннее проективное простран-
пространство 192
Левосторонние и правосторонние век-
векторы (л-векторы) 58
Левый идеал 19
Линейная зависимость в Р?(К) 196
— система (левосторонняя, право-
правосторонняя) 51, 52, 53
Линейное й-мерное подпространство
199
Линейно зависимые и независимые
элементы 53
Линейный комплекс 402
— ряд 233
X-матрица 98
Матрица 14, 59
— вырожденная 82
— квадратная 65
— косооимметрическая 97
— присоединенная 92
— регулярная 65
— симметрическая 97, 387
— типа р X Я 59
— транспонированная 77
— характеристическая 106
— Якоби 145
Матрицы ассоциированные 308 ;
Минимальный алгебраический ба-
базис расширения 120
— базис линейной системы 56
- расширения 116
— многочлен матрицы 108
Минор 85
Многочлен 28
Множитель 35, 36
Наибольший общий делитель много-
многочленов 34
Невырожденная коллипеация 353
Невырожденное проективное преоб-
преобразование 341
Независимые неизвестные 116
Неизвестное 27
Некоммутативная группа 11
Неподвижные прямые коллинеации
368
— точки коллинеации 353
Неприводимый многочлен 35
Несобственный идеал 20 :
Неспециальная коллннёация 356
Нечетная подстановка 13
Нуль аддитивной группы 12'¦• ¦'
— кольца 15
— (или корень) многочлена 126
Нуль-полярная корреляция 387
Область с однозначным разложе-
разложением 38
— целостности 21
456
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
Образ пространства 344
Обратная А-матрица 98
Обратный элемент 12
Общее ^-мерное подпространство 384
Однородный многочлен (или форма)
152
Однородное уравнение 152
Определитель 85
Особое подпространство 344
Особые точки коллинеации 341
корреляции 383
Перенос на прямой 377
Пересечение линейных подпространств
206
Перспективность (или перспективное
соответствие) 234
Перспективные ряды точек 234
— треугольники 209
Подгруппа 13
Подкольцо 18
Подматрица 63
Подобие коллинеаций 347
Подпространство линейное ^-мерное
199
Подстановка 10
Поле 21
— алгебраически замкнутое 124
— алгебраических функций 118
— коэффициентов уравнения 159
— разложения многочлена 125
— рациональных функций 48
— частных 26
Полное разложение 37
Полярная корреляция 387
Полярные векторы 80
р-соотношения квадратичные 331
Правостороннее проективное про-
пространство 194
числовое пространство 192
Правый идеал 19
Преобразование инволютивное 372
— треугольное 389
Приведение общей корреляции к ка-
каноническому виду 416
Примитивный многочлен 43
— элемент расширения 139
Принцип двойственности для проек-
проективного пространства 207
Присоединение неизвестного 29
— элемента к полю 114
Присоединенная матрица 92
Проективное преобразование 193
вырожденное 341
¦— пространство числовое 192
— соответствие 235
Проективно связанные (или проектив-
проективные) ряды точек 234
Проективно тождественные простран-
пространства 203
Проекция линейного подпространства
326
Произведение матриц 62
— проективных преобразований 193
Производная многочлена 131
Простая корреляция 416
Простое алгебраическое расширение
112
— трансцендентное расширение 115
Простой элемент 35, 37
Пространства проективно тождествен-
тождественные 203
Пространство векторное 58
— инцидентностное 229
— проективное числовое 194
— решение системы однородных
уравнений 79
Противоположный элемент 12
Пучок прямых 233
Размерность линейной системы 56,57
— проективного пространства 192
— (или степень трансцендентности)
расширения 121
Ранг построчный (постолбцовый)
матрицы 71, 77
— преобразования 342
Расширение кольца 19
— конечной степени 116
— пространства 194
Рациональная точка проективного
пространства 196
Регулярная матрица 165
Регулярный элемент (или делитель
единицы) 21, 36
Результант двух бинарных форм 192
— системы однородных уравнений
185
Результатная форма 181
Результантов система для системы
однородных уравнений 170
Репер 198
Решение системы однородных урав-
уравнений 79
/¦-«ратные пространства 224
Ряд точек (или линейный ряд) 233
Ряды "точек проективно связанные
234
Самосопряженные точки 388
Связанные системы координат 300
Сечение четырехугольника 263
Символ Кронекера 65
— Сегре 370
Симметрическая группа 13
— матрица 97
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
457
Симметрические функции 127
Симплекс 229
Сложение точек на прямой 271
Собственные значения матрицы 106
Собственный делитель многочлена 33
— идеал 20
Соотношение эквивалентности 18
Сопряженные подпространства (отно-
(относительно полярной корреляции) 397
— точки (относительно полярной кор-
корреляции) 388
Специализация многочлена 30
Специальные коллинеации 356
Специальный случай (конечной гео-
геометрии) 247
Степень многочлена 28
— трансцендентности ,(или размер-
размерность) расширения 121
Строка координат 194
Сумма линейных подпространств 206,
228
— матриц 61
Тело 21
— геометрии 276
— кватернионов 50
Теорема Дезарга 208
— Гильберта о базисе 154
о корнях 179
— Лапласа 86
— об остатке 33
— о замене 56
— Паппа 219
— Тэйлора 134
— Якоби 93
Точечная тройка 262
Точка проективного пространства 192
Транспозиция 13
Транспонированная матрица 77
Трансцендентная точка проективного
пространства 196
Трансцендентный элемент 113
Треугольная тройка 262
Треугольное преобразование 389
Тривиальное разложение 37
Умножение точек на прямой 272
Умножения закон 14
Уравнение с неопределенными коэф-
коэффициентами 159
«-результант 185
Форма (или однородный многочлен)
152
— билинейная 386
— бинарная 160 '
Фундаментальное подпространство
коллинеации 355
—¦ — корреляции 441
Функция алгебраическая 118
— целая симметрическая 127
Характеристика кольца 22
Характеристическая матрица 106
Характеристические числа матрицы
106
Характеристический многочлен ма-
матрицы 106
элемента 114
Характеристическое уравнение ма-
матрицы 106
Целая симметрическая функция 127
Циклическая коллииеация 372
Частная производная многочлена 132
Четная подстановка 13
Четырехугольник 262
Числовое проективное пространство
194
Шкала на прямой 271
Шкальная координатная система 300
Эквивалентности соотношение 18
Эквивалентные А-матрицы 99
— простые элементы 39
— разложения элемента 38
— расширения 113
— справа (слева) (я + 1)-строки 192
Элемент алгебраический 113
Элементарные делители коллинеации
353
— — X-матрицы 103
— преобразования X-матрицы 99
матрицы 73 ¦
симметрические функции 127
Элементы алгебраически зависимые
и независимые 119
Якобиан 145
СОКРАЩЕННЫЕ ОБОЗНАЧЕНИЯ
1{х] 28
I[xlt ...,xr] 30
К(х) 48
K(xv...,Xr) 48
[«!,...,«„] 60
8у 65
е*»---*„ и в^ ...<и 84
Гл | 85
К[1] 114
К (?) 114
... У 115
Г) 192
Г) 192
194
[я], Sn 194
Рг (ЛГ) 196
ОГЛАВЛЕНИЕ
Предисловие редактора перевода
Из предисловия авторов
Стр
3
5
ЧАСТЬ I
АЛГЕБРАИЧЕСКОЕ ВВЕДЕНИЕ
Глава I. кольца и тела 9
§ 1. Группы 9
§ 2. Кольца • 14
§ 3. Классификация колец 20
§ 4. Поле частных области целостности 23
§ 5. Кольцо многочленов 27
§ 6. Алгоритм деления 32
§ 7. Разложение на множители в области целостности .... 36
§ 8. Разложение на множители в кольце многочленов .... 42
§ 9. Примеры тел 46
Глава //. линейная алгебра, матрицы, определители ...... 51
§ 1. Линейная зависимость 51
2. Матрицы 59
3. Квадратные матрицы 65
4. Преобразования матрицы 69
5. Ранг матрицы 76
6. Однородные линейные уравнения 79
7. Матрицы над полем 82
8. Определители , . . 84
9. ^-матрицы 98
10. Несколько теорем 106
Глава ///. алгебраическая зависимость . . . . ПО
§ 1. Простые алгебраические расширения ПО
§ 2. Расширения поля 113
3. Расширения конечной степени 116
4. Разложение многочленов на множители 123
5. Дифференцирование многочленов 130
6. Примитивные элементы алгебраических расширений . . . . 137
7. Дифференцирование алгебраических функций 139
8. Несколько полезных теорем 147
Глава IV. алгебраические уравнения 151
§ 1. Введение 151
§ 2. Теорема Гильберта о базисе 154
§ 3. Результант двух бинарных форм 159
§ 4. Некоторые свойства результанта 164
§ 5. Результант системы бинарных форм 169
460 ОГЛАВЛЕНИЕ
§ 6. Система результантов для системы однородных уравнений
с несколькими неизвестными 172
§ 7. Неоднородные уравнения с несколькими неизвестными . . 175
§ 8. Теорема Гильберта о корнях 179
§ 9. Идеал результантных форм 180
§ 10. «-результант системы уравнений • 185
ЧАСТЬ II
ПРОЕКТИВНОЕ ПРОСТРАНСТВО
Глава V. АЛГЕБРАИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ПРОЕКТИВНОГО ПРОСТРАН-
ПРОСТРАНСТВА - 191
§ 1. Введение 191
§ 2. Числовое проективное пространство 192
§ 3. Проективное пространство размерности п 194
§ 4. Линейная зависимость в Ргп(К) 196
§ 5. Уравнения линейных подпространств. Двойственность . . 203
§ 6. Теорема Дезарга 208
§ 7. Основные построения 214
§ 8. Условие коммутативности тела. Теорема Паппа 219
§ 9. Некоторые конечные геометрии 222
§ 10. г-кратные пространства 224
Глава VI. синтетическое определение проективного простран-
пространства 225
§ 1. Свойства инцидентности 225
§ 2. Теорема Дезарга 230
§ 3. Проективно связанные линейные ряды • . . 233
§ 4. Гармоническая сопряженность 241
§ 5. Две проективно инвариантные конструкции 248
§ 6. Репер 263
§ 7. Алгебра точек на прямой 271
§ 8. Представление инцидентностиого пространства в виде про-
пространства Ргп{К) 276
§ 9. Ограничения на геометрию 289
§ 10. Следствия из предположения о справедливости теоремы
Паппа 291
Глава VII. грассмановы координаты 303
§ 1. Линейные подпространства 303
§ 2. Грассмановы координаты 305
§ 3. Дуальные грассмановы координаты 309
§ 4. Элементарные свойства грассмановых координат 315
§ 5. Некоторые теоремы о пересечениях и суммах 322
§ 6. Квадратичные /^-соотношения 328
§ 7. Теорема о базисе 334
Глава VIII. коллинеации 341
§ 1. Проективные преобразования 341
§ 2. Коллинеации 346
§ 3. Неподвижные точки и гиперплоскости невырожденной кол-
коллинеации 352
§ 4. Неподвижные ^-мерные подпространства невырожденной
коллинеации 364
ОГЛАВЛЕНИЕ 461
§ 5. Циклические коллинеации 372
§ 6. Некоторые частные виды коллинеации 374
§ 7. Вырожденные коллинеации • 378
Глава IX. корреляции 383
§ 1. Корреляции 383
§ 2. Полярные корреляции ' 388
§ 3. Нуль-полярные корреляции 399
§ 4. Простые корреляции 411
§ 5. Приведение корреляции общего вида 416
§ 6. Канонические виды корреляций 433
§ 7. Некоторые геометрические свойства корреляций 441
Библиографические замечания 452
Библиография 452
Алфавитный указатель 454
Сокращенные обозначения 458
В. Ходж и Д. Пидо
МЕТОДЫ АЛГЕБРАИЧЕСКОЙ ГЕОМЕТРИИ
Том I
Редактор М..С. АГРАНОВИЧ
Технический редактор Б. И. Корнилов
Художник Я. Л. Линии
Корректор Я. Я. Максимова
Сдано в производство 4/Ш 1954 г.
Подписано к печати 2/VI 1954 I-.
А-04151. Бумага 60Х92'/„=14,5 бум. л.
29 печ. л.
Уч.-изд. л. 25,4. Изд. № 1/2Ш.
Цена 19 р. 75 к. Зак. 1230.
Иадательство иностранной литературы
Москва, Ново-Алексеевская, 52
4-я типография им. Евг. Соколовой
Союзполиграфпрома Главиздата
Министерства культуры СССР.
Ленинград, Измайловский пр., 29.
КНИГИ ПО МАТЕМАТИКЕ,
выпущенные
ИЗДАТЕЛЬСТВОМ ИНОСТРАННОЙ ЛИТЕРАТУРЫ
Уокер Р., Алгебраические кривые. Перевод с английского,
236 стр., ц. 11 руб. 85 коп.
Лефшец С, Алгебраическая топология. Перевод с англий-
английского, 503 стр., ц. 26 руб. 80 копч
В ей ль А.. Интегрирование в топологических группах. Пе-
Перевод с французского, 222 стр., ц. 9 руб. 50 коп.
Картан Э. Геометрия групп Ли и симметрические про-
пространства (сборник статей). Перевод с французского,
384 стр., ц. 18 руб.
Картан Э. Теория спиноров. Перевод с французского,
223 стр., ц. 10 руб. 40 коп.
3 и г е л ь К. Автоморфные функции нескольких комплексных
переменных. Перевод с английского, 167 стр., ц. 9 руб.
Книги продаются в книжных магазинах и киосках Книго-
Книготорга и других книготорговых организаций, высылаются поч-
почтой наложенным платежом без задатка всеми отделами „Книга —
почтой" областных, краевых и республиканских отделений Кни-
Книготоргов.
ЗАМЕЧЕННЫЕ ОПЕЧАТКИ
Стр.
147
264
264
Строка
17 сн.
фиг. 28
2 сн.
Напечатано
Следует читать
1 ^\ \
\dxj J
Зак. 1230.