Текст
                    В. М. Мануйлов
Курс лекций по
линейной алгебре и геометрии
Механико-математический факультет
1-й курс, 2-й семестр
поток механиков


1 Линейные пространства 1.1 Линейное (векторное) пространство Определение 1.1.1 Множество V называется линейным (векторным) пространством над некоторым полем К , если заданы операция + сложения двух элементов множества V и операция умножения • элементов множества V на элементы поля К, которые удовлетворяют следующим условиям (аксиомам): (1 (ii (iii (iv (v (vi (vii (viii a -\-b = b + a Va, b G V, (a + b) + с = a + (b + c) Va, 6, с £ У, 30 G У : a + 0 = a Va G У, Va G У 3(-a) : a + (-a) = 0, A • (a + 6) = A • a + A • b Va, 6 G У, VA G K, (A + /i) • a = A • a + /i • a Va G У, VA, /iGK, A • (/i • a) = (A/i) • a Va G V, VA, /i G K, 1 • a = a Va G ТЛ Первые 4 свойства определяют на У структуру абелевой группы, а последние 4 свойства — структуру алгебры над полем К. Элементы множества V обычно называются векторами, а элементы поля К — скалярами или числами. Обычно мы будем опускать знак умножения •. Свойства линейного пространства: fi) нулевой элемент в множестве V определен однозначно, (и) для любого элемента обратный элемент определен однозначно, (ш) 0 -а = 0 Va G V, (iv) А-0 = 0 VA G К, (v) (-а) = (-1) • аМа G У, (vij если А • а = 0, то либо А = 0, либо а = 0. Доказательство. fi) если 0' — другой нулевой элемент, то 0 = 0 + (У = (У. (и) если Ъ + a = 0, то ( — а) = ( — а) + 0 = ( — а) + Ъ + а = ( — а) -\- а -\-Ъ — 0 + 6 = Ь. (ш) 0 = а-\-[ — а) — 1а+( —а) = (1 + 0)а+( — а) = 1а + 0а+( — а) = а + 0а+( — а) = а+( — а) + 0а = 0+ Оа = Оа. (iv) если А = 0, то равенство 0-0=0 доказано в предыдущем пункте; если А ф 0, то a + Aa = AA_1a + АО = A(A_1a + 0) = A(A_1a) = a, и АО = 0 следует из единственности нулевого элемента. а+( — 1)а = 1а+( —1)а = (1 + ( —1))а = Оа = 0, поэтому ( — 1)а = ( — а) в силу единственности обратного элемента. (vij пусть А • a = 0; если А ф 0, то a = A_1Aa = А_10 = 0. Примеры линейных пространств: 2
(i) множество, состоящее из одного элемента {0} является линейным пространством над любым полем, (ii) множество векторов на прямой, на плоскости, в пространстве, (ш) наборы из п чисел, V — {ai,... , ап : щ £ К}, где сложение и умножение на скаляры определяется покомпонетно, (iv) множество К^ [t] — множество многочленов степени не выше п с коэффициентами из поля К от переменной £, (v) множество функций F{x), определенных на некотором произвольном множестве X, со значениям в множестве К, (vi) множество решений однородной системы линейных уравнений, (vii) R является линейным пространством над полем Q, (viii) С является линейным пространством над полем R. Определение 1.1.2 Пусть дано линейное пространство V. Линейной функцией (линейным функционалом) называют отображение / : V —>■ К, обладающее свойствами: f(a-\-b) = f(a)-\-f(b) и f(Xa) = A/(a) Va, b £ V, A £ K. (ix) множество линейных функционалов является линейным пространством (оно называется двойственным пространством к V). Определение 1.1.3 Пусть дано линейное пространство W, его непустое подмножество V С W называется подпространством, если оно замкнуто относительно операций, определенных в пространстве W, т.е., если выполнены следующие свойства: 1) а + Ъе V Va,6G V, 2) Ха е V Ма е V, А е К. Лемма 1.1.4 Подпространство V линейного пространства W само является линейным пространством над тем же полем и с теми же операциями, что и W. Доказательство. Все условия определения линейного пространства выполнены, т.к. все элементы V являются элементами W, а для элементов W они выполнены по определению. • Примеры подпространств. Пусть пространство W — это множество векторов на плоскости, тогда следующие множества будут подпространствами: 1) {о}, 2) множество всех векторов, коллинеарных некоторому заданному вектору, 3) само пространство W. 1.2 Аффинное пространство Определение 1.2.1 Аффинным пространством называется тройка (Л, У,+), состоящая из множества Л, векторного пространства V и операции сложения + : Л X V —>■ Л, (т.е. складывать можно элемент множества Л с элементом векторного пространства, при этом в результате получается элемент множества Л), которая удовлетворяет следующим свойствам: 1) для любых А, В G Л существует единственный вектор v £ У, такой что В = А + и; 2) А + 0 = А для любого А £ Л, где 0 — нулевой вектор; 3) (А + v) + w = А + (v + w) для любых А £ Л, г?, w £ V. 3
В обозначении аффинного пространства часто опускают знак плюс и пишут просто (Л, V). Также, если из контекста понятно, какое пространство V имеется в виду, то и его не указывают и говорят об аффинном пространстве А. Элементы аффинного пространства (или множества А) называют точками. Любая пара точек А, В £ А однозначно определяет вектор v равенством В = А + v (свойство 1) и такой вектор обозначается АВ. Примеры: 1) А — это обычная плоскость, V — двумерное векторное пространство векторов плоскости, И приложение вектора к точке. 2) Рассмотрим систему линейных уравнений АХ = £?, где А — матрица, X, В — столбцы. Пусть А — множество решений этой системы, V — множество решений соотвтетсвующей однородной системы АХ = 0, -\ суммирование столбцов. Если Хв £ А и Xq £ У, то Хв + Xq £ А. 3) Возьмем какое-нибудь векторное пространство У, в качестве А возьмем его же, -\ операция сложения в этом векторном пространстве. Последний пример показывает, что имеется естественное соответствие между векторными и аффинными пространствами, и теория аффинных пространств полностью параллельна теории векторных пространств, поэтому в дальнейшем мы ограничимся только случаем векторных пространств, постоянно помня, что все результаты могут быть сформулированы в терминах точек и векторов аффинного пространства. Отождествляя Л и У, мы будем иногда называть элементы векторного пространства точками. 1.3 Факторпространство Определение 1.3.1 Пусть дано линейное пространство W, его элемент а £ W и его подпространство V С W. Линейным подмногообразием называется множество всех векторов вида а + и, где v £ V. Для линейных подмногообразий удобно пользоваться обозначением а + V. Лемма 1.3.2 Линейное подмногообразие a-\-V является линейным подпространством пространства W тогда и только тогда, когда а £ У. Доказательство. 1) если а £ У, тоа + У = 0 + Т/ = У (совпадают как множества). 2) пусть а + V является подпространством. Т.к. а £ а + У, то 2а £ а + У, что равносильно существованию некоторого Ъ £ У, такого что 2а = а + 6, но тогда получаем, что а — 6, т.е. а£ V. Лемма 1.3.3 а\ + V — а2 + V <^=^> а\ — а2 £ V. Доказательство. =^>: пусть а\ + V — а2 + V, тогда а\ £ а\ + V — а2 + V, значит, найдется такой вектор Ъ £ У, что а\ — а2 + fr, т.е. а\ — а2 £ V. <^=: пусть ai — а2 £ У, т.е. а\ — а2 — v £ V. Возьмем произвольный элемент Ъ £ а\ + У. Тогда 6 = ai + Ъ' для какого-то вектора £/ £ V. Покажем, что Ъ £ а2 + V. Действительно, 5 = (ц + £/ = a2 + (v + &'), причем v + £/ £ У. Определение 1.3.4 Фактор-пространством W/V линейного пространства W по, подпространству V называется множество {а + V : а £ И^} — множество всех линейных подмногообразий пространства W, заданных подпространством У, с определенными на нем операциями сложения, (а + V) + (6 + У) := (а + 6) + У, и умножения на скаляры, А(а + У) := Аа + V. Лемма 1.3.5 Факторпространство линейного пространства само является линейным пространством. 4
Доказательство. 1) Сначала докажем, что введенные нами в факторпространстве операции корректны, т.е. какие бы мы ни брали элементы подмногообразий в качестве а и Ь, мы получим одно и то же подмногообразие. Докажем это для сложения (для умножения доказывается аналогично): если а\ + V — <22 + У, Ь\ + V — &2 + V то а\ — <22 = v Е У, Ь\ — &2 = w £ V, поэтому [а\ -\- Ъ\) -\- V — (<^2 + b2 + v-\-w)-\-V = (g&2 + Ьг) + (^ + w) + ^ = (а2 + ^2) + ^Л т-е- сложение определено корректно. 2) Проверим свойства линейного пространства. Ввиду простоты ограничимся проверкой одного из восьми свойств, например 5). X((a + V) + {b + V)) = А((а + 6) + У) = А(а + 6) + У = = (Ла + ЛЬ) + V = (Ла + У) + (ЛЬ + V) = = Л(а + У) + Л(Ь+У). 1.4 Линейная зависимость векторов Определение 1.4.1 Пусть дано линейное пространство V и некоторая система (множество) векторов {v{ : г Е /} С V этого пространства. Если множество индексов / (а, значит, и система векторов) конечно (/ = {1,... , тг}), их линейной комбинацией называется выражение вида Ai^i + ... + \nvn, где Х{ — это числа (скаляры) из поля К. Если множество / бесконечно, линейной комбинацией бесконечной системы векторов называется выражение аналогичного вида, Х^'е/^'иЬ в котором лишь конечное число скаляров Х{ отлично от нуля. Определение 1.4.2 Линейной оболочкой системы векторов линейного пространства называется множество всех векторов, являющихся их линейной комбинацией. Линейная оболочка системы векторов ei,... , еп часто обозначается (ei,... , еп). Определение 1.4.3 Система векторов {щ : г Е /} называется линейно зависимой, если существуют числа Лг-, не все равные нулю, такие, что X^ei ^iai = 0, в противном случае система векторов называется линейно независимой. Лемма 1.4.4 Если система векторов {а{ : г Е /} линейно зависима, то один из них является линейной комбинацией остальных. Доказательство. Пусть Х\а\ + ... + Л&а& = 0, причем существует Х{ ф 0, тогда имеем Лг-аг- = —Х\а\ — ... — Лг-_1аг-_1 — \{+\о,{+\ — .. .Л&а&, умножив обе части этого равенства на Л~ , получим, что а,{ есть линейная комбинация остальных векторов. Лемма 1.4.5 Если система векторов ai,... , ап линейно независима, а система векторов ai,... , an, an+i линейно зависима, то ап+\ является линейной комбинацией векторов ai,... , ап. Доказательство, аналогично доказательству предыдущей леммы, с тем лишь замечанием, что если Лп+1 = 0, то ненулевой коэффициент Х{ находится среди первых п скаляров, но тогда первые п векторов линейно зависимы, что противоречит предположению. Лемма 1.4.6 Пусть дана линейно независимая система векторов ei,... , еп и пусть существует линейно независимая система векторов /i,... , fm Е (ei,... , еп), тогда т ^ п. 5
Доказательство. Пусть fi = ацв\ + ... + аг-пеп, а^ Е К, г — 1,... , т. Т.к. /i,... , fm — линейно независимая система векторов, то xifi + ... + xmfm = 0 <=> xi = ... = хт = 0. (1) Подставляя в линейную комбинацию из (1) выражение fi через ei,... , еп, получаем: 0 = xi(anei + .. .ainen) + ... + хш[ашХех + ... + атпеп) = = (xian + ... + xmami)ei + ... + (xi<Lin + ... + хтатп)еп, что равносильно (т.к. ei,... , еп — линейно независимая система векторов) системе уравнений: Г zian + .. . + хтат1 = 0 v %1&1п i • • • i %т&тп — U. Если т > п, то эта система имеет ненулевое решение, что противоречит (1). 1.5 Размерность Определение 1.5.1 Определим ранг системы векторов: пусть S - непустая система векторов в некотором линейном пространстве V, тогда: 1) если S состоит только из 0 Е V, то ранг r(S) := 0; 2) пусть е\ — произвольный ненулевой вектор из системы S\ если существует такой вектор 62, что система {ei,^} будет линейно независимой, то рассмотрим эту систему векторов; если, далее, существует такой вектор ез, что система {^1,62,63} будет линейно независимой, то будем рассматривать эту систему векторов, и т.д.; За) если процедура в п.2) закончится на конечном шаге, т.е. мы дойдем до линейно независимой системы векторов {ei,... , еп} и далее уже нельзя будет найти вектор en+i, чтобы расширить эту систему, то определим ранг как r(S) := щ 36) если процедура в п.2) не закончится на конечном шаге, то ранг r(S) := ос. Докажем, что наше определение корректно. Сначала предположим, что, действуя, как в п.2), двумя способами, мы получили две конечные системы векторов ei,... , еп и /i,... , /ш, и пусть т ф п. Тогда без ограничения общности можно считать, что т > п. Но, т.к. по определению к системе векторов ei,... , еп больше нельзя добавить ни одного вектора, то все fi Е (ei,... , еп), г — 1,... , т, и по лемме 1.4.6 имеем т ^ п. Получили противоречие. Теперь предположим, что один способ нам дал конечную систему векторов ei,... , еп, а второй способ выбора векторов /i,/2? • • • не заканчивается ни на каком конечном шаге. Но тогда система векторов /i,...,/n+i линейно независима, и еще одно применение леммы 1.4.6 дает противоречие. Определение 1.5.2 Размерность линейного пространства V равна dim У := r(V). Пространство V называется конечномерным, если dim V < ос. В противном случае пространство называется бесконечномерным. Примеры бесконечномерных векторных пространств: множество R над полем Q, пространство непрерывных функций на отрезке (докажите). Определение 1.5.3 Система линейно независимых векторов в пространстве V называется максимальной, если при добавлении любого другого вектора система векторов становится линейно зависимой. Следствие 1.5.4 В любом конечномерном пространстве существует максимальная система векторов. 6
Определение 1.5.5 Максимальная система векторов называется базисом пространства. Бесконечномерные пространства мы почти не будем рассматривать в нашем курсе и все следующие определения, леммы и теоремы относятся к случаю конечномерных пространств. Полезным упражнением является проверка истинности таких утверждений в бесконечномерном случае (иногда сложно даже переформулировать конечномерные утверждения) Лемма 1.5.6 Пусть дано подпространство V некоторого векторного пространства W, и пусть ei,... , ег — базис в V. Тогда его можно дополнить до базиса всего пространства. Доказательство. Т.к. ei,... , ег — базис, то эти векторы линейно независимы; тогда, просто проделав процедуру п.2) в определении ранга системы векторов, мы получим базис всего пространства. Лемма 1.5.7 Если V — подпространство векторного пространства W, то dim У <С dim W. Если же dim V = dim W, то V = W. Доказательство. Из предыдущей леммы следует, что количество векторов в базисе подпространства не превышает количества векторов в базисе всего пространства, отсюда вытекает первое утверждение леммы. Докажем второе утверждение. Пусть V ф W, т.е. существует вектор w Е W, w £ V. Выберем базис ei,... , ег в V. Тогда система векторов ei,... ,er,w будет линейно независимой в W, что невозможно, т.к. dim W — г. Действительно, если Ai^i +... + Xrer + Xv = О и хотя бы один из коэффициентов не равен нулю, то А ф 0 (противоречие с тем, что ei,... , ег — базис в У), но тогда вектор w есть линейная комбинация векторов ei,... , ег, что противоречит предположению. • Замечание: второе утверждение леммы неверно в бесконечномерном случае. Теорема 1.5.8 Пусть V — подпространство векторного пространства W, тогда dim V + dim W/V = dim W. Доказательство. Пусть dim V = r, dim W = п. Выберем произвольный базис ei,... , ег в V и дополним его до базиса ei,... , er, er+i,... , еп в W. Докажем, что er+i + У,... , еп + V будет базисом в W/V. 1) докажем линейную независимость этой системы векторов в W/V. Пусть они линейно зависимы, тогда существуют не все равные нулю Ar+i,... , Хп Е К, т.ч. Аг+1(ег+1 + V) + ... + Хп(еп + V) = 0 + V. Раскрыв скобки, получим (Ar+ier+i + ... + Хпеп) + V — 0 + У, поэтому существует такой вектор v Е У^ что v = Ar+ier+i + ... + Хпеп. Но, поскольку v Е У^ его можно представить в виде v = Ai^i + ... + Xrer. Тогда получаем, что Ai^i + ... + Xrer — Ar+ier+i — ... — Хпеп — 0, то есть, система векторов ei,... , еп линейно зависима, что неверно, так как это базис в W. 2) Докажем теперь, что любой вектор из W/V является линейной комбинацией векторов er+i + У,... , еп + V. Возьмем произвольный вектор а + V из фактор-пространства W/V. Т.к. а Е W, то а — Х\е\ + ... + Xrer + Ar+ier+i + ... + Хпеп. Тогда а + V = Aiei + ... + Xrer +Ar+ier+i + ... + Хпеп + V = 4 v ' ev = Ar+ier+i + ... + Xnen + V = Ar+i(er+i + V) + ... + Xn(en + V), Таким образом, er+i + У,... , en + V является базисом в W/V и, следовательно, dim W/V — n — r. Отсюда вытекает утверждение теоремы. 7
1.6 Пересечение и сумма подпространств Лемма 1.6.1 Пусть даны два линейных подпространства V\ и V2 пространства W, тогда V\ П V2 также является линейным подпространством. Доказательство. Для доказательство необходимо проверить, что множество V\ П V2 замкнуто относительно операций сложения и умножения на скаляры. Т.к. множества V\ и V2 замкнуты относительно этих операций, то \/ж, у G V\ П V2, VA G К получаем, что х + у, Хх G V\ и ж + у, Аж G Vi, следовательно, х + у, Аж G Vi П V2. • Замечание. В отличие от пересечения, объединение подпространств V\ U V2 в общем случае не будет линейным подпространством. Например, если V\ — (л/2), a V2 — (v3) над полем Q, то вектор л/2 + л/3 не будет принадлежать V\ U V2. Определение 1.6.2 Суммой V\ + V2 подпространств V\ и V2 называется множество всех векторов v G W, которые можно представить в виде суммы v — v\ + г?2? гДе ^i G Vi и t>2 G V2, т.е. Vi + y2 = (ViUy2}. Лемма 1.6.3 Для любых двух подпространств V\ и V2 их сумма V\ + V2 также будет линейным пространством. Доказательство. Возьмем произвольные векторы а, Ъ G V\ + V2, а = ai + а2, & = &i + &25 ai, 61 G Vi,a2,&2 G V2. Тогда a+fr = (<2i+&i) + (<22+^2) G V1+V2. Аналогично доказывается, что для A G К, a G V1+V2, их произведение Ха G V1+V2. Очевидно, что все условия определения линейного пространства будут выполнены, следовательно V\ + V2 является линейным пространством. Теорема 1.6.4 dim Vi + dim V2 = dim(Vi + V2) +dim(Vi П V2). Доказательство. Пусть ei,... , er — базис в V\ П V2, dim(Vi П V2) = r. Т.к. Vi П V2 С Vi и Vi П V2 С V2, то этот базис можно дополнить до базисов в V\ и V2. Пусть еь... ,er,er+b... , ег+р — базис в Vb dim Vi = г + р; еь... ,er,er+p+b... , er+p+g — базис в V2, dim Vi = г + q. Докажем, что ei,... , er, er+i,... , er+p, er+p+i,... , er+p+g — базис в V! + V2: 1) (линейная независимость). Пусть Ai^i + ... + Ar+p+ger+p+g = 0, тогда Ai^i + ... + Xrer + Ar+ier+i + ... + Xr+per+p = 4 v ' — —(^r+p+ier+p+i + • • • + Ar+p+ger+p+g) = г?, 4 v ' GV2 следовательно, и G V\ П V2, и его можно разложить по базису, v — а\ + ... + сегег, тогда О = и — v = ai + ... + arer + Ar+p+ier+p+i + ... + Ar+p+ger+p+g, следовательно Ar+p+i = ... = Ar+p+g = 0 и a\ — ... = ar = 0, т.к. ei,... , er, er +1,... , er+p+q линейно независимы. Поэтому v = 0. Но тогда и = Ai^i + ... + Xrer + Ar+ier+i + ... + Ar+per+p = 0, и из линейной независимости системы векторов ei,... ,er,er+i,... , er+p заключаем, что Ai = ... = Ar = Ar+i = ... = Ar+p = 0. Итак, все X{ = 0, i = 1,... , r + £> + g, следовательно ei,... , er, er_|_i,... , er+p, er+p+i,... , er+p+g линейно независимы. 2) (максимальность). Возьмем произвольный вектор a G Vi + V2, а — а\ + <22, где ai G Vi, <22 G V2. Разложим векторы а\ и а2 по базисам, ai — Ai^i + ... + Xrer + Ar+ier+i + ... + Ar+per+p, a2 — f^iei + • • • + /irer + /ir+p+ier+p+i + ... + /ir+p+ger+p+g, 8
тогда а = (Ai + ^i)ei + ... + (Лг + /ir)er + Ar+ier+i + ... + Ar+per+p + I /-V+p+1 ^r+p+1 I • • • i f^r-\-p-\-q^r-\-p-\-q •> следовательно система векторов ei,... ,er,er+i,... , er+p, er+p+i,... , er+p+g является базисом в Mi + M2, значит, dim(Vi + V2) = г +£>+ g, откуда следует утверждение теоремы. 1.7 Прямая сумма подпространств. Внешняя прямая сумма Определение 1.7.1 Сумма подпространств V\ + V2 называется прямой суммой (обозначение У10У2),если yinV2 = {0}. Следствие 1.7.2 dim(Vi 0 V2) = dim Vi + dim V2. Доказательство. Утверждение следствия очевидно вытекает из предыдущей теоремы. Лемма 1.7.3 Следующие утверждения эквиваленты: (i) сумма V\ + V2 прямая; (ii) dim Vi + dim V2 = dim(Vi + V2); (iii) разложение любого вектора а вида a = v\ + г?2; где г?х G Vi, г?2 £ V2; единственно; (iv) если 0 = г?х + г?2; г^е ^i G ^1, ^ G 1^? mo vi = ^2 = 0. Доказательство. To, что 1) <^=^> 2), вытекает из последнего следствия предыдущей лекции. Докажем, что 1) =>* 4). Пусть 0 = v\ + г?2? ^1 £ ^ъ ^2 £ V2, но v\ ф 0, а следовательно и t>2 / 0, тогда получаем, что г?2 = —v\, т.е. г?2 G V\ и , следовательно V\ r\V2 Э v2 ф 0, т.е. сумма не прямая. 1) <= 4) доказывается аналогично. Если сумма не прямая, то 3v G V\ П V2, v Ф 0, тогда и G Vi, -t; G V2 и 0 = t;+(-t;). Докажем 4) => 3). Пусть у некоторого вектора а есть два разложения, а = v\ + U2 = v[ + ^, ^lj^i £ Уъ v2iVf2 G V2, тогда 0 = (vi = и^) + (г;2 - ^)- Но тогда v\ - v[ = v2 - v'2 — 0. 4 v ' Ч v ' To, что 4) <= 3) очевидно, т.к. разложение любого вектора единственно, то и разложение нулевого вектора единственно. • Понятие прямой суммы можно обобщить на любое конечное число подпространств: сумма V\ + ... + Vn будет прямой, если V* = 1,... , п vin(V1 + ... + Vi-1 + Vi+1 + ... + Vn) = {0}. (2) Если сумма V\ + ... + Vn прямая, то для любого вектора а из этой суммы разложение вида а — v\ + ... + г?п, где V{ G V;, i = 1,... , гг, единственно. Замечание. Условие (2) более сильное, чем условие ViDVj = {0} Vi,j = 1,... , гг. Например, если взять три прямые (вектора, коллинеарные этим прямым), пересекающиеся в одной точке, то сумма любых двух из них будет прямой суммой, но сумма всех трех — нет, т.к. любой вектор третьей прямой можно представить в виде суммы векторов первых двух прямых, следовательно его разложение не будет единственно. 9
Внешняя прямая сумма Определение 1.7.4 Внешней прямой суммой двух линейных пространств Vi, V2 над одним полем К (не обязательно являющихся подпространствами одного пространства) называется новое линейное пространство V\ 0 V2 над полем К, состоящее из всех пар (^i, ^2) ? гДе vi £ V;, г — 1, 2, с операциями сложения и умножения на скаляры: 1) {V1,V2) + К,Ц) = (Ui +^,U2 + ^), 2) Л(иьи2) = (ЛиьЛи2), где ^-,и' G Vi, А е К. Если при этом отождествить сами пространства V\ и V2 с подмножествами внешней прямой суммы следующим образом: V\ f->- (Vi,0) и V2 f->- (0,V2), то их можно рассматривать как подпространства пространства V\ 0 У2. 1.8 Координаты Определение 1.8.1 Пусть дано линейное пространство V и базис ei,... , еп этого пространства, тогда любой вектор х £ "V можно представить в виде ж = Ai^i + ... + Хпеп. Числа Ai,... , Хп G К называются координатами вектора х в этом базисе. Введем некоторые соглашения для записи координат. Индексы у координат мы обычно будем писать не снизу, а сверху, т.е. не жг-, а хг. Вместо длинной записи х — х1е\ + ... + хпеп мы часто будем писать хгв{, на самом деле подразумевая сумму ^2п=1 хгв{. Координаты векторов мы часто / А будем записывать в виде столбцов, т.е. Корректность определения координат следует из свойств базиса (линейная независимость и максимальность). Замена координат Пусть нам даны два базиса ei,... , еп и ei,... , еп одного векторного пространства, тогда можно записать следующие равенства: ei схех + ... + с\еп, €"п — ^n^l I • • • I Спвп, которые равносильны одному матричному равенству Л л с1 • • • сп 1ег ...en) = (ei...erx Матрица С сл ... с_ называется матрицей перехода от базиса ei,... , еп к базису ei,... , еп. Лемма 1.8.2 Пусть ж1,... , хп — координаты вектора х в базисе ei,.. — координаты этого же вектора в базисе ei,... , еп. Тогда .,enj ах ,...,, с 10
Доказательство. Так как x3ej — х — хгв{ = х%е^с\ — {х%с\}е^ из линейной независимости векторов ei,... , еп следует равенство координат: х3 — х%с\ Mj (подразумевается суммирование по индексу г). 1.9 Изоморфизмы векторных пространств Определение 1.9.1 Пусть даны два линейных пространства V nW над одним полем К. Тогда биективное (т.е. взаимно однозначное) отображение / : V —>■ W называется изоморфизмом, если выполнены следующие условия (условия линейности): 1) f(vi + v2) = f(Vl) + f(v2) Vvuv2 G V, 2) /(Аг;) = А/(г;) \/v G V, A G K. Два линейных пространства V и W называются изоморфными {V = W), если между ними существует изоморфизм. Лемма 1.9.2 Если f : V —>■ W — изоморфизм, то обратное отображение f~l : W —>■ V также будет изоморфизмом. Доказательство, поскольку отображение / взаимно однозначно. Докажем только первый пункт, т.е., что f~l{w\ + w2) — /_1(^i) + f~l{w2) \/wi,w2 G W (второй пункт доказывается аналогично): ДГ'М + /_1М) = Д/^М) + Д/_1М) = ^1 + ^2 = /(Г'К + ^2)), следовательно f~l{w\) + f~1(w2) — f~1(wi + w2), т.к. отображение / взаимно однозначно. • Таким образом, изоморфность является отношением эквивалентности, т.е. обладает свойствами симметричности (любое пространство изоморфно самому себе), рефлексивности (если V изоморфно W, то W изоморфно V) и транзитивности (если V изоморфно ТУ и ТУ изоморфно С/, то V изоморфно U). Лемма 1.9.3 Если dim У = п, то V изоморфно пространству Кп столбцов (строк) из п элементов. Доказательство. Пусть ei,... , еп — базис в У, тогда построим отображение / : V —>■ Кп (х1\ следующим образом: если х = жгег-, то f(x) = : . Легко проверить, что это отображение \ хп ) будет изоморфизмом, а следовательно У = Кп. Следствие 1.9.4 Если dim V = dim W, то V = W. Доказательство. Пусть dim V = dim W = тг, тогда V = Kn = W. Верно и обратное: Лемма 1.9.5 Если V = W, то dim V = dim W. Доказательство. Допустим, что dim У < dim ТУ, пусть ei,...,en — базис в ТУ, тогда вектора/(ei),... ,/(en) G V должны быть линейно независимыми. Действительно, если Ai/(ei) + ... + Xnf(en) = 0, то, применив к обеим частям этого равенства отображение /_1, получим Ai^i + ... + Хпеп = 0, откуда Ai = ... = Хп = 0. Но их линейная независимость противоречит предположению dim V < п. 11
Лемма 1.9.6 Пусть dim У = dim W, а отображение f :V —>■ W удовлетворяет условиям линейности: 1) f(vi + v2) = f(Vl) + f(v2) Vvuv2 E V, 2) f(\v) = \f(v) \/ve v,Xe к. Пусть ei,... , en — базис в V. Тогда f является изоморфизмом тогда и только тогда, когда /(ei),... , f(en) — базис в W. Доказательство. Если / — изоморфизм, то из равенства Ai/(ei) + ... + \nf(en) = 0 следует /(Ai^i + ... + Хпеп) = 0, откуда заключаем, что Ai^i + ... + Хпеп = 0, значит, все Х{ = 0. Обратно, пусть /(ei,... , f(en)) — базис в W. Для проверки взаимной однозначности отображения / достаточно проверить, что отображение f~l корректно определено. Пусть w Е W имеет разложение по базису w = wl f{e\) + ... + wn f(en). Тогда определим отображение g : W —>■ V равенством g(w) = wle\ + ... + wnen. Очевидная проверка показывает, что g = f~l. • 1.10 Двойственное векторное пространство Напомним, что линейным функционалом на векторном пространстве V (над полем К) называется отображение / : V —>■ К, удовлетворяющее условиям линейности 1) f{vi + v2) = f(Vl) + f(v2) yVllv2 e V; 2) f(\v) = \f(v) Vv eV,\eK. Зададим на множестве V всех линейных функционалов / : V —> К, операции: 1) (Л + Л)И = ЛИ + ЛИ, Л,Л е V; 2) (Xf)(v) = Xf(v),feV,XeK. Эти операции превращают V' в линейное пространство. Это пространство называется двойственным пространством к V. Лемма 1.10.1 V ^ V'. Доказательство. Пусть е\,... , еп — базис в У, тогда докажем, что е1,... , еп будет базисом в V, где функционалы ег Е V, г — 1,... , п, определяются равенствами £г(е3) — 8г- [8г- — символ Кронекера, т.е. 5г: = < п '-/-'- Поскольку f(xlei) — жг/(ег), то значение функционала на произвольном векторе полностью определяется значениями функционала на базисных векторах и координатами этого вектора, т.е. функционалы ег полностью заданы нашими условиями. Нам нужно доказать два пункта: 1) линейная независимость векторов г1,... ,гп. Если / = А^1 + ... + Хпеп — 0 (равенство нулю в V' означает, что f(v) — 0 для любого вектора и G У), то f{ei) — \ = 0, т.е. все Х{ = 0. Следовательно эти функционалы линейно независимы. 2) максимальность, т.е. что V/ Е V, 3Ai,... , Хп Е К такие что / = Х{вг. Возьмем произвольный функционал / Е V, тогда, если х — хгв{, то f(x) = хг/(в{). Возьмем Х{ = /(ег), тогда получим, что /О) = хг/(ег) = хгХг = Хгх3ег{е3) = Хгег{х3е3) = Хгег{х), что и требовалось доказать. • Пусть нам даны базисы ei,... , еп и ei,... , еп в пространстве V и двойственные к ним базисы sl,...,sn и г1,..., еп в пространстве V''. Пусть С — матрица перехода от базиса ei,...,en к ei,... , еп, найдем матрицу перехода от базиса г1,... ,гп к г1,... , еп. Возьмем произвольный функционал / Е V, тогда / = /{вг = fj£3, где fi и /j — это координаты функционала / в базисах г1,... ,гп и г1,... , еп соответственно. Вычислим значение функционала / на векторе е& двумя способами. С одной стороны, f(ek) = f3e3(ek) = Л, а с другой стороны, /(е*) = 1гег(с3ке3) =Jic\, так как (ei...en) = (ei...en)C Отсюда получаем, что Д = Л'С^. Следовательно (/i.../n) = л \ /л (Л • • • fn)C, или (после транспонирования, обозначенного индексом £) | | = (С-1)^ | $п ' \ fn 12
и, наконец, отсюда получаем связь между базисами: (г1... еп) = (г1 .. .гп)(С-1)^, т.е. матрица перехода от базиса е к г равна (С-1)^. Мы доказали, что V = V, однако выбор изоморфизма / : V —>■ V зависит от выбора базиса в пространстве V. Действительно, пусть V — R, тогда базисом является любое ненулевое число е Е R. Выберем также еще один базис е — Ае, А ф 0,1. Пусть е — базис в V', двойственный к е, т.е. е(е) — 1, а г — двойственный базис к е, т.к. е(е) = 1, то е — \~1е. Изоморфизм f : V —> V, отвечающий базису е, задан следующим образом: Уж — ае, f(x) = as. Перейдем к базису е, тогда изоморфизм / : V —>■ V будет задаваться следующим образом: /(ж) = /(сеА_1е) = а\~2е. Т.е. разные выборы базиса в пространстве V дают разные изоморфизмы! 1.11 Канонический изоморфизм между пространством и его вторым двойственным Рассмотрим пространство, двойственное к двойственному. Оно называется вторым двойственным пространством: V" — (Vf)f. Элементы пространства V" — это линейные функционалы на пространстве V', т.е. функции, аргументами которых являются элементы множества V'. Очевидно, что dim V" — dim V' — dim V. Определим отображение <р : V —>■ V". Для каждого вектора х £ V функционал tp(x) — Lpx должен отображать функционалы (элементы множества V1) в поле скаляров. Пусть / £ V Определим значение tpx(f) — f{x)- Очевидно, что <рх — это линейное отображение V -л К. Кроме того, <p(xi + Х2) = ¥>(#i) + (f{x2) и ^(^х) = Ау?(ж). Докажем, что <р есть изоморфизм. Для этого нам нужно доказать, что из условия <рх = 0 следует, что х = 0. Условие <рх = 0 означает, что для любого функцинала / G V фхЦ) — 0, т.е. /(ж) = 0. Но единственный вектор в У, на котором любой функционал равен нулю, есть нулевой вектор, х = 0. Действительно, если это неверно, выберем базис е\ — ж, в2, • • • , еп в У, тогда для функционала г1 имеем г1 (ж) = 1^0. Так как ^ = 0 <^=^> ж = 0, то для произвольного базиса ех,... , еп в У векторы у?е1,... , LpGn линейно независимы. Но, поскольку dim V" — тг, эти векторы составляют базис пространства V"', следовательно <р — изоморфизм. При построении этого изоморфизма, мы ни разу не использовали базис (базис мы использовали только при доказательстве), поэтому этот изоморфизм не зависит от выбора базиса в пространстве У, а его конструкция универсальна и годится для любого пространства VI Такие изоморфизмы называются каноническими. Т.к. V и V" изоморфны канонически, то мы можем эти два пространства просто отождествить, и смотреть на пространства V и V' как на двойственные друг к другу (Vf — двойственное к У, а V = V" — двойственное к V!). Легко видеть, что базис ^ei,...,^6n в V" — двойственный к базису г1,...,^71, если г1,... ,гп — двойственный базис к ei,... , еп. При отождествлении пространств V и V", базисы <pei,... , Lpen и в\,... , еп отождествятся, и тогда базисы е\,... , еп и е1,... , еп будут взаимно двойственными. Пример: двойственное пространство пространства многочленов Рассмотрим пространство Кп[ж] многочленов степени не выше п с коэффициентами из поля К от переменной х £ К. Зафиксируем произвольное х — жо, и каждому многочлену р(х) поставим в соответствие число р(х) н->■ р(хо) G К. Каждое xq задает свое отображение evXo : Кп[ж] —>■ К. Т.к. evXo (р(х) + q(x)) = р(х0) + q(x0) = evXo {р{х)) + evXo {q{x)) и evXo(\p(x)) = \evXo(p)x, то отображение evXo линейно для каждого xq. Таким образом, каждое значение xq задает элемент evXo двойственного пространства К^ж]'. Лемма 1.11.1 Если жо, жх,... , хп — попарно различные значения, то evXo, evXl,... , evXn будет базисом в двойственном пространстве К^ж]'. Доказательство. Если нам удастся построить базис в пространстве Кп[ж], который будет двойственным к evXo, evXl,... , evXn, то отсюда будет следовать, что evXo, evXl,... , evXn будет двойственным к базису в ^[ж], т.е. будет базисом в К^ж]'. Построим такой базис: 13
Нам нужно найти такие многочлены pQ{x),pl{x),... , £>п(ж), что evXi(p3 (х)) = 5j, т.е. значение г-й функции evXi на всех базисных многочленах, кроме рг(х), равно 0, а на рг(х) равно 1. Эти многочлены можно построить, используя, например, интерполяционную формулу Лагранжа: • _ _(Ж - Ж0) ... {х - Xi-i)(x - Xi+i) ...(х-хп) р ух) — Х0) •• .{Хг - Xi-i)(Xi ^•+ь Докажем, что эти многочлены образуют базис. 1) линейная независимость: р(х) = \{рг(х) = 0 только, если все Х{ = 0, т.к. р(х{) = Х{ \/г. 2) максимальность: возьмем произвольный многочлен р(ж), тогда р(х) = р(х{)рг(х), т.е. является линейной комбинацией многочленов рг(х). (здесь, согласно тензорным обозначениям, подразумевается суммирование по индексу г). Таким образом, мы доказали, что pQ{x),pl{x),... ,рп(х) — базис в Кп[ж], а значит двойственный к нему базис evXo, evXl,... , evXn будет базисом в К^ [х]'. 2 Линейные операторы 2.1 Линейные отображения Определение 2.1.1 Пусть V,W — два векторных пространства над одним полем К. Отображение / : V —>■ W называется линейным, если \/ж, у £ У, А £ К выполняются равенства f(x + у) = f(x) + /(у) и f(Xx) = Xf(x). Пример: множество V — это множество линейных отображений при W = К. Пусть ei,... ,еп — базис в У, a ei,... , ет — базис в W. Если х = хге{ £ У, то f(x) = $(хге{) — жг/(ег), т.е., для вычисления значения функции в любой точке, достаточно знать ее значения на базисных векторах, т.е. f(e{) = а^е^ (а^ — коэффициенты разложения вектора f(e{) по базису е), тогда f(x) = хга^е^ = у е& — разложение значения по базисным векторам ei,... , е&. Координаты хг вектора х в базисе пространства V и координаты у значения отображения f(x) в базисе пространства W связаны следующим соотношением: у1 ут или, в матричной форме, Y — АХ, где Y и X — столбцы координат векторов f(x) и х соответственно, а матрица Aj = А— (а^) является матрицей, определяемой линейным отображением / (и определяющей его). Мы видим, что задание базисов в У и ТУ позволяет сопоставить каждому линейному отображению / его матрицу А/, причем это сопоставление взаимо однозначно. Поэтому существует биективное отображение между множеством линейных отображений L(V,W) из У в ТУ и множеством матриц Mm?n(K) с коэффициентами из поля К размера т X п. Лемма 2.1.2 L(V, W) ^ Mm,n(K). Доказательство. Достаточно проверить, что построенное выше биективное отображение L(V,W) —>■ Mm?n(K) будет линейным. Но это следует из того, что все отображения из L(V,W) линейны. • Примеры: 1) Рассмотрим отображение f(x) = 0, ему будет соответствовать нулевая матрица Aj = 0; 2) Если W = У, а отображение тождественно, / = id : V —>■ V, т.е. f(x) = х Мх £ У, то ему соответствует единичная матрица Aj = Еп] 3) Отображению f(x) = Хх соответствует матрица Aj = ХЕп. 14
Еще раз отметим, что соответствие f \-> Af зависит от выбора базисов в пространствах V и W. Изменим базисы в V (матрица перехода С\) и в ТУ (матрица перехода С2), тогда, естественно, изменится и матрица данного линейного отображения. Если в первоначальных базисах координаты были связаны матричным соотношением Y — AjX, то в новых базисах (X = С\Х', Y = С2У) имеем C2Y' = AfC\Xf, т.е. Y' = C^AfCiX' = A'fX'. Окончательно получаем формулу для матрицы оператора в новых базисах А1, — С2 AfC\. Если W — V, то мы получим отображение пространства в себя. Такие отображения называются линейными операторами. Матрица линейного оператора всегда квадратная, при этом в обоих экземплярах пространства V берется один и тот же базис. Тогда при переходе к другому базису матрица линейного оператора изменяется следующим образом: А', — C~1AjC\ где С — матрица перехода, a Aj — матрица оператора в старом базисе. Определение 2.1.3 Определим det / равенством det / = det Aj. Чтобы определение было корректным, надо, чтобы эта величина не зависела от выбора базиса в пространстве, т.е. возьмем два разным базиса с матрицей перехода С, тогда det A'f = det(C_1 А/С) = det С"1 det Af det С = det Af. Определение 2.1.4 Определим след tr/ линейного оператора равенством tr/ = tv Af (сумма диагональных элементов матрицы Af). Аналогично проверяем, что определение корректно: tiA'j = tr(C_1A/C) = tv(AfCC-1) = tvAf. Определение 2.1.5 Определим ранг rk / линейного оператора равенством rk / = rk А/. Он тоже, очевидно, не будет зависеть от выбора базиса. Определение 2.1.6 Ядро линейного оператора Кег/ = {х £ V : f(x) = 0} — множество всех векторов, переходящих в ноль. Образ линейного оператора Im / = {у £ V : Зх £ У, f(x) = у} — множество векторов у £ У, для которых существует прообраз. Аналогичные определения можно дать и для более общего случая — для линейных отображений одного векторного пространства в другое. Лемма 2.1.7 Ядро и образ любого линейного оператора являются линейными подпространствами в V. Доказательство. Доказательство очевидно, надо просто проверить, что эти множества замкнуты относительно операций сложения и умножения на скаляры. Например, в случае ядра, если ж, у £ Кег /, А £ К, то f(x) = f(y) = 0, поэтому f(x + у) = 0, f(Xx) = 0 и х + у, Хх £ Кег /. Проверка для образа оператора аналогична. Лемма 2.1.8 dim Кег / + dim Im / = dim V. Доказательство. Пусть ei,...,er — базис в Кег/, дополним его до базиса ei,... , ег,ег_|_х,... , еп всего пространства V. Докажем, что dim Im / — п — г. Для этого рассмотрим набор векторов /(er+i),... , f(en) и докажем, что он является базисом в Im /. 1) линейная независимость. Пусть Ar+i/(er+i) + ... + Xnf(en) = /(Ar+ier+i + ... + Хпеп) — 0, следовательно Ar+ier+i + ... + Хпеп £ Кег /, но тогда Ar+ier+i + ... + Хпеп — \i\e\ + ... + firer для некоторых /ii,... ,/ir. Т.к. векторы ei,... , еп линейно независимы, то все Х{ = 0 (и fij тоже), следовательно векторы /(er+i),... , f(en) линейно независимы. 15
2) полнота. Возьмем произвольный у Е Im /, следовательно существует такой х Е У, что f(x) = у. Если ж = хге{ (суммирование по индексу г, пробегающему от 1 до п), то у = /(ж) = $(хге{) — жг/(ег), что является линейной комбинацией векторов /(er+i),... ,/(еп), т.к. при г = 1,... , г е, Е Кег/ и /(е,-) = 0. Следовательно /(er+i),... , f(en) — базис в Im /, отсюда уже вытекает утверждение леммы. • Определение 2.1.9 Композицией двух линейных операторов f,g :V —>■ V называются линейные операторы / о д,д о / : V -> У, где (f о д)(х) = f(g(x)) и (д о f)(x) = g(f(x)). Можно легко показать, что в фиксированном базисе А/0<д = А/ • Ар, также легко проверить, что для множества операторов выполнены все аксиомы кольца (если умножение — композиция), т.е. множество линейных операторов имеет структуру кольца с единицей, роль которой играет тождественный оператор. 2.2 Инвариантное подпространство Определение 2.2.1 Пусть дан линейный оператор f:W^WnVcW — подпространство в W. Оно называется инвариантным подпространством относительно /, если его образ лежит в нем самом, т.е. f(V) С V. Примеры: 1) V = Кег / будет инвариантным подпространством, т.к. Мх Е V f(x) = 0 Е У, 2) У = Im / будет инвариантным подпространством, т.к. по определению Im / образ любого элемента ему принадлежит. Рассмотрим подробнее матрицы операторов. Пусть V — инвариантное относительно / подпространство в W. Пусть ei,... , ег — базис в У, дополним его до базиса ei,... , еп в W. Пусть *\ — , т.е. ее Aj — матрица оператора в этом базисе, тогда она имеет следующий вид: Aj = —^~ V I ^ можно разбить по ширине и высоте на две части, отвечающие векторам ei,... , ег и er+i,... , еп, причем в нижнем левом углу будут стоять одни нули. Действительно, т.к. V инвариантно, то f{ei) Е V при 1 <С г <С г, следовательно, f{e{) — ot\e\ + ... + а£ег. Коэффициенты в этом разложении по базису — это г-й столбец матрицы А/, а здесь на г + 1,... , n-ых местах стоят нули. Если W — V\ 0 V2, где Vi, V2 — инвариантные подпространства, то и правый верхний угол * о о * . Дока- матрицы Aj будет нулевой, и эта матрица будет иметь следующий вид: Aj зательство этого аналогично предыдущему. Ограничение оператора и фактор-оператор Определение 2.2.2 Пусть V — инвариантное относительно / подпространство, тогда оператор /i : V —>■ У, определенный равенством fi(v) = f(v), v Е V, называется ограничением оператора / на подпространство V и часто обозначается f\y. Матрицей оператора f\y будет левый верхний угол матрицы оператора /, т.е. Aj = Af 0 | * Если V инвариантно, то можно рассмотреть оператор f : W/V —>■ W/V (фактор-оператор), определенный равенством f'(a-\-V) — f(a)-\-V. Для проверки корректности такого определения предположим, что а\ + V — <22 + У, тогда f'(ai+V) = f(a1) + V = f(a2 + (a1-a2)) + V = 4 v ' ev = f{a2) + f{al-a2)+V = f{a2) + V = 4 v ' ev = f'{a2 + V). 16
Если е\ ... , ег — базис в У, a er+i,... , еп — его дополнение до базиса в W, то er+i +У,... , en-\-V будет базисом в фактор-пространстве W/V. Матрицей оператора в этом базисе будет правый нижний угол матрицы оператора Aj, т.е. Aj = ( —^г * ). 2.3 Невырожденные операторы. Собственные значения и собственные векторы Определение 2.3.1 Линейный оператор / : V —>■ V называется невырожденным, если выполнено одно из следующих условий: 1) det//0; 2)Кег/ = {0}; 3)1т/ = У; 4) rk/ = dim У; 5) Зд : V —>■ У, такой что д о f — f о д — id, т.е. существует обратный оператор. Лемма 2.3.2 5се эти пять свойств эквивалентны. Доказательство. 2) <^=^> 3), т.к. dim У = dim Кег / + dim Im /. 1) «<=>* 2): Пусть существует ненулевой вектор х £ Кег/. Выберем такой базис в V, чтобы х был первым вектором базиса, тогда в матрице оператора Aj первый столбец будет нулевым, тогда det / = 0. Обратно, если det / = 0, то у системы уравнений AjX = 0 существует ненулевое решение, т.е. под действием оператора / некоторый ненулевой вектор переходит в 0. Но тогда Кег//{0}. 1) <^=^> 4) — это мы знаем из курса высшей алгебры. 1) <^=^> 5). Если det/ ф 0 и Aj — матрица оператора /, то det Aj ф 0, следовательно существует обратная матрица Al , ей соответствует некоторый оператор д. Т.к. AjAl = Al Aj = Е, то / о д — д о / = id. Обратно, если существует обратный оператор, то его матрица будет обратной к матрице оператора /, следовательно det / = det Aj ф 0. Замечание. Обратный оператор (если он существует) единственен. Оператор, для которого ни одно из этих свойств не выполняется называется вырожденным. Собственные значения и собственные векторы Определение 2.3.3 Число А £ К называется собственным значением оператора /, если оператор / — А • id вырожденный. Тогда у этого оператора — ненулевое ядро. Любой ненулевой вектор, принадлежащий ядру оператора / — А • id, называется собственным вектором, отвечающим собственному значению А. Рассмотрим пространство V(X) = Кег(/ — X - id) — подпространство собственных векторов, отвечающих одному и тому же собственному значению А. Лемма 2.3.4 Пространство V(X) инвариантно относительно оператора f. Доказательство. Если х £ V(X), т.е. (/ — А • id)(x) = 0, тогда f(x) = Хх £ V(X). • Лемма 2.3.5 Пусть К — алгебраически замкнутое поле (т.е. любой многочлен / £ Кп[ж], deg / > 0; имеет корень), например, поле комплексных чисел. Тогда у любого оператора / : W —>■ W, где dim W > 1, существует нетривиальное инвариантное подпространство (отличное от нуля и от всего пространства). Доказательство. Рассмотрим уравнение det(/ — А • id) = 0. В силу алгебраической замкнутости поля, это уравнение имеет корень Aq, тогда Aq будет собственным значением / и тогда dim V(Xq) > 0 и V(Xq) инвариантно. Если V(Xq) ф W, то оно нетривиально. Если же случайно получилось, что V(Xq) = W, то / имеет вид / = X^-id, т.е. является просто оператором умножения на число, и тогда любое подпространство будет инвариантным. • 17
2.4 Проекторы Если W = V\ 0 V2, то для любого вектора w имеет место единственное разложение вида w = ^1 + ^2, где г?1 Е Vl, г?2 £ ^2- Рассмотрим линейный оператор / : ТУ —>■ W, определенный формулой f{w) — v\. Т.к. v\ — v\ + 0, то /(Vi) С Vi, т.е. Vi инвариантно относительно /, более того на подпространстве имеем /\уг = irf^. Т.к. все вектора из V2 переходят в 0, то V2 Е Кег /. На самом деле V2 = Кег /, т.к. если f(w) = 0, то в разложении w = v\ + V2 имеем V2 — О, т.е. w Е У2- Определение 2.4.1 Операторы указанного вида называются операторами проектирования или просто проекторами вдоль V2 на V\. Проекторы обладают замечательным свойством: если / — проектор, то f2 = /. Докажем обратное утверждение. Теорема 2.4.2 Если f2 = /, то оператор f : W —>■ W является оператором проектирования для некоторых V\ uV2- Доказательство. Возьмем V\ — Im / и V2 = Кег/ и докажем, что / — проектор вдоль V2 на V\. Сначала докажем, что W — V\ 0 V2, т.е., что W — V\ + V2 и V\ П V2 = {0}. Допустим, что существует ненулевой вектор а Е ViПТ^, тогда а Е Кег /, т.е. /(а) = 0 и а Е Im /, т.е. существует такой вектор Ъ Е И^, что f(b) = а. Тогда a = f(b) = f(b) = f(a) = 0, следовательно, а = 0. Мы получили, что V\ и V2 действительно образуют прямую сумму и Vi 0 V2 С W. Но, т.к. dim(Vi 0 V2) = dim V\ + dim V2 = dim Ker / + dim Im / = dim W, то Vi®V2 = W. Возьмем теперь произвольный вектор w Е W, тогда w = ^1+^25 гДе ^i £ ^ъ ^2 Е V2, следовательно, /(w) = /(^i + ^2) = /(^1) + /(^2) = f{vi) + 0 = /(^1), т.к. v2 Е Кег/. Нам осталось доказать, что, если v\ Е Im/, то /(^i) = v\. Пусть Ъ Е И^ — прообраз г?1, т.е. /(6) = г?1, тогда ui = /(6) = /2(&) = /(^i), следовательно оператор / действительно является оператором проектирования вдоль V2 на V\. Матрица оператора проектирования в базисе, составленном из базисов подпространств V\ и /1 \ V2 имеет следующий вид: подпространства V\. О 1 где количество единиц равно размерности о/ 2.5 Нильпотентные операторы Определение 2.5.1 Оператор / называется нилъпотентным, если существует такое натуральное число &, что fk = 0. Рассмотрим пример нильпотентного оператора. Пусть матрица оператора в некотором базисе /° 1 °\ о '•• ei,... , ега имеет вид А/ \0 , т.е. базисные вектора он сдвигает по циклу: еп н-> 1 о/ 18
en_i н->■ ... i—>■ e\ i—>■ 0. При возведении этой матрицы в степени, диагональ с единицами будет все дальше и дальше смещаться в правый верхний угол и через некоторое время вообще исчезнет, т.е. будучи возведенным в степень п, матрица станет нулевой, а значит и сам оператор станет нулевым в этой степени, т.е. будет нильпотентным. Теорема 2.5.2 Если оператор f : W —>■ W нильпотентный, то найдется базис, в котором ( Аг. матрица оператора будет иметь блочно-диагоналъный вид Af = V о о Аг ° \ где каждый блок (клетка) АПг размерности щ имеет вид \о АПк / . Такой вид матрицы ■■ 1 о/ оператора единственен с точностью до перестановки блоков. Такая форма матрицы оператора называется нормальной. Доказательство. 1) Единственность. Пусть / — нильпотентный оператор, рассмотрим последовательность операторов f° = id, f1 = /, /2,... , fn = 0. Обозначим Т{ — rk/% в частности го = dim W, гп — 0, и мы имеем цепочку неравенств г о ^ г\ ^ ... ^ гп. Обозначим через 7V& количество клеток размера kxk. Свяжем между собой числа Т{ и 7V&. Для этого рассмотрим разность го — г\. Для каждой отдельно взятой клетки такая разность равна 1, т.к. ранг клетки размера kxk равен к — 1, т.е. на единицу меньше, чем размерность. Поэтому каждая клетка вносит в разность го — т*1 вклад, равный единице, т.е. эта разность равна общему количеству клеток, следовательно го - Г1 = N± + N2 + N3 + .... Рассмотрим разность г\ — г2- Для клеток размера 1x1 такая разность равна нулю, а для клеток размера пхп при п ^ 2 ранг клетки равен п — 1, а ранг ее квадрата равен п — 2, и их разность равна единице. Поэтому разность г\ — Г2 равна количеству клеток размера пхп при п ^ 2, т.е. г\ — Г2 — N2 + Л^з + • • • • Аналогично получаем, что Г2 — гз = Л^з + ^4 + ... и т.д., гг_1 — Т{ — N{ + A^+i + .... Вычитая из предыдущего равенства последующее, получаем N{ = (гг_1 — Г{) — (г{ — rr+i) = ri-i — 2г{ + rr_|_i. Т.к. ранги от выбора базиса не зависят, то и числа N{ от базиса не зависят, следовательно количество клеток каждого размера будет одно и то же, поэтому нормальная форма оператора единственна с точность до перестановки клеток, из которых она состоит. 2) Существование. Проведем индукцию по размерности пространства W. Если dim ТУ = 1, тогда, т.к. / нильпотентен, то / = 0 и в любом базисе имеет нужный (нулевой) вид. В предположении, что утверждение теоремы верно для dim W < п, докажем его для dim W = п. Рассмотрим образ оператора V = lm f — инвариантное подпространство, и ядро U = Кег /. Рассмотрим ограничение / на V — оператор f\ : V —>■ V. Покажем, что dim V < dim W. Если мы предположим противное, dim V = dim W, это будет означать, что V = W, следовательно, оператор / будет обратимым, следовательно, det / ф 0. Но тогда det fn = (det f)n ф 0 для любой степени п, что приводит к противоречию с нильпотентностью. Итак, dim V < dim W, и в подходящем базисе матрица оператора / имеет блочный вид Aj = Af, * \ т „ Ап ( А\ * ' . 1огда его степени имеют такой же вид: А} — ±х * ) * * J \ 0 • 0, и оператор f\ также нильпотентный (причем dim V < 4i О А I 0, то и А h следовательно, если п). Значит, по предположению индукции оператор f\ имеет базис, в котором он представим в нужном нам виде Afl ( Ак 0 ^ Ак2 V о где t — количество клеток. Этому разбиению на блоки Akt J 19
будет соответствовать базис (1) (1) (2) (2) (t) (t) ll 5 ' ' ' 5 akx > а1 5 ' ' ' 5 ak2 > ' ' ' > ai 1 ' ' ' Iakt ' отвечает A/-- отвечает A^2 отвечает A^ Все эти вектора вместе образуют базис в У, обозначим эту группу векторов через (I). Дополним ее до базиса всего W. Если rk/ = г, то dim V = г, следовательно, dim JJ — п — г. тт » * (О (О (О (О (О (О (О Под действием оператора /i вектор а^' переходит в а^ _1? «^._1 н->■ а& _2> • • • > а2 ^ а1 ? а1 ^ 0. Следовательно вектора а^ ,... , а^ G Ker/i, более того, Кег/i = (а^ ,...,а^ ), т.к. все пространство разбивается в прямую сумму подпространств, отвечающих клеткам А^, • • • , Akt. Т.к. UOV = Ker /i С Кег / = [/, то базис а^ ,... , а^ подпространства С/ПУ можно дополнить до базиса пространства U. Дополним его векторами &i,... , 6n_r_t и обозначим эту группу векторов через (II) (количество векторов в ней равно dim U — dim (С/ Г) V) = (п — г) — t). Для того, чтобы дополнить группы векторов (I) и (II) до базиса всего пространства W, нам нужно еще t векторов. Рассмотрим группу векторов (I). Под действием оператора f\ в векторы а^ ,... , а^ ничего не переходит, однако во всем пространстве ТУ есть вектора, в них переходящие, т.к. а^ ,... , а^ £ Im / = У. Пусть это вектора ci,... , q, обозначим эту группу векторов через (III). Докажем, что объединение групп векторов (I), (II) и (III) образует базис в W. Линейная независимость. Пусть линейная комбинация этих векторов равна нулю: м.м . . J1)J1) . . j*)jt) . . j*)jt) a^ a1 + ... + a^a^ + ... + al>a\' + ... + а^аЦ + +Pibi + ... + (Зп-r-tbn-r-t + 7ici + • • • + 7t°t = 0. Применим к обоим частям равенства оператор /, тогда получим (1)л(1)| .JiUi) ■ ■ AW, .„(*)„(*) «2 ttj + ... + о^Ч/-! + ... + а\>а\> + ... + ^t4/-i + +0 + ... + 0 + 7x4^ + ... + 7*4? = °' Но вектора группы (I) образуют базис в У, следовательно, они линейно независимы, и все присутствующие здесь коэффициенты равны нулю, т.е. (1) (1) (*) (*) п а\} = ... = а\> = ... = а\} = ... = аЦ = 71 = • • • = Ъ = 0. Тогда от первоначальной суммы остается лишь 41}41} + • • • + 4° 4° + /3ibi + ... + /3n_r_tbn_r_t = 0, а эти вектора как раз образуют базис в С/, следовательно они линейно независимы и все оствши- еся коэффициенты также равны нулю, следовательно система векторов групп (/) U (II) U (///) линейно независима. Полнота этой системы векторов очевидна, т.к. количество векторов равно к\ + ... + kt + (тг — г — t) -\-1 — г -\- [п — г — t) -\-1 — п — dim W, значит это действительно базис. Посмотрим теперь, как выглядит матрица оператора / в этом базисе. Перепишем этот базис в следующем порядке: „(1) „(1) г .W „W r h h al 5 • • • 5 aki ' !' '1 ' * * * ' kt ' *' !' * * * ' un-r-t- По построению, /(Ьг-) = 0 для г=1,...,7г — г — £, ав каждой выделенной группе вектора переходят друг в друга циклически: С{ н->■ а/£* н->■ ... н->■ а^ н->■ 0, г = 1,...,£, т.е. каждой группе отвечает клетка размера на единицу больше, чем А^г т.к. к каждой циклической цепочке векторов мы добавили еще по одному вектору. В этом базисе матрица оператора будет иметь 20
f Akl вид: Aj +i Ak2+1 A kt+1 V векторам b{. Теорема доказана. где одномерные нулевые клетки отвечают о/ 2.6 Многочлены от операторов Пусть / : V —>■ V — линейный оператор. Тогда каждому многочлену p(t) Е ^n[t] можно поставить в соответствие оператор по следующему правилу: а0 + axt + a2t2 + ... + antn н> a0id + axj + a2f2 + ... + anfn — этот многочлен от оператора, также являющийся оператором, мы будем обозначать через p(f). Может так получиться, что p(f) — нулевой оператор, тогда многочлен p(t) называется аннулирующим многочленом для оператора /. Пример: Если / = id, то p(t) = t — 1 будет аннулирующим многочленом, т.к. p(f) = / — id = 0. Лемма 2.6.1 У любого оператора f существует аннулирующий многочлен. Доказательство. Пусть dim V = п, рассмотрим операторы f° = id, f1 = /, /2,... , fn . Раз- 4 v ' мерность векторного пространства линейных операторов равна п2, следовательно эти операторы (поскольку их количество больше размерности) линейно зависимы, тогда существуют та- 2 кие числа ао, «i,... , ап2, не все равные нулю, что aoid-\-a\f -\-.. .-\-ап2 fn = 0, но тогда получаем, 2 что многочлен p(t) — а$ + a\t + ... + an2tn аннулирует оператор /. Минимальный многочлен Определение 2.6.2 Многочлен p(t) называется минимальным многочленом для оператора /, если он аннулирует этот оператор, имеет наименьшую степень среди всех аннулирующих многочленов и его старший коэффициент равен 1. Лемма 2.6.3 Для любого оператора f существует, и притом единственный, минимальный многочлен. Доказательство. 1) Существование. Мы уже показали, что для любого оператора существует аннулирующий многочлен. Поэтому мы можем выбрать из всех аннулирующих многочленов многочлены с наименьшей степенью и поделить их на старший коэффициент. То, что получится, по определению будет минимальным многочленом. 2) Единственность. Допустим, что pi(t) и P2(t) — два минимальных многочлена для одногои того же оператора /, тогда deg^i = degp2 и их старшие коэффициенты равны 1, поэтому многочлен pi(t) — p2{t) будет аннулирующим многочленом меньшей степени, что противоречит предположению. Лемма 2.6.4 Число А будет собственным значением оператора f тогда и только тогда, когда А — корень минимального многочлена для f. 21
Доказательство. Пусть А — собственное значение оператора /, тогда существует такой ненулевой вектор ж, что fx = Хх. Пусть p{t) — минимальный многочлен, т.е. p(f) = О, тогда p(f)x = 0, следовательно р{Х)х — а$х + а\\х + ... + апХпх = а$х + a\fx + ... + anfnx = p(f)x = О, поэтому р(Х) = 0 (так как х ф 0). Обратно, пусть А — корень минимального многочлена, тогда p(t) — {t — X)q{t), deg q < deg£>, поэтому q{t) не аннулирует /, следовательно, существует такой ненулевой вектор ж, что q(f)x = у ф 0. Тогда (/ - А • id)у = (/ - А • id)q(f)x = р(/)ж = 0, следовательно, у — это собственный вектор оператора /, а А — его собственное значение. 2.7 Характеристический многочлен Определение 2.7.1 Многочлен Pj(t) = det(/ — Х-id) называется характеристическим многочленом оператора /. Отметим роль некоторых коэффициентов характеристического многочлена. Если его записать в виде Pf(t) — ао + a\t + ... + antn, то тогда ап — ( —l)n, an_i = ( — l)n_1 tr /, а$ — det /. Лемма 2.7.2 А является собственным значением оператора f тогда и только тогда, когда X — корень характеристического многочлена Pf(t). Доказательство. Если А — собственное значение, то оператор g = / — Х- id вырожденный, следовательно det(/ — А • id) = 0, т.е. А — корень Pf(t). Обратно, если А — корень Pf(t), то det(f-X'id) = 0, следовательно оператор f — X-id вырожденный, значит, А является собственным значением оператора /. • Если V С W — инвариантное подпространство, тогда, как мы знаем, матрица оператора / : W —>■ W имеет вид: Aj = ( J.1 * J, где f\ — ограничение / на У, а /' — фактор- оператор. Тогда, т.к. det / = det f\ det /', то Pj(t) = Pfl{t)Pfi{t). Лемма 2.7.3 Пусть V(X) — инвариантное подпространство, образованное собственными векторами, отвечающими собственному значению А. Тогда кратность корня характеристического многочлена не меньше размерности подпространства V(\). Доказательство. Если f\ — ограничение оператора / на У (А), то для любого х £ V(X) X О будем иметь, что j\x — Аж, поэтому матрица этого оператора имеет вид Afl ( а матрица оператора / — вид: Aj ' А 0 0 0 А * -Ajr) . Следовательно Pj(t) = Pfl{t)Pfi{t) К (A — t)dimVix) - Pft(t), поэтому кратность корня А не меньше размерности подпространства V(X) (но может быть и больше, если А является корнем многочлена Pji{t)). Теорема 2.7.4 (Гамильтона-Кэли) Характеристический многочлен Pj(t) оператора f : W —>■ W аннулирует этот оператор, т.е. Pj(f) = 0. 22
Доказательство. Мы ограничимся доказательством теоремы только случаем алгебраически замкнутых полей. Проведем индукцию по размерности пространства. 1) База индукции. Пусть dim ТУ = 1. В этом случае матрица оператора / имеет вид Aj = (А) и оператор имеет вид fx = Хх. Характеристический многочлен имеет вид Pf(t) = А — £, следовательно, Pj(f)x = Хх — fx = 0 для любого х £ W. База индукции верна. 2) Индуктивный переход. Пусть утверждение теоремы верно для dim W < п, докажем его для dim ТУ = п. Т.к. поле алгебраически замкнуто, то многочлен Pf(t) имеет корень А, т.е. Pf(t) = (А — t)q{t) для некоторого многочлена q(t). Тогда, как уже отмечалось, А будет собственным значением оператора /. Значит, существует собственный вектор х £ ТУ, отвечающий собственному значению А. Рассмотрим одномерное инвариантное линейное подпространство У, порожденное вектором х. Тогда матрица оператора / в подходящем базисе будет иметь вид Aj = ( п * ). Пусть Pf(t) — характеристический многочлен фактор-оператора /', тогда Pf(t) = (А — t)Pf/(t) и, более того, т.к. сИт(И'УУ) = п — 1, то, по предположению индукции, Pjf(ff) = 0 (здесь 0 — это нулевой вектор фактор-пространства). Это значит, что для любого ае W Pf,(f')(a+V) = V. (3) Вспомним теперь определение фактор-оператора в фактор-пространстве: f\a-\- V) = f(a) + V. Легко показать, что, применяя оператор несколько раз подряд, получим (/') (a-\-V) — } (a)-\-V для любой степени к. Но тогда Ру/(//)(а + V) = Pf/(f)a + V. Сравнивая это равенство с (3), получаем Pji[f)a + V — V, следовательно, Pji[f)a £ V для произвольного вектора а £ W. Поскольку dim V = 1, Pjt(f)a = ах для некоторого скаляра а. Поэтому Pj(f)a = (А • id — f)Pjt(f)a = (А • id — f)ax — а[Хх — fx) — О, т.к. х — собственный вектор, отвечающий собственному значению А. Итак, мы получили, что Pj(f)a = 0 для любого вектора а, т.е. Pf(t) аннулирует /. 2.8 Еще несколько утверждений об операторах Определение 2.8.1 Оператор / называется диагонализируемым, если существует такой базис, что матрица этого оператора в этом базисе диагональна. Примеры: 1) операторы проектирования диагонализируемы, 2) нильпотентные операторы не диагонализируемы (если они не нулевые), так как любая диагональная нильпотентная матрица равна нулю. Лемма 2.8.2 Пусть характеристический многочлен Pf(t) имеет п — dim ТУ различных корней, тогда оператор f диагонализируемый. Доказательство. Пусть Ai,...,An — корни Pf(t), т.е. собственные значения оператора /, a ai,... , ап — отвечающие им собственные вектора, т.е. fa{ = Агаг-, i = 1,... ,7г. Если бы мы знали, что ai,... , an — базис, то матрица оператора в этом базисе имела бы вид: Aj = Ai О О Хп Докажем, что ai,... , ап является базисом. Для этого нам достаточно доказать линейную независимость этих векторов (так как их количество совпадает с размерностью пространства). Проведем индукцию по размерности пространства. 1) База индукции. Если dim ТУ = 1, то вектор а\ будет базисом. База индукции верна. 23
2) Индуктивный переход. Пусть для dim W < п утверждение верно, докажем его для dim W — п. Допустим, что это не так, т.е. существуют скаляры «i,... , ап, не все равные нулю, т.ч. а\а\ + ... + апап — 0. Без ограничения общности можно считать, что ап ф 0, тогда вектор ап есть линейная комбинация остальных векторов, ап — — ^а\ — ... — °in~1 ап_\. Применив оператор / к обеим частям этого равенства, получим, что fan = /(- -а\ Qn-l Xnar, ■^r^i«i Oin-1 An_ian_b но, с другой стороны, Xnan = Хп(-^аг an_ij, т.е. Clri — 1 J- Приравняв выражения в правых частях равенств, получим, что (Ап — X\)^ai + ... + (An — An_i) °in~1 an_i = 0. Рассмотрим подпространство V = (ai,... ,an_i), оно будет инвариантно относительно оператора / и dim V = п — 1. Если f\ — ограничение / на У, то ai,... , an_i — собственные вектора оператора /i, следовательно, по предположению индукции, они линейно независимы. Т.к. все Х{ различны, то а\ — ... = an_i — 0, но тогда ап — 0, что невозможно, т.к. это собственный вектор. Полученное противоречие доказывает линейную независимость векторов ai,... , ап. Лемма 2.8.3 Над алгебраически замкнутым полем матрицу любого оператора можно при- / Ai • - вести к верхнетреуголъному виду *.# | заменой базиса. \ О А, Доказательство. Индукция по размерности пространства. 1) Если dim W — 1, то утверждение очевидно, т.к. любая матрица размера 1 является верхнетреугольной. 2) Пусть утверждение верно для dim W < п, докажем его для dim W — п. Т.к. поле алгебраически замкнуто, характеристический многочлен имеет корень А, он будет собственным значением. Ему соответствует собственный вектор, который порождает одномерное инвариантное подпространство У, тогда матрица оператора / имеет вид Aj = ( п . ). По предположению индукции матрицу Aft можно привести к верхнетреугольному виду Aft тогда матрица Aj (А 0 V \ Ai 0 • 1 Агг-1 / также будет верхнетреугольной. 4-1 Лемма 2.8.4 Если матрица оператора верхнетреуголъная, то на главной диагонали стоят собственные значения этого оператора. Доказательство. Пусть Aj О А det(/ — t-id) = (Ai — t) •...• (An — t), т.е. Ai,... , A а значит собственные значения. Ai * \ / Ai -1 * , тогда Af-t.id = I •-. I , и V 0 Xn -1 это корни характеристического многочлена, Лемма 2.8.5 Пусть оператор f такой, что в алгебраически замкнутом поле характеристический многочлен Pf(t) имеет единственный корень А; тогда оператор g — f — X • id является нильпотентным. 24
Доказательство. Т.к. у оператора / только одно собственное значение А, то в некотором /А *Ч базисе его матрица будет иметь вид Aj = •. # . Матрица оператора д в этом базисе V О А/ (° *\ имеет вид Ад — \ #.# . Характеристический многочлен оператора д имеет вид Pg(t) = V о о / ( —1)п£п, и, поскольку он является аннулирующим, то Рд(д) = ( — 1)пдп = 0, значит, дп = 0 и, следовательно, оператор </ является нильпотентным. 2.9 Корневое подпространство Определение 2.9.1 Пусть дан оператор / : W —>■ И^ и А — произвольный скаляр. Корневым подпространством, отвечающим числу А называется множество У\, состоящее из всех векторов х £ И^, для которых существует такое натуральное число тг, что (/ — А • id)nx = 0. Утверждение 2.9.2 Множество V\ действительно является подпространством. Доказательство. Если ж £ У\, то (/ — А • id)(сеж) = 0, следовательно, ах £ Уд для любого а £ К. Если ж, у £ V\, то существуют числа тг^, 7гу £ N, для которых (/' — X-id)nxx — 0, (/' — X-id)nyy — 0. Пусть 7г = max(na:, тг^). Тогда (/ — А • id)n[x + у) = (/ — А • id)nx + (/ — А • id)ny — 0, значит, Уд является подпространством. • Утверждение 2.9.3 Подпространство V\ С W инвариантно относительно оператора f. Доказательство. Возьмем произвольный вектор х £ У\, т.е. (/ — А • id)nx = 0, тогда (/ — А • irf)n/x = /(/ - А • ^)пж = /(0) = 0, значит, /ж £ V\. Утверждение 2.9.4 Подпространство V\ нетривиально (т.е. отлично от нулевого вектора) тогда и только тогда, когда А — собственное значение оператора f. Доказательство. Если А — собственное значение, то существует собственный вектор х ф 0, т.ч. (/ — А • id)x = 0, т.е. х £ V\. Обратно, если подпространство V\ содержит ненулевой вектор ж, то пусть п — наименьшее натуральное число, при котором (/ — А • id)nx = 0. Тогда у — (/ — А • id)n~1x ф 0. Но тогда (/ — А • id) у = (/ — А • id)nx = 0, следовательно у — собственный вектор оператора /, а А — собственное значение. Обозначим g — f — X • id. Очевидно, что если дпх — 0 для какого-то п £ N и для какого-то вектора ж, то и дтх — 0 при всех т> п. Т.е. получаем цепочку вложений: Кет д С Кег д2 С ... С Кетд71 С ... С Уд. Утверждение 2.9.5 £Ъш па каком-то шаге этой цепочки ядра Кег gk_1 и Кег gk совпали, то они будут совпадать и дальше, т.е. если Кег^ = Кег </ , то Кег </г = Кег^ при i > к. Доказательство. По условию мы имеем g ж — 0 <^=^> х £ Kerg «<=>* ж £ Кег^ <^=^> gk~lx — 0. Докажем, что </ +1ж = 0 «ч=>* g ж = 0, т.е. что Кег g +1 = Кег </ . Если дкх — 0, то, очевидно, дк+1х — д(дкх) = 0. Обратно, если дк+1х — 0, то дк(дх) = 0 <^=^> </^-1 (</ж) = 0 (по условию), следовательно, дкх = 0. Мы доказали, что Кег дк+1 — Кег дк. Проделав эту операцию нужное число раз, получим что Кег </^+2 = Кег </^+1 и т.д. 25
• Из этого утверждения следует, что при возведении оператора д в степени, его ядро не может бесконечно увеличиваться потому, что если в этой цепочке встретилось хотя бы одно равенство, то и дальше будут идти равенства. А равенство заведомо встретится не позже степени п — dim ТУ, т.к. dimKerg71 <С dim ТУ, а с каждым шагом она увеличивается (если увеличивается) не менее, чем на единицу. При возведении оператора д в очередную степень рост его ядра заведомо прекратится при п — dim ТУ, поэтому нам достаточно ограничиться этой степенью: для любого х е ух gdimWx = 0> В последующих наших рассуждениях о корневых подпространствах мы ограничимся подпространствами, отвечающими собственным значениям, т.к. все остальные подпространства будут состоять только из нулевого вектора. 2.10 Теорема о разложении пространства в прямую сумму корневых подпространств Теорема 2.10.1 Пусть дан оператор f : W —>■ W (над алгебраически замкнутым полем). Тогда пространство W является прямой суммой всех корневых подпространств, т.е. W = V\l 0 ... 0 V\k, где Ai,... , А& — собственные значения оператора f. Доказательство. Проведем доказательство этой теоремы по следующему плану: I) введем в рассмотрение новые подпространства Vi,... , Vk и докажем, что Vi С V\t, г — I,... , К] II) докажем, что все пространство является их суммой, т.е. W — V\ + ... + Vk] III) докажем, что эта сумма прямая, т.е. W = V\ 0 ... 0 Vk] IV) докажем, что Vi — V\t, откуда уже получим утверждение теоремы. I. Т.к. поле алгебраически замкнуто, то характеристический многочлен можно разложить на линейные множители: Pj (t) — {t — Ai)n • ... • {t — Xk)Tk ? причем r\ + ... + r& = deg Pj (t) = dim W. Рассмотрим многочлены Pi(t) = (t- A0ri -....(*- A,-_1)r'-1 (t - Xt+i)r'+1 •...•(*- \k)r\ т.е. pi(t) — это Pj(t), из которого выкинута г-ая скобка. Обозначим fi = Pi(f) и Vi = Im fi. Докажем, что Vi С V\t. Возьмем произвольный вектор v £ Vi, тогда у него существует прообраз w £ W, v = fiw = pi(f)w. Но (/ - А,- • id)r*v = (/ - А,- • id)r*Pi(f)w = Pf(f)w = О, следовательно, v £ V\t. II. Здесь нам надо доказать, что любой вектор w £ W можно представить в виде w = v\ + ... + Vk, где Vi £ Vi. Т.к. многочлены pi(t),... ,Pk{t) взаимно просты, то существуют такие многочлены qi(t),... , qk{t), что Pi(t)qi(t) + .. .+Pk(t)qk{t) = 1. Тогда pi(f)qi (/) + .. -+Pk{f)qk{f) = id,и для любого w £ W имеем w = Pi{f) qi(f)w+ .. .+Pk{f) gfc(/)w, т.е. w =pi(f)ui + .. .+Pk{f)uk. =ui =uk По определению, Vi = Pi(f)ui £ Im fi = Vi. Мы получили искомое разложение w = v\ + ... + Vk- III. Докажем, что пересечение каждого из подпространств Vi с суммой остальных состоит только из нулевого вектора, т.е. что Vi П (+j^iVj) = {0}, откуда будет следовать, что сумма прямая. Возьмем произвольный вектор а £ V^ П (+j-tiVj), т.е. а £ Vi и а £ +j^Vj. Тогда (/ — Аг- • id)r%a = 0и а — а\ -\-... -\- аг-_х + аг-+х + ... + a>m гДе aj £ Vj. По определению, (/ — Xj • id)Tjaj = О, а, так как при j ф г многочлен pi(t) содержит множитель (t — Xj)rJ, то Pi(f)aj = 0. Поэтому Pi{f)a = Pi{f)ai + ... + Pi{f)o>i-i + Pi{f)o>i+i + ... + Pi{f)ak = 0. Т.к. многочлены (£ - Лг)Гг и Pi(t) взаимно просты, то найдутся такие многочлены u{t), v(t), что u(t)(t — Аг)Гг + v(t)pi(t) = 1, следовательно, u(f)(f — Аг- • id)r% + v(f)pi(f) = id. Тогда a = u(f) (f — Xi • id)r%a-\-v[f) pi(t)a = 0, =o =o т.е. пересечение Vi П (+j^iVj) состоит только из нулевого вектора, поэтому сумма прямая. IV. Возьмем произвольный вектор а £ V\t, тогда, т.к. W — 0^=1^, то а — а1 + а", где а1 £ Vi, а" £ ©j^Vj. Докажем, что ап — 0. Т.к. а £ Удг, то существует такая степень т, 26
что (/ — Х{ • id)ma = 0. Пусть n — тах(ш,гг), тогда (/ — Х{ • id)na = 0 и (/ - Аг • id)na! — 0, следовательно (/ — Х{ • id)na!! — 0. Как было показано в предыдущем пункте, Pi(f)a!! = 0. Т.к. многочлены {t — Х{)п и Pi(t) взаимно просты, то существуют такие многочлены u{t), v(t), что u(t)(t — Xi)n + v(t)pi(t) = 1, тогда a" = u(f)(f — A; -id)naff + v(f)pi(f)aff = 0. Мы доказали, что a = о! G V^, т.е., что Удг С V{. Обратное включение было доказано в первом пункте. Следовательно, У\{ — У% и W = Vai 0 • • • 0 Va^.. Теорема доказана. • Лемма 2.10.2 Пусть p(t) — аннулирующий многочлен для оператора f : W ^ W и пусть его можно разложить в произведение двух взаимно простых многочленов p(t) = Pi(t)p2{t), тпо пространство W является прямой суммой двух подпространств, W = V\ 0 V2, каждое из которых инвариантно и Pi(t) аннулирует сужение f на V{, т.е. Pi(f)Vi = {0}; г — 1,2. Доказательство. Возьмем V\ — lmp2(f) и V2 = Impi(^). То, что Vi инвариантны и их прямая сумма равна W, доказывается так же, как предыдущая теорема о том, что пространство является прямой суммой всех его корневых подпространств. Докажем, что pi(f)V\ = {0}. Возьмем произвольный вектор v\ G Vi, тогда существует такой вектор w G W, что v\ — pi(f)w, тогда pi(f)vi = Pi(f)p2{f)w — p{f)w — 0, т.к. p(t) аннулирует /. Аналогично доказывается, что Р2(/)^2 = {0}. • Применяя эту лемму несколько раз, получаем аналогичное утверждение для произвольного числа сомножителей. Следствие 2.10.3 Пусть p(t) — аннулирующий многочлен для оператора f : W —>■ W и пусть его можно разложить в произведение т взаимно простых многочленов p(t) = pi(t) •... • Pm(t), то пространство W является прямой суммой т подпространств, W = V\ 0 ... 0 Vm, каждое из которых инвариантно и Pi(t) аннулирует сужение f на Vi, т.е. Pi(f)V{ = {0}; г — 1,... ,т. 2.11 Жорданова клетка. Жорданова нормальная форма оператора / А 1 0 ... 0 \ 0 А 1 ... 0 Определение 2.11.1 Матрица Jn(X) называется жордановой 0 0 ... А 1 \ 0 0 ... 0 1/ клеткой размера п с собственным значением А. Блочно-диагональная матрица с жордановыми клетками на главной диагонали называется жордановой матрицей (жордановой формой). Теорема 2.11.2 (Жордана о приведении матрицы оператора к нормальной форме) Для любого оператора f существует базис, в котором его матрица Aj будет жордановой. Такая матрица единственна с точностью до перестановки блоков (клеток). Доказательство. 1) Существование. Если в каждом из корневых подпространств У\г оператора / выбрать базис, а потом из них составить базис всего пространства (это будет просто объединение всех базисов корневых подпространств), то матрица оператора в этом базисе будет блочно-диагональной, / Al о ч Aj = *.. , где матрица Аг-, г — 1,... ,&, — это матрица ограничения f\vx- опе_ V 0 Ак ) ратора / на подпространство У\г. Т.к. каждая из матриц А{ имеет только одно собственное значение Аг-, то оператор f\vx. ~ \ ' id '• У\г ~^ У\г (и его матрица А{) будет нильпотентным, и, согласно теореме о нильпотентных операторах, в У\г существует базис, в котором матрица Jni(0) О оператора f\vx- —Xi-id имеет вид I *.. I . Тогда матрица оператора f\vx- имеет О Jnp(0) 27
Jni (A,-) 0 \ аналогичный вид Аг- = | ' •. , но уже с числами Аг- вместо нулей на диаго- О Jnp(\i) I нали. Следовательно, матрица Aj состоит из жордановых клеток. 2) Единственность. Надо показать, что каким бы способом мы не привели бы матрицу оператора / к жордановой нормальной форме, количество жордановых клеток фиксированной размерности с собственным значением А одно и то же. Для этого зафиксируем собственное значение Xi и посчитаем количество клеток, ему отвечающих. Обозначим через V^ подпространство, отвечающее блоку Аг-, т.е. всем жордановым клеткам с собственным значением А,-. Тогда У W С Vx, и, следовательно, dim ^ dim V\n но, более того, W = yW ф ...ШУИ. Но мы также знаем, что W = V\1 0 ••• 0 V\k, значит dim V^1' + ... + dim V^ ' = dim V\1 + ... + dim V\k, поэтому dim yW = dirnVx^, значит, V^ = V\t для i — 1,... ,&. Мы получили, что при произвольном разбиении на клетки, подпространства, отвечающие клеткам с собственным значением Аг- одинаковы и равны У\г. Таким образом, разбиение матрицы оператора / на блоки, отвечающие различным собственным значениям, единственно. Рассмотрим теперь блок А{ в матрице А/, соответствующий собственному значению Х{. Тогда матрица А{ — \Е будет нильпотентной, а она, как мы уже знаем, имеет единственное разложение на жордановы клетки с собственным значением 0. Значит, матрица А{ имеет единственное разложение на жордановы клетки с собственным значением Аг-, поэтому вся матрица также допускает единственное (с точночтью до перестановок) разложение на жордановы клетки, т.к. разбиение на матрицы единственно, и разбиение каждой из них на жордановы клетки также единственно. Еще одно доказательство единственности жордановой нормальной формы матрицы оператора можно получить по аналогии с аналогичным утверждением для нильпотентного оператора, при этом заодно получатся формулы для количества клеток определенной размерности. Введем числа г&(А) = гк(/ — А • id)k и 7V&(A) — количество жордановых клеток размерности &, отвечающих собственному значению А. Тогда легко заметить, что при вычислении разности rfc+i(A) — г&(А) нужно учитывать только клетки, отвечающие собственному значению А, поскольку ранги остальных клеток Jn% (Аг- — А) не меняются при возведении таких клеток в любую степень (эти клетки невырождены). Поэтому r&+i(A) — r&(A) = 7V&(A) + A^+i(A) + ..., откуда (так же, как для нильпотентных операторов) следует, что 7V&(A) = r&+i(A) + rr_i(A) — 2r&(A). 2.12 Приложения теоремы Жордана I. Задача о рекуррентных последовательностях. Пусть заданы первые к элементов #!,... , Xk некоторой числовой последовательности, и пусть известно, что каждый элемент этой последовательности, начиная с номера к + 1, линейно зависит от предыдущих к элементов по формуле жп+1 = aixn_k+i + а2хп-к+2 + ... + а>кхт п > к. Тогда мы можем последовательно вычислять все элементы этой последовательности. Но как быть, если нам, например, нужно вычислить #2002 5 не будем же мы вычислять по этой формуле все элементы подряд. Если посмотреть на правило, по которому вычисляется каждый следующий элемент, можно заметить, что Vn-k+l \ / %п-к+1 \ / %п-к+2 [ai...a,k) I : , тогда видно, что столбцы | '• I и | '• | связаны Сга+1 ^п+1 между собой оператором, / хп_к+2 \ /0 1 О \ / Xn_k+1 \ V ^п+1 о а2 1 А 28
тогда | | I = A I | !=... = An I | ] , поэтому для вычисления любого элемента Vn+k / \ Хп+к-1 / \ %к последовательности нам достаточно уметь возводить матрицу А в степени. Рассмотрим жорда- нову форму Af матрицы А, пусть С — матрица перехода к жордановому базису, А — CAfC~l, тогда Ап — СА!С~ • СА!С~ • ... • СА!С~ v. А если жорданова форма диагональна, как, напри- п раз мер, у рекуррентного соотношения хп+\ — хп + хп_\ (числа Фибоначчи), то она очень легко возводится в любую степень, и мы легко можем получить формулу общего члена этой последовательности. II. Задача о вычислении функций от матриц. Если функция f(x) достаточно гладкая, т.е. имеет достаточно много производных, то для нее можно написать формулу Тейлора, ко- торая будет иметь достаточно много членов, f(t) = /(А) + |, ' (t — А) + 2\ ' (t — А) + ... + приъ /А 1 04 -—i (^ — А)ш + гт (в качестве последнего слагаемого можно взять, например, остаточный член в форме Лагранжа). Если матрица А — жорданова клетка, А ( f(X) ш f(n-1]^ \ ' J\A> 1! ••• (п-1)! А 1 \0 А/ ТО f(A) , т.е. значение функции f(A) определяется только значе- /(А) ф ' V ° ДА) ) ц нием функции f(t) и ее п— 1 производной в точке t = А, а все производные более высоких порядков (т.е. все последующие слагаемые формулы Тейлора) дают нулевой вклад. То есть, мы можем взять формулу Тейлора для этой функции, обрубить ее на п— 1-й производной, и мы получим многочлен p(t), причем р(А) = /(А), а вычислять значение многочлена от матрицы мы умеем. Если матрица произвольна, то ее нужно привести к жордановой форме, А' = I ' •. , где V 0 Ат ) / ПМ) о \ Ai,... , Ат — жордановые клетки. Т.к. f(Af) = #.# и f(A) = Cf(Af)C~1^ \ 0 __ f(Aml J то формулу Тейлора нам достаточно обрубить на к — 1-й производной, где к — максимальный размер жордановой клетки в жордановой форме матрицы А, тогда мы получим такой многочлен p(t), что р(А) = f(A). Этот многочлен называется интерполяционным. Вопрос: Почему определение f(A) не зависит от способа приведения к жордановой форме ? 2.13 Овеществление и компексификация Овеществление Определение 2.13.1 Пусть V — векторное пространство над полем комплексных чисел С. Рассмотрим пространство V^, состоящее из тех же векторов, что и У, только вместо операции умножения на все комплексные числа мы ограничимся умножением только на вещественные числа. Тогда V^ будет линейным пространством над полем вещественных чисел R, оно называется овеществлением пространства V. Пусть ei,...,en — базис в пространстве У, тогда он не будет базисом пространства V^, так как не все вектора являются их линейными комбинациями с вещественными числами, а на комплексные числа мы больше не можем умножать. Базисом в V^ будут вектора ei,... , еп, гех,... , геп (проверьте), следовательно dim^ V^ = 2 dim^ V (индекс у dim непоминает, над каким полем мы рассматриваем размерность пространства). 29
Определение 2.13.2 Пусть дан оператор / : V —>■ У, тогда этот оператор, рассматриваемый на пространстве V^, называется овеществлением оператора f и обозначается /^. Посмотрим, как связаны матрицы операторов / и /^. Пусть в базисе ei,... , еп пространства V f(ek) — c^ej. Матрицу Aj = (cJk) оператора / можно разложить на вещественную и чисто мнимую часть, т.к. ее элементы — это комплексные числа, т.е. Aj = A-\-iB, где А — (Ree[), В — (Ime[). Тогда матрица оператора /^ в базисе ei,... , еп, гех,... , геп будет иметь вид Ajm = Посчитаем det Ajm, для чего сделаем следующие элементарные преобразования над строками и столбцами матрицы Ajm: (А -В \ ( A-iB -В -iA\ [В А )^{ В А J"> [A-iB -В-iA + i(A-iB) \ _ ( A-iB 0 \ ^ \ В A + iB ) ~ \ В A + iB J ' поэтому det Afm = det(A- iB) det(A + iB) = det (A/) • det Aj = |detA/|2. Комплексная структура Определение 2.13.3 Пусть V — векторное пространство над R. Комплексной структурой на V называется такой линейный оператор j : V —>■ У, что j2 = —id. Тогда пространство У можно рассматривать как векторное пространство над С, так как на V можно ввести операцию умножения на комплексные числа: (а + ib)v := av + bj(v). То, что это определение корректно (свойства v-viii определения векторного пространства), проверяется тривиально. Лемма 2.13.4 Пусть j — комплексная структура на вещественном векторном пространстве V. Тогда 1) dim V четна; 2) в подходящем базисе матрица оператора j имеет вид Aj — Доказательство. 1. Обозначим через V пространство У, рассматриваемое как комплексное (с помошью комплексной структуры j). Размерность пространства V конечна, т.к. по базису пространства V можно разложить любой вектор (возможно неоднозначно). Пусть ei,... , еп — базис в У, тогда ei,... , en, en+i = j(ei),... , е2П — j{en) будет базисом в У, следовательно, dim V = 2п. 2. Т.к. j(e{) = еп+{ и j(en+i) = — в{ для г — 1,... , п, то в этом базисе матрица оператора имеет указанный вид. Комплексификация Определение 2.13.5 Пусть V — векторное пространство над полем R. Рассмотрим пространство Vc = V ®V — {(а, Ъ) : а, Ъ £ V} и определим комплексную структуру следующим образом: j(a,b) := ( — 6, а) (нетрудно убедиться, что j2 = —id). Пространство с такой комплексной структурой называется комплексификацией пространства V. Покажем, что dime Vic = dim^ V. Если ei,...,en — базис в пространстве У, то (ei, 0),... , (еп, 0) будет базисом в пространстве Vc- Действительно, поскольку j(eb 0) = (0, ег), то умножением на мнимую единицу мы можем получить вектора (0, ei),... , (0, еп) и, следовательно, любой вектор (а, 6), где а, Ъ £ V. 5 -Д А Е -Е 30
Определение 2.13.6 Если дан оператор / : V —>■ V, то оператор fc : Vc —>■ Vc, заданный формулой fc(a,b) := (/а,/6), называется комплексификацией оператора /. Легко убедиться, что так определенный /с действительно будет линейным оператором. Если Aj — матрица оператора / в базисе ci,... , сп, то эта же матрица будет матрицей оператора fc в базисе (ci, 0),... , (сп, 0). Посмотрим, что будет, если к векторному пространству применить комплексификацию, а потом овеществление. Утверждение 2.13.7 Векторные пространства (Vc)r uV ®V канонически изоморфны. Доказательство. По определению, Vc и У © У совпадают как множества, поэтому (Vc)r и V 0 V совпадают как множества. Операция сложения при комплексификации и при овеществлении у нас не менялась, а к операции умножения на скаляры мы сначала добавили умножение на комплексные числа, а затем его запретили, следовательно операция умножения тоже не изменилась. Значит (Vc)r иУ©У совпадают как линейные пространства. • Также, как при действиях с комплексными числами, часто вместо пар (а, Ъ) £ Vc мы будем писать а + гЪ. Лемма 2.13.8 Если f : V —>■ V — оператор в вещественном векторном пространстве и dim У J> 1, то в пространстве V существует либо одномерное, либо двумерное инвариантное подпространство. Доказательство. Если dim У = 1, то утверждение леммы очевидно. Если dim У > 1, то пусть А = а + ij3 — собственное значение оператора /с- Тогда в Vc есть собственный вектор а + гЪ, а, Ъ £ V, отвечающий собственному значению А. Тогда fc{a + ib) — [а + г/3) (а + гЬ) — аа — j3b + i[ab + /За), но с другой стороны fc(a + ib) = f(a) + if(b), следовательно, f(a) = аа — j3b и f(b) = ab + /За. Т.к. а и /3 — это вещественные числа, то /(a), f(b) £ (а, 6), значит, (а, 6) — инвариантное подпространство. Очевидно, что оно либо одномерное, либо двумерное (на самом деле оно всегда будет получаться двумерным, если /3/0). 3 Евклидовы и унитарные пространства 3.1 Евклидовы и унитарные пространства Определение 3.1.1 Линейное пространство V над полем R называется евклидовым, если на нем определена функция / : V X V —>■ R (обозначается /(а, Ь) = (а, 6) и называется скалярным произведением), удовлетворяющая следующим свойствам: 1) линейность по второму аргументу: (а, Ъ + Ас) = (а, Ъ) + А(а, с) для любых а, 6, с £ У, А £ R; 2) симметричность: (6, а) = (а, Ъ) для любых а, 6 £ У; 3) положительная определенность: [а, а) J> 0 для любого а £ У, причем, если (а, а) = 0, то а = 0. Видно, что благодаря второму свойству эта функция также будет линейной и по первому аргументу, т.е. она билинейна. Определение 3.1.2 Линейное пространство V над полем С называется унитарным (или эрмитовым), если на нем определена функция / : V X V —>■ С (обозначается /(а, 6) = (а, 6), называется скалярным произведением), удовлетворяющая следующим свойствам: 1) линейность по второму аргументу: (а, Ъ + Ас) = (а, Ъ) + А(а, с) для любых а, 6, с £ V, А £ С; 2) эрмитовость: (6, а) = (а, Ъ) для любых а, 6 £ V] 3) положительная определенность: (а, а) J> 0, причем, если (а, а) = 0, то а = 0. Т.к. (а, а) = (а, а) (свойство 2), то число (а, а) вещественно, и неравенство (а, а) J> 0 имеет смысл. 31
Используя второе свойство можно получить, что (а + А6, с) = (а, с) + А(Ь, с), т.е. она полу(анти)линейна по первому аргументу, такая функция называется полуторалинейной. Пример: Пусть V = ¥L[t] — пространство многочленов над полем К (это один из немногих случаев, когда конечномерность пространства не играет существенной роли и не обязательно ограничиваться многочленами фиксированной степени), возьмем два произвольных вещественных числа а, 6, а < Ъ. Определим скалярное произведение двух многочленов p(t),q(t) по следующей формуле: (р(£), q(t)) = J p(t)q(t) dt. To, что выполнены первые два условия скалярного произведения, сразу вытекает из свойств интеграла, проверим положительную определенность. Действительно, (p(t),p(t)) = J p2(t) dt J> 0, интеграл от неотрицательной функции неотрицателен, причем, если J p2{t) dt = 0, то p(t) = 0. Аналогично, для пространства многочленов над полем С скалярное произведение можно задать формулой (p(t),q(t)) = J p(t)q(t) dt. Определение 3.1.3 Евклидовы и унитарные пространства называются гильбертовыми. Определение 3.1.4 Длиной вектора а в гильбертовом пространстве называется число \а\ = \/0,а). Это определение корректно, т.к. (а, а) J> 0. Лемма 3.1.5 (Неравенство Коши—Буняковского) Для любых двух векторов а, Ъ гильбертова пространства имеет место неравенство |(а, Ъ)\ <С \а\ • \Ъ\. Доказательство. Начнем с более простого — вещественного — случая. Рассмотрим скалярный квадрат (а — А6, а — ХЪ) J> 0, следовательно, для всех А £ R имеем квадратичное неравенство (а, а) — 2А(а, Ъ) + А2(6, Ъ) J> 0, следовательно дискриминант этого квадратного трехчлена неположительный, т.е. (а, Ь)2 — (а, а)(Ь, Ь) <С 0. Перенося (а, а)(Ь, Ь) в правую часть и извлекая корень, получаем искомое неравенство. Перейдем теперь к комплексному случаю. Возьмем произвольное А £ С. Тогда (а —А6, а — ХЪ) — (а, а) — А(6, а) — А(а, Ъ) + |А|2(6, Ъ) J> 0. Т.к. (а, Ъ) — комплексное число, то для некоторого угла <р выполнено равенство (а, Ь) = |(а, Ь)\егср. Ограничимся только теми А, для которых Хегср = fi £ R, тогда наш скалярный квадрат можно переписать в виде (а —А6, а — ХЬ) — (а, а)—2/i|(a, 6)|+/i2(fr, 6). Далее, действуя, как в вещественном случае, получаем нужный результат. Утверждение 3.1.6 Длина удовлетворяет неравенству треугольника, \a-\-b\ ^ \а\ + |Ь|. Доказательство. Из неравенства Коши-Буняковского следует, что (а, Ъ) + (6, а) <С 2|а| • |Ь Добавив к обеим частям неравенства (а, а) + (6, 6), получим (а + Ь,а + Ь) = (а,а) + (&,&)+ (а, 6) + (Ь, а) ^ (а,а)+ (Ь,Ь) + 2|а| • |Ь| = (|а| + Н)2, откуда следует неравенство треугольника. 3.2 Процесс ортогонализации Определение 3.2.1 Два вектора а, Ъ называются ортогональными (а _1_ 6), если (а, 6) = 0. Базис ei,... , еп называется ортонормированным, если (e2-,ej) = ^j, т.е. если векторы базиса попарно ортогональны и длина каждого из них равна 1. Пусть ei,... , еп — некоторая линейно независимая система векторов гильбертова пространства. Обозначим через V{ линейную оболочку первых г векторов, V{ = (ei,... ,ег), и получим расширяющуюся цепочку подпространств V\ С V2 С • • • С Vn. 32
Утверждение 3.2.2 Существует такой набор попарно ортогональных векторов ai,... , ап, что для каждого ноиера г линейная оболочка (ai,... , аг) совпадает с V{. Доказательство, (индукция по количеству векторов) 1) При п — 1 утверждение очевидно. 2) Пусть это утверждение выполнено для количества векторов, равного п, докажем его для п + 1. Т.к. утверждение верно для п векторов, то мы можем считать, что векторы ai,... , ап с указанными свойствами уже построены. Построим вектор an+i в виде an+i = en+i + Ai<2i + ... + Хпап. Линейная оболочка векторов ai,... , an+i совпадает с (ei,... , en+i) при любых Аг-, поэтому мы будем подбирать коэффициенты Х{ так, чтобы выполнялось условие (ап+х,аг-) = О для всех г — 1,... , п. Рассмотрим скалярное произведение 0 = (an+i, а{) — (en+i, а{) + Ai(ai, аг) + ... + Ап(ап,аг-). Поскольку (aj,a{) = 0 при j ф г по предположению индукции, то 0 = (еп+1,аг-) + Аг(аг, аг), следовательно Аг- = — Л+1а'л (знаменатель отличен от нуля). Таким образом, чтобы получить вектор an+i, надо из вектора en+i вычесть его ортогональные проекции на векторы ai,... , ап. Этот метод ортогонализации называется методом Грама- Шмидта. 3.3 Ортогональное дополнение Определение 3.3.1 Пусть V С W — подпространство гильбертова пространства. Ортогональным дополнением VL к V в W называется множество, состоящее из векторов, ортогональных всем векторам из У, т.е. V1- = {v G V : (и, w) = 0 \/w G И^}. Очевидным образом проверяется, что VL является подпространством, а не просто подмножеством. Лемма 3.3.2 И/ = УфУ1. Доказательство. Пусть ei,... , е& — базис в У, дополним его до базиса всего пространства W векторами e&+i,... ,еп. Применив процесс ортогонализации Грама-Шмидта, получим ортогональный базис ai,... ,a&,a&+i,... , ап в ТУ, причем его первая часть будет базисом в У, т.к. (ai,... , a&) = (ei,... , е&) = V. Покажем, что векторы a^+i,... , an образуют базис в VL. Пусть v G V^1, и = z/i<2i + ... + Vkak + ^k+iak+i + • • • + J/nan — разложение вектора v по базису пространства W. Коэффициенты z/i,... , z/& должны быть нулевыми, так как иначе вектор v не был бы ортогонален всем векторам ai,... , a&. Верно и обратное: если первые к координат какого-то вектора в базисе ai,... , ап равны нулю, то этот вектор принадлежит V1-. Следовательно, произвольный вектор w G W может быть представлен в виде суммы двух слагаемых — из У и из VL: w = Aiai + ... + Хкак + Хк+1ак+1 + ... + Anan, т.е. W = V + VL. 4 v ' * v ' Докажем, что эта сумма прямая. Возьмем произвольный вектор v G V П У1. Т.к. и G У1, то (v,w) = 0 для любого вектора w £ V. Поскольку v G У^ мы можем в качестве w взять сам вектор и, тогда (и, и) = 0, значит, v = 0. Следовательно, пересечение состоит только из нулевого вектора, и сумма — прямая. • Из разложения в прямую сумму W = V 0 VL следует, что любой вектор a G W можно единственным способом представить в виде а = а$ + a_L, где ao G У, <2_l G У1. Вектор ао называется (ортогональной) проекцией вектора а на подпространство У, а вектор a_L называется ортогональной составляющей вектора а. Пусть имеется другое разложение вектора а: а = а\ +<22, где а\ G У, (а на <22 дополнительных условий нет), тогда имеет место Утверждение 3.3.3 |«21 ^ |g_i_|. 33
Доказательство. Обозначим а$ — а\ — Ъ £ У, тогда а — а\-\-а2 — а^—[а^ — а\)-\-а2 — <2о + (а2 — 6), следовательно, а2~Ь — a_L, т.е. <22 = а±-\-Ь. Тогда (<22, <22) = (а_ь ^_l) + 2 (aj_, 6) +(6, 6) ^ (aj_, aj_), =o откуда получаем | «21 ^ laJ_|- Определение 3.3.4 Углом между двумя ненулевыми векторами в евклидовом пространстве называется величина (a, b) := arc cos ^\\L- Видно, что это определение не противоречит здравому смыслу, т.е. угол равен нулю тогда и только тогда, когда вектора коллинеарны, и угол — прямой тогда и только тогда, когда вектора ортогональны. Утверждение 3.3.5 (обозначения те же, что и в предыдущем утверждении) (а^ао) ^ Доказательство. Очевидно, что если А > 0, то (а, Ь) = (а, АЬ), т.е. вектор Ъ можно заменить на любой другой, коллинеарный ему (и направленный в ту же сторону). Найдем такое число А, чтобы вектор Ха\ был бы ортогонален вектору Ъ — а — Ха\\ (Aai, а — \а\) — О <Ф=> (ai, а — Aai) — О <Ф=> (ai, а) — A (ai, а\) — 0 <Ф=> А lor да (а, аг) - [а, лаг), cos^a, а0) - ^^ - ^ , cos^a, лаг) - \а\.\Ха1\ - \a\.\\ai\ ~ \а\ ' Следовательно, 2/—- n _ , а0,а0 _ aL.aL . 2/^Т^\ _ 1 (AabAai) _ (6,6) sin (a^So) = 1 = 5 sm (a5 ^ai) = 1 a,a a,a [a,a) [a,a) Т.к. (aj_,a_i_) ^ (6, 6), то sin2(d7So) ^ sin2(a, Aai), и sin(dTSo) ^ sin (a, Aai). Т.к. оба угла принадлежат [0,7г/2] (их косинусы неотрицательны), получаем (а^ао) ^ (a, Aai) = (а^аг). Определение 3.3.6 Расстоянием d(a,V) от вектора а до подпространства V называется наименьшее из всех возможных длин векторов, соединяющих векторы (точки) подпространства V с данным вектором, т.е. d(a,V) '.— minaiGy \а — а\\. Углом (а, У) между вектором а и подпространством V называется наименьший из всех углов между вектором а и произвольным вектором а\ £ У, т.е. (а, У) := minaiGy(a7Si). Очевидно, что d(a, V) — \a_\_\ — расстояние от вектора до подпространства равно длине ортогональной составляющей при проекции вектора на подпространство, а (а, V) = (а^ао) — угол между вектором и подпространством равен углу между вектором и его проекцией на данное подпространство. 3.4 Метод наименьших квадратов Допустим, что мы исследуем какое-нибудь природное явление и хотим описать его линейной формулой, т.е. мы предполагаем, что какая-то величина Ъ линейно зависит от других — ai,... , an, и хотим получить эту зависимость Ь — а\х1 + ... + апжп, т.е. узнать неизвестные коэффициенты ж1,... , хп. Мы делаем т измерений (для точности берем т > тг) и решаем систему уравнений а\х1 + ... + а\хп — Ь1 . Вообще говоря, эта переопределенная система не имеет решения. а™хг + ... + а™хп = Ьт 34
Поэтому нам надо найти наиболее приближенное решение ж1,... , хп в том смысле, что отклонение значений Ь3 от с3 — а\х1-\-.. .-\-а3пхп будет наименьшим. В качестве отклонения удобно рассмотреть корень из суммы квадратов отклонений координат \J(bl — с1)2 + ... + (Ът — с171)2 = \Ь — с|, что равно длине вектора b — с. Будем искать такое псевдо-решение. Рассмотрим векторы CL-t \ I LL гг а\ Пусть У — (ai,... , ап). Обычно т намного больше п, и векторы ai,... , ап линейно независимы. Если они все-таки линейно зависимы, следует отбросить какое-то их количество, чтобы оставшиеся образовали базис подпространства V. Будем считать, что это уже сделано, и векторы ai,... , ап линейно независимы. Спроектируем вектор Ъ на подпространство V. Получим разложение Ъ — bo + b±, и, как мы доказали ранее, |6j_| = \b — bo\ будет наименьшей длиной векторов, соединяющих Ъ с У, т.е. bo определяет искомое максимально приближенное псевдо-решение. Чтобы найти его, разложим вектор bo по базису подпространства У, bo = xla\ + ... + хпап. Тогда, взяв скалярные произведения с векторами базиса, получаем следующие равенства: (ai,x а\ + ... + хпап) = («1,6) (an,xlai + .. . + хпап) = (an,6), т.е. надо решить систему уравнений (уже квадратную): (ai^i)^1 + ... + (аъап)хп = (аь6) (an,ai)xl + ... + (ап,ап)хп = (ап,Ь). Решив ее, найдем координааты ж1,... , хп вектора 6q, которые и есть наше псевдо-решение. Матрица этой системы уравнений / (abai) ... {аиап) G = G(au... ,an) = : •.. : \ (an,ai) ... (an,an) называется матрицей Грама. Далее мы убедимся, что ее определитель отличен от нуля, когда векторы ai,... , ап линейно независимы. Параллелепипеды. Матрица Грама Определение 3.4.1 Пусть ai,...,an — система векторов в векторном пространстве V. Параллелепипедом, натянутым на векторы ai,... , ап называется множество векторов (точек) n(ai,... , ап) = {с £ У : с = х1а\ + ... + хпап, 0 ^ ж1,... , хп ^ 1}. Определение 3.4.2 Определим n-мерный объем Voln параллелепипеда n(ai,... , ап) индуктивно: 1) одномерный объем Voli n(ai) := |ai| — это длина вектора; 2) Voln П(аь ... , ап) := Voln_i П(аь ... , an_i) • d(an, (аь ... , an_i}). Очевидно, что объем есть неотрицательная величина. Корректность этого определения, т.е. независимость объема от порядка векторов при индуктивном переходе, вытекает из следующей теоремы. Теорема 3.4.3 (Voln n(ai,... , ап))2 — det G(ai,... , ап). 35
Доказательство, (по индукции) 1) При п — 1, очевидно, |ai|2 = (ai,ai). 2) Пусть утверждение верно для размерности п — 1, докажем его для размерности п. Спроектируем вектор ап на линейную оболочку векторов ai,... , an_i: ап — (an)0 + (<2n)_L = ^i<^i + • • • + An_ian_i +6, где Ь — (an)_L (т.е. 6 ортогонален векторам ai,... , an_i) и |Ь| = d(an, (ai,... , an_i)). Имеем: (abai flDG^ det G(ai,... , an) — det det det Ai det (abai) . (an,ai) .. (abai) .. (an,ai) ., (abai) (an,ai) (an,ai) ... (a (aban_i) (ab Хгаг + ... + An_ian_i +6) ) (an, Aiai + ... + An_ian_i + b) (aban_i) Ai(abai) + ... + An_i(ab an_i) + (ab6) ) Ai(an,ai)+ ... +An_i(an,an_i) + (an,b) . (aban_i) (abai) \ ; ; +... . (an,an_i) (an,ai) / (abai) ... (aban_i) (aban_i) + An_idet [ : •.. : : ] + (an,ai) ... (an,an_i) (an,an_i) + det det (abai) ... (aban_i) (ab6) (an,ai) ... (an,an_i) (an,b) ( (<^i,^i) ... (aban_i) (ab6) ^ =o (an_bai) ... (an_ban_i) (an_b6) (an,ai) =o (an,an_i) (an,b) V =(&,&) / / (<^i,^i) ... (aban_i) \ = det : •.. : J • (6, 6) = det G(ab ... , an_i) • |6|2 = \ (an_bai) ... (an_ban_i) / = (Voln_i П(аь ... , an_!))2 • H2 = (Voln П(аь ... , an))2. Лемма 3.4.4 Векторы ai,...,an линейно зависимы тогда и только тогда, когда det G(ai,... , ап) — 0. Доказательство. Если векторы ai,...,an линейно зависимы, то, без ограничения общности, можно считать, что ап = Aiai + ... + An_i<2n_i. Тогда Voln Il(ai,... , ап) — Voln_iII( а\,... ,ап— i) • d(an, (ab... ,an_i)) = 0, следовательно, по предыдущей теореме, det G(ai,... , ап) = 0. 36
Пусть теперь det G(ai,... , ап) = 0. Покажем линейную зависимость векторов ai,... , ап. Если аг = 0, то линейная зависимость очевидна. Предположим, что а\ ф 0, и рассмотрим последовательность чисел 0 / Voli n(ai), Vol2(ai,a2,),... , Volnn(ab... , an) = 0. Существует такой номер к, что Vol&_i n(ai,... , a^-i) ф 0, а Vol& n(ai,... , a&)=0. Т.к. Vol* П(аь ... , ак) = VoU-i П(аь ... , a^_i) • ^(а/,, (аь ... , a^-i», то ^(а/,, (аь ... , a^-i}) = 0, т.е. ак G («1, • • • , Gfc_i). Следовательно векторы ai,... , a&, а ,значит, и ai,... , an, линейно зависимы. • Пусть нам дан линейный оператор f : V —> V, где V — гильбертово пространство, пусть также ai,... , an — базис в пространстве У, а Ь{ — /(««')? ^ = 1,--- ,^, — значения оператора на этих базисных векторах. Посмотрим, как связаны матрицы Грама G — G(ai,... , ап) и G' — G(6i,... , Ьп)- Пусть матрица оператора / в базисе ai,... , an имеет вид С — Aj = с1 тогда && = clkai и элементы матрицы G' равны д[- — (bi,bj) = (с^а^^с-а! з -Л, Cj(ak,a>i)cj = c^gkiCj. Следовательно, G' — C'GC. Если базис ортонормирован, то G — Е 1 О О 1 и а = с1 с. Утверждение 3.4.5 Произвольная квадратная матрица G является матрицей Грама для некоторого набора (линейно независимых) векторов тогда и только тогда, когда существует такая (невырожденная) матрица С, что G — С С. Доказательство. =^>: пусть G — G(ai,... ,an), выберем в пространстве ортонормированный базис, пусть / — линейный оператор, переводящий этот ортонормированный базис в векторы ai,... , an, тогда G = C*C, где С = А/. <=: пусть G — С С, тогда С — это матрица некоторого оператора / в некотором ортонорми- рованном базисе ai,... , an, тогда G — это матрица Грама для векторов /(ai),... , f(an). 3.5 Канонический изоморфизм V = V Лемма 3.5.1 Пусть V — двойственное пространство к пространству V. Если V — евклидово пространство, то существует канонический (т.е. не зависящий от базиса) изоморфизм между V и Vf. Если V — эрмитово пространство, то существует канонический изоморфизм между сопряженным пространством V и V1. Доказательство. Зафиксируем произвольный вектор v £ V и рассмотрим функцию lv : V —>■ К, где К есть поле R или С, определенную равенством lv{x) — (и, ж). Линейность этой функции следует из линейности скалярного произведения. Сначала рассмотрим случай, когда V — евклидово пространство. Рассмотрим отображение / : V —>■ V\ определенное формулой f(v) \— lv. Это — линейное отображение, т.к. lVl+\V2 — lVl +A/i2, более того, это отображение не зависит от выбора базиса. Проверим, будет ли / изоморфизмом, т.е. надо доказать, что Кег / = {0} (этого будет достаточно, так как размерности пространств V иУ совпадают). Возьмем произвольный вектор w £ Кег /, тогда f(w) = lw — 0, следовательно, lw{x) — (w, х) = 0 для любого х G V. Но тогда и (гу, w) = 0, значит, w = 0, т.е. ядро отображения / нулевое. Теперь рассмотрим случай, когда V — унитарное пространство. Напомним, что, по определению сопряженного пространства, умножение на комплексные числа устроено по правилу Л • v := Xv. Тогда отображение f : V —> V\ f{v) — /„, также будет линейным (над полем С), 37
потому что l\.v — /д = Xlv. Аналогично вещественному случаю получаем, что ядро / нулевое и / — изоморфизм. • Напомним, что если пространства канонически изоморфны, то их можно просто отождествить с помощью канонического изоморфизма, и в дальнейшем не различать. 4 Операторы в евклидовых и унитарных пространствах 4.1 Изоморфизмы гильбертовых пространств Определение 4.1.1 Пусть V и W - гильбертовы пространства. Отображение / : V —>■ W называется изоморфизмом гильбертовых пространств, если выполнены следующие свойства: 1) / — линейное отображение; 2) / сохраняет скалярное произведение, т.е. (/(а),/(6)) = (а, Ь) для любых а, Ъ £ V] 3) существует обратное отображение f~l : W —>■ У, обладающее свойствами 1 и 2. Утверждение 4.1.2 Два гильбертовых пространства изоморфны (как гильбертовы пространства) тогда и только тогда, когда их размерности совпадают. Доказательство. Если пространства V и W изоморфны как гильбертовы пространства, то они также изоморфны как векторные пространства, поэтому их размерности совпадают. Докажем обратное утверждение. Пусть dim V — dim W — n, ai,... , an — ортонормированный базис в У, a &i,... , Ъп — ортонормированный базис в W. Отображение / достаточно определить на базисных векторах, а затем продолжить на все V по линейности. Пусть f(a{) = Ьг-, г — 1,... ,7г. Проверим условие 2). Возьмем два вектора ж, у £ У, х — хга{, у = уга{. Тогда f(x) = хгЬ{, f(y) = угЬ{ и {f{x)if{y)) — %l{bi,bj)yJ = xl8ijy3 — xl(ai,aj)y3 — (ж, у). Обратное отображение, очевидно, существует и линейно, и также удовлетворяет свойству 2). Утверждение 4.1.3 Пусть f : V —>■ V — некоторое отображение (не обязательно линейное). Если f сохраняет скалярное произведение, то оно линейно. Доказательство. Возьмем ортонормированный базис ai,...,an пространства V. Пусть bj = /(аг), г — 1,... , п. Проверим будут ли вектора образовывать базис (линейно независимы). Т.к. сохраняется скалярное произведение, то (6г-, bj) = (аг-, aj) = 5^, и система векторов &i,... , bn ортонормирована. Проверим ее линейную независимость: если Ai&i + ... + Xnbn = 0, то, умножая скалярно на вектор &&, получаем (&&, Ai&i + ... + Xnbn) = А& = 0. Таким образом, векторы &1,... , Ъп образуют базис (вообще говоря, любая система попарно ортогональных векторов линейно независима). Возьмем произвольный вектор х — хга{, тогда хг — жг(аг-,аг) = (аг-,ж), а, т.к. / сохраняет скалярное произведение, то хг — (аг-,ж) = (/(аг-),/(ж)) = (Ьг-,/(ж)), следовательно, f(x) = хгЬ{. Таким образом, f(x) имеет те же координаты в базисе &i,... , Ьп, что и ж в базисе ai,... , an, следовательно, при отображении / сохраняются координаты. После этого замечания проверка линейности очевидна. Определение 4.1.4 Линейный оператор / : V —>■ V называется изометрией, если |/(а)| = \а\ для любого вектора а £ V (т.е. если он сохраняет длины векторов). Утверждение 4.1.5 Оператор f является изометрией тогда и только тогда, когда он сохраняет скалярное произведение. 38
Доказательство. Если / сохраняет скалярное произведение, то он, в частности, сохраняет и длины векторов. Остается проверить обратное утверждение. Пусть / сохраняет длины векторов (т.е. изометрия). 1) В случае, когда пространство V евклидово, возьмем два произвольных вектора а, Ъ £ V, тогда (а + 6, а + Ь) — (а, а) + (6, Ь) + 2(а, 6), откуда (а, Ь) — \{{а + 6, а + 6) — (а, а) — (6, 6)), следовательно, оператор / сохраняет скалярное произведение. 2) Рассмотрим теперь случай, когда пространство V унитарно. Тогда будем иметь [а-\-Ъ,а-\- Ь) — (а, а) + (6, Ь) + (а, Ь) + (а, 6) = (а, а) + (6, 6) + 2 Re(a, 6), откуда Re(a, 6) = \{{а + 6, a + Ь) — (а, а) — (b,b)), следовательно, вещественная часть скалярного произведения сохраняется. Взяв вектор гЪ вместо 6, получаем (а + гЪ, а + гб) = (а, а) + (гб, гб) + (а, гб) + (гб, а) = (а, а) + (6, 6) + г(а, 6) — г(6, а) = = (а, а) + (6, 6) + г(а, 6) — г(а, Ъ) — (а, а) + (6, 6) + 2г Im(a, 6), следовательно мнимая часть скалярного произведения также выражается через длины векторов, Im(a, Ь) — Yi ((а + ib,a -\- гЬ) — (а, а) — (6, 6)) и, значит, тоже сохраняется. Лемма 4.1.6 Следующие три утверждения эквивалентны: 1) оператор f сохраняет скалярное произведение; 2) оператор f переводит ортонор мир о ванные базисы в ортонормированные; 3) в ортонор мир о ванном базисе матрица Aj оператора f обладает свойством AjAj = Е. Доказательство. 1) => 2) очевидно, т.к. (f(a,),f(a3)) = (аг,а3) = 8гз. 2) =>* 1). Пусть ai,... , ап — ортонормированный базис, hi — /(аг-), и &i,... ,Ьп — также ортонормированный базис. Возьмем произвольные векторы х — хга{ и у = угаг-. Тогда /(ж) = жг6г-, /(у) = У*Ь*, и (f(x)J(y)) = (хгЪг,у3Ъ3) = хг(Ъг,Ъ3)у3 = хг(аг,а3)у3 = (ж, у), значит, / сохраняет скалярное произведение. 2) =>> 3). Возьмем ортонормированный базис ai,...,an, тогда G(/(ai),... , f(an)) = 4 v ' =Е Af G(ai,... , an) Aj, т.е. AfAj = E?. 3) =>> 2). Для любого ортонормированного базиса ai,...,an имеем G(/(ai),... , f(an)) = A/ G(ai,... , an) Af, значит, A* At — E, следовательно, векторы /(ai),... ,/(an) также орто- нормированны. 4.2 Ортогональные и унитарные операторы Определение 4.2.1 Оператор, сохраняющий скалярное произведение в евклидовых пространствах называется ортогональным, в унитарных пространствах — унитарным. Лемма 4.2.2 Пусть оператор f действует в гильбертовом пространстве W, а V С W — инвариантное подпространство. Если f сохраняет скалярное произведение, то VL тоже инвариантно. Доказательство. Возьмем произвольный вектор а £ У1; надо доказать, что /(a) £ У1, т.е., что (/(а), и) = 0 для любого v £ V. Мы знаем, что f(V) С V, но, поскольку ортонормированный базис переходит в ортонормированный базис, то dim f(V) = dim V, следовательно f(V) = V. Тогда найдется такой вектор w £ V, что v = f(w), и тогда (/(а), и) = (f(a),f(w)) = (a, w) = О, что и требовалось доказать. 39
Лемма 4.2.3 Если f — унитарный оператор, то все его собственные значения по модулю равны 1, если же f — ортогональный, то все его собственные значения равны ±1. Доказательство. Пусть А — собственное значение, тогда для собственного вектора v выполнено равенство fv = Xv. Т.к. оператор сохраняет скалярное произведение, то (v,v) = (fv,fv) = (Аи, Xv) = XX(v,v) = |А|2(и,и), а т.к. v ф 0, то (v,v) ф 0, следовательно, |А|2 = 1, т.е. |А| = 1. Если же оператор / ортогональный, то будем иметь (и, v) = А2(и, и), следовательно, А = ±1. Лемма 4.2.4 Если f — унитарный оператор, то его собственные вектора, отвечающие различным собственным значениям, взаимно ортогональны. Доказательство. Пусть Ai ф А2, и fv\ — X\V\, fv2 = X2v2 (^i и v2 — собственные вектора). Тогда (vuv2) = (fvi,fv2) = {XivuX2v2) = XiX2(vuv2), следовательно, либо (vuv2) = 0, т\е. vi _L г?2? либо А1А2 = 1. Но во втором случае, поскольку |Ai| = IA2I = 1, имеем Aj~ = Ai, поэтому А1А2 = Aj~ А2 = 1, откуда следует, что Ai = А2, что невозможно по предположению. Следовательно, векторы v\ и v2 ортогональны. • Теорема 4.2.5 1) Если f : W —>■ W — унитарный оператор, то существует ортонорми- рованный базис, в котором его матрица Aj диагональна, причем на диагонали стоят числа, по модулю равные 1. 2) Если f : W —>■ W — ортогональный оператор, то существует ортонормированный базис, в котором Aj имеет блочно-диагональный вид с блоками размера 1 и 2, причем одномерные блоки — это ±1, а двумерные блоки имеют вид ( . ) для некоторого игла из. > * г \ smLp cos (f J r v т 3) Указанные канонические виды матриц унитарного и ортогонального оператора единственны с точностью до перестановки диагональных элементов и двумерных блоков. Доказательство. 1) Пусть А — собственное значение оператора / (оно существует, т.к. поле С алгебраически замкнуто) и v — собственный вектор, отвечающий этому значению. Тогда V — (v) — одномерное пространство, порожденное вектором v — будет инвариантным. Пользуясь этим замечанием, проведем теперь доказательство по индукции. Если dim W = 1, то утверждение теоремы очевидно. Пусть теорема верна для случая dim W = п, докажем ее для dim W = тг + 1. Возьмем одномерное инвариантное подпространство У, порожденное собственным вектором, тогда W = V0У1, р- ), где А! — матрица оператора /|у±. Ограничение f\y± и матрица Aj имеет вид Aj — . . ., оператора / на VL также будет унитарным (так как / сохраняет скалярные произведения), следовательно, по предположению индукции матрицу Af можно представить в требуемом виде, но тогда и вся матрица будет представлена в таком виде. Поскольку на диагонали будут стоять собственные значения оператора / (и его ограничений), то они все по модулю равны 1. 2) Если у оператора / есть вещественные корни, то с ними можно поступить так же, как и в случае унитарного оператора. Мы знаем, что у оператора / есть либо одномерное, либо двумерное инвариантное подпространство У, из ограничения f\y± мы также можем выделить либо одномерно, либо двумерное инвариантное подпространство и т.д. В итоге мы представим матрицу Aj в блочно-диагональном виде с блоками размера 1 или 2. Причем одномерные блоки — это не что иное, как собственные значения оператора, т.е. ±1. Рассмотрим теперь какой-нибудь двумерный блок и обозначим для краткости через g ограничение оператора / на соответствующее инвариантное двумерное подпространство V. У оператора g нет вещественных собственных значений, т.к. иначе V распадалось бы на два одномерных инвариантных подпространства. Пусть комплексные числа А и А — собственные значения оператора g (они сопряжены друг другу, поскольку коэффициенты характеристического уравнения 40
вещественны). Комплексифицируем У, получим пространство Vc, элементами которого являются векторы вида a + ifr, где а, Ъ £ V. В пространстве Vc есть собственный вектор оператора д, отвечающий значению А, пусть это вектор с £ Vc, тогда дсс = Ас. Пусть А = а + ij3 и с — а + гб, где се, /3 £ IR, а, & £ У. Тогда дас = ga + igb, но, с другой стороны, дсс — Хс — аа — j3b + i(ab + /За), следовательно, имеем да — аа — j3b ж дЪ — j3a -\- ab. Но это значит, что в базисе а, Ъ матрица оператора д имеет вид [о ) • Т.к. а2 + (З2 = |А| = 1, то существует угол у?, для которого -/3 се се = cos у?, /3 = — cos у?. Но тогда матрица оператора </ будет иметь требуемый вид. Следовательно любую двумерную клетку можно привести к такому виду. Осталось доказать, что требуемый вид матрица оператора д имеет в ортонормированном базисе. Для этого достаточно проверить, что \а\ = |Ь| и (а, Ь) = 0 (тогда базис е\ — А, в2 — тп ортонормированный, и матрица оператора д в нем имеет такой же вид, что и в базисе а, Ъ). Имеем (а, а) = (да, да) — (аа — /36, аа — (ЗЪ) — а (а, а) + /3 (6, 6) — 2се/3(а, 6), поэтому т.е. (1 -а2)(а,а) - /32(6, 6) + 2се/3(а, 6) = О, 4 v ' = 02 /Г ((а, а) - (6, 6)) + 2се/3(а, 6) = 0. (4) Аналогично, (а, 6) = (да, #6) = (сеа — /36, /За + себ) = се/3(а, а) + се (а, Ъ) — (3 (а, 6) — се/3(6, 6), поэтому се/3((а,а) - (6,6))+(се2 - /З2 - 1)(а,6) = 0, -2{32 т.е. се/3((а, а) - (6, 6)) - 2/32(а, 6) = 0. (5) Обозначим (а, а) —(6, 6) = ж, (а, 6) = у. Равенства (4), (5) дают систему уравнений для определе- ( в2х + 2аву = 0 ~ u I /З2 2се/3 I 0/э3 2 ния х и у < д д2 _ п * Определитель этой системы ^ ^2 = —2р—2ар — —2р. Поскольку /3/0 (иначе собственное значение А было бы вещественным и нам не пришлось бы возиться с двумерными клетками), определитель системы не равен нулю, следовательно эта система имеет только одно решение, а именно нулевое, т.е. х = (а, а) — (6, Ь) = 0 и у = (а, Ь) = 0, откуда получаем, что длины векторов а и Ъ совпадают, а сами эти векторы ортогональны. 3) В случае унитарного оператора единственность очевидна, т.к. на диагонали там стоят корни характеристического многочлена с учетом их кратности. В случае ортогонального оператора корни характеристического многочлена двумерной клетки являются комплексными корнями характеристического многочлена оператора, следовательно, двумерные клетки тоже определяются однозначно. • 4.3 Сопряженный оператор Лемма 4.3.1 Пусть даны два (не обязательно линейные) отображения f,g гильбертова пространства V в себя. Если для любых векторов а, 6 £ V выполняется равенство (/а, Ь) = (a,gb), то fug — линейные операторы. Доказательство. Поскольку операторы / и g играют симметричную роль, достаточно доказать утверждение леммы для отображения /. Равенство f(a\ + G&2) — f(a>i) — /(^2) = 0 следует из того, что для любого вектора b £ V верно равенство (f(ai + 0,2) — f{ai) ~ f(a2),b) — 41
(f(a1 + a2),b) - (f(a1),b) - (/(a2),b) = (ax + a2,#&) - {augb) - {a2,gb) = (0,^6) = 0. Аналогично проверяется, что f(Xa) = Xf(a): (/(Aa) — A/(a), 6) = (/(Aa), 6) — (A/(a), 6) = (Aa, #6) — A(a, #6) = 0. Определение 4.3.2 Если для оператора f : V ^ V существует такой оператор </, что для любых векторов а, Ъ £ У выполняется равенство (fa,b) = (a, ^6), то </ называется сопряженным оператором для /. Докажем единственность сопряженного оператора. Допустим, что gi и д2 — два сопряженных оператора для /. Тогда (fa,b) = (a,gib) = (а, #2Ь), т.е. (a,gib — д2Ъ) — 0 для любого вектора а, следовательно при любом Ъ имеем gib — д2Ъ — 0, следовательно, gi — д2. Сопряженный оператор обозначается д = f*. Лемма 4.3.3 Если операторы fi и f2 имеют сопряженные f£ и f£ соответственно, то оператор д — fif2 также имеет сопряженный д*, причем д* — f2f{. Доказательство. (/i/2a, b) = (/2a, fib) = (a, f2f^b). • Лемма 4.3.4 Если в ортонор мир о ванном базисе матрица оператора f равна А и существует сопряженный оператор /*, то матрица этого оператора в том же базисе равна А1 (если пространство евклидово) или А (если пространство унитарно). Доказательство. Пусть матрица оператора / в ортонормированном базисе ei,... , еп есть а\ ... а\ Ъ\ ... Ь\ А — | : '. t : I , а матрица оператора /* (в том же базисе) есть В = : #.# : < / и? ... &i_ Тогда а\ = {e3,a\ek) = {e3,fe%) = (/*ej,e,-) = {bl3ehe%) = Ь*, откуда получаем Л = 5 , или 5 = А . Отметим, что условие ортонормированности базиса в лемме является существенным. Следствие 4.3.5 Если /* — оператор, сопряженный к f, то (/*)* = /. Лемма 4.3.6 Для любого оператора f существует ему сопряженный /*. Доказательство. Выберем ортонормированный базис ei,... ,еп, и пусть Aj — матрица оператора / в этом базисе. Тогда матрица А* будет (в этом же базисе) матрицей некоторого . Возьмем произвольные векторы а = агег-, Ъ — Ьгв{. да = (а ... ап) с1 с1 с1 '.. сп и легко видеть, что с\ (a, fb) = (а1 ... ап) [ : •.. : )[ : ] = (Ь,да)= (да,Ь), т.е. д = /*. 42
Утверждение 4.3.7 Если V — инвариантное подпространство относительно f', то V — инвариантное подпространство относительно /*. Доказательство. Возьмем произвольный вектор v G VL, тогда Ми £ V имеем (f*v,u) = (г?? fu) — О, т.к. v G VL, а /и G F. Следовательно, f*v G V^1 для любого и G У1. Определение 4.3.8 Оператор / называется самосопряженным (или симметрическим), если /* = /. Оператор / называется ко со симметрическим, если /* = —/. Оператор / называется нормальным, если /*/ = //*. Кроме того, в терминах сопряженного оператора можно дать другое определение ортогонального (унитарного) оператора: оператор / называется ортогональным (в евклидовом пространстве) или унитарным (в унитарном пространстве), если /* = f~l (или, что то же самое, f*f = id). Заметим, что для матриц операторов будут выполнены эти же свойства, что и для операторов, т.е. матрица симметрического оператора является симметрической (в вещественном случае), матрица кососимметрического оператора является кососимметрической и т.д. Легко показать, что все ортогональные, унитарные, симметрические, кососимметрические операторы являются нормальными операторами (т.е. свойство //*/ = //*, очевидно, будет выполнено). Лемма 4.3.9 Пусть f : W —>■ W — оператор проектирования. Он является самосопряженным тогда и только тогда, когда проектирование является ортогональным. Доказательство. Пусть W — V\ 0 V2, / — оператор проектирования на V\ вдоль V^ тогда V\ — Im /, V2 = Ker/. Условие ортогональности проектирования равносильно условию V\ _L V2- Пусть оператор / самосопряженный. Возьмем произвольные векторы a G Ker/ и Ъ G Im / (тогда Ъ — fc для некоторого с G W), тогда (а, Ь) = (а, fc) = (fa, с) = (0, с) = 0, следовательно а _1_ Ь, откуда получаем Ker / J_ Im /. Предположим теперь, что Ker / J_ Im /. Возьмем произвольные векторы и, v G W и представим их в виде и = и\ + и2, v — v\-\- г?2, где u\,v\ G Im /, и2, v2 G Ker /. Тогда (fu,v) = (fu1,v) + (fu2,v) = {ui,vi + v2) = (u^vi) + (wbu2) = (wbui). =wi =0 =0 Аналогично получаем, что (и, fv) = (^1,^1). Поэтому (fu,v) = (и, fv) для любых векторов u,v £ W, значит, оператор / самосопряжен. 4.4 Канонический вид матрицы самосопряженного оператора Теорема АЛЛ Для любого самосопряженного оператора f : W —> W существует ор- тонормир о ванный базис, в котором его матрица имеет диагональный вид с вещественными числами на диагонали. Указанный канонический вид матрицы самосопряженного оператора единственен с точностью до перестановки диагональных элементов. Доказательство. 1) Короткое и неправильное: приведем матрицу к жордановой форме, под диагональю будут нули, следовательно, т.к. А — А, над диагональю тоже будут нули. Ошибка в том, что жорданов базис в общем случае не будет ортогональным. 2) Правильное. При доказательстве мы будем использовать следующую лемму. Лемма 4.4.2 Если V — инвариантное подпространство относительно самосопряженного оператора f, то V1- также будет инвариантно относительно f. 43
Доказательство. Очевидно, т.к. VL инвариантно относительно /* = /. • Проведем доказательство теоремы по индукции. 1) Пусть dim W = 1. Очевидно, Aj = (а) — диагональная матрица. В случае поля комплексных чисел, а будет вещественным числом, т.к. а — а. 2) Допустим, что теорема доказана для dim W ^ п, докажем ее для dim W — п + 1. Сначала разберем случай поля комплексных чисел. Пусть v — собственный вектор оператора f ^ V — (и), тогда W — УфУ1, причем V и V1- оба инвариантны относительно /, тогда матрица оператора / имеет вид Aj = ( п * ), где ограничение f оператора / на VL тоже самосопряжено, следовательно, по предположению индукции, его можно привести к искомому виду. В итоге матрица Aj будет диагональной, причем, т.к. а = а, на диагонали будут вещественные числа. Теперь перейдем к случаю поля вещественных чисел. Мы знаем, что у любого оператора над полем вещественных чисел существует либо одномерное, либо двумерное инвариантное подпространство. Если у этого оператора есть хотя бы одно одномерное инвариантное подпространство, то можно действовать аналогично предыдущему случаю. Если же у этого оператора имеются лишь двумерные инвариантные подпространства, то его матрица имеет вид ац <2i2 Aj = I а21 a22 0 1 . По предположению индукции матрица ограничения f на ортого- А f нальное дополнение к инвариантному подпространству имеет искомый вид. Осталось лишь разобраться с двумерной клеткой А — ( ). Т.к. At = А, то a2i = ai2. Для дальнейшего \ a21 <^22 J доказательства нам потребуется Лемма 4.4.3 У двумерной симметричной матрицы характеристический многочлен имеет вещественные корни. Доказательство. ац — t а\2 а2\ a22 — t det ( "^ и „^Yl + ) = t2 - (ац + a22)t + а1га22 - а\2. Дискриминант этого многочлена равен D = (ац +а22)2 — 4(аца22 — а\2) — (ац — а22)2 -\-Аа\2 J> 0. • Пусть Ai, А2 — собственные числа матрицы А. Тогда в базисе, составленным из собственных векторов, она имеет вид А — ( п > ). Если Ai = А2, то мы всегда можем выбрать два ортонормированных собственных вектора в качестве базиса двумерного пространства. Если же \г ф А2, то применим следующее утверждение. Лемма АЛЛ Собственные вектора, отвечающие различным собственным значениям самосопряженного оператора взаимно ортогональны. Доказательство. Пусть fv\ — A^i, fv2 = А2и2, тогда (fvi,v2) = (Ai^i,u2) = \i(vi,v2). Но, с другой стороны, (fvuv2) = (vi,fv2) = {vi,\2v2) = \2(vi,v2). Таким образом, Xi(vuv2) = A2(^i,u2), следовательно, (vi,v2) = 0, т.к. Ai ф A2. • Доказательство существования канонического вида закончено. Единственность следует из того, что на диагонали там стоят корни характеристического многочлена с учетом их кратности. 44
4.5 Канонический вид матрицы кососимметрического оператора Теорема 4.5.1 У любого кососимметрического оператора f : W —>■ W над полем комплексных чисел существует ортонормированный базис, в котором его матрица Aj имеет диагональный вид с чисто мнимыми числами на диагонали. Доказательство. Мы знаем, что если V С W инвариантно относительно /, то и VL будет инвариантно относительно /. Т.к. /* = —/, то /*(V~L) = — f{VL) = f{VL) С VL, т.е. V1- будет инвариантно относительно /. Следовательно матрицу оператора / можно привести к диагональному виду (таким же способом, каким мы делали это ранее — по индукции, соответ- /Al ° \ ствующий базис будет ортонормированным), Aj = *.. . Т.к. /* = —/, то А = — А, V 0 Хп J следовательно Х{ = — Аг-, г — 1,... , п, следовательно все Х{ — чисто мнимые числа. • Теорема 4.5.2 У любого кососимметрического оператора f : W —>■ W над полем вещественных чисел существует ортонормированный базис, в котором матрица Aj имеет блочно- диагональный вид, причем все блоки либо одномерные (равные нулю), либо двумерные, имеющие Доказательство. Разложив пространство W на инвариантные подпространства (одномерные или двумерные) оператора /, получим искомый блочно-диагональный вид. Т.к. А* = — Aj, то на диагонали этой матрицы стоят нули, следовательно все одномерные клетки нулевые, и по диагонали двумерных клеток стоят нули. Таким образом, двумерные клетки имеют вид ( , п но из того же свойства кососимметричности следует, что Ъ — —а. Единственность канонического вида матриц кососимметрических операторов с точностью до перестановки блоков также следует из того, что эти блоки определяются характеристическим многочленом оператора. 4.6 Неотрицательные и положительные операторы. Извлечение неотрицательного квадратного корня из оператора Определение 4.6.1 Оператор / : V —>■ V называется неотрицательным, если 1) г = /, 2) (/и, v) J> 0 для любого v G V Упражнение: в случае поля комплексных чисел первое условие является следствием второго, а в вещественном — нет. Лемма 4.6.2 Оператор f является неотрицательным <^=^> в некотором ортонор мир о ванном базисе его матрица диагональна с неотрицательными элементами на диагонали. Доказательство. =^>: Т.к. /* = /, то существует ортонормированный базис ei,... , еп, в котором матрица one- / А, О X ратора диагональна, Aj = * •. , Аг- G К. Тогда (/ег-, ег) = Аг-^ 0 для всех г — 1,... , п. V 0 Хп ) <=: очевидно. 45
Лемма 4.6.3 (извлечение квадратного корня) Если f — неотрицательный оператор, то существует (и притом единственный) такой неотрицательный оператор д, что д2 = /. Доказательство. Существование. Т.к. / — неотрицательный, то в некотором ортонормированном базисе его /Al ° \ матрица имеет вид Af = •. _ , причем все Аг- ^ 0. Возьмем оператор д с матрицей V о \п ) /лАГ о \ Ад = •. # в этом же базисе, тогда д2 = /. \ 0 у/К ) Единственность. Пусть наряду с оператором </, построенным выше, существует еще один такой неотрицательный оператор /г, что h2 = /. В некотором базисе ai,... , ап матрица оператора /v^T о \ д имеет вид Ад = '-. I . а т.к. оператор h неотрицательный, то и его матрица в V о ^/к ) /Mi о \ некотором (вообще говоря другом) базисе &i,... , Ьп имеет вид Ah = '•. • Т.к. Аг- V 0 fln / и ji2 — это собственные значения оператора / (с учетом кратности), то /^ совпадают с л/Xi с точностью до перестановки. Без ограничения общности можно считать, что они уже переставлены так, чтобы fii в точности совпадали с л/\~{. Построим изометрию и, переводящую один базис в другой, u(a,i) — Ьг-, тогда (u*hu)ai — (u*h)bi — и*fifoi — jiiU*bi — y\iU*bi — у Аг-аг- = </аг-, следовательно, u*hu — д и h — иди* (т.к. оператор и обратим и и~1 — и*). Возведя обе части этого равенства в квадрат, получим f — д — (u*hu) — u*huu*hu — u*h и — и*fu, значит, uf = fu, т.е. оператор и перестановочен с /. Если бы и был перестановочен и с </, т.е. если бы было верно равенство ид = ди, то тогда получилось бы, что h = иди* = дии* = </, что нам и нужно доказать. Докажем перестановочность и с д. Пусть матрица оператора и в базисе ai,... , ап имеет вид (в этом базисе матрицы операторов / и д имеют диагональный вид). и\ ... и\ \ / Ai 0 \ / \хи\ ... \пи\ < ... </ \ 0 \п ) \ Ai< ... ХпК \iu{ ... Xiu^ аналогично, Aju = I : #.# : I . Перестановочность и с f означает, что Хпи^ ... Ап< \ги3г = \jufiij. (6) Точно так же получаем, что Х^ .. . л/Ки^ \ / л/\~1и\ .. . л/X^ul : •. : ' Ади — \ ; • . ; Ai^i • • • VKK / \ VKui ... л/КК 46
Из равенства (6) следует, что л/Xiuj = y/XjU^ для всех i,j, т.е. ид — ди. Единственный неотрицательный квадратный корень из неотрицательного оператора / мы будем обозначать f1'2. Лемма 4.6.4 Оператор f неотрицателен тогда и только тогда, когда f = h*h для некоторого оператора h. Доказательство. Если / неотрицателен, то в качестве оператора h можно взять квадратный корень из /. Если / = h*h, то /* = (/i*/i)* = /г*(/г*)* = h*h = /, т.е. / — самосопряженный. Для любого вектора а имеем (fa, а) = (/г*/ш, а) = (/га, ha) J> 0, следовательно, / — неотрицательный. Определение 4.6.5 Оператор / называется положительным, если он неотрицателен и обратим. Для любого положительного оператора существует ортонормированный базис, в котором его матрица диагональна, причем на диагонали стоят положительные числа. Лемма 4.6.6 Если оператор f : V —>■ V положителен, то формула (а, Ъ) \— [fa, Ъ), где а, Ъ £ V, задает (новое) скалярное произведение (•, •} в гильбертовом пространстве V со скалярным произведением (•,•). Доказательство. Проверим необходимые условия скалярного произведения: 1) линейность очевидна, т.к. оператор / линейный и скалярное произведение (•, •) также линейно; 2) симметричность следует из самосопряженности /; 3) положительная определенность: (а, Ъ) ^ 0, т.к. (а, Ъ) — (fa, а) = (д2а,а) = (да, да) ^> О, где д — неотрицательный квадратный корень из /. Причем оператор д положителен, поскольку обратим (иначе f — д2 был бы необратим). Равенство (а, а) = 0 эквивалентно (да, да) = 0, или да = 0, но из обратимости д отсюда вытекает а = 0. Полярное разложение операторов На примере комплексных чисел мы знаем, что они допускают так называемое полярное разложение — разложение в виде z = г-е^, где г ^ 0 — вещественное число, и \ег(^\ = 1. Оказывается, что подобным образом можно раскладывать и линейные операторы. Теорема 4.6.7 (о полярном разложении) Для любого оператора f : W —>■ W существует разложение в произведение двух операторов f = uh, где и — унитарный (или ортогональный), ah — неотрицательный. Причем оператор h определен однозначно, а, если f обратим, то и и определен однозначно. Доказательство. Мы докажем эту теорему только для случая, когда оператор / обратим. Существование. Т.к. / обратим, то и /* обратим, а, следовательно, и /*/ обратим. Более того, /*/ — неотрицательный, следовательно, он положительный. Пусть h — (J*/)1/2, тогда h — неотрицательный и обратимый, т.к. К2 — /*/, т.е. существует самосопряженный (и даже положительный) оператор h~l. Рассмотрим оператор и — fh~l. Тогда и* — (/^_1)*/* = h~l/* и и*и — h~l/*fu — h~lh2h~l — id, следовательно, и — унитарный (или ортогональный) оператор. Мы получили искомое разложение / = uh. Единственность. Пусть f — uh — vk, где и, v — унитарные (ортогональные), a h,k — неотрицательные операторы. Тогда имеем К2 — f*f — (vk)*vk = k*v*vk = k*k = k2, т.е. h и k — это неотрицательные квадратные корни из /*/, следовательно, k — h (здесь мы не пользуемся обратимостью /), и, значит, u — v — fh~l. 47
4.7 Канонический вид матрицы нормального оператора Теорема АЛЛ Оператор f, действующий в унитарном пространстве W, является нормальным (т.е. /*/ = ff*) тогда и только тогда, когда в некотором ортонор мир о ванном базисе его матрица диагональна. Доказательство. Если в некотором ортонормированном базисе матрица оператора / диа- Ai О тональна, Aj = I •. # I , то матрица сопряженного оператора имеет в том же базисе О вид А/* =| •. ш | . Так как AjAj* = А/*А/, то /*/ = //*. О А„ Теперь перейдем к доказательству существования ортонормированного базиса, в котором матрица нормального оператора диагональна. Пусть А — собственное значение оператора /, V = {v G W : fv = Xv} С W - подпространство собственных векторов, отвечающих А. Подпространство У, очевидно, инвариантное относительно /, будет инвариантно также относительно /. Действительно, возьмем произвольный v £ V. Тогда f*fv = /*Аи = А/*и, но с другой стороны, f*fv = ff*v, поэтому f(f*v) = А/*и, следовательно, вектор /*г? является собственным, отвечающим тому же собственному значению А, поэтому /*г? £ У, что и доказывает инвариантность V относительно /*. Мы знаем, что, если подпространство инвариантно относительно /, то ортогональное дополнение инвариантно относительно /*. Т.к. V инвариантно относительно обоих операторов / и /*, то и V1- будет инвариантно относительно обоих операторов. Доказательство теоремы проведем по индукции (по размерности пространства) точно так же, как и в предыдущих теоремах о приведении к диагональному виду. Возьмем инвариантное подпространство У, тогда в подходящем ортонормированном базисе его матрица имеет блочный вид Aj = ( —~-\ ). Ограничения оператора / на V и VL тоже нормальны, следовательно (по предположению индукции) эти блоки диагональны в подходящих базисах, следовательно, и вся матрица диагональна. 5 Билинейные и полуторалинейные функции 5.1 Билинейные функции (формы) Определение 5.1.1 Пусть V — векторное пространство над полем К. Функция g : V X V К называется билинейной функцией, если она линейна по каждому аргументу, т.е. д(аг + а2,Ъ) = д(аъЪ) + д(а2,Ь) Уаг,а2,Ь £ V] д(\а, b) = Ag(a, Ь) \/а, Ъ £ У, А £ К; д(а, bi + Ь2) = д{а, Ьг) + д(а, Ь2) \/а, Ьь Ь2 е V] д(а, ХЬ) = \д(а, Ь) \/а, Ъ е V, А £ К. Если выбрать базис ei,... , еп в пространстве У, то билинейную функцию можно записать матрицей G — (gij), где gij = g(ei,ej). Причем (если базис зафиксирован), то существует взаимнооднозначное соответствие между квадратными матрицами и билинейными функциями, т.е. любая матрица задает какую-то функцию и разные матрицы задают разные функции. Пример. Если д(а,Ь) = (а, Ь) — обычное скалярное произведение в евклидовом пространстве, то д будет билинейной функцией, а ее матрица G будет просто матрицей Грама. Поэтому на матрицу билинейной функции можно смотреть как на обобщение матрицы Грама. 48
Если G — матрица билинейной функции </, то значение этой функции на двух любых векторах восстанавливается по формуле д(х,у) = g(xlei,y3ej) — xlg(ei,ej)y3 — хгд^у3 или, в матричной форме / у1 д{х,у)= (ж1... xn)G I : V Уп При замене базиса е'к — сгке{, где С = (сгк) — матрица перехода, матрица билинейной функции изменится следующим образом: 9ы = 5(4>е/) = 5(4ei,cfe) = с\д(е%,е3)с\ = с\д%3с\, т.е. G' — ClGC', где G" — матрица той же билинейной функции в новом базисе. На множестве билинейных функций можно естественным образом определить структуру линейного пространства (над тем же полем К), причем размерность этого пространства будет п2, где п — dim V. Обозначается оно B(V). Очевидно, что B(V) = Mat(n X тг). В случае поля комплексных чисел рассматривают также полуторалинейные функции. Определение 5.1.2 Пусть V — векторное пространство над полем С. Функция f : V X V —>■ С называется полуторалинейной функцией, если она линейна по второму аргументу и антилинейна по первому, т.е. д(аг + а2,Ъ) = д(аъЪ) + д(а2,Ъ) Уаг,а2,Ь £ V] д(\а, b) = Ag(a, Ь) \/а, Ъ £ У, А £ С; д(а, bi + Ь2) = д(а, Ьг) + д(а, Ь2) \/а, ЪЪЪ2 £ У; ^(а, ЛЬ) = \д(а, 6) \/а, 6 £ V, А £ С. И в этом случае можно, аналогичным образом, ввести понятие матрицы полуторалинейной функции, но при переходе к новому базису матрица полуторалинейной формы будет изменяться по формуле G' — С GC. Определение 5.1.3 Рангом билинейной (полутроалинейной) функции называется ранг ее матрицы в произвольном базисе, ткд = гкС Формулы перехода к другому базису показывают, что это определение корректно. Действительно, поскольку матрица перехода С обратима, rk C*GC = rkC GC = гкС 5.2 Канонический изоморфизм B(V) = L(V,V'). Невырожденность Пусть L(V, V!) — пространство всех линейных отображений / : V —>■ V\ где V — двойственное пространство к V. Пусть нам дано такое отображение f : V —> Vf, и ei,... , еп — базис в V. Возьмем произвольный вектор ж £ У, ему отвечает линейная функция f(x) £ V', f(x) : V —>■ К. Возьмем произвольный вектор у £ У, тогда функционал f(x) можно применить к вектору у: f(x)y = f(x%e%)y3e3 = x%f(e%)e3y3 = хг' fl3y3, где fij = f(ei)ej. Таким образом, элементу / £ L(V,Vf) ставится в соответствие матрица F — (fij)- Обратно, каждая матрица F = (fij) задает (если зафиксирован базис) отображение / : V —>■ V по формуле f(x)y — хгfijy3. Другими словами, фиксация базиса устанавливает изоморфизм L(V,V) = Mat(n х п). Лемма 5.2.1 Пространства B(V) и L(V,Vf) канонически изоморфны. 49
Доказательство. Возьмем произвольное билинейное отображение д £ B(V) и зафиксируем его первый аргумент, тогда получится линейное отображение V —>■ К, заданное формулой х н->■ д(а, ж), следовательно, д(а,х) Е V при фиксированном а. Теперь мы можем построить отображение B(V) —>■ £(У, V) по следующему правилу: билинейному отображению д Е 5(У) ставим в соответствие отображение д : V —>■ У', определенное равенством </(а) = д(а,х). Ясно, что <7 Е £(V, У'). Можно построить также и обратное отображение: пусть / : V —>■ V — линейное отображение, тогда j(a) Е V при фиксированном а Е У, т.е. f(a)b Е К и /(ж, у) = f(x)y — билинейная функция, т.е. / Е 5(У). Эти два отображения — д i—>■ #, /' i—>■ / — взаимно обратны, следовательно они осуществляют изоморфизм B(V) = L(V, V). Т.к. этот изоморфизм не зависит от выбора базиса, то это канонический изоморфизм. • Докажем канонический изоморфизм B(V) = L(V,Vf) еще одним способом (с помощью матриц). Выберем базис ei,... ,еп в У, возьмем отображение д Е B(V), пусть G — (gij) — его матрица, т.е. gij = g(ei,ej). Возьмем двойственный базис г1,... ,гп в V' и отображение д : V —>■ V (то же, что и в предыдущем абзаце). Пусть G — (gij) — его матрица, т.е. д(е{) — gijS3. Посмотрим, как связаны между собой матрицы G и G. С одной стороны, g(ei)ek = (gij£3)ek — 9ik, а с другой стороны, g(ei)ek = #(ег-, е&) = </г&, следовательно, матрицы GhG совпадают в произвольном (но одном и том же) базисе, откуда и следует канонический изоморфизм B(V) = L(V,Vf). • Как мы уже знаем, при фиксированном первом аргументе билинейная функция х н->■ д(а,х) — ад(х) является линейным функционалом. Аналогично, при фиксированном правом аргументе имеем линейный функционал х н->■ д{х,а) — да{%)- Фиксация первого (соотв. второго) аргумента определяет отображение Lg : V —>■ V равенством а н->■ ад (соотв. отображение Rg : V —>■ V равенством а н->■ да). Определение 5.2.2 Левым ядром билинейной функции g Е B(V) называется множество Gl = {а Е V : g(a,b) = О V6 Е V}. Правым ядром билинейной функции называется множество GR = {aeV : g(b, а) = О V6 Е V}. Очевидно, что множества Gl и Gr являются подпространствами в V. Лемма 5.2.3 Размерности левого и правого ядер совпадают и равны dim Gl — dim Gr = dim V — rk g. Доказательство. Т.к. матрица G билинейной функции g : V X V —>■ К и матрица Al9 отображения Lg : V —Ь V (см. предыдущую лемму) совпадают, то гкС = гкА^ . Более того, а Е Gl тогда и только тогда, когда а Е KerLg, т.е. Gl — Ker Lg. Т.к. dim У' = dim У, то dim Gl — dim Ker Lg = dim V' — rk Al9 = dim У — rk g. Аналогично (заменяя первый аргумент на второй), легко видеть, что матрица G1 совпадает с матрицей Arq отображения Rg : V —>■ V и dim Gr — dim У' — rkG* = dim У — rkg. Определение 5.2.4 Билинейная функция g называется невырожденной, если dim Gl — dim Gr = 0 (это условие равносильно тому, что detG ф 0 или rkg = dim V). Примеры: 1) пусть G = ( n п )• Найдем левое и правое ядро: g(a,b) = (а1 аг) ( n п ) ( а2 ) = а1^2- Следовательно, Gx = (^2) и Gr = (ei}5 гДе еъе2 — базис. 2) билинейная функция может быть невырождена на всем пространстве, но быть вырожден- ! И Г ( -1 ° ^ f 1 нои на подпространстве! Например, пусть G = I п . 1, рассмотрим вектор а — I . подпространство У = (а). Т.к. д(а,а) — 0, то для любых двух векторов 6, с £ V (т.е. колли- неарных вектору а) д(а,Ь) = 0, т.е. ограничение билинейной функции д на подпространство V вырождено, в то время как сама функция д невырождена, т.к. detG ф 0. Отметим, что в этом примере левое и правое ядро совпали, потому (как мы увидим далее) что функция симметрична. 50
5.3 Симметричные, кососимметричные и эрмитовы функции Если д : V X V —>■ К — билинейная функция, то функция (а, Ь) н->■ д{Ъ, а), полученная из функции д заменой первого и второго аргументов, также является билинейной функцией. Мы будем ее обозначать д1, дг[а,Ъ) — д{Ъ,а). Это же обозначение мы будем использовать и для полуторали- нейных функций над полем комплексных чисел. Определение 5.3.1 Билинейная функция д называется симметричной, если д1 — д, т.е. если д(Ь,а) = д(а, 6); ко со симметричной, если д1 — —д, т.е. если д(Ь,а) = —д[а,Ъ). Над полем комплексных чисел полуторалинейная функция д называется эрмитовой, если д1 — д, т.е. если д(Ъ,а) = д(а,Ь). Формально можно также ввести понятие косоэрмитовой полуторалинейной функции, удовлетворяющей условию д(Ь,а) = —д[а,Ъ), однако мы сейчас убедимся, что это понятие сводится к понятию эрмитовой функции. Лемма 5.3.2 Если д — косоэрмитова функция, то гд — эрмитова. Доказательство. Нам дано, что д1 — —д. Умножим обе части этого равенства на мнимую единицу, гд1 = -гд = гд. • Утверждение 5.3.3 Если билинейная функция симметрична (или ко со симметрична), то ее левое и правое ядра совпадают. Доказательство. Очевидно (см. определение левого и правого ядер). В случае (косо)симметричной билинейной функции g корректно определено ее ядро Кет g = G\ — Gr. Определение 5.3.4 Функция / : У -Л К называется квадратичной функцией (формой), если существует такая билинейная функция д, что f(a) = д(а, а) для любого а £ V. Заметим, что если / — квадратичная функция, то f(a + b) = д(а -\-Ъ,а -\-Ъ) — д(а, а) + д(а, Ь) + д{Ъ, а) + д{Ъ, Ъ), следовательно, g(b,a) + g(a,b) = f(a + b) — f(a) — f(b). Если поле К не характеристики 2 (поля характеристики 2 мы вообще далее не будем рассматривать, поскольку нам часто придется исползовать деление пополам), то определим билинейную функцию h равенством h(a, b) = т;(д(а, b) + g{b, а)). Эта функция является симметричной и h(a, а) = д(а, а) = f(a), т.е. ее можно использовать вместо произвольной функции д в определении квадратичной функции. Таким образом, определение квадратичной функции можно сделать более жестким, а именно потребовать симметричность функции д. Мы получили, что любая симметричная билинейная функция д задает квадратичную функцию / равенством /(а) = д(а,а), и наоборот, по формуле g(a,b) = \(f(a + b) — f(a) — f(b)) любая квадратичная функция задает симметричную билинейную функцию. Ясно, что это соответствие взаимно однозначно, когда характеристика поля К отлична от 2. Утверждение 5.3.5 Любая билинейная функция допускает единственное разложение в сумму симметричной и кососимметричной билинейных функций. Доказательство. Существование указанного разложения очевидно, т.к. g — \{g + gf) + \{g — gf)- Единственность. Сначала убедимся, что если билинейная функция одновременно симметрична и кососимметрична, то она нулевая. Действительно, если д(а, Ь) = д{Ъ, а) — —д(Ь, а), то 2д{Ъ, а) — О, поэтому (характеристика поля не равна 2) д{Ъ, а) — 0 для всех а, Ъ. Пусть теперь функция д обладает двумя разложениями указанного вида, д — д\ + </2 = hi +^25 где д\, h\ симметричны, а #2? ^2 кососимметричны. Тогда 0 = (</i — /н) + (<72 — ^2)5 откуда следует, что как функция #2 — ^25 так и функция дг — hi, должна быть одновременно симметричной и кососимметричной, поэтому обе эти функции равны нулю. 51
5.4 Ортогональное дополнение Определение 5.4.1 Пусть V С W, а на ТУ задана (косо)симметричная билинейная функция д, тогда VL = {а £ W : #(а, 6) = О V6 £ V}. Пример. Пусть G = ( п л ) в базисе е\,е2 и пусть а = е\ + 62. Обозначим Vi = (ei), V2 = (^2)5 0 Х , У3 = (а). Тогда V^~ — V^ ^з~ — ^з- Видно, что ортогональное дополнение в случае произвольной билинейной симметричной функции не очень похоже на обычное ортогональное дополнение. Случай кососимметричной билинейной функции будет выглядеть еще более экзотичным. Лемма 5.4.2 dim У1 J> dim ТУ — dim V, причем равенство достигается тогда и только тогда, когда Кег </ П V — {0}. Доказательство. Выберем базис ei,... ,ег в У. Тогда любой вектор Ъ £ V можно записать в виде Ь — Ьгв{, 1 <С i <С г. Тогда условие а £ V1- эквивалентно равенствам </(а, ег) = 0 для всех г — 1,... , г. Дополним выбранный базис до базиса всего пространства. Тогда на п координат вектора а мы будем иметь систему из г линейных уравнений ( g(a,ei) = 0 [ g{a,er) = 0. Размерность пространства решений этой системы (т.е. пространства VL) удовлетворяет неравенству dim V1- ^ п — г — dim W — dim V (здесь стоит неравенство, потому что некоторые уравнения системы могут быть линейно зависимыми). Равенство будет достигаться тогда и только тогда, когда ранг этой системы равен в точности г, т.е. все строки линейно независимы. Пусть для некоторых коэффициентов Х{ ^2 Л*#(а, ei) = g{a, ^ \гег) = д{а, Ь) = 0 i=l г=1 (здесь Ъ — ^Ji-i^i^i £ V). Если ранг системы уравнений меньше г, т.е. если строки линейно зависимы, то это равносильно тому, что для некоторого Ъ £ У, Ъ ф 0, равенство д(а,Ь) = 0 выполнено для всех а £ W (т.е. отображение а н->■ #(а,Ь) тождественно равно нулю). Но это значит, что Ъ £ Кег </, или, другими словами, V ПКет д ф {0}. Но тогда линейная независимость, наоборот, означает, что У П Кег д = {0}. • Лемма 5.4.3 У П У1 = Кег ду, где ду — ограничение д на V. Доказательство. Возьмем произвольный вектор а £ У П У1, тогда а £ У и д(а,Ь) = 0 для любого Ъ £ У, поэтому, по определению, а £ Кет ду. Возьмем произвольный вектор с £ Kergy, тогда с £ У (т.к. ду определена только на У) и д(с, Ь) — 0 для любого Ь £ У, следовательно, с £ У1, поэтому с £ У П У1. • Следствие 5.4.4 £Ъш Kergy = {0} (т.е. ограничение д на V не вырождено), то W — V®VL. Доказательство. Т.к. У П У1 = {0}, то У + У1 = У 0 У1 С ТУ (т.е. сумма — прямая), причем dim (У ф У1) = dim У + dim У1 ^ dim У + (dim ТУ — dim У) = dim W, следовательно, УФУ1 = 1У. 52
Лемма 5.4.5 Если ограничения д на V и на VL невырождены, то (V^)1- = V. Доказательство. Вложение V С (^/_L)"L имеет место независимо от условий на д. Действительно, если a G V, то д{а, Ь) — 0 для любого Ь £ VL. Докажем совпадение V и (У1)1. Поскольку ограничения д на У и У1 навырождены, имеют место разложения W — V ® V1- = У1 0 (У1)1. Поэтому dim У = dim(y-L)-L, и из совпадения размерностей пространства (V~L)'L и его подпространства V следует их совпадение. Лемма 5.4.6 Пусть W — V (&V1-, ei,... , ег — базис в V, er+i,...,еп — базис в VL. Тогда в базисе ei,... , еп матрица билинейной функции имеет вид G - О Доказательство. Поскольку при г <С г, j > г (и наоборот, при i> г, j <^ г) g(e{,ej) = 0, так как векторы ег-,е^ принадлежат различным прямым слагаемым, то в левом нижнем и правом верхнем углах матрицы будут нули. 5.5 Нормальный вид матрицы (косо)симметрической или эрмитовой функции Посмотрим подробнее, как устроены линейные пространства с заданными на них (косо)симметричными билинейными функциями. Начнем с одномерного случая. I. Симметричная функция в одномерном вещественном пространстве. Пусть е £ V — базис в У, а = ае и Ъ — /%, тогда g(a,b) = aj3g(e,e). Если g(e,e) = 0, то такая функция вырождена на V. Если д(е,е) > 0, то, изменив длину базисного вектора, можно получить такой вектор е', что g(ef,ef) = 1. Если д(е,е) < 0, то таким же способом можно получить g(ef,ef) = —1. Таким образом, существует базис, в котором матрица (одномерная) этой функции имеет один из трех видов, а именно (0), (1) или ( — 1). П. Симметричная функция в одномерном комплексном пространстве. Этот случай аналогичен предыдущему. Если </(е, е) — А £ С, то, умножением е на А-1/2 можно получить такой вектор е', что g(ef,ef) = 1. Итак, в этом случае существует базис, в котором функция имеет один из двух видов — (0) или (1). III. Эрмитова функция в одномерном комплексном пространстве. Поскольку д(а,а) = д(а,а), то д(а,а) вещественна для любого а. Если е! — уе, то д(е!,е!) — \у\д(е,е), т.е. д(е!,е!) имеет тот же знак, что и </(е, е). Поэтому в этом случае матрица функции опять имеет один из трех видов - (0), (1) или (-1). IV. Кососимметричная функция. Т.к. д(е,е) = — </(е,е), то любая кососимметричная функция на одномерном пространстве тождественно равна нулю. В двумерном случае, если д не тождественно равна нулю, то найдутся такие векторы а, 6, что д(а,Ь) = а ф 0. Приэтом эти два вектора обязаны быть линейно независимыми, (если Ъ — Аа, то д(а,Ь) = \д(а,а) = 0) следовательно они образуют базис в двумерном пространстве. В этом базисе матрица функции д ^ ( д(а,а) g(a,b) \ / 0 а \ 0 - lL имеет вид G = )т ( )ь\{ = п • Взяв базис е\ — а, в2 — —о, получим в нем матрицу G — ( . п ) • Таким образом, у любой кососимметрической функции на двумерном ( ° 1\ пространстве существует базис, в котором ее матрица имеет один из двух видов — I in) или { 0 0 Теорема 5.5.1 1) у любой симметричной билинейной функции на вещественном векторном пространстве существует базис, в котором ее матрица имеет диагональный вид с числами 0, ±1 на диагонали. 53
2) у любой симметричной билинейной функции на комплексном векторном пространстве существует базис, в котором ее матрица имеет диагональный вид с числами 0; 1 на диагонали. 3) у любой эрмитовой полу тор алинейной функции на комплексном векторном пространстве существует базис, в котором ее матрица имеет диагональный вид с числами О, ±1 на диагонали. 4) у любой ко со симметричной билинейной функции на вещественном или комплексном векторном пространстве существует базис, в котором его матрица имеет блочно-диагональный вид с блоками ( . n ) и (0) на диагонали. Доказательство. Пункты 1)-3). Лемма 5.5.2 Если g ф 0; где g — функция из пунктов 1)-3) теоремы, то существует такой вектор а, что д(а, а) ф 0. Доказательство. Предположим противное. Пусть д(а, а) — 0 для любого вектора а. Тогда, т.к. д(а + 6, а + Ъ) — д(а, а) — д(Ъ, Ь) — д(а, Ь) + д(Ъ, а), то д(а, Ь) + д(Ъ, а) — 0 для любых векторов а, Ъ. Если д — симметричная, то сразу получаем д(а,Ь) = 0. Если д — эрмитова, то имеем g(a,b) + g(a,b) = 2Re(g(a, b)) = 0. Взяв вместо вектора Ъ вектор гб, получим Re(g(a, гЪ)) — Im(</(a, Ъ)) — 0 для любых векторов а, Ъ. Следовательно наша функция д тождественно нулевая, что противоречит предположению. • Далее будем действовать по индукции (база индукции dim ТУ = 1 уже проверена). Пусть утверждение теоремы верно для dim V < 7г, докажем его для dim W — п. Если д — 0, то ее матрица нулевая и всё очевидно. Если же д ф 0, то возьмем такой вектор а £ ТУ, что д(а,а) ф 0 (по лемме он существует). Возьмем V — (а) С W. Т.к. ограничение ду функции д на V невырождено, то W — V 0 VL и dim У1 = п — 1. По индукции в VL уже существует нужный базис, добавив к нему вектор (точнее, некоторое его кратное е = Аа, такое что д(е,е) = ±1), получим искомый базис. 4) Если д ф 0, то найдутся такие линейно независимые векторы а, Ъ £ ТУ, что д(а,Ь) ф 0. Без ограничения общности можно считать, что д(а,Ь) = 1. Возьмем V = (a, Ь) С W. Ограничение ду функции д на V невырождено, т.к. матрица функции ду равна ( in)' слеДовательно5 W — V 0 У1, и dim У1 = п — 2. В VL по предположению индукции можно выбрать нужный базис. Добавив к нему векторы а и 6, получим искомый базис. • Указанный вид матрицы называется нормальным. Для приведения матрицы симметричной билинейной или эрмитовой функции к нормальному виду удобно использовать метод Лагранжа выделения полных квадратов. Дадим его краткое описание. / х1 \ / у1 \ Любая билинейная функция имеет вид д(х, у) = gijXly\ где х — : L у = : .Заменив \хп ) \уп ) у на ж, получим квадратичную функцию д(х,х) = gijXlx3. Возможны два случая: а) Если все коэффициенты при (хг)2 равны нулю, это можно исправить: найдем ненулевое I /у» ^ /у» ^ I /у» V слагаемое вида д^х х и сделаем замену координат s / ~k ~i , тогда ж ж — (ж )2 —(ж)2. б) Если имеется ненулевое слагаемое вида дц(хг)2 (без ограничения общности можно считать, что i = 1), тогда выделим полный квадрат, содержащий (ж1)2: / \ Л i\2 , 2#i2 12, , ^ды 1 п\ 1 д[х,х) = дц [ (х ) -\ ж ж + ... -\ ж ж + слагаемые, не содержащие ж = ( 1 i 512 2 | | 5ln гЛ2 | 1 — 9и\х Н ж +...Н ж + слагаемые, не содержащие ж . v 5ii 5ii / 54
Сделав замену координат л/Ьп + 912 911 ' + ...+ 9ln юП 911 получим д( ±( Л\2 + ....С оставшимися слагаемыми, не содержащими х , можно проделать то же самое, в итоге ±( Л\2 ± -2\2 ±...± Г/с\2 , т.е. в новом базисе матрица функции д будет получим, что д{х, а диагональной. Итак, мы знаем, что для любой билинейной вещественной симметрической функции в векторном пространстве W существует базис, в котором она имеет нормальный вид д(х,у) = :1у1 + ... + хрур ГР+1уР+1 гР+ЯуР+Я Аналогично, комплексная билинейная симметрическая функция имеет нормальный вид д(х^ у) = Х1у1 + . . . + X у . Нормальный вид эрмитовой функции — д{х, у) — х1у1 + ... -\-хрур — xpJrlypJrl — ... — xpJrqypJrq. А кососимметрическая функция имеет нормальный вид д{х, у) — х1у2 — х2у1 + х3у4 — х4у3 + ... + х2% 1у2г х2гу2г 1. 5.6 Единственность нормального вида Теперь обсудим вопрос о единственности нормального вида. Для комплексной билинейной симметричной функции (соотв. для кососимметричной функции) нормальный вид определяется единственным числом — к (соотв. 2г), которое равно рангу функции, поэтому не зависит от способа приведения к нормальному виду. Оставшиеся два случая похожи друг на друга, поэтому обсудим один из них — случай вещественной симметричной билинейной функции. Нормальный вид ее матрицы z1 G \ V О/ Введем в рассмотрение три числа: р — количество единиц q — количество минус единиц, s — количество нулей. Видно, что р-\- q = rkg, s = dim ТУ — ткд следовательно, р + q и s не зависят от выбора базиса. Определение 5.6.1 Набор чисел (p^q^s) называется сигнатурой вещественной симметричной билинейной функции (или квадратичной функции). Если функция д невырождена, то s = 0, и для определения ри q достаточно знать хотя бы одно из них или их разность. Поэтому в случае невырожденной функции сигнатурой часто называют число р — q. Теорема 5.6.2 (инерции) Если вещественная симметричная билинейная функция в пространстве W приведена к нормальному виду двумя разными способами, то числа р, q и s одни и те же. Доказательство. Пусть функция g имеет нормальный вид в двух базисах: ^1 •> • • • •> &pi ^р+1 •> • • • •> &p-\-qi ^p+g + 1 •> • • • •> €p-\-q-\-s И в\ , . . . , вр/, вр>-|_1 , . . . , вр/_|_д/, вр/_|_д/_|_^ , . . . , ep/_|_g/_|_s/, причем, как мы уже знаем, sf = s и pf + q' — р + q. Рассмотрим в W подпространства V+ (еъ ,ер), V- (ep+i,... , ep+g), Vq — (ep+g+i,... , ep+q+s) V+ = (еь ... , ep/}, V- = (<V+i,... , V+g/}, V0 = (ep/+g/+1,... , ep/+g/+s). Если x G V+ и x ф 0, то g(x,x) > 0 (неравенство строгое, так как ограничение функции g на V+ невырождено). Действительно, если е\ + .. . + жрер, то д{х,; Л\2 + ...+ 55
(хр)2 > 0. Аналогично, если х £ V- 0 Vo, то д(х,х) <С 0. Такая же ситуация имеет место с подпространствами V+, V- и Vo- Пусть £> > У, тогда dim V+ = £>, dim(V_ ф Vo) = dim V_ + dim Vo = q' + s — dim ТУ — pf. Следовательно, dim V+ + dim(y_ 0УО) = |) + dim W - pf > dim W, значит, пересечение этих подпространств нетривиально, V+ П (V_ 0 Vo) Ф {0}. Возьмем произвольный ненулевой вектор их этого пересечения, х £ V+ П (V_ 0 Vo). Т.к. х £ V+, ж / 0, то д(х,х) > 0, но, с другой стороны, т.к. х £ V_ 0 Vo, то д(х,х) <С 0. Получили противоречие. Случай р < р! рассматривается аналогично. 5.7 Теорема Якоби. Критерий Сильвестра Сигнатура и нормальный вид симметричной билинейной (или квадратичной) функции могут быть определены и без нахождения в явном виде замены координат. Напомним, что угловым минором порядка к квадратной матрицы называется минор, составленный из первых к строк и к столбцов. Теорема 5.7.1 (Якоби) Пусть G — матрица симметричной билинейной функции д в некотором базисе. Пусть все угловые миноры до порядка г = гкС отличны от 0. Тогда существует базис, в котором функция g имеет вид g(x,y) = JGilx1?/1 + j^~p22/2 + •••+ \q \хГуг> где \В{\ — i-й угловой минор. Доказательство. Будем искать новый базис в виде е[ = ei; ef2 = е2 + cle[] 4 = е3 + с\е[ + с§е'2; еп = еп \ спе1 \ • • • \ сп еп-1-> где ei,... ,еп — тот базис, в котором нам дана матрица функции д. Такое преобразование удобно тем, что (также как в обычном процессе ортогонализации) для любого номера к линейные оболочки векторов ei,... , ек и векторов е^,... , ек совпадают. Матрица перехода при таком преобразовании верхнетреугольна, т.е. имеет вид С — \ *-. , поэтому ее определитель V о 1 / равен 1. Кроме того, поскольку изменение матрицы G при такой замене координат сводится к элементарным преобразованиям строк и столбцов, определители угловых миноров не изменяются (иначе это можно показать так: если мы ограничимся первыми к координатами и пространством (ei,... ,е&), то матрица перехода Ск также будет иметь единичный определитель, и матрица углового минора изменится по формуле G'k — CkGkCk, поэтому \Gk\ = |C^||Ga;||Ca;| = |G&|). Коэффициенты c\ будем искать следующим образом. Сначала мы их найдем для индексов j <С г, где г = гкС Коэффициент с\ определим из равенства g(ei,e2) = д^е^е^) = 0. Это равенство дает уравнение g(ei,e2) + c\g(ei,e\) — 0, которое имеет решение, поскольку по предположению д{е\, е\) — \G\\ ф 0. Аналогично можно найти с\ и с\ из условия д(е'3, е[) = д(е'3, е2) = 0, затем — с\^ с\ж с\ж т.п. пока нижний индекс не станет равным г. Действительно, если мы уже нашли векторы ef>,... , ^^_!, то коэффициенты сгк для вектора ек ищутся из условия д^^е^) = ... = g(ekiek-i) — 0) которое дает систему линейных уравнений { <i9{e'1,e'1) + ... + cl-1g{e'k_1,e'1) = -д{ек,е'х) { с1кд(е[,е,к_1)+... + скк-1д(е,к_1,е,к_1) = -д{ек,е!к_1) 56
Эта система имеет решение, так как ее матрица невырождена — ее определитель равен |G&_i| (если бы мы не заменили векторы ег- на е', то матрица системы просто совпадала бы с к — 1-м угловым минором, а при заменах указанного вида определитель угловых миноров не изменяется). Таким образом, мы можем найти векторы 4,... ,е'г нового базиса. При этом матрица функции д примет вид / 9(e'i,e[) V * #«,4) * * где левый верхний угол — диагональная матрица. Отметим, что ранг этой диагональной матрицы равен г (ранг углового минора не меняется), поэтому все значения д(е^е^) отличны от нуля при 1 <С г <С г. Оставшиеся векторы е'г , 1?... , е'п найдем из условия д(е[, ef-) — 0, если г <С г a j > г. Для этого надо взять е 63 9«,е[)е1 (H^j\ef. Теперь матрица функции д примет вид 9\erier) ( 9{е[,е[) \ 0 #(4,4) 0 * У а, поскольку ранг этой матрицы равен г, т.е. рангу углового минора порядка г, то правый нижний угол этой матрицы равен нулю. Окончательно, в построенном базисе матрица функции д примет вид /</«,ei) I \ ff(4,4) о G' V Поскольку \G'k\ — \Gk\ для всех к — 1,... , п, имеем равенства \G1\ = \G'1\=g(e'1,e'1); \G'2\ = \G2\=g(e'1,e'1)g(e2,e2) = 1^(4 е'2) Ф= \G'3\ = \G3\ = \G2\g(e3le3) = \G2\g(e3le3) 4= \G'r\ = \Gr\ = {G^g^O = |Gr-ib(4,<) В построенном базисе 4,... , e'n функция g имеет вид о/ 9(4, ез) д(е'г,е'г) \G2\ \Gi\ \G3\ \Оз\ \Gr \G r-1 g{x,y) что и требовалось доказать. д{еъе1)х у + ... + g(er, er)xryr |Gi|xV + S l^i I .V + ...+ |Gr |G гЖ у r-1 Определение 5.7.2 Симметричная билинейная функция д в вещественном пространстве V называется положительно определенной, если ее сигнатура равна (dim У, 0,0) (эквивалентное определение — если д{х, х) > 0 для любого ненулевого х £ V). 57
Теорема 5.7.3 (Критерий Сильвестра) Функция д положительно определена тогда и только тогда, когда в ее матрице G (в произвольном базисе) все угловые миноры положительны. Доказательство. Если все угловые миноры положительны, то по предыдущей теореме функция g имеет вид g(x,x) = Ai(x1)2 + ... + Ап(жп)2, где п — размерность пространства, а Xi > 0 при всех г — 1,... , п, следовательно, д положительно определена. Обратно, предположим, что функция д положительно определена. Докажем сначала, что все угловые миноры будут ненулевыми. Отметим сразу, что \G\ — \Gn\ ф 0, т.к. функция д невырождена и ее ранг равен п. Поскольку функция д положительно определена, то и ее ограничения на любые подпространства также будут положительно определенными, а, следовательно, и невырожденными. Т.к. Gk — это матрица ограничения д на (ei,... ,е&), то \Gk\ ф 0 для всех к. Следовательно, все угловые миноры ненулевые. Воспользуемся предыдущей теоремой: чтобы функция </(ж, у) = X\x1y1 + ... + Хпхпуп была невырожденной (т.е. чтобы все Аг- были положительными) необходимо, чтобы все \G{\ были положительными. 5.8 Пространства с обобщенным скалярным произведением. Группы операторов, сохраняющих скалярное произведение Определение 5.8.1 Вещественное пространство с заданной на нем невырожденной симметричной билинейной функцией называется псевдоевклидовым пространством. Комплексное пространство с заданной на нем невырожденной эрмитовой полуторалинейной функцией называется псевдоэрмитовым пространством. Вещественное пространство с заданной на нем невырожденной кососимметричной билинейной функцией называется симплектическим пространством. Первые два случая являются естественными обобщениями евклидового и эрмитового пространств. Скалярное (обобщенное) произведение задается симметричной билинейной или эрмитовой полуторалинейной функцией </, (ж, у) = д{х, у) — х1у1 + ... + хрур — жр+1ур+1 — ... — хпуп (в псевдоэрмитовом случае добавляется комплексное сопряжение). Если в нормальном виде функции д все знаки — плюсы (т.е. если д положительно определена) то псевдоевклидово пространство является просто евклидовым, а псевдоэрмитово пространство — эрмитовым (унитарным). Матрица G функции д является обобщением матрицы Грама. В псевдоевклидовом и псевдоэрмитовом случае будем говорить, что базис ei,...,en ор- / \ /О при г ф j если а\е^еЛ — < , л . / . ^v " 3) у ±1 при г — j :, х) = 0 для любого вектора х. тонормирован, можно, т.к. д . В симплектическом случае такое невоз- Однако невырожденная кососимметричная / о функция имеет вид -1 О V о о -1 \ / (т.е. без клеток размера 1, т.к. наличие нулевой одномерной клетки противоречит невырожденности функции д). Следовательно, размерность четна. Пусть матрица функции д имеет указанный вид в базисе ei,... ,в2Ш. Рассмотрим базис ei, ез,... , в2Ш-1, ^2, ^4,... , в2Ш, в этом базисе матрица функции д имеет вид / V ■1 1 \ о . Такой базис называется гамильтоновым. В симплектическом про- / странстве значение функции д на паре векторов также называют их скалярным произведением (еще более обобщенным, чем псевдоевклидовое или псевдоэрмитово). 58
Рассмотрим теперь операторы, действующие в псевдоевклидовом, псевдоэрмитовом или сим- плектическом пространстве V. Пусть оператор / : V —>■ V сохраняет скалярное произведение, т.е. g(fx, fy) = д{х, у) для всех ж, у е V. Лемма 5.8.2 Все операторы, сохраняющие скалярное произведение, образуют группу. Доказательство. Очевидно, что если операторы /i,/2 сохраняют скалярное произведение, то и их композиция также его сохраняет: g(fif2x, fif2x) — 9^НХ^2У) — д{х^у)- Если обратный оператор существует, то он также сохраняет скалярное произведение: д(х,у) = g(ff-1xjf-1y) = g(f-1xj-1y). Нам осталось показать, почему обратный оператор существует для любого оператора /, сохраняющего скалярное произведение. Возьмем какой-нибудь базис ei,... , еп, пусть А = (а1:) — матрица оператора /, G — д^ — матрица функции д в выбранном базисе. Тогда условие сохранения скалярного произведения примет вид: д(х,у) = 9ijXly3 = g(fxjy) = дыакгхга13у3 = (АгСА)гзхгу3, т.е. G — AfGA (в псевдоэрмитовом случае надо еще учесть комплексное сопряжение, G — A GA). Т.к. матрица G невырождена, то и А обязана быть невырожденной, следовательно, существует и А-1, которой соответствует (в том же базисе) оператор f~l. • Если G — единичная матрица, то А1 А = Е (в псевдоэрмитовом случае А А — Е)^ж эти условия выделяют ортогональные (унитарные) матрицы. Введем в рассмотрение следующие группы операторов: • псев до ортогональная группа О (р, q) — группа операторов, сохраняющих псевдоевклидовое скалярное произведение с сигнатурой (р, д, 0) (если q — 0, то группу 0(р, 0) называют ортогональной и обозначают 0(р)). • псевдоунитарная группа С/(р, q) — группа операторов, сохраняющих псевдоэрмитовое скалярное произведение с сигнатурой (р, д, 0) (если q — 0, то группу 0(р, 0) называют унитарной и обозначают U(p)). • симплектичеспая группа Sp(2m) — группа операторов, сохраняющих симплектическое скалярное произведение в пространстве размерности 2т. Дадим описание этих групп в малых размерностях. Группа 0(2) — группа операторов, сохраняющих скалярное произведение на плоскости. Такие преобразования могут собственными или несобственными (сохранять ориентацию плоскости или менять ее). Если оператор сохраняет ориентацию, то это просто поворот на некоторый / cos <z? — sin <z? \ угол <р и его матрица имеет вид I . I, а если оператор меняет ориентацию, то это \ sin LD COS Lu J I cos <z? sin (z? еще и композиция с симметрией, и матрица имеет вид I . \ sin Lp COS (р Группа 0(1,1). В этом случае скалярное произведение задано формулой д(х,у) = х1у1 — х2у2 и вектор с координатами ж, у будет иметь длину ±1, если х2 — у2 = ±1, т.е. если его конец лежит на одной из гипербол, х2 — у2 = 1 или х2 — у2 = —1. В этом случае стандартный базис е\ — (1,0), в2 = (0,1) также будет ортонормированным, но при повороте вектора е\ против часовой стрелки, вектор в2 будет поворачиваться по часовой стрелке и новый орто- нормированный базис е^е^ будет симметричен относительно прямой у — х. В этом случае матрица А оператора, сохраняющего скалярное произведение, должна удовлетворять условию A1 i n J А = ( п 1 ) • Здесь будет уже не два, как в случае 0(2), а четыре различных класса операторов: ( ch (р sh(p \ ( — ch (р — sh (р \ ( ch (р sh (р \ ( — ch (р — sh (р \ \ sh(p ch(p J ' I sh^ ch (p J ' I — sh (p — ch (p J ' I — sh (p — ch (p J 59
Поэтому иногда говорят, что псевдоортогональная группа состоит из четырех компонент. Рассмотрим теперь симплектическую группу Sp{2). Матрица скалярного произведения имеет вид ( in)* Матрица А оператора, сохраняющего скалярное произведение, должна удовлетворять условию А1 ( . ) А = ( . n ), что равносильно условию det А = 1 (проверьте!). Таким образом, группа Sp{2) совпадает с группой матриц, имеющих единичный определитель, 5X2 0^)- Однако при больших размерностях пространства симплектические группы не совпадают ни с какими, уже известными нам. 5.9 Симметрические билинейные функции на евклидовом пространстве Приступим к рассмотрению симметрических функций на евклидовом пространстве. Пусть нам задано такое пространство V со скалярным произведением (•, •). Раньше мы установили следующие два канонических изоморфизма: 1) если V — евклидово пространство, то V = V. Этот изоморфизм в сторону V —>■ V можно записать, например, следующим образом: а G V н->■ (а, •) G V1'. 2) В(V) = L(y, V!) для любого пространства V (здесь евклидовость ни при чем). Этот изоморфизм можно записать так: B(V) Э д •—>■ д G L(y, V), где д(а) G V определяется соотношением д(а)(Ь) = д{а,Ъ). Из этих двух изоморфизмов видно, что для евклидова пространства имеем канонический изоморфизм В(V) = L(V, V) = L(y), т.е. мы избавляемся от "лишнего" пространства V'. Проще всего этот изоморфизм будет записать в обратную сторону, т.е. L(V) —>■ B(V). Пусть / G L(y), т.е. f : V —> V) тогда оператору / можно поставить в соответствие билинейную функцию gj(a,b) — (/а, Ъ). Отображение / н->■ gj, L(V) —>■ B(V), задает изоморфизм. Действительно, т.к. размерности пространств L(V) и B(V) совпадают, то достаточно проверить лишь то, что у этого отображения нулевое ядро, т.е. проверить, что если gj = 0, то и / = 0. Если (/а, 6) = О для всех а, Ъ G V, то, зафиксировав а, получим, что (/а, Ь) = 0 для любого 6, следовательно, fa = 0. Но т.к. это равенство выполняется для всех а, то / = 0. Отсюда следует существование обратного отображения B(V) —>■ L(y), B(V) Э д •—>■ fg G L(y), где оператор fg определяется равенством g(a,b) = (fga,b). Лемма 5.9.1 1) Если функция д симметрична, то fg — самосопряженный оператор. 2) Если f — самосопряженный оператор, то gj — симметричная функция. Доказательство. 1) Пусть д(а,Ь) = д{Ъ,а) для всех а, Ъ G V, тогда (fgb,a) = (fga,b) = (b,fga), что означает самосопряженность. 2) Если (/а, Ь) = (а, fb) для всех а,Ь £ V, то #/(а, Ь) = (/а, Ь) = (а, fb) = (/6, а) = #/(Ь, а), т.е. <// симметрична. • Исходя из этой леммы можно сделать вывод, что, поскольку самосопряженный оператор можно привести к диагональному виду, то то же самое можно сделать и с симметричной билинейной функцией. Теорема 5.9.2 Пусть д — симметричная билинейная функция на евклидовом пространстве V, тогда существует ортонормир о ванный базис, в котором ее матрица диагоналъна. Доказательство. Для самосопряженного оператора fg существует ортонормированный ба- /А, ОХ зис ei,... , еп, в котором его матрица диагональна, Ajg = •. # , где Х{ — веществен- V о хп ) ные числа. Это значит, что jge{ — Аг-ег-, г — 1,... , п. Рассмотрим матрицу G функции g\G — (gij)- По определению д^ = #(ег-, ej) = (fge{, ej) = (Аг-ег-, ej) = A^-j, т.е. матрица G диагональна и, более того, равна матрице Ajg. 60
Другое доказательство. Возьмем матрицу G билинейной функции в каком-нибудь орто- нормированном базисе. При переходе к другому базису матрица этой функции преобразуется по правилу G' — ClGC', где С — матрица перехода. Поскольку С — матрица перехода от одного ортонормированного базиса к другому ортонормированному, то матрица С ортогональна, следовательно, С1 — С~1. Следовательно, матрица билинейной функции преобразуется по правилу G' — C~lGC. Но по такому же правилу преобразуются линейные операторы, а для них уже известна теорема о приведении к диагональному виду. Лемма 5.9.3 Указанный в теореме диагональный вид единственен с точностью до перестановки диагональных элементов. Доказательство. Диагональные элементы Аг-, г — 1,... , тг, удовлетворяют уравнению det(G — ХЕ) = 0, однако при переходе к другому ортонормированному базису это уравнение имеет тот же вид: det(G'-XE) = det (C'GC- AC'C) = det(C"(G-A£)C) = (det C)2det(G- XE) = 4 v ' =1 det(G — XE), и его корни, тем самым, не зависят от выбора ортонормированного базиса. Определение 5.9.4 Этот диагональный вид называется каноническим видом билинейной функции. Собственные векторы оператора fg называются главными осями функции </, и иногда приведение к каноническому виду называют приведением к главным осям. Например, в трехмерном пространстве уравнение д(х,х) = 1 задает поверхность второго порядка, а ее уравнение в главных осях имеет вид Ai(x1)2 + Х2(х2)2 + Аз(ж3)3 = 1. 5.10 Пара симметричных билинейных функций Теорема 5.10.1 Пусть на векторном пространстве V заданы две билинейные симметричные функции g и h, и пусть g положительно определена, т.е. д(х,х) > 0 Мх ф 0. Тогда существует базис в V, в котором одновременно матрица функции g имеет нормальный вид, а матрица функции h — канонический (т.е. матрица функции g единична, а матрица функции h — диагональна). Доказательство. Идея доказательства состоит в том, что, поскольку функция g положительно определена, то на У с ее помощью можно определить скалярное произведение по формуле (а, Ъ) \— g(a,b) (все аксиомы скалярного произведения легко проверяются). Следовательно, на V можно ввести структуру евклидового пространства. При этом в любом ортонормированная базисе (относительно введенного только что скалярного произведения) матрица Грама (она же — матрица функции д) будет единичной. По предыдущей теореме существует ортонормированный базис, в котором матрица функции h имеет канонический вид. • Покажем, как найти канонический вид функции h и канонический базис. Рассмотрим определитель det(H — AG), где Н — матрица функции /г, a G — матрица функции д в некотором базисе ei,... , еп. Введем скалярное произведение с помощью функции д. Пусть е^,... , efn — ортонормированный базис (по отношению к введенному скалярному произведению). Пусть Н1 и G1 — матрицы этих функций в базисе е^,... , е'п. Пусть также С — матрица перехода от базиса е^,... , е'п к ei,... , еп. Тогда G = С1С!С и Н = ClHfC', причем, т.к. базис е^,... , efn ортонорми- рован, то G' — Е. Получим det (Я - AG) = det (С*Я7С - \СгЕС) = detCtdet(F/ - A£)detC, следовательно, многочлены det(H — XG) и det(Hf — ХЕ) отличаются лишь числовым множителем, значит их корни совпадают. Т.к. диагональные элемента канонического вида функции h — это 61
корни многочлена det(Hf — ХЕ), то они будут также корнями уравнения det(H — XG). Последнее уравнение называется обобщенным характеристическим уравнением, для пары симметричных билинейных функций. Нахождение канонического базиса. Пусть х — собственный вектор матрицы Н', отвечающий собственному значению А. Пусть X — столбец координат этого вектора в ортонормированном базисе ei,... , еп, а X' — столбец координат этого же вектора в первоначальном базисе е^,... , е'п. Чтобы найти Х\ нужно решить уравнение (Hf — XE)Xf = 0. Т.к. X' — СХ, то это уравнение равносильно уравнению (Н'-ХЕ)СХ = 0, домножим его слева на С1 и получим Ct(H/ — ХЕ)СХ = 0, т.е. (H-\G)X = 0. Мы только что получили доказательство следующей леммы: Лемма 5.10.2 Корни многочлена det(H — XG) не зависят от выбора базиса и являются диагональными элементами канонического вида матрицы функции h, а координаты векторов канонического базиса ищутся как решение системы уравнений .(Н — XG)X — 0. Покажем на примере, что требование положительной определенности хотя бы одной из двух функций существенно. Пусть билинейные симметричные функциии g и h заданы матрицами п f ° 1\ и ( 1 ° ^ W G = I . п I и г/ = I n i J • ^и °Дна из них не является положительно определенной. Допустим, что существует базис, удовлетворяющий условию теоремы, тогда уравнение det(H — XG) = 0 должно иметь вещественные корни (т.к. эти корни суть диагональные элементы матрицы канонического вида функции К). Но это уравнение не имеет вещественных корней, следовательно, такого базиса не существует. 6 Тензоры 6.1 Тензоры. Пространство тензоров Пусть нам задано векторное пространство V (над полем К), и пусть V' — двойственное пространство. Возьмем произведение р экземпляров пространства V и q экземпляров пространства V и рассмотрим функцию Т :V X ...xVxV X ...xV ^К, р раз q раз т.е. Г — функция от р векторов и q линейных функций, принимающая значения в К. Такая функция называется полилинейной, если она линейна по каждому аргументу при фиксированных остальных аргументах, т.е. если выполняются равенства: T(v1,...,v,i + v,/,...,vp,f1,...,f') = !>!,... + !>!,... Т(уъ... ,\vi,... ,vp,f\... ,fq) = XT(vu.. T(v1,...,vp,f1,...,f« + f"i,...,r) = T(vu... + T(Vl,... T{vx,...,vp,f\...,\p,...,F) = XT{vu.. v'l,...,vp,f\...,P) + v'/,...,vp,f\...,r), 5 Vi 5 ' ' ' 5 Vp, J ,...,/ ) , vp,f\...,f'j,...,r) + Vp5 J ?•••?/ ?'••?/ ) 5 5 Vp, J ,...,/ ,...,/ ) . Определение 6.1.1 Тензором называется полилинейная функция. Тензор типа (р, q) — это полилинейная функция от р векторов из V и от q линейных функций из V'. Тензором типа (0, 0) называют скаляры. Примеры: 1) скаляры — это тензоры типа (0, 0) по поределению; 2) векторы — это тензоры типа (0,1), т.к. любой вектор задает линейную функцию на V переводящую элемент / £ V в f(v) £ К; 62
3) линейные функции — это тензоры типа (1,0), т.к. они задают отображение / : V —>■ К, переводя вектор v Е V в элемент f(v) Е К; 4) билинейные функции — это тензоры типа (2, 0), т.к. они задают отображение V X V —>■ К. 5) линейные операторы — это тензоры типа (1,1), этот пример мы обсудим позже. Отметим, что в силу канонического изоморфизма V = У" роль векторного пространства V и его двойственного пространства V в определении тензора симметричны. Множество тензоров типа (р, q) мы будем обозначать 0р. На этом множестве можно ввести структуру линейного пространства, для этого нужно определить операции сложения двух тензоров и их умножения на скаляры. Пусть Г, S Е Ор, тогда: (TISJK...,^/1,..,/') := T(v1,...,vp,f\...,n + (АГЖ...,^,/1,..-,/9) := XT(Vl,...,vpj\...,r). Легко проверить выполнение всех аксиом линейного пространства и убедиться, что множество Ор действительно будет линейным пространством. Можно также определить операцию умножения тензоров (разных типов) друг на друга. Пусть Т Е Op, S Е 0£, тогда новый тензор Г ® S Е Qp+r опреляется по формуле {T^S){vu...,vp,vp+1,...,vp+r,f\...,f\r+\...,r+t):= :=T{vx,...,vp,f\...,n-S{vp+x,...,vp+r,F+\...,F+t). Так определенное умножение тензоров дистрибутивно (т.е. (Г + XS) ® R = Г ® /? + А51 ® /?), ассоциативно (т.е. (Г ® 5) ® /? = Г ® (5 ® Д)), но не коммутативно. Примеры: 1) произведение вектора v £ V и линейной функции / Е V — тензор u®/g6}. Посмотрим, как этот тензор действует на своих аргументах. Возьмем произвольный вектор а Е V и функцию h Е У, получим, что (v ® /)(«, h) = /&(г?) • /(а). 2) возьмем две линейные функции </, /г Е У', тогда д ® h будет тензором типа (2,0) (т.е. билинейной функцией), (д ® h)(v\, V2) — g(v\) • h{v2). 6.2 Координатное определение тензоров Перейдем теперь к координатному описанию тензоров. Зафиксируем базис ei,... , еп в пространстве У, ему будет соответствовать двойственный базис г1,... ,гп в двойственном пространстве V1'. Т.к. тензор — это полилинейная функция, то ее значение определяется значениями на базисных векторах, т.е. 2>1, • • • , vp, f1,... , Я) = Г«ег1,... , vSP,fj^jl ,■■■, f]/"1) = = v?-...-vPp-f}l-...-fl-T(eil,...,eip,e",...,eK), где vl£ — координаты вектора и&, а /•. — координаты линейной функции /*. Обозначим Г(ег-1,... , ег- , £л,... , eJ<?) = T3l'"'fq £ К. Поэтому, зафиксировав базис, мы можем поставить тензору Г в соответствие набор чисел т31''"'-4 — его значения на базисных векторах. Естественно, этот набор чисел будет зависеть от выбора базиса. Посмотрим, как изменяются эти числа при переходе от одного базиса к другому. Пусть мы перешли от базиса ег- к базису ег-, и С — (с^) — матрица перехода, т.е. ег- = с\е^. Тогда двойственный базис ег тоже сменится на ?, причем матрица перехода D = (dlk) = С-1, d3kc\ — S3, т.е. ег = dlkek. Тогда ^1 ,... Jo ^11;:::'X = r(efcl,...,efcp,?is...,^) = = T(^eH,...,cletp,dl^,...,dl;qe^ = T(ell,...,elp,e^,...,e^)^k\.....cl.dl;i.....dlj Tt""i"-Jk\ ■■■■■clP 'dl ■■■■■d[? 63
Примеры: 1) если х — вектор, то х — dkx\ Такой закон изменения координат называется векторным законом. _ 2) если / — линейная функция, то fk = сгк/{. Такой закон изменения координат называется ковекторным законом. А величины, изменяющиеся по ковекторному закону называются ковек- торами. Таким образом, линейные функции (элементы пространства V1) — это ковекторы. Мы получили тензорный закон изменения координат: rpn-f-Jq rp3\i---i3q i\ гР jl\ Jq ±ku...1kp — ±ги...,гр ' Ch ' ' ' ' ' % • ал ' ' ' ' ' %' Теперь мы можем дать другое (координатное) определение тензору: тензор - это набор чисел T3l'"'fq, который при замене координат преобразуется по тензорному закону. Это и предыдущее определения тензора эквивалентны, так как по такому набору чисел, пользуясь линейностью, можно восстановить полилинейную функцию Г, для которой Tie е- fJ1 р-М — TJ1'"'J<? Рассмотрим еще один пример — пример тензоров типа (0, 2). Пусть (а^) — матрица некоторой билинейной функции, или, что то же самое, тензор типа (2,0). Предположим, что матрица (а^-) обратима и обозначим элементы обратной матрицы через а%\ т.е. агза^ — Slk. Лемма 6.2.1 агз является тензором типа (0,2), т.е. этот набор чисел при переходе к другому базису изменяется по формуле akl = atJdkd1-. Доказательство. В новом базисе выполнено равенство aklaim = 5^. Подставим сюда а/ш = а^с\сгш^ где С — (сгт) — матрица перехода, тогда Ъ а^с\сгш — 5^. Умножим обе части этого равенства на элементы обратной матрицы к матрице перехода (напомним, что ckd3k — S3): aklajiC^c^dP-d^ — S^dF-d^ или aklaji = dkd\. Воспользуемся теперь обратимостью матрицы (a2-j), т.е. тем, что а^агг — 8Т-. Умножив обе части предпоследнего равенства на агг, получим а' а^агг — аггdkd-. При суммировании по г получим, что а 5Т- = аггdkd-, или а = a4dkd-. • 6.3 Базис в пространстве тензоров Построим базис в пространстве тензоров 0р. Векторы и ковекторы — это тензоры типа (0,1) и (1,0) соответственно. Рассмотрим произведение еп ® ... ® elp ® ejl ® ... ® е^ , оно состоит из тензоров типа (0,1) и тензоров типа (1,0), следовательно само является тензором типа (p,q). Всего таких различных произведений получится np+g, т.к. из п ковекторов надо выбрать рииз п векторов надо выбрать q. Докажем, что эти элементы (произведения такого вида) образуют базис в 0р. Прежде, чем доказывать это, вычислим значение такого тензора (произведения) на наборах аргументов из базисных векторов: еч ® ...®егр ®еп ® ... ® ejq(ekl,... ,ekp,eh,... ,e'*) = = ^ю.....^(в,р).^(вл)-...-^(^) = = Si1 •... • 5lp • 8h •... • 8lq = «1 Kp Jl Jq 1, если %i = &i,... ,ip = kpji = /b... Jq = /g, 0, в остальных случаях. Лемма 6.3.1 Множество произведений вида еч ® ... ® еЪр ® ejl ® ... ® ej является базисом ввя 3q V Доказательство. Сначала докажем линейную независимость этих произведений. Пусть существуют такие числа X3l''"'3q, что линейная комбинация \3l''"'3qe4 ® ... ® егр ® е7- ® ... ® е7- . ^ %\ ,... 5 ь г) 1\ ,... 5 ь р J i- J q 64
Применим этот тензор, как полилинейную функцию, к аргументам е^х,... , е&р, е 1,... , е q и получим \?'""1Ч еч <8> • • • <8> е{* ® еп ® ... ® е^(е^ ,... , е*р,е\ ... ,е'*) = 0 (7) ' Р ч * ' Подчеркнутое выражение равно 1, если i\ — k\,... , ip = &р, ji = /i,... , jg = /g и 0 в остальных случаях, следовательно, равенство (7) может быть записано в виде Но, т.к. это равенство имеет место для любого набора индексов к\,... , &р, /i,... , /g, то все ^к'""* к Равны нулю. Линейная независимость доказана. Удостоверимся теперь, что любой тензор можно представить в виде линейной комбинации этих базисных тензоров. Для этого достаточно доказать равенство т = Т£;;ш%яе{1 ® ... ® егр ® eh ® ... ® е,-,. (8) А из-за полилинейности это равенство достаточно проверять на базисных аргументах вида е^1,... , ej~ ,г^,... ,elq. Левая часть равенства по определению равна Т^1'"'^, а правая часть, как мы уже видели раньше, также равна T-^^fqen ®.. .®elp®e3l ®.. .06^(6^,... , е/^,^1,... ,elq) — Т?1''"'?4. Итак, равенство проверено, т.е. для произвольного тензора Г мы нашли его разложение в линейную комбинацию (8), причем числа т?1'""1?4 являются координатами этого тензора в указанном базисе. 6.4 Линейные операторы как тензоры Перейдем теперь к обещанному отождествлению линейных операторов и тензоров типа (1,1). Утверждение 6.4.1 Имеет место канонический изоморфизм ®\ = L(V). Доказательство. Пусть дан линейный оператор f : V —> V, нам надо по нему построить билинейную функцию Tj = Tf(v,cp) с одним векторным (v G V) и одним ковекторным (<р G V) аргументами. Определим его равенством Tf(v,cp) := cp(f(v)) G К. Tj действительно является полилинейным отображением от двух аргументов. Соответствие f \-> Tj задает линейное отображение L(V) —>■ О}, конструкция которого не зависит от выбора базисов. Доказать, что отображение L(V) —>■ 0{ будет изоморфизмом, можно двумя способами. Первый — это просто записать все в координатах и сравнить. Второй способ. Размерности пространств L(V) и в} совпадают (они равны (dim У)2), поэтому надо проверить лишь то, что у этого отображения нулевое ядро, т.е. что если Т/ = 0, то и / = 0. Пусть Г/(г?, (f) = 0 для любых v G V, tp G V, т.е. для любого <р <p(f(v)) = 0, следовательно, f(v) — 0. Но, т.к. это верно для всех векторов v G V, то имеем / = 0. • Теперь мы можем отождествлять линейные операторы и тензоры типа (1,1). Например, тождественный оператор задается в любом базисе матрицей (8?). Проверим в явном виде, что символ Кронекера 8"- является тензором. Запишем тензорный закон изменения координат 8f = 83гс](1^ = c\d\^ что, в свою очередь, равно c\d\ — 8\, т.к. D — С~1 и CD — Е. Значит, символ Кронекера действительно является тензором типа (1,1). 65
6.5 Свертка тензоров Пусть Г G ©р — тензор с хотя бы одним нижним и одним верхним индексами, т.е. р, q > 0. Пусть ei,...,en — базис в V. Зафиксируем один векторный и один ковекторный аргумент (пусть это будут первые по порядку аргументы), на их место поставим базисные элементы ег- и ег и определим полилинейную функцию sT от р — 1 векторых и q — 1 ковекторных аргументов по формуле (sT)(v2,...,vpJ2,...,r):=T(ei,v2,...,vp,e\f2,...,r), в которой подразумевается суммирование по индексу г. Проверим, что определение тензора sT не зависит от выбора базиса, т.е. что его координаты будут преобразовываться по тензорному к другому базису имеем закону. Имеем (sT)^2'*"'^ (здесь опять производится суммирование по индексу г). При переходе (5f)!2'•"''? = f,fc'/2'-''' = Tlun'-'lq ■ с',1 -d2 • ... • c!p • df -d'? ....•/«. V //C2,...,«p /C,/C2,...,«p H,^,-)^ w^ 2 P Jl ^2 ^ Произведение подчеркнутых элементов равно c^d^ = (Г-1, т.к. CD = Е, поэтому ненулевыу слагаемые отвечают значениям i\ — j\- Обозначим i\ — j\ — i, тогда f!u'"{q = Tit*'"?* • ci2.....cip • d[2 •...• <# = (sT)i2""iq • ci2.....c!p • d[2 •...• <#. ki,...,kp i,i2,...,ip k2 kp j2 Jq \ )i2,...,ip k2 kp j2 Jq Т.е. координаты (sT)3-2'"'^4 действительно преобразуются по тензорному закону, значит, действительно, sT — тензор типа (p—l,q—l). Этот тензор называется сверткой тензора Г. Такую операцию свертки можно проводить несколько раз до исчерпания верхних или нижних индексов. Последняя возможная свертка (после которой не остается либо нижних, либо верхних индексов) называется полной сверткой. Примеры: 1) Возьмем линейный оператор — тензор типа (1,1), результатом свертки будет скаляр. Пусть нам дан оператор / : V —>■ У, который задается матрицей (//), сверткой этого тензора будет число Д (сумма диагональных элементов), т.е. в данном случае свертка — это след, sf = tr /. 2) Рассмотрим полную свертку тензора типа (2,2). Возьмем билинейную функцию </, т.е. тензор типа (2, 0), и два вектора а, Ъ — тензоры типа (0,1). Тогда д® а® & будет тензором типа (2, 2). Координаты этого тензора (д® a® b)f- — д^акЬ\ где д^ — матрица билинейной функции д. Тогда при полной свертке этого тензора получим s(g ® а ® b) = gijalb3 = д(а, Ь). 6.6 Поднятие и опускание индексов Пусть нам дано евклидово пространство У, т.е. векторное пространство над R со скалярным произведением (•,•). Тогда существует канонический изоморфизм V = Vf, поэтому у любого тензора можно заменить векторный аргумент на ковекторный и наоборот. Например, возьмем тензор типа (0,1), т.е. вектор Г : V -Л R. Отождествим его с ковектором (Г,-) : У -Л R, тогда пполучим канонический изоморфизм пространств тензоров ©q и 0°. В координатах это выглядит следующим образом. Пусть G — (gij) — матрица Грама скалярного произведения (•, •). Каждому тензору Г с координатами Тг поставим в соответствие Tj = gijT1 (это произведение двух тензоров, д и Г и свертка по индексу г). Таким образом мы у тензора Г опустили индекс. Обобщая эту операцию, дадим определение операции опускания индекса. Опускание индекса — это отображение Ор —>■ ©р+ц которое тензору T3l'"'fq ставит в соответствие тензор g^ .7yj2rvJ<?> Здесь мы опустили первый индекс j\. Аналогично можно опустить любой другой верхний индекс. Поднятие индекса. Аналогичным образом можно и поднимать индексы. Для этого используется матрица G~l — (glJ) (вспомним, что матрица Грама обратима и что дгз есть тензор типа (0,2)). Тензор Т31''"'-4 операция поднятия индекса переводит в тензор д%3 •T3iY"'3<- G ©p_i- 66
6.7 Оператор альтернирования. Внешние формы Рассмотрим линейное пространство 0° тензоров с одними нижними индексами, т.е. полилинейные функции от р векторов. Также рассмотрим группу перестановок Sp. Если взять какую- нибудь перестановку а £ 5Р, то можно определить линейный оператор fa : 0° —>■ 0° следующим образом. Пусть Г £ 0° т.е. Г = Г(г?х,... , ^р); определим fa(T) = <тТ, где (<tT)(ui,... , г?р) := Г(иа(1\,... , ^а(р)). Эта операция перестановки аргументов сумму тензоров переводит в сумму, а умножение тензора на скаляр — в умножение на скаляр, следовательно, fa — линейный оператор, кроме того, fax fа2 — f(j\(J2- Координаты тензоров Г и аТ связаны между собой равенством \a-L ju,...,«p — \CFl )\Cii, • • • 5 eip) — 1 \eia{l) ' • • • ' 6V(p)/ = ^ V(l) ' • • • ' lcr(p)- Поскольку нам вскоре понадобится делить на целые числа, с этого момента, говоря о тензорах, будем считать, что характеристика поля К нулевая. При желании для простоты можно считать, что K = R. Построим оператор альтернирования (приводящий к аналогу свойства кососимметричности) Alt : в°р -> в°; Alt Г := -} J^ (-1У°Т. aeSp Этот оператор будет линейным, т.к. является суммой линейных операторов. Назовем тензор Г G ©р ко со симметрическим (или внешней формой), если аТ = ( — 1)аТ для любой перестановки a G Sp. В пространстве всех тензоров с нижними индексами определим подпространство Лр С Qp всех кососимметрических тензоров (проверка того, что множество кососимметриче- ских тензоров в действительности есть подпространство, очевидна). Если р = 2, то условие кососимметричности эквивалентно условию T{j = —Tj{. Лемма 6.7.1 Оператор Alt является оператором проектирования на подпространство внешних форм Ар. Доказательство. Нам потребуются следующие равенства: Утверждение 6.7.2 a(AltT) = Alt (<гТ) = (-1)а АНТ. Доказательство. Применим перестановку а к тензору Alt Г: *(AltT) = a(l £(-1)Уг) = 1 ^(-l)IMT), peSp pesp т.к. а — это линейный оператор. Когда р пробегает всю группу 5Р, перестановка т — ар тоже пробегает всю группу 5Р, поэтому полученное выражение можно записать так: cr(AltT) = iEr^i-1)"^- А> поскольку (-1)- = (-1)"(-1Г, то reSp reSp т.е. мы доказали, что cr(AltT) = ( — 1)а Alt Г. Теперь докажем, что Alt(crT) = ( — 1)а Alt Г. По определению Alt(crT) = -^ ^2pes (~^-)Р((Ра)Т)- Обозначим г = ра и получим peSp reSp reSp = (-i)aQE(-1)T(rT)) = (-1)aAltr- теЬр Перейдем теперь собственно к доказательству леммы. 67
1. Проверим, что ImAlt С Лр. Действительно, поскольку <r(AltT) = ( — 1)а Alt Г, то по определению Alt Г G Лр для любого Г £ 0° поэтому ImAlt С Лр. 2. Докажем, что если Г £ Лр, то Alt Т — Т. Действительно, поскольку Г £ Лр, то аТ = ( —1)аГ и Altr = i^(-l)Vr = i^(-ir(-irr = i^r=lp!r = r. <j£Sp cr(zSp cr(zSp 3. Проверим, что Alt2 = Alt, т.е. что Alt(AltT) = Alt Г для любого Г £ 0° Действительно, в п.1 мы доказали, что S = Alt Г £ Лр, в п.2 — что Alt S = S, подставив Alt Г вместо 51, получим Alt (Alt Г) = Alt Г. 6.8 Внешнее умножение, его свойства Определим аналог тензорного умножения для внешних форм — внешнее тензорное умножение (обозначается Л): для Г £ Лр, S £ Aq положим Г Л S := Alt (Г ® 51). Лемма 6.8.1 Введенное нами внешнее тензорное умножение обладает следующими свойствами: для любых внешних форм Т £ Ар; S £ Ag; R £ Лг i^) (Г + А51) Л R = Т Л R -{- XS Л /? (дистрибутивность); 2) S /\Т — ( — 1)^Т Л 51 (антикоммутативность) ; 3) (Т Л S) Л R = Т Л (S Л R) (ассоциативность). Доказательство. 1) Дистрибутивность следует из дистрибутивности операции ® и линейности оператора Alt. 2) По определению SAr = Alt(S<g>r) = _L— у а(5®Г); (7bbp+q T/\S = Alt{T®S)= . l ., V ст(Г®5). Рассмотрим координаты тензоров a[S®T) и a(T®S). Имеем ст(5®Г)гь...,гр+д = (5®Г)М1),...,Мр+д) = — V(i) г-- ,V(g) ' V(<H-i) '••• 'Мр+<?) ' ^ ' °{T®S)iu...,ip+q = {T®s)ittW,...Mp+q) = Посмотрим, чем отличаются индексы у S и Тв выражениях (9) и (10). Индексы в (9) — это ст(1),... ,a(q),a(q + l),... , cr(p + g), а индексы в (10) — это сг(р+1),... , сг(р + д), сг(1),сг(д). Пусть г — перестановка р + 1 ... р + g 1 ... р 1 ... q q + 1 ... p + q Тогда, как легко видеть, a(S ® Г) = ат(Т ® 51). Поэтому SAT = ] У {-iy<j{S®T) = (p + g)! V = ^ Е (-1Г(-1ГМ(5®г) = О" G £р+ q PtSp+q 68
и нам осталось определить ( —1)т. Для вычисления знака перестановки надо подсчитать количество элементарных перестановок, ее составляющих. Лекго видеть, что это число равно произведению pq, т.е. ( — 1)т = ( —1)рд, что и требовалось показать. 3) Введем дополнительно обозначение Т\ А Г2 Л ... Л Т& := Alt(Ti ® Г2 ® ... ® Т&). Для доказательство ассоциативности нам также понадобится следующее равенство. Утверждение 6.8.2 Alt((AltQ) ® R) = Alt(Q ® R) для любых тензоров Q £ 0°, R € 0°. Доказательство. Поскольку операция ® обладает свойством дистрибутивности, а оператор Alt линеен, имеем Alt((AltQ)® Д) = Altff^ JZi-^^Q) ®R 1 x-^ aebp - , / v -l)aAlt{<jQ®R). aebp Каждой перестановке a £ Sv поставим в соответствие такую перестановку a G Sp+q, которая на первых р индексах действует как <т, а остальные оставляет на месте, т.е. 1 ... р р +1 ... р + q сг(1) .. . а(р) р+1 ... р+ q При этом, очевидно, ( — 1)а = ( — 1)а. Тогда crQ ®R = a(Q ® Д), и Alt((AltQ)(g)i2) = -}^2(-l)°Mt(a(Q®R)) aeSp ■I E(-1)CT(-1)?Alt(^®i?) = aeSp -} J2 Alt(Q ®R) = ~}P]- Alt(Q ® i?) Alt(Q® Д). Докажем теперь ассоциативность внешнего умножения. Обозначим Q = Г ® 5, тогда Alt Q Alt(T(8)5) и (TAS)AR = Alt((TAS)<g) Д) = Alt (Alt (Г ® 5) ® Д) = = Alt((AltQ)® Д) = Alt(Q® R) = Alt(T ® S ® R) = = TASAR. Аналогично получим, что Г Л (S A R) = Г Л 5 Л Д, т.е. (Т A S) A R = Т A (S A R). 6.9 Базис в пространстве внешних форм Построим базис в пространстве кососимметрических тензоров Лр. Как нам известно, базисом в пространстве 0° являются всевозможные произведения вида еч ®.. .(&егр. Однако при проектировании на подпространство Ар эти произведения переходят в еп А.. .Ае1р — AltfV1 ®.. .®е1р) и становятся линейно зависимыми. Действительно, если г& = г/, то е%к Аеч — 0, поэтому из базиса нужно выкинуть все произведения, в которых встречаются повторяющиеся индексы. Далее, т.к. е%к Аеч = — еч Ае%к, то нужно также выкинуть все произведения с неупорядоченными индексами 69
и оставить только произведения с индексами упорядоченными, например, по возрастанию, т.е. такие, что i\ < ... < ip. Всего таких упорядоченных произведений будет Ср, где п — dim V. Очевидно, что любой тензор является линейной комбинацией тензоров еп Л.. ./\slp, i\ < ... < гр, т.к. из базиса мы выкинули только заведомо линейно зависимые вектора. Поэтому для доказательства того, что эта система векторов действительно является базисом Ар достаточно доказать ее линейную независимость. Пусть линейная комбинация этих тензоров равна нулю, J2 Агь...,гр£г1Л...Л^ = 0. ii<...<ip Перепишем эту сумму в виде Е Ан !Р(^ЕС^^£^)=0' (п) i\<...<ip (t£Sp Подчеркнутые элементы — это элементы базиса в пространстве 0° и они линейно независимы. Отсюда будет следовать равенство нулю всех коэффициентов, если только все эти подчеркнутые элементы будут различны. Докажем, что все базисные элементы, встречающиеся в этой сумме, различны. Распишем эту сумму подробнее • • • + At-b...,t-p Y^ гМ1) ® • • • ® ^Мр) + • • • + Aji,...,jP Y1 £3р{1) ® ''' ® £3р{р) + "" a£Sp pESp Допустим, что существуют такие <т, р £ Sv и индексы гх,... , гр, ji,... , jp, что гМ1) 0.. . ®гМр) = г-Mi) ® ...®eJ^), т.е. ia^\ = Jp(i),... , ia(p\ — jp(v)- Перейдем к перестановке т — ра~х, тогда %х — Jr(i),... , ip = jT(p)- Но индексы г и j у нас упорядочены по возрастанию, следовательно, г — тождественная перестановка. Значит, а = р и тогда i\ — Ji,... , гр = jp. Следовательно, все слагаемые в (11) различны, значит все коэффициенты в (11) равны нулю, что и доказывает линейную независимость системы тензоров еч Л ... Л еЪр, i\ < ... < гр, и то, что она является базисом в Л„. 6.10 Связь между линейной зависимостью и тривиальностью внешнего произведения Рассмотрим пространство Лх. Оно совпадает с 0° и с V', поэтому его элементами являются ковекторы или линейные функции на V. Теорема 6.10.1 Пусть Lpl,... , Lpp £ Лх = V, тогда Lpl Л ... Л Lpp — 0 тогда и только тогда, когда ковекторы у?1,... , Lpp линейно зависимы. Доказательство. Если ковекторы линейно зависимы, то один из них можно выразить в виде линейной комбинации остальных. Пусть ф9 — \\^рх + ... + Ар_х^р_15 тогда (р1 Л ... Л (fp = (f1 Л ... Л tpp~l Л (Aiv?1 + ... + Ap_iv?p_1) = = Aiv?1 Л ... Л tpp~l Л (f1 + ... + Ap.iv?1 Л ... Л tpp~l Л (рр~г = О поскольку в каждом слагаемом встречается пара совпадающих сомножителей. Для доказательства обратного утверждения предположим, что ср1 Л ... Л Lpp — 0 и разложим ковекторы у?1,... , tpp по некоторому базису г1,... ,гп пространства V1, <рк = р>\ е%к. Тогда О = v^V1 Л ... Л рР ег? = (А • ... • рР • гп Л ... Л е** = ' »1 Lp "1 Lp = ср^ ■... ■ срргр ■ J2 (-1)стег'ст(1) ®... ® ег'ст(р». 70
Эту полилинейную функцию можно применить к наборам векторов е^1,... , е&р, причем ее значение на этих наборах равно нулю (т.к. она тождественно нулевая). Вычислим ее значение на таком наборе векторов: 0 = ^1-----<-E(-1)VCT(1)®---®eMp)(^1,---,efcp). (12) aeSp 4 v ' В подчеркнутой сумме имеется только одно ненулевое слагаемое, а именно, то слагаемое, в котором ia(\) — &i,... , ia(p) — ^Р5 т-е- когда i\ — &a-i(i), • • • , ip = ka-itp\, причем это ненулевое слагаемое равно ( — 1)а. Поэтому наша сумма (12) преобразуется в ° = Е ("1)>1-1(1) • • • • • А-ЧР) = Е (-!)Р<(1) • • • • • <(р) (13) a£Sp pESp (здесь мы переобозначили р — сг-1). А это не что иное, как формула определителя некоторой матрицы. Рассмотрим прямоугольную матрицу Ф Ч>\ • • • ч>\ р р <Pl • • • ¥п и пусть &ki,...,kp — это квадратная матрица (минор), составленная из столбцов к\,... ,кр матрицы Ф, а остальные столбцы выкинуты. Тогда правая часть (13) будет формулой определителя этой матрицы, т.е. О = det Ф&ь...?& . Т.к. числа к\,... ,кр мы можем брать любыми, то все максимальные миноры в матрице Ф равны нулю, следовательно ее строки линейно зависимы, следовательно ковекторы у?1,... , ф9 линейно зависимы. Оглавление 1 Линейные пространства 2 1.1 Линейное (векторное) пространство 2 1.2 Аффинное пространство 3 1.3 Факторпространство 4 1.4 Линейная зависимость векторов 5 1.5 Размерность 6 1.6 Пересечение и сумма подпространств 8 1.7 Прямая сумма подпространств. Внешняя прямая сумма 9 1.8 Координаты 10 1.9 Изоморфизмы векторных пространств 11 1.10 Двойственное векторное пространство 12 1.11 Канонический изоморфизм между пространством и его вторым двойственным . . 13 2 Линейные операторы 14 2.1 Линейные отображения 14 2.2 Инвариантное подпространство 16 2.3 Невырожденные операторы. Собственные значения и собственные векторы .... 17 2.4 Проекторы 18 2.5 Нильпотентные операторы 18 2.6 Многочлены от операторов 21 2.7 Характеристический многочлен 22 2.8 Еще несколько утверждений об операторах 23 2.9 Корневое подпространство 25 71
2.10 Теорема о разложении пространства в прямую сумму корневых подпространств . 26 2.11 Жорданова клетка. Жорданова нормальная форма оператора 27 2.12 Приложения теоремы Жордана 28 2.13 Овеществление и компексификация 29 3 Евклидовы и унитарные пространства 31 3.1 Евклидовы и унитарные пространства 31 3.2 Процесс ортогонализации 32 3.3 Ортогональное дополнение 33 3.4 Метод наименьших квадратов 34 3.5 Канонический изоморфизм V = Vf 37 4 Операторы в евклидовых и унитарных пространствах 38 4.1 Изоморфизмы гильбертовых пространств 38 4.2 Ортогональные и унитарные операторы 39 4.3 Сопряженный оператор 41 4.4 Канонический вид матрицы самосопряженного оператора 43 4.5 Канонический вид матрицы кососимметрического оператора 45 4.6 Неотрицательные и положительные операторы. Извлечение неотрицательного квадратного корня из оператора 45 4.7 Канонический вид матрицы нормального оператора 48 5 Билинейные и полуторалинейные функции 48 5.1 Билинейные функции (формы) 48 5.2 Канонический изоморфизм B(V) = L(y, V). Невырожденность 49 5.3 Симметричные, кососимметричные и эрмитовы функции 51 5.4 Ортогональное дополнение 52 5.5 Нормальный вид матрицы (косо)симметрической или эрмитовой функции .... 53 5.6 Единственность нормального вида 55 5.7 Теорема Якоби. Критерий Сильвестра 56 5.8 Пространства с обобщенным скалярным произведением. Группы операторов, сохраняющих скалярное произведение 58 5.9 Симметрические билинейные функции на евклидовом пространстве 60 5.10 Пара симметричных билинейных функций 61 6 Тензоры 62 6.1 Тензоры. Пространство тензоров 62 6.2 Координатное определение тензоров 63 6.3 Базис в пространстве тензоров 64 6.4 Линейные операторы как тензоры 65 6.5 Свертка тензоров 66 6.6 Поднятие и опускание индексов 66 6.7 Оператор альтернирования. Внешние формы 67 6.8 Внешнее умножение, его свойства 68 6.9 Базис в пространстве внешних форм 69 6.10 Связь между линейной зависимостью и тривиальностью внешнего произведения . 70 72