Текст
                    Московский Государственный Университет им. М. В. Ломоносова
Научно-Исследовательский Институт Ядерной Физики
им. Д. В. Скобельцына
И. П. ВОЛОБУЕВ, Ю. А. КУБЫШИН
Дифференциальная геометрия
и алгебры Ли
и их приложения в теории поля
Эдиториал УРСС
Москва, 1998


Игорь Павлович Волобуев, Юрий Александрович Кубышин. Дифференциальная геометрия и алгебры Ли и их приложения в теории поля. М.: Эдиториал УРСС, 1998. — 224 с. В книге излагаются основы дифференциальной геометрии и теории алгебр Ли, а также описание теории калибровочных полей на геометрическом язы- языке. В качестве приложений этого аппарата обсуждаются размерная редукция калибровочных теорий и задача спонтанной компактификации. Книга рассчитана на студентов старших курсов, аспирантов и научных работни- работников-математиков и физиков-теоретиков. Настоящее издание осуществлено при финансовой поддержке Российского фонда фундаментальных исследований (проект № 97-02-30032) Группа подготовки издания: Директор — Доминго Марин Рикой Заместители директора — Наталья Финогенова, Ирина Макеева Компьютерный дизайн — Виктор Романов, Василий Подобед Верстка — Наталия Бекетова, Леонид Иосилевич Редактор — Виктория Малышенко Обработка текста и графики — Светлана Бондаренко, Наталья Аринчева Издательство «Эдиториал УРСС». 113208, г. Москва, ул. Чертановская, д. 2/11, ком. прав. Лицензия ЛР №064418 от 24.01.96 г. Подписано к печати 28.08.98 г. Формат 70x100/16. Тираж 1000 экз. Печ. л. 14. Зак. N° 311 Отпечатано в АООТ «Политех-4». 129110, г. Москва, Б. Переяславская, 46. ISBN 5-901006-70-4 © И. П. Волобуев, Ю. А. Кубышин, 1998 © Эдиториал УРСС, 1998
Предисловие «Чистая математика и физика становятся связанными все теснее, хотя их методы и остаются различными. Можно сказать, что математик играет в игру, в которой он сам изобретает правила, в то время как физик играет в игру, правила которой предлагает Природа, однако с течением времени становится все более очевидным, что правила, которые математик находит интересными, совпадают с теми, которые избрала Природа. Трудно предсказать, каков будет результат всего этого. Возможно, оба предмета в конце концов сольются, и каждая область чистой математики будет иметь физические приложения, причем их важность в физике станет пропорциональна их интересности в математике.» Кажется, что это пророчество Дирака!) начинает сбываться, по крайней мере в том, что касается дифференциальной геометрии и калибровочных теорий поля. Действительно, экспериментальное подтверждение единой теории электрослабых взаимодействий Вайнберга—Салама—Глэшоу, в особен- особенности открытие промежуточных векторных бозонов, и успехи квантовой хромодинамики, по меньшей мере непротиворечиво описывающей силь- сильные взаимодействия, дают серьезные основания полагать, что в основе теории взаимодействия элементарных частиц лежит фундаментальный физический принцип локальной калибровочной инвариантности. Осно- Основанная на этом принципе стандартная модель взаимодействий элементар- элементарных частиц, включающая в себя теорию электрослабых взаимодействий и квантовую хромодинамику, в настоящее время хорошо согласуется практически со всеми имеющимися экспериментальными данными, а последовательное его применение позволяет выйти за рамки этой модели и существенно продвинуться вперед в программе объединения всех видов взаимодействий в одно универсальное путем построения калибровочных теорий великого объединения. Разработанный к настоящему времени аппарат квантовой тео- теории поля, основанный на теории возмущений, в принципе, достаточен для расчета физических процессов, которые наблюдаются или будут наблюдаться в ближайшее время в экспериментах по физике высоких энергий. Однако хорошо известно, что калибровочные теории обладают многочисленными структурами, для изучения которых требуется выход '' P. A. M. Dirac. The relation between mathematics and physics. Proc. of the Royal Soc. EdinbuiBli A. Vol. 59, A938-1939), p. 122-129. Русский перевод в сб.: П. А. М. Дирак. К созданию квантовой теории поля. М.: Наука, 1990. С. 245—254.
Предисловие за рамки теории возмущений. К ним относятся инстантонные и моно- монопольные решения, сложная структура вакуума, топологические модели и модели Черна—Саймонса, — в общем, все те явления, где проявляется геометрическая и топологическая природа калибровочных теорий. Как и следовало ожидать, изучение этой стороны калибровоч- калибровочных теорий потребовало применения нового аппарата, и оказалось, что необходимый математический аппарат уже был разработан или нахо- находился в стадии разработки. Основные части этого аппарата включают дифференциальную геометрию, в первую очередь теорию расслоенных пространств и теорию связностей, алгебраическую топологию, теории групп и алгебр Ли. Геометризация калибровочных теорий произошла вполне естественно и позволила, во-первых, более глубоко понять уже известные факты (как, например, неоднозначности Грибова), а во- вторых, обнаружить ряд совершенно новых свойств и явлений (структура вакуума, структура пространства модулей инстантонных решений, интер- интерпретация теории Дональдсона—Флоера как топологической квантовой теории, инвариантные связности и т.д.). Цель настоящей книги, во-первых, познакомить студентов, специ- специализирующихся по теоретической физике, и специалистов, работающих в этой области, с основами математического аппарата дифференциаль- дифференциальной геометрии и теории конечномерных алгебр Ли. По мнению многих преподавателей университетов, которое мы вполне разделяем, основные сведения из этих разделов математики уже давно должны были бы стать частью обязательных курсов по математическим методам современной теоретической физики. Так как на большинстве физических факультетов подобные курсы либо отсутствуют, либо ограничиваются, по-существу, изложением теории конечномерных групп Ли, при написании настоящей книги мы попытались частично восполнить этот пробел. Во-вторых, — и это имеет прямое отношение к основной теме книги — мы ставим целью дать введение в геометрическое описание калибровочных теорий на языке расслоений и связностей. При отборе материала мы не стремились охватить все основные классические результаты дифференциальной геометрии. В настоящее время для этого имеются многочисленные монографии и учебные по- пособия, некоторые из которых написаны специально для физиков. Мы постарались очертить и ясно изложить тот минимум, который необхо- необходим для освоения геометрического подхода к описанию калибровочных теорий. Одновременно это тот минимум, который позволяет ориентиро- ориентироваться при чтении литературы по дифференциальной геометрии и теории алгебр Ли. Структура книги следующая. Глава 1 носит вводный характер, в ней даются основные определения и понятия, возникающие в калибро- калибровочных моделях, а именно в электрослабой теории и в хромодинамике.
Предисловие Главы 2, 3 и 5 содержат математический материал. Главы 2 и 3 посвяще- посвящены изложению основных сведений по дифференциальной геометрии, в главе 5 излагается корневая структура конечномерных алгебр Ли и тео- теория диаграмм Дынкина для полупростых алгебр Ли. В остальные главах обсуждаются применения этого математического аппарата в ряде задач теории поля и гравитации. В главе 4 излагается геометрический подход к описанию калибровочных теорий. В главах 6 и 7 обсуждаются приложе- приложения такого подхода к решению задач размерной редукции калибровочных полей и спонтанной компактификации. Выбор этих приложений доста- достаточно субъективен: авторы работали над этими проблемами в течение ряда лет. В то же время эти приложения, во-первых, позволяют проде- продемонстрировать многочисленные преимущества и мощь геометрического подхода, а во-вторых, они, как и сама идея Калуцы и Клейна, со- сохраняют свою актуальность при построении моделей фундаментальных взаимодействий. В предлагаемой книге мы попытались найти некий промежу- промежуточный, между математически строгим и принятым в физике, стиль изложения, при котором сложный материал преподносится в доступной форме и сразу же иллюстрируется примерами. При этом мы сохраняем строгость в определениях и формулировках теорем, но доказательства теорем приводятся лишь в том случае, когда они могут быть изложе- изложены в ясной и короткой форме без привлечения большого количества дополнительного материала или когда они действительно необходимы для понимания материала. В противном случае мы ограничиваемся пояснением идеи доказательства на характерных примерах или просто ссылками на книги, где приводятся соответствующие доказательства. Ряд достаточно простых промежуточных выкладок, опущенных в основном тексте книги, предлагается проделать в качестве задач и упражнений, помещенных в конце книги. Избранным стилем изложения объясняется и выбор физических приложений, о которых мы уже говорили выше. Они скорее носят характер иллюстрирующих примеров, а не являются последним словом применения математических методов в калибровоч- калибровочных теориях. Книга содержит также ряд приложений, делающих ее достаточно замкнутой. В них приводятся некоторые определения и крат- краткие сведения, которые не относятся к дифференциальной геометрии и теории алгебр Ли, но используются в основном тексте. В значительной своей части книга основана на курсе лекций для студентов IV курса, читавшегося авторами в течение двух лет на кафедре квантовой статистики и теории поля физического факультета МГУ. Авторы благодарны всем слушателям этих лекций, вопросы которых способствовали улучшению изложения материала. Мы также благодарны Герду Рудольфу и Жузе Моурао, нашим друзьям и соавторам многих наших статей, за многочисленные деловые и приятные обсуждения
6 Предисловие вопросов, нашедших отражение в книге. Мы благодарны руководству Отдела теоретической физики высоких энергий НИИ ядерной физики МГУ за проявленное внимание и поддержку при работе над книгой и ее издании. Один из нас (Ю. К.) хотел бы выразить благодарность своей семье за то понимание, терпение и моральную поддержку, которыми сопровождалась его долгая работа над этой книгой. Наконец, мы благодарим Российский фонд фундаментальных исследований (фант 97-02—30032) за решающую финансовую поддержку при издании книги, без которой она не могла бы увидеть свет.
Г л а в а 1 Введение Современные исследования по теории поля раскрывают все более сильную зависимость физических свойств моделей от геометрических и топологических свойств пространства-времени М. Такая зависимость проявляется, например, при изучении сложной структуры вакуума в неабелевых калибровочных теориях, механизма перехода между вакуум- ами и т.д. При этом приходится рассматривать поля на многообразиях с нетривиальной топологией (при анализе монополей и инстантонов или изучении эволюции Вселенной) и/или с числом измерений больше четырех (при изучении размерной редукции и спонтанной компактифи- кации в теориях типа Калуцы—Клейна). Оказывается, что для решения подобных задач более удобным (и, как мы считаем, математически более красивым) является геометрический подход, которому посвящена глава 4. Этот подход использует аппарат дифференциальной геометрии, изложенный в главах 2 и 3. Центральными понятиями при этом являются главное расслоение и связность в нем. Как правило, при введении новых понятий и нового аппарата для описания тех или иных физических явлений возникает естественный вопрос: являются ли они действительно необходимыми? Очень часто, как и в нашем случае, ответ отрицательный в том смысле, что нет прикладных (расчетных) задач, которые нельзя было бы решить, не используя новые методы. Преимущества геометрического подхода следующие. 1) Он дает естественный и наиболее адекватный язык для описания калибровочных теорий, так как оперирует с такими понятиями как связность, кривизна и т.д., органически присущими этим теориям. Тем самым мы переходим к более фундаментальным понятиям, чем вектор-потенциал и напряженность в стандартном подходе, что в свою очередь позволяет новые нетривиальные обобщения в теории. Удобство использования геометрического языка главных расслоений по сравнению со стандартным в описании калибровочных теорий можно сравнить с удобством использования ковариантных тензорных обозначений по сравнению с работой в компонентах в электродинамике Максвелла. Геометрический язык дает возможность меньше заботиться о технических
8 Глава 1. Введение деталях, а больше внимания уделять действительно принципиальным проблемам. 2) Геометрический подход позволяет проводить рассмотрение глобально, что важно при изучении топологических свойств теории. Именно основные идеи и методы геометрического подхода и будут главным предметом обсуждения в следующих главах. Однако пре- прежде чем переходить к ним, мы напомним основные факты из теории калибровочных полей и калибровочных моделей взаимодействий эле- элементарных частиц, введем необходимые обозначения и дадим основные определения. § 1. Принцип локальной калибровочной инвариантности и поля Янга—Миллса Хорошо известно, что вектор-потенциал электромагнитного поля определен с точностью до градиентного, или калибровочного преобразо- преобразования А„{х) -> А„(х) + dfl(x). A.1) Смысл этого преобразования проясняется в рамках классической теории поля. А именно, если рассмотреть взаимодействие электромагнитного поля с заряженным полем, которое описывается комплексной полевой функцией Ф(аг), то преобразования A.1) обеспечивают инвариантность лагранжиана, а следовательно и ковариантность классического уравнения для Ф(ж), относительно локальных фазовых преобразований Ф(ж) —> е'С17(х)Ф(ж), где постоянная е играет роль электрического заряда. Поле Afi{x) при этом всегда входит в уравнение и лагранжиан в комбинации 1?/хФ(х) — (дц — ге^4м)Ф(ж), которая при фазовых преобразованиях ведет себя так же, как поле Ф(ж): D^ix) -> <fy - ieAp - гед^е^^ЯЦх) = eier)(x)D^(x). A.2) Источником же поля Ац(х) является сохраняющийся нетеровский ток Зц(х), отвечающий фазовым преобразованиям с не зависящими от точки параметрами. Обобщение этой конструкции на случай более сложного зарядового пространства, в котором задано представление неабелевой группы симметрии, например, пространства изотопическо- изотопического спина, приводит к неабелевым калибровочным полям, или полям Янга—Миллса [ЯМ] (см. также общую теорию калибровочных полей, например, в [СФ], [БШ]). Пусть в зарядовом пространстве действует представление г неко- некоторой компактной группы Ли G, которую мы будем считать простой. Это предположение не является ограничительным, так как произвольная
§ 1. Локальная калибровочная инвариантность и поля Янга—Миллса 9 компактная группа Ли есть прямое произведение конечного числа про- простых компактных групп Ли и ?7A)-групп, и ее рассмотрение сводится к рассмотрению каждого сомножителя по отдельности. Для дальней- дальнейшего нам необходимо ввести ряд обозначений и привести некоторые результаты из теории компактных групп Ли. Обозначим через g алгебру Ли группы G. Действие группы G на самое себя внутренними автоморфизмами h —» ghg~x, g,h G G, порождает действие G в линейном пространстве g. Это представление называется присоединенным представлением группы G, и если эта группа п-параметрическая, то оно может быть реализовано матрицами п х п. Соответственно и алгебра Ли g реализуется п х п-матрицами, при этом действие G сводится к матричному умножению: X —»• дХд~х, X€g,g€G. С помощью этого представления в g можно ввести G-инвариант- ную симметричную билинейную форму В(Х, Y) = tr(Xy) (которая от- отрицательно определена), а также базис генераторов {Ха}, а — 1,2,...,п, нормированных условием 1х(ХаХъ) = —2 6ab. Этот базис обладает тем свойством, что в нем структурные константы в коммутационных соот- соотношениях [Xa,Xb] = CabXd полностью антисимметричны (см. гл. 5, §2). Например, в случае алгебры Ли группы SUB) такие генераторы суть 3 х 3-матрицы с компонентами (Ха)ы = -еаЫ, а коммутационные соот- соотношения имеют вид [Ха,Хь\ = SabcXc- A.3) Задание представления г группы G в зарядовом пространстве означает, что для любого элемента д G G определено преобразование поля Ф(ж) -* г(д)9(х), A.4) причем матрицы г(д) удовлетворяют условию r(gtg2) = r(gi)r(g2)- Мы полагаем, что группа G является (глобальной) группой симметрии теории, т.е. лагранжиан поля материи ^(Ф(ж),5дФ(ж)) инвариантен относительно преобразований A.4). По теореме Нетер этой симметрии отвечают сохраняющиеся токи j^(x), а= 1,2,..., п. Локальные преобразования полей Ф(ж), аналогичные локальным фазовым преобразованиям в электродинамике, имеют вид Ф(г) -* r(g(x))V(x). A.5) Очевидно, лагранжиан _2/(Ф,д,,Ф) уже не будет инвариантен относи- относительно таких преобразований, так как входящие в него производные поля Ф(ж) преобразуются неоднородно: r(g(x)) (д^ + г(р(х)-'^(ж))) Ф(ж). A.6)
10 Глава I. Введение Для компенсации неоднородного члена в производную нужно ввести векторное поле А^(х) = А^(х)Ха со значениями в алгебре Ли д, которое при преобразованиях A.5) преобразуется так: А„(х) - д(х)А11(х)д(хУ1 + g(x)dfig(x)~l. A.7) В этом случае удлиненная производная ?)рФ(ж) = (д^ + г(Лм))Ф(ж) преобразуется, как и поле Ф(х), однородно D^(x) ->r(g(x))D^(x) A.8) и поэтому называется ковариантной производной. Введение взаимодействия с полем Ац(х) через ковариантную производную приводит к тому, что полевые конфигурации {Ф(х),Ац(х)} и {r(g(x))9(x),g(x)All(x)g(xyl + д(х)дAд(хУх} оказываются физически эквивалентными, т.е. описывают одну и ту же физическую ситуацию. Классы физически эквивалентных конфигураций являются орбитами калибровочной группы. Чтобы работать с классами конфигураций, нужно уметь вы- выбирать в этих классах представителей. Для этого на поля налагают дополнительные условия, устраняющие калибровочный произвол; выбор дополнительного условия называется выбором калибровки. Например, условие d^A^ix) — 0 называется лоренцевой калибровкой. По анало- аналогии со случаем электромагнитного поля для неабелевых калибровочных полей можно построить тензор напряженности FliV(x) = dllAv-dvAll + [Ali,Av\, A.9) который при преобразованиях поля A.7) преобразуется однородно FMAx) -»g(x)Flw(x)g(xyK A.10) Единственным разумным (и, как мы увидим в гл. 4, естественным) обобщением лагранжиана электромагнитного поля на случай неабелевых калибровочных полей является лагранжиан ^1tT(FIH,F) + &f(9,Dlt9), A.11) ъд который инвариантен относительно локальных калибровочных преобра- преобразований A.5), A.7). Входящая в него величина д называется калибровоч- калибровочной константой связи. В лагранжиане A.11) калибровочное поле взято в геометрической нормировке. В физических моделях обычно используется другая норми- нормировка, аналогичная нормировке электромагнитного поля в формуле A.2). Для перехода к этой нормировке из поля Ам(х) нужно выделить кон- константу д, т.е. в лагранжиане нужно сделать замену А^(х) —> дАц(х).
§ 2. Калибровочные теории взаимодействий элементарных частиц 11 При такой замене д1 в знаменателе «свободного» лагранжиана ка- калибровочного поля исчезнет, но константа связи появится в тензоре напряженности FpV = dpAv — д„Ац + д[Ац, Av] и в ковариантной произ- производной D^ = дц + дАц. Отметим еще, что если тензор напряженности разложить по генераторам {Ха}, tr(XaXb) = -26ab, то «свободный» лагранжиан калибровочного поля запишется в виде Варьированием отвечающего лафанжиану A.11) действия по полю Af,(x) получаются уравнения Янга—Миллса D,F" = V" + 1А„]**\=Г(х\ A.12) где j"(x) — нетеровский ток поля Ф(ж), отвечающий глобальным преобразованиям A.4). Из A.12) следует, что при взаимодействии по- поля Ф(ж) с калибровочным полем сохраняется не ток jp{x), а комбинация Jit(x) + [Av,FfU/]. Таким образом, источником неабелева калибровочного поля А^(х) является не только ток поля Ф(ж) (как было в электро- электродинамике), но и оно само, что отражает нелинейность «свободного» лагранжиана этого поля. § 2. Калибровочные теории взаимодействий элементарных частиц По-видимому, из неабелевых калибровочных теорий наибольший успех выпал на долю единой теории электрослабых взаимодействий, созданной С. Вайнбергом [Ва] и А. Саламом [Са] в конце 60-х годов (см. изложение теории, например, в [ВТ], [ЧЛ]). Эта теория основана на калибровочной группе S*7B) x U(l), и ниже мы достаточно подробно опишем ее калибровочный и хиггсовский секторы, а также сектор фермионов первого поколения. Пусть е обозначает поле (отрицательно заряженного) электрона, а ие — поле нейтрино. Объединим левые нейтрино и электрон в дублет, а правый электрон оставим синглетом: Такой выбор мультиплетов объясняется тем, что в слабых взаи- взаимодействиях нарушается четность, и правое нейтрино экспериментально не наблюдается. Группа SU{2) действует на дублет левых частиц (и поэтому ее также обозначают SUB)i); ее генераторы с коммутационными
12 Глава 1. Введение соотношениями A.3) в этом представлении выражаются через матрицы Паули {та}: г(Ха) = —г—. Поэтому преобразование поля Le можно записать в виде Le -> exp (-igjC) Le. A.14) Как обычно, связанное с SUB)L квантовое число есть собственное значение оператора т3. Обозначим через у квантовое число, связанное с группой U(\)- преобразований, и потребуем, чтобы электрический заряд q выражался через него по формуле q = T3 + y. A.15) Очевидно, для Le мы имеем у = —, а для eR — у = — I, поскольку для него собственное значение т3 равно нулю. В соответствии с этим U(\)-преобразования полей имеют вид ( 9' \ , Le ->ехр ( -» — т/ 1 Le, eR -» с\р(-гд r])eR. A.16) Аналогично, для полей кварков и и d, которые мы обозначаем теми же буквами, можно определить следующие состояния uR=]-(l-75)u, dR=l-(l-75)d, A.176) 1 2 причем для полей левых кварков y=-z, для uR имеем q = у — -, а для 6 3 dR — q = y = —. Поэтому SUB) x Щ1 ^преобразования для этих полей выглядят так: Lq -» exp (-i «7 уГ) exp (i | r^j Lqt A.18a) f 2g' \ ( g' \ uR -> exp I г —7/ I uR, dR-> exp \-i - rj J dR. A.186) Ассоциируя с преобразованиями A.14), A.16) и A.18) неабелево калибровочное поле WM(x) — W^(x)Xa со значениями в алгебре Ли группы SUB) и абелево калибровочное поле Уц(х), мы можем стан- стандартным образом построить калибровочно инвариантный лагранжиан, описывающий взаимодействие этих полей с полями лептонов и кварков:" & + Ж, A.19)
§ 2. Калибровочные теории взаимодействий элементарных частиц 13 где 1 W 1 (i 20я1 — y y^v Y = д Y д Y A 206) 4 = г L^ ( dp — ig —Wj} -\ Y^ \ Le + i ёд7//(д/1 + ig'Y^eR, A.20b) - ig-rW" - i —Yu I Lq + - i Ц-Y^j uR + idn-f Up + гугЛ dR, A.20r) и в лафанжиане для кварков A.20г) в выражениях вида q( )q подразуме- з вается суммирование по цветовым индексам, т.е. J29i( )9«- Отметим еще, что во всех формулах калибровочные поля взяты в физической норми- нормировке, что согласуется с видом преобразований A.14), A.16) и A.18). Все поля, входящие влафанжиан A.19), имеют нулевую массу. Бо- Более того, массовые члены для фермионов, имеющие вид тп(Д/л + /д/l), оказываются запрещенными требованием инвариантности относительно калибровочных преобразований A.14), A.16), A.18). Поэтому ненулевые массы фермионы могут приобрести, например, за счет эффекта Хигг- са [Хи], т.е. за счет взаимодействия со скалярным полем, имеющим ненулевое вакуумное среднее (см. также гл. 4, §7). При этом все век- векторные поля, кроме поля фотона, тоже приобретают массу, т.е. фуппа SUB) хЩ1) нарушается до фуппы U(l)em, порождаемой операто- оператором q A.15). Это значит, что ненулевое вакуумное среднее должно иметь поле с нулевым электрическим зарядом. Такая картина спонтанного нарушения симметрии имеет место в случае комплексного скалярно- скалярного поля <р, преобразующегося по спинорному представлению фуппы SUB)l и имеющего заряд у = |. Другими словами, при калибровочных преобразованиях поле <р ведет себя так: t -т)(х)\ (р. A.21а) Определим также зарядово сопряженный дублет <р = гт2<р*, который преобразуется следующим образом: exp(-i <? у С(х)) ехр (-г ~ jtfs)) ip. A.216)
14 Глава 1. Введение Калибровочно инвариантный лагранжиан, описывающий взаимодействие поля <р с полями Wf, и Ур, а также самодействие четвертой степени, имеет вид ¦—Yuip -\(<р+(р . A.22) 2 \ 2 / Калибровочно инвариантное взаимодействие поля <р с фермионами можно записать так: Щ = -Ге {(Le<p)eR + eR(tp+Le)} - Г„ {(Lgip)v.R + uR(tp*~Lg)} - - Td {(Lq<p)dR + dR(<p+Lq)} . A.23) Таким образом, полный лагранжиан теории есть Заметим далее, что калибровочным преобразованием поле <р всегда можно привести к виду Множитель —= выделен для того, чтобы из A.22) для поля а получался V2 канонический кинетический член нейтрального скалярного поля. Это поле, в соответствии с видом его потенциала самодействия, имеет ненулевое вакуумное среднее (а) = v, минимизирующее этот потенциал. Выделяя это вакуумное среднее, т.е. заменяя в A.25) <т —» v + а, получим лагранжиан модели Вайнберга—Салама в унитарной калибровке. В результате этой подстановки у всех полей появляются массовые члены. В случае векторных полей они имеют вид A.26) Диагонализация этой квадратичной формы приводит к следующим полям с определенными массами: Заряженные поля ;^ ?z. (,27) Нейтральные поля Ац = cos вцгУц + sin OwWjl, mA = 0, A.28а)
§2. Калибровочные теории взаимодействий элементарных частиц 15 Z» = - sin 6WY^ + cos6wwl, mz = ^ (g2 + g'2} 2, A.286) где параметр Ow, называемый углом слабого смешивания или углом Вайнберга, определяется соотношением tgOw = д'/д. Безмассовое поле А^, очевидно, следует отождествить с электро- электромагнитным полем. Массовые члены для фермионов оказываются следующими (f = e,u,d) -Г/(/яД + Д/л)^ = -!»,//, ™/=^- A.29) Наконец, для массы поля а находим ma = 2Xv2. A.30) Введем в рассмотрение фермионные токи 2 _ 1 _ U d7/ld' A.31а), ^g, A.316), 3$ = Le-T^Le + Lq-y^Lg. A.31в) Через них удобно записать взаимодействие фермионов с векторными полями, к которому приводит лагранжиан A.24): 9 ' (з ~ 2sin2 ewjM) Z*. A.32) 2 Очевидно, первое слагаемое описывает электромагнитные взаи- взаимодействия лептонов и кварков, поэтому для электрического заряда е имеем дд' е= - =gs\nOw =g co&0w. A.33) Второе слагаемое описывает слабое взаимодействие фермионов через заряженные токи, и из него получается следующее выражение для константы Ферми Gp\ % ?: (-.34,
16 Глава 1. Введение Третий член приводит к слабому взаимодействию фермионов через ней- нейтральные токи, открытие которых явилось первым экспериментальным подтверждением модели Вайнберга—Салама. Остановимся кратко на модификации модели при рассмотрении всех трех известных поколений фермионов. Ясно, что калибровочный и хиггсовский секторы останутся неизменными. К лагранжиану добавятся члены вида A.20в) или A.20г) для каждого дополнительного типа фермионов, которые приведут к появлению дополнительных вкладов в заряженные и нейтральные токи, имеющих ту же структуру, что и A.31). Существенные изменения произойдут только в формуле A.23), описывающей взаимодействие фермионов с полем Хиггса: в ней появятся матрицы, перемешивающие лептоны и кварки одинакового заряда. При диагонализации этих матриц и переходе к состояниям с определенной массой произойдет изменение базисных полей. Это изменение приведет к появлению в заряженных токах матрицы смешивания, называемой также матрицей Кобаяши—Маскавы. Нейтральные же токи и взаимодействия с полем Хиггса останутся диагональными и в этом базисе. Описанная модель с тремя поколениями фермионов обычно на- называется стандартной моделью электрослабых взаимодействий. Важ- Важной чертой этой модели является отсутствие при ее квантовании 75-аномалий, т.е. она представляет собой перенормируемую теорию. Ее предсказания хорошо подтверждаются тремя различными типами экспериментов: нейтринными экспериментами с нейтральными токами, интерференционными экспериментами в глубоко неупругом рассеянии заряженных лептонов и прямым рождением W- и Z-бозонов. Экспери- Экспериментальное значение угла Вайнберга, извлеченное из результатов этих экспериментов, в настоящее время есть (sin2 0w)exp = 0.2315 ±0.0022. Обратимся теперь к калибровочной теории сильных взаимодей- взаимодействий. Как мы уже отмечали, каждый тип (или аромат) кварков может существовать в трех разновидностях, отличающихся цветом — квантовым числом, из фермионов присущим только кваркам и отсутствующим у лептонов. В пространстве цветов действует группа SUC). Требование инвариантности теории относительно локальных SUC)-преобразований приводит к появлению цветного поля Янга— Миллса, или поля глюонов, за счет обмена которыми осуществляется взаимодействие между кварками. Глюоны образуют цветовой октет и нейтральны по отношению к ароматам. Симметрия SUC)C предполага- предполагается точной, т.е. поле глюонов остается безмассовым. Таким образом, лагранжиан этой теории имеет вид (FF^) i J2 V (д U -m)qk, A.35) где суммирование ведется по кваркам различных ароматов.
§ 3. Геометрическая интерпретация калибровочных полей 17 Построенная на основе этого лагранжиана квантовая теория поля называется квантовой хромодинамикой. Ее главной отличительной чер- чертой является асимптотическая свобода [ГВ, Хо], т.е. стремление эффек- эффективной константы связи к нулю при стремлении переданных импульсов к бесконечности. Качественно это означает, что взаимодействие кварков, составляющих адроны, стремится к нулю на малых расстояниях. Ряд исследований дает указания на то, что при малых переданных импульсах эффективная константа связи неограниченно возрастает, следовательно взаимодействие кварков неограниченно возрастает с увеличением рас- расстояния. Вследствие этого несущие цветовой заряд частицы не могут разойтись на макроскопические расстояния, .т.е. наблюдаемый спектр адронов порождают только бесцветные состояния. Отметим в заключе- заключение, что результаты экспериментов по глубоко-неупругому рассеянию лептонов на адронах, адронным столкновениям при высоких энергиях и др. дают убедительные количественные подтверждения правильности квантовой хромодинамики как теории, описывающей сильные взимодей- ствия (краткое изложение этих вопросов и дальнейшие ссылки можно найти, например, в обзоре "Review of Particle Physics", Phis. Rev. D54, №1 A996)). § 3. Геометрическая интерпретация калибровочных полей В заключение этой главы скажем еще несколько слов о гео- геометрическом смысле калибровочных полей. Для этого введем понятие параллельного переноса поля Ф(ж) вдоль контура. Итак, пусть 7 есть контур в пространстве-времени, заданный уравнением хц — х^Ц). Векторное поле X с компонентами Х=1Г A36) является касательным к 7 в каждой точке. Будем говорить, что поле Ф(ж) параллельно переносится вдоль контура 7> если в каждой его точке ковариантная производная в касательном направлении равна нулю, т.е. X"D^(x)\x=x{t) = 0. A.37) Это определение является естественным обобщением понятия парал- параллельного переноса векторного поля в смысле линейной связности. Вычислим изменение поля Ф(х) при параллельном переносе вдоль бесконечно малого замкнутого контура (х,х-\-б],х + е]
18 Глаза 1. Введение Очевидно, Д,Ф = 9(х + е,) - Ф(ж) ~ Д2Ф = Ф(ж + ei + е2) - Ф(ж ^ Д3Ф = Ф(ж + е2) - Ф(ж + ?j + е2) ^ НА^х + ?2))Щх Д4Ф = Ф(ж) - Ф(ж + е2) = г Складывая эти выражения, для полного изменения поля с точностью до членов второго порядка по €\, е2 получим: ДФ =-г(^)Фе^. A.38) Если сравнить это выражение с выражением для изменения при параллельном переносе по замкнутому контуру (в смысле линейной связ- связности) векторного поля ДУ* = —RvPaVvepxe\, то становится ясно, что тензор Fpv аналогичен тензору кривизны, а потенциал Ац аналогичен символам Кристофеля Г?„. Эта аналогия совершенно четко прослежи- прослеживается при геометрическом описании калибровочных полей в терминах расслоенных пространств и связностей, которое является предметом главы 3. Геометрическое описание оказывается наиболее адекватным для рассмотрения калибровочных теорий вне рамок теории возмущений, например, для нахождения и изучения в таких теориях точных решений.
Глава 2 Основные понятия дифференциальной геометрии § 1. Дифференцируемые многообразия Понятие дифференцируемого многообразия является обобщением знакомых из курса аналитической геометрии понятий точки, кривой, поверхности в евклидовом пространстве и т.д. Вещественное (комплексное) многообразие размерности п пред- представляет собой пространство, которое локально, т.е. в окрестности каждой точки, выглядит как евклидово пространство Ж" (С). Точное определение следующее. Вещественное дифференцируемое многообразие М размерности dim M — п есть хаусдорфово пространство (см. Приложение 2), облада- обладающее следующими свойствами: 1) М — локально евклидово, т.е. для любой точки р ? М существует окрестность (см. Приложение 1) этой точки U С М и гомеоморфизм (см. Приложение 3) ср окрестности U на открытое подмножество в Ж". Этот гомеоморфизм символически будем записывать так: <р : U —> R", т.е. для р € U (р(р) = (х*(р),х2(р),...,хп(р)) G Ж". Пара (U,<p) на- называется картой. Вещественные числа х'(р) (»' = \,...,п) называются координатами точки р G U С М относительно карты (U,<p). 2) Существует набор карт {(Ua,ipa)} такой, что \)UUa = M; а п) если множество Uab — Ua П Ub не пусто, то отображение <Раъ — Ч>ьО1Ра' (здесь о — знак композиции отображений) из <ра(иаъ) С Ж" в ipb(Uab) С Ж" является дифференцируемым отображением (в настоящей книге условимся считать его бесконечно дифференцируемым) (рис. I). Набор карт с такими свойствами называется атласом. Рассмотрим некоторые примеры дифференцируемых многообра- многообразий.
20 Глава 2. Основные понятия дифференциальной геометрии (х\р),хЧр\...,хЧр)) м Рис. I. 1) R1, отрезок на прямой, незамкнутая кривая являются приме- примерами одномерных многообразий, для которых достаточно одной карты. 2) Сферу S" можно определить уравнением п+1 (ж1J = с2 = const, где х1 — координаты в Rn+I. «Нульмерная» сфера 5° есть просто две точки: х\ = ±с. Сфера 51 является окружностью, сфера S2 — обычная сфера в трехмерном пространстве. Для описания каждого из этих многообразий требуется как минимум две карты. Поясним, например, как устроены эти карты для S2. В качестве окрестности U\ возьмем сферу без северного полюса (без точки N на рис. 2). Чтобы задать гомеоморфизм <р\ : U\ —> М2, поместим нашу сферу на плоскость М2 так, чтобы она касалась своим «южным» полюсом (точкой S) плоскости. Пусть точка p€U\ обозначена буквой А на рис. 2. Проведем отрезок NA, N Рис. 2.
§ 1. Дифференцируемые многообразия 21 продолжим его до пересечения с плоскостью R2 (В — точка пересечения) и положим <р\(р) = В = (ж1,ж2), где ж1 и ж2 координаты точки В в некоторой системе координат, введенной на М2. Такое отображение называется стереографической проекцией. Ясно, что этим способом можно установить взаимно-однозначное соответствие между точками R2 и всеми точками 52 кроме точки N. В качестве второй карты (Е/2,У2) возьмем сферу без полюса 5 и стереографическую проекцию из S на плоскость, касающуюся сферы в точке N. 3) Проективные пространства. Вещественное проективное пространство размерности п (обознача- (обозначается МР" или Р„(М)) представляет собой множество прямых в М"+|, проходящих через начало координат. Другое эквивалентное определение: ШРп — это сфе- сфера 5", у которой диаметрально противоположные точки отождествлены, как показано на рис. 3 (штри- (штриховой линией соединены тождественные точки). На рис. 4 изображено многообразие ЕР1 и «доказано», что оно гомеоморфно S1. с . с Рис. 3. --:Ж—т в' = aL *в' = = S Рис. 4. Структуру проективного пространства как многообразия мы пояс- поясним на примере комплексного проективного пространства, обозначаемого СР" или Р„(С). Определение комплексного (аналитического) диф- дифференцируемого многообразия аналогично определению вещественного многообразия; требуется сделать лишь очевидные замены понятий веще- вещественного анализа на понятия комплексного (например, Ж" на С" и т.д.). Определим СР" как множество прямых в пространстве С"+1, проходящих через начало координат. Пусть z € C"+1 и (z°,z\... ,zn) ее координаты. Если z Ф О, то точка z определяет прямую, проходя- проходящую через начало координат 0 и точку z. Две точки будем считать эквивалентными, если они лежат на одной прямой, т.е. z ~ z', если z = cz', где се С1 и с Ф 0. Тогда комплексное проективное про- пространство (см. Приложение 4) есть фактор-пространство комплексной плоскости С"+1 с выколотой точкой 0 по этому отношению экви- эквивалентности, СР" = (С"+| - {0})/~. Координаты z\i = 0,1,2...,п) называются однородными координатами на СР". Введем теперь на этом пространстве систему окрестностей Uk и гомеоморфизмов щ. Пусть Uk (к = 0,1,..., п) — это те прямые, для всех точек которых, кроме начала
22 Глава 2. Основные понятия дифференциальной геометрии координат, zk Ф 0. Тогда отображения <рк : C/Jt —>¦ С1 зададим формулами: &)»)wS^) и &, = *'/** - локаль- локальные неоднородные координаты. Т.к. Е7* П 17/ не пусто, то существует отображение <ры = <Pi°<Pb* : С" -^ С". Его явный вид: Очевидно, что функции ?^Ы) являются бесконечно дифференцируемыми (аналитическими) в своей области определения (fkiUk П Uj) С С. Следовательно, для задания многообразия СР" требуется атлас из (п+ I) карты. Можно показать, что СР1 диффеоморфно сфере S2 (задача 2.1). Приведем примеры групповых многообразий, т. е. многообразий, на которых дополнительно задана фупповая структура. а) Z2 — фуппа, состоящая из двух элементов ( — 1) и (+1) с обычным законом умножения. б) унитарная фуппа U(l), элементами которой являются числа вида е'"@ < в < 2тг) со стандартным законом умножения. в) SUB) — фуппа комплексных матриц А размера 2x2, явля- являющихся унитарными (А+А = АА+ = 1) и унимодулярными (det A = 1). г) SOC) — фуппа ортогональных (АТА = 1) унимодулярных (det Л = 1) матриц, задающих повороты векторов в трехмерном про- пространстве. Каждому элементу А ? 517B) можно поставить в соответствие элемент А(.А) = A G SOC), удовлетворяющий следующим уравнениям: (к =1,2,3), где г, (г = 1,2,3) — матрицы Паули. Группа 517B) является уни- универсальной накрывающей фуппой фуппы 50C) (см. Приложение 5), а Л : 5Щ2) —> 5ОC) — накрывающий гомоморфизм. Рис. 5. В заключение этого парафафа приведем примеры множеств, которые не являются многообразиями (рис. 5).
§ 2. Касательные векторы и векторные поля 23 § 2. Касательные векторы и векторные поля Понятие вектора, касательного к многообразию, возникает при абстрагировании понятия производной по направлению, известного из курса математического анализа. Пусть a(t) — гладкая кривая, проходящая через точку ро много- многообразия М, причем параметр t принимает значения из интервала (а,Ъ), содержащего точку t — О, и а@) — р0. Возьмем окрестность U С М и гомеоморфизм ip : U —*¦ Ж"; (pip) = (ж'(р),... ,хп(р)). Обозначим <p(a(t)) — (al(t),a2(t),...,an(t)). Пусть / — вещественнозначная диф- дифференцируемая функция от п переменных (х\... ,хп), заданная на подмножестве <p(U) С М". По определению производная функции / в точке (х1(р0),... ,хп(р0)) по направлению, задаваемому кривой a(t), равна 4 at t=o = jtf(a\t),...,an(t)) t=o da^t) ~dt~ dj(x\...,xn) t=Q B.1) где мы ввели функцию f(p) = /(ar'(j>),... ,ж'(р)) на U со значениями в К. В дальнейшем мы не будем делать различия между этими двумя функциями, так как по смыслу всегда будет понятно, о какой функ- функции идет речь. Если мы обозначим ?' = ~?- направлению B.1) можно записать в виде <=о , то производную по Эх* B-2) где Хрц — линейное отображение из алгебры (бесконечно) дифференци- дифференцируемых функций / на М (мы будем обозначать эту алгебру 3(М)) в Ж. Из B.1) и B.2) следует, что xPof = jt t=0 at B.3) t=o Отображение ХРо называется вектором, касательным к кривой a(t) в точке ро- Нетрудно убедиться, что Хр удовлетворяет правилу Лейбница Xp(fg) = (Xp(f))g(p) + f(p)Xp(g). Дадим следующее определение: касательным вектором к многообра- многообразию М в точке реМ называется линейное отображение Хр : $(М) —* Ж,
24 Глава 2. Основные понятия дифференциальной геометрии удовлетворяющее правилу Лейбница в точке р. При этом значение Xp(f) (/ G $(М)) есть производная функции / в точке р по некоторому направлению. Линейное пространство, натянутое на всевозможные каса- касательные векторы Хр в точке р, называется касательным пространством к М в точке р и обозначается ТР(М). Если {ж1} — локальные коорди- образуют базис в наты в окрестности точки р, то элементы < -^ Тр(М) и любой касательный вектор Хр G ТР(М) может быть записан в виде (см. B.2)): B.4) р где числа {?'} — координаты Хр в этом базисе. Очевидно, что dim TP(M) = dim M. Структуру касательного пространства к прямому произведению многообразий М х N в точке (p,q) (р G M,q G N) мы обсудим в §4. Пусть теперь каждой точке р G М сопоставлен касательный вектор Хр G ТР(М), гладко зависящий от р. Тогда говорят, что на М задано векторное поле X. Если / есть дифференцируемая функция на М, то (X/) есть функция на М, определяемая равенством: (Xf)(p) = Xp(f). В локальных координатах {хг(р)}, заданных в некоторой окрестности U многообразия М, X = Если для любой дифференцируемой функции / € 5(М) функ- функция Xf также является дифференцируемой, то поле X называется диф- дифференцируемым векторным полем. Координаты ?'(р) такого поля в ло- локальном базисе являются дифференцируемыми функциями. Множество всех дифференцируемых векторных полей на М будем обозначать Х(М). Поле X G Х(М) является линейным отображением X : $(М) —> 5(М). Определим в Х(М) скобочную операцию [X, Y]: [X,Y](f) = X(Y(f))-Y(X(f)). Относительно этой операции Х(М) является алгеброй Ли, т. е. выполня- выполняются следующие соотношения: 1) [X,Y] = -[Y,X); B.5а) 2) [X,[Y,Z]] + [Y,[Z,X]] + [Z,[X,Y]] = O B.56) для X, Y, Z G Х(М). Соотношение B.56) называется тождеством Якоби. В Х(М) можно также ввести операцию умножения на функции из следующим образом: если / G $Ш) и X G Х(М), то (fX)p = f(p)Xp.
§ 3. Дифференциальные формы 25 Познакомившись с понятиями касательного вектора и касатель- касательного пространства, мы можем теперь ввести понятия ориентируемости и ориентируемого многообразия. Пусть {Ua,<pa} — некоторый атлас многообразия М. Рассмо- Рассмотрим окрестности Ua и Щ, такие что Ua П Ub ф 0. Ддя точки р G Ua П Щ мы имеем два набора координат: (ра(р) = (х'(р),... ,ж"(р)) и <Рь(р) = (у\р),¦ ¦¦,Уп(р)), и, соответственно, два базиса в касатель- касательном пространстве ТРМ : < (Х,)р = -^ > и I (Yj)p = ^> >¦ Нетрудно убедиться в том, что эти базисы связаны преобразованием (Х{)р = { где матрица А\ = (dy*/dxl)\ и якобиан J = del А Ф 0. Если J > 0, то говорят, что базисы {Х{} и {J}} имеют одну и ту же ориентацию (ориентированы одинаково), если и J < 0, то говорят, что они имеют противоположные ориентации. Многообразие М называется ориентируемым, если для любых перекрывающихся окрестностей Ua и Ub существуют локальные коорди- координаты {ж1} для Ua и {у7} для Ub, такие, что якобиан J = detidyi/dx1) > 0. Это определение совпадает с интуитивно понятным свойством «двухсто- «двухсторонности» двумерных поверхностей D2 (двумерный диск), сферы S2, тор Т2 и др. Все эти поверхности ориентируемые. В то же время, например, лента Мёбиуса, рассматриваемая в §6 настоящей главы, обла- обладает лишь одной стороной и является неориентируемым многообразием (задача 2.26). Для нее всегда найдутся окрестности, в пересечении ко- которых якобиан матрицы преобразования J < 0. Другими примерами неориентируемых многообразий являются бутылка Клейна (§6 гл. 2) и проективное пространство ЕР2. § 3. Дифференциальные формы Рассмотрим линейное пространство Тр(М), дуальное (см. При- Приложение 6) к касательному пространству ТР(М) многообразия М. Оно называется кокасательным пространством, а его элементы — кокасатель- ными векторами (ковекторами). Часто значение ковектора шр € Тр(М) как линейного функционала на касательном векторе Хр G ТР(М) за- записывается в виде внутреннего произведения (шр,Хр). Таким обра- образом, ковектор шр является линейным функционалом: шр : Тр(М) —* Ш. Пусть {х*} — локальная координатная система в окрестности точки р базис касательных векторов в ТР(М). Обозначим через - {(*),}
26 Глава 2. Основные понятия дифференциальной геометрии •I (da;1) > базис в Тр(М), дуальный к < (gfr) f • Тогда Функционал dx% называют полным дифференциалом. Любой ковектор шр ? Тр(М) может быть представлен в виде %, B.7) где коэффициенты щ называются компонентами ковектора шр и равны Для каждой функции / € 5(^0 мы определим ее дифференциал (df)p в точке р как такой функционал, что {(df)p,Xp)=Xp(f), B.9) где Хр G ГР(М). В формулах B.6), B.7) и B.9) символы dx{ и d/ использовались просто как обозначение. Но оказывается, что эти диф- дифференциалы обладают теми же свойствами, что и обычные полные дифференциалы функций, изучаемые в курсе математического анализа. В частности, из B.7)—B.9) следует, что p- BШ) Сопоставим каждой точке р многообразия М ковектор шр G Тр(М). Тогда говорят, что на М задана I-форма (или дифференциальная форма степени 1). Ясно, что 1-форма ш есть линейное отображение, ш : 3?(М) —> 5(М), причем (ш(Х))р = (шр,Хр), хехш), рем, B.11) (мы будем рассматривать лишь дифференцируемые 1-формы). Справедливы следующие свойства (f,g G #(M), X,Y ? Х(М)): u(fX + gY) = fu(X) + gw(Y\ (/w)(X) = fu>(X). B.12) В терминах локальных координат {ж1}
§ 3. Дифференциальные формы 27 Очевидно, что и и X не зависят от выбора координат. Базисные элементы dxl и ~, при преобразованиях координат х —>¦ х' = х'(х) преобразуются по формулам: . „¦ дх'',. д дхк д dx = —-dar, —.- = — -—т. dx' дх13 дх'3 дхк Отсюда можно вывести закон преобразования для компонент щ и ?' (задача 2.4). Определим теперь форму ш произвольной целой степени г как кососимметрическое отображение из Х(М) х Х(М) х ... х Х(М) (г раз) в ШМ), линейное по каждому аргументу. Кососимметричность означает, что ш(Хи...,Хг) = (-1)л'ш(Х1[(]),...,Х1[(г)), где Ах — четность перестановки тг : A,2,... ,г) -^ (тгA),¦.. ,тгB)). Обо- Обозначим DT(M) множество всех дифференциальных г-форм на М для каждого г > 0. Ясно, что если п = dtmM, то вследствие кососимме- кососимметричности г-форма ш = 0, если г > п. Положим D°(M) = 5(М), т.е. дифференцируемые функции на М мы будем считать 0-формами. Операция внешнего произведения Л позволяет из форм низших степеней строить формы более высоких степеней. Если ш\ G Dr(M) и а>2 € DS(M), то Ш] Ло>2 € Dr+S, и г + s-форма ш\ Ло>2 есть следующее отображение: А(ш\(Х\,..., Хг) а;2(Хг+ь..., Xr+S)) = B.13) где символ А означает альтернирование и суммирование ведется по всем возможным перестановкам тг. Например, для ш\ ? Dl(M), 102 € DX(M) ш\ Л ш2 является 2-формой: (w, Лш2)(Х,У) - 1-(Ш1(Х)ш2(У) -ui(Y)u>2(X)), X,Y? X(M). B.14) Можно показать, что если ш G Dr(M), а /х G Dq(M), то справедлива формула В частности, если ш и ц являются 1-формами, то ш Л /х = — /х Л ш и а;Ла; =
28 Глава 2. Основные понятия дифференциальной геометрии Если {ж1} — локальные координаты в окрестности U С М, то дифференциалы dx1 образуют базис 1-форм на U. Аналогично внешние произведения г дифференциалов dxh А... Adx'r образуют базис г-форм на U. Любая дифференциальная r-форма в этой координатной окрестности может быть представлена в виде ш = ^2 иь h-Лг (ж)dxii A dxh Л ... Л dxir, B.15) i,<J2<...<«r где компоненты «,-, *2...;г(х) — дифференцируемые функции на U, анти- антисимметричные по всем индексам (сравни с формулой B.7) для ковектора). Отсюда, например, следует, что для 1-формы где С(х) — компоненты векторного поля X в выбранных локальных координатах. В соответствии с вышесказанным 0-форма характеризуется одной функцией, произвольная 1-форма ш = ^щ(х)йх% — п функциями > щ(х) и т.д. Это соответствует тому, что размерность линейного про- пространства Лг антисимметричных тензоров степени г в точке х G М равна 1 при г = 0, п при г = \ и т.д. Поэтому говорят, что dimXH = 1, dimD1 = п. Можно показать, что dim D2 = п(п - 1 )/2 и dim Dr = dim Dn~r, где п — dim M (задача 2.5). Часто оказывается полезной следующая формула dx1' Л ... Л dx1' = ег>-л" dx] Л dx2 Л ... Л dxn, B.16) где е*1-1* — полностью антисимметричный тензор ранга п. Введем операцию внешнего дифференцирования форм, которую будем обозначать символом d. Она характеризуется следующими свой- свойствами: а) d есть линейное отображение из Dr в DT+l, d(Dr) С Dr+l; б) для функции / G D°(M) 1-форма df есть полный дифферен- дифференциал / и df(X) = X(f), ХеХ(М) B.17) (ср. B.9)); в) если о> 6 DT(M) и fie D*(M), то fi)-d(vAfi + (-\)ru;Adfi; B.18) г) dd = 0. B.19)
§ 3. Дифференциальные формы 29 Покажем, как операция внешнего дифференцирования записыва- записывается в локальных координатах. Пусть поле X = C'^fr- Тогда, в соответ- соответствии со свойством B.17) т.е. df = @) <fc' как и для дифференциала функции / (см. B.10)). Если г-форма ш = ^2 u«i...»r <*г*1 Л ... Л rfx'r, то (г + 1)-форма dw в «1<«2<-<»г этих координатах выглядит так dttjb..jr Л dx" Л ... Л dxtr - Л «fa* л ... Л Аг*'. B.20) Если М = М3, то нетрудно показать, что внешнее дифферен- дифференцирование эквивалентно вычислению rot и div (задача 2.6). При этом для функции на К3 тождество ddf следует из равенства смешанных частных производных dtdjf и djdif или, эквивалентно, из тождества rotgrad/ = 0. Для 1-формы ш = ^Uidx* тождество ddw соответствует t тождеству div rot и = 0 (задача 2.7). Несложно доказать следующую формулу дифференцирования 1-форм (задача 2.8), которая нам понадобится в дальнейшем. Пусть ш € D[(M) и X,Y e Х(М). Тогда 2 (dw) (X, Y) = X(u(Y)) - ?(ш(х)) - ш([Х, Y]), B.21) где Х(ш(У)) понимается как результат действия векторного поля X на функцию w(Y) G $(М). Определим теперь операцию интегрирования дифференциальных форм для ориентируемого многообразия М. Мы приведем здесь лишь основные моменты этой конструкции, строгое изложение можно найти в [Бу] (см. также [На], [НС]). Можно показать, что для ориентируемого многообразия М раз- размерности п всегда существует n-форма П € Dn(M), которая нигде не обращается в нуль. Такая форма задает ориентацию М и называется элементом объема. Такая форма не едининственна, другая те-форма О' = hu, где h — гладкая функция на М, нигде не обращающаяся в нуль, также является элементом объема. Два элемента объема п и п' задают одинаковые
30 Глава 2. Основные понятия дифференциальной геометрии ориентации, если функция h > 0 на М, и противоположные, если h < 0. Для М = R" примером такой формы является dv = dx] Л dx2 Л... Л dx", она задает естественную ориентацию на Ж". Отметим, что введенные выше определения являются коррект- корректными. Действительно, рассмотрим две карты (Ua,<pa) и AТъ,<рь) с пересекающимися окрестностями на М и соответствующие координаты (ж',ж2,... ,ж") и (г/',у2,... ,у"). Тогда любая «-форма ш G ?>"(М) ло- локально, на Uа, может быть представлена как ш — ua(x)dxl Л ... Л dxn (см. B.15) и B.16)). В точке р G Ua П Щ мы имеем также другое локальное представление ш = ub(y)dy] Л... Л dyn. Используя формулу для преобразования базисных форм типа dx1 и результаты задачи 2.4, нетрудно убедиться, что иа(х) = щ(<раЬ(х)) ¦ J, где J = det(dy'/dxi) — якобиан матрицы преобразования координат. Так как М — ориентируемое многообразие, то J > 0. Поэтому знак функции h, связывающей два элемента объема, определен однозначно. Заметим, что любая n-форма ш может быть записана как ш — fil, где / — функция на М. Возможность определить интефал от ш по М зависит от гладкости функции /. Для простоты рассмотрим случай, когда / офаничена на М, имеет компактный носитель и ее возможные точки разрыва образуют подмножество меры нуль. Определим сначала интефал от ш по окрестности U С М карты (U,<p) с координатами (х1,... ,хп). Как уже говорилось выше, форма и) локально может быть представлена как ш = u(x)dx] Л ... Л dx" (точнее, такое представление имеет форма (<р~1)*ш, см. следующий парафаф) и может рассматриваться как форма на (p(U) С К". Тогда положим по определению / ш= I u(x) dx1 Л ... Л dx11 = I u(x) dnx, B.22а) U V(U) <p(U) где последнее выражение есть обычный кратный интефал в смысле Римана от функции те переменных. Заметим, что согласно B.22), dv = dx] Л ... Л dx" может рассматриваться формально как элемент объема интефирования d"x в обычном смысле. Нетрудно убедиться, что для ориентируемого многообразия М это определение не зависит от выбора локальных координат и согласовано в области пересечения нескольких окрестностей (задача 2.27). Далее, пусть {Ua} — открытое покрытие М такое, что каждая точка покрыта конечным числом окрестностей (для этого предположим, что М паракомпактно, см. Приложение 10). Можно показать, что для
§ 3. Дифференциальные формы 31 такого покрытия существует разбиение единицы, т.е. набор функций ?а € д(М) таких, что A) 0 < еа(р) ^ 1; B) еа(р) = О, если р ? Ua и C) Y2?a(p) — 1 ДЛЯ любой точки р (Е М. Из свойства C) следует, что а ш = ^2еаш. Тогда интеграл от ш по многообразию М определим как aW- B-22б> м а м ° иа Сделаем еще одно замечание. Если / — интегрируемая функция наМиО — элемент объема, то в общем случае интеграл от / по М можно определить как / fu, но т.к. элемент объема, задающий данную м ориентацию, не является единственным, то это определение не дает однозначного результата. По этой же причине нельзя однозначно ввести понятие объема М. Ситуация меняется, если многообразие снабжено метрикой, см. гл. 3. Определим еще операцию Ходжа или преобразование дуальности, обозначаемое символом *. Эта операция переводит формы из простран- пространства DT(M) в D"~T(M). Здесь мы рассмотрим эту операцию для плоского евклидова пространства М — Ж1: * (da:'1 Л dx%2 Л ... Л dxtr) - — е,- ,- ,- ,- , * х (п - г)! 2" ' """" х dxir+l Л dxir+7 Л ... Л dxin. B.23а) Если пространство М риманово, то в определении операции Ходжа нужно заменить е,-,...,-. на \/J7le«i...»r»,+i-««' где 7 — детерминант метри- метрического тензора, и необходимо различать верхние и нижние индексы (см. §4, гл. 3). Нетрудно показать, что в случае евклидова пространства (-l)r(n-r)u; B.236) для ш G DT(Rn). Введем теперь понятие внутреннего произведения форм. Пусть ш и ft суть г-формы на М = R". Определим их внутреннее произведение так: (ш,ц) = шЛ*ц. B.24) R* Нетрудно показать, что если ш = ^и,-,...^ Ас* Л ... Л dxlr и fi = X) Vi,...irdx'' Л ... Л dxtr, то , ц) = I Ui^.itVi^iT (ш, ц) = I Ui^.itVi^iTdv B.25)
32 Глава 2. Основные понятия дифференциальной геометрии (задача 2.11). Внутреннее произведение симметрично: (ш, ц) = (ц, ш) так как иЛ*ц = цЛ*ш. B.26) Это равенство следует из определения операции Ходжа. Для изучения дальнейших свойств дифференциальных форм мож- можно рекомендовать книгу [КН], а также книги и обзоры [Аи], [ЕГХ], [На], [НС], написанные для физиков. § 4. Отображения и преобразования Рассмотрим два многообразия М и N, причем, вообще говоря, т = dim М фп — dim N. Пусть задано отображение ip : М —» N. Для выяснения некоторых свойств отображений нам в этом параграфе будет удобно вести рассмотрение в локальных координатах. Выберем в М карту (U,ip), а в N — (V,x), причем <p(U) С V. Определим функцию х° У ° V>~' из "Ф(Ю СГ в x(V) С Ж". Если функции Xi°'Po1lfJl являются (бесконечно) дифференциру- дифференцируемыми для всех карт (Uj,i>j) и (Vi,Xi) таких, что <p(Uj) С VJ-, то говорят что <р — дифференцируемое отображение. Рис. 6. Выберем точку р G М и обозначим ее образ в N через q, q = (p(p) g N (рис. 6). Пусть a(t) — кривая в М, проходящая через точку р, причем а@) = р. Она определяет касательный вектор Хр к М в точке р. Образ этой кривой в N будем обозначать E(t) = (p(a(t)). Кривая Pit) определяет касательный вектор X'q к N в точке q, который является образом Хр при отображении многообразий. Такая процедура определяет дицЬференциап отображения <р, обозначаемый (р' или dip. Будем писать X'q = Х'^) = <р'Хр = d<pXp. B.27) Для дифференцируемой функции /' на N, f G S(N), определим функцию / G $(М), являющуюся обратным образом /' при отображе- отображении (р, так " - f = ip*f = foip. B.28)
§ 4. Отображения и преобразования 33 Тогда справедлива следующая цепочка равенств: <p'Xp(f) = X'v(p)(f) = jtf _ d > dt t=o _ t—0 = Xp(f' oip) = Xp{ip*f). B.29) Обсудим отображение касательных векторов в терминах локальных координат. Пусть в окрестностях U и V, введенных выше, заданы координаты {x'}(i = 1,...,т) и {у3}^ = 1,...,п) и точка р G М имеет координаты {xq,...,x™}, a q — <р(р) G N — {Уо>--чУо}- Таким образом, мы имеем функцию ф = х°<Р°'Ф~1 '¦ 1>(U) ~^ X(V), причем yl = ftixo) (j = 1,2,..., п). Возьмем в качестве Х„ вектор ( А ) - Тогда, \<>х )Р для функции /' на V, пользуясь B.29) и правилом дифференцирования сложной функции, получаем: „ 9 дх{ df х=х0 у=уо дх1 х=х0 Х=Хо I Следовательно, дх1 t=x0 ду3 B.30) Произвольное дифференцируемое отображение <р, вообще говоря, не преобразует векторное поле на М в векторное поле на N. Это связано с тем, что может не существовать обратное отображение <р~х (см. формулу B.35)). Теперь мы можем выяснить, как устроено касательное простран- пространство Т(рд)(М х N) к прямому произведению многообразий М х N (dimM = m,d\mN = п) в точке (p,q) G М х N. Пусть Хр G ТР(М), Yg ^ Tq(N), а кривые x(t) и y(t) такие, что Хр — касательный вектор к x(t) в точке р = ж(^о), a Yq — касательный вектор к y(t) в точке 9 = y(to). Возьмем теперь вектор Z ? T(m){M x N), который касает- касается кривой (x(t),y(t)) в (p,q) — (x(to),y(to)). Определим отображение М —» М х N следующим образом: "ф\(р') — (p',q), где р' G М. Аналогич- Аналогично, 1р2 : JV -> М х JV и ^2(?') = (Р,?'), ?' € N. Обозначим Х^,) = -ф\Хр, y(p,7) = i>'iYq- Очевидно, что Х<Р)(?) € Г(рЛ)(АГ х JV) и Y^,,, G ^^(M x JV). Пусть / G 5(Л^ х -W")- Тогда, согласно B.3), t=tn 2 Зак. 3II
34 Глава 2. Основные понятия дифференциальной геометрии d " " ¦"¦ " " B.31) t=t0 dt t=fo и, значит, Z(ptg) = X(ptg) + 4{p,q) ¦ Таким образом касательное пространство T(p,q)(M x N) может быть отождествлено с прямой суммой векторных пространств Тр(М) ф Tq(N). Пусть теперь задано отображение <р : М х N —> V, где М, N, V — некоторые многообразия. Зафиксируем точку (р, q) € М х N и определим отображения (р\ : М -* V и <р2 : N -+ V следующими формулами: уя(р') = У(?',9). ?>2(q') = У(^,?'), где р' €М, q' ? N. Тогда можно доказать следующее Предложение 2.4.1. Если вектор Ъ^ф € Т(рЛ)(М х N) соответствует (Хр, Yq) G ТР(М) ф Tg(N), как описано выше, то B.32) Доказательство. Заметим, что щ = tpoipi (i = 1,2), где ^ — отображения, определенные выше. Из определения Х(р)9) и Y(p>9) следует, что ' (p'tXp, <p'Y(j,,q) = <p'2Yq. ПОЭТОМУ (p'Z(p,q) = <р'(*(рл)+Ум') = ^'l^Р ^ Формулу B.32) часто называют формулой Лейбница. Обсудим теперь отображение форм. Пусть о/ является г-формой на N. Определим ее обратный образ ш = (р*ш' € DT(M) следующей формулой V..., Хг) = а;'„(р)(?>'Х,,..., ^'хг), B.33) где Xi (E 2),(М) (г = 1,2,...,г). Очевидно, эта формула полностью согласована с B.28), B.29), если функции /' и <p*f' рассматривать как формы нулевой степени. Пусть теперь окрестности U, V, координаты {ж*}, {у7} и функция ф те же, что и выше. По определению B.33) и согласно B.30) имеем JL X=Xq Таким образом, формула B.33) для дифференциала dy% приводится к виду (<P*dy')p = (Ar1")-. Можно доказать, что внешнее дифференцирование перестановоч- перестановочно с <р*. Мы покажем это для 1-формы в локальных координатах. Пусть
§ 4. Отображения и преобразования 35 ' = Ylu'j ш' = Ylu'j(y)dtf есть 1-форма на V. Тогда <р*ш' = Yl(u'j °Ф)(.х)(Ф*йу*) з з и мы имеем две цепочки равенств: дх{ л (^ V) = Е ^ ^ V ^(ф ^) л (^ V) = Е т ^ — ** л ^- -^> ду1 ^ ду1 дхк дх1 Сравнивая окончательные выражения, приходим к выводу, что d(<p*cj') = <p*(dw'). B.34) В итоге, после обсуждения действия отображения (р, мы имеем следующую схему: <р: M^N, Dr(M) ?- Dr(N). Отображение <р отображает точки М в N и касательные векторы к М в касательные векторы к N. Для функций и форм соответствующее отобра- отображение действует в обратном направлении. Обратный образ для форм <р*ш' часто называют возвратом формы ш' из N в М (соответствующий термин в английском языке — pullback). Если в качестве многообразия N выступает само многообразие М и отображение у?: М —> М является диффеоморфизмом, т.е. ip и (р~1 — дифференцируемые отображения, то <р называют преобразованием в М. Оно индуцирует автоморфизм (см. Приложение 7) ip' алгебры Ли Х(М) векторных полей: ((р'Х)р = ip'Xv-Hph B.35) где X € Х(М). Выполняются следующие два свойства преобразований: ' (fo<p-])<p'X; B.36а)
36 Глава 2. Основные понятия дифференциальной геометрии 2) [tplX1<p'Y\ = tpl([X,Y]). B.366) В дальнейшем важную роль будут играть однопараметрические группы преобразований М. Однопараметрическая группа преобразований — это множество преобразований <pt, параметризуемых вещественным числом t, —со < t < со, и обладающих свойствами: 1) (ft : М —> М есть преобразование для любого фиксированного t; 2) отображение <р :1х М —> М дифференцируемое; 3) ipt+s = <Pt°<ps- Оказывается, что каждое векторное поле X ? Х(М) локально находится во взаимно-однозначном соответствии с некоторой однопара- метрической группой преобразований щ. Это соответствие описывается следующими формулами: (Xf)(p) = j,m 1 = hm (^ -) (p), где / ? $(M). Говорят, что <pt индуцирует поле X. Предложение 2.4.2. Пусть X — векторное поле на М, (pt — его однопараметрическая группа преобразований, a ip — некоторое преобразование М. Тогда поле X' = -ф'Х индуцируется il>o<ptoi/)~]. Доказательство. Возьмем точку р G М и q = 1р(р). Вектор Хр ? Тр(М) касается кривой a(t) = <pt(p) в точке р = а@). Если / ? $(М), то (X'f)q = (X(f о ф))р = Jim (J r П-±-Г.\ (<ф Отсюда следует, что поле X' — ф'Х порождается однопараметрической ФУппой преобразований ф о щ о ф~{. В заключение парафафа мы приведем без доказательства следую- следующую формулу: [Х,У] = Нт р-, B.37) где X, Y ? Х(М), a (pt — однопараметрическая фуппа преобразований, порожденная полем X (доказательство можно найти в книгах [Но], [КН]. § 5. Группы Ли Важным классом дифференцируемых многообразий являются фуппы Ли. Группа Ли — это фуппа, которая одновременно явля- является дифференцируемым многообразием, причем фупповая операция
§ 5. Группы Ли 37 G х G Э (а, Ъ) —»• ab ' GG есть дифференцируемое отображение из G х G в G. Обозначим через La левые сдвиги на группе элементом а € G: Lag = ад, д Е G. Аналогично, Ra — правый сдвиг: Rag = да. La и Ra являются преобразованиями на G. Определим также отображение Sa, a G G: Sag = LaRa-\g — ада~х. Sa есть внутренний автоморфизм (см. Приложение 7) в G. Рассмотрим множество векторных полей на G, X(G). Поле X € X называется левоинвариантным, если оно инвариантно относительно всех отображений L'a, а € G (L'a — дифференциал La). Это означает, что L'aX — X или, если указывать точку, в которой рассматривается поле, (LaX)ag ЕЕ LaXg = Xag. B.38) Обозначим через g множество всех левоинвариантных полей на G, QCX. Пусть е — единица группы Ли G. Рассмотрим произвольный касательный вектор А пространства, касательного к G в точке е, Te(G). Определим векторное поле X на G формулой: Ха = L'aA. Тогда для этого поля справедливы равенства: Хь — LbAe = L^-xL'aAe — jL^-iXa, (a,b G G), т.е. поле Х является левоинвариантным (ср. B.38)). Следовательно, линейные пространства g и Te(G) изоморфны, g = Te(G), и dimg = d\mTe(G) = dimG. Если X,Y E g, то из B.366) следует, что L'a[X,Y] = [L'aX,L'aY] = [X,Y] B.39) и, значит, [X, Y] G g. Таким образом, g является алгеброй; она называется алгеброй Ли группы G (отметим, что для того, чтобы g было алгеброй Ли, должны выполняться свойства B.5а, б); в нашем случае они выполняются). Подробнее свойства алгебр Ли будут изучаться в гл. 5. Элементы g будем обозначать А, В, С .... Как уже говорилось в § 4, каждому векторному полю X локально соответствует некоторая однопараметрическая группа преобразований <pt. Если поле X инвариантно относительно действия некоторого преобра- преобразования ip, т.е. гр'Х = X, то из Предложения 2.4.2 следует, что щ и -ф коммутируют между собой. Пусть А € g и (pt — соответствующая однопараметрическая группа преобразований в окрестности е. Тогда <pt(g) = (<Pt о Lg)(e) = (Lg о (pt)(e) = Lg((pt(e)) = gipt(e) = R^g, B.40) для любого g G G. Следовательно, щ задано глобально на всей группе G. Величина at — ^<(e) обладает свойствами: 0 at+s = atas; B.41a) ii) o0 = е B.416)
38 Глава 2. Основные понятия дифференциальной геометрии и является однопараметрической подгруппой в G. Таким образом, любое левоинвариантное векторное поле А на G находится во взаимно- взаимнооднозначном соответствии с однопараметрической подгруппой щ в G. Докажем одно важное свойство автоморфизмов (см. Приложе- Приложение 6) G. Пусть <р — автоморфизм. Тогда (р о La)(b) = <p(La(b)) = <p(ab) = <р(а)<р(Ъ) = Ь^рф)) = (Lv(a) о <р){Ъ). Используя это свойство, получаем, что если А € д, то (ip'A)v(a) = ip'Aa - <p'L'aAe = L'v(a)<p'Ae = L'v(a)(<p'A)e. Т.к. (<p'A)e G Te(G) = g, то <р'А является также левоинвариантным полем, <р'А е д. Обратимся теперь к автоморфизму Sa, a € G, введенному выше. Дифференциал этого отображения играет важную роль в теории групп и алгебр и для него часто употребляют обозначение ad(a) = S'a. Отображе- Отображение a —> ad(a) задает представление группы G в линейном пространстве g и называется присоединенным представлением ad (от слова adjoint — присоединенный). Т.к. 5„ = LaRa-\ = Ra-\La, то для A G g имеет место соотношение ad(a)A = R'a-\L'aA = R'a-iA. Если <ц — однопараметричес- кая подгруппа в G, отвечающая полю А € д, то формулу B.37) можно переписать в виде: B-R'B B-ad(aTl)B [А, В] = lim ^— = Нш У ¦ B.42) <—о t <->о t Отметим еще одно важное свойство однопараметрической под- подгруппы aj левоинвариантного поля A G д. Она является единственной кривой в G такой, что касательный вектор к ней в точке at, который мы обозначим <н, равен L'^Ae и Оо = е. Обозначим элемент группы Oi\t=l = d] G G через ехр.4. Таким образом, ехр есть экспоненциальное отображение из g в G, ехр : g —* G. При этом ехр tA = щ. Теперь мы перейдем к рассмотрению форм на группе Ли G. Форма ш на G называется левоинвариантной, если L*aw = ш для любого a <= G. Если ш — левоинвариантная 1-форма, а А (Е д, то («СА))<а) = ша(Ав) = u>a(L'aAe) = (L*au})e(Ae) = ше(Ае) B.43) для любого а в G. Функция и)(А) постоянна на G и мы можем определить пространство д* левоинвариантных форм на G как пространство дуальное к д. Пользуясь формулой B.21), можно доказать (задача 2.15) уравнение Маурера—Картана: B.44) для ш е 9*, а,в ? д-
§ 5. Группы Ли 39 До сих пор мы рассматривали формы со значениями в простран- пространстве вещественных чисел BL В общем случае форма может принимать значения в некотором линейном пространстве. Так, нам часто придется иметь дело с формами на многообразии М со значениями в алгебре Ли g группы G. Мы определим их так: ш = ^w"Qa, где элементы {Qa} а (а = 1,2,...,d\mG) образуют базис в д, а и>а — обычные М-значные формы на М. В этом случае выражение [ш,ц] понимается следующим образом: [w, Ц] = [Qa, Qp]wa A /, B.45а) где ш = Y^^Qa, /* = IZ^Qa, a [Qa,Qp] — коммутатор в алгебре Ли 0. а а Hi Например, если ш,ц? D\M), X,Y G Х(М), то [ш, /х](Х, Y) = [Qa, Qp](wa Л /)(Х, Y)=X-[Qa, ~ ua(Y)fip(X)) = ~MX),^(Y)] - l-[u>(Y),n(X)l B-456) Нетрудно доказать следующие свойства: [ш, ш](Х, Y) = [и(Х), ш(Х)] , и ? Dx (M); B.45в) B.45г) B.45д) Среди различных форм на группе важную роль играет каноничес- каноническая левоинвариантная 1 -форма в (ее называют также формой Маурера— Картана). Это есть левоинвариантная 0-значная 1-форма на G, опреде- определяемая формулой 0(А) = А или (в(А))(а) = ва(А) = Ае для А € 0 (в этой формуле аргумент формы обычно понимают как левоинвариантное векторное поле на группе в некоторой точке а ? G, а правую часть формулы как элемент Te(G) = 0). Каноническую форму можно разложить по базису {Qa} алгебры д: в = J2^"Qa, где в" i образуют базис вещественнозначных левоинвариантных 1-форм на G. Уравнение Маурера—Картана для канонической формы может быть записано как d9=--[e,0] B.46a)
40 Глава 2. Основные понятия дифференциальной геометрии (см. B.45)) или 1 d9a = — /3,7=1 (а = 1,2,... ,dimCr), где Ср^ — структурные константы алгебры д в базисе {Qa}, определяемые соотношением: B-47) Сокращенно форму в записывают в виде: в = д~хйд. B.48) Если мы имеем матричную реализацию группы G, т.е. д = д(?) — ма- матрица, параметризованная координатами ?:, то запись B.48) приобретает буквальный смысл. Для примера вычислим каноническую форму в случае G — SUB). В стандартной параметризации углами Эйлера {?} = {х, ?>, i>} 9(Х, <Р, 1» = еЧ'еЪеЧ* = ( _% \ ) , B.49) где х а*. Z\ = cos — e 2 t z2 = sin—e"'1^", a гь T2i тз — матрицы Паули. Несложные вычисления по формуле B.48) дают в — —- (s\n х zos-ф dip-s\nij)dx) + — (sin % sin ^d^3 + cos^d%) 4- ^ + di>). B.50) Матрицы ^та (a = 1,2,3) образуют базис в алгебре Ни g = suB) группы SUB). Построим также соответствующие левоинвариантные векторные поля Аа на фуппе G = 517B). Для этого возьмем линейно-независимые Л Л Л векторные поля ¦§-, ^-, ^, запишем Ло в виде разложений по этим полям и найдем коэффициенты этих разложений из условий в(Аа) = ^та.
§5. Группы Ли 41 Легко получить, что cosip д д д А\ = sin^- cos^ctgx—, sin x д<р дх 8$ sin^ д д . , д Рассмотрим теперь дифференцируемое многообразие М, на ко- котором действует группа Ли G как группа преобразований. Это означает, что для каждого элемента oGG определено преобразование М, которое мы будем обозначать ipa, ij>a : M —> М. Пусть при этом отображение G х М -* М, переводящее элемент (а,р) в ipaP(a ^ G,p € М), является дифференцируемым и для него выполняются условия: 1) 1ре — тождественное преобразование; B.52) 2) 1раЬ(р) ЫФ()) В этом случае говорят, что G действует на М справа (иногда пишут ра вместо "фар). Говорят также, что G действует на М эффективно, если из равенства -фар — р для всех р 6 М следует, что о = е, и что G действует на М свободно, если из равенства ipap = р для некоторого р следует, что а = е. Очевидно, если группа G действует на М свободно, то она действует и эффективно. Следующая конструкция будет часто встречаться нам в последу- последующих разделах. Мы установим соответствие между левоинвариантными векторными полями на G и векторными полями на М. Пусть А ? д и at — отвечающая ему однопараметрическая подгруппа в G. Тогда ipai есть однопараметрическая группа преобразований М и она индуци- индуцирует векторное поле А* € Х(М). Тем самым мы задали отображение а : д —» Х(М), для которого ар(А) = А*р. Оно является производной отображения ар : G —у М, задаваемого формулой ар(а) = ipa(p)- Предложение 2.5.1. Отображение а является гомоморфизмом (см. При- Приложение 7). Если G действует эффективно на М, то а — мономорфизм (д в Х(М)). Если G действует свободно на М, то для любого ненулевого А ? д а(А) нигде не обращается в нуль на М. Доказательство. Покажем, что а — гомоморфизм. Если Ь ? G, то b). B.53)
42 Глава 2. Основные понятия дифференциальной геометрии Пусть А, В € g, a at — однопараметрическая подгруппа в G, соответ- соответствующая А. Переходя в B.53) к производным отображений и используя равенства B.37) и B.42), получим [А$,В*р] = [<гр{А),орВ\= Jim j = Jim 1 [ <трВ =<rPlimj [в - ad («Г1) в] = т. е. а — гомоморфизм алгебры Ли g в алгебру Ли Х(М). Пусть поле А Е g принадлежит ядру этого гомоморфизма, т.е. (т(Л) = 0 всюду на М. Это означает, что ¦фа, — тривиальная группа преобразований. Если G действует на М эффективно, то отсюда следует, что <н = е и Л = 0. Таким образом, кегсг = {0} и а является изоморфизмом (см. Приложение 7). Пусть <т(А) = 0 в некоторой точке ро G М. Тогда Va,Po = Ро- Если G действует на М свободно, то это влечет at = е и А = 0. л § 6. Главные расслоения Понятие расслоенного простран- пространства (или расслоения) играет важную роль в дифференциальной геометрии и ее физических приложениях, в част- частности, в теории калибровочных полей. 1 Оно возникает, например, тогда, когда на многообразии Р вводят структуру слоев. А именно, пусть Р разбивается на подмножества, т. н. слои, каждый из которых изоморфен некоторому мно- множеству F. Слои можно «занумеровать» точками некоторого множества М, на- называемого базой (схематическое изображение расслоения дано на рис. 7). Это означает, что задана каноническая проекция ж : Р —> М', отображаю- отображающая все точки одного слоя (и только их) в точку х € М. Таким образом, слой над точкой х можно обозначить ж~х(х). Кроме того, локально, т.е. над некоторой окрестностью U С М, расслоение Р устроено так же, как прямое произведение U x F. Но глобальная структура расслоения может быть нетривиальной. Расслоение Р над базой М часто обозначают Р —» М. Можно доказать теорему о том, что любое расслоение над базой, являющейся стягиваемым пространством (т.е. которое можно по себе продеформировать в точку), тривиально. Так, например, тривиальны все расслоения над окрестностью в Ж". Рис. 7.
§ 6. Главные расслоения 43 На рис. 8 а, б изображены два расслоения над М — S1 с одним и тем же слоем F, являющимся отрезком [а, Ь] (точка о отождествляется с а', Ь — с Ъ'). Это обычное кольцо (ограниченный цилиндр) (рис. 8а) и лента Мебиуса (кольцо, перекрученное один раз) (рис. 86). Их локальные структуры одинаковы, в то время как глобальные явно различаются. Этот пример весьма поучителен: из него видно, что задание базы не определяет расслоение однозначно. Требуется указать еще, каким образом различные части расслоения (порции расслоения над различными локальными окрестностями) «склеиваются» между собой. и V " и а V б) Ь 1 а U Рис. 8. Примером расслоения может служить множество Р, на котором задано отношение эквивалентности ~ (см. Приложение 4) так, что классы эквивалентности гомеоморфны между собой. В этом случае слой образован точками, эквивалентными друг другу, базой является фактор- фактормножество Р/~, а точками базы — классы эквивалентности. Понятие расслоения возникает также тогда, когда с каждой точкой многообразия М связано множество объектов, характеризующих М в этой точке. Так например, в каждой точке х ? М существует набор касательных к М векторов, образующих линейное пространство ТХ(М). Тогда можно ввести расслоение Р над базой М, для которого слой F над точкой х есть множество всех векторов касательных к М в точке х. Оно называется касательным расслоением. Часто при изучении свойств многообразия М оказывается удобным работать именно с этим расслоением. Мы подробно рассмотрим два важных частных случая расслоений: главное расслоение и расслоение, ассоциированное с главным. В случае главного расслоения слой диффеоморфен некоторой группе. Дадим точное определение главного расслоения. Пусть имеется многообразие М и группа Ли G. Главное расслоенное пространство (или главное расслоение) над М есть многообразие Р, на
44 Глава 2. Основные понятия дифференциальной геометрии котором задано действие группы G; при этом выполняются следующие условия: 1) G действует свободно на Р справа: (р,а) ? Р х G -> Фар = ра ? Р; B.54) 2) отображение B.54) задает отношение эквивалентности на Р (р ~ р' если р = 9ар' для некоторого a ? G) и М есть факторпростран- ство (см. Приложение 4) для Р по этому отношению эквивалентности: М = Р/~ или М = P/G, причем каноническая проекция тг : Р —»• М дифференцируема; 3) Р — локально тривиально. Это означает, что для каждой точки х ? М существует окрестность U, х ? U С М, такая, что n~l(U) (т.е. порция Р над U) изоморфно U x G в том смысле, что существует диффеоморфизм х '¦ t~](U) —* U x G, задаваемый формулой: Х(Р) = (к(р),<р(р)) €U X.G, р ? ir~l(U), где <р — отображение из тг~'(?7) в G, удовлетворяющее условию: (р(Фар) = <Р(р)& Для всех р ? тг~'({7), «ее Обычно используется следующая терминология: Р — простран- пространство расслоения, М — базовое пространство (база), G — структурная группа, it — проекция, я~1(х) слой над х, являющийся замкнутым подмногообразием в Р. Будем обозначать это главное расслоение так: P(M,G,ir) или P(M,G). Очевидно, dimP = dimM + dimG. Из определения следует, что тг(Фвр) = п(р) для всех а ? G. Если мы выбрали некоторую точку ро ? Р, то слой, проходящий через ро, представляет собой множество точек вида {Фар0,а ? G}. Так как структурная группа G действует на слое свободно, то слой диффеоморфен G. Локальные окрестности Up в Р, задающие карты, можно выбрать в виде Up = Um x Ug, где Um и Uq — окрестности в М и G соответственно. Часто главные расслоенные пространства описывают в терминах открытого покрытия на М и функций перехода. В силу свойства локальной тривиальности для P(M,G) можно выбрать такое открытое покрытие {Uа} на М (т.е. Ua Ua — М), что в каждой порции 1г~х(иа) задан диффеоморфизм Ха ¦ ir~4Ua) -^UaxG, Xa(p) = Or(p),?>a(p)), где р ? *~Чиа) и <ра(9др) = <ра(р)д. Если Ua П Ub Ф 0, то в ъ~\иа n Ub) заданы одновременно два отображения: Ха и Хь- Для р ? тг~\иа П Ub) имеем ЫВД(ЫВДГ' = <рь(р)д((ра(р)д)'1 = <ръ(р)(<р*(р))~]- Это означает, что величина <Ръ(р)(<Ра(р)~1) зависит только от тг(р), и, следовательно, <рьа(тг(р)) = (pbipXfaip))^ является отображением из Ua П 17ь в G. Такое отображение называется функцией перехода.
§ 6. Главные расслоения 45 Семейство функций перехода фъа расслоения P(M,G), соответствующих покрытию {Ua} на М, задает способ «склейки» различных порций ж~\иа) между собой в единое многообразие. Нетрудно показать, что <Рса(х) = <Рсь(х)<РЪа(х) ДЛЯ X ?UanUbnUc. В соответствии с результатами предыдущего параграфа действие G на Р задает гомоморфизм а алгебры Лид группы G в алгебру Ли Х(Р) векторных полей на Р. Поле А* = cr(A), A E д называется фундамен- фундаментальным векторным полем, соответствующим А. Так как отображения Фа переводят каждый слой в себя, то Ар касается слоя в точке р. По определению главного расслоения группа G действует на Р свободно, следовательно для любого А Ф О поле А* нигде не обращается в нуль. Размерность каждого слоя равна dim g. Поэтому отображение ар из д в Тр(р), &р(А) = Ар, есть изоморфизм д на касательное пространство в точке р к слою, проходящему через р. Предложение 2.6.1. Если А* = <т(А), то *U* = <7(ad(<TV), B-55) где а е G, A G д. Доказательство. Так как поле А* индуцируется однопараметрической группой преобразований Ф0(, где at — однопараметрическая подгруппа в G, отвечающая А, то в соответствии с Предложением 2.4.2, поле Ч/'аА* индуцируется Ф„ о Ф0( о Фа-| = Фа-1О(а. Выясним теперь, какому элементу из g отвечает подгруппа dt = a~]ata или соответствующая ей однопараметрическая группа преобразований в G <pt — Rat (см. B.40)). Для g 6 G имеем: ipt(9) - R-0,9 = gat = ga~lata = a~^aga~xata = S («Г1) (ада~х<ц) = о щ о Таким образом, щ — S(a"') о <pto S(a) и, согласно Предложению 2.4.2, такая однопараметрическая группа преобразований индуцирует поле ad(a"')>l (напомним, что ad = 5'). Остановимся теперь на понятии гомоморфизма расслоений. Пусть у нас имеется два главных расслоения: P(M,G) и P'(M',G'). Гомо- Гомоморфизм / расслоения P'(M',G') в P(M,G) состоит из отображения /р : Р' —> Р и группового гомоморфизма /с : G' —> G таких, что /р(Фа-р') = Ф/с(а')/р(р') Для всех р' € р' и а' € G''• Гомоморфизм / отображает слой из Р' в слой из Р и при этом индуцирует отображение точек базы М' в М fM : М' —> М, причем /м(я"'(р')) = тг(/Р(р')). Если мы отождествляем Р' с fp(P'), G' с fG(G') и М' с fM(M'),
46 Глава 2. Основные понятия дифференциальной геометрии то говорят, что P'(M',G') есть подрасслоение в P(M,G). Если кроме того М' = М и /м суть тождественное преобразование на М, то го- гомоморфизм / : Р'(М, G') —> Р(М, G) называется редукцией структурной группы G расслоения P(M,G) к подгруппе G'. При этом P'(M,G') на- называется редуцированным расслоением и говорят, что структурная группа G редуцируема к G'. § 7. Примеры главных расслоений Пример 1. Тривиальное расслоение P(M,G) = М х G. Точка расслоения р = (х,д), где х € М, д € G. Действие структурной группы: Ч?а(х,9) = (х,да); слой — группа G. Каноническая проекция есть просто проекция на первый сомножитель: тг(х,а) — рГ](ж, а) = х. Пример 2. Пусть G — группа Ли, Н — ее замкнутая подгруппа. Тогда G = P(G/H,H), где база G/H — однородное пространство (см. Приложение 9):Ф/,<7 = gh, д ? G, h € Н. Каноническая проекция ж есть сопоставление каждому элементу д его класса эквивалентности [д]: *(9) = Ы? G/H. Очевидно, что ж(9кд) = w(gh) = [gh] = [д] = ir(g). Пример 3. Расслоение Хопфа РE2, Щ1)) = 53. Так как SUB) = S3 (задача 2.2), то точки этого расслоения можно рассматривать как матрицы д G SUB). Структурная группа G = U(\) = {eiA, 0 < Л < 2тг}. Ее действие: Фд<7 = <?etArj. Каноническую проекцию SUB) —» S2 зададим следующим образом. Нетрудно показать, что для любой матрицы д € SUB) справедлива формула дт3д+ = т? где (* = 1 в силу унитарности д. Тогда ж(д) = ( — точка 52. Так как 9хдт3(9хд)+ = дтъд+, то я-(ФА0) = *(д). Пример 4. 52n+I = P(CPn,U(l)). Сферу 52n+1 можно реализовать как множество точек z = (zl,z2,...,zn+\) в CJ+1, удовлетворяющих условию \z\ |2 + I22I2 + ... + \zn+\ |2 = 1. Структурная фуппа G действует так: Фд2 = e'xz. Так как каждой точке z € С"+| ,2^0 соответствует прямая, проходящая через начало координат и точку z, т.е. элемент CF", то каноническая проекция ж сопоставляет точке z G 52n+1 эту прямую.1 Действие структурной группы просто перемещает точку вдоль этой прямой. Пример 5. При описании гравитации на языке расслоенных про- пространств важную роль играет расслоение линейных реперов. Пусть М — дифференцируемое многообразие размерности dimAf = п. В каждой точке х 6 М можно выбрать n-линейно независимых касательных векторов Х\,..., Хп, которые будут базисом касательного простран- пространства ТХ(М). Такой упорядоченный базис называют линейным репером их = {Х\х,..., Хпх} в точке х. Ясно, что имеется много способов выбора
§ 7. Примеры главных расслоений 47 репера в каждой точке многообразия М. Пусть L{M) — множество всех линейных реперов во всех точках М. Оказывается, что L(M) является главным расслоенным пространством со структурной группой GL(n, E) (группа невырожденных вещественных матриц размером п х п). Дей- Действительно, если о = (dj) € GL(n;R), их — {Х\х,... ,Хпх} ? L(M), то Ф„их есть репер {Yix,... ,Ynx} в точке х, где YjX = a}Xix. Каноническая проекция тг определяется как отображение из L(M) в М, сопоста- сопоставляющее реперу их точку х. Легко проверить, что GL(n;R) действует свободно на L(M) и ж(и) = -k{v) тогда и только тогда, когда v = Ф„«. Если (ж1,...,ж") — локальные координаты в некоторой окрестности U С М, то каждый репер кг в точке х ? U можно записать в виде и = {Х\,...,Хп} с Xi = Xi^p:, где X,* — невырожденная матрица. Переменные {х1} и {X*} (i,j,k — 1,2,...,п) можно взять в качестве локальных координат в эг~'(?/); тем самым L(M) становится диф- дифференцируемым многообразием. Итак, L(M) есть главное расслоение Р(М, GL(n, Ш)), называемое расслоением линейных реперов. Следующие примеры служат иллюстрацией тому, что могут су- существовать глобально различные главные расслоения с одинаковой локальной структурой. Пример 6. P(Sl,Z2). Слой состоит из двух точек {+1, -1} = S° = Z2 и действие структурной группы Ф„, о G Z2 совпадает с обыч- обычным умножением. Выберем на базе М = S1, параметризуемой углом в (О ^ в < 2тг), две пересекающиеся окрестности Uy и f72. Тогда локально расслоение выглядит так: тг^]) = U\ х Z2, координаты (в,ay); тг"' (U2) = U2 х Z2, координаты (в, а2), где п],а2 G G = Ъ2. Функция перехода <pi2 зависит лишь от непрерывной переменной 0 из области пересечения U\ П U2 и принимает дискретные значения из Ъ2. Ясно, что эта функция должна быть постоянной. Воз- Возможны два случая: <pi2 = 1 и <р\2 = — 1. В зависимости от выбора функции перехода, «склеивающей» карты в Р, получаются топологически неэкви- неэквивалентные главные расслоения. Первый случай: <pi2 = 1, (р\(р) = <р2(р), р G Р (здесь <ра отображение, задающее диффеоморфизм Ха '¦ ^~l(Ua) —> Ua х G, см. §6). Тогда расслоение Р тривиальное, Р = Sl x Ъ2, и пред- представляет собой две окружности, являющиеся границей обычного кольца (рис. 8а). Второй случай: ч>п = —\, <р\ — ~(р2, P(S\Z2) — нетривиаль- нетривиальное расслоение, представляющее собой кривую, дважды накрывающую базу 51 и являющуюся границей ленты Мебиуса (рис. 86). Пример 7. Расслоение магнитного монополя P(S2,U(l)). На базе М = S2 удобно ввести сферические координаты (в,ф) @ ^ в ^ тг, 0 ^
48 Глава 2. Основные понятия дифференциальной геометрии ф < 2ж). Точки слоя ?7A) = S1 будем параметризовать величинами е^. В качестве двух окрестностей на S2 выбирают верхнюю и нижнюю полусферы Н+ и Я_ (см. рис. 9). Их пересечение Я+ П Я_ представляет собой окружность 51 («экватор»), параметризуемую углом 0 ^ ф < 2тг. Тогда локально наше расслоение выглядит так: Н+ х U( 1), Я_ х Щ1), координаты @,ф,е^+), координаты {в,ф,е^~). Я+ПЯ. Рис. 9. Как уже отмечалось выше функция пере- перехода является функцией точек в Н+ П Я_ (в нашем примере зависит только от ф) и принимает значения в U(l). Легко по- понять, что отображения ipa, введенные в п.З определения главного расслоения, име- имеют следующий простой вид: <р±(р±) = е1^*, где р± = (в, ф, е1^*) — точка расслоения над Я±. Тогда функция перехода <р+^(ф) = <P+<P)vZl(p) = eil*+'*-\ р € 7Г-'(Я+П Я_). Мы выберем ее в виде <р+_(ф) = ег1ф. Так как функция перехода однозначная функция на Н+ П Я, то I должно быть целым числом. В этом примере видно, что задавая функции пе- перехода с различными I, мы получаем топологически различные главные расслоения над S2 со структурной группой U(\). При / = О расслоение тривиально: РE2,U(\),l = 0) = S2 x S1. Случай I — 1 есть расслоение Хопфа P(S2,U(\),l = 1) = 53 (см. пример 3). Число I соответствует так называемому первому классу Черна и нумерует неэквивалентные расслоения монополя. Пример 8. Инстантонное расслоение P(S4,SUB)). Эта конструк- конструкция во многом аналогична предыдущему примеру. Пусть F,ф,тр,р) — сферические координаты в базе М = S4, (a,/3,j) координаты слоя SUB) = S3. Разобьем S4 на две «полусферы» Я±, границы которых являются сферами 53. Тогда область пересечения Я+ П Я_ вбли- вблизи «экватора» S4 параметризуется углами Эйлера (в,ф,тр) сферы 53. Стандартная параметризация элементов Ь,(в,ф,-ф) € SUB) = S3 углами Эйлера следующая: в ( 0> + ф)\ h@, ф, гр) = Х4 — гтх, х\ + ixj = cos - exp I i——— 1 , в /Лф-Ф) + ix4 = sin - exp
§ 8. Ассоциированные расслоения 49 где г,- — матрицы Паули. Элементы д структурной группы G = SU{2) параметризуются углами Эйлера (а,р,у), д = g(a,^,j). Наше расслоение описывается двумя картами: H+xSUB), координаты (в,ф,ip,p;a+,p+,y+); ' #_ х SUB), координаты @,</>,^,р;а_,/3_,7-)- Функцию перехода выберем в виде (р+-(О,ф,1р) = (h@, ф,тр))к, где к должно быть целым числом. При к = 1 имеем известное расслоение Хопфа РE4, SUB); k= 1) = 57. Мы снова получили бесконечную серию топологически неэквивалентных главных расслоений, характеризуемых числом к. Оно отвечает второму классу Черна. § 8. Ассоциированные расслоения Опишем теперь другой класс расслоений, который часто встреча- встречается при описании калибровочных теорий. В расслоениях этого класса в качестве слоя будет выступать не группа, как в случае главного расслое- расслоения, а многообразие, на котором задано действие группы. В физических приложениях роль этого многообразия будет играть пространство пред- представления полей материи. Пусть P(M,G) — главное расслоенное пространство, a F — многообразие, на котором группа Ли G действует слева, т.е. задано представление р группы G на F такое, что для любого элемен- элемента а ? G определено линейное отображение р(а) : F —»¦ F, причем p(ab) = р(а)р(Ь). Построим прямое произведение Р х F, элементами которого являются пары (р,?)> р € Р, ^ G -F, и определим действие G на Р х F справа: G Э а : (р,?) G Р х F -у (Фар,р(а)~'О ? Р х F. Такое действие группы задает отношение эквивалентности. Возьмем фактор-пространство (см. Приложение 4) Р х F по этому отношению эквивалентности; его называют скрученным произведением Р и F и обычно обозначают Е = Р xGF. Элементами многообразия Е являют- являются классы эквивалентности [(р,?I = {(*oP,P(o)~'0>a e **}• Проекция же : Е —> М определяется из условия замыкания следующей треугольной диаграммы: Р х F —» Е ХОРГ,\ */*Е, м где 7г — это сопоставление элементу (р,0 ? Р х F класса [(р, ?)] ? Е, ¦к — каноническая проекция в Р, а рг, — проекция на первый сомножитель в прямом произведении: рг, : (р,0 —> р. Установим теперь локальную структуру Е. Для любой точки х ? М существует окрестность U такая, что х ? U С М и тг~'({7)
50 Глава 2. Основные понятия дифференциальной геометрии изоморфно U х G. Тогда действие группы G на ic~l(U) х F задается так: (ж,#,?) € U x G x F -> (x,ga,p(a)~lO e U x G x F, где eGG. Факторизация относительно такого группового действия дает: (ж,р,?) —»• [(ж,#,?)] = (ж,?;) € U х F. Так как яя(ж,?) = ж, то мы получаем, что ir^.l(U) = U х F,T.e. E локально устроено как U x F. Описанное выше многообразие Е обозначают E(M,F,G,P) и называют расслоением над базой М со стандартным, или типичес- типическим слоем F и (структурной) группой G, ассоциированным с главным расслоением Р. Каждому элементу р G Р можно сопоставить отображение из F в Е, которое мы будем обозначать той же буквой р. Оно задается следующим образом: пусть ? G F, тогда р(?) есть элемент Е, совпада- совпадающий с классом [(р,О]- Другими словами, р(?) — это образ элемента (р,?) G Р х F при действии естественной проекции тг : Р х F —* Е. Нетрудно понять, что на самом деле р есть отображение из F на Fx = 7Гя'(ж) С Е, где х = ir(p) и (Фар)(?) = р (р(а)?), а €<?,?€ F. Пример 1. В качестве примера ассоциированного расслоения рассмотрим касательное расслоение. Пусть L(M) — расслоение линейных реперов над М (см. пример 5 из §7), dimM = п, а V = Ж" есть га- мерное векторное пространство с фиксированным базисом {?i,?2,- • ,?п}- Элементы группы а = (a'j) 6 GL(n; R) действуют на V по следующему закону: а : ?,-> р(а)?; = ]>>$&• B.56) i=i Расслоение, ассоциированное с L(M), со стандартным слоем V назы- называется касательным расслоением над М и обозначается Т(М). Как мы только что объяснили, репер и G L(M) в точке х можно рассматривать как отображение из V на Fx = ir^M)(x) С Т(М). Это отображение может быть задано следующим образом: и?,- = X,(i = 1,2,...,га), где и = (Xi,X2,... ,Х„). Нетрудно показать, что и есть линейный изомор- изоморфизм V на ТХ(М) и, следовательно, слой в Т(М) над ж € М может рассматриваться как ТХ(М). Пример 2. Кроме касательного расслоения, с расслоением ли- линейных реперов ассоциирован целый ряд тензорных расслоений, которые мы сейчас опишем. Рассмотрим тензорную алгебру линейного про- 00 странства У = Ж": T(V) = ? TTS, где То° = Ж, Гог = Г®...® V, r,s=O V "*¦ г Tf = у * ® ... ® У* , и Г/ = Тог ®Т°. Элементы пространства TJ называ- ются тензорами контравариантной степени г и ковариантной степени s.
§ 8. Ассоциированные расслоения 51 В этой алгебре стандартно определяются операции тензорного произве- произведения и свертывания тензоров. Хорошо известно также (см. [КН]), что действие GL(n,W) на V = Е" канонически продолжается на всю алгебру T(V). Поэтому с расслоением линейных реперов можно ассоциировать любое тензорное расслоение типа (r,s), TJ(M) = L(M)xGi(nR)rj, типи- типическим слоем которого является пространство г раз контравариантных и s раз ковариантных тензоров. В случае г = \, s = О получается ка- касательное расслоение. Расслоение, отвечающее г = О, s = 1 называется кокасательным расслоением и обозначается Т*(М). Оно играет важную роль в классической механике. Так же как и в предыдущем примере, для всех тензорных расслоений можно построить явный вид отображения и: г; -»т;ш), и е им). Пример 3. Следующий пример ассоциированного расслоения будет играть важную роль при размерной редукции симметричных калибро- калибровочных полей. Одновременно он позволяет понять свойства главного расслоенного пространства, обладающего некоторой дополнительной симметрией. Пусть Р(М,К) — главное расслоенное пространство над М со структурной группой К и канонической проекцией тг. Далее, пусть на Р задано действие некоторой группы G (группы симметрии), которая является компактной группой Ли. Это означает, что для каждого д ? G существует преобразование Qg, являющееся элементом группы автомор- автоморфизмов (см. Приложение 7) Р, Qg ? Aut(P), т.е. Qg : р ? Р —> Qgp ? Р и Qg коммутирует с правыми сдвигами, порождаемыми действием структурной группы К: QgWkP) = $k(Qgp), k(EK,geG,peP. B.57) Мы будем считать, что Qg — левое действие: Qgi92 = Qgi °Qg2- Так как в общем случае отображения Qg выводят точку из слоя, то такое действие группы симметрии очевидно порождает преобразование Од точек базы в соответствии с диаграммой: р % р *1 1* B-58) М -^ М и it(Qgp) — Од(тс(р)). Предположим для простоты, что i) М = М х G/H, где Н — подгруппа в G, т.е. любая точка х ? М представима в виде х = (ж,?), х ? М, ? ? G/H; И) группа G действует только на однородном пространстве G/H, причем каноническим образом (см. Приложения 8 и 9).
52 Глава 2. Основные понятия дифференциальной геометрии Возьмем теперь подмногообразие В = М х {?0} С М, где ?0 = [е] есть класс эквивалентности, содержащий единицу фуппы G, обычно называемый началом пространства G/H. Порцию расслоения Р над В обозначим через Р: \ B.59) Очевидно, что она является главным расслоенным пространством Р(В,К) с канонической проекцией тг, равной офаничению ж на Р. Действие фуппы симметрии G, вообще говоря, выводит точку из расслоения Р. Но, если мы берем элемент h € Н С G, то QhP 6 Р при р G Р, так как Tt(Qhp) = Ohit(p) = Oh (ж, [e]) = (x,h[e]) = (ж, [е]), где х — ж(р). Более того, Qh смещает точку р вдоль слоя (говорят, что Н действует на Р как подфуппа фуппы вертикальных автоморфизмов). Возьмем прямое произведение G х Р, на котором фуппа Н действует следующим образом: ) g?G, hEH, peP, и построим каноническим образом скрученное произведение G хн Р, т.е. расслоение с типическим слоем Р, ассоциированное с главным расслоением G(G/H,H) (см. пример 2, §7). Покажем, что GxHP диффеоморфно исходному главному расслоению Р(М,К), причем диф- диффеоморфизм x'-G^hP-^P задается формулой: B.60) Это определение не зависит от выбора представителя класса, так как X\[(9h~\Ohp)]) = Ogh-tOhp = Одр = ху[(9,Р)])- Легко проверить, что х переводит действие структурной фуппы К на Р в действие этой фуппы на Р, т.е. х([07> **?)]) = *fc ([#,?])• Наконец, убедимся, что каждая точка из Р имеет ровно один прообраз в G хя Р. Пусть р ? Р и п(р) = (ж,?). Так как фуппа G на однородном пространстве G/ff действует транзитивно, то существует элемент д G G такой, что ? = 91е]- Очевидно, что таким же свойством обладают все элементы вида gh, h € Н. Возьмем теперь любую точку из слоя над (ж, [е]), принадлежащую фактически Р С Р; обозначим эту точку р'. Так как ПЯдР) = Ogit(p') = Од (ж,[е]) = (х,д[е\) = (ж,О = ОД, то Qgp' лежит в том же слое, что и р. В силу п. 2 определения главного расслоенного пространства структурная фуппа действует транзитивно и свободно и, следовательно, существует единственный элемент k G К такой, что р — VkQgP''¦ Итак, р = Qgp, где р = Фьр'. Если вместо
§ 9. Сечения расслоений и их свойства 53 элемента д, переводящего [е] в ?, взять gh~](h G Н), то вместо р следует взять Qhp е Р, так как Qgh-\QhP — QgP = Р- Итак, пары (д,р), для которых Qgp = р, имеют вид (gh~],QhP), h G H, т.е. образуют один класс [(д,р)] в G хн Р. § 9. Сечения расслоений и их свойства Пусть P(M,G) — главное расслоение, a U — окрестность в М. Тогда локальным сечением Р над U называется отображение s : U —> Р такое, что тг о s — тождественное преобразование в U. Предложение 2.9.1. Глобальное сечение в главном расслоении P(M,G) существует тогда и только тогда, когда Р — тривиально. Доказательство. Пусть в Р существует сечение s : М —» Р. Определим отображение ip : М х G —> Р так: <р(х, а) = Ф„в(ж), x?M,aeG. Можно проверить, что (р — диффеоморфизм, т. е. Р ~ М х G. Обратно, пусть Р ~ М х G, т.е. существует диффеоморфизм X : Р —¦ М х G. Тогда определим отображение s : М —> Р следующим образом: для ж € М s(x) = x~'(s,e), где е — единица группы G. Легко проверить, что тгE(ж)) = тг (х~'(ж, e)J = х, т.е. s — глобальное сечение. Аналогично определяются локальные и глобальные сечения ассо- ассоциированного расслоения E(M,F,G,P). Но в отличие от предыдущего случая глобальное сечение ассоциированного расслоения может суще- существовать и для нетривиального Е (задача 2.25). В дальнейшем для краткости глобальное сечение будем называть просто сечением. Здесь следует отметить, что векторные поля и формы на мно- многообразии М можно рассматривать как сечения касательного Т(М) и кокасательного Т*(М) расслоений. Аналогично, произвольное тензор- тензорное поле на М определяется как сечение соответствующего тензорного 00 расслоения ТЦМ). Легко видеть, что множество Т(М) = 5Z ^(М) r,s=O тензорных полей на М образует алгебру, в которой естественно задаются операции тензорного произведения и свертывания тензоров.
54 Глава 2. Основные понятия дифференциальной геометрии Пусть E(M,F,G,P) — расслоение, ассоциированное с главным расслоением P{M,G), и задано отображение т) : Р —> F, обладающее свойством l)QV, B-61) где р — представление группы G на F. Такие отображения называют эквивариантпными. Докажем теперь два предложения, которые понадобят- понадобятся нам в главах 4 и 6. Предложение 2.9.2. а) Пусть задано эквивариантное отображение rj : Р -+ F. Тогда s (тг(р)) = (р, г)(р)) есть сечение в Е. б) Если s(x) — сечение в Е, то rj{p) = р~х о s (ir(p)) есть эквивариантное отображение из Р в F. Доказательство, а) Здесь нужно проверить лишь корректность определе- определения сечения. Пусть р' = Ф5р. Тогда 8 GГ(р')) = 8 GГ(Ф9р)) = [(9дрМ*ВР))] = б) В условии этого пункта р понимается как отображение обрат- обратное к отображению р : F —* Fx С Е, х — чг(р) (см. §8). Следовательно, p~l : Е —> F (образ — такой элемент ? ? F для которого р(?) = [(р,?)]) и р~х oso-x : Р —> F. Проверим эквивариантность отображения г/. Пусть — { и Р (v(p)) = [(Р> О] по определению отображения. Тогда, если р' = Ъдр, V(P') = ?, то где мы воспользовались определением эквивалентных элементов, отно- относящихся к классу [(р',?')]. С другой стороны А?) = Р (V(P')) = s (*(9tp)) = s (тг(р)) . Следовательно, ^ = р(д)?' или )? = P(g-l)v(p)- a Предложение 2.9.3. Пусть Н — замкнутая подгруппа в G. Главное расслоение P(M,G) редуцируется к Q(M,H) тогда и только тогда, когда Е(М, G/H, G, Р) имеет сечение. Доказательство. Достаточность. Пусть s : М —> Е — глобальное сечение в Е — PxGG/H, где G действует на типическом слое G/H каноническим
§ 10. Связности в главных расслоениях 55 образом (см. Приложение 8):р(д)? = д?, ? G G/H, и ?0 = [е] = Я — начало в G/H. Обозначим через Q подмножество в Р: Проверим, что Q есть главное расслоение над М со структурной группой Я. Действительно, Ф*Л 6)] = т.е. Флр для любого h ? Н также принадлежит Q. Пусть теперь р ? Q, р' G Q и тг(р) = тг(р') = ж. Покажем, что точки р и р' отличаются правым сдвигом на элемент из Я. Так как р(?о) = р'(?о) = s(x), р = Удр' для некоторого д G G, то [(?,&)] = [(?',&)] и [(Ф5р',6)] = [(р'>5^о)] = [(р'>|о)]- Значит, элемент д принадлежит стационарной подгруппе (см. Приложение 9) точки ?о, т.е. Н. Необходимость. Пусть группа G редуцируется к Н С G, Q(M,H) С P(M,G). Положим, как и выше ?0 = [е] = Я G G/H и определим отображение из Р в E(M,G/H,G,P): Покажем, что это отображение постоянно на слое в Q. для любого h 6 Я. Обозначим через г вложение Q в Р, i : Q —> Р и построим отображение ^0 °¦ * : Q —> Е. Из вышесказанного следует, что оно постоянно на слое в Q, т. е. является отображением из М в Е или сечением в Е: () F о«)(«), qeQ.a § 10. Связности в главных расслоениях Пусть задано главное расслоенное пространство Р(М, G) и р G Р. Рассмотрим касательное пространство ТРР к Р в этой точке. Оно содержит подпространство Vp, состоящее из векторов касательных к слою. Мы будем называть его вертикальным подпространством. В качестве базиса в Vp можно выбрать систему фундаментальных векторных полей А*а = о-(Аа), где {Аа} — базис в g (см. §6). Локально главное расслоение Р устроено как U x G, где U — окрестность в М. Поэтому и касательный вектор в точке р € Р можно разложить на вектор «вдоль слоя» и вектор «вдоль базы». Вертикаль- Вертикальное направление («вдоль слоя») однозначно фиксировано действием структурной группы. Второе направление («вдоль базы») можно выбрать
56 Глава 2. Основные понятия дифференциальной геометрии многими способами. Связностью Г в Р называется соответствие (прави- (правило), сопоставляющее каждой точке р € Р некоторое подпространство Нр из ТрР такое, что а) ТРР = VP® Нр (прямая сумма); б) пространство Щ в точке р' = Фдр есть Ф'дНр для любых g G G ир€Р; в) Нр зависит от р дифференцируемым образом. Подпространство Нр называется горизонтальным подпростран- подпространством. Согласно (а), если задана связность Г, то любой вектор X G ТрР может быть единственным образом представлен в виде: X = Y + Z, YeVp z енр. B.62) V. Г Г" Компоненту Y называют вертикальной и обозначают vX, a Z — горизонтальной и Z = hX. Условие (в) означает, что если X — дифференцируемое векторное поле, то vX и hX также являются диффе- дифференцируемыми векторными полями. Рис. 10 иллюстрирует зависимость разложения B.62) от выбора связности (горизонтального подпростран- подпространства). Оказывается, что связность Г в Р удобно описывать с помощью 1-формы и на Р со значениями в ал- алгебре Ли группы G. Эта форма назы- (vX)" вается формой связности данной связ- (vX)' ности Г и определяется следующим образом. Отображение <гр : д —> ТР(Р), сопоставляющее каждому А G g фун- фундаментальное векторное поле в точ- точке р, А*р = (Тр(А), есть линейный изо- Рис. 10. морфизм 0 на касательное подпространство в точке р к слою (см. §6), т.е. на вертикальное подпространство Vp. Тогда для любого X G ТрР мы определим ш(Х) как такой элемент А € д, что Ар = av(A) = (vX)p. Очевидно, что ш(Х) = 0 в том и только в том случае, если X — горизонтальное поле. Предложение 2.10.1. Форма связности ш удовлетворяет следующим усло- условиям: 1) ш(А*) = А для любого А ? д; 2) (Ф*и;)(Х) = ad(<T')u;(X) для каждого д € G и каждого X ? Х(Р). В правой части равенства понимается действие присо- присоединенного представления G на элемент ш(Х) из д. Доказательство. Условие 1) следует из определения. Условие 2) в силу B.62) достаточно проверить отдельно для горизонтального и вертикаль- вертикального полей.
§ 10. Связности в главных расслоениях 57 0 X — горизонтально. По определению ш(Х) = 0. Но в силу условия (б) для связности поле Ф^Х также горизонтально для любого д е G и, следовательно, (Ф*о;)(Х) - ш(%Х) = 0. и) X — вертикально и мы можем считать, что X = А* — фундаментальное векторное поле, А* = <т(А), А <Е д. Тогда (У*ди))(А*) = ш(Ф'дА*) = асКз^'М = ad(g~l)w(A*), где мы воспользовались Предложе- Предложением 2.6.1. ? Предложение 2.10.2. Пусть задана I-форма ш на P(M,G) со значениями в д, удовлетворяющая условиям 1) и 2) предыдущего предложения. Тогда существует единственная связность Г в Р, для которой и) является формой связности. Доказательство. Определим горизонтальное подпространство в точке р G Р следующим образом: Нр = {X G ТРР : ш(Х) = 0}. Проверка условий а) — в) и того, что ш есть форма связности этой связности выполняется просто. ? Каноническая проекция тг : Р —> М индуцирует соответствующее линейное отображение тг' : ТрР —> ТХМ, х = ж{р) для каждого р € Р. Если задана связность, то тг', ограниченное на горизонтальное подпро- подпространство Нр, является изоморфизмом. Горизонтальным лифтом (или подъемом) векторного поля X на М называется единственное горизон- горизонтальное (при заданной связности) векторное поле X* на Р, которое проектируется на X, ж'(Хр) — XT(J)) для каждого р G Р (в этом случае говорят, что X* накрывает X). Предложение 2.10.3. Пусть в расслоении P(M,G) задана связность Г. Тогда а) Для любого векторного поля X на М существует единственный горизонтальный лифт X*. Лифт X* инвариантен при действии Ф^ для любого д € G. б) Любое горизонтальное векторное поле X* на Р, инвариантное относительно G, является лифтом некоторого поля X на М. Доказательство, а) Отображение тг' есть линейный изоморфизм из Нр на ТЖ(р)М (р € Р). Отсюда следуют существование и единственность лифта X*. Нетрудно показать, что X* — дифференцируемое векторное поле. Из условия б) на связность Г в Р (условие инвариантности горизонтальных подпространств относительно G) следует, что лифт X* инвариантен при действии Ф^ для любого д G G. б) Для любой точки г?М выберем некоторую точку р в слое тг~'(ж) и положим по определению Хх — тг'(Хр). Это определение кор- корректно, так как, если выбрать другую точку р' — Фдр в том же слое, то в
58 Глава 2. Основные понятия дифференциальной геометрии силу инвариантности X* тг'(Х^) = ж(Ф'дХр) = ж'(Хр). Следовательно, X* есть лифт векторного поля X. D Заметим, что если, например, X* и Y* — горизонтальные лифты, то поле fX*+gY*, где f(p) и д(р) суть функции на Р, хотя и горизонтально в каждой точке р, но не является в общем случае инвариантным относительно Ф^ и, согласно предыдущему Предложению, не является горизонтальным лифтом. Перечислим некоторые свойства горизонтальных и вертикальных векторных полей. Лифты полей X ,Y € 3?(М), будем обозначать X*, Y*, а фундаментальные векторные поля, отвечающие А, В G g, — А*, В*. 1. X* + Y* — горизонтальный лифт для X + Y. 2. f*X* есть горизонтальный лифт для /X, где f(x) — функция на М, а /* функция на Р, определяемая так: /* = / о ж. 3. [X*,Y*] вообще говоря не есть горизонтальное векторное поле, но h[X*,Y*] есть горизонтальный лифт для [X, Y]: ¦к1 (h[X*,Y*]) = тг' ([Х*,П) = [ж'Х>'У] = [X,Y]. 4. Если А* = а А — фундаментальное векторное поле, a Z — горизонтальное, то [Z, А] горизонтально. Действительно, А* инду- индуцируется однопараметрической подгруппой преобразований 9Щ и по формуле B.37) [Z,A*] = lim U^Z-Z). B.63) Но поле ty'ofZ — горизонтальное и, следовательно, [Z,A*] — горизонтально (но, вообще говоря, не равно нулю, так как Z может быть неинвариантным горизонтальным полем). 5. Поле [А*, В*] есть фундаментальное векторное поле, так как а — гомоморфизм: [А\В*] = [аА,<тВ] = а ([А,В]) = ([А,В])*. Остановимся теперь на вопросе о редукции связности в случае, ко- когда главное расслоение P(M,G) редуцируется к подрасслоению Q(M,H), Н CG (см. § 6). Касательное пространство к Р в точке q ? Q С Р может быть представлено в виде прямой суммы TqP = TqQ Ф Rq, где Rg есть подпространство вертикального подпространства Vq С TqP. Пусть ш — форма связности на Р. Обозначим ш = lj\q сужение ш на Q, т.е. форму ш, взятую в точках q G Q и на векторах из TqQ. Будем говорить, что связность в Р редуцируема к связности в Q, если форма w — w\q является [)-значной, где i) — алгебра Ли группы Я.
§ 10. Связности в главных расслоениях 59 В качестве иллюстрации обсудим задание связности в тг \и) С Р, где U — окрестность в М. Пусть {х1} ({i = 1,2,...,тп}) — локальная координатная система, а I & = -^ \ — базис векторных полей в U. Он является координатным (голономным), так как [&,?;] = 0. B.64). В качестве базиса векторных полей в G возьмем п (п = dim G) левоинва- риантных векторных полей Аа G 0. Базис {Аа} является некоординатным (неголономным): [Аа,Ар] = С1рА1, («,/3,7=1,2,...,»), B.65) где Сд^ — структурные константы группы G. V Так как подрасслоение тг (U) тривиально, т. е. существует три- В,- _ . виализация х '¦ *~X(U) -* U x G, ""v Fi 5 то в качестве базиса векторных (х,а)=р полей в ж (U) можно выбрать горизонтальное Оа,?Ь где А*а = <тАа — фунда- подпространство Нр ментальные векторные поля, ка- . ». ?. сательные к слою, a (?i)s.(x) = ^ и s'a(?i)x — базис пространства, ка- рис jj сательного к сечению sa : U —> ж~\и), определяемому условием X(sa(x)) = (ж,a) G UxG, а — фиксированный элемент из G (см. рис. 11). Связность Г, заданная во всем расслоении Р, индуцирует связ- связность IV на Tr~l(U). Обозначим через ?* горизонтальный лифт поля &. Изучим коммутаторы полей А*а, & и ?j. а) [А*а,А*р\ = C^pAj в соответствии со свойством 5 (см. выше) и формулой B.65). б) [i4a,^i] = 0 в силу формулы B.37), так как по определению поле ?,- не меняется при движении вдоль слоя. в) [|i,|j] = 0, потому что пространство, касательное к сечению в точке р = х (?><*)> изоморфно пространству, касательному к М в точке х, причем ?,- отвечают ?,-, а [&,?/] = 0 (см. B.64)). Рассмотрим теперь коммутаторы полей А*а и ?,*. г) [.Aa,?j] = 0 в силу формулы B.63) и инвариантности лифта ?* относительно преобразований Ф„, а ? G. д) K,*,fj] имеет лишь вертикальную компоненту. Это следует из того, что согласно свойству C) M?*,?jJ есть горизонтальный лифт для [&,?»• 1 = 0. Обозначим
60 Глава 2. Основные понятия дифференциальной геометрии где F"j — функция на ir~l(U). Можно показать, что А*а (*g) = -C%Flr B.67) _ Разложим теперь горизонтальное векторное поле ?* по базису {А*а,&}. Так как тг'(?) = & и тг'(&) = 6, то в = Ь-В?А*а, B.68) где В," — некоторые коэффициенты. По определению формы связности о>(?*) = 0. Отсюда получаем В? = оЛЙ), B.69) где мы представили ш = шаАа. Таким образом, выбор горизонтального подпространства означает выбор функции Bf (p) — В"(х, а) и &=?-ша(ЫА*а- B.70) Например, если В" = 0, то горизонтальным является направление, задаваемое сечением sa. Можно показать, что А*а(В?) = -С^В?, B.71) дхг dxj и! г ] § 11. Форма кривизны Пусть задано главное расслоенное пространство P(M,G). Изучим сначала класс форм на Р со значениями в некотором конечномерном векторном пространстве F. Будем считать, что задано также представле- представление р структурной группы G на F, т.е. для каждого g € G определено линейное отображение p(g): F —> F такое, что р(д\д2) = р(д\) ° p(gi)- F-значная г-форма <р на Р называется псевдотензориапьной формой степени г на Р типа {p,F), если она обладает свойством %<Р = P(9~l)<P, 9ZG. B.73) Форма (р на Р называется тензориальной, если она псевдотензориальна и горизонтальна, т.е. <р(Х\,...,ХТ) = 0, если хотя бы один из касательных векторов Xi вертикален. Примеры. 1) Форма связности ш есть псевдотензориальная форма типа (ad, g).
§11. Форма кривизны 61 2) Пусть (рм есть некоторая F-значная г-форма на базе, а р = id — тривиальное представление (р(д) — тождественное преобразование в F для любого д G G). Тогда <р = ж*(рм есть тензориальная форма типа (id, F). Действительно, так как то ip — горизонтальна. Далее, (ф>)(хь ..., хт) = иф;хь ..., ф;хг) = ; ; = (pMiir'X),...,тг'Хг) = <p(Xi,...,Хг), т.е. ср — псевдотензориальна. Введем два новых определения: \\)D<p - (d(p)h. Операция D называется внешним ковариантным дифференцирова- дифференцированием, a Dip — внешней ковариантной производной формы (р. Выясним связь между тензориальными и псевдотензориальными формами на Р. Предложение 2.11.1. Пусть <р — псевдотензориальная г-форма на Р типа (p,F). Тогда а) dip — псевдотензориальная (г + 1)-форма типа (p,F), б) <ph — тензориальная г-форма типа (p,F), в) Dip — тензориальная (г + 1)-форма типа (p,F). Доказательство, а) Это свойство просто следует из равенства Ф^°^ (см. B.34)). б) Так как Ф^ой = /юф^ (в силу инвариантности горизонтальных подпространств), то <ph есть псевдотензориальная форма u.. .,hXr) = p{g-x)(iph){Xu... ,Xr). Горизонтальность iph очевидна. в) Это свойство следует из а) и б). ? Важную роль как в теории расслоенных пространств, так и при геометрическом описании калибровочных полей играет форма кривизны ft = Du) формы связности и). Согласно Предложению 2.11.1 она явля- является тензориальной g-значной 2-формой (ad,g). Важная формула для формы кривизны (формула ковариантного дифференцирования формы связности) дается следующим предложением.
62 Глава 2. Основные понятия дифференциальной геометрии Предложение 2.11.2. Форма кривизны ?1 формы связности ш удовлетво- удовлетворяет структурному уравнению U(X,Y) = du(X,Y) + )-MX)MY)], X,Y?TPP, р G Р. B.74) Доказательство. Так как любой касательный вектор на Р можно разло- разложить на вертикальный и горизонтальный, а все члены в B.74) билинейны и антисимметричны по X и Y, то достаточно рассмотреть следующие три случая. i) Х,Г — горизонтальны. Тогда ш(Х) = w(Y) = 0 и B.74) совпадает с определением П = Dm. п) X, Y — вертикальны и X = А* — <т(А), Y = В* = <г(.В). По определению левая часть равенства п(А*,В*) = 0. В силу формулы B.21) для дифференцирования 1-форм, имеем B) А («(В)) * («W)) Но ш(А*) = Л, ш(В*) = J5 и не зависят от точки в Р. Поэтому *,В*) = -^ ([А*,В*]) = -Х-ш {[А,В]*) = и правая часть равенства B.74) также обращается в нуль. iii) X — горизонтальный, a Y = А* = <т(А). Тогда fi(X,j4) = 0 и о;(Х) = 0. По формуле дифференцирования: 2dcu(X, А*) = X (а»(Л*)) - А* (ш(Х)) - ш ([X, А*]) = -и ([X, А*]) . В силу свойства 4 (см. § 10) коммутатор [X, А*] горизонтален и, следо- следовательно, du>(X,A*) = 0. D Предложение 2.11.3. Если X и Y — горизонтальные векторные поля на Р, то () B.75) Доказательство простое: fl(X,Y) = dv(X,Y) = -1-ш ([X,Y]) . a Приведем теперь формулы для дифференцирования других форм на Р.
§11. Форма кривизны 63 Предложение 2.11.4. Пусть <р — псевдотензориальная 0-форма типа (p,F) на Р. Тогда D<p(X) = d<p(X) + р ЫХ)) <р, X € Х(Р), B.76) где р' — дифференциал отображения р, a w — форма связности. Доказательство. По определению, Dtp(X) = d(p(hX) = d<p(X) - dip(vX). Пусть vX — A* — фундаментальное векторное поле, индуцированное однопараметрической группой преобразований Ф^. Тогда dp(vX) = d<p(A*) = А*(<р) = Jt<P°*«< Lo= Jt Kv>\t=o= Jt P(<h Здесь мы воспользовались псевдотензориальностью <р: р(д~1)<р. Так как касательный вектор к кривой at в точке aQ = e есть А € д, прообраз А* при гомоморфизме <т, то ^вГ'|<=о= ~-^- Итак, y{vX) = -р'{А)<р = -р' (w(X)) <p, откуда и следует формула B.76). D Можно показать, что если <р — тензориальная 1-форма типа (ad,g), то , Y) = Лр(Х, Y) + 1 [<р(Х), ш(У)] + X, Y G Tp(P), p G Р. B.77) (См. [КН], гл. 2, §5, Предложение 5.5). Предложение 2.11.5 (тождество Бьянки). ЯП = 0. B.78) Для доказательства применим операцию внешнего дифференци- дифференцирования d к структурному уравнению B.74). Используя формулы B.19) и B.45), получим: dU= -[du>,u]--[w,du)] = [da>,u;]. B.79) По определению внешней ковариантной производной имеем DU = (dtt)h = [Du, u)h] = 0, B.80) поскольку для формы связности wh = 0. ?
64 Глава 2. Основные понятия дифференциальной геометрии § 12. Некоторые примеры В качестве первого примера связности рассмотрим так называемую каноническую плоскую связность. Пусть Р = М х G — тривиальное главное расслоение. Множество М х {а} для каждого а € G является подмногообразием в Р причем М х {е}, где е — единица группы, является подрасслоением в Р. Каноническая плоская связность задается тем, что в качестве горизонтального подпространства в каждой точке р = (х,а) 6 Р выбирается пространство, касательное к Мх{а} в точке (х,а). Пусть в — каноническая левоинвариантная 1-форма на G (см. §5), а рг2 : М х G —> G естественная проекция на второй сомножитель. Можно проверить, что о/ = (рг2)*0 B.81) есть форма связности канонической плоской связности (задача 2.20). Вычислим кривизну этой связности. Для этого найдем внешний дифференциал от а;: =(рт2)* (-1[0,0?) [(рт2H,(рт2)в] где мы воспользовались уравнением Маурера—Картана для каноничес- канонической формы в. Тогда, в силу структурного уравнения B.74) получаем, что О = Вш = 0. Пусть теперь P(M,G) — произвольное главное расслоение, в котором задана связность Г. Пусть для любой точки х G М существует окрестность U такая, что связность на тг~'(?/), индуцированная связно- связностью Г, изоморфна канонической плоской связности в U x G. Другими словами, существует изоморфизм % '¦ v~l(U) —+ U x G, х(р) = (ж>а) (р G n~l(U), х = ж(р) G U,а ? G) такой, что горизонтальное подпро- подпространство в каждой точке р G тг~'([/") отображается на горизонтальное подпространство канонической плоской связности в точке х(р) ?U xG. Тогда связность ГвР называется плоской. Приведем без доказательства два утверждения о свойствах плоской связности (доказательства приведены в [КН]: 1) Связность в P(M,G) плоская тогда и только тогда, когда п = 0. 2) Пусть Г — связность в P(M,G) и ее форма кривизны равна нулю. Если М паракомпактно (см. [РФ]) и односвязно (см., например, [РФ], [Ко]), то Р изоморфно тривиальному расслоению М х G и Г изоморфна канонической плоской связности в М х G. Второй пример. Рассмотрим расслоение Хопфа Р E2,17A)) = S3 (см. §7). Элементы структурной группы G = 17A) представим в виде а(а) = е1а, а — групповой параметр @ < а < 2тг). Пусть действие структурной группы задается формулой
§ 12. Некоторые примеры 65 где giXiVii*) ? SUB) — элемент расслоения Р, реализованный как матрица из SUB) ~ S3; явный вид этой матрицы приведен в §5 (формула B.49)). Легко проверить, что 1>а(а)9(Х, <Р, i>) = 9(Х, <Р,1> + 2а). Выясним теперь, как выглядят фундаментальные векторные поля на расслоении Хопфа. Пусть X поле на G, отвечающее однопараметри- ческой подгруппе at = ext, a /(a) G 5(G) (oGG) — функция на группе, которая при 0 ^ а < 2тг является фактически функцией параметра а f (а(а)) — /(а). Тогда легко показать, что Х„(ао) = ¦?- .В частности, Хе = -^ е 6 Te(G) ~ д. Соответствующий элемент алгебры Ли q есть А = 1, а каноническая левоинвариантная форма в = da. Для того, чтобы понять, какое фундаментальное поле А* = <т(А) отвечает А = 1, введем функцию G (g(x,<p,ip)) = G(x,<p,i(>) на расслоении и вычислим A*G. По определению A*G d JtG^ a,g(x,<p,' dt Ф)) t=0 Hg(x,<p,i > + 20) t=Q то есть <т(А) - A* - 2~. В координатах {%, <р,ф} (углы Эйлера, см. §5) 1-форму связно- связности можно записать в виде w — a dip + bdip + cdx- Форма связности должна удовлетворять условию ш{А*) = А. Отсюда следует, что о, — \- Коэффициенты бис можно определить лишь после задания связности, т. е. выбора горизонтального подпространства в ТР{Р) в каждой точке р. Рассмотрим два случая: i) Зададим связность, выбрав в качестве горизонтальных подпро- подпространств пространства, натянутые на векторы j- и j- -cos%^. Так как форма связности на этих векторах обращается в нуль, то находим ш = - {dip + cos xd<p) ¦ ii) Пусть горизонтальное подпространство порождается векторами d d д д -г и ^-^. Тогда ш — -(dip + dx + cos xd<p). Вычислим теперь для этих двух случаев форму кривизны. Так как структурная группа — абелева, то согласно структурному уравнению 3 Зак. 311
66 Глава 2. Основные понятия дифференциальной геометрии B.74) п — dw. Получаем О Q= -s и) п = - sin х d<p Л dx- § 13. Параллельный перенос и ковариантное дифференцирование Имея заданную связность в расслоении Р можно определить понятие параллельного переноса слоев в этом расслоении и в любом ассоциированном с ним. Если ассоциированное расслоение является векторным, т. е. его типический слой является векторным пространством, то параллельный перенос слоев в нем естественно приводит к понятию ковариантного дифференцирования сечений, которое играет важную роль в теории линейных связностей. Мы начнем обсуждение этих вопросов с понятия параллельного переноса в главном расслоении. Итак, имея связность Г в главном расслоенном пространстве P(M,G), определим параллельный перенос слоев вдоль любой кривой т в базе М. Для этого введем сначала понятие горизонтальной кривой в Р. А именно, кривую pt в Р будем называть горизонтальной, если все касательные векторы к ней, pt, горизонтальны относительно связности Г. Далее, пусть т = xt, О ^ t ^ 1, есть дифференцируемая кри- кривая в М. Горизонтальным лифтом или подъемом кривой г называется горизонтальная кривая г* = pt, О ^ t ^ 1, в Р, такая что ir(pt) — xt, * € [0,1]- Предложение 2.13.1. Для любой дифференцируемой кривой т = xt, (?[0,1],вМи для любой точки ро € Р с тг(р0) = #о существует единственный лифт г* = pt кривой г, начинающийся в р0. Доказательство. Вследствие локальной тривиальности расслоения P(M,G) в нем существует дифференцируемая кривая vt такая, что vo — Ро и 7r(vt) = xt, t G [0,1]. Поскольку лифт pt, если он существует, обладает свойством ir(pt) = ir(vt), то ясно, что в каждой точке t pt отличается от vt на преобразование из структурной группы *„,, где at — кривая в структурной группе с а® = е, т.е. Pt = Фо,^. B.82) Дифференцируя это равенство, получим й = *аЛ + <МйГЧ), B.83)
§ 13. Параллельный перенос и ковариантыое дифференцирование 67 где ар обозначает изоморфизм <тр : д —* Vp (Vp — вертикальное под- подпространство в ТрР), порожденный действием структурной группы и введенный в Предложении 2.5.1. Горизонтальность p't означает, что u>(p't) — 0. Подставляя сюда B.83), получим W = -At, B.84) где At = u)(vt) — кривая в алгебре Ли g группы G. Существование решения уравнения B.84) проще всего показать в матричной реализации группы G. В этом случае единственное решение B.84) есть просто = Гехр - где использована обычная Т-экспонента. В соответствии с B.82) су- существование единственной кривой о< эквивалентно существованию и единственности лифта т* =pt. ? Теперь мы можем определить параллельный перенос слоев следу- следующим образом. Пусть т = xt, 0 < t ^ 1 есть дифференцируемая кривая в М. Для любой точки v G тг~'(жо) существует лифт т* = pt, начинаю- начинающийся в этой точке. Поставим в соответствие точке v G ic~l(xo) точку v' = p\ ? 7T~1(a;i)- Обозначая это соответствие той же буквой г, запишем v' — t(v). Поскольку эту процедуру можно провести для любой точки из 7г~'(:ео), мы получаем отображение т : тг~'(жо) —> ir~](x\), которое называется параллельным переносом вдоль кривой г. Параллельный перенос вдоль любой кривой г является изомор- изоморфизмом. Это следует из единственности лифта кривой и из того, что параллельный перенос перестановочен с действием структурной группы, т. е. тофа = Ф„от. Последнее объясняется тем, что действие структурной группы переводит горизонтальную кривую в горизонтальную. Связность Г в расслоении P(M,G) определяет связность и параллельный перенос в любом ассоциированном с ним расслоении Е(М, F, G, Р) со стандартным слоем F. Действительно, как мы выяснили в § 8 этой главы, любая точка р €. Р определяет изоморфизм из типичного слоя F в слой Е над тг(р), р : F —»тг^1 (тг(р)). Это отображение позволя- позволяет канонически определить в любой точке w = [(р,?)] вертикальное, т.е. касательное к слою, подпространство как Vw = p'(T^F). Ясно, что это определение не зависит от выбора представителя в классе w = [(р, ?)]. Аналогично, любая точка ? G F определяет отображение ? : Р —> Е, ?(р) = [(р, ?)]. Горизонтальное подпространство в точке w = [(p, ?)] определяется как образ Нр С ТРР при действии дифференциала ?' отображения ?, Hw = ?'(НР), причем это определение не зависит от
68 Глава 2. Основные понятия дифференциальной геометрии выбора представителя. Учитывая структуру Е = Р xG F как скрученного произведения, нетрудно убедиться, что TWE = Hw ф Vw. Кривая в Е горизонтальна, если касательные к ней векторы горизонтальны в каждой точке. Для любой кривой г = х% в М и точки w G тгд'(жо) существует единственный горизонтальный лифт т* = wt, irsiivt) = х%, с началом в точке w. Этот лифт можно построить следующим образом. Возьмем представитель (p,Q в классе w — [(р,О] ¦ Поскольку irE(w) — тг(р) = ж0, существует горизонтальный лифт pt для г в расслоении Р. Горизон- Горизонтальный лифт г* при этом задается соотношением wt = pdO- Нетрудно убедиться, что это определение не зависит от выбора представителя (р, ?). Последнее означает также единственность лифта. Дословно повторяя рассуждения, проведенные для случая главного расслоенного пространства, мы придем к заключению, что любая кри- кривая т в М определяет изоморфное отображение т : тгд'(жо) —> Tr^'(xi), называемое параллельным переносом в ассоциированном расслоении Е. Параллельный перенос слоев наиболее часто используется в век- векторных расслоениях, которые отличаются рядом особенностей. Прежде всего отметим, что в каждом слое тг^1^), х ? М, векторного расслоения E(M,G,V,P) имеется структура векторного пространства. Поэтому и множество всех сечений S(E) векторного расслоения Е автоматически наделяется структурой векторного пространства (вообще говоря, бес- бесконечномерного). Связность в векторном расслоении и порожденный ей параллельный перенос позволяет сравнивать (и складывать) векторы сечения над разными точками базы. Именно на этом и основано понятие ковариантной производной для сечения векторного расслоения, которую мы сейчас определим точно. Итак, пусть задана связность Г в главном расслоении Р, сечение <р : М —* Е ассоциированного с ним векторного расслоения Е(М, G, V, Р) и некоторая кривая т = xt в М. Тогда для каждого t ковариантная производная Vi(^? для (р в направлении (или по отношению к) xt определяется так: Vit<p = jimo ^ [т/+А< {<p(xt + At)) - <p(xt)] , B.85) где r/+A' : тгд'^+дг) —* тг^'^О обозначает параллельный перенос вдоль г из xt+At в ж<. Из определения ясно, что для любого t Vi(y> G ngl(xt) и определяет сечение Е над г. Поскольку, как мы знаем, любому вектору X 6 ТХМ можно поставить в соответствие кривую xt, которой он касается в точке х = xto для некоторого t0, определение ковариантной производной B.85) можно переформулировать для любого вектора на М, положив Vjt^j = Vj, <p. Ясно также, что понятие ковариантной производной можно распространить и на случай, когда X есть векторное поле
§ 13. Параллельный перепое и ковариантыое дифференцирование 69 на М, определив ее в каждой точке как (Vx<p)(x) = V^yj. Сечение <р называется параллельным относительно связности Г, если для любой кривой г в М кривая (р(т) горизонтальна, или, эквивалентно, Vx<p — О для любого векторного поля X на М. Между операцией ковариантного дифференцирования сечений расслоения Е(М, G, V, Р) и операцией внешнего ковариантного диффе- дифференцирования в главном расслоении P(M,G) существует связь, которую мы установим в следующем Предложении. Предложение 2.13.2. Пусть X € ТХМ, р G *~\х), X Е ТРР причем тг'(Х) = X, и f(p) - р~1<р (тг(р)) есть функция на Р, f : Р -> V, соответствующая сечению ip (см. Предложение 2.9.2). Тогда Доказательство. Пусть г = xt, —e^t^e есть кривая в М, для которой X = &о, и пусть г* = pt есть лифт т с началом в точке р, р0 = р. Из определения лифта кривой следует, что р0 = hX. Тогда мы пишем Df(X) = df(hX) = UmQ ^ (f(pAt) - f(p)) = 1 г _, _, л = lim — \pAt<p(xAt) — Po ^(^o) • Отсюда p(Df(X))= lim — [ро°Рд!р(жд<)-р(а;о)|. B.86) Далее, положим p2t\<p(x&t) = ? E V и рассмотрим горизонтальную кривую pt(Q в Е. При t = At pAt(O = уК^д*), а при t — О O д!- Это означает, чторо°Рд<У(жд<) есть параллельный перенос <р(хы) из жд< в ж0, т.е. ро °Рд{у(жд*) = т0Л< ((р(хы)). Подставляя это в соотношение B.86), в его правой части получаем определение ковариантной производной. ? Основные свойства операции ковариантного дифференцирования перечислены в следующем Предложении. Предложение 2.13.3. Пусть X, Y — векторные поля на М, / — функция на М, а <р и -ф — сечения в Е. Тогда A) B) C) Доказательство. Свойства A) и C) сразу следуют из предыдущего пред- предложения. B) объясняется тем, что параллельный перенос в векторном
70 Глава 2. Основные понятия дифференциальной геометрии расслоении есть линейный изоморфизм слоя на слой. D) есть простое следствие определения B.85). D § 14. Характеристические классы В §7 мы видели, что могут существовать различные главные расслоения с одной и той же базой и одной и той же структурной группой. Более того, эти расслоения нумеруются некоторыми целыми числами (примеры 7 и 8). В этом параграфе мы введем понятие характеристических классов, позволяющих различать неэквивалентные расслоения. Оно играет важную роль при описании инстантонов и монополей в калибровочных теориях. Рассмотрим группу Ли G и ее алгебру Ли д. Прежде всего определим множество /*(<?) симметричных полилинейных отображений к раз инвариантных относительно G: f ((ad a)A,, (ad a)A2, ..., (ad a)Ak) = f(At ,A2,..., Ak), B.87) где А\,А2,...,Ак?д, a€G. Пусть теперь P(M,G) — главное расслоение с канонической проекцией ж и правым действием структурной группы на расслоении Ч/д. Выберем связность в Р с формой связности ш и формой кривизны п. Для каждого / G Ik(G) определим 2к-форму /(П) на Р следующим образом: , B.88) где Xi,...,X2fc G Х(Р), А* — четность перестановки тг : A,2,... 2к) —> (тгA),тгB),... тгB&)), а суммирование ведется по всем возможным пе- перестановкам. Мы изучим формы /(П), которые играют ключевую роль при определении характеристических классов, и попутно докажем ряд предложений о свойствах дифференциальных форм. Будем говорить, что форма (р степени г на Р проектируется в г-форму <р на М, если ср = ж*(р. B.89) Предложение 2.14.1. r-форма <р на P(M,G) проектируется в единствен- единственную г-форму <р на М, если
§ 14. Характеристические классы 71 i) <p(X],... , Хг) = О как только хотя бы один из Xj вертикален; ii) Ч>{К*и ¦ ¦ ¦, ВД) = V(XU... ,Xr), a 6 G. Доказательство. Пусть х € М и V{X € ТХ(М) (i — 1,...,г). Возьмем касательные векторы XiP ? Тр(р), тг(р) = х, такие, что тг'(Х^) = Vix и положим ...,XT). B.90) Покажем, что это определение корректно, т.е. не зависит от выбора точки р в слое тг~'(р) и касательных векторов XiP. Пусть X'ipf € Tp(P) и тг'(Х^) = Vix, где р' - Ф„р. Представим векторы X'ipl как X'ip, = 4?'aYip, причем ir'(Yip) = V{X. Согласно пункту (ii) Поскольку вектор (X,- — Yi)p вертикален для каждого г, то из (i) следует, что <P(XU.. .,Xr) = <p(YuX2, ...,XT) + ip(Xx - YhX2,... ,Xr) = = <р<УиХ2, ...,Xr) = <p(YltY2,X3,.. .,Xr) = ...= <p(Yi,Y2,... ,Yr). П Предложение 2.14.2. Если <р = ir*<p, то d<p = D<p (D — ковариантный дифференциал, определенный в § 11). Доказательство. Если (р G Dr(P) и Х{,...,ХГ+1 G Х(Р), то ..., тг'Хг+1) = (#)Gг'ЛХь -. .,*'hXr+l) = (d(p)(hXu.. .,hXr+]) = D<p(Xb... ,Xr+1). Здесь мы воспользовались свойством B.34). ? Пусть / G Ik(G), и /(П) — 2к -форма на P(M,G), определенная равенством B.88). Предложение 2.14.3. Форма f(u) на Р проектируется в единственную 2к -форму /(ft) на М, причем df{u) = 0. B.91) Доказательство. Форма п есть тензориальная форма типа (ad, g). От- Отсюда по формуле B.88) следует, что /(ft) удовлетворяет условию (i) Предложения 2.14.1. Так как Ф„й = ad(a~')ft, а / инвариантна при действии G, то удовлетворяется и условие (ii) того же предложения. Значит, /(ft) проектируется в единственную 2&-форму на М. Далее, d/(ft) = d?r*/(ft) = 7r*d/(ft) и, чтобы доказать B.91), достаточно доказать,
72 Глава 2. Основные понятия дифференциальной геометрии что df(u) = 0. Согласно Предложению 2.14.2 df(Cl) = Df{u). Так как операция D действует как простое внешнее дифференцирование (т. е. по формуле B.18)) и DCI = 0 согласно Предложению 2.11.5 (тождество Бьянки), то Df(u) = 0. ? Рассмотрим теперь две формы связности щ и ш\ на Р и положим а = шх- ш0, B.92а) щ = ш0 + ta, 0 ^ t ^ 1. B.926) Легко проверить следующие свойства: 1) а есть тензориальная форма типа (ad, g); 2) {cot, 0 ^ t ^ 1} есть однопараметрическое семейство форм связности на Р. Обозначим Dt внешнее ковариантное дифференцирование, a Qt форму кривизны, определяемые формой связности u)t. Предложение 2.14.4. 4 B-93) Доказательство. Согласно структурному уравнению B.74) Qt = du)t H—[щ,шг] = du)<s + tda + a[ut,(Vt]. Используя равенство du)t/dt — а, получаем —nt = da+-[a,u)t] + -lut,a]. B.94) dt 2 2 Из формулы B.77) ковариантного дифференцирования тензориальных 1-форм следует, что правая часть равенства B.94) есть Dta. D Прежде чем перейти к следующим свойствам, нам надо рас- рассмотреть случай, когда аргументами отображения / € Ik(G) являются некоторые g-значные формы <р\,..., <рь на Р степеней т\,..., г* соответ- соответственно. Тогда форму f(<f\,- ¦ ¦ ,<fk) степени г = г\ + ... + г* определим так: B.95) (ср. B.88)). Таким образом, определенная выше 2&-форма /(П) есть просто /(О,..., п). Форму f((f],..., ipk) удобно представить в виде: ОС] . А Оь /ъ r\S'\ ttai...atV| Л... Л <рк , B.96) al,...,ak=\
§ 14. Характеристические классы 73 где Ti -формы <pf возникают при разложении по базису {Еа} (а = 1,2,... ,те = dimG) алгебры Ли д, а числа aat---aat = /(#„,,..., Eat). Предложение 2.14.5. Пусть / ? Ik(G). Bк - 1)-форма i <b = kjdtf(a,ut,...,ut) B.97) о на Р проектируется в единственную BА; — 1)-форму на М и <*Ф = /(П,,... ,П,) - /(По, • • ¦, По) ~ /(О,) - /(По). B.98) Доказательство. Из тензориальности форм а и П* и из представления B.96) (или B.95)) следует, что f(a, ut,..., fit) удовлетворяет условиям Предложения 2.14.1 и эта форма, а значит и форма Ф, проектируются в Bfc— 1)-формы на М. Используя Предложения 2.14.2 и 2.14.4, тождество Бьянки Dttit = 0 и представление B.96), получаем = к f(Dta, О,,..., flt) = * /(-^П*. П«, • • •, ^) - ^т/(^, П«, Of)- ас ас Следовательно, 1 = k J dt{df{a,Uu...,ut))= J dtjtf{Ut,Uh...,ut) = .,По). П Введем еще несколько определений. Пусть N — дифференци- дифференцируемое многообразие размерности те. Форма ш ? Dr(N) называется замкнутой, если du = 0, B.99) и точной, если w = a>, B.100) где ц G Dr~'(JV"). Очевидно, что любая точная форма является замкнутой, но обратное неверно. Обозначим множество замкнутых г-форм на N Zr,
74 Глава 2. Основные понятия дифференциальной геометрии а множество точных г-форм Вт. Будем считать две г-формы шиш' эквивалентными, и> ~ ш', если ш = ш' + da для некоторой а € DT~l(N). Множество классов эквивалентности Zr/~ образует абелеву группу, называемую группой когомологии де Рама, и обозначается .ffr(JV;M) (также пишут Hr(N;M) = Zr/Br). В дальнейшем мы будем опускать указание на поле Ш, над которым рассматриваются формы. Особый случай представляет пространство H°(N). Так как не существует форм степени (-1), и dc = 0, если с постоянная функция, то H°(N) представляет собой множество функций, постоянных на N. При этом dim H°(N) равна числу связных компонент многообразия N. В частности для евклидова пространства dimH°(Rn) = I. Согласно лемме Пуанкаре при г ^ 1 dimfPCR") = 0, т.е. любая замкнутая форма может быть представлена как внешняя производная от формы более низкой степени. Таким образом, когомологии де Рама многообразия N нетривиальны, если локальные окрестности Щ С N «склеиваются» в N нетривиальным образом. Для полноты изложения отметим, что величина bp = dim НР(Ю называется р-ым числом Бет/Пи многообразия N, а сумма р=0 (те = dim N) является характеристикой Эйлера. По теореме Гаусса— Бонне ?{М) может быть выражена через кривизну многообразия; в этом проявляется связь между свойствами форм на многообразии и его геометрией. Для дальнейшего нам понадобится теорема Стокса, которую мы приведем без доказательства. Пусть N есть r-мерное многообразие, a 3N — его граница. Тогда для любой (г — 1)-формы ш справедливо равенство: I du= fu, B.10I) N dN где интеграл от формы понимается в том же смысле, как и в форму- формуле B.226). Например, если г = 1, а N является сегментом [а,Ь], то B.101) переходит в хорошо известную формулу N
§ 14. Характеристические классы 75 Если многообразие N (dim N = г) не имеет границы, 8N = О, то интеграл по N не зависит от выбора представителя в классе эквива- эквивалентности из Hr(N). Действительно, пусть ш и /х принадлежат одному классу эквивалентности. Тогда ш = /i + da, a (Е Dr~l(N). По теореме Стокса I ш= I (ц + da) - I fi+ I da= I ц+ I a= 1ц. N N N N N 8N N Вернемся теперь к 2fc-формам f(u), где / (Е i*(G). Согласно Предложению 2.14.3 формы /(ft) и f(u) являются замкнутыми. Из Предложения 2.14.5 следует, что формы f(u), отвечающие различным связностям в главном расслоении P(M,G), принадлежат одному и тому же классу эквивалентности в группе когомологии де Рама Н2к(М). Следовательно, если N — 2А;-мерное подмногообразие в М, не имеющее границы, то интеграл по N от /(?2) не зависит от выбора связности в главном расслоении над М. Кроме того, оказывается, что для любого N С М с 8N = 0 интеграл от f(u) является целым числом. Если / — симметрическое инвариантное полилинейное ото- отображение, т.е. / G Ik(G), то линейная комбинация величин f(A) = f(A,A,...,A) с вещественными коэффициентами представляет собой инвариантный относительно действия G (в смысле B.87)) полином (или характеристический полином) Q(A) переменной А ? д. Как построить такой полином в явном виде? Пусть алгебра Ли д реализована матрицами размером 1x1. Если матрица А имеет собственные значения {Л(, А2,..., Л/}, то инвариантный полином Q(A) является симметричной функцией этих чисел А,- и его можно записать через симметрические полиномы степени к вида Ai,A,2...Au.. B.102) Примером инвариантного полинома является выражение det(l + A). Предположим, что матрица А может быть приведена к диагональному виду преобразованием типа А = UA'U~l, где А' — diag(A], А2, - -., Aj) — диагональная матрица. Тогда можно показать, что det(l + A) = det(l + А') = 1+ 5, (А) + 52(А) + 5, (А), B.103) где 5,(А) = А, + А2 + ... + А, = tr A' = tr А, B.104а) 52(А) = J2 XiXj = 1- [(А, + А2 + ... + А,J - А? - \\ - ... -
76 Глава 2. Основные понятия дифференциальной геометрии \ [AГ ЛJ ~ trUJ] = \ [(tf AJ ~ tF А1 ' BШ4б) 53(А) = - [(tr AK -3tr A2tr A + 2trA3] B.104b) и т.д. Для определения когомологического класса, называемого характе- характером Черна, используется инвариантная функция tr(exp.4). Перейдем теперь непосредственно к характеристическим классам. Мы ограничимся рассмотрением классов Черна для главного расслое- расслоения Р над многообразием М без границы {дМ = 0) и со структурной группой G С GL(k; С) (группа невырожденных комплексных матриц раз- размером к* к). Определим с помощью инвариантного полинома det(l + A) форму на М, называемую тотальной формой Черна, по следующей формуле с(Р) = det ( 1 + ^-п J, B.105) где П — форма кривизны формы связности в P(M,G), а черта напоминает о том, что мы должны все слагаемые в разложении типа B.103), B.104) спроектировать на базу М. Иногда тотальную форму Черна обозначают с(п). Используя B.103) и B.104), получаем с(Р) = 1 + с, (Р) + с2(Р) + ..., B.106) где Ci(P) являются 2,7-формами на М, определяемыми инвариантными полилинейными отображениями из P(G) следующим образом: с,(Р) = —trfi; 2тг с2(Р) = —r(-tr ЮЛ ft-Mr QAtr п); B.107) 2 с3(Р) - —— \п~п Л tr п Л tr п - 3(tr п Л П) Л tr п) + 2tr П Л п Л Щ 4о?Г и т.д. (ср. B.104)). Положим по определению cq(P) — 1. Форма Cj(P) G D2\M) называется j-ой формой Черна. Очевидно, что Cj(P) = 0, если 2j > n — dimM. Поэтому сумма B.106) конечна. Как было показа- показано выше, Cj(P) есть замкнутая форма и j'-ые формы Черна, отвечающие различным связностям данного расслоения, принадлежат одному кого- когомологическому классу в Н2*(М), называемому j-ым характеристическим классом Черна. Значение интеграла по всему многообразию М от формы, пред- сталяющей соответствующий класс Черна или образованной внешним
§ 14. Характеристические классы 77 произведением нескольких форм Черна, называется числом Черна рас- расслоения P(M,G). Числа Черна являются топологическими характери- характеристиками расслоения. Замечательным является тот факт, что эти числа являются целыми. Например, при п = 4 мы имеем два числа Черна: ¦/• С2(Р) = j c2(P), Mr B.108) = J c,(P)ACl(P). M Пример 1. Расслоение магнитного монополя Р (S2,U(\)). В этом случае с(Р) = 1 + — U, cq{P) = 1, С|(Р) = (г/2я-) п и неэквивалентные расслоения характеризу- характеризуются первым числом Черна B.109) Пример 2. Инстантонные расслоения Р (S4,5f/B)). Форма кри- кривизны может быть представлена в виде п — таП°, где та — матрицы Паули и tr тать = 26аЬ. Тотальный класс Черна имеет вид с(Р) = 1 + —4tr П Л U = 1 + —^па Л па, 8тг2 4тг2 так как tr п = (tr та)па = 0. Следовательно, 1 со(Р)=1, с,(Р) = 0, Здесь расслоения характеризуются вторым числом Черна С2(Р) = [ с2(Р) = ~ [пШп. B.110) J air* J Более подробное изложение теории характеристических классов можно найти, например, в [КН], [ДНФ], [ЕГХ].
Глава 3 Линейные и римановы связности В настоящей главе мы будем изучать линейные и римановы связ- связности, которые широко используются в общей теории относительности. Эти связности требуют особого рассмотрения потому, что в соответ- соответствующих главных расслоенных пространствах возникают новые, только им присущие структуры. Сначала мы дадим общее описание линейных связностей в главном расслоении, а потом соотнесем его с эквивалент- эквивалентным описанием в базе в терминах ковариантных производных, которое является стандартным в общей теории относительности. § 1. Линейные связности Пусть М есть дифференцируемое многообразие с dimM = n, и L(M), как обычно, обозначает расслоение линейных реперов над М, т. е. главное расслоенное пространство с базой М и структурной группой GL(n,R) (см. пример 5 §7 главы 2). Линейной связностью в М называется связность в расслоении линейных реперов L(M). Если в L(M) задана линейная связность Г, то ей стандартным образом можно поставить в соответствие формы связности и кривизны, ш и п = Du, со значениями в алгебре Ли gl(n, Ш) структурной группы (см. § 10 главы 2). Однако оказывается, что специфика расслоения линейных реперов позволяет ввести еще одну 2-форму, характеризующую эту связность. Прежде чем перейти к обсуждению этой 2-формы, мы опишем 1 -форму, канонически задающуюся на L(M) безотносительно к связности в этом расслоении. Напомним, что с расслоением линейных реперов L(M) ас- ассоциировано касательное расслоение Т(М) (пример 1 §8 главы 2), при этом любой репер и € L(M) определяет линейный изоморфизм и : Е" —»• ГТ(„)М из типического слоя 1" в слой Т{М) над тг(и). Обозначим через и~х обратное отображение, и~1 : Тж^и)М —» Ж". Да- Далее, заметим, что дифференциал тг' канонической проекции в L(M) отображает TUL(M) в Т„(и)М, тг' : TUL(M) —» Тж^и)М. Таким обра- образом, комбинируя отображения «"' и тг', мы получаем в каждой точке
80 Глава 3. Линейные и римановы связности и ? L(M) отображение и ' о тг' : TUL(M) —» М", т.е. 1-форму на L(M) со значениями в Ж". Эта форма называется канонической формой для L(M) и на любом векторе X ? TUL(M) может быть записана так: в(Х) = и~] (тг'(Х)) . C.1) Легко проверить, что форма в горизонтальна и обладает свойством Ф^ = а~Ч C.2) где а~1в обозначает естественное левое действие GL(n, Ж) на элемен- элементы Е" (см. пример 1 §8 главы 2). Поэтому каноническая форма в для L(M) есть тензориальная 1-форма типа (GL(n, М),Ж"). Линейная связность Г в L(M) позволяет поставить в соответ- соответствие каждому вектору ? G К" стандартное горизонтальное векторное поле В(?), которое полностью определяется условиями и (В(О) = 0, C.3а) 0(B(O)=t. C.36) Из определения C.3) и из C.2) следует, что для любого a G GL(n, Ш) ' В(а-10- C-4) Кроме того, Б(^1 + ?2) = В(?\) + В(?2) и при ? ^ 0 поле В(О нигде не обращается в нуль. Это сразу видно из соотношения tt'(B(?)) = «(?), являющегося следствием определения в C.1), если принять во внимание, что и : Ж" —> TUZ/(M) есть линейный изоморфизм и и(?) = 0 только при ? = 0. Если .4 € <^(теI&) и А* — соответствующее фундаментальное векторное поле, то из B.37) и C.4) легко получить, что [а;В@]=В(М)> C-5) где А? обозначает действие матрицы А € gl(n, Ж) на ? ? R". Введем теперь в пространствах Е" и <?Z(n, E) стандартные базисы. Стандартный базис пространства Е" состоит из векторов с координатами а< = @,..., 1,0,... ,0) (единица на г-м месте), а стандартный базис А) алгебры Ли gl(n, Ш) состоит из матриц с компонентами (.4})* = SjS}. С помощью этих базисов в L(M) можно построить п2 + п векторных полей: стандартные горизонтальные поля Д- = В(щ) и фундаментальные поля Ау, которые вместе, как легко убедиться, образуют базис касатель- касательного пространства TUL(M) в каждой точке и G L(M). Принято говорить, что п2 + п векторных полей B^Aj определяют абсолютный параллелизм в L(M).
§ 1. Линейные связности 81 Рассмотрим внешний ковариантный дифференциал от в, 0 = D9. Вследствие C.2) и Предложения 2.11.1 0 есть тензориальная 2-форма на L(M) типа (GL(n,М);Е"), которая называется формой кручения линейной связности Г. Предложение 3.1.1. Для форм связности, кривизны и кручения, ш, И и 0, линейной связности Г в М имеют место следующие уравнения структуры: п(Х, Y) = <МХ, Y) + Х- [ш(Х), ш(У)] , C.6а) 0(Х, Y) = ЩХ, Y) + Х- (u){XN{Y) - ы(ГЩХ)), C.66) X,Y?TUL(M). Доказательство. Уравнение структуры C.6а) было доказано в Предло- Предложении 2.11.2. Доказательство уравнения C.66) проводится аналогично. А именно, это уравнение нужно проверить в трех случаях, из которых нетривиален только тот случай, когда вектор X вертикален, а вектор Y горизонтален. Вследствие линейности 0 по обоим аргументам не ограни- ограничивая общности можно считать X фундаментальным векторным полем, а У — стандартным горизонтальным полем. Выберем A G д1(п,Ш) и ? € R", так, что А*и — X, ?(?)„ = Y. На этих полях левая часть C.66) обращается в нуль, а правую часть можно преобразовать к виду de {а\В@) + \м - \ {а*в (в@) - в(Ов(А*) - в ([А*,в(О]) } + {м, где мы воспользовались формулой B.21) для внешнего дифференциала 9. Первый член в фигурных скобках исчезает вследствие постоянства функции О (-В(О) = ?» второй — вследствие горизонтальности формы в. Преобразовав коммутатор в третьем члене с помощью формулы C.5), мы найдем, что ^0 ([.А*,В(?)]) = ^А(,, т.е. правая часть уравнения C.66) тоже обращается в нуль. Это и доказывает второе уравнение структуры. D Рассматривая в как векторнозначную форму, aw — как матрич- нозначную форму, структурные уравнения можно переписать в краткой форме: п = <L) + ш А ш, C.7а) 0 = йв + ш А в. C.76) Разлагая ш и в по стандартным базисам вЕ" и gl(n, R), уравнения C.7) можно также записать в компонентах аналогично B.79).
82 Глава 3. Линейные и римановы связности Предложение 3.1.2. Для линейной связности Г в М имеют место следующие тождества Бьянки: DU = 0, C.8а) DQ = Q А в. C.86) Доказательство. Тождество C.8а) было доказано в Предложении 2.11.5. Применив операцию внешнего дифференцирования к уравнению C.76), мы получим dQ - dw А в - ш A dO. Если от этого уравнения взять горизонтальную компоненту и заметить, что второй член при этом исчезает, то получится в точности уравнение C.86). а § 2. Ковариантное дифференцирование Как мы выяснили в примере 2 §8 главы 2, с расслоением ли- линейных реперов L(M) ассоциирован целый ряд векторных расслоений, а именно, тензорные расслоения Т*(М). В соответствии с результата- результатами § 13 главы 2 задание линейной связности в М определяет в этих расслоениях параллельный перенос, который, в свою очередь, позволяет определить операцию ковариантного дифференцирования сечений этих расслоений, т. е. соответствующих тензорных полей. Пусть заданы линейная связность Г в М и тензорное поле К типа (r,s), рассматриваемое как сечение расслоения ТЦМ). Аналогично рассуждениям § 13 главы 2, мы можем определить ковариантную про- производную от К либо вдоль кривой Xt в М, VitK, либо для вектора X Е ТХМ, VXK, либо для векторного поля X G Х(М) на М, VХК¦ Мы сформулируем свойства операции ковариантного дифференцирования тензорных полей для последнего случая. Предложение 3.2.1. Пусть Т есть алгебра тензорных полей на М, и X, Y G То(М) = Х(М). Тогда ковариантное дифференцирование имеет следующие свойства: A) Vx : Т(М) -> Т(М), причем V* {%(М)) С ГДМ); B) Vjf перестановочно со свертыванием; C) Vx+r = Vx + Vr; D) Vxf = Xf; E) VfXK = fVxK для любой функции / G S{j(M) = $(M). Доказательство. Как мы установили в § 13 главы 2, параллельный перенос в векторном расслоении есть линейный изоморфизм слоя на слой. При
§ 3. Тензоры кривизны и кручения 83 оо этом из того, что действие GL(n,R) на слое T(V) = ]>Г T*(V) является продолжением действия этой группы на V, следует, что параллельный перенос сохраняет тип тензора и перестановочен со свертыванием. Последнее и влечет за собой A) и B). Свойства C)—E) доказаны в Предложении 2.13.1. ? Замечание. Из общей теории известно (см. [КН]), что операция дифференцирования тензорных полей полностью определяется ее дей- действием на алгебре функций 5(М) и множестве векторных полей Х(М). Поскольку действие Vjp на ?(М) у нас задано, определение дифферен- дифференцирования Vx эквивалентно заданию его действия на векторных полях, которое, в соответствии с Предложениями 2.13.1 и 3.2.1 для любых X, У, Z G Х(М) имеет вид VX(Y + Z) = VXY + VXZ, C.9a) VX+YZ = VXZ + VYZ, C.96) V/xF = fVxY, C.9b) V*/У = fVxY + (Xf)Y. C.9r) Таким образом, любое отображение (X, У) —> V^y, удовлетворяющее этим условиям, есть ковариантное дифференцирование относительно некоторой линейной связности в М. § 3. Тензоры кривизны и кручения В § 1 мы определили формы кривизны и кручения, U и 0, линейной связности в L(M). Специфика расслоения линейных репе- реперов позволяет построить на базе М геометрические объекты, точно характеризующие эти формы. _ Пусть X_jr,Z G ТХМ_, и е 1*~\х), и X,Y,Z 6 TUL(M) такие, что тг'(Х) — X, тг'(Г) = Y, w'(Z) = Z. Определим кручение Г и кривизну R линейной связности соотношениями )), C.10а) R(X, Y)Z = u( Bп(Х, ?)) 6(Z)) . C.1 Об) В последнем соотношении действие U(X,Y) на 6(Z) следует понимать как умножение матрицы из gl(n, Ж) на вектор из Жп. Из тензориальности форм п и 9 и из свойства отображения и следует, что эти определения корректны, т.е. не зависят от выбора точки и е 7r~'(x) и векторов X, У, Z, проекции которых на базу фиксированы. Отметим, что кривизну R(X,Y) следует понимать как линейное преобразование пространства ТХМ.
84 Глава 3. Линейные и римановы связности Кручение и кривизну можно записать через ковариантную произ- производную относительно рассматриваемой линейной связности. Предложение 3.3.1. Кручение Г и кривизна R могут быть представлены в виде T(X,Y) = VXY-VYX-[X,Y], C.11a) ЩХ, Y)Z = [Vx, Vy] Z - V[X,Y]Z, C.116) где X, Y, Z — векторные поля на М. Доказательство. Докажем сначала C.11а). Пусть X*, Y* — лифты полей X, Y и и € тг"'(ж). По определению C.10) = и (Х„*0Ю - Y:0(X*J - 0([Х*и, О) , C.12) где мы воспользовались формулой B.21). Заметим, что по определению в C.1) 0(Y*) = u~\Y), т.е. в(Уи) G К" есть эквивариантное отображение из L(M) в Ж", отвечающее Y как сечению касательного расслоения. В соответствии с Предложением 2.13.2 и {X*J(Y*)) =u(D @(O) (X*)) = VXY. C.13) Наконец, вспоминая, что h([X^,Yu]) = ([X,У])*, из C.12) получаем (З.Па). # Формула C.11 б) доказывается аналогично. Преобразовав ЩХ*, Y*) с помощью формулы B.21), приведем C.1 Об) к виду ЩХ, Y)Z = и (ш([Х*и, Y:mZ*)) . C.14) Используя свойство в C.2) и инвариантность лифта Z* относительно действия структурной группы, а также проводя тривиальные преобразо- преобразования, получим ш ([х*, у*]) в(г*) = v ([х*, г*]) e(z*) = = ([X*,Y*] - h([X*,Y*))) 9(Z*) = ([X*,Y*] - ([X,Y])*) 6{Z*). Подставляя это в C.14) и учитывая C.13), приходим к формуле C.116). ? Для форм п и 0 в расслоении L(M) имеют место тождества Бьянки C.8). Подставляя в них векторные поля X*, Y*, Z*, являющиеся лифтами полей X, Y, Z, их можно переписать как тождества для кривизны R и кручения Т (см. [КН]). Мы определили кривизну и кручение линейной связности бе- безотносительно к какому-либо базису в касательном пространстве, т.е. инвариантным образом. Если же на некотором открытом множестве U С М задан подвижный репер {X,}, то можно перейти к привычной компонентной записи тензоров кривизны и кручения.
§ 3. Тензоры кривизны и кручения 85 Напомним, что подвижный репер на открытом множестве U С М — это упорядоченный набор из п векторных полей X, на U, зна- значения которых в каждой точке и 6 U образуют репер. Дуальный к {Х{} подвижный корепер будем обозначать {Ег}; он определяется условием Е1(Хк) — 6к. Если в U заданы локальные координаты {х1}, то определен координатный репер j з§т>---, ^ Ь дуальным к нему корепером, оче- очевидно, будет {dx1}. Отметим, что коммутатор полей подвижного репера в общем случае может быть отличен от нуля. Такой базис векторных полей называется неголономным, в отличие от голономного координатного базиса, для которого коммутатор полей всегда исчезает. Рассмотрим кривизну и кручение на векторных полях подвижного репера {Xj} и определим их компоненты B!kij и T-j соотношениями tjXk, C.15а) R(Xi, Xj)Xk = ^2 RlkijXi- C.156) Разлагая ковариантную производную V* = Vхк базисных полей по тому же базису ^4^, C.15b) получим набор величин Г^-, которые называются компонентами или символами Кристофеля линейной связности. Подставляя C.15) в C.11), нетрудно получить выражения для компонент тензоров кривизны и кручения через символы Кристофеля и структурные функции С,* него- лономного базиса, определенные соотношениями [X,-,Xj] = C,*Xfc. Введение подвижного репера на открытом множестве U С М задает над U сечение расслоения L(M), a :U —> L(M), которое каждой точке и G U ставит в соответствие репер в этой точке, a(U) = {Х,}|„. Легко показать, что обратный образ формы в относительно этого сечения есть * y?&. C.16а) Обратные образы форм 0, п и ш выражаются через определенные в C.15) компоненты по формулам:
86 Глава 3. Линейные и римановы связности <т*п = а*и> = ^Ж = Е(Г^*И C1бг) Эти соотношения следуют из определения соответствующих форм и компонент. Докажем, например, формулу C.16г). Используя результаты Предложения 2.13.2, имеем: («гМГ1 ViX, = {DO (</Xj)) (a'Xi) , C.17) где мы приняли во внимание, что отвечающее полю a'Xj эквивариантное отображение есть 9(a'Xj). По определению символов Кристофеля, в левой части C.17) получаем (cr(tt))~1V,Xj = Г^-о*. В соответствии с C.16а), O(cr'Xj) — aj. Поэтому в правой части C.17) получаем ш(<т'Xi)a,j = U(Xi)^ah. Сравнивая выражения в обеих частях, приходим к формуле C.16г), у которой в качестве аргумента формы взят вектор X,-. В физической литературе часто используются уравнения для форм Тг и Rlk, определенных в C.16). Эти уравнения получаются взятием обратного образа относительно сечения а структурных уравнений C.7) и имеют вид Г' = dE{ + ш) А Е\ C.18а) R) = Щ + ш{ A uf-. C.186) Аналогичным образом из C.8) можно получить тождества Бьянки для этих форм. § 4. Римановы связности Важный класс линейных связностей образуют римановы связ- связности, которые можно задавать на многообразии с помощью (псев- до)римановой метрики. Прежде чем переходить к описанию этих связно- связностей, остановимся кратко на различных определениях метрики, которые нам понадобятся в дальнейшем. В дифференциальной геометрии можно дать несколько эквива- эквивалентных определений метрики. Так, (псевдо) риманову метрику д на М можно определить как невырожденное скалярное произведение дх в касательном пространстве ТХМ, дифференцируемое по х в том смысле, что для любых дифференцируемых векторных полей X, Y на М функ- функция д(Х, Y) дифференцируема. Эквивалентно, метрика определяется как симметричное ковариантное тензорное поле степени 2, невырожденное в каждой точке х € М, т. е. из д(Х, Y) = 0 для всех X G ТХМ следует Y = 0. Как мы выяснили в §9 главы 2, тензорные поля являются
§ 4. Римановы связности 87 сечениями соответствующих тензорных расслоений, и существует одно- однозначное соответствие между сечениями ассоциированных расслоений и эквивариантными отображениями из главного расслоения в типический слой. Поэтому метрику д на М можно рассматривать как нигде не обращающееся в нуль эквивариантное отображение д : L(M) -* S(V* <g> V*), V = R", C.19) где S означает симметризацию тензорного произведения. Первые два определения оказываются удобными при рассмотрении римановой связ- связности в М, последнее наиболее адекватно при рассмотрении соответ- соответствующей связности в L(M). Напомним еще основные свойства псевдоримановой метрики д, заданной на n-мерном многообразии М. Скалярное произведение дх в каждой точке х е М определяет линейный изоморфизм I: ТХМ —* ТХМ, задаваемый соотношением (I(X),Y) = дх(Х,Y), X,Y€ TXM, C.20) (где мы использовали обозначения §3 главы 2 для внутреннего про- произведения элементов из ТХМ и ТХМ). Этот изоморфизм определяет скалярное произведение в сопряженном пространстве ТХМ, которое мы обозначим также дх и которое задается формулой 1\ a,peTZM. C.21) Пусть {li} — подвижный ортонормальный репер, т.е. набор п ли- линейно независимых векторных полей, заданных на некотором открытом множестве U С М и удовлетворяющих условиям g(ii,ik) = ?i6ik = m, C.22) где ?j = ±1 и signp = (?i,?2>-.-,?n) есть сигнатура метрики д. Для дуального ему корепера {е'}, e'(Zt) = 6'к вследствие C.20) и C.21) также имеем g(e\ek)=ei6ik = tiik. C.23) Как уже отмечалось в § 3 гл. 2 структура Риманова многообразия, в случае когда оно ориентируемо, позволяет ввести выделенную п-форму, являющуюся элементом объема dv соответствующим метрике д. Она согласована с ортонормальным репером и определяется как dv = е1 Л е2 Л ... Л еп, C.24) что является естественным обобщением элемента объема в B.22а).
Глава 3. Линейные и римановы связности Если в U заданы также локальные координаты {х'}, то кова- риантные и контравариантные компоненты метрики д определяются как ' A25а) gik=g{dx\dxk). C.256) Определим компоненты отображения J, / (-^ \ = Iikdxk. Из C.20) сразу следует, что Iik = gik и gikgkl = 6l{. Таким образом, в координатной записи операции /иГ1 суть операции опускания и подъема индексов. Ясно также, что эти операции можно продолжить на всю тензорную алгебру. Ортогональный корепер {е1} можно разложить по координатному кореперу {dx1}, е' = ekdxk, причем из C.23) следует, что (dete'kJ = |det<7,7..| = \д\. Подставив это разложение в C.24), получим стандартную формулу для элемента объема dv = у/\д\ dx1 A dx2 А ... A dxn. Если D — компактное подмногообразие в М и кр — харак- характеристическая функция D (т.е. kD = 1 на D и ко = 0 вне D), то определим интеграл от функции / по D как / fkjjdv, а объем D как м \o\(D) = J ко dv. Если М компактно, то объем М равен vol(M) = / dv. м м Формулы C.22) и C.25а) для компонент метрики можно обратить и получить выражение для метрического тензора через кореперы {е'} и {dx1}. Оно имеет вид ек = gikdxl <g> dxk. Из него легко найти связь между компонентами метрики в ортонормаль- ном репере и в координатном базисе: 9ik = »7гте,е^. Как мы уже упоминали в §3 главы 2, псевдориманова метрика д модифицирует вид операции Ходжа. А именно, для р-формы ш эта операция при наличии метрики определяется так: возьмем отвечающее из антисимметричное контравариантное тензорное поле степени р, /~'(ь>) и свернем его с n-формой объема dv. В результате получим (п-р)-форму, которую и принято обозначать *ш. Компоненты формы *ш выражаются через компоненты ш по формуле
§ 4. Римановы связности 89 **, ^ ,...у,..*-,- C.26а) Легко проверить, что в отличие от случая евклидова пространства, *(*ш) = е(-\У{п~р)ш, где е = Пе« (см- C.22)). Отметим еще, что формула i C.26) эквивалентна следующему закону преобразования базисных р- форм dx'1 А .. .dx'T: Л dxh ... Л dxir) = '—¦?i|""S,-j.-,dar" Л ... dah*. C.266) / (я — р). Вернемся теперь к рассмотрению линейных связностей. Пусть в L(M) задана связность Г и на М задана (псевдо) риманова метрика д, которую мы будем понимать как функцию на L(M) C.19). Линейная связность Г называется метрической, если метрика д параллельна относительно этой связности. В соответствии с Предложением 2.13.2 для функции д на L(M) это условие можно записать как Dg = 0. C.27) Оказывается, расслоение L(M) слишком велико для описания метриче- метрической связности, т. е. эта связность редуцируема к связности в некотором подрасслоении L(M), которое мы сейчас опишем. Ясно, что ненулевой элемент т/ пространства S(V* <8> V*), V = М", можно представить как симметричную матрицу. Такую матрицу можно привести к диагональному виду преобразованием GL(n, Ж) : т? —* AttjA. Если 7/ принадлежит области значений метрики д, рассматриваемой как отображение д : L(M) —» S(V* <S> V*), то в соответствии с C.22) ее можно привести к виду т) = diag(?i,?2,-. ?п)- Рассмотрим подмножество в L(M), определяемое следующим образом: О(М) = {и е L(M\ g(u) = п) ¦ C.28) Поскольку множество преобразований, оставляющих rj инвариантной, есть ортогональная группа, которую мы будем обозначать О(т/), О(М) есть главное расслоенное пространство с базой М и структурной груп- группой O(ij), которое называется расслоением ортонормальных реперов псевдориманова многообразия М. Предложение 3.4.1. Пусть Г — связность в L(M), д — метрика на М и О{М) С L(M) есть редуцированное подрасслоение, определяемое с помощью д. Связность Г редуцируема к связности в О(М) тогда и только тогда, когда она метрическая. Доказательство. Пусть Г редуцируема к связности в О(М). Тогда любая горизонтальная кривая с началом в О(М) лежит в О(М),
90 Глава 3. Линейные и римановы связности следовательно, любая горизонтальная кривая в L(M) имеет вид vt = ФаЩ, где щ е О(М), а ? GL(n,W). Это означает, что g(vt) постоянно вдоль любой горизонтальной кривой в L(M), и, следовательно, Dg = 0. Обратно, если Г — метрическая связность, то из Dg = 0 следует, что она постоянна вдоль любой горизонтальной кривой. В этом случае, по определению О(М) C.28), горизонтальная кривая с началом в О(М) лежит в О(М), т.е. связность Г редуцируема к связности в О(М). D Итак, мы выяснили, что для задания метрической связности в L(M) достаточно задать некоторую связность в расслоении ортонор- мальных реперов О(М). Из всех возможных метрических связностей наиболее важной является связность с нулевым кручением, которая называется римановой связностью или связностью Леви-Чивита. Предложение 3.4.2. Каждое псевдориманово многообразие допускает единственную метрическую связность с нулевым кручением. Доказательство. Нам нужно показать, что в L(M) существует единствен- единственная связность, удовлетворяющая условиям Dg = 0, C.29а) D0 = dO + u>Ae = O. C.296) Построим соответствующее д расслоение ортонормальных реперов О(М). Метрическая связность в L(M) однозначно определяется связностью в этом расслоении. В О(М) C.29а) выполняется тривиально, поэтому остается показать, что уравнение C.296) имеет в О(М) единственное решение. Пусть (,) обозначает скалярное произведение в Е", отвечающее rj = diagfci ...?„) и X,Y,Z ? ТОЩ). Рассматривая C.296) на векторах X, Y и взяв скалярное произведение с 0(Z), получим: {0(Z), ш(?)в(Х)) - @(Z), ш(Х)в(?)) = 2 @(Z), ЩХ, Y)) . C.30) Заметим, что поскольку ограничение ш на О(М) принимает значения в алгебре Ли ортогональной группы O(tj), а скалярное произведение (,) О(?7)-инвариантно, {в(г),ш(У)в{Х)) = - (w(Y)e(Z),0(X)) для любых X, Y, Z. Поэтому, циклически переставляя X, Y, Z в C.30), складывая два уравнения и вычитая третье, получим ($(Z)MY)9(X)) = (B(X),dO(Y,Z)) + (9(Y),de(Z,X)) + (e(Z),de(X,Y)) . Это явное выражение для формы связности ш и доказывает существова- существование единственной связности с нулевым кручением в О{М), а значит и единственность метрической связности с нулевым кручением в L(M). D Рассмотренное построение римановой связности как связности в расслоении линейных реперов практически не используется в физиче- физических приложениях. Это связано с тем, что так построенные связности
§ 4. Римановы связности 91 трудно сравнивать для различных метрик, поскольку каждой метрике отвечает свое расслоение ортонормальных реперов. Для физических при- приложений более удобным оказывается описание римановых связностей в терминах ковариантных производных. Как отмечено в замечании после Предложения 3.2.1, для полного определения линейной связности доста- достаточно задать отвечающую ей ковариантную производную на множестве векторных полей. Предложение 3.4.3. Для любых векторных полей X, У, Z на М кова- риантная производная VXY относительно римановой связности, порожденной метрикой д, задается уравнением 2д ( Vx Y, Z) = Xg(Y, Z) + Yg(X, Z) - Zg(X, Y) + + g([X,Y]tZ)+g([Z,X],Y)+g(X1[Z,Y]). C.31) Доказательство. В соответствии с Предложением 3.4.2, риманова связ- связность полностью определяется уравнениями C.29). Результаты Пред- Предложений 2.13.2 и 3.3.1 позволяют переписать эти уравнения в базе так: 0, C.32а) Т(Х, У) = Vxy - VYX - [X, У] = 0. C.326) Применяя операцию ковариантного дифференцирования к функции g(X,Y) и учитывая C.32а), получим Xg(Y, Z) = g (VXY, Z) + g (У, VXZ) . Проводя в этом равенстве циклическую перестановку X, У, Z, складывая полученные равенства с соответствующими знаками и учитывая C.326), получим C.31). ? Поскольку кручение римановой связности по определению исче- исчезает, эта связность характеризуется только кривизной. А именно, для нее можно определить ковариантное тензорное поле степени 4, называемое тензором римановой кривизны: ЩХиХ2,Х3,ХА) = д (R(X3,X4)X2,Xt) . Это тензорное поле обладает целым рядом симметрии (см. [КН]), которые следуют из определений кривизны C.106) и C.116), а также из тождества Бьянки для формы кривизны C.8а). Если в окрестности U С М введены локальные координаты {ж1}, то рассмотренные здесь формулы можно записать в привычной компо- компонентной форме. Так, условие метричности связности C.29а) и C.32а) сведется к Vtffc/ = gki-i = 0.
92 Глава 3. Линейные и римановы связности Требование исчезновения кручения C.296) и C.326) означает просто симметричность символов Кристофеля, Т'к1 = Т)ь. В этом случае формула C.31) приведет к стандартному выражению для символов Кристофеля римановой связности через метрику: Г'*; = -gtm(dkgim + di9km - dmgki)- С их помощью из C.116) получается стандартное выражение для ком- компонент тензора кривизны. Компоненты тензора римановой кривизны выражаются через эти компоненты по формуле Rijki — д%тЩы- Сво- Сворачивая тензор римановой кривизны с метрическим тензором, можно построить тензор Риччи 1Цк = glmRumk и скалярную кривизну R = дгкЯ,к- Отметим в заключение, что формулы C.11) и C.31) являются наиболее общими формулами для тензора кривизны и ковариантной производной римановой связности. Они позволяют получить выражения для символов Кристофеля и тензора кривизны и в неголономном (некоординатном) базисе.
Глава 4 Геометрическое описание калибровочных полей и полей материи § 1. Калибровочное поле как связность в главном расслоении В главе 1 изложен стандартный подход к описанию калибровочных полей и взаимодействий. В рамках этого подхода калибровочное поле является векторной функцией в пространстве-времени М со значениями в алгебре Ли д калибровочной группы G. При этом конфигурации А, отличающиеся на калибровочное преобразование, считаются физически эквивалентными. Поэтому для того, чтобы учитывать только физически различные конфигурации (это, например, важно при вычислении функ- функциональных интегралов), необходимо выбрать представитель на каждой орбите калибровочной группы, т. е. фиксировать калибровку. Наше рассмотрение будем в основном чисто классическим. Мы не будем рассматривать функциональный интеграл и диаграммы Фейнмана, а изложим основные идеи, лежащие в основе геометрического подхода, установим его связь с обычным подходом и переформулируем основные свойства калибровочных теорий на геометрическом языке. Некоторые замечания о квантовой теории в рамках геометрического подхода будут приведены в §4. Исходным пунктом геометрического подхода (см. [КП], [ДМ], [Тр1], [ДВ], [ЕГС], [НС]) является понимание того, что задание калибро- калибровочной теории с калибровочной группой G (будем считать ее компакт- компактной) следует начинать не с выбора лагранжиана калибровочных полей на многообразии М (dimM = п), играющем роль пространства-времени, а с выбора геометрии главного расслоения P(M,G), объединяющего в себе пространственно-временные и калибровочные симметрии теории. Вместо задания конфигурации калибровочного поля на М в обычном подходе здесь первичным является глобальное задание связности Г в Р
94 Глава 4. Геометрическое описание полей или формы связности ш связности Г. Только после этого можно присту- приступить к конструированию лагранжиана теории из геометрических величин (форма связности ш, форма кривизны П), руководствуясь при этом как физическими принципами, так и математическими соображениями. В § 1—6 мы будем рассматривать чисто калибровочные теории (без полей материи) со стандартным лагранжианом L- rtrQA*H. D.1) При этом действие задается формулой 1 г J L= 5 = ^oT(G) J 4e4o\ п 4e2vol(G) v ' 4e2\o\(G) р G)J . Л *U. D.2) Здесь е — калибровочная константа связи, vol(G) — объем калибровоч- калибровочной группы G, а след берется в алгебре Ли g группы G. Мотивировка такого выбора L и 5 будет приведена в § 3 и § 4. Как этот подход соотносится со стандартным? Прежде всего мы от формы связности ш перейдем к 1-форме на базе М (на пространстве- времени). Для этого выберем локальное (если P(M,G) нетривиально) сечение s над окрестностью U С М, s : U —> Р и определим форму A(s) на U со значениями в алгебре Ли д: A{s) = в*ш. D.3) Если {жм} — локальные координаты в U и fM = dp = d/dx11 — локальный базис векторных полей, то калибровочное поле в стандартном подходе (как g-значная функция на U) равно: А(;\х) = А(х'%), xeU. D.4) Так как в выбранных координатах любая 1-форма может быть записана в виде разложения по базису {dx11}, то A{s) = A(;)(x)dxfi. D.5) Очевидно, что функции А^\х) могут быть еще разложены по базису {Qa} в алгебре д: А^}(х) = A^)a(x)Qa, где А(?)а(х) — обычные числовые функции на U, а а — калибровочный (цветовой) индекс. Пусть, как и выше, С1 — форма кривизны формы связности ш. С помощью выбранного сечения s мы можем определить 2-форму на U F(s) = s*u. D.6)
§ 1. Калибровочное поле как связность в главном расслоении 95 В локальной координатной системе F? = \в${х)Ы Л dx\ D.7а) F$(x) = &%,&). D.76) Установим связь между формами F(s) и ЛE) и их компонентами F$ и А^\ Для этого воспользуемся структурным уравнением B.74): 1 F(s) = s*u = s*Du = s* (dw + -[w,u;]) = = d(s*u;) + l- [s*u>, s*u] = dA(s) + X- [A(s\ A(s)], D.7b) так как s осуществляет изоморфизм из U С М в s{U) С Р. Вычислим те- теперь dA(s), используя свойства операции внешнего дифференцирования и D.5) dxp) T л \ Так как [ji?\ 4'}] (^,6) = ^^(х),^^*)], то ls)] D.8) ), Als)(x)] . Чтобы величины А]!\х) и FJ^ можно было отождествить с компонентами калибровочного поля и тензора напряженности, нужно выяснить, чему в геометрическом подходе отвечают калибровочные преобразования, и показать, что А(р(х) и jF^ преобразуются при этом по формулам A.7) и A.10). Мы сделаем это в §2, а здесь будем считать этот факт установленным. Остановимся теперь более подробно на локальных представлениях для формы связности ш и формы кривизны п. По определению главного расслоения (см. §5 главы 2) тг~'(?/") ~ U x G, т. е. %(р) = (тг(р), (р(р)) для р ? ir~\U), где % — диффеоморфизм, а <р — отображение из ir~l(U) в G. Как и в § 10 главы 2, выберем в качестве базиса векторных полей в ж~1A1) фундаментальные векторные поля А*а, а = 1,2,...,к = dimB, ({Аа} — базис в д, А*а = (т{Аа), где а — изоморфизм g на пространство
96 Глава 4. Геометрическое описание полей касательное к слою, индуцированный правым действием Фа группы G на слое) и поля ? , \i — 1,2,...,п = dimM, которые мы сейчас определим. В дальнейшем в этом параграфе мы будем отождествлять р ? tt~\U) с х(Р) = (х,9) € U х G. В каждой точке р — (ж,a) G n~](U) введем вектор (^/1)(Х,а)) касающийся подмногообразия U х {а} С v~\U) (а — фиксированный элемент из G) такой, что тг'(^) = ?м. Другими словами, (?м)(х,а) = s'atp, где отображение sa : х € М —»• (ж, а) G J7 х {а} С 7r"'(i7) — сечение в tt~[(U), a ^ — векторное поле, введенное выше (см. D.4)). Тогда любое векторное поле L G X(ir"\U)) представимо в виде _ L = C*A*a+C%. D.9) В частности, горизонтальный лифт ^ поля ?м запишем следующим образом: _ * . D.10) (ср. B.68)). Задание связности Г (т. е. горизонтальных подпространств) осуществляется заданием функций В%(х,д). По определению формы связности ш(А*а) = Аа. Так как этому же свойству удовлетворяет форма щ = <р*в, где отображение <р : n~{(U) —* G входит в определение диффеоморфизма х- а ^ — каноническая левоин- вариантная 1-форма на группе G, то ш = шо + Q^dx11. Здесь (dx^x^g) — ковектор, дуальный к (^)(г,5) : dx11^,,) = 6%. Из условия о;(^*) = 0 и D.10) получаем, что ш = шо + В, D.11а) В{х,д) = Bll(x,g)dxtl = Bfa,g)Aadxfi. D.116) Отметим также, что форму щ часто записывают в виде Щ = <р(р)~* dtp(p); D.11 в) если группа G реализована матрицами, то эта запись имеет буквальный смысл. Для того, чтобы выяснить характер зависимости В^(х,д) от д G G, вычислим величину (ФаШ)(г,5)(ж). Согласно Предложению 2.10.1 она должна равняться ad(a~l)u^^)(x). Для формы ш0 это свойство вытекает из Предложения 2.6.1. Это свойство будет выполняться для формы ш D.11), если g-значная функция Вм(х,д) удовлетворяет условию: l)Bll(x), D.12)
§ 1. Калибровочное поле как связность в главном расслоении 97 где мы обозначили В^(х) = В^(х,е) (е — единица группы). Если мы выберем в ir~}(U) сечение sa, то соответствующая 1-форма на М, задающая калибровочное поле, равна 4*в) = (*». = D«0)« + Вц(х, a){s*adx^)x = Вр(х, a)dxM, D.1 За) так как «а(^'')(г,в) = dx1*, и, следовательно, В/,(х,а) = А1*'\х). D.136) Вычислим теперь форму кривизны Q. Используя D.11а, б) полу- получаем dw = dw0 + d(ad(g~])Aa)B^(x)dx>i + ad(g~l)dB. Учитывая, что каноническая форма на группе G в = д ' dg, легко убедиться в том, что d(ad(g-l)Aa) = -[6,ad(g-])Aa], D.14) где д EG. Подставляя выражение для dw в структурное уравнение B.74) и используя D.14) и уравнение Маурера—Картана B.46а), находим, что -Slllv(z,g)dx'1Adz1', D.15a) м 1 I = Qlu>(x,e). D.156) Аналогично D.7в), D.8) %Лх) = д„ВАх) - dvBplx) + [Вм(х), В Ах)] . D.16) Очевидно, что компоненты тензора напряженности Fp\x) = ad(o"' )п„Ах) = П^(х, а). D.17) Пусть на многообразии Р задана метрика j и индексы М,N,... пробегают значения 1,2,..., D = dim Р = dim М + dim G. Запишем, как в §4 главы 3, метрику j с помощью ортонормированного корепера {еА} j = vAB{eA®eD), D.18) где v — плоская метрика и А, В = 1,2,..., D — внутренние индексы. Условимся считать, что первые п значений индекса А, А = \х — 1,2,...,п = dimM, нумеруют координаты вдоль подмногообразий вида U х {а} С тг~'({/), а следующие к значений А — п + а, а = 1,2,... ,fc = dimG — координаты вдоль слоя. Предположим, что сигнатура метрики 4 Зак. 311
98 Глава 4. Геометрическое описание полей следующая: signjMN = (—> +,+>•••> +). т. е. vab — диагональная матрица с v\\ = — 1, Uaa = 1 ПРИ Л ^2. Форму кривизны D.15) можно записать в виде 1 " П = г Z) ПАВел Л ев. D.19) Вычислим форму *П степени (D — 2), дуальную в смысле Ходжа к ft. По формулам C.26) имеем 1 " ^ (еЛ Л е*) = А,В=\ __ A.-.Ae^. D.20) 3=1 Тогда лагранжиан D.1) равен п ,g)vACvBDdvP, D.21) 1 1 " где dvp — инвариантный элемент объема в Р. Из D.156) следует, что выражение D.21) не зависит от д. Так как dvp = dficdvM, dv^ — инвари- инвариантный элемент объема в М, due — инвариантная мера интегрирования группы G и vol(G)= I dfiG, G то вклад в действие D.2) от подрасслоения v~l(U) С Р, U С М, равен S {^) dvM. D.22) и В силу соотношения D.17) получаем, что (^) dvM, D.23) т.е. мы получаем стандартное выражение A.11) для действия в калибро- калибровочной теории Янга—Миллса. Как уже обсуждалось в § 14 главы 2, могут существовать тополо- топологически неэквивалентные главные расслоения Р —> М с одной и той же базой М и одной и той же структурной (калибровочной) груп- группой G. Пусть мы имеем расслоения со структурными группами GL(k,C)
§ 1. Калибровочное поле как связность в главном расслоении 99 или U(к). Такие расслоения характеризуются классами Черна. Выясним, как эти классы выражаются через напряженность калибровочного поля FJfJ(x) в U С М. Напомним, что характеристические классы задаются с помощью мультилинейных инвариантных отображений / € Ik(G). Фор- Форма /(ft), являющаяся проекцией 2ft-формы /(П), согласно Предложению 2.14.1 определяется так 7@)(Х, ,...,*») = ЯП) (Llf..., L2k) . Здесь Xix е ТХ(М), 2^, е ТР(Р), где тг(р) = х и *%, = Х,г. Выберем в качестве точки р точку s(x), где s : М —> Р — сечение над U, а в качестве Lis(X) — касательный вектор s'X,-z. Это возможно, так как тг о 5 = 1йц — тождественное преобразование и tt's'Xj = X*. Получаем, что J(u)(Xb...,X2k) = /(П) (s'Xu...,s'X2k) = s*f(u) (Xb...,X2fc) = = / (e*0) (X,,..., X2t) = / (F(s)) (X,,..., Xlk) , D.24) где мы воспользовались мультилинейностью отображения /. Тогда, на- например, в случае dimM = п = 4 интеграл B.108), определяющий второе число Черна С2(Р), разбивается на сумму интегралов по окрестностям U С М и вклад каждой из таких окрестностей равен С2(Р)и = / с2(Р) = -^ / [tr (F(s) A F(s)) - UF(S) A tr FE)] . D.25) В частности, если Р — инстантонное расслоение Р (S4,517B)) (см. пример 8 из § 7 главы 2), то {$)D.26) и где U — одна из окрестностей, покрывающих 54, a F$ есть тензор дуальный к F$, т.е. компоненты 2-формы *F(s} на базе: *F{S) = t-Ffidz!1 A dx\ D.27a) D.276) Таким образом, калибровочная теория в пространстве-времени М с кали- калибровочной группой G, как говорят, разбивается на множество секторов, каждому из которых отвечает расслоение P(M,G) с определенными характеристическими числами, и для полного изучения всей теории надо рассмотреть все секторы. Стандартная теория возмущений, как правило, описывает поля в секторе с тривиальными характеристическими числами.
100 Глава 4. Геометрическое описание полей §2. Калибровочные преобразования Пусть U — окрестность в М, s : U —* P(M,G) — локальное сечение, a A^s) и F(s) формы на U, определенные по ш и il с помощью этого сечения. Предположим теперь, что в U задано также другое сечение t. Выясним вопрос, как связаны между собой 1-формы A(s) и A(t) и 2-формы F(s) и F(t). Очевидно, что существует отображение (калибровочная функция) д :U —* G такое, что Цх) = *дМ8(х). D.28) Возьмем касательный вектор X € ТХ(М), х G U и обозначим Х$(Х) и ?д(Х) касательные векторы в ж~х{17) и G: XS(X) = s'X ? TS(X)(P), €д(х) = </Х € Tg(X)(G), где д' — производная отображения д : U —> G. Пусть A G 0 — левоинваринтиое векторное поле на G, которое равно д'Х в точке д(х). Введем отображение х '¦ Р х G —* Р вида Мы рассмотрим это отображение в точке (s(x),g(x)) и определим связанные с ним отображения Х\ ¦ Р ~* Р н X2-G —>Р так: X (У,^(^)) = ЪЯ(х)Р, V € Р; D.29а) Х2(«') = X (*(«),«') = *«'«(«), a' G G. D.296) Тогда сечение ^(z) = х (s(x)> 9(x)) ¦ Обозначим через Z(S(X)^X)) каса- касательный вектор из Tislx)ig(X))(P х G), соответствующий (Xs(xh€g(x)) e 2^(г)(Р) Ф Tg(X)(G) (см. §4 главы 2). Согласно Предложению 2.4.1 (фор- (формула Лейбница) t'(X) = x'(Z) = Х\ (X) + хШ D.30) Из D.29) следует, что %', = Ф^A), a x'i есть гомоморфизм <т3(х) из алгебры Ли g в касательное пространство к слою в точке s(x) ? Р (см. §5 главы 2), т.е. XiiO = <rS(X)Z = (Osw D.31) есть фундаментальное векторное поле. Вычисляя форму ш от обеих частей D.30), получаем шЦ'Х) = и> (9'9(x)s'x) + и>(О = ad (g(x)-])w(s'X) + f, D.32) где мы воспользовались результатами Предложения 2.10.1. По определе- определению левоинвариантной канонической 1-формы группы G мы имеем: в(д'Х) = 0@ = ?. D.33)
§2. Калибровочные преобразования 101 Учитывая D.3), D.32) и D.33), получаем окончательное соотношение между формами, определенными с помощью различных сечений: A{t) = t*u> = ad (д(хГ') AU) + д*в. D.34) При матричной реализации группы G форма д*в может быть записана в виде (см. B.48)) д*в = д(хГ]Aд(х), D.35) где д(х) — значение калибровочной функции д : U —+ G в точке х € U. По определению dg(X) — Х(д) для X G Х(М). Компоненты калибровочного поля А^ и A{j? связаны следующим соотношением: Af(x) = ad (<7(*Г') А{;\х) + д(х)-1д„д(х), D.36) т.е. мы получили формулу для калибровочного преобразования поля A.7). Так как касательный вектор Хг(?) в D.30) вертикален (см. D.31)), а форма кривизны п является тензориальной формой типа (ad,g) (см. § 11 главы 2), то формулы для 2-формы F(I) и компонент напряженности FJfJ, аналогичные D.34) и D.36), имеют вид Fi^ad^r1)^, D.37а) FJS = ad (g(x)-})F$(x). D.376) Наши рассуждения показывают, что выбор локального сечения s:P-»P соответствует фиксации калибровки для полей, заданных на U в стандартном подходе. Переход от одного сечения к другому эквивалентен калибровочному преобразованию и переходу к другой ка- калибровке. Невозможность выбора в общем случае глобального сечения в P(M,G) означает невозможность задания калибровочного поля на всем пространстве-времени М глобально; мы вынуждены ограничиться локальными заданиями калибровочных полей на каждой карте много- многообразия М. В то же время форма связности ш определена глобально, во всем расслоении P(M,G). Она содержит в себе всю информацию о калибровочной конфигурации в теории и является исходным объек- объектом (наряду с расслоением P(M,G), отражающим структуру теории) в геометрическом подходе к описанию калибровочных теорий. Именно связность о», а не калибровочное поле А^\ наиболее удобна при изуче- изучении глобальных (геометрических, топологических и др.) свойств теории, так как позволяет проводить анализ во внутренних терминах, не прибегая к локальным координатным системам. Заметим, что формулы D.34), D.36), D.37) полностью согласуются (с учетом свойства D.12)) с выражениями для форм А($а) и FiSa) D.13)
102 Глава 4. Геометрическое описание полей и D.17), полученными для сечений специального вида: sa(x) = (x,a) G t _ .. Пусть теперь имеются две окрестности Ua и Up в М, в каждой из которых форма связности представима в виде D.11). Выясним, как связаны между собой функции В? и Bjf , характеризующие ш над окрестностями Ua и Up соответственно. Если Ха и хр — диффеомор- диффеоморфизмы, задающие локально структуру прямого произведения на Р(М, G), т.е. ха(р) = (*(Р),?>а(Р)) ДЛЯ р е ir~l(Ua) и хр(Р) = (ir(P),^(?)) ДЛЯ р G v~\Uf)), то (ppip) = <рра(х)(ра(р), где р е тг~' (Ua DUp), х = ж(р), 4>ра{я) — функция перехода (см. § 6 главы 2). Таким образом, для формы связности шв!'1 (Ua П Up) мы имеем два представления: ad (patoV) ^Ш l ad (см. D.11), D.12)). Так как ш однозначно определена на Р, то, используя связь между <ра и <рр, получаем, что я (х G Ua П Up), т.е. В^ и Бр связаны калибровочным преобразованием. Изучим теперь калибровочные преобразования для форм связно- связности. Обозначим через 21 пространство связностей главного расслоения P(M,G). Для дальнейшего нам понадобится понятие вертикального автоморфизма расслоения, которое мы сейчас определим. Отображе- Отображение vp : Р —* Р называется вертикальным автоморфизмом, если оно удовлетворяет следующим требованиям: (М) 2) vp коммутирует с Фа, т.е. Фа«р(р) = vp(9ap), для любого а € G. Из 1) следует, что vp сдвигает точку вдоль слоя. Очевидно, что вертикальный автоморфизм vp можно характеризовать отображением р: Р —* G таким, что vP(p) = Ф/Хр)?, D.38а) где Фа обозначает действие структурной группы, причем из условия 2) следует, что р(Фвр) = a-lp(p)a = S(a-l)p(p), a € G, D.386) т.е. р — эквивариантное отображение. Вертикальный автоморфизм vp порождает преобразование в 21 стандартным образом, а именно, если ш е а, то (у*ш) (X) - и? (v'pX) е а, где х е г,(Р), р е р, р' = vp(p).
§ 2. Калибровочные преобразования 103 Чтобы вычислить ь*ш, выясним сначала, чему равен касательный вектор (v'pX) .. Пусть / € $(Р), X — векторное поле, порождающее локальную однопараметрическую группу преобразований ipt. В соответствии с Пред- Предложением 2.4.2 поле v'pX порождается vpo<ptoVpl. Имеем следующую цепочку равенств: V (vp(p))) ) (p)) t=0 t=0 t=o t=o Итак, d <=o D.39) d + It Обозначим первое слагаемое в правой части равенства через р' — vp(p)- Векторное поле Y порождается однопараметрической груп- группой преобразований Ф/»о>)-'p(<pt(p)) и> следовательно, равно Y = (т(А) (см. §6 главы 2), где А — элемент алгебры Ли д, соответствующий однопараметрической подгруппе p~i(p)p(<ptp) в G. Тогда можно записать: d _. р *=о -1 . D.40) р) = (p-ldp)p(X) = (р*в Второе слагаемое в D.39) есть не что иное, как (iD1 Y\ I f\ \ pip) Jp1 \J '" Вычисляя форму ш от обеих частей равенства D.39), получаем (v*pw)p (X) = оу (v'pX) = и, (Ур.) + ш, (Ф^Х) = А + ad (р(рУ])шр(Х). Учитывая D.40), приходим к окончательной формуле: ьрш = ad(p -ь р ldp, D.41) которую обычно называют формулой калибровочного преобразования для форм. Как это преобразование соотносится с калибровочным пре- преобразованием для форм на базе, описывающих калибровочные поля? Пусть U — локальная окрестность в М, s — сечение в ir~l(U).
104 Глава 4. Геометрическое описание полей Если ш,ш' 6 21 и о/ и ш связаны калибровочным преобразованием vp, ш' = УрШ, то мы можем построить два поля на базе: Однако имеют место соотношения A'(s) = sV = s* о vpw =(vpos)*u) = t*w = A(t\ где новое сечение t определяется формулой t — vp о s. Следовательно, в соответствии с D.34) A(s) и Л'E) связаны калибровочным преобразо- преобразованием, соответствующим переходу от сечения s к сечению t = vp о s в ж~\Щ. Отметим в заключение параграфа, что локальное описание кали- калибровочных преобразований как переходов от одних сечений к другим, является более общим, чем описание калибровочных преобразований как вертикальных автоморфизмов, так как в общем случае может не су- существовать глобальных вертикальных автоморфизмов, характеризуемых отображением D.38). § 3. Электродинамика Максвелла В педагогических целях в качестве первого шага в изучении ка- калибровочных теорий в рамках геометрического подхода целесообразно рассмотреть частный случай электродинамики Максвелла. В качестве главного расслоения, на котором задается теория, мы возьмем триви- тривиальное расслоение Р — М4 х U(\), где М4 — пространство Минков- ского, т.е. пространство Ж4 с псевдоримановой метрикой, характери- характеризуемой в декартовых координатах диагональным метрическим тензором Vpv '• ^оо = — 1, Vu = I. Условимся считать, что индексы /х, v — 0,1,2,3; i,j = 1,2,3 и х° — временная координата. Пусть группа G — U(\) реализуется элементами вида д = ехр(ш), a G Е. Так как в расслоении Р существует глобальное сечение, скажем s(x), то рассмотрение теории в Р эквивалентно ее рассмотрению в базе Мл в терминах форм A(s) и F(s). Мы условимся дополнительно выделять мнимую единицу из этих форм так, что закон калибровочного преобразования для A^s) в соответствии с D.36) будет иметь вид: 4S>) = 4f) + da(x), D.42) где а(х) — вещественнозначная функция на М4, задающая калибровоч- калибровочную функцию д(х) = ехр(т(ж)). Согласно D.37) 2-форма Fu) в нашем
§ 3. Электродинамика Максвелла 105 случае калибровочно инвариантна. В дальнейшем значок (s) мы будем опускать. В соответствии с D.4) и D.7) Ах = Ар{х)дяГ, D.43а) Fx = (dA)x = ^Flw(.x)dxlt A dxv. D.436) Напряженности электрического 2% и магнитного В, полей входят в 2-форму F следующим образом: Fx = Ei{x)dxi A dx° + -Bieijkdx? A dxk. D.43в) Для дальнейшего нам потребуется несколько новых определений. Пусть М некоторое псевдориманово пространство, а ш ? Dr(M) и fi Е Dr~l(M) — некоторые формы. Введем операцию 6, сопряженную к внешнему дифференцированию, следующим образом (о>, dfi) = / о/ Л *dfi = I дш Л *fi = Fш, fi), D.44) м м где как и в B.24) скобки (,) обозначают внутреннее произведение форм на М. Из D.44) ясно, что 6 : Dr(M) —»• Dr~\M). Нетрудно показать, что если ш € DT(M), то 6ш = е(-1 )"г+"+' * d(*u), D.45а) 66ш = 0, D.456) где е = ?|?2...е„ — произведение факторов, задающих сигнатуру ме- метрики на М: sign7 = (?|,?2,..-,?п) (см. §4 главы 3)ип = dimM. Так же как и в случае внешнего дифференцирования, действие операции 6 на формы сводится к стандартным операциям тензорного исчисления на коэффициенты этих форм (задача 4.3). Определим теперь лапласиан (оператор Лапласа) Д = {d + бJ = d6 + 6d, где мы учли, что dd = 0 и 66 = 0. Очевидно, что Д : DT(M) —» DT(M). Форма ш называется гармонической, если Аш = 0. Так как (о», Да») = (ш, d6u)) + (ш, 6dw) = Fш, 6ш) + (du>, do»), то условие гармоничности формы равносильно условиям замкнутости (do» = 0) и ко-замкнутости Fш = 0) этой формы. Вернемся теперь к электродинамике. Введем 1-форму Зх = ji(x)dx{ + p(x)dx°, D.46)
106 Глава 4. Геометрическое описание полей где j(x) и р(х) играют роль плотности тока и плотности заряда соответ- соответственно. Нетрудно показать (задача 4.3), что уравнения 6F = -j, D.47а) dF = 0 D.476) (последнее из них есть тождество Бьянки B.78) в случае абелевой группы G) сводятся к стандартным уравнениям Максвелла на Е и В: divE = +p, 0oE-rotB=j, D.48a) div В = 0, д0В + rot E = 0. D.486) Из уравнения D.47а) и свойства D.456) следует, что 62F = -6j = -* d(*j) = 0, D.49) где 3-форма *j в локальном базисе имеет вид (*j)x = -p(x)dxl Л dx2 Л dx3 + -eillvpji(x)dx>1 Л dx" Л dxp. D.50) Тождество D.49) эквивалентно уравнению непрерывности для тока в стандартном подходе: -дор + div j = 0. D.51) Покажем, как из D.49) в случае, когда ток j = 0, следует за- закон сохранения заряда. Пусть D — некоторый объем в трехмерном пространстве. Возьмем четырехмерное подмногообразие V С М4, пред- представляющее собой цилиндр, у которого ось и образующие параллельны временной оси, а верхние и нижние основания суть многообразия D, отвечающие моментам времени х° — t\ и х° = ti\ обозначим эти осно- основания D\ и Z>2- Используя теорему Стокса B.101), представление D.50) и тождество D.49), получаем: 0=[ d(*j) = - I p(x) dx1 Adx2 Л dx3 = v av = -Jp(x)dx + J p(x)dx = -Q(t2) + Q(tx), D2 D, где Q(t2) и Q(t\) — заряды внутри D2 и D\ соответственно. Сделаем еще два замечания о свойствах формы F. 1) Если 1-форма j = 0, то из D.47) следует, что 6F — dF = 0 и форма F является одновременно замкнутой и ко-замкнутой. Следова- Следовательно, AF — 0, т. е. F — гармоническая 2-форма.
§ 3. Электродинамика Максвелла 107 2) Пусть М = Е". Тогда, согласно лемме Пуанкаре (см. §14 главы 2), только из условия замкнутости формы F D.476) следует, что она является точной, т.е. существует форма А ? D^M") такая, что F = dA. Другими словами, в этом случае всегда существует вектор-потенциал Ai(x) (i = 1,2, ...,те), соответствующий 1-форме А — Aidx1. Отметим, что эта форма определена с точностью до внешнего дифференциала df функции / на R". Вернемся теперь к электродинамике и обсудим вопрос о выборе лагранжиана и действия. Сначала рассмотрим случай чистой электро- электродинамики, когда отсутствуют поля материи. В рамках геометрического подхода лагранжиан должен представлять собой форму четвертой степени на М = М4, построенную из А и F и форм, полученных из них с помощью операций *, d, б. Из физических соображений лагранжиан должен быть калибро- вочно-инвариантным и содержать часть, квадратичную по А, которая отвечает свободному лагранжиану. Так как для электродинамики фор- форма F калибровочно-инвариантна, то лагранжиан должен строиться из F и *F. Нетрудно проверить, что существует лишь две 4-формы, удовле- удовлетворяющие перечисленным выше требованиям: Aii = F A *F, D.52а) H2 = Ff\F. D.526) Эти формы отвечают двум инвариантам электродинамики Е2 — В2 и ЕВ: Ml = -(В2 - E2)dx° A dx] Л dx2 A dx3; \i2 - -2ЕВ dx° Adx* Adx2 A dx3. Форма Ц2 является точной: fi2 = F A F = dA AdA = d(A A dA) + A A ddA = d(A A dA) D.53) и не может служить лагранжианом теории, так как приводит к по- поверхностным членам в действии. Действительно, интеграл от /Х2 по многообразию М сводится к интегралу по дМ, который равен нулю, если, как обычно, предполагается, что компоненты А^(х) формы А достаточно быстро убывают на бесконечности. Следовательно, лагран- лагранжиан чистой электродинамики пропорционален Ц\ (ср. D.1), D.2), Пусть теперь в теории имеются поля материи, порождающие сохраняющийся ток j. Единственной 4-формой, описывающей взаимо- взаимодействие электромагнитного поля с током линейное по полю, является форма Из = A A *j = *А A j.
108 Глава 4. Геометрическое описание полей Полное действие теории имеет вид: 5 = - IF A *F + I *A Л j. D.54) м4 м* Калибровочная инвариантность второго слагаемого в действии вытекает из следующей цепочки равенств / *(А + da) Aj = I *А A j + I *da Л j = / *A A j + I *aA6j M* M4 M4 Af4 Af4 и уравнения непрерывности тока D.49). Можно показать, что уравнение D.47а) получается при варьировании действия D.54) (задача 4.5). § 4. Неабелевы калибровочные теории В этом параграфе мы вначале обсудим свойства классической неабелевой калибровочной теории в рамках геометрического подхода. Схема рассмотрения будет аналогична схеме предыдущего параграфа. В качестве главного расслоения, на котором задана теория, возьмем Р = М4 х G, где М4 — пространство Минковского, a G — калибро- калибровочная группа. Очевидно, что рассмотрение будет справедливым и для нетривиальных расслоений P{M,G) при условии, что мы работаем в локальной окрестности U С М. Глобальные свойства калибровочных теорий для некоторых нетривиальных расслоений будут изучаться в сле- следующих параграфах. Итак, в нашем случае, так же как и в предыдущем параграфе, анализ можно проводить в терминах форм Аи) и F{s) (см. D.4) и D.7)) на базе; значок (s) при этом будем опускать, Fx = (DA)X = (dA)x + -[AX,AX] = -FfiV(x)dxli A dxl'. d 2 [AA] - 2m Уравнения движения в теории Янга—Миллса в стандартном подходе соответствуют следующим соотношениям на форму F (ср. с D.47)): D*F = d(*F) + [A,*F) = -*j, D.55а) DF = DDA = dF + [A, F] = 0, D.556) где форма j, описывающая ток, задается формулой D.46), обобщенной очевидным образом на случай неабелевой калибровочной группы. Равен- Равенство D.556) представляет собой тождество Бьянки (см. B.78)). Из D.55а) следует, что d(*j) + d([A,*F])=0. D.56)
§ 4. Неабелевы калибровочные теории 109 Первое слагаемое в этом равенстве соответствует дивергенции 4-вектора тока (ср. D.49) или D.51)). Второе слагаемое указывает на то, что само неабелевое калибровочное поле переносит заряд. Так как законы калибровочных преобразований для форм А и F имеют вид D.36) и D.37), то действие и лагранжиан для чисто калибровочной теории, удовлетворяющие требованиям, перечисленным в предыдущем параграфе, могут быть построены только из следующих 4-форм: Hi =ItFA*F; D.57a) fi2 = trFAF, D.576) где след вычисляется от элементов алгебры Ли д группы G. Можно показать, что форма ^ является точной (задача 4.6). А именно, trF A F = dtr(a A dA + -А А [А, А]). Если форму А разложить по базису {Qa} (« = 1,2,... ,dimG) алгебры Ли g калибровочной группы G, нормированному условием tr(QaQp) = то имеет место соотношение trF A F = d(сс ^2 А° А dA" + ~Cg X) C^iA<X A АР А Al)' D-58a) где Сру — структурные константы группы G, антисимметричные по всем индексам. В частности, если G = SUB) и Qa = ^та, где та — матрицы Паули, то CG = -~, С^ = eafh и trF A F = --rfBD A" A dA<t + ~ Y2 e<*frAa A aP a АЛ¦ D-586) Итак, лагранжиан чисто калибровочной теории пропорционален фор- форме fi] и мы выбираем его в виде L= -trFA*F; D.59a) 4е2 при этом действие равно S = --^\\F\\2 = -~(F,F) = --^ [ixFA*F D.596) 4ег 4ег Ае1 J
110 Глава 4. Геометрическое описание полей (см. D.1), D.2), а также D.21)-D.23)). Здесь е — калибровочный заряд теории. Взаимодействие калибровочного поля с полями материи обычно строится минимальным образом через ковариантную производную; этот вопрос мы обсудим в § 7 настоящей главы. Теперь мы кратко остановимся на формулировке квантовой кали- калибровочной теории в рамках геометрического подхода. Квантование кали- калибровочных теорий удобнее всего проводить с помощью метода функци- функционального интегрирования, который позволяет осуществить квантование глобально. В настоящее время математически удовлетворительная теория существует лишь для функциональных интегралов в евклидовых про- пространствах, т. е. в пространствах с сигнатурой метрики (+,..., +). При этом физические результаты получают аналитическим продолжением результатов интегрирования из К4 в М4. Подробное изложение матема- математической теории функционального интегрирования для скалярных полей можно найти в монографиях [Сай], [ГД]. Пусть имеется калибровочная теория, заданная на главном рас- расслоении Р(М, G); здесь М — произвольное евклидово пространство. Согласно постулату квантования с помощью функционального интегра- интеграла вакуумное ожидание наблюдаемой величины /(ш) (из физических соображений она должна быть калибровочно инвариантной) дается вы- выражением fe-s<»>№{dw} а <460) я Здесь 21 — пространство связностей главного расслоения P(M,G), вве- введенное в §2, S(w) — действие D.2) на форме связности ш, {du} — мера интегрирования на 21. Для того, чтобы сделать выражения типа D.60) осмысленными, приходится вводить регуляризацию. Обычно при строгом анализе свойств евклидовых функциональных интегралов вво- вводится решеточная регуляризация, те. осуществляется переход от теории в непрерывном пространстве-времени М к теории в дискретном про- пространстве. Математически строгие результаты, касающиеся построения и свойств калибровочных теорий, изложены, например, в книге [За] и обзоре [БД]. Величины Б(ш) и f(w) в D.60) калибровочно инвариантны. Поэтому функциональные- интегралы в этом выражении можно пере- переписать в виде интегралов по калибровочно-неэквивалентным формам связности. Пусть С — группа вертикальных автоморфизмов расслое- расслоения P(M,G), т.е. группа локальных калибровочных преобразований, действующих на 21. Фактор-пространство т/ — 21/С называется про- пространством калибровочных орбит или пространством модулей. Таким
§ 4. Неабелевы калибровочные теории 111 образом, пространство 21 оказывается бесконечномерным расслоением (не обязательно главным) 21 —> rj. При квантовании калибровочных теорий в рамках стандартного подхода фиксируют калибровку. На геометрическом языке это соответ- соответствует выбору сечения s : rj —> 21 в расслоении 21 —» г). Интегралы в D.60) записываются в виде интегралов по s(t]) = rj f где a — координаты на s(rj), а фактор Д есть детерминант Фаддеева— Попова, возникающий при замене переменных из —* <т. Укажем некоторые проблемы, возникающие при таком методе квантования. В формуле D.61) молчаливо предполагается, что сечение s(tj) пересекает каждую орбиту в 21 и причем только в одной точке. Однако, как было показано в работе [Зи] для калибровочной теории на М = S4 (или S3) с неабелевой компактной калибровочной группой Ли расслоение 21 —* т; нетривиально и не существует непрерывного глобального сечения s : ту —*• SI, т.е. нельзя однозначно определить глобальную калибровку. Сечение, отвечающее любому калибровочному условию и проходящее через точку ш ? 21, пересекает орбиту (слой), содержащую ш, в бесконечном количестве точек (см. рис. 4.1 б). Это явление получило название неоднозначности Грибова, так как впервые было замечено Грибовым в 1977 г. (см. [Гр]) при анализе SUB)- калибровочных теорий в М = М4 в случае кулоновской калибровки. При этом накладывались дополнительные условия на бесконечности, что фактически замыкало М в сферу S4. Для неоднозначности Грибова существенными являются топологические свойства пространства М. Так в евклидовом пространстве К4 существует непрерывное глобальное сечение. Возникает естественный вопрос: так как выражение D.60) хорошо определено после введения решеточной регуляризации, а переход к D.61) наталкивается на серьезные трудности, то нельзя ли квантовать калибро- калибровочную теорию на основе представления D.60), не фиксируя калибровку. Оказывается (см. [БД]), что фиксация калибровки необходима для фор- формулировки теории возмущений по малой константе связи е (см. D.2)). Теория возмущений, в свою очередь, необходима нам для установления связи со стандартной физикой, особенно в вопросах перенормировок. Однако, было показано, что для формулировки теории возмущений достаточно локальной фиксации калибровки, т.е. локального сечения расслоения 21 —»¦ т), и топологические свойства М роли не играют.
112 Глава 4. Геометрическое описание полей § 5. Магнитный монополь Дирака Вначале напомним, как вводится монополь Дирака в рамках стан- стандартного подхода (подробнее см., например, [ЧЛ] или [Со]). Уравнения электродинамики D.47) в пространстве Минковского М4 допускают следующее симметричное обобщение: = /; D.62а) dflF"l/ = f, D.626) где Ff,v — тензор, дуальный к F^ (см. D.276)), f = (p,j) — 4- вектор электрического тока, a f = (p,jf) — 4-вектор магнитного тока. При этом предполагается, что существуют (экспериментально пока не обнаруженные) магнитные заряды или монополи и р есть их плотность. Учитывая, что F^ = д^А„ — д„Аи, нетрудно показать, что для того, чтобы удовлетворялось уравнение D.62) с магнитным током f Ф О, необходимо, чтобы дрдуАр Ф дудрАр в тех точках, где магнитный ток f Ф 0. Это означает, что потенциал А^(х) сингулярен в М4. Если мы имеем точечный статический магнитный монополь с магнитным зарядом qm, расположенный в начале координат (х = 0), то напряженность его магнитного поля равна ^ D.63) и может быть представлена с помощью вектор-потенциала А^, например, следующим образом: В{ = (rotA){ - qm(-x3N(xlN(x2)x36i3. При этом вектор-потенциал Ац в сферической системе координат (г, в, ip) равен: . „ к Чт 1 -cos0 qm в Ао = 0, А = е^ —— = е^ -— tg -, D.64) r4nr sin^ Мтгг 2 4nr sin^ Мтгг и сингулярен вдоль отрицательной полуоси ж3. Эта линия сингулярности называется дираковской струной. Заметим, что потенциал А D.64) равен потенциалу поля, создаваемого бесконечно длинным тонким соленоидом, расположенным вдоль дираковской струны, положительный полюс которого с магнитным зарядом qm находится в начале координат. Кроме того, как было показано Дираком, заряд qm может принимать только дискретные значения Ят = ЯоЩ D.65)
§ 5. Магнитный монополь Дирака I i 3 где <7о — наименьший магнитный заряд, an — целое число. Рассматривая электрически заряженные частицы в поле магнитного монополя, можно показать, что qo связано с наименьшим электрическим зарядом ео соотношением 2тг <7о = —Щ, ео щ — целое число. На этом мы закончим краткое введение в теорию магнитного монополя Дирака в рамках стандартного подхода и перейдем к описанию того же объекта, но на геометрическом языке. В методических целях нам удобнее сначала рассмотреть магнитный монополь на сфере S2. Будем считать, что радиус сферы равен г (г > 0), а в и (р @ ^ 0 < тг, 0 < <р < 2тг) — обычные сферические координаты. Элементы калибровочной группы U(\) будем параметризовать так: д = expBiriip/qo), где qo пока некоторое число. Теперь рассмотрим главное расслоение Р = P(S2,U(l)) и зададим в нем связность, отвечающую монопольной конфигурации. Сделаем это локально. Для этого введем, как и в примере 7 §7 главы 2, две полусферические окрестности U+ и U-. в 52 так, что U+ П U- — Sl — экваториальная окружность в = |, параметризуемая углом <р. Пусть (в, <p,expBiriip+/q0)) — координаты в Р+ = *-\U+) *U+x Щ\), a {e,<p,expBnirl>Jq0)) - в Р_ = тГ1^-) = U-. х 1/A). По аналогии с тем, как это делалось в вышеупомянутом примере, можно показать, что tb_ -ф, 2тг— = 2тг— + п<р, D.66) 9о <?о где п — целое число, характеризующее способ «склейки» подмного- подмногообразий Р+ и Р- в единое расслоение Р. Зададим форму связности следующим образом: ш — \ I dip- + ш+ в Р+, +«! в р. D-67) где 1-формы ш± в Р± равны: и>± = — (± I - cos в) dip, D.68) 4тг a qm — некоторая константа. Здесь для удобства мы приняли следующее условие нормировки: ограничение формы связности ш на вертикальное подпространство равно ш0 = —i(qo/2n)g~]dg; такая нормировка допусти- допустима для G — 17A). Мы будем использовать одни и те же обозначения d0 и dip для форм в U± и в Р±; по смыслу всегда будет понятно, о каких формах идет речь. Выберем в Р+ и Р_ сечения s+ и s_ соответственно
114 Глава 4. Геометрическое описание полей следующим образом: в±(в,<р) — (e,<p,expBiriip±/qo)j G Р±, где ip± — фиксированная величина. Тогда 1-форма на S2, описывающая калибро- калибровочное поле, есть А± = ЛD±) = s±u»± = —(±1 — cosO) dip = D.69a) qm xldx2 — x2dxx 4тгг х3 ± г D.696) Здесь xl — координаты пространства R3, в которое погружена сфера S2, и г2 = (ж1J + (ж2J 4- (х J. Так как угол ip не имеет определенного значения в точках в = 0 и в — ж, то форма A+(AJ) регулярна в U+(U-), но сингулярна в точке в = п(в — 0). При в = чг ((в = 0)) х3 = —г (ж3 = +г) и сингулярный характер формы виден и из представления D.696). Поскольку калибровочная группа — абелева, то форма кривизны равна п = du) = dw± = ^P- sin Ode A dip. D.70) 4тг Она является замкнутой формой, но не является точной, так как формы du)+ и dw- заданы лишь локально, в Н+ и Н-. Из однозначности формы связности ш в Р+ П Р_ = тг~1(Н+ П HJ) и из соотношения D.66) следует, что формы ш+ и ш- должны быть связаны между собой в Р+ П Р- следующим калибровочным преобразованием: ш+ = и)- Н dip. Аналогичная формула справедлива и для А+ и4_. Учитывая представле- представления D.68), приходим к выводу, что параметр qm принимает дискретные значения qm = nqo, т.е. получаем формулу D.65). В § 14 главы 2 было показано, что расслоения Р (S2,U(l)) харак- характеризуются первым числом Черна, которое в нашем случае вычисляется по формуле СОР) = fCl(P) = -- [и, D.71) J qo J S2 S2 где п — проекция формы кривизны на базу. Различие между коэф- коэффициентами, стоящими перед интегралами, в формулах D.71) и B.109) объясняется различным выбором нормировок формы связности. Подста- Подставляя D.70) в D.71), получаем п Г = -— / si 4тг J dip = -n. D.72) s2
§ 6. Инстантоны 115 Рассмотрим теперь магнитный монополь в трехмерном евклидовом пространстве с выколотой точкой х = 0: М = Ж3 — {0}. В качестве двух координатных окрестностей в М выберем области Н+ = {х G М : ж3 > 0} и Н- = {х ? М : х3 < 0}. Их пересечение Н+ Л iT_ есть ж'ж2 — плоскость без точки (ж1 =0, х2 = 0). Зададим форму связности в Р (М,U(l)) формулами D.67) и D.68), 1-форма на базе, описывающая калибровочное поле, будет тогда иметь вид D.69), причем знаки + и — будут относиться к окрестностям Н+ и Н-. Проанализируем А+. Эта форма регулярна в Н+, в области своего задания, и описывает калибровочное поле вида D.64). В области Н- она сингулярна на отрицательной ж3-полуоси. Эта полупрямая и есть дираковская струна. Аналогичными свойствами обладает и форма Л_, но для нее дираковская струна совпадает с положительной ж3-полуосью. 2-формы F+ = dA+ и F_ = dA- совпадают друг с другом в Н+ П Н- и определяют единую форму F, описывающую напряженность поля: F = dA± = — sin в d6 A d(p = — -ецкх*&] A dxk. D.73) 4тг 87гг3 J Отсюда получаем, что напряженность магнитного поля монополя в М = Ж3 — {0} равна D.63). Следовательно, параметр qm играет роль величины магнитного заряда монополя, a q0 — наименьший магнит- магнитный заряд. Итак, как мы видели, поле точечного монополя Дирака однозначно задается своими значениями на сфере постоянного радиу- радиуса S2 с центром в точке, где расположен монополь, а целое число п, характеризующее величину магнитного заряда qm = nq0, есть взятое с обратным знаком первое число Черна, классифицирующее расслоения Р (S2,U(l)) (см. D.71, D.72)). В статье [Тр2] было отмечено следующее: так как когомологические классы для пространства М с евклидовой топологией тривиальны, то экспериментальное обнаружение монополя означало бы, что или пространство-время имеет неевклидову топологию, или описание электромагнетизма с помощью расслоенных пространств является неадекватным. §6. Инстантоны Формы связности, соответствующие калибровочным полям, удо- удовлетворяющим классическим уравнениям движения, оказываются точка- точками стационарности в пространстве 21 для функциональных интегралов типа D.60) и поэтому особенно важны при исследовании калибровочных теорий. Если такие классические решения найдены, и действие теории на этих решениях конечно, то мы можем дальше учесть квантовые флукту- флуктуации на фоне того или иного классического решения. Хотя физическим пространством-временем является пространство Минковского М4, для
] 16 Глава 4. Геометрическое описание полей нас важны классические решения калибровочной теории и в четырехмер- четырехмерном евклидовом пространстве К4. Они описывают квантовые туннельные переходы между различными вакуумами теории. Эти вопросы подробно обсуждаются в книгах [ЧЛ], [Ра]. Напомним также, что функциональ- функциональные интегралы в настоящее время удается строго определить лишь для евклидовых пространств (см. §4 главы 4). Решения классических уравнений движения с конечным действи- действием в евклидовом пространстве получили название инстантонов. Мы будем изучать инстантоны в чисто калибровочной теории Янга—Миллса с калибровочной группой G = SUB). Предположим также, что теория задана на сфере S4, которая связана с К4 стереографической проекцией из «южного полюса». Итак, рассмотрим главное расслоение Р (S4, SUB)); его свойства обсуждались в § 7 главы 2 (пример 8). Пусть U+ и U- — две четырехмер- четырехмерные «полусферы», покрывающие пространство М — S4, U+ Г) U- = S3 (будем считать, что U+ — «северная полусфера», а 1Г_ — «южная»), Х± — диффеоморфизмы, устанавливающие связь между точками в Р± = т~\и±) и парами (х,д) 6 U± x G, т.е. х±(р) = (*(р),<Р±(р)), р ? Р±. Функция перехода у>_+ = <p_(p)ip+(p)~l является функцией на многообразии U+ П V- = S3 со значениями в калибровочной группе G — SUB). Так как 53 диффеоморфно SUB), то функция перехода является отображением <р-+ : S3 = SUB) i-> SUB). Пусть 0,<p,ip — углы Эйлера @. ^ 0 ^ тг, 0 ^ <р < 2тг, 0^^>< 2тг), параметризующие многообразие U+ П U-, а есть элемент калибровочной группы G — SUB), где та — матрицы Паули. Между координатами точек Ж4, отвечающих подмногообразию U+ П U- = S3 С S4, и углами @,<р,-ф) существуют следующие соотноше- соотношения: I , • 2 0 i?±? х +гх — г cos -е г , 2 3 , . 4 . ^ i"Jbe х +гх = r sin -е г , 2 где г2 = (ж1J + (ж2J + (ж3J + (ж4J = BДJ. Тогда Цв, (р, V) = Цх) \хеи+пи_ = . D.74) г Из однозначности отображения у?_+ получаем, что = (h(x))k , xeU+nU-, D.75)
§ 6. Инстантоны i 17 где к — целое число. Зададим форму связности на главном расслоении P(S4,SUB)) формулами шр = ad (<р+(р)~*)А+ {ж(р)) +<p+(p)~ldip+(p) для р € Р+, D.76а) шр = ad (у>_(рГ').4_ (ж(р)) + (p_(p)~ld(p^(p) для р € Р_. D.766) 1-формы А± на U± С 54 получаются опусканием формы связно- связности ш на базу с помощью сечений s±(x) = х±1(х>е)> гДе е — единица группы G (см. D.11)—D.13)). Из однозначности формы связности в подмногообразии Р+ П Р_ и формулы D.75) получаем, что -А+(х) и Л_(х) в ?/+ П U- должны быть связаны следующим калибровочным преобразованием: Л_ (х) = ad (ft(z))* ji+ (x) + (h(x))k d (h(x)rk . D.77) 2-форма на базе, описывающая напряженность калибровочного поля, в окрестностях U+ и U_ выражается формулами: -[A+,A+] для xeU+, \ D.78) -[A-,A-] для жег/_, причем в пересечении окрестностей U+ П J7_ F- = ad(h)kF+. Действие в рассматриваемой теории запишем в виде *F D.79) (ср. D.2) и D.596)). Рассмотрим величину ||F ± *F\\2 = ftr(F± *F) Л (*F ± F). D.80) s4 Используя свойства B.26) и B.22), нетрудно показать, что = 2 ftrFA*F±2 f trFA*F±2 ftrFAF. s* s4 Так как выражение D.80) неотрицательно, то 2т2 5 D.81)
118 Глава 4. Геометрическое описание полей где действие S определяется формулой D.79), а второе число Черна — формулой B.110) (см также D.25)). Таким образом для всех конфигу- конфигураций калибровочной теории, заданной на расслоении Р E4, SUB)) с данным вторым числом Черна CiiP), действие на этих конфигураци- конфигурациях ограничено снизу величиной 2тг2 |С2(Р)|/е2, причем минимальное значение достигается на формах связности, удовлетворяющих условию самодуалыюсти F = *F D.82а) или условию антисамодуальности F = -*F. D.826) Из тождества Бьянки D.556) следует, что (анти)самодуальные формы связности удовлетворяют уравнению движения D.55а) с j = 0, т.е. такие формы связности являются инстантонными решениями. Впервые нетривиальное инстантонное решение в теории Янга— Миллса с калибровочной группой SUB) было найдено. Белавиным, Поляковым, Тюпкиным и Шварцем в их работе [БПТШ]. Формулы, описывающие довольно широкий класс инстантонных решений, были предложены в работах [Хо, Ви, КФ]. Для форм над окрестностью U- они имеют вид: (А-)х = \rjfjjiiv (dv In Ф(х)) dx\ D.83a) (А'_)х = ^TjfiJIW (dv In Ф(яО) dx". D.836) Здесь Ф(ж) — функция, которую еще предстоит определить, а fjjpy — матрицы, введенные 'т Хоофтом: O',M= 1,2,3; /i,i/= 1,2,3,4). D.84) Если выражение D.83а) подставить в условие самодуальности D.82а), то мы придем к следующему уравнению на функцию Ф(х): дид'1Ф(х) Ф(х) Если Ф(х) является решением D.85), то 1-форма D.836) удовлетворяет условию антисамодуальности D.826). Очевидное решение Ф = const дает связность А- = 0 с нулевым числом Черна Сг(Р). Нетривиальное решение, найденное 'т Хоофтом, имеет вид
§ 6. Инстантоны 119 где pi и Щц — произвольные вещественные параметры. При к = 1 мы получаем одноинстантонное решение Белавина, Полякова, Тюпкина, Шварца. Оно описывает локализованную конфигурацию (инстантон) с центром в точке а] и характерным размером р\. В последующих формулах мы будем считать, что центр инстантона расположен в точке п\ = 0; переход к общему решению с п] Ф 0 достигается заменой х на х — а\. В окрестности U- решение имеет вид: In : S3 где отображение h : S3 —»¦ 5GB) определено формулой D.74) и С помощью формулы D.77) при к = 1 легко показать, что соответствую- соответствующее решение в окрестности U+ имеет вид где мы учли, что (/г dh) х = гТкЩруХ dx"/r . Формы А+ и А- регулярны в областях U+ и U- соответственно. Форма А+ сингулярна в точке г = оо («южный полюс» сферы S4), а А- сингулярна при г = 0 («северный полюс»). Решение D.87), D.88) является самодуальным. Антисамодуальное решение получается при подстановке D.86) в выражение D.836). Оно равно: ТТ в U+ : 2'!Х>2 + ': , - ¦", D.89) 2 ' (жJ + /)f (жJ ж2 + р] Главные расслоения Р (S4, SUB)) и формы связности на них характе- характеризуются вторым числом Черна (см. B.110)) С2(Р) = г-, ftrFAF= —\ [trF+AF++ [ ОЖ* J О7Г- {J J S4 U+ V-
120 Глава 4. Геометрическое описание полей В частности, форма связности D.76) с А±, вычисляемым по фор- формулам D.83а), D.86), дает С2(Р) = —к. Такое решение называют к- инстантонным решением. Например, для решения Белавина, Полякова, Тюпкина, Шварца D.87), D.88) имеем F+ = iTj -j (е4 Л е* + -ejae* Л е1), F_ = ad(h)F+, 8тг pi J pi S4 е]Ле2Ле3Ле4 = -\, где мы положили радиус сферы S4 равным р\/2 и выбрали метрику на сфере в виде: Антиинстантонное решение D.89) дает Сг(Р) = +1. Традиционно в физической литературы в качестве топологической характеристики рас- расслоения и инстантонного решения используют величину к = — Сг(Р). Ее называют топологическим индексом, или числом инстантонов, или индексом Понтрягина (в английской литературе часто используется тер- термин winding number). Заметим, что в математических работах классы Понтрягина и числа (индексы) Понтрягина вводятся для векторных рас- расслоений Е т. е. (расслоений, у которых слой — векторное пространство) и ассоциированных с ними главных расслоений со структурной груп- группой GL(k, Ш), которая для (псевдо) римановых многообразий М может быть редуцирована до О(к). Однако, классы Понтрягина Pj(E) выра- выражаются через классы Черна комплексифицированного расслоения Ес со структурной группой GL(k,C): (см. [ЕГХ], [КН] т. 2). Более общее, чем D.86) решение для Ф(х) было предложено в работе [ДНР] *+1 2 -Р±-Л\ D-90) оно сводится к D.86) при ah+\ —> оо, рк+\ —> оо с условием р\+х/ а\+\ — 1- Решение, построенное с помощью функции D.90), описывает fc-инстантонную конфигурацию и характеризуется 5к + 4 параметрами (общий множитель в D.90) несуществен, см. D.83)). Случаи к — 1 и 2
§ 7. Поля материи 121 являются особыми: при к = 1 решение характеризуется 5 параметрами, при к = 2 — 13 параметрами, если мы исключим параметры, связанные с калибровочными преобразованиями. В работах [Шв], [АХЗ] было показано, что число возможных свободных параметров fc-инстантонного решения в теории с калибровочной группой SUB) равно 8к — 3. Таким образом, формула Джакива, Нола, Ребби D.90) дает наиболее общее инстантонное решение для к = 1 и к = 2. В частности, наиболее общим одноинстантонным решением является решение Белавина, Полякова, Тюпкина, Шварца. Оно является также решением на нетривиальном расслоении с наименьшим действием S = 2ir2/e2. § 7. Поля материи Пусть нам задана калибровочная теория с калибровочной груп- группой К на пространстве-времени М размерности dimM = d. Это означает, что мы имеем главное расслоение Р(М,К), задающее кали- калибровочную структуру теории. Покажем, как в геометрическом подходе описываются поля материи. Предположим, что из физических соображений следует, что поле материи должно преобразовываться по конечномерному линейному представлению р калибровочной группы К, т.е. оно должно принимать значения в векторном пространстве Vp, в котором для каждого элемента а € К определено линейное преобразование р(а): Vp —> Vp, реализующее представление группы К в Vp, причем р{а\а{) = р(ви)р(а2). Построим расслоение Е = E(M,VP,K,P) над М со стандартным слоем Vp и структурной группой К, ассоциированное с главным расслоением Р = Р(М, К) (см. § 8 главы 2). Тогда поле материи характеризуется сечением в Е или, эквивалентно (см. Предложение 2.9.2) отображением <р : Р —* Vp, удовлетворяющим условию эквивариантности: (роУа = р(а~])о<р, а?К. D.91) Согласно определению, данному в § 11 главы 2, отображение (р является псевдотензориальной формой типа (р, Vp). Пока мы говорили о свойствах поля материи с точки зрения калибровочных преобразований. Но это поле обладает еще определен- определенными тензорными свойствами с точки зрения преобразований про- пространства-времени М (ниже в качестве приложений общей теории мы рассмотрим скалярные и спинорные поля). Сейчас мы обсудим именно этот аспект геометрического подхода к описанию полей ма- материи. Пространственно-временные свойства теории характеризуются расслоением линейных реперов L(M) = L (M, GL(d; R)) . В физике М обычно рассматривается как псевдориманово пространство, т.е. снаб- снабжается метрикой 7 (см. §4 главы 3). Мы будем считать, что сигнатура
122 Глава 4. Геометрическое описание полей метрики sign7 = (—,+,+,...,+), т.е. у нас в каждой точке х G М имеется одна временная координата и (d — 1) пространственная. Как уже говорилось, при этом расслоение L(M) редуцируется до рассло- расслоения ортонормальных реперов О(М) = Р (М,O(l,d — 1)). Если М ориентируемо, то предположим, что группой симметрии теории явля- является группа 50A,d— 1) — связная компонента O(l,d— 1), содер- содержащая единицу. Таким образом, мы будем рассматривать расслоение 0 = Р (М, SO(l,d— 1)). Пусть поле материи преобразуется по пред- представлению Т группы 50A,d — 1), действующему в пространстве Vp. Построим расслоение W = W (М, Vr,SO(l,d— I), Oj, ассоциирован- ассоциированное с главным расслоением. Поле материи характеризуется сечением в W или отображением <р : О —* W, удовлетворяющим условию эквива- риантности tpo9A=T(A-l)o(p, D.92) где A G SO(\, d— I). Такое описание не встречало бы никаких трудностей, если бы все представления группы SO(\,d— 1) были однозначными. Од- Однако хорошо известно, что у этой группы есть двузначные представления, что связано с неодносвязностью (точнее, двусвязностью) самой группы 50A, d — 1) (см. [По]). Для того, чтобы избежать этой трудности, надо с самого начала заменить SO(l,d— 1) односвязной группой, устроенной в окрестности единицы так же, как 50A, d— 1). Оказывается, что для любой связной группы Ли G существует связная односвязная группа Ли G, локально изоморфная G. Эта группа G называется универсальной накрывающей группы G (см. Приложение 5). Для G = SO(l,d- 1) универсальная накрывающая группа имеет число накрытия z — 2 и обо- обозначается G — Spin(l,d— 1). Таким образом, мы должны рассматривать главное расслоение 05 = Р (M,Spin(l,d — 1)) и ассоциированное с ним расслоение WS = WS (M, F#,Spin(l,d - 1), 05), где УЬ — простран- пространство представления группы Spin(l,d- 1). Для иллюстрации материала, изложенного выше, мы рассмотрим сейчас случай, когда М = М4 — пространство Минковского, а у есть плоская метрика Минковского, r}^ = diag(—1,1,1,1) (ц, v = 0,1,2,3). В качестве пространственной группы симметрии теории возьмем собствен- собственную группу Лоренца, обозначаемую L\. Ее элементы (матрицы размером 4x4) оставляют инвариантной форму (ж, у) = х°у° — ху = —ЦруХ^у" и удовлетворяют условиям detA = +1, Aq ^ 1. Универсальной накрыва- накрывающей для L\ является группа 5LB,Q — группа всех комплексных матриц 2 х 2 с детерминантом, равным 1. Накрывающий гомоморфизм А задается следующим образом. Обозначим через е^ матрицы go = 1,
§ 7. Поля материи 123 в{ — Ti (i = 1,2,3), т,- — матрицы Паули, а через x — матрицу ° + ж3 хх - ix2 Тогда, если А Е 51/B, Q, то мы поставим ей в соответствие матрицу А = А(А) € L\, удовлетворяющую соотношению Аж = А?А+. D.93) Нетрудно показать, что А : А —» А есть гомоморфизм и локальный изоморфизм и число накрытия г(А) = 2. Если мы имеем некоторое представление V : А —* Х>(А) группы 52/B, Q, то представление (однозначное или двузначное) для ь\ можно получить, полагая Т(А) = Г(А(А)) = 2?(А). D.94) Представление Т группы b\ однозначно тогда и только тогда, когда V(—A) = D(A). Неприводимые конечномерные представления SLB,Q характеризуются парой (j, к), где j и к — целые или полуцелые неотрицательные числа. В частности, имеется два неэквивалентных представления E,0) и (О, |), действующих в пространстве С2, т.е. в пространстве двухкомпо- нентных спиноров. Операторы этих представлений равны X>v2' /(A) = A и X>v'2i(A) = А*. Компоненты спиноров представления (^,0) обозна- обозначают ?а(а = 1,2), а представления @, |) — ?« (ос = 1,2). Мы можем рассматривать также и приводимые представления группы SLB,Q. В физике важную роль играет представление Дирака, которое являет- является прямой суммой двух неэквивалентных представлений (такого рода представления называются вполне приводимыми): 2>0'°) ©2>(°'О. D.95) Оно действует в пространстве дираковских (четырехкомпонентных) спи- спиноров (а =1,2, /3=1,2). *=(!:). В силу локального изоморфизма групп L\ и 5Z/B, Q их алгебры Ли совпадают. В окрестности единицы элементы группы b\ можно
124 Глава 4. Геометрическое описание полей параметризовать с помощью вещественных антисимметричных 4x4 матриц в = (в^и) = (—в»?) по формуле A = e^""V) D.96) где I1"' — элементы алгебры Ли группы L\, называемые операторами инфинитезимальных лоренцовых вращений: В этой же окрестности операторы представления имеют вид Г(А) = е**"'". D.97) Равенства D.96) и D.97) задают представление алгебры Ли группы b\: X"" = Т'(Г), ¦ D.98) соответствующее представлению Т. Например, для представления (|,0) Матрицы е^ были определены выше, ё0 = I, ej = — Tj, eM = ifvev, ё? = rfvlv. Для представления D.95) r'(j'0)®(°'0 (^) = Ijyw _ _1 (Г^Г" _ Г"Гр) D.99) 2 4 где Г*1 — матрицы Дирака (см. [БШ], [БШ1]). Достаточно подробное обсуждение геометрии пространства Минковского и свойств группы Лоренца можно найти в книге [БЛОТ]. Вернемся снова к общему псевдориманову многообразию раз- размерности d и расслоениям OS и WS, введенным выше. Сейчас мы изложим схему описания полей материи в рамках геометрического под- подхода, которая учитывает единым образом как калибровочные, так и пространственно-временные свойства теории. Обозначим через С пря- прямое произведение групп Spin(l,d— I) x К и построим прямую сумму главных расслоений Q = OS © Р, которая определяется так: Q(M) = {(u,p) eOSxP: тгО5(«) = пр(р)} , где 7T#s и 1Гр — канонические проекции в OS и Р соответствен- соответственно. Очевидно, Q(M) является главным расслоенным пространством со структурной группой С = Spin(l,d— I) x К; действие структурной
§ 7. Поля материи 125 группы в Q будем обозначать Фс, с G С. Пусть поле материи преобра- преобразуется по представлению 6 = (V,p) группы С, т.е. оно преобразуется по представлению р калибровочной группы К и является спин-тен- спин-тензором, преобразующимся по представлению V относительно действия группы Spin(l,d — 1). Пространство представления 6 обозначим Vg; очевидно Vg = Vp <8> Vp (тензорное произведение). Построим расслоение Y(M) = Y(M,Vg,C,Q), ассоциированное с главным расслоением Q. По- Поле материи определяется как сечение (вообще говоря, локальное) Y(M) или как эквивариантное отображение ip:Q(M)-*VSi D.100а) <роФс = 6(с^)о<р, се С D.1006) (ср.D.91), D.92)). Величина (p(q), q € Q, является элементом про- пространства Vg и характеризуется компонентами (<р(д)Уа относительно некоторого базиса в V« = Vp <8> Vp, где индекс а нумеруют векторы базиса пространства Vp (например, спинорный индекс в случае спи- спиноров или лоренцев индекс для 4-векторов), а индекс г — векторы базиса пространства Vp («внутренний» индекс). Тогда действие 6(с) с с = (А,а) € Spin(l,d — 1) х К записывается в стандартном виде: Пусть задана калибровочная связность ш в Р(М,К) и линейная связность в М, т.е. в нашем случае связность т в OS (M, Spin(l,d — 1)). Тем самым задана связность ц = (т,ш) в Q(M) со значениями в с = s ф f — алгебре Ли группы С, где s и f — алгебры Ли групп Spin(l,d- 1) и К (в совпадает с so(\,d— 1) — алгеброй Ли группы SO(l,d— 1))). Согласно Предложению 2.11.4 ковариантная производная этой формы связности равна D<p = d<p + 6\fi)ip, D.101) где 6' — дифференциал отображения 6, задающий представление алге- алгебры с в Vg, отвечающее представлениям V алгебры s в VD и р' алгебры i bVp: 6'(p)v = (V'(t) <g> tV/i) cp + (iVb 0 p'(w)) <p, D.102) где 1ур и -1у„ — тождественные преобразования в Vp и Vp соответ- соответственно. Если мы теперь построим из D.101) лагранжиан поля <р, то тем самым мы опишем взаимодействие поля материи с калибровоч- калибровочным и гравитационным полями. Взаимодействия такого типа, как уже говорилось в главе 1, называются минимальными. Для того, чтобы перейти к обычным полям на М, надо, по аналогии с чисто калибровочной теорией (см. § 1 главы 4), выбрать
126 Глава 4. Геометрическое описание полей локальное сечение а : М —* Q(M), что эквивалентно выбору сечений s : М -» Р(М,К) п t : М -± OS (M,Spin(l,d - 1)). Как мы уже знаем, выбор сечения s в Р означает выбор калибровки, а выбор сечения t в OS — выбор подвижного ортонормированного репера {еа} в М (т.е. выбор локальной системы координат). Тогда поле материи в М определяется как (р(а) = а*ср = (р о а D.103) или (р(<т)(х) = <р((т(х)), х ? U, U — окрестность в М. Пусть а' : U —> Q(M) — другое сечение в Q(M) и а'(х) = ФС(Х)<т(ж), где с(х) (Е С. Пользуясь эквивариантностью D.1006) отображения tp, получаем <р(<г'\х) = <р {(т'(х)) = <р (Фс(г)^(х)) = (<ро ФсA) = б(с{хГх)<р(а(х)) = б(с{хУх)<р(а\х). D.104) Преобразование с функцией с(х) = (е,а(х)) (е — единица в Spin(l, d — 1)), при котором изменяется только сечение s в Р, соответствует калибровочному преобразованию поля <р{а)(х): <pia>)(x) = (lvT ®р(а(хГ1)") <р(а)(х). D.105) Преобразование с функцией с(х) = (A(z), е) (здесь е — единица в К), при котором изменяется только сечение t в OS, соответствует локальному преобразованию системы координат в М: чР\х) = B>(А(*Г') (8) tv)v{°\x). D.106) Вычислим теперь ковариантную производную поля <р^. По опре- определению Dcpa — a*Dip. Тогда, согласно D.101), D<p(a) = a* (d<p + б'(ц)<р) = Фр(а) + 5'(<т»^(<г) = = dip^ + V'(t*T)<p(ir) + p\A{s))<p(<T\ D.107) где мы очевидным образом упростили запись D.102). 1 -форма А(<т) = s*u) на М описывает калибровочное поле и была введена в § 1 главы 4. Если V™ — базис в алгебре Ли s группы SO(l,d — 1) (/л,v = 0,1, 2,...,d— 1), то ограничивая C.16г) на расслоение ортонормальных реперов, получаем t Т = — 1 i/fipl Ax ,
§ 7. Поля материи 127 где Тцур = 71/<тГ^, — символы Кристофеля. Тогда второе слагаемое в правой части выражения D.J07) равно V'(t*r)<p" = [v^dx" (х""^) , D.108) где Xvp = V'{lvp) (ср. D.98)) — генераторы представления V группы Spin(l,d— 1), по которому преобразуется поле <р^а). Рассмотрим в качестве примеров скалярные и спинорные поля. 1. Скалярные поля. Скалярное поле на М преобразуется по тривиальному представлению V группы Spin(l,d— 1) или, эквивалентно, по тривиальному представлению Т группы S0(l,d- 1), т.е. Т(А) и ?>(А) суть единичные операторы для всех А ? SO(l,d — 1) и A G Spin(l,d — 1) соответственно и 2>'(Х) = 0 для всех X G в. Поэтому, в данном случае предыдущие рассуждения можно было бы провести только с использованием расслоений Р(М,К) и E(M,VP,K,P). Предположим, что скалярное поле <р преобразуется по нетривиальному представлению калибровочной группы; при этом обычно его называют полем Хиггса. Так, в теории электрослабых взаимодействий Вайнберга—Салама К = 517B) х U(l), р — фундаментальное представление и Vp = С2. В модели Джорджи—Глэшоу К = SOC), p — присоединенное представление, Vp = 6 = soC) (как векторное пространство) — алгебра Ли группы 5ОC). Согласно D.101) Dip- dip + р'(ш)<р. D.109) Форму степени d на М, инвариантную относительно калибро- калибровочных преобразований и являющуюся лагранжианом теории, обычно выбирают в виде L = (D<pwy A (*D<p(<T)ihij + Щ^<р(^<р(<г)Ыум, D.110) где hij — метрический тензор р-инвариантной метрики в Vp (i — индекс, относящийся к пространству представления Vp), U — скалярная функция, играющая роль потенциала самодействия, a dv^ = y/[y\dx° A dx1 A ... Adxd~x — элемент объема в М. В качестве примера рассмотрим абелеву калибровочную теорию, характеризуемую главным расслоением Р = MxU(l) (электродинамика). Скалярное поле в этой теории описывается эквивариантным отображе- отображением (р : Р —» Vp = С (все конечномерные представления группы Щ1) одномерны): (роУа = р(а~1)<р, aeU(\).
128 Глава 4. Геометрическое описание полей Мы реализуем представление р следующим образом: р(а) = eiea. Здесь е — некоторая константа (заряд поля <р). Калибровочное преобра- преобразование D.105) выглядит так: <р^(х) = p(«(z)-Vf)<*> = e-iea{xVs)(x), D.111) где калибровочная функция а : М —»• 17A) связывает сечения s и s1: s'(x) = *a(X)S(x). Чтобы записать ковариантную производную в явном виде, вычислим величину р'(А), где А (Е t. Пусть поле А индуцирует однопараметрическую подгруппу at = exp(tA) в К = Z7(l). Тогда d — —е t=o dt teat = ieA. i=0 Используя эту формулу, получаем выражение для ковариантной произ- производной D.109) (D<p)(X) = d<p(X) + ieu(X)ip, D.112) где X — векторное поле на Р. Вернемся к общему случаю скалярного поля в калибровочной теории на М с калибровочной группой К. Важную роль в теории поля играет явление спонтанного нарушения калибровочной симметрии, воз- возникающее в том случае, когда основное состояние системы вырождено. На геометрическом языке спонтанное нарушение симметрии означает, что существует глобальное сечение ф : М —* Е = E(M,VP,K,P) такое, что ф(х) = сро G Vp для всех х G М, где <ро — одно из основных со- состояний в теории. Например, если потенциал скалярного поля в D.110) имеет вид U(\(p\2) = с(\<р\2 — /х2) , где с и ц константы, то щ — ц? с единичным вектором ? : |?|2 — hij?l?j — 1. Пусть Н — стационарная подгруппа точки (р0 в Vp, т.е. Н = {a G К : р(а)(р0 = (р0}, и (ро явля- является началом однородного пространства (орбиты) К/В.. В этом случае сечение ф фактически является сечением расслоения Е(М,К/Н,К,Р). Тогда, согласно Предложению 2.9.3, расслоение Р(М,К) редуцируется к расслоению Q = Q(M,H). Напомним, что подрасслоение Q С Р определяется условием Q = {q G Р : ip(q) = <ро}, где <р — отображение из Р в Vp, описывающее скалярное поле и отвечающее сечению ф. Обычно требуют, чтобы при спонтанном нарушении симметрии для конфигурации <р0 выполнялось условие (D<po)q(X) — 0 для всех q G Q и всех X G X(Q). Так как (d<pQ)g(X) = 0, то из D.109) следует, что (D<po)q(X) = 0 влечет р' (шд(Х)) <р0 = 0. D.113)
§ 7. Поля материи 129 Это равенство означает, что ограничение ш = u\q формы связности ш на Q есть t) — значная форма в Q (f) — алгебра Ли группы Н), т.е. связность в Р редуцируется к связности в Q (см. § 10 главы 2). Таким образом, в случае спонтанного нарушения симметрии калибровочная группа К нарушается до своей подгруппы Н, теория задается расслоением Q(M, H) и связностью в нем. В силу Предложения 2.9.3 и равенства D.113) верно обратное: если расслоение Р(М,К) редуцируется к Q(M,H), H С К и связность в Р редуцируется к связности в Q, то в теории имеет место спонтанное нарушение симметрии и (D<p)q(X) = 0 для всех q G Q и X € X(Q). В качестве примера рассмотрим спонтанное нарушение симме- симметрии в калибровочной теории, характеризуемой главным расслоением Р = S2 х SOC). Пусть скалярное поле преобразуется по векторному трехмерному представлению р группы 5ОC), при этом VP = Ж3. Мы будем параметризовать точки базы М = S2 вектором г = (х, у, z) G М3, где х2 + у2 + z2 = 1. Эквивариантное отображение <р : Р —> S2, описы- описывающее скалярные поля, можно задать следующим образом: для точки (г, a) ?S2x 5ОC) = Р (г € 52, a G 5ОC)) <p(r,a) = p(a~])ff(x,y,z). Очевидно, точка г0 = @,0,1) G S2, являющаяся «северным» полюсом сферы, остается на месте при вращении вокруг г-оси, т.е. при пре- преобразованиях из подгруппы Н = SOB) С 5ОC). Если в теории есть вакуумное состояние со значениями поля tpo = f0 (E S2 С Vp, то проис- происходит спонтанное нарушение симметрии и расслоение Р = S2 х 5ОC) редуцируется к расслоению Q = {(г,a) G Р : а г = го}- Отсюда видно, что точки Q находятся во взаимно-однозначном соответствии с эле- элементами а € 5ОC), т.е. Q = Q(S2,SOB)) = 5OC). Таким образом, редуцированное расслоение Q есть расслоение монопольного типа (так как 5ОB) = СД1)), причем нетривиальное, отвечающее первому числу Черна C,(Q) = 2. 2. Спинорные поля. Рассмотрим алгебру матриц Дирака Г (а = 0, l,...,rf— 1) пространства М, реализованную матрицами раз- размера 2[d/2] х 2[d/2] ([x] — целая часть числа х), удовлетворяющими антикоммутационному условию где диагональная матрица rfb = diag(-l, I,..., 1) есть метрический тензор плоской метрики. Эти соотношения отличаются от обычно используемых знаками перед rjab. Однако при нашем выборе сигнатуры метрики это определение предпочтительнее, т.к. тогда (Г°)+ = —Га, и матрица Г° 5 Зак. 311 °
130 Глава 4. Геометрическое описание полей эрмитова. Поэтому для спинорного поля -ф можно положить "ф = ^>+Г°, и выражение фТагр будет вектором с положительно определенной нулевой компонентой. Спинорное поле гр в М преобразуется по спинорному предста- представлению группы Spin(l,d— 1) размерности 2[</у'21. Если d четно, то это представление приводимо и может быть разложено на два неприво- неприводимых представления, отвечающих различным собственным значениям оператора киральности Td+1 = (i)~T°T] ...Г*. Пусть V — спинорное представление группы Spin(l,d— 1), а V' — соответствующее ему пред- представление алгебры в; генераторы представления V получаются равными V'(eab) = — |[Га,Гь]. Выражение D.108) в этом случае приводится к виду *~ \~ • /Y — в" где Г^ = Tpvpeaeb> a матрицы е„ связывают подвижный ортонормиро- ванный репер {еа} с д^. Поэтому компонента ковариантной производной D.107) получается равной = д^(<т) + Тр1>{с) + р'(^5))^(<7), D.114) где спиновая связность ти есть При преобразовании системы координат в М с помощью элемента группы SO(l,d— 1) преобразование спинора выглядит так: где <т' = ^А0" (см- D.106), ср. D.97)). Лагранжиан для спинорного поля ^(<г)(ж) имеет вид
Глава 5 Основы теории алгебр Ли Алгебры Ли вначале возникли при анализе групп Ли, но затем стали объектом самостоятельного изучения. Аппарат теории алгебр Ли является мощным инструментом исследования свойств групп и их представлений. Он интенсивно используется также в современной теории поля, например, при изучении трансформационных свойств полей, при анализе схем нарушения калибровочной симметрии, при исследовании кварковой модели адронов, в задачах о размерной редукции многомерных теорий и т.д. В настоящей главе мы введем основные понятия теории алгебр Ли и обсудим структуру алгебр Ли. В главе 6 этот математический аппарат будет применен к построению моделей Хиггса в рамках метода размерной редукции. Для более глубокого изучения теории алгебр Ли можно рекомендовать книги Джекобсона [Дж], Гото и Гроссханса [ГГ], Барута и Рончки [БР], Кириллова [Ки], Кана [Ка]. § 1. Основные понятия. Связь групп и алгебр Ли В §5 главы 2 мы определили алгебру Ли g группы Ли G как множество левоинвариантных векторных полей или, эквивалентно, как касательное пространство TeG. Был определен также коммутатор полей Х,У<Ед(см. B.5), B.39)) [X,Y]f = X(Yf)-Y(Xf) E.1) для любой гладкой функции / на G. Операцию, сопоставляющую каждой упорядоченной паре элементов X и Y из g элемент [X, Y] ? g будем рассматривать как произведение в алгебре Ли д. Нетрудно проверить, что такое произведение обладает следующими свойствами: 1) антикоммутативность: [Х,У] = — [У,Х]; E.2а) 2) тождество Якоби: [[Х,У],#] + [[У,^1, X] + [[Я,Х],У] = 0, E.26)
132 Глава 5. Основы теории алгебр Ли где X, Y, Z 6 0. Другие способы построения алгебры Ли по группе Ли обсуждаются, например, в книге [Ки]. Как уже отмечалось, в настоящее время теория алгебр Ли выдели- выделилась в самостоятельный раздел. Поэтому часто пользуются определением алгебры Ли, отличным от того, которое было дано в §5 главы 2, и не связанным с группой, порождающей алгебру. Это определение полезно иметь в виду, поэтому сейчас мы перейдем к его формулировке. Сначала напомним определение алгебры вообще. Пусть А — векторное пространство над полем Р (мы будем рассматривать случаи Р — Ж и Р = С). Введем в А произвольное билинейное отобра- отображение / : А х А —> А; оно называется умножением. Тогда А — алгебра относительно /. Алгебра А называется ассоциативной, если f(X,f(Y,Z)) = f(f(X,Y),Z), X,Y,Z€A. Определим теперь класс алгебр, называемых алгебрами Ли; в этом случае произведение f(X,Y) будем обозначать [X,Y]. Алгебра А называется алгеброй Ли, если выполняются условия E.2а, б). Очевидно, что [X, Х] = 0. Пусть L — алгебра Ли. Векторное пространство К С L называется подалгеброй в L, если К — алгебра относительно умножения [, ], определенного в L, т.е. [X,Y] € К для всех X,Y G К. В дальнейшем, если К, Q — подмножества в L, то через [К, Q] мы будем обозначать множество всевозможных элементов вида [X,Y], где X G К, Y €Q. Подалгебра J в алгебре Ли L называется идеалом алгебры L, если [L,I] С I. Центр алгебры L, обозначаемый обычно Z{L), есть множество элементов X € L таких, что [X,Y] = 0 для всех Y G L. Если К — подалгебра в L, то централизатор К в L определяется так: С^(К) = {С G L : [С, X] — 0 для всех X G К}. Таким образом, центр Z(L) есть централизатор всей алгебры. Нормализатором подалгебры К в L называется подалгебра, определяемая следующим образом: NL(K) = {X е L : [Х,К] С К}. Пусть L и L' — алгебры Ли с определенными в них произведениями [, \i и [, ]v соответственно. Линейное отображение <р : L —> L' называется гомоморфизмом алгебр Ли, если <р([Х, Y]L) — [p(X),tpiY))L. для всех X,Y ? L. Рассмотрим алгебры Ли К и Q с произведениями [,]«• и [,]q. На прямой сумме векторных пространств L = K®Q можно ввести структуру алгебры Ли с произведением [, \l следующим образом: [(XuY]),(X2,Y2)]l = ([X1,X2]k,[Yi,Y2]q), ХиХ2еК, YuY2eQ. Тогда L называется прямой суммой алгебр К и Q. Пусть пространство алгебры Ли I представимо в виде прямой суммы L = L\ ф L2, причем каждое из слагаемых L,- (г = 1,2) явля- является подалгеброй относительно ограничения произведения [,]i на L{. Если только одна из подалгебр, скажем L2, является к тому же иде-
§ 1. Основные понятия. Связь групп и алгебр Ли 133 алом алгебры L, то L называется полупрямой суммой алгебр L\ и L2, L = L2^ L\. Алгебра Ли называется абелевой, если [L, L] = 0. Алгебра Ли L называется простой, если она неабелева и имеет лишь два (тривиальных) идеала: {0} и L. Если же L не содержит нетривиальных абелевых идеалов, то она называется полупростой. Вернемся снова к вопросу о связи между алгебрами Лии группами Ли. Пусть at — однопараметрическая подгруппа группы Ли G (см. §5 главы 2), а X — вектор, касательный к at в точке Оо = е; мы будем писать X = do. Такой вектор X € g называется генератором (или инфинитезимальным оператором) однопараметрической группы о< (ср. F.2)). Можно доказать (см. [Ки, §6.4]), что для каждого вектора X ? g существует единственная однопараметрическая подгруппа at такая, что X = а0. В §5 главы 2 мы уже определили экспоненциальное отображение exp :g->G следующим образом: для X € g ехр(Х) = аь E.3) где at — однопараметрическая подгруппа, отвечающая вектору X. Тогда элемент OjGG можно записать в виде exp(tX) или etx. Экспоненциальное отображение диффеоморфно отображает не- некоторую окрестность нуля в алгебре Ли g на некоторую окрестность единицы группы G. Справедлива следующая теорема Адо, которую мы приведем без доказательства: всякая алгебра Ли над полем комплексных чисел изоморфна некоторой матричной алгебре. Для групп Ли соответствующая теорема справедлива лишь локально. Теорема Адо позволяет сводить доказательства многих утверждений об алгебрах Ли к случаю матричных алгебр Ли. При этом полезно иметь в виду следующие свойства матриц. Пусть М — произвольная п х п матрица с элементами Мц. Если |Mjj| < оо для всех i и j, то М2 Мк ехр(М) =1+М+—- + ...+ — + ... E.4а) всегда существует (ряд E.4) абсолютно сходится). Приведя матрицу М к нормальной жордановой форме, можно доказать равенство (задача 5.4): E.46) Рассмотрим теперь примеры алгебр Ли. Пример 1. Пусть А — произвольная ассоциативная алгебра Ли с законом умножения /. Введем в А новое умножение по форму- формуле f(X,Y) = f(X,Y)- f(Y,X), X,Y e А. Алгебра А относительно умножения / становится алгеброй Ли, а /(,) обозначают [,].
134 Глава 5. Основы теории алгебр Ли Пример 2. Пусть V — векторное пространство над полем Р, а {е,} (* = 1,2,...,п = dimF) — базис векторов в V. Рассмотрим ассоциативную алгебру всех линейных отображений пространства V в себя, обозначаемую обычно gl(V). Для всякого отображения <р : V —> V из gl(V) элемент <p(ej) G V можно снова разложить по выбранному базису. Положим у(еу) = E,j G Р). Существует изоморфизм между gl{V) и ассоциативной алгеброй всех матриц размером п х п, обозначаемой gl(n,P), который задается так: /S\\S\2- •• S\nS ?д1(щР). 2- • • Sn Согласно примеру I gl(V) и gl(n, P) являются алгебрами Ли относительно скобочного умножения [, ] (коммутатора в случае матриц). Пример 3. В таблице 5.1 приведены группы Ли G, являющиеся подгруппами в GL(n,P), и их алгебры Ли 0, часто используемые в физике (отметим, что таблицы 5.1 и 5.2 основаны на табл. 3 из [ЛБ]). Там же приведены условия, налагаемые на элементы д € GL(n,P), определяющие данную группу. Условия на элементы соответствующей алгебры получаются из свойств экспоненциального отображения, в частности, из E.46). Значок «Т» означает транспонирование, матрица J^n определена в E.5), Р — Ж или С. Для алгебр из этой таблицы в случае Р — С используются также другие стандартные обозначения (мы тоже будем их широко использовать): Ап = sl(n + 1,Q, Bn = soBn+ 1,Q, Сп = sp(n,Q, Dn = soBn,Q. Таблица 5.1. Группа G SL(n,P) SO(n,P) Sp(n,P) Условия, наложенные на элементы g?GUn,P) detg - 1 detg = 1 — 1 T я -g F;nlgTF2n = g~{ X?gl(n,P) UX=O XT = -X XTFln + F2nX = 0 Алгебра g sl(n,P) so(n,P) sp(n,P) Помимо алгебр Ап, Вп, Сп и Dn в физике часто приходится иметь дело с их овеществлениями и вещественными формами. Сейчас мы введем эти понятия. Пусть V — векторное пространство над С и его комплексная размерность dime V = п. Будем теперь рассматривать V как пространство
§ 1. Основные понятия. Связь групп и алгебр Ли 135 над Ж (например, если {г>,} (г = 1,2,...,п) — базис в V над С, то {«!,...,«„, iv\,..., ivn} — базис в V над Ж). Тогда мы получим векторное пространство Vr над Ж вещественной размерности dirriR Vr = 2n; Vr называется овеществлением V. Если на V задана структура алгебры Ли, то она тривиально переносится на Vr. Пусть теперь L — алгебра Ли над Ж вещественной размерности diiriRi = п. Расширяя поле коэффициентов до С, мы получим алгебру Ли Lc над С комплексной размерности dime Lc = n, которая называется комплексификацией алгебры L. Очевидно, Lc = L® %L (прямая сумма R векторных пространств над Е). Произведение [, ] распространяется на V по линейности: если Х\, Y\, Х2, Y2 G L, то Рассмотрим алгебру Ли L над С. Вещественной формой L называ- называется подалгебра L в Lr такая, что Lc — L. Ясно, что dimc^ = diiriR.L и L = L Ф iL. Данная алгебра Ли L над С может иметь несколько неизоморфных вещественных форм. Это видно из таблицы 5.2, в кото- которой приведены овеществления и вещественные формы для алгебр Ли из таблицы 5.1, там же указаны и условия, налагаемые на элементы этих алгебр. Здесь черта означает комплексное сопряжение, «+» — эрмитово сопряжение, а матрицы 1р>д, F2r и K(p,q) следующие: 1, 0 \ _/ О 1Г\ //„,, 0 OJ' K™-{6 /MJ' E5) где 1Г — единичная матрица размера г х г. Компактные вещественные формы, к которым относятся два последних столбца таблицы, будут введены в следующем параграфе. Если L — алгебра Ли над Ж, то при комплексификации подалгебра (идеал) переходит в подалгебру (идеал) в Lc, если L полупроста, то и Lc полупроста и наоборот. Схематически это можно изобразить так: E.6а) Подчеркнем, что подалгебры и идеалы в Lc могут не иметь аналогов в L (см. пример 5 ниже). Пусть L — алгебра Ли над С, Lr — ее овеществление. Схема, L—> подалгебра —> идеал —* полупростота <=± Lc подалгебра идеал полупростота.
136 Глава 5. Основы теории алгебр Ли Таблица 5.2. алгебра В над С Ап п ^ 1 Вп п ^ 1 с„ п ^ 1 овещест- овеществление <7r s/(n+I,QR 5oBn+l,QR sp(n, QR soBn, Qr вещественная форма jCjr sl(n+ 1,R) su(p,q),p+q=n+] n+i=2k so(p, q) p + q = 2n+\ spin, R) spiP, q). so(p,q) p + q = 2n so*Bn) условия на uX = 0 trJT = 0 XF2k - F2kX = 0 XTIM+IMX=0 XTF2n+F2nX=0 л J<2n + Г2пл — " XTIM+IMX=0 XT + X = 0 XF2n - F2nX = 0 компактная вещественная форма д С дк su(n+ 1) soBn+ 1) sp(n) soBn) условия на ,гХ = 0 хт = -х Х+ + X = 0 аналогичная E.6а), имеет вид: подалгебра идеал полупростота простота подалгебра идеал полупростота простота. E.66) Если L — алгебра Ли над С, a L — ее вещественная форма, то L —> L подалгебра —* подалгебра идеал —> идеал полупростота <==? полупростота, E.6в) но не всякой подалгебре в L = Lc соответствует подалгебра в L. Пример 4. Простая алгебра soC,M) после комплексификации остается простой алгеброй Ли: soC,M)c = soC,Q. Пример 5. Рассмотрим вещественную простую алгебру Ли g = soC,1), являющуюся алгеброй Ли группы Лоренца G = 5ОC,1).
§ 2. Представления алгебр и форма Киллинга 137 Выберем в g стандартный базис {li,rij} (i,j = 1,2,3), удовлетворяющий коммутационным соотношениям: [lit lj] = Eijkh, Ui, nj] = ?ijknb, [Щ, Tij) = -stjkh- E.7) Подалгебра, натянутая на элементы lj (j = 1,2,3), является алгеброй soC) и отвечает пространственным вращениям. Выберем в gc = soC, \)c базис {ui,Vj}, где щ = (I,-+ in,-)/2, Vj = (lj -irij)/2. Легко проверить, что [щ, щ] = eijkuk, [vu Vj] = ?ijkvk, [и,-, vj] = 0, т.е. линейные оболочки элементов {щ} и {»,•} (г = 1,2,3) являются идеалами в д,е, изоморфными soC,Q. Т.о. so(l,3)c = soC,Q ©soC,C) (см. таблицу 5.2), в то время как в исходной алгебре g не было нетривиальных идеалов. Пример 6. Пусть g = slB,C), возьмем базис {—|ту} (j — 1,2,3), где Tj — матрицы Паули. После овеществления базис в дк выберем в виде {li,rtj}, где k — -\т{, rij = \tj. Легко проверить, что коммутационные соотношения в этом базисе совпадают с E.7). Следовательно, sJB,Qr = soC,l). Группы Ли, алгебры которых приведены в таблицах 1 и 2, и сами алгебры называются классическими. Классические группы определяются как группы, оставляющие инвариантными те или иные формы х на векторном пространстве V, т.е. как группы преобразований д : V —*¦ V, д е G таких, что x(9(u)>9(v)) = X(u->v) Для всех u,v EV. Так, например, группа SO(k,C) есть группа всех матриц из SL(k,C), которые сохраняют в С6 форму X(Z, Z) = Ziz'i + Z2Z2 + ... + ZkZk = Zi(t)ijZj = ZTZ. SO(p,q), p + q — к есть группа всех матриц из SL(k, Ш), сохраняющих в Ж* форму Х(Х,Х) = Х]Х\ + ... +XqX'q-Xq+iXq+] -... -ХкХь = Xi(IPtg)ijXj = X* Ip,qX . (Относительно локальных классических групп см., например, [БР, гл. 3]). В заключение параграфа отметим, что каждой алгебре Ли L (с dimi < oo) соответствует единственная связная односвязная группа Ли G такая, что ее алгебра Ли есть L. Все остальные связные группы Ли, алгебры Ли которых также совпадают с L, имеют вид G/H, где Н — дискретная подгруппа, принадлежащая центру группы G. § 2. Представления алгебр и форма Киллинга Пусть V — векторное пространство над полем Р к L — алгебра Ли над Р. Будем рассматривать gl(V) (см. пример 2 §1) как алгебру
138 Глава 5. Основы теории алгебр Ли над Р. Всякий гомоморфизм г : L —> gl(V) называется представлением алгебры Ли L. Это отображение удовлетворяет следующим условиям: r(aX + bY) = a г{Х) + Ъ r(Y), E.8а) r([X, Y]) = [г(Х), r(Y)] = r(X)r(Y) - r(Y)r(X) E.86) для всех X, Y G L, а, 6 (Е Р. Мы будем обозначать такое представление (V,r). Среди различных представлений алгебр Ли важную роль играет присоединенное представление. В §5 главы 2 мы определили внутренний автоморфизм 5а группы G формулой Sag-agd~\ a,g?G, а также ввели дифференциал этого отображения ad(a) — S'a, который за- задает присоединенное представление группы G в линейном пространстве 0 = TeG. Заметим, что если G — матричная группа, ад — соответству- соответствующая матричная реализация ее алгебры, то действие ad(a),a G G можно вычислить по формуле: ad(a)X = aX<r\ X G g. Пусть a< — однопараметрическая подгруппа, отвечающая вектору X G g, т.е. X = at\t=Q. Рассмотрим производную отображения адщ в точке t — 0 и обозначим ее также adX. Используя формулу B.42), получаем для Y e g: adW) = lim^^-y- =ltalIziE«V=Iiyl E.9) <->o t <->о t С помощью тождества Якоби легко показать, что свойства E.8) для г = ad выполняются и, следовательно, отображение ad : L —> gl(L) задает представление (L,ad), которое называется присоединенным пред- представлением алгебры Ли L. Операция adX, X G L является естественным действием элементов алгебры Ли на самой алгебре и позволяет исполь- использовать результаты теории представлений для изучения свойств алгебр Ли. Рассмотрим теперь две последовательности идеалов в L (см. зада- задачу 5.3): а) центральная (убывающая) последовательность: LX=L, L2 = [L,L], L3=[L2,L], ..., Lk = [Ьк~\ LDL] DL2DL3D...; б) производная последовательность:
§ 2. Представления алгебр и форма Киллинга 139 Алгебру L называют нильпотентной (разрешимой), если Lk — 0 (L(fc) = 0) при некотором к. Предложение 5.2.1. Всякая нильпотентная алгебра разрешима. Докажем по индукции, что Ь(к) С Lk+]. Действительно, L{1) = L1. Предположим, что L(k~l) С Lk. Тогда L(k) = [L{k-l\L{k~X)] С [Lk,L{k~l)] С [Lk,L] = Lk+i. Отсюда следует утверждение предложения. D Частным случаем нильпотентной (и разрешимой) алгебры является абелева алгебра, для которой I? = LA) = 0. Если L — разрешима, т. е. X(fc) = 0 для некоторого А;, то L(k~X) — абелев идеал в L. Таким образом, разрешимая алгебра всегда содержит нетривиальный абелев идеал. Наибольший разрешимый идеал в алгебре Ли L называется радикалом алгебры Ли L. Можно доказать, что L полупроста тогда и только тогда, когда ее радикал равен нулю. Более того, справедлива следующая фундаментальная теорема Леви—Мальцева (доказательство приведено, например, в [Ше]): Пусть L — алгебра Ли над Р (Р = Е или С) с радикалом N. Тогда существует полупростая подалгебра S С L такая, что L = N 3 S (полупрямая сумма). E.10) Очевидно, что [N,N] С N, [S,S] С 5, [N,S] С N. Пример 1. Алгебра Ли П группы Пуанкаре состоит из простой алгебры Ли М = soC,1) группы Лоренца и идеала t4, образованного линейными комбинациями операторов импульса Р„ (у = 0,1,2,3). Как хорошо известно, [М,М] С М, [t4,M] С t4, [t*,t4] = 0. В соответствии с теоремой Леви—Мальцева П = t4 3 М. Эта теорема позволяет свести изучение произвольных алгебр Ли к изучению полупростых и разрешимых алгебр. Структура полупростых будет обсуждаться в следующих параграфах. Разрешимые алгебры Ли, хотя и имеют, как кажется, более простую структуру, до сих пор не поддаются классификации. Пример 2. Пусть V — векторное пространство над полем Р, 1 — тождественное отображение в V, a 3(V) — Р ¦ 1 С gl(V). Очевидно, что одномерная подалгебра 3 принадлежит центру Z(gl(V)) и потому является идеалом в gl(V). Если X € дИУ), то dim V dim V Хх G sl{V), X2 e 3(V). Так как sl(V) П 3(F) = 0, то gl(V) = *Z(V)©3(V).
140 Глава 5. Основы теории алгебр Ли Пример 3. Аналогично предыдущему, можно показать, что и(п) = su(n) © 3, где и{п) = {Х е gl(n,Q : Х+ = -X] С gl(n,C), а 3 = С1„, 1„ — единичная матрица в gl(n,С). Справедлива следующая теорема Картана: пусть V — векторное пространство над Р и L — подалгебра алгебры gl(V). Тогда L либо полупроста, либо L = L®3(V), где L — полупростой идеал. Важную роль в изучении свойств алгебр играют билинейные формы. Рассмотрим алгебру Ли L как векторное пространство над Р. Симметричная билинейная форма на L — это отображение ш : Lx L —»• Р такое, что 1) u,(X,Y) = u(Y,X), X,Y?L; 2) ш билинейно. Если ш удовлетворяет условию ш([Х, Y],Z) = ш(Х, \Y,Z\), то она называется инвариантной формой. Предложение 5.2.2. Пусть L — алгебра Ли и (V, г) — ее представление. Тогда равенство ur(X,Y) = tr(r(X)r(Y)), X,YGL E.12) определяет симметричную инвариантную билинейную форму на L. Доказательство. Свойства E.11) очевидны. Проверим инвариантность: ojt([X,Y],Z) = tT(r([X,Y])r(Z)) =tr([r(X),r(Y)],r(Z)) = = tT(r(X)r(Y)r(Z)) - tr(r(Y)r(X)r(Z)) = = tr(r(X), [r(Y), v(Z)\) = tr(r(X), r([Y, Z])) = wr(X, [Y, Z]). a Если (V, r) = (L, ad), то форма шаа называется формой Киллинга алгебры L. Мы будем обозначать ее В(Х, Y) = wad(X, Y) = tr(ad X ad Y). E.13) Форма ш называется невырожденной, если равенство ш(Х,Ь) = 0 вы- выполняется тогда и только тогда, когда X = 0. Форма Киллинга играет фундаментальную роль в теории алгебр Ли, что видно уже из двух нижеследующих предложений. Предложение 5.2.3. Алгебра Ли L разрешима тогда и только тогда, когда В(Х, Y) = 0 для любых X, Y G L(I). Если L нильпотентна, то В = 0 на L{1) (см. [ГТ]). Предложение 5.2.4 (теорема Картана). Алгебра Ли i полупроста тогда и только тогда, когда ее форма Киллинга невырождена. Полное доказательство см., например, в [БР]. Здесь мы приведем доказательство в одну сторону, а именно, покажем, что если В — невы- невырождена, то L — полупроста. Предположим противное: пусть L — не
§2. Представления алгебр и форма Киллинга 141 полупроста и имеет абелев идеал I С L. Выберем базис {X,} в L. Тогда adXadУХ, = [Х,[У,Х,]] = ?С0(Х,У)Х_,, где Cij(X,Y) — некото- j рые числовые коэффициенты. По определению В(Х, Y) — ^С,,(Х, Y). i Рассмотрим величину B(Z,X) при Z ? I, X ? L. О ad(Z)ad(X)Y = [Z, [X,Y]] = О при Y <Е I, так как [X,Y] e Г, И) ad(Z)ad(X)r = [Z, [X,Y]] el при Y ? I, так как / — идеал. Следовательно, коэффициенты Cn(Z,X) = 0 для всех i и B(Z, X) — 0, т.е. форма Киллинга вырождена. Итак, L — полупроста. ? Билинейная симметричная форма s называется скалярным про- произведением, если s(X, X) > 0 при X Ф 0. Алгебра Ли над Ж называется компактной, если она обладает инвариантным скалярным произведени- произведением. Это название оправдывается тем, что алгебра Ли компактной группы Ли компактна. Так как в комплексной алгебре L любая билинейная форма является индефинитной, то всякая комплексная алгебра Ли L некомпактна, а компактная алгебра является некоторой вещественной формой в L. Примеры компактных вещественных форм приведены в таблице 5.2 (их способ построения мы опишем в §4). Справедливо сле- следующее свойство (см. [БР]): всякая компактная алгебра Ли L является прямой суммой L = N®L = N(BLi®L2®... ФLn идеалов, где N — центр L, L — полупростая, a Li — простые алгебры. Приведем теперь некоторые из обсуждавшихся выше формул в базисе {Х{} (i = 1,2,... ,dimL) в L. Любые элементы алгебры могут быть разложены по этому базису: X = xlXt, Y = ylXt. Если Cjfc — структурные константы в этом базисе, т.е. [Х,-,Х7] = C,*Xfc, то легко убедиться, что (ad(X)F)' = [Х,У]' = C]kx?yk и матрица присоединен- присоединенного представления (ad X)J = C\jXl. Тогда форма Киллинга может быть записана как B(X,Y) = tr((adX)(ad Y)) = (adX)}(adF)| = = C}jCiizly' = gltxly', E.14) где gis = C\jC3si — симметричный тензор второго ранга, называемый метрическим тензором Картана. Если алгебра Ли компактна, то можно выбрать такой базис, что (—gis) = Sis (см. §4). Покажем, что при этом структурные константы мо- могут быть представлены полностью антисимметричным тензором третьего ранга. Определим Сг$г = С1Т1дц. Очевидно, CTSi = -CSTl. Далее,
142 Глава 5. Основы теории алгебр Ли - Csrl = CTsl = J2ctrsB(Xi,Xl) = B([Xr,Xs],X,) = t = B(Xr, [Xs,Xi]) — CslgiT — Csir, где мы воспользовались инвариантностью формы Киплинга. Таким образом, тензор Crs/ полностью антисимметричен. Если <7,> = — 6tr, то С sir = —Сsi- Согласно E.10) любая алгебра Ли может быть представлена в виде полупрямой суммы разрешимой и полупростой подалгебр. Задача клас- классификации всех полупростых алгебр Ли сводится к задаче классификации простых алгебр Ли в силу следующего предложения. Предложение 5.2.5 (теорема Картана). Полупростая алгебра Ли L может быть разложена в прямую сумму попарно ортогональных простых подалгебр L,: L = LX®L2®... ®Lk. E.15) Это разложение единственно. Доказательство. Пусть N — ненулевой идеал полупростой алгебры Ли L. Обозначим JVX его ортогональное дополнение (по отношению к форме Киллинга), т.е. N^ = {X G L : B(X,N) = 0}. Покажем, что ЛГХ — также идеал. Пусть X ? JVX, тогда для любого Y€NhZELb силу инвариантности формы Киллинга получаем: B([Z,X],Y) = B(ad(Z)X,Y) = -B(X,ad(Z)Y) = -В(Х, [Z,Y]) = 0. Таким образом, для любого Z € L [Z,X] G Nx, т.е. Nx — идеал в L. Легко понять, что JV n iVx — также идеал в L и, если X ? N n Nx, то Заметим, что если I — некоторый идеал в L, то, вообще говоря, нужно было бы различать значения формы Киллинга, взятые по отношению к I (будем обозначать их В(,)/) и по отношению ко всей алгебре L (сохраним прежнее обозначение В(,)). Мы покажем сейчас, что для X, Y G I B(X, Yh = В(Х, Y). Пусть {Хт,Х-2,...,Xr-,Xr+i,...,Хп} - базис в L, причем {Xf,...,Xf} — базис в I. Тогда согласно E.14) для X,Yel, Х = х'Хг, Y = yTX-t, B(X,Y) = tr(adX ad Г) = С\?1хху* = Tys = tr(adX Применяя этот результат для идеала I = N1- П N и используя Предло- Предложение 5.2.3, получаем, что N П NL — разрешимый идеал. Так как L
§ 3. Подалгебра Картана 143 полупроста, то N П Nx — 0. Следовательно [N,N^ = 0 и B(N,N±) = O. Если N или N1 полупросты, то мы повторяем процедуру до тех пор, пока L не разложится в прямую сумму простых попарно ортогональных некоммутативных подалгебр, т.е. пока не представим L в виде E.15). Пусть Mi ф Mi ф ... ф Mi — другое разложение алгебры L на простые идеалы. Возьмем некоторый простой идеал Ms, которого нет среди идеалов Lt (г = 1,2,..., к). Тогда Значит, Ms принадлежит центру алгебры L, который равен нулю в силу полупростоты L. Следовательно, разложение E.15) единственно (с точностью до перестановки). D § 3. Подалгебра Картана Важную информацию об алгебре Ли L можно получить, исследуя характеристические многочлены эндоморфизмов adX, X € L. Напо- Напомним, что, если V — векторное пространство и ср 6 gl(V), то характери- характеристический многочлен линейного отображения (р есть х@ = det (My — <p), где 1у — тождественное отображение V на себя. В частности, в соот- соответствии с теоремой Кэли—Гамильтона, оператор х(ф) = 0. Пусть {X],..., Хп} — базис в L и Хи = щХ\+и2Х2+... +ипХп — элемент из L, где щ G Р, а и = (и\,...,и„) — n-мерный вектор из Рп. Мы изучим свойства характеристического многочлена x(^>u) эндоморфизма adXu: X(t,u) = det(* • 1L - adXu) = Г+ц„-|(«)Г' + ... + go(u). E.16) Здесь <7,(и) являются полиномами от щ,... ,ип. Так как adXU(XU) = 0, то преобразование adXu имеет нулевое собственное значение и, сле- следовательно, до(и) = х@,«) = det(-adXu) = 0. Нулевое собственное значение может быть, вообще говоря, вырожденным. Это означает, что существует номер I такой, что до(и) = ... ~ gi~\(u) = 0 и gt(u) ^ 0, т.е. 0 является собственным значением кратности ^ I для всех Хи (Е L. Число I называется рангом алгебры L, ranlcL = I. Если элемент Хц € L такой, что нулевое собственное значение имеет кратность точно I и д{(й) Ф 0, то он называется регулярным элементом алгебры L. Предложение 5.3.1. Пусть L — алгебра Ли ранга I над Р и X — регулярный элемент алгебры L. Представим характеристический
144 Глава 5. Основы теории алгебр Ли многочлен х(') эндоморфизма adX в виде x(t) = *'xi(O» гДе Xi@) Ф О, и определим Н = x\(^dX)L и L* = (adX)lL. Тогда 1) L = H®L*; 2) Н — подалгебра в L и dimff = I; 3)[H,L*] = [X,L*] = L*; 4) подалгебра Н совпадает со своим нормализатором в L, т.е. NL(H) = Я; 5) подалгебра Н является нильпотентной. Доказательство этих утверждений можно найти в [ГГ]. Подалгебра Н, определенная в Предложении 5.3.1, называется подалгеброй Картана. Ниже нам понадобится понятие обобщенного собственного под- подпространства; напомним его определение. Пусть А — линейный опе- оператор, действующий в векторном пространстве V, а Л — одно из его собственных значений. Тогда обобщенное собственное подпростран- подпространство оператора А, отвечающее собственному значению А, определя- определяется так: V(X) = {v G V : существует целое число j > О такое, что (A-X-iyv = 0}. Теперь мы докажем предложение о свойствах представлений алгебры Ли L, которые будут играть ключевую роль в дальнейшем. Предложение 5.3.2. Пусть V — векторное пространство над Р, (V,r) — представление алгебры Ли L и X G L. Пусть L — L@) ф L(ct) (В ... — разложение векторного пространства L на обобщенные собственные подпространства эндоморфизма adX, а V = V(A) ф V(fi) ф ... — разложение V на обобщенные собственные подпространства эндоморфизма г(Х). Тогда r(L(a))V(X) С V(a + А). E.17) Комментарии: 1) Будем считать {0} подпространством в V, отвечающим тем числам, которые не являются собственными значениями. Так, в E.17) мы имеем V(a + А) = {0}, если а + А не является собственным значением г(Х). 2) Подпространство ?@) всегда присутствует в разложении L, так как, по крайней мере, X ? L@) ввиду ad(X)X = [Х,Х] = 0. Доказательство. Пусть Y € L, v G V. Тогда имеем (г(Х) - (а + \))r(Y)v = {[r(X), r(Y)] + r(Y)r(X) - (а + А)г(Г)} v = = r([X,Y}-aY)v+r(Y)(r(X)-\)v = r((ad(X)-a)Y)v + r(Y)(r(X)- X)v. Проводя индукцию по А;, можно показать, что к (г(Х) - (а + X))kr(Y)v = Y^ cir((ad X - a)fc~'F)(r(X) - А)Ч E.18) «=o
§3. Подалгебра Картана 145 где С*к — биномиальные коэффициенты. Если Y 6 L(a) и «6 V(X), то существует целое число j > О такое, что (adX — a)JF = 0 и (г(Х) - Xyv = 0. Тогда из E.18) следует т.е. r(Y)v€ V(a + X). D Следствие. Пусть L — алгебра Ли, X € L, и L = L@) ® L(a) ф ... — раз- разложение L на обобщенные собственные подпространства эндоморфизма adX. Тогда 1) [L(a),L(p)]CL(a + p); 2) L@) есть подалгебра в L, содержащая X. Эти утверждения немедленно следуют из Предложения 5.3.1, если в качестве представления (V,r) взять представление (L,ad) алгебры L. ? Обсудим теперь свойства представлений подалгебры Картана Н. Предложение 5.3.3. Пусть V — векторное пространство над Р, Н — подалгебра Картана некоторой алгебры Ли L, (V,r) — предста- представление Н. Тогда 1) существует набор функций А|,...,А^ на Н со значениями в Р и набор подпространств V\,...,Vk таких, что а) V = VX®V2®... ®Vk; б) для любого X е Н и любого номера j A < j' ^ к) V, содер- содержится в V(Xj(X)), в обобщенном собственном подпространстве преобразования г(Х), отвечающем собственному значению Xj(X), т.е. Vj = {v ? V: для каждого X G Н найдется целое число I ^ 1 такое, что (т(Х) - Xj(X))'v = 0}; 2) функции Xj линейны. Мы не будем доказывать это предложение (желающие могут найти доказательство в [ГГ]), а ограничимся лишь несколькими замечаниями поясняющего характера. Так как подалгебра Картана Н нильпотентна, то в обозначениях Предложения 5.3.2 Я = #@) относительно adX для любого X G Я. Следовательно, если V(X) — обобщенное собственное подпространство преобразования г(Х) с собственным значением А, то г(Я)У(А) С V(A). Этот факт, по существу, и позволяет ввести функции Xj : Н —» Р и подпространства Vj с указанными выше свойствами (конкретные примеры таких функций приведены в следующем параграфе). Поясним идею доказательства свойства 2) на примере абелевой алгебры Я. В векторном пространстве V мы можем выбрать базис {vj} такой, что оператор г(Х) для некоторого X ? Я будет диагоналей: r(X)Vj = Xj{X)vj. E.19a)
146 Глава 5. Основы теории алгебр Ли Тогда V = V) фУгф... Ф V*, где Vj = Pvj. Пусть Y — некоторый другой элемент из Н. В силу абелевости алгебры Н r(Y)Vj С Vj, т.е. r{Y)v3-,= \j(Y)Vj. E.196) Это означает, что в выбранном базисе операторы r(Y) для всех Y 6 Н диагональны. Из E.19а) и E.196) следует, что Xj(X + Y) = А7-(Х)+А,-(У), т. е. функция Aj — линейна. В случае произвольной нильпотентной ал- алгебры Н идея доказательства линейности Aj также состоит в нахождении общего собственного вектора преобразований г(Х), X € Н. Предложение 5.3.3 играет очень важную роль в теории алгебр Ли, так как позволяет понять их общую структуру. Действительно, пусть L — алгебра Ли, а Н — ее подалгебра Картана. Применяя это предложение к представлению (A ad) алгебры Н, мы заключаем, что существуют функции ao,ai,... ,ак из Н в Р и подпространства L(a0), Ь(ац),...,L(ak) в L такие, что L = L(a0) ® 1>(оц) ф ... ®Цак), причем L(otj) = {Y € L: для любого X G Н существует целое число / ^ 1 такое, что (айХ — aij(X))lY — 0}. Так как Н — нильпотентна, то для любого X G Н существует собственное подпространство, отвечающее нулевому собственному значению. Мы положим <*о = 0 и ?@) = {Y e L: для любого X ? Н существует целое число / > 1 такое, что (adX)'F = 0}. Очевидно, что Н С Ь@). Можно показать (см. [IT]), что на самом деле L@) = Н. При этом существенно используется тот факт, что Н совпадает со своим нормализатором в L. Итак, мы приходим к разложению L = H® L(ax) Ф ... Ф L(ak). E.20) Кроме того, из Предложения 5.3.2 следует, что ,),?(а7)]С?(а, + ау). E.21) Функции ot],...ak называются корнями, а разложение E.20) — разложе- разложением по корневым подпространствам алгебры L относительно подалгебры Картана Н. Разумеется, функции at,...,ak мы считаем попарно раз- различными, поэтому существует элемент X G Н, что все числа <Xj(X) отличны от нуля и друг от друга. Если V — векторное пространство и (V, г) — представление алгебры L, то мы имеем также, в соответствии с Предложением 5.3.3, разложение V = V(\l)(BV(\2)®... ®V(\i\ E.22) где \j (j — 1,2,...,l) — функции из Н в Р; они называются весами представления (V, г) алгебры L относительно подалгебры Картана Н.
§ 4. Структура простых алгебр Ли 147 § 4. Структура простых алгебр Ли В силу теоремы Картана (Предложение 5.2.5) любая полупростая алгебра Ли L может быть разложена в прямую сумму попарно ортого- ортогональных простых подалгебр. Поэтому нам достаточно изучить свойства простых алгебр Ли. В этом параграфе мы будем обозначать g простую алгебру Ли, Ц — ее подалгебру Картана, В — форму Киллинга на д. Мы перечи- перечислим основные свойства полупростых алгебр Ли и опишем их структуру. Мы не будем приводить доказательства этих свойств (их можно найти, например, в [Дж], [ГГ]). Справедливость некоторых из свойств предла- предлагается доказать в качестве упражнений к настоящей главе. Кроме того, эти свойства будут проиллюстрированы на примере алгебр А\ — slB,C) и -4.2 = slC,<C). Разложение E.20) по корневым подпространствам в обозначениях настоящего параграфа принимает вид: 8 = &ев(«)©в(/?)ФвG)---, *) = 9@), E.23) где а,/3,7,• • • — корни алгебры д. Обозначим Д множество {а,/3,у,...} всех корней этой алгебры и определим Д = Д U {0}. Очевидно, что Д и Д являются подмножествами в Jj*, в пространстве, дуальном к подалгебре Картана. Начнем перечисление свойств полупростых алгебр. 1) Если а,/3€ А и а + р ф 0, то В(д(а), д(/?)) = 0. 2) Ограничение В^ формы Киллинга В на Ц невырождено, т.е. для любого X ? \) и X Ф 0 существует элемент Y G \) такой, что 3) Подалгебра Картана I) абелева. 4) dimg(a) = 1 для любого аб Д. 5) Если а € Д, то и (—a) G Д. Свойство 4 означает, что подпространство g(or), a G Д равно Сеа, где еа — некоторый элемент, обладающий свойством ad X(ea) = а(Х)еа для всех X G t). Элемент еа, порождающий д(а), а е Д, будем называть корневым вектором. Проиллюстрируем перечисленные выше свойства на примерах. Пример 1. Алгебра А\. Стандартный базис — матрицы Паули: 0 1\ /0 -i\ (\ 0 /0 -i\ =(г oj' Однако, корневая структура алгебры А\ проявляется наиболее четко в другом базисе: on », ¦ . /о о\ Тг = 1Тз E24)
148 Глава 5. Основы теории алгебр Ли Коммутационные соотношения в этом базисе имеют следующий вид: [т+,т_] = 2тг. E.25) Для дальнейшего нам понадобится явный вид операторов присоединен- присоединенного представления (A\,ad) алгебры А\. Если элементу т+ векторного пространства д — А\ мы сопоставим столбец @1, элементу т_ — W /0\ /0\ столбец I 1 I, а тг — I 0 ], то в таком базисе матрицы, отвечающие эндоморфизмам adr+, adr_, adr2, как следует из E.25), имеют вид: /0 0-1N / 0 0 0\ /1 0 0\ adr+ =10 0 0 , adr_ = ( 0 0 1, adrz = 10—101. E.26) \02 0/ V-200/ \0 00/ Теперь не составляет труда вычислить по формуле E.13) значения формы Киллинга на базисных элементах: В(т+,т+) = В(т+,т2) = В(т-,тг) = В(т.,т.) = 0; В(т+,т_) = 4; B(tz,tz) = 2. E'27) Определим ранг алгебры. Возьмем произвольный элемент Хи = щт++и2т-+и-$тг бди вычислим для него характеристический многочлен X(t, и) = det(t ¦ 1 - ad Xu) = t3 + g2(u)t2 + д\ (u)t + до(и) (см. § 3). В со- соответствии с общей теорией до(и) = 0, а для остальных коэффициентов gt(u), исходя из E.26), получаем: #>(«) = 0, д\(и) = -(«з + 4щи2). Следовательно, rank A\ = 1 и т2 является регулярным элементом. Так как dim t) = rank g = 1, то подалгебра Картана t) может быть реализована на элементе тг. Построим теперь в явном виде корни алгебры А\. Произвольный элемент X ? Ц имеет вид: X = гтг, г G С. Тогда, в соответствии с E.25), ad Х(т±) = ±гт±, ad X(tz) = 0. E.28) Для всех Y ? д — А\ мы можем записать adX(F) = ay(X)Y и собственные значения «у являются линейными функциями на f) со значениями в С, т.е. «у 6 f)*. Мы имеем два ненулевых корня ат+ и ат и для любого г ? С aT+(rTz) = r, aT_(rrz) = -r. E.29)
§4. Структура простых алгебр Ли 149 В данном примере множество Д = {ат+,ат_}, а разложение по корневым подпространствам имеет вид: д = Ах - I) ф Ст+ © Ст_, 1) = Ctz , т.е. д(ат+) = Ст+, д(ат_) = Ст_ (свойство 4). Свойство 3 очевидно. Свойства 1 и 2 следуют из равенств E.27). Свойство 5 вытекает из того факта, что ат = —ост+ (см. E.29)). Пример 2. g = А2. Стандартный базис, обычно используемый в физике, следующий: А, = 1 0 0 , А2 = i 0 0 , Аз = А4= ¦Л.7 Для наших целей более удобным оказывается другой базис: t± = -(Ai±iA2), tz = -A3, v± = -(A4±iA5), «± = -(A6±*A7), у = -/=А8. Приведем коммутационные соотношения, которые нам понадобятся в дальнейшем: 1 0 0 0 0 0 0 _ j 0 0 0 1 0 1 0 0 0 0 \ / 1 1 -u±, [tz,v±] ~ ±-v±, E.30) Рассмотрим представление (^2,ad) алгебры А2. Пусть s,- (i = 1, 2,...,8) — столбец из l8, у которого на г'-м месте стоит 1, а осталь- остальные элементы — нули. Если t+,t-,tz,u+,u-,v+>v-,y соответствуют е,,е2,...,е8, то из E.30) следует, что adtz и ad у суть диагональные матрицы 8x8 вида (задача 5.11) E3|)
150 Глава 5. Основы теории алгебр Ли Можно показать, что B(tz,tz) = 3, B(y,y) = 4, B(tz,y) = 0, B(t+,u±) = 0 и т.д. E.32) Исследование характеристического многочлена показывает, что rank А2 = 2 и tz и у являются регулярными элементами. Так как dim f) = 2, то подалгебра Картана f) может быть натянута на tz и у; из E.30) следует, что Ц — абелева алгебра (свойство 3). Запишем произвольный элемент X е fj в виде X = ptz + qy, p,q G С. Согласно E.30) adX(t±) = ±pt±, adX(u±) = ± (-^ + q) u±, E.33) adX(v±) = ± (| + g) v±, adX(tz) = ad X(y) = 0. В этом случае множество Д содержит 6 ненулевых корней: причем Обозначим а] = at+, а2 = аи+, а3 = av+. Тогда at_ = —a\, otu_ = -a2, а„_ = —а3 (свойство 5). Имеем 0(«i) = Ct+, д(—а\) — Ci_ , д(а2) — Си+ и т.д. (свойство 4). Свойства 1 и 2 проверяются прямым вычислением (см. E.32)). Обычно в теории простых алгебр Ли выбирают некоторую кано- каноническую билинейную форму, которая отличается множителем от формы Киллинга. Мы будем обозначать эту форму (, ): (X,Y) = bB(X,Y), X,Y€g. E.35) Множитель Ь будет фиксирован ниже. Определим для любого а € Д элемент ha (= \) следующим образом: a(X) = (ha,X) E.36) для любого 16^. Это позволяет также определить невырожденную билинейную форму в I)* (на самом деле она является скалярным произведением) формулой (а, 13) = (ha, hp) = a(hp) = p(ha), a,/3€A. E.37) 6) Если а ? А, то {а,а) — положительное число.
§ 4. Структура простых алгебр Ли 151 Величину (а, а) будем называть длиной корня. В алгебре, вообще говоря, могут быть корни различной длины. Мы фиксируем коэффи- коэффициент Ь в E.35) условием, что самые длинные в данной алгебре корни имеют длину 2. Пример 1. Обозначим в алгебре g = А\ а — ат+. Легко проверить, чтоЛа = 2тг, Ь=\, (а,а} = 2. Пример 2. g = А2. Получаем ha, = 2tz, ha2 = -tz + \y, ha2 = tz + \у, Ь = |. При этом (a,, a,} = <a2, a2) = 2, (a,, a2) = -1. E.38) Так как dimf) = 2, то в качестве базисных элементов в подалгебре Картана возьмем hai и hai. Элемент hai = ha, + hai. Итак, мы выяснили, что полупростая алгебра Ли д состоит из элементов двух типов: а) Из элементов, образующих абелеву подалгебру Картана f) С g с dimf) = rankg. Для полупростых алгебр Ли g подалгебру Картана f) часто определяют как максимальную абелеву подалгебру в д, такую что для произвольного lei) дополнение каждого инвариантного подпространства в g относительно adX также является инвариантным подпространством в g относительно ad-X". б) Из корневых векторов еа, каждый из которых отвечает од- одному из корней а 6 Д С f)'. Отметим, что Д не является линейным пространством. Разложение E.23) по корневым подпространствам имеет вид: g = J) 0 Сеа ф Се_а 0 С^ © Се_^ 0 .... E.39) Коммутаторы между элементами различных подпространств следующие: а) если h G i), ea — корневой вектор, то [h, ea] = a(h)ea, a(h) = (ha, h); E.40) б) если еа и ед — корневые векторы, то {0, если а + C не есть корень, элемент из f), если а + /3 = 0, E.41) На,реа+р, если а + /3 G Д, где Na,p — некоторые константы; их значения нам не понадобятся. Уточним, чему равен элемент [е„,е_а] € I). Имеем для любого h G I) ([ea,e-a],h) - (ea,[e-a,h]) - a(h) (ea,e_a) = (ha,h) (ea,e_a) , где мы воспользовались инвариантностью формы (,). Отсюда [ea,e_a] = (ea,e_a)/ia.
152 Глава 5. Основы теории алгебр Ли Обычно корневые векторы нормируют условием (ео,е_а) = — 1. Тогда [ea,e-a] = -ha. E.42) Рассмотрим теперь векторное пространство V и представле- представление (V,r) алгебры д. Пусть А — некоторый вес этого представления. По- Последовательность весов А —тог, А —(т— 1)а,..., А —а, А, А+а,..., \+ра, где а (Е А, т и р — неотрицательные целые числа, будем называть а-серией (или а-последовательностью) весов, проходящей через А. 7) Пусть А + ja, —m ^ j ^ р есть а-серия весов, проходящая через А. Тогда _(А, а) т-р = 2- -. E.43) (а, а) Пример 1. В случае д — А\ этот результат воспроизводит известную классификацию представлений. Как мы уже выяснили, dim f)* = dim f) = 1 и поэтому любой вес А любого представления А\ равен sa, где а <Е Д, a s — число, характеризующее представление. Пусть представление имеет веса Ао, Ао — а,..., Ао — qa и Ао = soa. Исходя из E.43), имеем, что целое число q равно «) _ = 2s0- q 2 (а, а) Таким образом, so = | — спин представления и принимает значения О, 1/2, 1, 3/2,... Собственные значения (веса) представления со спином so имеют вид sQ{a,a), (s0 — \)(а,а),... ,—so(a,a), а размерность этого представления равна q + 1 = 2s0 + I. Очевидно, что формула E.43) справедлива и для представления (д, ad) алгебры д. 8) Если а & А и ка Е А (к — целое число), то возможны лишь значения к = ±1. Пусть X, Y G Ц. Нетрудно понять, что В(Х, Y) = ^(dim g(a))a(X)a(Y). E.44) С учетом свойства 4 получаем, что если а,/3 G Д, то (a, j3) = (haihp) = ftX>,7>G,0>. E.45) 9) Множество Д порождает I)* (как линейное пространство). Изучим структуру множества корней Д. Для этого введем упоря- упорядочение среди корней. Оно будет в некоторой степени произвольным,
§ 4. Структура простых алгебр Ли 153 так как естественного упорядочения среди корней не существует. Пусть «i,аг,...,а/ некоторый базис в I)*, так что любой элемент р G {)* может быть записан в виде р = 5^^-ai» A" 6 К. Мы будем говорить, i что элемент р положителен, если ct > О или если с\ = О, а сг > О и т.д. Аналогично, р отрицателен, если первый ненулевой коэффициент С{ < 0. Тогда Д = Д+ U Д_, где Д+ (Д-) — множество положитель- положительных (отрицательных) корней. Положительный корень, который нельзя представить в виде суммы двух положительных корней, будем называть простым корнем. Обозначим множество простых корней ж, ж С Д+. Пример 1. В случае g = А\ Д+ = {а}, тг = {а}. Пример 2. В случае g = Aj есть различные возможности. Можно выбрать Д+ = {a\,cti,ai}. Из E.34) следует, что аз = а\ + аг и тг = {а|,аг}. Другой выбор положительных корней: Д+ = {аь—а2,а3}. Так как а\ — а3 + (—oci), то ж = {—«2, <*з}- 10) Если а,/3 G тг, то or — /3 не является корнем. 11) Если а, /3 6 7Г и а Ф /3, то (а,/3) ^ 0. Выше мы определили понятие длины корня. Теперь определим угол ар между корнями а и /3 следующим естественным образом: cos ар = \w\\ww E.46) Мы можем изобразить корни алгебры в виде векторов с общим началом, причем длины векторов пропорциональны длинам соответствующих корней, а угол между векторами определяется формулой E.46). Такие схематические изображения корней называются корневыми диаграммами алгебр. Пример 1. g = А\. Имеется два корня а и (-а). Их длины равны, a cos(a(—a)) = — 1. Корневая диаграмма этой алгебры приведена на рис. 12 а. -а, а, -а -а. -а, а) б) Рис. 12.
154 Глава 5. Основы теории алгебр Ли Пример 2. Множество Д алгебры g = А2 содержит 6 корней: at\, а2, «з = <*i + «2> — аь ~а2 и —«з- Имеем а[а2 — 120°, «Г^з = 60°. Соответствующая корневая диаграмма изображена на рис. 12 б. 12) Пусть ж совокупность простых корней из Д. Тогда а) ж = {«1,...,«/} образует базис в [)*. б) если /3 6 Д+, то /3 = 7i|O!j + пг^г + •• • + Я/<*ь где та,- — неотрицательные целые числа. Свойство 12 а) означает, что число простых корней алгебры g равно / = dim fj* = rankg. Введем теперь матрицу Картона А, содержащую в себе всю информацию о структуре алгебры д. Она имеет размер 1x1 и ее элементы определяются формулой Aij , _2i«iU> E.47) Отметим некоторые очевидные свойства элементов матрицы Картана: 13) а) Аи = -2; б) если А^ Ф 0, то и Aji ф 0; в) A{j — целое число, причем А^ ^ 0 при i ф j; г) А^Aji = 4cos(a^5j) = 0,1,2,3 при гф]. Множество ж простых корней алгебры g называется неразложи- неразложимым, если нельзя указать два непустых его подмножества ж\ и ж2, таких, ЧТО Ж\ U 7Г2 = Ж, Ж\ П 7Г2 = 0 И («1,02) = 0 ДЛЯ ЛЮбЫХ Ol\ G 7Г| И аг € 7Г2. 14) Множество ж простых корней неразложимо тогда и только тогда, когда алгебра Ли g проста. Оказывается, что любому множеству ж = {«],...,а<} С Ж', со- состоящему из линейно-независимых элементов a\,...,ai, такому, что А^ = — 2?~j4 суть целые числа со свойствами A3), а ( , ) — ка- каноническое скалярное произведение в К' (такое множество называют ж -системой), соответствует полупростая алгебра Ли. Поэтому задача классификации простых алгебр Ли была сведена к классификации всех неразложимых тг-систем. В работе [Ды1] было доказано, что существует 4 бесконечные серии простых комплексных алгебр Ли, отвечающих клас- классическим алгебрам, и 5 так называемых исключительных комплексных алгебр Ли. Оказалось также, что множества простых корней этих ал- алгебр удобно изображать в виде графических схем, получивших название диаграмм Дынкина. Они строятся по следующему правилу. Сопоставим каждому простому корню а,- 6 ж кружок, около которого укажем величи- величину (ai,ati). Далее, кружки, отвечающие корням а,- и а,, соединим AijAji линиями. Если А^ = 0, то эти кружки не соединяются. Диаграммы Дынкина для алгебр классических серий А„, Вп, С„ и Dn, (см. §1), а также для исключительных алгебр G2, F4, Е^, Е1 и Eg приведены
§4. Структура простых алгебр Ли 155 на рис. 13 (нижний индекс в обозначении алгебры указывает ее ранг). Отметим, что в литературе часто не указывают на диаграмме квадраты длин корней, а вместо этого на линиях, соединяющих простые корни разной длины, ставят стрелку, направленную в сторону более короткого корня. По диаграмме Дынкина можно восстановить матрицу Картана, а затем и всю алгебру Ли. «1 а2 «з "и-1 ап а, а2 а„1 а„ А„ о о о— • • • —о о с о о— • • • —» " #4 «Ч Л €\ Л ri л -^ а, а2 В„ о 2 3D 1 3 о ее F< I 2 2 2 2 Рис. 13. Пример 2. Диаграмма Дынкина алгебры g = Аг изо- J_ о2 бражена на рис. 14. Из нее следует, что в алгебре два простых 2 2 корня ct| и а2 и (а],а|) = @:2,0:2) — 2. Величина АпА2\ = 1. Рис 14 Значит, согласно E.47), 2 • (а^аг) = —Ai2A2\{<xi,<xi){<X2>a2) = 1> 4 и из свойства 13 в заключаем, что An = -А21 = +1 и (а\,а2) = — 1. Итак, матрица Картана имеет вид E.48) Таким образом, подалгебра Картана двумерна и ее базис состоит из элементов hQl и ha2. Кроме того в Лг имеются корневые векторы е±в|, е±а2. Какие еще имеются корни и корневые векторы? Чтобы выяснить это, рассмотрим а2-серию, проходящую через ot\ : а.\ + joi2- Из E.43)
156 Глава 5. Основы теории алгебр Ли и E.48) получаем, что т-^2(а"а2) • Так как т = 0, то р = 1, т. е. эта серия состоит из а\ и а\ + а2. Изучение <х\-серии, проходящей через а2, приводит к выводу, что в А2 есть лишь один непростой положительный корень ац +а2. Таким образом, алгебра А2 включает еще корневые векторы eai+aj и е_(а|+СГ2)- Тем самым мы полностью восстановили алгебру Ли А2; коммутационные соотношения даются формулами E.40) —.E.42). В дальнейшем нам понадобятся понятия старшего веса предста- представления и сигнатуры представления; сейчас мы их определим. Пусть (V, г) — конечномерное неприводимое представление алгебры g и V = V(X) ф V(n) © ... есть разложение пространства V по весовым подпространствам, а Л, fi,... — веса представления (см. E.22)). В силу конечномерности пред- представления всегда существует вес w, такой что для любого положительного корня а € Д+ алгебры g ш + а уже не является весом. Тогда вес ш называется старшим весом представления. Далее, пусть v G V(u) и ad(f))w С Cv. Такой вектор v называется старшим (весовым) вектором представления (V,г), он порождает все пространство V при действии на него операторами г(Х), X € д. Если ш — старший вес, то сиг- сигнатурой представления называется совокупность чисел [т\,т2,... ,mj], вычисляемых по формуле пц = 2р^\, «= 1,2,...,* = ranks, E-49) где а, — простые корни алгебры д. Конечномерное неприводимое представление однозначно задается своим старшим весом и сигнатурой. Покажем теперь, как по данной комплексной алгебре g с разло- разложением E.39) по корневым подпространствам построить ее компактную вещественную форму. Определим элементы: "а, = «Лац Ъа = -^-J^-i Ca = i ° f-~", E.50) где а, G тг, а G Д. Возьмем подмножество g в д, образованное элемен- i тами вида X = Z)/*>*<,, + ]Г) vaba+ J2 Хо,са, где (ii,fi,Xi G 1. Нетрудно i=i аед оед показать, что дс = д и В(Х,Х) ^ 0 для любого X G д. Это означает,
§ 4. Структура простых алгебр Ли 157 что g — компактная вещественная форма алгебры д. Отображение <т комплексной алгебры д в себя, удовлетворяющее условиям а(рХ + qY) = рсг(Х) + qa(Y), а2 = 1 (тождественное преобразование в д) для любых X и Y из д называется сопряжением. Здесь мы рассмотрим лишь сопряжение <т, заданное следующим образом: а(Х) = X = -X, если X € Ц; <т(еа) = ёа = е_а, если еа — корневой вектор в д. Согласно E.50) компактная вещественная форма состоит из элементов, инвариантных относительно такого сопряжения. Общая алгебра ЛиЬ Комплексная полупростая алгебра S D Радикал N Комплексные простые алгебры Ав, Вп, С„, Dn, G2, FA, E6, E7, E8 Нильпотентные алгебры / / \ \ Просты веществен компактн е ные ые алгебры Простые вещественные некомпактные алгебры Абелевы алгебры Рис. 15. В заключение параграфа приведем схему (рис. 15), основанную на результатах этой главы и иллюстрирующую соотношения между различными типами алгебр Ли; эта схема взята из книги [БР].
Глава 6 Размерная редукция симметричных калибровочных полей В двадцатые годы в работах Т. Калуцы и О. Клейна [КК] была выдвинута гипотеза о том, что в микромире пространство-время имеет размерность больше четырех. А именно, они рассмотрели теорию грави- гравитации в пятимерном пространстве вида М4 х 51 и показали, что если на поля наложить требования инвариантности относительного каноничес- канонического действия группы U{\) на пространстве дополнительного измерения (окружности 51), то такая теория может быть интерпретирована как четы- четырехмерная теория гравитации, взаимодействующей с электромагнитным полем. Впоследствии эта идея была обобщена на случай произвольных однородных пространств дополнительных измерений G/H, при этом реинтерпретация сектора G-инвариантных полей многомерной теории в терминах четырехмерных полей получила название размерной редукции. Мы еще вернемся к задаче размерной редукции гравитации в главе 7. А здесь отметим, что такое понимание размерной редукции является весьма общим и может применяться не только к гравитационному, но и к другим, в частности, к калибровочным полям. Однако в последнем случае наложение на многомерные калибро- калибровочные поля требования инвариантности оказывается слишком ограни- ограничительным. Специфика калибровочных теорий позволяет ослабить это требование и рассматривать класс калибровочных полей, инвариантных относительно действия группы симметрии G с точностью до калибро- калибровочного преобразования. Такие поля получили название симметричных калибровочных полей. Размерная редукции симметричных калибровочных полей оказа- оказалась весьма интересной с точки зрения физических приложений, т.к. позволяет получить из многомерных чисто калибровочных теорий че- четырехмерные модели Хиггса с жестко фиксированными параметрами. Построение методом размерной редукции таких моделей будет подробно обсуждаться в конце этой главы.
160 Глава 6. Размерная редукция симметричных калибровочных полей Для проведения размерной редукции симметричных калибровоч- калибровочных полей удобно использовать геометрическое описание калибровочных теорий. В геометрическом подходе симметричным калибровочным полям соответствуют инвариантные связности. Поэтому мы сначала установим это соответствие, приведем стандартные математические результаты об инвариантных связностях, а затем применим их к задаче размерной редукции симметричных калибровочных полей. § 1. Симметричные калибровочные поля и инвариантные связности Рассмотрим в пространстве Е с фиксированной метрикой у чисто калибровочную теорию с калибровочной группой К. В соответ- соответствии с результатами предыдущей главы, на геометрическом языке это означает, что нам задано некоторое главное расслоенное пространство Р(Е,К;Ч?,к) и связность в нем; соответствующую форму связности обозначим ш. Пусть на расслоении Р(Е,К) действует слева группа G как группа автоморфизмов этого расслоения, т.е. действие G коммутирует с действием структурной группы. Обозначая это действие Lg, имеем: L9\9* = L9\ ° L9i Fla) Lgo4k = *koLg. F.16) Действие G на Р(Е,К) порождает действие этой группы на Е, которое мы считаем нетривиальным и обозначаем Од; оно определяется из условия noLg = Ogoir. F.2) Для того, чтобы группу G можно было рассматривать как группу симметрии теории, необходимо, чтобы метрика 7 была (j-инвариантна. Связность в расслоении Р(Е,К) называется G-инвариантной, если форма связности ш инвариантна относительно действия Lg для любого д ? G. Таким образом, мы имеем следующие условия G-инвариантности теории: 7, F.3а) L*u) = ш. F.36) Пусть над окрестностью U С Е задано сечение s : U —> Р. Тогда на U определено калибровочное поле А = s*u>. He ограничивая общности, будем считать, что действие G оставляет U инвариантной, и рассмотрим трансформационные свойства поля А относительно этого
§ I. Симметричные калибровочные поля и инвариантные связности 161 действия. Для этого заметим, что из определения сечения и из F.2) следует, что 1TO(LgOS) = Од, и поэтому отображение sg :U —* Р, определенное как sg = Lg о s о Og-i F.4) тоже есть сечение над U. Поэтому в расслоении тг^1 A7) существует вертикальный автоморфизм Vg, переводящий s в sg: sg = Vgo s. F.5) Возьмем обратный образ формы ш относительно сечения sg. Получим s*gu) = (Lg о s о Од-\)*ш = О* ,(s*(LgU})) = О* у А. Выражение F.5) да- дает возможность вычислить s*A другим способом. Вспоминая, что, в соответствии с D.38), вертикальный автоморфизм Vg характеризуется не- некоторым эквивариантным отображением тд : Р —* К, и учитывая D.41), в этом случае имеем: 8*дш = s*(Vg*u>) = ad(Pgy'A + (pgyldp9, где мы обозначили s*rg = pg. Сравнивая оба результата, мы видим, что для поля А, являющегося обратным образом инвариантной связности, преобразование симметрии эквивалентно калибровочному: О*д->А = ad(pgy'A + (pg)-ldpg. F.6) Таким образом, мы установили связь между симметричными калибро- калибровочными полями и инвариантными связностями, которая позволяет использовать для описания симметричных калибровочных полей извест- известные математические результаты, к изложению которых мы и переходим. В математике изучены инвариантные связности в расслоении Р(Е,К) для случая, когда группа G действует на Р слой транзитивно, т. е. для любых двух слоев из Р существует элемент из G, переводящий один слой в другой. Это означает, что группа G действует транзитивно на Е, и Е есть некоторое однородное пространство G/H. Мы ограничимся здесь рассмотрением только редуктивных пространств G/H, т.е. таких пространств, для которых существует разложение алгебры Ли g группы G в прямую сумму алгебры Ли f) группы Я и некоторого линейного пространства m, g = f) ® т, обладающее свойством ad-HTm С т, или, эквивалентно, [l),m] С т. Важный специальный случай инвариантной связности дает следу- следующее: 6 iiK. 311
162 Глава 6. Размерная редукция симметричных калибровочных полей Предложение 6.1.1. Пусть G — связная группа Ли, а Я — ее замкнутая подгруппа, такая что однородное пространство G/H редуктивно. Тогда 1) f)-компонента вц = ш канонической 1-формы в в G определяет в расслоении G {G/H, H) связность, инвариантную относительно левых сдвигов элементами из G; 2) форма кривизны этой связности задается формулой п=-\[вт,вт]ь; F.7) 3) любая связность в G (G/H, H), инвариантная относительно левого действия G на себя, определяет редуктивное разложение 0 = f) ф m и может быть построена описанным в A) способом. Доказательство. 1) Определение 1-формы 0 (§5, гл. 2) и закон ее пре- преобразования при правых сдвигах позволяют легко проверить, что ш = в^ удовлетворяет условиям A) и B), приведенным в Предложении 2.10.1 и налагаемым на форму связности. Горизонтальным подпространством для соответствующей связности будет подпространство, натянутое в ка- каждой точке д € G на левоинвариантные векторные поля, порожденные элементами из т. 2) Воспользовавшись для п структурным уравнением B.74), получим Остается заметить, что выражение в фигурных скобках есть [)-компонента уравнения Маурера—Картана B.44) для в и поэтому исчезает. 3) Для произвольной левоинвариантной формы связности ш в G (G/H, H) определим подпространство m как множество левоинвариантных век- векторных полей X, для которых ш(Х) = 0. Очевидно, д = 0фт, иш = вь. о Инвариантные связности в произвольном расслоении Р (G/H,K) описываются теоремой Вана (см. [КН], глава 2, § 11). Здесь мы приведем доказательство этой теоремы для случая редуктивных однородных про- пространств G/H в форме, удобной для нашего дальнейшего рассмотрения. Прежде чем формулировать теорему заметим, что действие груп- группы G на P(G/H,K), которое мы считаем левым и обозначаем Lg, определяет гомоморфизм т : Н —> К. Действительно, возьмем некото- некоторую точку ро € тг~1(о), где о — [е] есть начало G/H. Поскольку Н есть стационарная подгруппа точки о, то LhPo G я1 (о), и мы можем определить т(Л) соотношением F.8)
§ 1. Симметричные калибровочные поля и инвариантные связности 163 Разумеется, гомоморфизм г зависит от выбора точки ро- Поэтому в дальнейшем мы считаем точку р0 фиксированной. Предложение 6.1.2. Если связная группа Ли G действует слой-транзитив- но как группа автоморфизмов главного расслоения P(G/H,K), то существует взаимно-однозначное соответствие между G-ин- вариантными связностями в Р и линейными отображениями ф : m —»• t, удовлетворяющими условию эквивариантности <f>(ad(h)m) = ad т(Н)ф(т), h ? Н, m G m, F.9) где r(h) определено в F.8). Доказательство. Определим отображение i : G -+ Р формулой i(g) = Lgpo и возьмем обратный образ относительно этого отображения некоторой G-инвариантной формы связности ш на Р, г*ш = а. Обозначая левое действие д € G на д' (Е G просто дд' и принимая во внимание вытекающее из определения г соотношение i од = Lg о г, для а получим: д*а = (д* о i*)uj = (г* о Ь*д)ш — а. Это означает, что форма а левоинвариантна, и поэтому она однозначно выражается через каноническую 1-форму в на G, а = Л@), где А есть линейное отображение А : g —> 6. Пусть b есть левоинвариантное поле на G, порожденное эле- элементом Ь G д. Вычислим а(Ь), используя тот факт, что действие подгруппы Н в точке р0 эквивалентно действию подгруппы т(Н) струк- структурной группы К (см. F.8)). По определению а имеем а(Ъ) = w(i'b). Из определения отображения г и из левоинвариантности Ь следует, что поле i'b инвариантно относительно действия Lg. Поэтому функция u)(i'b) по- постоянна, и ее можно вычислить в точке р0. Вследствие F.8) в этой точке i'b — (т(Ь))*, где (тF))* обозначает фундаментальное векторное поле в Р (и той же буквой г обозначен гомоморфизм алгебр Ли, отвечающий гомоморфизму г : Н —> К). Окончательно получаем а(Ь) = т(Ь) = А(Ь). Отсюда следует, что А|(, = г. Далее, обозначая правое действие h G Н на G через ify,, по определению отображения г имеем: R*hoi* = (io Rh)* = (ФГ(Л) о i)* = i* о *;(Л). Применяя первое и последнее выражения этой цепочки к ш, учиты- учитывая ее закон преобразования при действии структурной группы Ф*(Л) и трансформационные свойства в относительно преобразования R*h, получим ,, R*ha = 1 1
164 Глава 6. Размерная редукция симметричных калибровочных полей Для ограничения Л|т = ф это и есть условие эквивариантности F.9), т.е. мы поставили в соответствие форме ш отображение ф с требуемыми свойствами. Обратно, по отображению ф F.9) можно восстановить связность и форму ш. Пусть X есть левоинвариантное векторное поле на G, отве- отвечающее элементу X ? т. Определим в точках подмногообразия i(G) горизонтальное подпространство Нцд) как подпространство, порожден- порожденное векторами вида (ф(Х))* — i'X, где (ф(Х))* есть фундаментальное векторное поле, порожденное элементом ф(Х) ? Ъ. Из определения i найдем, что ж о i постоянно на элементах из класса [д], т. е. ж oi — жа, где же — каноническая проекция в Р (G/H,H). Из этого следует, что ж' ((ф(Х))* — i'X) = —ж'с(Х). Поэтому касательное пространство Тцд)Р есть прямая сумма так определенного горизонтального подпространства и вертикального подпространства. Поскольку G действует на Р слой-транзитивно, i(G) есть под- расслоение в Р; нетрудно понять, что его структурная группа есть т(Н). Любой элемент р € Р можно представить в виде р = Фаг(д), а Е К, д G G, причем а и д определены с точностью до умножения на элементы т{ЬГх) и h. Горизонтальное подпространство в р определим как образ го- горизонтального подпространства в i(g) при отображении Ф„. Легко проверить, что, благодаря свойству F.9) отображения ф, это определение не зависит от выбора а и д. Покажем, наконец, что так определенной связности отвечает форма связности ш. Для этого вычислим и (ф'а((ф(Х)У - i'X)) = ad а [ф(Х) - а(Х)} = 0. Это означает, что мы восстановили исходную связность по отображе- отображению ф. и Замечание. Инвариантная связность в Р, для которой ф = 0, называется канонической связностью. Как видно из доказательства Предложения 6.1.2, горизонтальные компоненты векторов вида i'X, где X — левоинвариантное векторное поле на G, отвечающее I6m, порождают горизонтальные подпростран- подпространства в точках i(G). Поэтому форма кривизны п инвариантной связности полностью характеризуется своим сужением на это подрасслоение, со- совпадающим, очевидно, с i*u. Предложение 6.1.3. Для сужения формы кривизны инвариантной связ- связности на подрасслоении i(G) или, эквивалентно, для формы i*Q
§ 1. Симметричные калибровочные поля и инвариантные связности 165 на G имеет место представление г*п= х- [Ф(вт),ф(вт)] - 1-т([вт,вт]ь) - 1-Ф([ет,от]т) . F.Ю) Доказательство. Используя структурное уравнение для U и то, что г*ш = а — А(в), получаем i*U = A(d9) + 1- [А(в),А(в)] = Х- [А(в),А(в)] - Х-А{[в,в\). При переходе ко второму равенству мы приняли во внимание уравнение Маурера—Картана. Разлагая затем в на Ц- и m-компоненты: в = 0f, + 0m, вспоминая, что Л|(, = т, Ajm = <p и обладает свойством F.9), получаем F.10). ? Следствие. Инвариантная связность плоская тогда и только тогда, когда отображение ф : m —> f продолжает гомоморфизм т : t) —> t до гомоморфизма Л : g —»t. Доказательство. Как мы отмечали в § 12 главы 2, связность плоская тогда и только тогда, когда ее форма кривизны нулевая. Для инвариантной связности обращение в нуль формы кривизны F.10) эквивалентно тому, что ф продолжает г до гомоморфизма Л : g —»t. О Замечание. Результаты Предложений 6.1.2, 6.1.3 могут быть легко рас- распространены на линейные связности. Действительно, как мы знаем из главы 3, действие G на G/H канонически поднимается до действия G на расслоении линейных реперов L (G/H). Зафиксируем некоторый ре- репер ио в точке о, т.е. и0 6 тг""'(о). Действие преобразований из подгруп- подгруппы Н на и0 порождает гомоморфизм А : Н —> GL(n,R) (та = dim G/H), который, очевидно, совпадает с представлением изотропии в точке о. Левоинвариантные линейные связности в G/H находятся во взаимно- взаимнооднозначном соответствии с линейными отображениями ф : m —»¦ gl(n), удовлетворяющими условию ф(ай(К)т) = ad \(К)ф(т), габт. Линейная связность, соответствующая ф — 0, называется канонической связностью. Если G действует на G/H эффективно (т.е. Н не содержит нормальных делителей G), то на L {G/H) G действует свободно, и вследствие этого подмножество Q = {Lgu0, g G G} в L (G/H) есть подрасслоение, изоморфное G (G/H,H). Ясно, что каноническая связность в L {G/H) редуцируема к канонической связности в Q = G (G/H,H). Отметим еще, что если на G/H задана G-инвариантная метрика, то каноническая связность G/H является метрической, но в общем случае обладает ненулевым кручением. ?
166 Глава 6. Размерная редукция симметричных калибровочных полей § 2. Размерная редукция симметричных калибровочных полей Пусть в пространстве Е — М х G/H с фиксированной метрикой 7 = rj(By (rj — метрика на М, a у — на G/H) задана калибровочная теория с калибровочной группой К и со стандартным действием. В дальнейшем мы предполагаем группы G и К компактными. На пространстве Е такого вида естественно определено действие группы G, которое сводится к каноническому левому действию G на G/H. Мы будем считать, что метрика у инвариантна относительно этого действия, а значит, и метрика у 6?-инвариантна, т.е. О*ду = ъ F.11) где мы сохранили обозначения § 1 для действия G на Е. Предположим, что в рассматриваемой теории есть сектор Сг-сим- метричных калибровочных полей. В соответствии с результатами § 1 это означает, что существует некоторое главное расслоенное пространство Р(Е, К; Ф, 7г), на котором задано действие группы G автоморфизмами Lg, проектирующееся в действие Од на Е (т. е. выполняются соотношения F.1), F.2)), и Сг-симметричным калибровочным полям на Е соот- соответствуют инвариантные формы связности ш в этом расслоении, для которых L*gG) = G>, VgEG. F.12) Поскольку для симметричных полей действие группы G сводится к калибровочному преобразованию, лагранжиан на таких полях не зависит от точек пространства G/H, т. е. фактически представляет собой лагранжиан некоторой теории в пространстве М (которое в дальнейшем будет иметь смысл четырехмерного пространства-времени). Чтобы явно построить эту эффективную теорию, нужно выразить G-симметричные конфигурации полей на Е в терминах полей, заданных на М, затем подставить это представление в лагранжиан и получить эффективное действие теории в М. Эта процедура и есть размерная редукция симметричных калибро- калибровочных полей. Для ее проведения удобно использовать геометрическое описание таких полей как инвариантных связностей. На этом языке первый шаг размерной редукции — представление симметричных полей на Е в терминах полей на М — означает, что нам нужно описать инвариантную форму связности ш на Р в терминах геометрических объектов, заданных на некотором главном расслоении с базой М. Обратимся для этого к конструкции примера 3 §8 главы 2. Обозначая через о начало в G/H, определим подмногообразие М С Е, М = М х {о}, состоящее из неподвижных точек подгруппы Н, т.е. для
§2. Размерная редукция симметричных калибровочных полей 167 Vh € Н и Vz € М OhZ = z. Ясно, что порция Р над, М, Р = ж 1(М), есть главное расслоенное пространство со структурной группой К и базой М. _ Поскольку преобразование Oh действует на М тривиально, груп- группа Н действует на Р преобразованиями Lh как подгруппа группы вертикальных автоморфизмов этого расслоения. Вследствие этого для любого р ? Р существует отображение тр-.Н^К, задаваемое формулой Lhp = 9Tp(h)p F.13) и обладающее следующими свойствами Tpihihj) = Tp(hx)TP(h2\ F.14a) тад(Л) = ad(o-1)T#(ft)> F.146) легко выводимыми из D.38) и F.1). Формула F.14а) означает, что тр : Н —> К есть гомоморфизм (ср. с F.8)). Далее, как показано в примере 3 §8 главы 2, расслоение G хн Р с типическим слоем Р, ассоциированное с главным расслоением G (G/H,H), диффеоморфно Р, т.е. существует диффеоморфизм X:GxHP->P, F.15а) определяемый соотношением не зависящим от выбора представителей в классе [(#,i>)] = [(gh~\Lhp)]. Очевидно, х переводит каноническое левое действие G на G х# Р в действие G на Р, а действие структурной группы К на Р в действие этой группы на Р. Представление Р в виде F.15) позволяет построить отображения ip-.G^P, ip{g) = Lgp, F.16а) ie:P^P. F.166) Отображение ip аналогично отображению i, введенному в Предложе- Предложении 6.1.2; отображение F.166) просто представляет Р как подмногообра- подмногообразие в Р. Из определения ip и из F.16) легко следует, что «•«# = Ф«о^, а?К. F.17) Нетрудно проверить, что обратный образ формы ш относительно отображения ie, п = г*а>, есть форма связности на Р, инвариантная относительно действия Н, L*hw = u>, УЛеЯ, F.18) что является наследием условия F.12).
168 Глава 6. Размерная редукция симметричных калибровочных полей Далее, для любого р G Р обратный образ ip = ap F.19) есть 1-форма на G со значениями в алгебре Ли ? группы К. Вследствие G-инвариантности ш ар тоже G-инвариантна, и поэтому может быть представлена в виде (см. § 1) ар = Ар(в), Ар : g -> t, F.20) где в есть каноническая левоинвариантная 1-форма на группе G, а отображение Ар линейное (сравни с Предложением 6.1.2). Из F.17) легко найти, что 1)oAp. F.21) Обозначим через Д/, правое действие Н на G : R^g = gh. Тогда из F.13), F.16) получим ip oRh = HTp{h)p. Применяя (ipoRh)* к форме ш, учитывая F.21) и закон преобра- преобразования в при правых сдвигах, находим Ар о ad h = ad тр{К) о Ар. F.22) Вследствие компактности G однородное пространство G/H ре- дуктивно, т.е. существует редуктивное разложение g = Ц © т. Вычисляя форму ар на левоинвариантном векторном поле Ь, порожденном Ъ € t), найдем, что ограничение А^ на t) совпадает с дифференциалом отобра- отображения тр (который мы будем обозначать той же буквой) Ajli, = тр : i, -> С, F.23а) а Ар|т = фр вследствие F.21), F.22) обладает свойствами фр : m -> t, F.236) ф*ар = ad(a"') о фр, F.23в) фр о ad h = ad Тр(Л) о 0р. F.23г) Здесь следует отметить, что форма w характеризует форму ш на пространстве орбит группы G в Р, а отображение 0р характеризует а> на 6г-орбите через р. Фактически, это то же самое отображение (с опорной точкой р), которое вводилось в Предложении 6.1.2. По форме ш и отображению фр можно реконструировать исходную связность и форму п. Действительно, касательные векторы Y G TgG и Z G ТрР определяют касательный вектор к G хяР в точке [(д,р)] как
§ 2. Размерная редукция симметричных калибровочных полей 169 класс \(Y,Z)]. Соответствующий касательный вектор X G Г / \Р, X = х'A(У, Z)}) имеет вид ' 'Y. F.24) Определим горизонтальное подпространство в точке X([(<?,р)]) как подпространство, порожденное векторами вида X = L'gZ + грт - (фр(т)) *, F.25) где Z горизонтален относительно связности и в Р, т есть значение в точке д левоинвариантного векторного поля на G, порожденного элементом т G m, а (фр(т))* — фундаментальное векторное поле на Р, порожденное фр(гп) G 6. Прямой проверкой можно убедиться, что так определенное горизонтальное подпространство не зависит от выбора представителя в классе [(д,р)], благодаря свойствам F.17) и F.23в) инвариантно относительно действия структурной группы, а также с очевидностью инвариантно относительно преобразований Lg. Также легко проверить, что на векторах вида F.25) форма ш обращается в нуль, т.е. по форме ш и отображению фр мы восстановили исходную связность. Таким образом, G-инвариантная форма связности ш на Р находится во взаимно однозначном соответствии с парой (ш,фр) на Р. Оказывается, что вследствие оставшейся Ж-симметрии F.18) рас- расслоение Р может быть редуцировано дальше. А именно, выберем неко- некоторую точку ро ? Р, положим r(h) = Tpo(h) и рассмотрим подмножество в Р, определенное как F.26а) Из F.146) следует, что Р есть подрасслоение в Р со структурной группой С = (с е К, cr(h)c'1 = r(h), V/гея} F.266) (централизатор т(Н) в К). Расслоение Р, аналогично F.15 а), можно представить в виде Р = КхсР. F.27) Сужение ш на Р(М,С) обозначим ш, п\Р = ш. Поскольку действие Lh в точках Р вследствие F.13), F.26) сводится к действию ), условие инвариантности F.18) переписывается для ш так: ш = L*hu)\P = Ф*(Л)й|я = айт{ЪГх)ш\Р = ad т(/Г')о;- F.28)
170 Глава 6. Размерная редукция симметричных калибровочных полей Это означает, что ш принимает значения в алгебре Ли с группы С, т.е. ш является формой связности на Р, и связность в К -расслоении Р редуцируема к связности в С-расслоении Р; форма ш стандартным образом восстанавливается по форме ш (см. [КН], глава 2, §6). Отображение фр в точках р? Р удовлетворяет условию фр о ad h = ad r(h) о фр. F.29) По отображению фр отображение фр со свойством F.23в) восстанавли- восстанавливается с помощью представления F.27). Окончательно, мы пришли к результату, что G-инвариантная форма связности ш на Р(Е,К) находится во взаимно однозначном соответствии с парой (ш,фр) на Р(М,С), где ш — форма связности на Р, фр — линейное отображение, удовлетворяющее F.23в) и F.29). Свойство F.23в) позволяет рассматривать фр как эквивариантное отображение из Р в линейное пространство 6 ® т*. В этом простран- пространстве естественно определено представление группы Н, индуцированное представлениями ad(r(H))t и ad(fir)m. При таком рассмотрении усло- условие F.29) означает, что ф(р) принимает значения в подпространстве тривиального представления Н, которое мы обозначим Vq С t ®m*. Для того чтобы доказать это, введем понятие коприсоединенного представления группы Ли G. Пусть задано спаривание ({1,г)) элементов I ? д* и г € д. Тогда присоединенное представление adG порождает в д* представление ad'G, определяемое формулой ((l^dg-'r^^iiaSg^r)}, g e G, и называемое коприсоединенным представлением группы Ли G. Соответствующее представление алгебры Ли g задается так: ({l,adgr)) =-((ad1 gl,r)), g <E д. Обозначая тем же символом ((,)) спаривание ф G t ® m* с элементом т ? т, инфинитезимальную форму условия F.29) можно переписать в виде i0,m)) = ((ad т(к)ф,т)). Отсюда следует, что для любого h G I) adт(h)ф + adihф = 0, т.е. на операторах ф, удовлетворяющих условию F.29), реализуется тривиальное представление алгебры Ли \) и, соответственно, группы И. Вспоминая результаты главы 2, мы приходим к заключению, что фр описывает скалярное поле на Н со значениями в пространстве Vq.
§ 2. Размерная редукция симметричных калибровочных полей 171 Установленное соответствие дает решение задачи классифика- классификации (^-инвариантных связностей или G-симметричных калибровочных полей. Физически оно означает, что чисто калибровочная теория в пространстве Е = М х G/H с калибровочной группой К, обладающая дополнительной группой пространственной симметрии G, сводится к калибровочной теории с калибровочной группой С в пространстве М, которая включает в себя дополнительные скалярные поля, описываемые отображением ф. Чтобы полностью характеризовать эту редуцирован- редуцированную теорию, необходимо получить ее действие из действия исходной многомерной теории. Это и будет предметом нашего дальнейшего рас- рассмотрения. Введем в пространстве Е (локальные) координаты zM — (х^,^т) (М = 0,l,...,dimM + d\mG/H- l), где {ж*1} (/* = 0,1,... ,dimM - 1) — координаты в М, а {?"*} (т = 1,2,...,dimG/H) — координаты в G/H, и запишем стандартное действие для исходной калибровочной теории в Р(Е,К) в виде = ^ J ( FMN) dvE, F.30) MN,F) Е где д есть константа связи, Fmn — компонента обратного образа F = s*u формы кривизны п = du> + ^[ш,и>] относительно некоторого (локаль- (локального) сечения s : Е -+ Р, (,) — К -инвариантная билинейная форма в t (пропорциональная tr в присоединенном представлении и потому отрицательно определенная), a cLve — элемент объема пространства Е, построенный по G-инвариантной метрике -у = 77Ф7- Рассмотрим это действие на (9-инвариантных связностях и>. Для таких связностей можно получить специальное представление 2-формы кривизны F, позволяющее легко преобразовать действие F.30) в действие некоторой теории в М. Заметим, что благодаря представлению F.15а) любое (локальное) сечение 5 : Е —» Р можно задать с помощью (локальных) сечений s\ : G/H —* G и «2 - М —» Р по формуле *(*,O = x([(*i(O,*2(«))])- F.31) Учитывая F.24), получим отсюда наиболее общее представление для калибровочного поля на Е, отвечающего G-инвариантной форме а>: 1(*,0 = (**w)(*,c) = (s*2u)x + A,2(,)((«l0)f). F.32) Очевидно, благодаря F.27) сечение «2 можно выбрать так, что S2(x) G Р. Для дальнейшего нам удобно также выбрать s\ удовлетворяющим усло- условиям si(o) = е, s\ (T0G/H) = m, которые устанавливают изоморфизм
172 Глава 6. Размерная редукция симметричных калибровочных полей касательного пространства T0G/H с подпространством т. При этом дифференциал канонической проекции irG в расслоении P(G/H,H), взятый в точке е G G, n'G : т —> T0G/H, порождает на m adH- инвариантное скалярное произведение, отвечающее метрике j в точке о. Обозначая в\в = в, фв2(х) = Фх и s\w — A, A € с, получим выражение для G-симметричного поля на Е = М х G/H в стандартной калибровке: ), F.33) где фх вследствие F.29) удовлетворяет условию F.34) Нетрудно проверить, что преобразование О*д_\ для этого поля эквивалент- эквивалентно калибровочному преобразованию с функцией рд(О = t((si (?))'</ х S\(g~x?)), что совпадает с определением G — симметричного калибро- калибровочного поля F.6). Соответствующая полю А 2-форма напряженности имеет вид F = F+ (Вф){вт) + 1- [ф(вт), ф(вт)} - - \фA0т,0т]т) - 1-т([вт,От]ь), F.35) где F = dA + \[A,А], а ковариантная производная поля ф определена как (Вф)(вт) = (<1фЛвт) + [А,ф(От)], причем в (йф Авт) подразуме- подразумевается спаривание элементов из f0m* и т. Отметим, что последние три члена в F.35) фактически представляют собой сужение формы F на пространство дополнительных измерений G/H и в точности соответ- соответствуют представлению для формы кривизны инвариантной связности в Предложении 6.3. Очевидно, что на полях вида F.33) лагранжиан в действии F.30) не зависит от точек G/H. Поэтому в F.30) можно проинтегрировать по этому пространству, а подынтегральное выражение взять в точках М. Вы- Выражения для компонент 2-формы F на базисных векторах пространства Т(Х,о)Е легко находятся с помощью представления F.35). В частности, отождествление T0G/H с m и введение в m ортонормированного в смы- смысле метрики (j)o базиса {иа} (а = 1,2,... dim G/H) позволяет перейти к скалярным полям фа(х) = Фх(иа) ^ %, на компоненты которых наложены связи F.34). В результате действие F.30) принимает вид \ /{<^,О j2(^a(),^a()) {f)} dvM, F.36) 9 м
§ 3. Вычисление потенциала скалярных полей 173 где д2/д2 равно объему пространства G/H, вычисленному по метрике j, dvM — элемент объема пространства М, построенный по метрике tj, РрФАх) = дрфа(х) + \Ац(х),фа{х)], а потенциал У(ф) неотрицателен и определяется соотношениями: у(Ф) = ~ Х)$*« *<»> ^ °> <637а) а,Ъ Fab = 2F(ua,ub) = [фа(х),фь(х)] - фх{[иа,щ]т) - т([«.,иь]ь). F.376) Мы видим, что редуцированная теория представляет собой кали- калибровочную теорию с калибровочной группой С F.266), включающую в себя скалярные поля, минимально взаимодействующие с калибровочным полем и обладающие самодействием не выше четвертой степени, т.е. в случае dimM = 4 редуцированная теория является перенормируе- перенормируемой. При калибровочных преобразованиях с функцией с(х) G С поле A/j(x) преобразуется стандартно, а преобразование скалярных полей определяется преобразованием отображения фх Фх~* Ф'х = ай(с(х))фх, которое совместно с условием F.34). Отметим еще, что в редуцированном действии в явном виде представлен только чисто калибровочный сектор. Это связано с тем, что скалярные поля подчиняются связям F.34). Разрешение этих связей, нахождение явного вида скалярных полей и их взаимодействий пред- представляют собой теоретико-групповой аспект задачи размерной редукции, который мы будем обсуждать ниже. § 3. Вычисление потенциала скалярных полей в задаче размерной редукции В этом параграфе мы применим результаты из теории алгебр Ли, приведенные выше в главе 5, для решения задачи, возникающей на заключительном этапе размерной редукции многомерных калибровоч- калибровочных теорий, а именно для вычисления потенциала скалярных полей, нахождения калибровочной группы, до которой спонтанно нарушается симметрия за счет механизма Хиггса, и представления, по которому преобразуется скалярное поле редуцированной теории. Пусть, как и §2, исходная теория представляет собой теорию Янга—Миллса с калибровочной группой К в многомерном пространстве Е = М4 х G/H. Предположим, что К и G — простые компактные группы Ли. В дальнейшем будем обозначать t алгебру Ли группы К, g — алгебру Ли группы G, f) — алгебру Ли группы Н. При этом
174 Глава 6. Размерная редукция симметричных калибровочных полей часто используют запись 6 = Lie(jRT), f) = Lie(if), g = Lie(G). В §2 было показано, что в секторе симметричных полей и при Сг-инвариантной метрике д в Е эта теория может быть редуцирована к теории в Мл, содержащей калибровочные и скалярные поля. Для полного описания редуцированной теории необходимо решить следующие задачи: 1) Найти централизатор с = Сс(тA))) алгебры r(f)) в t, кото- который является алгеброй Ли калибровочной калибровочной группы С редуцированной теории. Здесь т есть гомоморфизм алгебр t) -* t, со- соответствующий гомоморфизму групп г : Н —* К, введенному в §2 (мы используем одну и ту же букву в обозначении гомоморфизмов групп и алгебр; по смыслу всегда будет ясно, о каком гомоморфизме идет речь). 2) Мы имеем редуктивное разложение g = f)®m (см. §2). Необходимо разложить представление (m, ad) подалгебры I) С g на неприводимые. 3) Аналогично, нужно разложить на неприводимые представления (t,ad) подалгебры т{\)) С I. 4) На основании результатов пунктов 2 и 3 построить эквива- риантное отображение ф : m —> Е, описывающее скалярные поля в М4 (см. §2). 5) Вычислить скалярный потенциал редуцированной теории по формуле J2 m,n F.38) ф([ит,и„]т) - [ф(ит),ф(и„)], где {ит} — базис в т, ортонормированный в смысле метрики д в Е, а (,) — каноническая инвариантная билинейная форма в \), введенная в главе 5. 6) Определить тип представления, по которому преобразуется скалярное поле редуцированной теории относительно группы С. 7) Если потенциал V окажется потенциалом типа Хиггса, то надо найти калибровочную группу после спонтанного нарушения симметрии. Для решения этих задач удобными оказываются графические схемы, на которых изображены не только простые корни алгебры (как на диаграммах Дынкина), а все положительные корни. Такие схемы мы будем называть корневыми решетками. Корневые решетки алгебр А\, At, A3 и Ап приведены на рис. 16. Каждый кружок на этой схеме соответствует тому или иному положительному корню (или отвечающему ему корневому вектору). Корни, лежащие на горизонтальной стороне треугольника, являются простыми и образуют диаграмму Дынкина. Два кружка на корневой решетке, отвечающие корням а и /3, соединены отрезком тогда и только тогда, когда существует простой корень a, G тг,
§ 3. Вычисление потенциала скалярных полей 175 ах аг а,_, а, ам a,w at a^, a,_, а. (а) (б) такой что где N Рис. 16. аг= р и [ea,eai] = Na,aiep или /3 + оч = а и a^a. — некоторые коэффициенты (см. E.41)). Кружок, лежащий на пересечении отрезков, выходящих из точек а* и а,- (г < j), отвечает корню a,+a,+i +... +а^ (см. рис. 16, корневая решетка для А„). По видимому, впервые аналогичные схемы были приведены в работе [Ды2]. Корневые решетки для алгебр серии А„ в том виде, в каком они изображены здесь, а также корневые решетки для алгебр других классических серий можно найти в статьях [ВК]. Рассмотрим теперь простую алгебру g и ее подалгебру fj; центра- централизатор СдЦ)) подалгебры Ц в g в этом параграфе будем обозначать с. Мы покажем на нескольких примерах, как с помощью корневых ре- решеток решаются задачи нахождения централизатора с и разложения представления (m,ad) подалгебры \) на неприводимые. Пример 1. g = Аг, Ц = А\. Корневые решетки алгебр Ах и А2 приведены на рис. 16 а и 166. Базисными элементами алгебры g = Аг удобно выбрать элементы ha, и ha2 ее подалгебры Картана g и корневые векторы е±О|, е±О2, e±(Ql+a2). Подалгебру \) = А\ мы реализуем на элементах (Лв1,ea,,e_ai). Такое вложение fj в д, при котором корневые векторы подалгебры являются корневыми векторами всей алгебры, называется регулярным. Здесь мы будем рассматривать лишь регулярные вложения. Изучим действие эндоморфизмов adX, X € f) на элементы ев2 и ев|+Л2. Исходя из E.40)-E.41), имеем: adhai(ea2) = -еаг; adee,(ea2) = i\Taba2eai+a2; ade_a,(ea2) = 0; F.39) adhai(eai+a2) = ea,+a2; adea,(ea|+a2) = 0; ade_ai(ea,+a2) = JV_a|ta1+a2ea2. Следовательно, подпространство V, натянутое на элементы еаг и еа1+а2,
176 Глава 6. Размерная редукция симметричных калибровочных полей которые мы будем также обозначать V — {ea2,eai+ct2}, является про- пространством неприводимого представления (У, ad) алгебры \). Покажем, как этот результат может быть получен из анализа корневой решетки А2 (рис. 166). То, что точки а2 и а.\ + а2 соединены отрезком, означает, что корневые векторы переводятся друг в друга действием эндоморфизмов ade±a., где а,- ? 7Г. Очевидно, что в данном случае это ad еО| или ad е_а,. Так как ad hai оставляет корневые векторы на месте, то подмножество V = {еа2,еа|+а2} является неприводимым представлением t). Сопряженное подмножество V = {е_а2,е_(О|+а2)} также является неприводимым представлением алгебры f). Вспомним теперь, что под- подалгебра Картана g алгебры g = А2 двумерна; ее элемент hai порождает подалгебру Картана алгебры t) = А\. Запишем второй линейно незави- независимый элемент g в виде h = a\hQi + a2ha2. Очевидно, adua,(/i) = 0. Оказывается, что можно выбрать коэффициенты а\ и а2 так, что ade±a,(^) = 0. Несложные вычисления дают а2 = 2о|. Мы положим в.\ — 1, так что Л = Лв1+2Лвг F.40) Элемент h порождает одномерную подалгебру 3 = СЛ, которая является пространством тривиального представления алгебры Ц = А\ относительно действия эндоморфизмов адХ, X 6 t). Суммируем полученные результаты. Алгебра g = t) ф m, а подпро- подпространство m в свою очередь представимо в виде: т = 79УФЗ- F.41) То, что V, V и 3 являются прямыми слагаемыми, следует из свойства 1 полупростых алгебр Ли и равенства (hai,h) = (auai) + 2(a,,a2) = 0. Очевидно, что 3 = с. Так как dim3 = 1, то все ее (конечномер- (конечномерные) представления одномерны. Нетрудно проверить, что ad3(fy) = 0, ad 3C) = 0, adh(e±ai) = ±(а2,ац + 2а2)е±аг = ±3е±аг, F.42) adh(e±(ai+a2)) = ±(а, + a2,«i + 2a2)e±(ai+a2) = ±3е±(а,+а2). Тип представления, с точностью до сопряжения, в большинстве случа- случаев однозначно характеризуется размерностью представления. Поэтому в физической литературе для обозначения типа представления часто пишут его размерность, подчеркнутую снизу. В этих обозначениях простран- пространство m размерности dim m = 5 разлагается на следующие неприводимые представления алгебры Ц = А\: 5->2 + 2*+1, F.43)
§ 3. Вычисление потенциала скалярных полей 177 где 2* — представление, сопряженное по отношению к 2. Если же хотят указать свойства этих пространств относительно некоторой одномерной подлагебры (подалгебры 3 в нашем примере), то указывают в скобках собственное значение элементов подпространства при действии эндоморфизма adX, где X — некоторый фиксированный элемент одномерной подалгебры. В нашем случае X — h и разложение F.43) принимает вид 5 -¦ 2(+3) + 2*(-3) +1@). F.44) Аналогично можно написать разложение для присоединенного представления (g,ad) алгебры g на неприводимые относительно подал- подалгебры \) е 3 С g 8 -» 3@) + 2(+3) + 2*(-3) +1@). Представление (V,ad) алгебры f) = А\ имеет старший вес ш = а\ +_а2 и сигнатуру [1] (см. §4 главы 5 и формулу E.49)), а представление (V",ad) имеет старший вес п> = —а2, и сигнатуру также [1]. Таким образом, представления 2 и 2* эквивалентны и являются так называемыми фундаментальными представлениями. Для алгебры Ап фундаментальное представление — это представление размерности п+ 1, для Вп — 2п+ 1, для С„ — 2п, для Dn — 2п. Ранг алгебры совпадает с числом ее неэквивалентных фундаментальных представлений. Пример 2. g = А2, I) = 1)'®3, где I)' = А\, а 3 = СЛ. — одномерная подалгебра, порожденная элементом F.40). Весь необходимый анализ был уже проделан при рассмотрении предыдущего примера. Поэтому, мы приведем лишь ответы: g = [j © m, dim g = 8, dim m = 4, m = V Ф V, F.45a) 4-2(+3) + 2(-3), F.456) 8 -> 3@) +1@) + 2(+3) + 2(-3). F.45b) Здесь указаны размерности представлений относительно J)' = А\, а в скоб- скобках — собственное значение оператора ad Я. В этом примере с = ОД) = 3, т.е. f)Dc = 3^0- Пример 3. д — Аз, \) — А\. Корневая решетка алгебры g = A3 приведе- приведена на рис. 17. Подалгебра I) = А\ реализована на a,+a2 Д{/ /$!а2+аг базисных элементах еО|, е_а, и ЛО|. Анализ корне- корневой решетки приводит к выводу, что подмножества ^ = {е^еа1+а2} И V2 = {еа2+„3, еа|+О2+аз} ЯВЛЯЮТСЯ представлениями размерности 2 алгебры \). Сопря- женные представления V\ и V2 реализуются на кор- корневых векторах, отвечающих соответствующим отри- отрицательным корням. Как видно из структуры корневой решетки, каждый
178 Глава 6. Размерная редукция симметричных калибровочных полей из элементов еаз, е_„3 и ha3 порождает одномерное тривиальное пред- представление алгебры 1), а все вместе они порождают подалгебру с' = А\, принадлежащую централизатору с = Cg(f)). По аналогии с примером 1 централизатору с принадлежит и подалгебра, натянутая на элемент h подалгебры Картана g алгебры д, линейно независимый с hai и ha}. Запишем его в виде h — hai + a2hai + «3^aj. Требование 3 = СЛ С с, т.е. ad 1)(Л) = 0, приводит к условию (haih) = 0. Требование, чтобы 3 являлось прямым дополнением с' в с, приводит к условию (ha},h) = 0. Из этих условий получаем h = hai +2ha2 + har F.46) Итак, с = с' ф 3 = А\ ФСЛ. Подпространство m представимо в виде прямой суммы m = Vi Ф V2 0 V, ф V2 Ф с' 0 3. F.47) Соответственно, представление (m, ad) алгебры Ц разлагается в сумму неприводимых представлений (dimm= 12): 12-»2 + 2 + 2 + 2 + 3-1 + ! F.48) Покажем теперь, как представление (m,ad) разлагается на неприво- неприводимые относительно алгебры 1) ф с' ф 3 = -^i Ф -Ai © СЛ. Для этого заметим, что элементы пространств Vj и V2 переводятся друг в друга под действием эндоморфизмов adX, X G с'. Точнее, подпространства W\ = {еа2,еа2+аз} и W2 = {еа1+а2,еа1+а2+аз} являются пространствами неприводимых представлений алгебры с', эквивалентных фундаменталь- фундаментальному. Нетрудно проверить, что ad h(v) = 2v при v G Vi или v eV2. Итак, разложение F.48) можно переписать в виде: 12-*B,2)B) + B>2)(-2) + а,3)@) + а,1)@)| F.49) где (т,п) обозначает тип представления относительно ^фс', причем первое число относится к алгебре f), а второе к с'. Аналогичное разложение для (g, ad) имеет вид: Л -> C, D (°> + B,2) B) + B,2) (-2) + Q, 3) @), +Q, 1) @). F.50) Обратимся теперь к задачам построения эквивариантного отобра- отображения ф и вычисления потенциала скалярных полей редуцированной теории. Пусть исходная теория Янга—Миллса задана в пространстве Е — МА х СР2 размерности dim Е = 8, где СР2 — комплексное проек- проективное пространство, которое диффеоморфно следующему однородному пространству СР2 = G/H - SUC)/SUB) x U(l). Предположим, что калибровочная группа этой теории К — SUD). Обозначим через g, f),
§ 3. Вычисление потенциала скалярных полей 179 и t компактные алгебры Ли групп G, Н и К соответственно; g = suC), 1) — s«B) ф 3, где 3 — одномерный центр, отвечающий группе U(\), t = suD). Имеет место редуктивное разложение д = |фт. Для простоты мы выбрали пространство G/H симметрическим. Это означает, что оно обладает двумя фундаментальными свойствами: 1) [m,m] = 6; F.51а) 2) представление (m,ad) алгебры fj неприводимо. F.516) Задача размерной редукции симметричных калибровочных полей в рассматриваемой теории сводится, как было показано в предыдущем параграфе, к построению линейного отображения ф : m —» t, удовлетво- удовлетворяющего условию эквивариантности F.34). Рассмотрение этого условия на инфинитезимальных элементах группы Н позволяет переписать его в виде: ad т(Х)(ф(?)) = ф(ад X(Y)) F.52) для всех X G 5 и Y е т. Здесь т : t) —* I — гомоморфизм алгебр, порождаемый гомоморфизмом групп т : Н —> К. Условие F.52) означа- означает, что отображение ф есть оператор, который сплетает представления (m, ad) алгебры I) и (t, ad) алгебры гA)) С t. По лемме Шура сплетающий оператор равен нулю, если он сплетает неэквивалентные представления, и обратим, если он сплетает эквивалентные представления. Наиболее просто сплетающий оператор строится между комплексными представле- представлениями комплексных алгебр: в этом случае он равен просто единичному оператору, осуществляющему изоморфизм между эквивалентными пред- представлениями (см. [Ки]). Итак, для построения сплетающего оператора удобно комплекси- фицировать алгебры g, f) и t и распространить на них условие F.52) по линейности. Обозначим g = gc, t) — fjc, t — tc, m = mc. Мы имеем g — A2, b = A\ Ф 3, I = Аз- Построенный при этом оператор ф бу- будет сплетать представления в комплексных пространствах ши (. При ограничении на подпространство m С m он должен давать требуемое эквивариантное отображение, т.е. он должен удовлетворять условию вещественности ф(Х) = ф(Х), X em. F.53) Проанализируем представления (m,ad) алгебры Ц = А\ фСЛ, где в каче- качестве h мы возьмем элемент F.40). Разложение этого представления на неприводимые было получено в примере 2 (см. F.456)). В дальнейшем элементы алгебры t будем обозначать прописными буквами. Гомомор- Гомоморфизм т : \) —»¦ t зададим на базисных элементах алгебры Ц следующим образом: г(Л„,) = Яа,, т(е±а,) = Е±О], т(К) = Я,
180 Глава 6. Размерная редукция симметричных калибровочных полей где элемент подалгебры Картана алгебры t 1+Наз) F.54) Н(На1 (ср. F.46)). Опираясь на результаты примера 3, нетрудно проверить, что централизатором подалгебры r(J)) в t является с = С{(тA))) = с'фСЯ, где с' = А\ — подалгебра, реализованная на элементах Еаъ, Е-аз, На}. Разложения I на инвариантные подпространства эндоморфизмов adr(f)), а также разложение представлений F, ad) алгебр тA)) = т(\)')®СН, где tf = А\, и гA)) ф с = r(fj') ф с' ф СН на неприводимые имеют вид (ср. F.50) и рис. 17): t = т(()') ф с' Ф СН ф Vx Ф V2 Ф Vi Ф V2, F.55а) 15 ^ 3@) + 31@) +1@) + 2C) + 2C) + 2(-3) + 2(-3), F.556) 11 ->C,1) @) + а, 3) @) + а, I) @) + B,2) C) + B,2) (-3). F.55в) Здесь подпространства V\ n V2 реализованы на следующих элементах: V\ = {Ea2,Eat+a2}; V2 = {Ea2+a},Eai+a2+ai}. Сравнивая представления в разложениях F.456) и F.556), мы видим, что среди них есть эквивалент- эквивалентные. Поэтому сплетающий оператор имеет вид: Ф = fi(x)[V - Vx]+f2(x){V -> V2]+gdx)[V -. Vx]+g2(x)[V -> V2], F.56) где символом [V —> VJ] мы обозначили оператор, устанавливающий изоморфизм между пространствами V С m и VJ- С 6 (i — 1,2), в которых реализуются эквивалентные представления. Аналогичный смысл имеет символ [V —» ^]. Коэффициенты /,(ж) (i = 1,2) и gi(x) (i — 1,2) являются скалярными функциями; именно они играют роль скалярных полей редуцированной теории в М4. Как построить в явном виде операторы [V —> VJ]? Учитывая свойство 1 полупростых алгебр Ли (см. §4 гл. 5) и нормировку корневых векторов (еа,е_а) = — 1, получим, что эти операторы имеют вид: (X G m) [V -* Vx] (X) = -Еа2(е-аг,Х) - Еа1+а2(е_(а]+аг),Х), [V —»¦ V2](X) = —Еа2+аз(е-а2,Х) — Еах+а2+аъ{е-(а1+а2), X). Вводя упрощающие обозначения: v\ = е„2, v2 = еа[+О2; V, J = Ea2, F2A) = Eai+ai; F,B) = Еа2+аз, V2i2) = Eai+a2+a} и учитывая, что условие вещественности F.53) накладывает ограничение gi(x) = /,(ж) (г = 1,2), получаем окончательное выражение для эквивариантного отображения ф: /)(vi'X)> F58a)
§3. Вычисление потенциала скалярных полей 181 где X € т. В частности 2 2 ? ? ^0)- <6-58б> Теперь мы приступим к вычислению потенциала скалярных по- полей, заданному формулой F.38). Прежде всего выясним, как выглядит инвариантная метрика у в G/H и базис векторных полей {ит}, орто- нормированный в смысле этой метрики. Используя результаты главы 3 и свойство F.516) симметрического пространства G/H, получаем, что значение метрики -у в начале G/H на векторных полях X, Y равно %(X,Y) = -L2(X,Y), где X и Y векторы, касательные к G/H в начале (точке о) и равные X и Y соответственно, но рассматриваемые как элементы подпространства m С д. Фактор I? есть коэффициент пропорциональности, характеризу- характеризующий метрику. Он имеет следующий геометрический смысл: величина L определяет характерный размер внутреннего пространства; она имеет размерность длины. Учитывая формулы E.50), выражающие элементы компактной вещественной формы через корневые векторы, мы можем выбрать базис {ит} следующим образом: 1 vi + vx \ v2 + v2 г Vx - щ i v2~v2 __, U2 = _ __ U3 = I _-_-, щ = 1 ___. F.59) Подставляя F.59) в F.38), приведем выражение для скалярного потен- потенциала к следующему виду: v2 = -42Г4 2 V, = -21-4 При выводе этих выражений мы учли особенности нашего примера, а именно то, что i) [vi,Vj] = 0 для любых i,j = 1,2, ii) [<p(Vi),</>(Vj)] = 0 также для любых i,j — 1,2 (см. F.586)). Вычислим каждое из слагаемых Vk {к— 1,2,3) по отдельности.
182 Глава 6. Размерная редукция симметричных калибровочных полей 1) Выражение для V\ удобно переписать в виде: 2 V, = -4L-4(t([vuv2]),t([vuv2))) - 2Ь-4 Рассмотрим первый член в этой сумме. Коммутатор [v\,v2] = [ea2,e_(ai+a2)] = Na2t-{ai+a2)e-ai, где константы Na,p задают закон умно- умножения в алгебре Ли g = А2. Тогда получаем (t([vi,v2]),t([vi,v2])) = Na2-(ai+a2)N-a2tai+Q2(T(e-ai),T(eai)) = F.61) Для вычисления выражения F.61) можно было бы восстановить констан- константы NOtp для алгебры Ли д. Однако в нашем примере можно поступить про- проще. Рассмотрим следующее выражение: ([ea2,e_(a|+a2)J, [e_a2,ea|+ajH, где (,)g есть скалярное произведение в алгебре Ли g (напомним, что скобки (,) у нас сейчас обозначают скалярное произведение в алгебре Ли t). С одной стороны, F.62) С другой стороны, учитывая инвариантность скалярного произведе- произведения (,)в, имеем Цеа2> e-(ai+a2)Jj le-a2> eai+a2jjg = ~ (Деа2> le-a2> e-(o,+a2)J]j Так как —а2 — (а\ + а2) — —ai — 2a2 не является корнем алгебры Ли g = А2 и, следовательно, [е_а2,е_(а,+?Г2)] = 0, то, применяя тождество Якоби к первому сомножителю в скалярном произведении, получаем ([ea2)e-(a,+a2)]) [e-a2ea,+a2])fl = = +(«2,«1 + a2>0(e-(a1+o2),ea|+a2)g = "I- F.63) Сравнивая F.62) и F.63), получаем, что правая часть выражения равна ( — 1). Второй член в сумме, определяющей V\, вычисляется просто. Приведем выкладки для слагаемого 0"([«b«i])iT([»i,t>i])) = (r([ea2,e_a2]),T([e_a2,eaJ)) = = -(т(Ла2),г(Лв2)) = (-r(\h- X-hU X
§ 3. Вычислепие потенциала скалярных полей 183 Здесь мы воспользовались формулами F.40) и F.54), определяющими элементы h и Н, а также соотношениями, задающими вложение т : 1) —* 6. Окончательный ответ: V\ = 15L4. 2) Выражение для потенциала редуцированной теории должно быть инвариантно относительно преобразований из группы С, кали- калибровочной группы редуцированной теории. Поэтому в нашем случае мы проведем дальнейшие выкладки в специальной калибровке: /г = 0 (см. F.58)), а затем восстановим ответ в общем случае из соображений инвариантности. Преобразуем выражение для V2, используя инвариант- инвариантность скалярного произведения (,) и условие F.52) эквивариантности отображения ф: 2 V2 = 4ZT4 J2 (Ф [to> *jh ».-], *<»,-)) • Используя явный вид отображения ф F.58 а) и учитывая, что [[v{, Vj], VjJ~ Vj, получаем в специальной калибровке: = 4i~4|/i |212 ([ea2, е_(в|+в2)], [e_a2, ea,+aj)g + + ([ea2, e_a2], [e_a2, eaj)g + ([ea,+a2, е_(в|+в2)], [e_(ai+a2), eai+a2])g|. Проводя выкладки, аналогичные тем, которые выполнялись в п. I (см. F.63)), окончательно имеем: V2 = -24?~4|/(|2. 3) Исходя из F.586), запишем ], [Е-аг,Еа1+а2]) Дальнейшие выкладки проводятся так же как в п.2. Итак, 44 Выше мы показали, что с = А\ ф СЯ. Возвращаясь к компактной вещественной форме, получаем, что калибровочная группа редуциро- редуцированной теории С = 5GB) х U(l). Инвариантами этой группы второй
184 Глава 6. Размерная редукция симметричных калибровочных полей и четвертой степени по полям являются |/|2 = |/||2 + |/2|2 и |/|4. Окончательное выражение для потенциала следующее: F.64) Согласно разложению F.55в) соответствующие элементы пространств V\ и V-i преобразуются по фундаментальному представлению алгебры Ли с; = А\ при действии эндоморфизмов adX, X ? с'. Исходя из выражения F.58а), эти преобразования можно интерпретировать как преобразование столбца Таким образом, скалярные поля редуцированной теории образуют непри- неприводимый комплексный дублет относительно преобразований неабелевой части С = SUB) калибровочной группы С - SUB) xU(l). Потенциал редуцированной теории F.64) является потенциалом типа Хиггса: он имеет вырожденный минимум при |/|2 = 1 и приводит к спонтанному нарушению симметрии. Чему равна группа R остаточной симметрии? Пусть вакуумное значение скалярного поля характеризуется вектором с компонентами f\ = 1, /2 = 0. Тогда алгебра Ли г группы R является подалгеброй в с такой, что эндоморфизмы ad r оставляют инвариантными векторы вида ф(Х), ХЕш, где ф — отображение, отвечающее вакуумному скалярному полю. Анализ корневой решетки алгебры t = Аз (рис. 17) дает, что г = CZ, где элемент Z из подалгебры Картана алгебры с равен, например, 3 — [Hai "b ^Ja2 ~r J1~Lai ) — лл -г J-"aj' Z=- (яа, + 2На2 + ЗЯаз) = Н + ЪН ) = Н Итак, R = U{\). Подведем итоги. Размерная редукция симметричного сектора те- теории Янга—Миллса с калибровочной группой К = 51/D), заданной в многомерном пространстве Е — М4 х SUC)/SUB) xU(l), дает модель Хиггса в М4, включающую калибровочные и скалярные поля, с калибро- калибровочной группой С = SUB)xU(\), которая после спонтанного нарушения симметрии нарушается до R = U(l). По своей структуре редуцированная теория совпадает с бозонным сектором стандартной модели электро- электрослабых взаимодействий Глэшоу—Вайнберга—Салама, (см. §1 главы 1, а также, например, [ВТ, ЧЛ, БШ1]). Однако, в отличие от традиционного подхода, модель, полученная размерной редукцией, более «жесткая» — она содержит меньше свободных параметров. Действительно, массы ча- частиц и заряды в этой модели выражаются через калибровочный заряд исходной многомерной теории и параметр L, характеризующий размер
§ 3. Вычисление потенциала скалярных полей 185 внутреннего пространства дополнительных измерений G/H. В качестве иллюстрации приведем некоторые результаты, полученные в статье [ВК]. Домножая компоненты поля fi(x) на коэффициент с тем, чтобы добить- добиться канонической нормировки кинетического члена скалярных полей, и используя стандартные формулы для масс W- и Z-бозонов и бозона Хиггса (или Я-бозона), получаем, что в нашей модели V2 2 Mw = —, Mz = M# = -. Jj Li При этим угол Вайнберга ву/ удовлетворяет соотношению sin2#w = 1 — Муу/М%. Это значение далеко от экспериментального (sin20^p = 0.2315 ± 0.0022) и, конечно, наша модель не претендует на роль реали- реалистичной, а является чисто иллюстративной. Однако сама идея, идущая еще от Калуцы и Клейна, о том, что низкоэнергетическая физика определяется некоторой многомерной фундаментальной теорией и гео- геометрией дополнительных измерений, является весьма привлекательной, а результаты по размерной редукции калибровочных, гравитационных, суперструнных и других теорий позволяют надеяться на построение реалистической модели. В заключение параграфа отметим, что изложен- изложенный выше способ вычисления потенциала скалярных полей не является самым общим. Более общий и более мощный метод вычисления У(ф), использующий дополнительные сведения из теории алгебр Ли, был раз- развит в статьях [ВКМ]. С помощью этого метода было получено общее выражение для потенциала V{<f>), когда пространство дополнительных измерений является однородным симметрическим пространством. Было также показано, что в этом случае скалярный потенциал редуцирован- редуцированной теории всегда является потенциалом типа Хиггса и приводит к спонтанному нарушению симметрии.
Глава 7 Спонтанная компактификация В предыдущих главах мы рассматривали модели, получающиеся размерной редукцией калибровочных теорий, заданных в многомерных пространствах специального вида. При этом факторизованная структура многомерных пространств просто постулировалась, и, соответственно, метрика считалась фиксированной, а не рассматривалась динамически. Конечно, более последовательным представляется подход, в рам- рамках которого требуемая структура многомерного пространства-времени получается динамически как результат решения уравнений движения многомерной теории. Такой подход был впервые предложен в работах [КШ, Лу] и получил название спонтанной компактификации. Поскольку структура многомерного пространства-времени непосредственно связа- связана с его метрикой, то в рамках этого подхода метрика обязательно должна рассматриваться динамически, т.е. соответствующая многомер- многомерная теория обязательно должна включать в себя теорию гравитации. В качестве первого шага реализации программы спонтанной компак- компактификации мы рассмотрим размерную редукцию теории гравитации в предположении, что ее действие есть многомерное обобщение действия Гильберта—Эйнштейна. § 1. Размерная редукция теорий гравитации Рассмотрим в многомерном пространстве Е теорию гравитации, инвариантную относительно действия некоторой компактной группы Ли G на Е. Как обычно, будем считать это действие левым и обозна- обозначать Од. Тогда инвариантность теории означает, что мы рассматриваем на Е класс метрик -у (сигнатуры signf = (-1,1,..., 1», удовлетворяющих условию O*gj = j. G.1) Аналогично рассмотрению в главе 6, нашей целью будет описание этой теории в терминах объектов, заданных на некотором расслоении с базой М = E/G. Оказывается, для того, чтобы такое описание было
188 Глава 7. Спонтанная компактификация непротиворечивым, необходимо дополнительно предположить, что G действует на Е регулярно, т.е. что все стационарные подгруппы дей- действия G на Е сопряжены одной подгруппе Н С G. В этом случае пространство Е обладает структурой ассоциированного расслоения. Пусть N(H) обозначает нормализатор Я в G (см. § 1 главы 5). Рассмотрим множество неподвижных точек подгруппы Н: Р = {р?Е, Ohp = p, Vh?H}. G.2) Из определения N(H) ясно, что множество Р инвариантно отно- относительно действия этой группы. Более того, можно показать, что в рассматриваемом случае группа К — N(H)/H действует на Р свободно и Р/К — М, т.е. Р представляет собой главное расслоенное простран- пространство с базой М и структурной группой К; Р = Р{М,К) [Бр]. Чтобы перейти к принятому у нас правому действию структурной группы, нужно положить в точках Р Vk=Okl keK. G.3) Заметим еще, что группа К естественно действует на однородном пространстве G/H справа. А именно, для любых g€G,h?Hnk(zK по определению имеем: [д]к = [gh]k = [ghk] = [gkk~lhk] = [gkh'\ = [дк]. Поэтому мы можем построить ассоциированное расслоение Р хК G/H, которое диффеоморфно Е. Диффеоморфизм X : Р х* G/H -» Е, G.4а) х([(Р,\9])])=ОдР G.46) очевидно не зависит от выбора представителей в соответствующих классах. Это представление для Е позволяет построить отображения, аналогичные отображениям F.16): ip:G/H-*E, ip(\g]) = OaP, G.5a) ie :P-+E. G.56) Последнее отображение просто эквивалентно определению Р как под- подмногообразия в Е. Легко проверить, что отображения G.5) обладают свойствами: ip о 1д = Од о ip, g EG; G.6а) *ф*(р) ~Ъ° гк-' > к ? К; G.66) te°*i=Ori О«е, G.6в)
§ I. Размерная редукция теорий гравитации 189 где 1д и Тк обозначают левое действие G и правое действие К на G/H. Взяв обратные образы метрики -у относительно отображений G.5), можно определить следующие объекты на расслоении Р: i*Pl = 7j» G-7а) 7 = 7- G-76) V С помощью соотношений G.6) легко проверить, что ур для лю- любого р G Р есть G -инвариантная метрика на однородном пространстве G/H, а 7 — К -инвариантная метрика на расслоении Р. Отметим, что эти метрики не являются независимыми: из G.5) нетрудно увидеть, что образ То G/H при отображении %'р включает в себя вертикальное подпро- подпространство Vp С ТРР, а значит 7р и у «пересекаются» по вертикальному подпространству расслоения Р. Поэтому для описания метрики -у в терминах независимых объектов, метрику *у на Р нужно разложить дальше и отбросить ее вертикальную компоненту. Для этого заметим, что К -инвариантная метрика на главном расслоении Р(М,К) порождает в нем связность. Ее горизонтальные подпространства определяются как ортогональные дополнения к вертикальным подпространствам Vp в ТРР. Легко убедиться, что благодаря 1Г-инвариантности метрики -у, это опре- определение удовлетворяет всем требованиям, предъявляемым к связности (см. главу 2, § 10). Соответствующую форму связности обозначим и>. Теперь мы можем определить метрику т] на М соотношением rJ(X,Y) = j(X*,Y*), G.8) где X,Y G ТХМ, а X*, Y* суть горизонтальные лифты этих векторов в некоторой точке р ? Р с тг(р) = х. if-инвариантность 7 обеспечивает независимость этого определения от выбора точки р. Итак, мы поставили в соответствие G-инвариантной метрике j на Е тройку объектов (т},и,1р), где rj — метрика на М, w — форма связности в главном расслоении Р(М,К), a jp для любого р ? Р есть G-инвариантная метрика на G/H. Покажем теперь, что множество G-инвариантных метрик j на Е находится во взаимно однозначном соответствии с множеством таких троек. Мы только что объяснили, как метрике -у однозначно ставится в соответствие тройка (т), w,7?)- Покажем теперь, что по такой тройке можно восстановить метрику -у с требуемы- требуемыми свойствами. Для этого заметим, что благодаря представлению G.4) G-инвариантная метрика на Е полностью определяется своими значени- значениями в точках Р, т. е. для восстановления -у на Е достаточно восстановить ее в точках Р. Изучим подробнее структуру касательного пространства к Е в точках р 6 Р, ТрЕ. Рассмотрим сначала вертикальное подпространство расслоения Е ~ Р хк G/H. В данном случае это подпространство
190 Глава 7. Спонтанная компактификация порождается действием группы G, и в соответствии с G.4), G.5) в точке р € Р оно может быть представлено как i'p(ToG/H). Выясним теперь структуру касательного пространства T0G/H. Вследствие компактности группы G пространство G/H редуктивно, т.е. существует редуктивное разложение алгебры Ли д д = Ит, G.9) причем, как мы уже отмечали в предыдущей главе, m естественно отождествляется с касательным пространством к G/H в начале о, m = TOG/H. В m действует представление изотропии группы Н, ад(Н)т. Обо- Обозначим через 6 подпространство в т, в котором реализуется тривиальное представление. Можно показать, что t есть алгебра Ли группы К. Поскольку представление ad(H)m вполне приводимо, существует инвариантное подпространство т' С т, в котором реализуются нетри- нетривиальные представления Н и которое дополняет t до m, m = t©m'. Подставляя это разложение в G.9), получаем следующее разложение алгебры g g = g®e©m', G.10) обладающее свойствами: ad(#N = 0, G.11а) ad(#)m'Cm', G.116) ' С m'. G.11 в) Последнее соотношение вытекает из редуктивности однородного про- пространства G/N(H). Для дальнейшего нам понадобится базис генераторов в g, {IJ}, [T;,Tfc] = ClikTi, согласованный с разложением G.10). Это означает, что генераторы {2}} распадаются на генераторы {Та}, Т„_ G f) и {Та}, Та € т, а генераторы Та, в свою очередь, распадаются на генераторы Та 6 t и Га е т': Tt -> (Гй G I), Ta G т), та -»(г. е е, та е т'). Из G.11) получаем общий вид коммутационных соотношений для этих генераторов: [Та, Тр] = С~дТу, [Та, Тр] = CaJ3T7, 7 ~ л <712> [Та, Ть] — С^Тд, [Та, Ть] — CabTd. Вернемся теперь к представлению G.4). Из него легко найдем, что ТРЕ = ТРР Ф tp(m'). G.13)
§ 1. Размерная редукция теорий гравитации 191 Оказывается, это разложение ортогонально относительно любой G-ин- вариантной метрики у на Е. Этот факт объясняется тем, что любая G-инвариантная метрика -у на Е порождает в точках Р (неподвижных точках подгруппы Н\) Н-инвариантное скалярное произведение. По построению, в подпространстве ТрР реализуется тривиальное предста- представление Н, а в подпространстве гр(т') — нетривиальное. Поэтому по лемме Шура эти подпространства ортогональны. Покажем, как по тройке (r),w,jp) можно восстановить метрику -у в точках Р. Во-первых, форма связности ш определяет разложение ТрР = Нр ф Vp. Поэтому, учитывая G.10), разложение G.13) можно переписать в виде ТРЕ = Hp®Vp® i'p(m) = Нр 0 i'p(m). G.14) Нетрудно показать, что горизонтальное подпространство связности в Е, порожденной связностью в Р, в точках р 6 Р, совпадает с Пр. В соответствии с этим разложение векторов X 6 ТРЕ на Нр- и ip(m)- компоненты будет записываться как X — hX + vX. Далее, пусть vX обозначает элемент из т, порождающий vX в точке р, т. е. vX = i'p(vX). Тогда значение метрики -у на векторах X, Y G ТРЕ восстанавливается по формуле 7(Х, Y) = ж* г} (hX, hY) + <yp{vX, vY\ G.15) где тг обозначает каноническую проекцию в расслоении Р. Итак, мы показали, что существует взаимно однозначное соответ- соответствие между G-инвариантными метриками на Е и тройками (T],uj,jp). Физический смысл 7/ и и) вполне ясен: т/ есть гравитационное поле на М, аи) — калибровочное поле на М с калибровочной группой К. Для выяснения физического смысла ур вспомним, что существует взаимно однозначное соответствие между множеством G-инвариантных метрик на G/H и множеством Н-инвариантных билинейных форм на m [KH]. Всякую билинейную форму на m можно рассматривать как элемент пространства m*®m*. Как мы установили в §2 предыдущей главы, на пространстве ш* действует коприсоединенное представление ad' H группы Н. Поэтому на пространстве m* <g> т* естественно определяет- определяется представление 6 группы Н, задаваемое на разложимых элементах соотношением 6h(u <g> v) = (ad1 hu) ® (ad1 hv). G.16) Ясно, что инвариантные билинейные формы принадлежат подпростран- подпространству Vo С т* <8) т*, в котором реализуется тривиальное представление Н. Разложение G.10) позволяет уточнить структуру Vo. А именно, Fo = е* ® t* e иь, G.17)
192 Глава 7. Спонтанная компактификация где Wo есть подпространство тривиального представления Н в (т')* <8> (тТ. Нам осталось выяснить закон преобразования 7р ПРИ действии структурной группы К расслоения Р. Из G.66) и G.7а) легко найти, что = Г*к->Ъ- С учетом левоинвариантности jp это можно переписать как *Р- О Л 8) Трактовка метрики 7р как элемента из т* (g> т* эквивалентна рассмо- рассмотрению ее в точке о = [е] € G/H. В этой точке G.18) сводится к соотношению где представление 6 определено аналогично формуле G.16). Теперь мы можем заключить, что ур есть эквивариантное ото- отображение из Р в Vq и поэтому описывает скалярные поля на М со значениями в Vo. Итак, мы установили состав полей редуцированной теории. Для полного ее описания нужно вывести действие для этой теории из действия Эйнштейна—Гильберта исходной многомерной теории 1 Г — S= —— / RdvE, G.19) 16тгх J Е где R и dvg суть скалярная кривизна пространства Е и его элемент объема, вычисленные по метрике j, а к обозначает многомерную гравитационную постоянную. Другими словами, нам нужно выразить R через (т/,ш,7р), отвечающие метрике 7- Чтобы сделать это, удобно локально ввести подвижный репер специального вида. Введем сначала такой репер в некоторой окрестности U С Е точки ре Р. Действие генераторов Та на Е задает в U векторные поля е° = ^^схр(Т„<) . В Р П U эти поля нигде не обращаются в нуль и линейно независимы. Поэтому существует окрестность U' С Е, в которой эти поля также не обращаются в нуль и остаются линейно независимыми. В этой окрестности коммутационные соотношения для полей еа имеют вид [еа, ер] = Г'С^(и)е7, G.20) причем в точках р ? Р П U' С^д(р) совпадают со структурными констан- константами группы g G.12), Cj,(p) = dip.
§ 1. Размерная редукция теорий гравитации 193 Появившаяся в G.20) константа / имеет размерность длины, по- поскольку базисные векторные поля на Е имеют размерность обратной длины, а элементы алгебры Ли g и ее структурные константы безраз- безразмерны; эта константа характеризует размер пространства G/H. Поля 1еа безразмерны, и к ним применимы все результаты глав 2 и 3. В частности, для полей 1ва в точках р G Р имеем w(Ze?) = Г?- Далее, в окрестности любой точки х = п(р) можно ввести локальные координаты {х1*} и построить векторные поля {дм}. Обо- Обозначим горизонтальный лифт этих полей до U' {а^}. По построению 7(ар,еа) = 0. Далее, поскольку 1г'([ам,а„]) — [д^д,,] = 0, коммутатор [а^а,,] имеет только вертикальную компоненту К,а,] = !/>)е„. G.21) Легко проверить, что в точках р 6 Р f?v(p) — 0, a f%(p) только знаком отличается от компонент кривизны связности ш в Р: % f а^ av). G.22) По определению ам имеем также [а„,еа] = 0. G.23) Итак, для любой точки р € Р найдется окрестность U' С Е, в которой существуют векторные поля {а^, еа} с коммутационными соотношения- соотношениями [еа,ер] = Г1С]1/}(и)е7, G.24а) [а/1,е„] = 0, G.246) [а^а„\^1^Лп)еа, G.24в) причем в точках р G P C\U' Clpip) = CZP, G.25a) &(Р) = 0, f%(P) = ~F%- G-256) Вычислим с использованием этого базиса скалярную кривизну R в точке р € Р. Для этого введем сначала следующие обозначения для компонент метрики 7- l(a^ av) = V V1?"' = й?' G.26а) 73ta.3ll 7<еа,е/,) = 7а/ь 7^ = ^- G-266)
194 Глава 7. Спонтанная компактификация В точке р ? Р компоненты jap вследствие ^-инвариантности -у подчи- подчинены связям Как мы уже отмечали, 7(а/о еа) = 0 по построению. С помощью формулы C.31) и коммутационных соотношений G.24) для символов Кристофеля в точке р ? Р получим Г -iriPaPa - Ciafi + Сру,а), G.27а) , G.276) "^ ~ А /ю,!' ~~ ~А ар,»/ := О, G.2/В) Гр1/,/> = r,,Vjp(»/) (символы Кристофеля метрики »/ на М). G.27д) Ковариантная производная в G.276) определена как Подставляя значения символов Кристофеля в выражение для скалярной кривизны, получим следующее представление для R: f R = R(M) + R(G/H) - -FjtvF^ab + Ls, G.28) 4 — где R(H) есть скалярная кривизна пространства М, вычисленная по метрике т), кривизна пространства G/H дается формулой R(G/H) = 1-(р^ у^ар^с/е^ ^ра а кинетический член скалярных полей есть 'a Ясно, что базис векторных полей с коммутационными соотноше- соотношениями G.24) можно построить в окрестности любой точки и = Одр, пере- перенося поля а.ц,еа действием оператора Од. Поэтому представление G.28)
§ 2. Спонтанная компактификация 195 для скалярной кривизны R справедливо в любой точке Е. Отметим еще, что скалярные поля -уар взаимодействуют с калибровочным полем неми- неминимально, и что все скалярные поля 7<*/? обладают существенно нелиней- нелинейным самодействием, вследствие чего теорию с лагранжианом G.28) нельзя рассматривать с помощью стандартных методов теории возмущений. § 2. Спонтанная компактификация Вернемся теперь к вопросу о том, можно ли требуемую фактори- зованную структуру пространства Е = М х G/H получить динамически как решение уравнений многомерной теории. Рассмотрим сначала случай чистой гравитации. В качестве действия для этой теории опять возьмем многомерное обобщение действия Эйнштейна—Гильберта G.19), допол- дополнительно введя в него космологическую постоянную А (которую при необходимости можно положить равной нулю): тбЬ <729) Е Варьируя это действие по метрике 7> получим многомерное уравнение Эйнштейна с космологической постоянной Rmn - ]рмм{В. - А) = 0. G.30) Выясним, имеют ли эти уравнения вакуумные решения, отвеча- отвечающие факторизации пространства Е. Для этого будем искать решение этих уравнений в виде 7 = 17 ©7, G-31) где г) есть метрика Минковского, а 7 — B-инвариантная метрика на G/H, не зависящая от точек пространства Минковского М4. В этом случае компоненты R^ тензора Риччи и скалярная кривизна R простран- пространства М4 обращаются в нуль. Поэтому R = R(G/H), и уравнения G.30) принимают вид R»v - -V^RiG/H) - Л) = 0, G.32а) R(G/H)ik - l--yik(R(G/H) - Л) = 0. G.326) Из первого уравнения следует, что R(G/H) = Л. Подставляя это во второе уравнение, получаем R(G/H)ik — On R(G/H) = 0. Для однород- однородного пространства с инвариантной метрикой эти равенства эквивалентны 7*
196 Глава 7. Спонтанная компактификация тому, что G/H есть тор Td. Ранее мы установили, что при размерной редукции теории гравитации в пространстве с такой структурой мож- можно получить калибровочную теорию только с абелевой калибровочной группой (U(l))d. Таким образом, для получения нетривиальной компак- компактификации с пространством Минковского в качестве четырехмерного пространства в действие G.29) нужно добавить поля негравитационной природы. Мы возьмем в качестве таких полей калибровочные поля с калибровочной группой К и со стандартным действием 5/ вида F.30). Полное действие многомерной теории получается добавлением действия Sf к действию Sg G.29): S = Sg + Sf. G.33) Варьированием этого действия по метрике -у и калибровочному полю А получаются многомерные уравнения Эйнштейна—Янга—Миллса Mmn — -z7mn{M — Л) — —ту-1 k^ml^n) ~ -i1mn\*kl->* 1 I, (/.J4a) dMFMN - TLMLFMN - [A?, FMN] = 0. G.346) Аналогично предыдущему случаю, будем искать вакуумные ре- решения для метрики в виде G.31). В соответствии с этим вакуумную конфигурацию калибровочного поля, очевидно, следует искать в виде А„ = 0, Ат = Ат(О, G.35) где {fm} — некоторые (локальные) координаты в G/H. Подставляя анзацы для метрики G.31) и поля G.35) в уравнения G.34), мы сведем их к уравнениям 4тгх ( <7-36а) dkFkm - TlklFkm - [Aki Fkm] = 0, G.366) A = 2-(Fkl,Fkl), G.36b) которые называются уравнениями спонтанной компактификации [КШ], [Лу]. Фигурирующие в них величины к и д1 суть четырехмерная грави- гравитационная постоянная и калибровочная константа связи, отличающиеся от к и д2 на объем пространства G/H, вычисленный по метрике 7- Обратимся сначала к уравнению G.36в). Нетрудно понять, что для вы- выполнения условия А = const достаточно потребовать, чтобы поле Ат было G-симметричным калибровочным полем на G/H (см. главу 6), или, что эквивалентно вследствие G.35), чтобы Ат было G-симметричным калибровочным полем на Е = М4 х G/H.
§ 2. Спонтанная компактификация 197 Рассмотрим теперь уравнение G.366). Легко видеть, что это уравнение получается варьированием по Ат эффективного действия J <Я*. **) dvG/H, G-37) G/H где dvc/н и v(G/H) — элемент объема и объем G/H, вычисленные по метрике j. Известно, что экстремумы функционала в классе симметричных полей являются экстремумами и в классе всех полей [Ко, Па]. Но в классе G-симметричных полей Ам действие 5эфф приводится к виду S3w = -{Fik,Fik), G.38) из которого ясно, что оно фактически представляет собой потенциал ска- скалярных полей редуцированной теории, записанный, в отличие от F.37), в неортонормальном базисе. Отсюда следует, что полевые конфигурации многомерной теории, отвечающие экстремумам потенциала скалярных полей редуцированной теории, являются экстремумами функционала G.37) и поэтому удовлетворяют уравнению G.366). Это наблюдение позволяет сформулировать следующий общий метод решения уравнений спонтанной компактификации: 1. Зададим на пространстве G/H Cr-инвариантную метрику 7 общего вида и вычислим для этой метрики по формуле F.37) потенциал скалярных полей V редуцированной теории. Хорошо известно [КН], что множество С-инвариантных метрик на G/H находится во взаимно однозначном соответствии с множеством Н-инвариантных скалярных произведений в т. Последние определяются разложением на неприводи- неприводимые компоненты представления изотропии и зависят от конечного числа параметров {Мк} (к = 1,2,... iV) размерности массы [ВКМР]. Поэтому соответствующую метрику мы будем обозначать 7 = 1(Мк). Скалярные поля редуцированной теории обозначим {/,(ж)} (i = 1,2,...т). Тогда потенциал V есть функция от {/,} и {Мк}: V — V(fi;Mk). 2. Для каждого набора параметров {Мк} найдем экстремумы потенциала F(/,;Mt), т.е. /,¦ = /,(М^). С помощью формул типа F.56) и формулы F.33) по этим величинам можно восстановить соответствующие конфигурации многомерного калибровочного поля А = А(Мк). 3. Вычисляя по метрике у(Мк) тензор Леви-Чивита Rik, а по полю А(Мк) — величину {Fik,Fl) и подставляя их в уравнение G.36а), мы по- получим N алгебраических уравнений на N параметров {Мк}. Если набор параметров {М]. *} удовлетворяет этим уравнениям, то метрика ^(М^) и поле A(Ml }) удовлетворяют уравнениям G.36а, б), уравнение G.36в) удовлетворяется вследствие C-симметричности поля A(MJ.0)) [ВКМР].
198 Глава 7. Спонтанная комлактификация Этот метод не только позволяет эффективно решать нелинейные дифференциальные уравнения G.36), но и дает естественный критерий физической адекватности их решений. А именно, в предыдущей главе мы показали, что потенциал скалярных полей редуцированной теории может быть потенциалом Хиггса. В этом случае естественно предпочесть компактифицирующие решения, отвечающие абсолютному минимуму потенциала (хиггсовскому вакууму), другим решениям, поскольку они оказываются нестабильными по отношению к первым. В качестве примера рассмотрим в восьмимерной теории Эйн- штейна-Янга-Миллса с калибровочной группой К = SUD) компакти- компактифицирующие решения, отвечающие следующей структуре пространства- времени: Е = М4 х СР2. Размерная редукция калибровочной теории с калибровочной группой К = SUD) в этом пространстве обсуждалась в § 3 предыдущей главы, и мы можем воспользоваться приведенным там ре- результатом F.64) для потенциала скалярных полей редуцированной теории G.39) в котором мы положили L = 1/М. Этот потенциал является стан- стандартным потенциалом Хиггса, и его экстремумы находятся тривиально: 7*1* = 0, |/*2)|2 = 1. Отметим, что в этом простейшем примере они не зависят от М. В соответствии с нашим рецептом, нахождение экстремумов по- потенциала эквивалентно решению уравнения G.366) при фиксированной метрике 7- Поэтому нам осталось решить уравнение G.36 а). В данном случае удобно поступить следующим образом. Свернем это уравнение с 7**- Тогда в левой части мы получим скалярную кривизну пространства СР2, отвечающую этой метрике, а в правой — потенциал скалярных по- полей редуцированной теории, умноженный на 4н/д2. Скалярная кривизна пространства СР2 легко вычисляется по стандартным формулам [КН]: R — 12М2. Подставляя это выражение и значение потенциала G.39) в точке Хиггсовского вакуума в свернутое уравнение G.36а), получим соотношение 2 ^4 G.40) 9 из которого для устойчивого решения находим М = (Щ j 2. Величи- Величина L = М~1 = у[Щ характеризует размер пространства СР2, который оказывается порядка Планковского. Легко проверить, что для решения, отвечающего / = 0, этот размер определяется равенством L = \1Щ-, т.е. устойчивое решение соответствует меньшему размеру пространства дополнительных измерений.
Приложения
Приложение 1. Прежде чем определить понятие окрестности, определим понятия топологии и открытого множества. Пусть S — множество и 11 — совокупность его подмножеств, удовлетворяющая условиям: 1) пустое множество 0 ? 11 и S ? il; 2) пересечение двух множеств из И принадлежит it; 3) объединение любой совокупности множеств из 11 принадле- принадлежит И. Если задана такая совокупность И подмножеств 5, то говорят, что задана топология в 5, а множество S вместе с И называется топологическим пространством и обозначается (S,il) или просто 5. Множества U ? 11 называются открытыми множествами топологического пространства E,11). Подмножество Ux С S, содержащее точку х ? 5, называется окрестностью точки х, если найдется открытое множество U ? И такое, что х ? Ux С U С S. Подмножество Т топологического пространства S называется замкнутым, если S\T = {ж ? S\x ? Т} — открыто. Более подробно со свойствами множеств и топологических про- пространств можно познакомиться по книгам [AM], [Кос], [РФ]. Приложение 2. Пусть 5 — множество элементов, которые мы будем обозначать x,y,z,.... Обозначим через Ux С S окрестность (см. Приложение 1) элемента х 6 5. Тогда S называется хаусдорфовым пространством, если выполняются следующие условия. 1. Для любого х G 5 существует по крайней мере одна окрестность Ux и х G Ux для любого Ux. 2. Если UXX) и Ux2) — окрестности ж, то существует такая окрестность Ux3) этого же элемента, что ui3) С UXX) П Ux2). 3. Пусть заданы х, Ux и у ?UX. Тогда существует окрестность Uy элемента у такая, что Uy С Ux. 4. (Аксиома отделимости). Пусть заданы произвольные х,у ? 5 и х Ф у. Тогда существуют окрестности Ux, Uy такие, что Ux П Uy = 0 @ — пустое множество). Приложение 3. Пусть 5 и Т — топологические пространства. Гомеоморфизмом называется взаимно однозначное и взаимно непрерывное отображение
Приложения 201 / : 5 —> Т, т.е. отображение, для которого существует непрерывное отображение д = f~l :T—^Snfog = tT (тождественное отображение в Г) и gof — is. Мы пишем S = Т и говорим, что 5 и Т — гомеоморфны. Приложение 4. Задать на множестве 5 бинарное отношение (или просто от- отношение) — значит перечислить некоторое множество пар элементов (ж, ж'), ж € S, ж' € S. Нам понадобится лишь понятие отношения эквива- эквивалентности. Мы будем обозначать его значком ~, говорить, что элемент ж находится в отношении ~ к элементу ж' (или ж эквивалентен ж'), и писать ж ~ ж'. Бинарное отношение называется отношением эквивалентности, если оно 1) рефлексивно, т.е. ж ~ ж для каждого ж Е S, 2) симметрично, т. е. из ж ~ ж' следует ж' ~ ж, 3) транзитивно, т. е. если ж ~ ж' и ж' ~ ж", то ж ~ ж". Определим отображение ж из S в множество всех подмножеств S следующим образом: каждому элементу ж G S поставим в соответствие множество эквивалентных ему элементов, которое называется класс экви- эквивалентности. Другими словами, тг(ж) есть множество {ж' G S\x' ~ ж}. Нетрудно показать, что если ж' 6 тг(ж), то тг(ж) = тг(ж'), и два класса экви- эквивалентности либо совпадают, либо не пересекаются. Множество классов эквивалентности называется фактор-множеством и обозначается 5/~. Таким образом тгE) = 5/~. Отображение тг называется канонической проекцией S на 5/~. Подробное изложение свойств фактор-пространств можно найти, например, в [Me]. Приложение 5. Накрывающие группы являются частным случаем накрывающих многообразий. Связное многообразие М, для которого определено непрерывное отображение А : М —+ М, называется накрывающим мно- многообразием многообразия М, если любая точка ж € М обладает такой окрестностью и, что 1) полный прообраз X~l(u) = \Jua С М есть объединение попарно а непересекающихся компонент па С М, 2) ограничение Аа = А|йа отображения А на па есть диффео- диффеоморфизм йа на всю п. Каждая иа называется правильно накрывающей компонентой. Для всех точек М и их окрестностей и таких, как
202 Приложения описано выше, число правильно накрывающих компонент одинаково, обозначается z(X) и называется числом накрытия. Односвязное накрывающее многообразие М для данного связного многообразия М называется универсальным накрывающим многообра- многообразием. Пусть, например, М = S\ ф — угловая координата точки в М @ ^ ф < 2тг). Одним из накрывающих многообразий для М является М = 51; ее точки будем параметризовать углом ip @ ^ ф < 2тг). Отображение Л : М —* М задается так: А(^>) = 2^>(mod 2тг) (остаток от деления на 2ж) и z(A) = 2. Универсальное накрывающее многообразие М = Ж.1. Для него Л(ж) = x(mod2x), где ж — координата в Ж1 (—сю < х < оо), z(X) = оо. Пусть задана группа G. Многообразие G, являющееся универсаль- универсальным накрывающим, называется универсальной накрывающей группой группы G, если отображение Л : G —» G есть гомоморфизм (он на- называется накрывающим гомоморфизмом) и в то же время локальный изоморфизм (т. е для пары окрестностей й С G и и С G, содержащих единицы, Л : й —* и есть изоморфизм). Например, для G = 5ОC) универсальной накрывающей является группа G = SUB), причем на- накрывающий гомоморфизм А реализуется формулой типа D.93) и z(\) — 2 так, что 5ОC) = 5Z7B)/Z2. Для G = SO(n) универсальная накрывающая обозначается G = Spin(n), для G — SO(\,n) — G = Spin(l,«); в этих случаях также z(X) — 2. Приложение 6. Пусть V — векторное пространство, а ц — линейный функционал, т.е. отображение, заданное на V, со значениями в М, удовлетворяющее условиям /jl(v + и) = fi(v) + ц(и), fi(xv) = xfi(v), где v,u ? V, iGl. Значение функционала ft на v часто записывают в виде внутреннего произведения: (ц, w). Пространство линейных функ- функционалов на V называется пространством дуальным (двойственным) к V и обозначается V*. Дуальное пространство V* является линейным пространством и dimV = dimF*. Если {»,-} — базис в V, то базис {ft1} в V* называется дуальным к {»,-}, если {fi',Vj} = V. Элемен- Элементы V часто называют контравариантными векторами, а элементы V* — ковариантными.
Приложения 203 Приложение 7. В этом пункте мы дадим определения некоторых наиболее часто употребляемых типов отображений ф : S —* Т, где S и Г — некоторые множества. Отображение ф взаимно однозначно (инъективно), если из х Ф х' (х,х' € X) следует ф(х) Ф ф(х'). Отображение ф является отображением 5 на Т (сюръективным), если ф(в) = Т. Отображение ф, которое инъективно и сюръективно, называется биективным. Отображение ф называется гомоморфизмом, если оно сохраняет математические структуры, введенные на множествах. Так, если S = G и Т = G' являются группами, то гомоморфизмом называют однозначное (но не обязательно взаимно однозначное) отображение, сохраняющее групповую композицию: ф(аЬ) = ф(а)ф(Ь), a,b?G. Аналогично, если S = g и Т = д' — алгебры Ли со скобочным законом умножения [х,у], то гомоморфизм алгебр должен удовлетворять условию №> У]) = 1Ф(х), ФШ, «, У € 0. Если S = G и Т = G' — группы, то ядро ker<? гомоморфизма ф есть подгруппа кег$ = {д G С\ф(д) = е} С G (е — единица группы), а образ Im ф гомоморфизма ф — Im ф = {ф(д),д ? G} С G'. Гомоморфизм ф называется мономорфизмом, если кег0 = {е} (т.е. ф инъективиое отображение), и эпиморфизмом, если \тпф = G' (т.е. ф сюръективно). Если гомоморфизм ф биективен, т.е. ф — взаимно однозначное отображение G на G' (кетф — {е}, \тпф = G'/), то он называется изоморфизмом. В этом случае говорят, что G и G' изоморфны и пишут G = G'. Рассмотрим теперь отображение множества в это же множество ф: S —> 5. Если S = G — группа и отображение ф — гомоморфизм, то ф называется эндоморфизмом. Изоморфное отображение группы на себя называется автоморфизмом. Все эти определения очевидным образом переформулируются для алгебр (с заменой е на нулевой элемент). Часто встречается автоморфизм группы ф : G —> G, задаваемый формулой ф(д) — а~1да, где д € G, а а — произвольный фикси- фиксированный элемент группы. Этот автоморфизм называется внутренним автоморфизмом, порожденным элементом а. Приложение 8. Пусть группа G действует на множестве S, т. е. задано отображение GxS —> S, которое обозначается (<?, х) —* д-х со следующими свойствами:
204 Приложения i) e • х = х для всех х ? 5 (е — единица группы); ") 9 ' id'' х) — (99)' х Для всех х ? S и g,g' ? G. В этом случае множество 5 часто называют G-множеством. Орбитой точки х ? S называется подмножество G ¦ х = {д ¦ х, g ? G} С S. Мож- Можно показать, что две орбиты G ¦ х и G ¦ у либо совпадают, либо не пересекаются, а все G-множество S разлагается в объединение непересе- непересекающихся орбит. При этом на 5 возникает отношение эквивалентности (см. Приложение 4): х ~ у тогда и только тогда, когда хну принадлежат одной орбите. Приложение 9. Говорят, что группа G действует на 5 транзитивно или что G-множество S однородно, если любая точка из 5 переводится в любую другую преобразованием из группы G. В частности, орбита (см. Приложение 8) является однородным (У-пространством, а любое (?-множество является объединением однородных пространств. Зафиксируем точку х ? S. Подгруппа Gx = {g ? G \д ¦ х = х} С G называется стационарной подгруппой или стабилизатором точки х. Со- Совокупность элементов вида {gh,h G Gx} при фиксированном д G G называется левым смежным классом. Его обозначают [д] или gGx. Оче- Очевидно, что [д] состоит из всех элементов группы, переводящих точку х в д • х. Можно показать, что G-множество S изоморфно пространству левых смежных классов G/ ~, где отношение эквивалентности задается так: д ~ д' тогда и только тогда, когда д и д' принадлежат одному классу 19] — \я'\- Пространство левых смежных классов будем обозначать G/Я, H^GX. Обратно, пусть Н — подгруппа G. Совокупность G/H левых смежных классов в G по Н вида [д] = дН = {gh,h ? Н} является однородным Cr-пространством относительно естественного действия G: д:[д']=д1Н—>[дд'] = дд'Н. Приложение 10. Введем понятие компактности. Пусть 5 и Г — два множества и Г С S. Открытым покрытием подмножества Т называется семейство открытых подмножеств {«у : j ? J}, Uj С S такое, что Г С \J uj- jeJ Если вдобавок индексирующее множество J конечно, то {uj : j ? J}
Приложения 205 называется конечным открытым покрытием. Пусть {uj : j (E J} и {vk : к Е К} — два покрытия Т С 5. Если для любого j ? J найдется fc E К такое, что Uj = Vk, то {uj : j (Е J} называется подпокрытием покрытия {vk : к 6 К}. Говорят, что покрытие {uj : j 6 J} вписано в покрытие {vk : к € К}, если для любого j 6 J найдется к ? К такое, ЧТО Uj С Vk. Покрытие называется локально конечным, если каждая точка пространства обладает окрестностью, пересекающейся лишь с конечным числом Uj из этого покрытия. Подмножество Т топологического пространства X называет- называется компактным, если всякое открытое покрытие Т обладает конечным подпокрытием. Например, пространство 1R с обычной топологией неком- некомпактно, потому что открытое покрытие {(п, те+2): те 6 Z — целые числа} не имеет конечных подпокрытий. Единичный отрезок [0,1] и окруж- окружность S] компактны. Не любое подмножество компактного пространства компактно, например, интервал @,1) - некомпактное подмножество в [0,1] (рассмотрите покрытие {A/те, 1 - 1/те) : п — натуральные числа}). Но замкнутое (см. Приложение 1) подмножество компактного простран- пространства всегда компактно. Подмножество пространства М" компактно в том и только в том случае, если оно ограничено и замкнуто (теорема Гейне—Бореля). Если S — метрическое пространство (т.е. определена неотрица- неотрицательная вещественная функция на 5x5, называемая метрикой, такая что р(х,у) = 0 тогда и только тогда, когда х = у; р(х,у) = р(у,х); p(x,z) ^ р(х,у) + p(y,z) для любых x,y,z G 5), то его компактное под- подмножество при любом положительном е может быть накрыто конечным числом открытых шаров радиуса е. Хаусдорфово пространство (см. Приложение 2) называется па- ракомпактным, если во всякое его открытое покрытие можно вписать локально конечное открытое покрытие. Компактные хаусдорфовы про- пространства и все метрические пространства являются паракомпактными.
Задачи
Задачи к главе 2 1. Для сферы S2 найти карты и локальные гомеоморфизмы ?>»(р) (р — точка сферы), воспользовавшись стереографической проекцией. Вычислить функцию <p\j = Vi °Vj'- Записав локальные координаты в комплексном виде (отождествив М2 с С1), показать, что СРХ диффео- морфно S2. 2. Показать, что многообразия Z2, SUB) изоморфны сферам. Проверить, что 5ОC) ~ ЕР3. 3. Выразить коммутатор векторных полей [fX,gY] через поля X,Y и [X,Y]. Здесь X,Y e X(M), f,g G 5(М). 4. Исходя из инвариантности X € 3?(М) и u; G ?>' (М) относитель- относительно общекоординатных преобразований, установить, как преобразуются компоненты ?' поля X и компоненты щ формы со при этих преобразо- преобразованиях. 5. Найти размерность пространства г-форм dim?>r. Показать, что dim Dr — dim Dnr, где п = dim M. 6. Пусть, M = Ж" и {ж1} — координаты в Е". Выписать в этих координатах все возможные формы для п = 2 и п = 3 (см. B.15)) и вычислить их внешние производные и их попарные внешние произве- произведения. В случае, когда п = 3 для 1-формы ш — ^«,-da;1 и 2-формы i fi = 5D Vijdx1 Л dar7 связать do; и d/x с rot« и div s", где компоненты и вектора Si определяются величинами Vjji Vij = ?kijSk- 7. Пусть М = Ж3. Используя запись в координатах {ж1}, показать, что тождества ddf = 0 и ddo> = 0 эквивалентны rotgrad/ = 0 и div rot г? = 0, где / G #(М), а о; = Ylui^x% — 1-форма. i 8. Доказать формулу B.21) в локальных координатах. 9. Пусть dimM = 2. Показать, что при замене локальных ко- координат х1 —» х"(х\х2) (i — 1,2) 2-форма dz1 Л dx2 преобразуется как элемент площади: dx' Adx' = (Якобиан замены) dx] Л dx2. 10. Вычислить *ш и **ш для w e Dr(R2) при г = 0,1,2. 11. Доказать формулу B.25). 12. Доказать равенство B.26). 13. Показать, что для левых сдвигов La и правых сдвигов Ra на группе выполняются равенства Ъаъ = Lao Lb, Rab = Rb o Ra. 14. Показать, что если А — левоинвариантное векторное по- поле и ^ — его однопараметрическая группа преобразований, то (pt коммутирует с левыми сдвигами La для всех а Е G.
Задачи 209 15. Доказать уравнение Маурера—Картана B.44) для левоинвари- антных форм. 16. Показать, что уравнение Маурера—Картана B.44) для канони- канонической 1-формы группы G в базисе {Ei}, удовлетворяющем B.47), имеет вид B.46). 17. Найти каноническую 1-форму в и левоинвариантные вектор- векторные поля i) для G = 5GB) в параметризации g(ot\,а2,(Хз) — expfi ?3 ak<*k) I ii) для G = U(l). 18. Рассмотреть действие G = 5ОC) на М = S2 = {х е Ш3, (х{J + (ж2J+(ж3J = 1}. Определить тип действия (свободное или эффективное). Построить в явном виде гомоморфизм <т из алгебры Ли группы 50C) в ?E2). Указания: поля искать в сферических координатах; генераторы 50C) на сфере являются операторами момента. 19. Доказать формулы B.67), B.71), B.72). Использовать при этом тождество Якоби B.56) для полей А*а, ?*, ?*¦. 20. Доказать, что о> = (рг2)*0 есть форма срязности канонической плоской связности в Р = М х G (формула B.81)). 21. Рассмотреть расслоение Хопфа 53 = РE2,Щ1)). Показать, что 1-форма в3, где в = Х^*7»^' — каноническая 1-форма на 517B) > (см. B.50)), есть форма связности, и вычислить ее форму кривизны. Какие векторные поля образуют базис горизонтального пространства? 22. Рассмотреть формулу Стокса B.101) для г = 2 и ш = A{dxx и г = 3 и ш — ^?ijkEkdxl A dxK Выяснить к каким известным формулам математического анализа приводится B.101) в этих случаях. 23. Выразить инвариантную функцию tr(exp-4) через симметри- симметрические полиномы Sj(X) B.99). 24. Вычислить первое число Черна для расслоения Хопфа 53 = РE2,Щ1)) для форм связности i) и ii) из § 12 и формы связности из задачи 2.21. 25. Объясните, в каком пункте нарушился бы аналог Предложе- Предложения 2.9.1. для ассоциированного расслоения. 26. Показать, что лента Мёбиуса, определенная в §6 (см. также Пример 6 в §7 гл. 2), является неориентируемым многообразием. 27. Показать, что определение интеграла B.22а), B.226) не зависит от выбора локальных координат и согласовано в области пересечения окрестностей, покрывающих многообразие М.
210 Задачи Задачи к главе 3 1) Покажите, что определения C.10а) и C.106) корректны, т.е. не зависят от выбора точки и ? к~1(х) и векторов X, Y, Z таких, что тг'(Х) = X, тг'(У) = Y и ж'B) = Z. 2) Исходя из C.15) и пользуясь C.11) получить выражения для компонент тензоров кривизны и кручения через символы Кристофеля. 3) Покажите, что ?*, в\ЕГ) = 0, 4) Для компонент if векторного поля Y относительно локальной системы координат {х1}, Y = ^ifXi, где Xi = д/дх1, выразить их ковариантные производные if.j, определяемые соотношением через обычную производную drf/dx*, компоненты г? и символы Кри- стоффеля. Задачи к главе 4 1. Получить формулы D.21) и D.22) для лагранжиана и действия калибривочной теории. 2. Рассмотреть формы ш0 и В (см. D.11)) на подрасслоении ж~\и) в локальных координатах. Показать, что для произвольного векторного поля D.9) на -k~\U) <vo(hY) = -B(Y), B(hY) = B(Y), где hY — горизонтальная компонента Y. 3. Рассмотреть электродинамику Максвелла в пространстве-вре- пространстве-времени Минковского М4. а) Выразить 2-форму *F в терминах электрического (Ё) и магнитного (В) полей (см. D.43)). Показать, что переход F —»¦ *F равносилен замене Ё —> -В, В -* Ё. б) Проверить, что уравнения D.47) эквивалентны системе уравне- уравнений Максвелла D.48).
Задачи 211 в) Получить из D.49) уравнение непрерывности D.51). 4. Проверить в случае М = М2, что Л/ с / G D°(M) сводится к обычному оператору Лапласа, действующему на функцию /(ж). 5. Получить уравнения D.47) из действия D.54). 6. Доказать формулу D.58). 7. Показать, что для инстантонного решения D.87), D.88) С2(Р) = -1. 8. Рассмотреть неабелеву калибровочную теорию на расслоении Р = М4 х К с калибровочной группой К = 517B) и скалярным полем в фундаментальном представлении. Получить аналоги формул D.111) и D.112). НИИ Задачи к главе 5 1. Рассмотрите элементы группы 50C) в матричном представле- а/ -\ -iff? S(a) = e , где а = (ax,ag,az), Tx,Ty,Tz — стандартные генераторы вращений. Покажите, по-крайней мере в квадратичном приближении по а и Д, что SE)S{0) = 5G), где величина ^Т строится из af, рТ и их коммутаторов, но не содержит элементы типа EГ)(рТ). 2. Пусть L — алгера Ли, К — ее подалгебра. Показать, что центр 3(?) есть абелев идеал, а централизатор Cl(K) — подалгебра в L. 3. Пусть L — алгебра Ли, А и В — идеалы в L. Покажите, что [А, В] — также идеал в L. 4. Доказать матричное равенство E.46) deteM = е1тМ. Указание: воспользоваться тем фактом, что любая квадратная матрица М может быть приведена к нормальной жордановой форме, т.е. существует невы- невырожденная матрица X такая, что Х~ХМХ = J, где J — некоторая жорданова матрица, т.е. блочно-диагональная матрица \ ( Зг,(А,) 0 ... Ч 0 CMA2) ... ... 0 0 а,3(Аз) ... ... ... ... в которой 3Г(А) есть г х г матрица вида
212 Задачи А 1 О ,0 0 0 ... А, (См. [КМ1). 5. Найти размерности алгебр в табл. 5.1. Показать, что sl(n,P) является идеалом в gl(n,P). 6. Покажите, что ядро гомоморфизма ad : L —> gl(V) является центром алгебры Ли L, kerad = ЪЩ. 7. Докажите свойство 1 полупростых алгебр Ли (см. §4). Для этого рассмотрите выражения вида ad ea(ad ер(Х)) для случаев, когда X G f) и X = е7, 7 ? Д и покажите, что во всех случаях trad ea ad ер = 0. 8. Пользуясь результатами предыдущей задачи и невырожденно- невырожденностью формы Киллинга на д, докажите свойство 2 из §4. 9. Покажите, что подалгебра Картана полупростой алгебры абеле- ва. Для этого рассмотрите B(X,Y) с X ? <9(|) = [в,0] и воспользуйтесь формулой E.44). 10. Докажите свойство 5 из §4, воспользовавшись свойством 1 и невырожденностью формы Киллинга на д. 11. Покажите, что для алгебры g = A3 справедливы формулы E.31) и tz и у являются регулярными элементами. 12. Докажите свойство 8 из §4. Для этого рассмотрите а — серию корней, проходящую через а и воспользуйтесь формулой E.43). 13. Проверьте свойство 10 из §4. Используйте метод доказательства от противного. 14. Докажите свойство 11 из §4. Для этого рассмотрите а — серию, походящую через /3 и воспользуйтесь формулой E.43). 15. Восстановите матрицу Картана и алгебру по диаграмме Дын- кина для алгебры В2. 16. Докажите отрицательную определенность формы Киллинга на вещественой форме д, порожденной элементами E.50). Задачи к главе 6 1. Рассмотрите алгебру g = А3 и ее регулярную подалгеру S) = А^. Разложите представление (g,ad) алгебры $) на неприводимые и найдите централизатор Cg(S)). 2. Рассмотреть задачу о размерной редукции симметрического сектора многомерной теории Янга—Миллса, заданной в шестимерном пространстве вида Е = М4 х G/H, где G/H = SUB)/U(\) = СРХ (диффеоморфно сфере S2), с калибровочной группой К = SUB). Найти калибровочную группу С редуцированной теории и, вычислив потенциал скалярных полей, построить действие редуцированной теории.
Список литературы [AM] Александрии Р. А., Мирзахарян Э. А. Общая топология. М.: Высшая школа, 1979. [АХЗ] Atiyah M., Hitchin N.. Singer I. Proc. Nat. Acad. Sci. V. 74. P. 2662- 2663. 1977. [БД] Balaban Т., Jaffe A. Constructive Gauge Theory. Fundamental Problems of Gauge Field Theory. Proc. of the 6-th Ettore Majorana Intern. School on Mathematical Physics (Erice, 1985). Ed. by G. Velo, A. S. Wightman. №4. Plenum Press. P. 207-264. 1986. [БЛОТ] Боголюбов Н. Н., Логунов А. А., Оксак А. Н., Тодоров И. Т. Общие принципы квантовой теории поля. М.: Наука, 1987. [БР] Барут А., Рончка Р. Теория представлений групп и ее приложения. М.: Мир, 1980. [Бр] Бредон Г. Введение в теорию компактных групп преобразований. М.: Наука, 1980. [БШ] Боголюбов Н. Н., Ширков Д. В. Введение в теорию квантованных полей. М.: Наука, 1984. [БШ 1] Боголюбов Н. Н., Ширков Д. В. Квантовые поля. М.: Наука, 1980. [Ва] WeinbergS. Phys. Rev. Lett. V. 19. P. 1264. 1967. [Bu] Wilczek F. In: Quark Confinement and Field Theory. N. Y.: John Wiley and Sons, 1977. [BK] Волобуев И. П., Кубышин Ю. А. ТМФ. Т. 68. №2. 225-235; №3. С. 368-380. 1986. [ВКМ] Волобуев И. П., Кубышин Ю. А., Моурао Ж. М. ТМФ. Т. 78. № 1. 58-69; №2. С. 267-280. 1989. [ВКМР] Волобуев И. П., Кубышин Ю. А., Моурао Ж. М., Рудольф Г. ЭЧАЯ. Т. 20. Вып. 3. С. 561-627. 1989. [ВТ] Волошин М. Б., Тер-Мартиросян К. А. Теория калибровочных взаимодействий элементарных частиц. М.: Энергоатомиздат, 1984.
214 Список литературы [ГВ] Gross D., Wilczek R. Phys. Rev. D8. P. 3633. 1973. [ГГ] Гото М., Гроссханс Ф. Полупростые алгебры Ли. М.: Мир, 1981. [ГД] Глимм Дж., Джаффе А. Математические методы квантовой физики. Подход с использованием функциональных интегралов. М.: Мир, 1984. [Гр] Gribov V. N. Nucl. Phys. V. В139. № 1. P. 1-19. 1978. [Дж] Джекобсон Н. Алгебры Ли. М.: Мир, 1964. [ДМ] Drechsler W., Mayer N. Е. Fibre bundie techniques in gauge theories. Lecture Notes in Physics. V. 67. Springer-Verlag. 1977. [ДНР] Jackiw R., Nohl C, Rebbi С Phys. Rev. D15. P. 1642-1646. 1977. [ДНФ] Дубровин В. А., Новиков С. П., Фоменко А. Т. Современная геометрия. Методы и приложения. 2 изд. М.: Наука, 1986. [Ды 1] Дынкин Е. Б. Классификация простых алгебр Ли. Мат. сборник, Т. 18. С. 347-352. 1946. [Ды 2] Дынкин Е. Б. Максимальные подгруппы классических групп. Труды Московского математического общества. Т. 1. С. 39—166. 1952. [ЕГХ] Eguchi Т., Gilkey Т. В., Hanson А. Г. Phys. Reports С. V. 66. № 6. Р. 213-393. 1980. [За] Зайлер Э. Калибровочные теории. М. 1985. [Зи] Singer I. M. Commun. Math. Phys. 60. P. 7-12. 1978. [Ka] Cahn R. N. Semi-simple Lie algebras and their representations. Reading, MA: Benjamin/Cummings Pub. Com., 1984. [Ки] Кириллов А. А. Элементы теории представлений. М.: Наука, 1978. [КК] Kaluza Т. Sitzungsber. Preuss. Acad. Wiss. Berlin. Math. Phys. Kl. 966. 1921. Klein C. Z. Phys. V. 37. P. 895. 1926. [KM] Кострикин А. И., Манин Ю. И. Линейная алгебра и геометрия. М.: Наука, 1986. [КН] Кобаяси Ш., Номидзу К. Основы дифференциальной геометрии. Т. 1,2. М.: Наука, 1981.
Список литературы 215 [Ко] Coleman S. Classical lumps and their quantum descendants. New Phenomena in Subnuclear Physics. Proc. of the 1975 Intern. School of Subnuclear Physics. Part A. Ed. by Zichichi, N. Y.—London: Plenum Press. P. 297-421. 1977. [Кос] Косневски Ч. Начальный курс алгебраической топологии. М.: Мир, 1983. [КП] Коноплева Н. П., Попов В. Н. Калибровочные поля. М.: Атомиздат, 1972. [КФ] Corrigan E. Е, Eairlie D. В. Phys. Lett. V. 67В. Р. 69-71. 1977. [КШ] Cremmer E., Scherk J. Nucl. Phys. В. V. 118. № 1/2. P. 61-75. 1977. [ЛБ] Ляховский В. Д., Болохов А. А. Группы симметрии и элементарные частицы. Л.: Изд-во ЛГУ, 1983. [Лу] Luciani I. E Nucl. Phys. В. V. 135. № 1. P. 111-130. 1978. [Me] Менский М. Б. Метод индуцированных представлений: простран- пространство, время и концепция частиц. М.: Наука, 1976. [Но] Номидзу К. Группы Ли и дифференциальная геометрия. М.: ИИЛ, I960. [Па] Palais R. S. Commun. Math. Phys. V. 69. P. 19. 1979. [По] Понтрягин Л. С. Непрерывные группы. М.: Наука, 1973. [Ра] Раджараман Р. Солитоны и инстантоны в квантовой теории поля. М.: Мир, 1985. [РФ] Рохлин В. А., Фукс Д. Б. Начальный курс топологии. Геометрические главы. М.: Наука, 1977. [Са] Salam A. Elementary Particle Theory. Ed. by N. Svartholm. Stockholm. Almquist Forlag AB. P. 367. 1968. [Co] Соколов А. А., Тернов И. М., Жуковский В. Ч., Борисов А. В. Калибровочные поля. М.: Изд-во МГУ, 1986. [Сай] Саймон Б. Модель Р(у)г эвклидовой квантовой теории поля. М.: Мир, 1976. [Tpl] TrautmanA. Fibre bundles associated with space-time. Rep. Math. Phys. V. 1. №1. P. 29-62. 1970.
216 Список литературы [Тр 2] TrautmanA. Czechoslovak Journ. of Physics. V. B29. № 1. P. 107-116. 1979. [Шв] Schwan A. S. Phys. Lett. V. 67B. P. 172-174. 1977. [Хи] Higgs P. W. Phys. Lett. V. 12, P. 132. 1964. [Xo] 't Hooft G. Report at the Conference on Lagrangian field theories. Marseille, 1972. [ЧЛ] Ченг T.-I7., Ли Л.-Ф. Калибровочные теории в физике элементарных частиц. М.: Мир, 1987. [Ше] Шевалпе К. Теория групп Ли. Т. 3. Общая теория алгебр Ли. М.: ИИЛ, 1958. [ЯМ] Yang С. N., Mills R. L. Phys. Rev. V. 96. P. 191. 1954.
Предметный указатель Абелева алгебра Ли, 133 алгебра Ли, 24, 37, 132 ассоциативная алгебра, 132 ассоциированное расслоение, 50 атлас, 19 Векторное поле, 24 дифференцируемое векторное расслоение, 66 вертикальное подпространство, 55 вещественное проективное про- пространство, 21 вещественная форма, 135 внешнее произведение, 27 внешнее дифференцирование, 28 внешнее ковариантное дифферен- дифференцирование, 61, 82 внутренний автоморфизм группы, 9 внутреннее произведение, 25 выбор калибровки, 10 Главное расслоенное пространст- пространство (главное расслоение), 43 гомеоморфизм, 19 гомоморфизм расслоений, 45 горизонтальный лифт, 57 горизонтальный лифт (подъем) кривой, 66 горизонтальное подпространство, 56 группа когомологии де Рама, 74 группа Ли, 36, 43, 132 группа Лоренца, 122 групповое многообразие, 23 Действие Эйнштейна—Гильберта, 191, 195 диаграмма Дынкина, 154, 174 диффеоморфизм, 35 дифференциал отображения, 32 дифференциальная форма, 26 дифференцируемое многообразие, 19 дифференцируемое отображение, 32 Единая теория электрослабых вза- взаимодействий (модель Вайнбер- га—Салама), 11, 184 Замкнутая форма, 73 Идеал алгебры, 132 инфинитезимальный оператор, 133 инвариантная связность, 160 инвариантная форма, 141 инстантон, 115 инстантонное расслоение, 48 интегрирование дифференциаль- дифференциальных форм, 28
218 Предметный указатель Калибровочное преобразование, 8, 10, 12, 101, 103 калибровочная теория сильных взаимодействий (квантовая хромодинамика), 17 каноническая левоинвариантная 1-форма, 39 каноническая плоская связность, 56 каноническая форма для расслое- расслоения линейных реперов, 80 карта, 19 касательное расслоение, 50, 79 касательный вектор, 23 касательное пространство, 24 классические алгебры, 137 ковариантная производная, 10 кокасательное пространство, 18 кокасательный вектор (ковектор), 24 комплексное проективное прост- пространство, 21 комплексификация алгебры, 135 компактная вещественная форма, 135, 156 компактная алгебра, 141 корень, 146 корневой вектор, 147 корневая диаграмма, 153 корневая решетка, 174 кручение линейной связности, 83 кривизна линейной связности, 83 Лафанжиан неабелевой калибро- калибровочной теории, 8, 94, 107 левоинвариантное векторное по- поле, 38 левоинвариантная форма на фуп- пе, 38 линейная связность, 79 Магнитный монополь Дирака, 112 матрица Картана, 154 метрическая связность, 89 Неабелево калибровочное поле, 8, 12, 108 неоднозначность Грибова, 111 нильпотентная алгебра, 139 нормализатор, 132 Овеществление алгебры, 135 однопараметрическая фуппа пре- преобразований, 36 окрестность, 19 оператор Лапласа, 105 операция сопряженная к внешне- внешнему дифференцированию (ко- (кодифференцирование), 105 операция Ходжа, 31, 88 ориентируемость, 25 ориентируемое многообразие, 25 Параллельный перенос, 17 параллельный перенос слоев, 66 параллельный перенос вдоль кри- кривой, 67 плоская связность, 64 подалгебра Картана, 144 полупростая алгебра Ли, 133 полупрямая сумма, 133 потенциал Хиггса, 128, 184, 198
Предметный указатель 219 потенциал электромагнитного по- поля, 8 представление алгебры Ли, 138 преобразование, 35 присоединенное представление, 138 присоединенное представление группы, 9 простая алгебра Ли, 133 простой корень, 153 прямая сумма, 133 псевдотензориальная форма, 60 (псевдо)риманова метрика, 86 Разложение по корневым подпро- подпространствам, 146 разрешимая алгебра, 139 размерная редукция гравитации, 187 размерная / редукция симметрич- симметричных калибровочных полей, 166 ранг алгебры, 143 расслоение Хопфа, 48, 64 расслоение линейных реперов, 46, 79 расслоение магнитного монополя, 47, 112 расслоение ортонормальных репе- реперов, 89 регулярный элемент, 143 редукция действия калибровочной теории, 171 редукция связности, 58 редукция структурной группы, 46 редуцированное расслоение, 46 римановы связности, 86, 90 Связность, 56 сигнатура представления, 156 символы Кристофеля, 85, 194 симметричная билинейная форма, 9, 140 симметричное калибровочное по- поле, 161 сечение, 53 скалярная кривизна, 91, 194 скалярное поле, 127 сопряжение, 157 спинорные представления, 123 спонтанное нарушение симмет- симметрии, 128 спинорное поле, 129 спонтанная компактификация, 187 старший вес, 156 старший (весовой) вектор, 156 стереографическая проекция, 20 структурное уравнение для формы кривизны, 62 сфера, 20 Тензор напряженности, 10, 95 тензор Риччи, 92, 197 тензориальная форма, 60 тензорная алгебра, 50 тензорное расслоение, 51 теорема Стокса, 74 тотальная форма Черна, 76 точная форма, 73 Угол Вайнберга, 15 универсальная накрывающая группа, 122 уравнения Максвелла, 106
220 Предметный указатель уравнение Маурера—Картана, 38 уравнения спонтанной компакти- фикации, 197 уравнения Янга—Миллса, 11, 108 условие (анти)самодуальности, 118 Форма Киллинга, 140 форма кривизны, 61 форма кручения линейной связ- связности, 81 форма связности, 56 форма Черна, 76 формула Лейбница, 34 фундаментальное векторное поле, 45 функции перехода расслоения, 44 Характеристика Эйлера, 74 характеристический класс Черна, 76 хаусдорфово пространство, 19 Центр алгебры, 132 централизатор, 132 Числа Бетти, 74 число Черна, 77, 99, 114 68, 92, 107 Эквивариантное отображение, 38, 133 экспоненциальное отображение, 38, 133 электродинамика Максвелла, 104 элемент объема, 29 эффект Хиггса, 13, 127, 185
Содержание Предисловие 3 Глава I. Введение 7 §1. Принцип локальной калибровочной инвариантности и поля Янга—Миллса 8 §2. Калибровочные теории взаимодействий элементарных частиц II §3. Геометрическая интерпретация калибровочных полей 17 Глава 2. Основные понятия дифференциальной геометрии 19 § 1. Дифференцируемые многообразия 19 § 2. Касательные векторы и векторные поля 23 § 3. Дифференциальные формы 25 § 4. Отображения и преобразования 32 § 5. Группы Ли 36 § 6. Главные расслоения 42 § 7. Примеры главных расслоений 46 § 8. Ассоциированные расслоения 49 § 9. Сечения расслоений и их свойства 53 § 10. Связности в главных расслоениях 55 §11. Форма кривизны 60 § 12. Некоторые примеры 64 § 13. Параллельный перенос и ковариантное дифференцирование 66 § 14. Характеристические классы 70 Глава 3. Линейные и римановы связности 79 §1. Линейные связности 79 §2. Ковариантное дифференцирование 82 §3. Тензоры кривизны и кручения 83 §4. Римановы связности 86 Глава 4. Геометрическое описание калибровочных полей и полей материи 93 § 1. Калибровочное поле как связность в главном расслоении 93
222 Содержание §2. Калибровочные преобразования 100 §3. Электродинамика Максвелла 104 §4. Неабелевы калибровочные теории 108 §5. Магнитный монополь Дирака 112 § 6. Инстантоны 115 §7. Поля материи 121 Глава 5. Основы теории алгебр Ли 131 §1. Основные понятия. Связь групп и алгебр Ли 131 §2. Представления алгебр и форма Киллинга 137 §3. Подалгебра Картана 143 §4. Структура простых алгебр Ли 147 Глава 6. Размерная редукция симметричных калибровочных полей 159 § 1. Симметричные калибровочные поля и инвариантные связности 160 § 2. Размерная редукция симметричных калибровочных полей 166 §3. Вычисление потенциала скалярных полей в задаче размерной редукции 173 Глава 7. Спонтанная компактификация 187 §1. Размерная редукция теорий гравитации 187 §2. Спонтанная компактификация 195 Приложения 200 Задачи 208 Список литературы 213 Предметный указатель 217