Предисловие редакторов перевода
Предисловие автора
Обозначения и соглашения
I Основы общей теории относительности
1.2 Пространство и время в дорелятивистской физике и в специальной теории относительности
1.3 Метрика пространства-времени
1.4 Общая теория относительности
2 Многообразия и тензорные поля
2.2 Векторы
2.3 Тензоры. Метрический тензор
2.4 Абстрактные индексные обозначения
3 Кривизна
3.2 Кривизна
3.3 Геодезические
3.4 Методы вычисления кривизны
4 Уравнения Эйнштейна
4.2 Специальная теория относительности
4.3 Общая теория относительности
4.4 Теория гравитации в линейном приближении: ньютонов предел и гравитационное излучение
4.4.2 Гравитационное излучение
5 Однородная изотропная космология
5.2 Динамика однородной изотропной Вселенной
5.3 Космологическое красное смещение. Горизонты
5.3.2 Горизонт частиц
5.4 Эволюция нашей Вселенной
6 Решение Шварцшильда
6.2 Внутренние решения
6.3 Геодезические в пространстве-времени Шварцшильда
6.3.2 Прецессия перигелия
6.3.3 Отклонение лучей света
6.3.4 Времениая задержка сигналов
6.4 Расширение Крускала
II Современные методы в общей теории относительности
7.2 Пространственно однородные космологические решения
7.3 Алгебраически специальные решения
7.4 Методы генерирования решений
7.5 Возмущения
8 Причинная структура
8.2 Условия причинности
8.3 Области зависимости. Глобальная гиперболичность
9 Сингулярности
9.2 Конгруэнции времениподобных и нулевых геодезических
9.3 Сопряженные точки
9.4 Существование кривых максимальной длины
9.5 Теоремы о сингулярностях
10 Формулировка начальных данных
10.2 Формулировка начальных данных в общей теории относительности
11 Асимптотически плоские пространства
11.2 Энергия
12 Черные дыры
12.2 Общие свойства черных дыр
12.3 Заряженные черные дыры Керра
12.4 Извлечение энергии из черных дыр
12.5 Черные дыры и термодинамика
13 Спиноры
13.2 Спиноры в искривленном пространстве-времени
14 Квантовые эффекты в сильных гравитационных полях
14.2 Квантованные поля в искривленном пространстве-времени
14.3 Рождение частиц вблизи черных дыр
14.4 Термодинамика черных дыр
Приложения
В Дифференциальные формы. Интегрирование. Теорема Фробениуса
B.2 Интегрирование
B.3 Теорема Фробениуса
С Отображения многообразий. Производные Ли. Поля Киллинга
С.2 Производные Ли
С.3 Векторные поля Киллинга
D Конформные преобразования
E Лагранжева и гамильтонова формулировки уравнений Эйнштейна
Е.2 Гамильтонова формулировка
F Единицы измерения и размерности
Литература
Предметный указатель
Текст
                    General
Relativity
Robert M. Wald
The University of Chicago Press, Chicago 60673
The University of Chicago Press, Ltd., London
©1984 by The University of Chicago
All rights reserved. Published 1984
Printed in the United States of America
95949392 7
Library of Congress Cataloging in Publication data
Wald, Robert M.
General Relativity.
Bibliography: p.473
Includes Index.
1. General Relativity (Physics) I. Title.
QC173.6.W35 1984 530.П 83-17969
ISBN 0-226-87032-4
ISBN 0-226-87033-2(pbk.)


Роберт М. Уолд Общая теория относительности Перевод с английского В.Р. Гаврилову Г.Н. Измайлову С.С. Моливеру СВ. СушкоВу Н.Р. Хуснутдинов Редакторы перевода ИЛ. Бухбиндеру СВ. Червой Москва Российский университет дружбы народов 2008
УДК 530.12 У 63 ББК 22.313 Издание осуществлено при финансовой поддержке Российского фонда фундаментальных исследований по проекту 06-02-30035. рсеЬи У 63 УОЛД P.M. Общая теория относительности. Пер. с англ. Под ред. И.Л. Бухбиндера, СВ. Червона. - М.: РУДН, 2008. - 693 с: ил. ^ Книга известного американского физика-теоретика Роберта М. Уол- да "Общая теория относительности" посвящена изложению физических основ и математического аппарата эйнштейновской теории гравитации и специальным вопросам, связанными с нахождением точных решений уравнений гравитационного поля и методами изучения глобальной структуры многообразий. Рассматриваются уравнения Эйнштейна, приближение слабого гравитационного поля, стандартные космологические модели, сферически симметричное гравитационное поле и основные тесты общей теории относительности. Обсуждается структура сингулярностей и проблема начальных данных для уравнений гравитационного поля. Определяются асимптотически плоские пространства и изучаются свойства черных дыр. Рассматривается двух- компонентный спинорный формализм в плоском и искривленном пространствах. Последняя глава посвящена квантовым аспектам гравитации. Книга расчитана на студентов и аспирантов университетов и на физиков-теоретиков, специализирующихся в теории гравитации, общей теории относительности и космологии. ISBN 978-5-209-02964-9 ©R.M. Wald, 1984, 2008 ©И.Л. Бухбиндер, СВ. Червон. Перевод на русский язык, 2008 ©Российский университет дружбы народов, издательство, 2008
Оглавление Предисловие редакторов перевода 11 Предисловие автора 14 Обозначения и соглашения 17 I Основы общей теории относительности 19 1 Введение 21 1.1 Введение 21 1.2 Пространство и время в дорелятивистской физике и в специальной теории относительности 22 1.3 Метрика пространства-времени 26 1.4 Общая теория относительности 28 2 Многообразия и тензорные поля 33 2.1 Многообразия 33 2.2 Векторы 37 2.3 Тензоры. Метрический тензор 43 2.4 Абстрактные индексные обозначения 50 3 Кривизна 59 3.1 Операторы ковариантной производной и параллельный перенос 61 3.2 Кривизна 69 3.3 Геодезические 75 3.4 Методы вычисления кривизны 84 3.4.1 Координатный метод 84 3.4.2 Метод ортонормированного базиса (тетрады) ... 86 4 Уравнения Эйнштейна 95 4.1 Геометрия пространства в дорелятивистской физике. Общая и специальная ковариантность 95 4.2 Специальная теория относительности 101 4.3 Общая теория относительности 111 4.4 Теория гравитации в линейном приближении: ньютонов предел и гравитационное излучение 122 4.4.1 Ньютонов предел 125 4.4.2 Гравитационное излучение 128
8 Оглавление 5 Однородная изотропная космология 145 5.1 Однородность и изотропность 145 5.2 Динамика однородной изотропной Вселенной 152 5.3 Космологическое красное смещение. Горизонты 160 5.3.1 Красное смещение 160 5.3.2 Горизонт частиц 162 5.4 Эволюция нашей Вселенной 166 6 Решение Шварцшильда 181 6.1 Вывод решения Шварцшильда 182 6.2 Внутренние решения 190 6.3 Геодезические в пространстве-времени Шварцшильда . . 203 6.3.1 Гравитационное красное смещение 203 6.3.2 Прецессия перигелия 206 6.3.3 Отклонение лучей света 212 6.3.4 Времени 'ая задержка сигналов 216 6.4 Расширение Крускала 218 II Современные методы в общей теории относительности 233 7 Методы решения уравнений Эйнштейна 235 7.1 Стационарные аксиально-симметричные решения 236 7.2 Пространственно однородные космологические решения 244 7.3 Алгебраически специальные решения 258 7.4 Методы генерирования решений 260 7.5 Возмущения 263 8 Причинная структура 271 8.1 Будущее и прошлое: определения и результаты 272 8.2 Условия причинности 281 8.3 Области зависимости. Глобальная гиперболичность . . . 287 9 Сингулярности 303 9.1 Что является сингулярностью? 305 9.2 Конгруэнции времениподобных и нулевых геодезических 311 9.3 Сопряженные точки 320 9.4 Существование кривых максимальной длины 332 9.5 Теоремы о сингулярностях 337
Оглавление 9 10 Формулировка начальных данных 347 10.1 Начальные данные для частиц и полей 349 10.2 Формулировка начальных данных в общей теории относительности 360 11 Асимптотически плоские пространства 385 11.1 Конформная бесконечность 387 11.2 Энергия 408 12 Черные дыры 425 12.1 Черные дыры и гипотеза космической цензуры 426 12.2 Общие свойства черных дыр 439 12.3 Заряженные черные дыры Керра 445 12.4 Извлечение энергии из черных дыр 462 12.5 Черные дыры и термодинамика 469 13 Спиноры 481 13.1 Спиноры в пространстве-времени Минковского 484 13.2 Спиноры в искривленном пространстве-времени 508 14 Квантовые эффекты в сильных гравитационных полях 535 14.1 Квантовая гравитация 538 14.2 Квантованные поля в искривленном пространстве-времени 553 14.3 Рождение частиц вблизи черных дыр 569 14.4 Термодинамика черных дыр 592 Приложения 599 А Топологические пространства 601 В Дифференциальные формы. Интегрирование. Теорема Фробениуса 608 8.1 Дифференциальные формы 608 8.2 Интегрирование 610 8.3 Теорема Фробениуса 616 С Отображения многообразий. Производные Ли. Поля Киллинга 620 С.1 Отображения многообразий 620 С.2 Производные Ли 623 С.З Векторные поля Киллинга 626
10 Оглавление D Конформные преобразования 630 Б Лагранжева и гамильтонова формулировки уравнений Эйнштейна 636 ЕЛ Лагранжева формулировка 637 Е.2 Гамильтонова формулировка 647 F Единицы измерения и размерности 662 Литература 665 Предметный указатель 682
Предисловие редакторов перевода Вашему вниманию представляется книга Роберта М. Уолда "Общая теория относительности". Книга сочетает в себе современный вводный учебник для студентов-физиков старших курсов по теории гравитации (часть I) и монографию, рассчитанную на студентов, аспирантов и молодых ученых, специализирующихся в общей теории относительности и ее приложениях (часть II). Хотя книга вышла в свет достаточно давно, в 1984 году, ее содержание по-прежнему актуально. Книга пользуется заслуженной известностью, на физических факультетах многих университетов мира она является либо основным либо одним из основных учебников. Мы рады представить эту книгу Российскому читателю. В последние два десятилетия статус общей теории относительности как раздела теоретической физики коренным образом изменился. Развитие теории поля, суперсиметрии и теории струн показало, что приложения общей теории относительности выходят за рамки классической космологии и астрофизики. Проблемы происхождения и эволюции Вселенной, проблемы темной энергии и темного вещества оказались тесно связанными с физикой элементарных частиц. Черные дыры обсуждаются в контексте теории суперструн. По существу, формализм и физические представления общей теории относительности стали обязательными элементами теоретической физики высоких энергий. Это означает, что увеличивается как число ученых, использующих методы общей теории относительности в своей работе, так и число студентов физиков и математиков, изучающих общую теорию относительности. В связи с этим возникает необходимость в учебниках, написанных с современных позиций, рассчитанных на читателей с разным уровнем подготовки и разными интересами и позволяющих освоить основные методы общей теории относительности на том языке, который используется в текущей журнальной литературе. Как нам представляется, Данная книга может быть таким учебником. Имя автора книги хорошо знакомо специалистам в области теории гравитации. Профессор Чикагского университета Роберт М. Уолд внес значительный вклад в квантовую теорию поля в искривленном пространстве-времени, в термодинамику черных дыр, в изучение математической структуры общей теории относительности, а также в
12 Предисловие редакторов перевода применение общей теории относительности к космологии и астрофизике. Роберт М. Уолд получил докторскую степень по теоретической физике в 1972 году в Принстонском университете под руководством профессора Дж. Уиллера и с тех пор активно и плодотворно работает в области теории гравитации. Профессор Уолд является членом Американской Академии Наук и Искусств и Национальной Академией Наук США, в период с 2000 по 2004 годы являлся Президентом Международной ассоциации общей теории относительности и гравитации. Содержание книги хорошо представлено оглавлением, поэтому мы не будем обсуждать содержание подробно. Как мы уже отмечали, книга состоит из двух частей. В первой части представлен некий теоретический минимум по общей теории относительности. Дается краткое и четкое изложение математического аппарата общей теории относительности, причем с использованием базовых понятий дифференциальной геометрии многообразий, когда тензорные поля задаются не компонентами в некоторой системе координат, а трактуются как отображения. Рассматриваются уравнения Эйнштейна, приближение слабого гравитационного поля, стандартные космологические модели, сферически симметричное гравитационное поле и основные тесты общей теории относительности. Каждая глава снабжена оригинальными задачами. Вторая часть посвящена специальным вопросам, связанным с нахождением точных решений уравнений Эйнштейна, обладающими определенными симметриями и методами изучения глобальной структуры многообразий, отвечающих решениям уравнений Эйнштейна. Подробно обсуждается структура сингулярностей и проблема начальных данных для уравнений гравитационного поля. Определяются асимптотически плоские пространства и изучаются свойства черных дыр. Рассматривается двухкомпонентный спинорный формализм в плоском и искривленном пространствах. Последняя глава посвящена некоторым квантовым аспектам гравитации. В частности обсуждается непе- ренормируемость эйнштейновской квантовой гравитации. Формулируется квантовая теория свободных полей в искривленном пространстве- времени и на ее основе изучается эффект Хокинга квантового испарения черных дыр. Обсуждаются вопросы термодинамики черных дыр. К каждой главе во второй части книги, также как и в первой, дается большое количество оригинальных и достаточно сложных задач. Материал второй части может быть использован для чтения специальных курсов и для курсовых работ студентов, специализирующихся по теории гравитации. В приложениях рассматриваются более специальные
Предисловие редакторов перевода 13 математические вопросы, используемые в основном тексте, а также лагранжев и гамильтонов формализм общей теории относительности. В целом, книга Роберта М. Уолда "Общая теория относительности" представляется нам полезным и существенным добавлением к классическим руководствам по теории гравитации таким как Л.Д. Ландау, Б.М. Лифшиц, Теория поля; Ч. Мизнер, К. Торн, Дж. Уиллер, Гравитация; С. Вайнберг, Гравитация и космология. Мы надеемся, что книга вызовет интерес читателей. При переводе книги мы старались в максимальной степени сохранить авторский стиль изложения, не меняя сложившуюся в отечественной литературе физическую и математическую терминологию. Отдельный вопрос касается списка цитированной литературы. В настоящее время существует гигантская учебная, монографическая и журнальная литература по теории гравитации и ее приложениям, в том числе и на русском языке. Никакой сколь угодно полный список литературы здесь не возможен. Поскольку основное содержание книги носит учебный характер, касается хорошо установленных вопросов и внутренне замкнуто, мы сочли возможным не делать добавлений в авторский список литературы. Исключение составляет раздел 14.1 Квантовая гравитация, где материал несколько устарел. В этом случае сделаны небольшие комментарии и в минимальном количестве добавлена более современная литература. В приложении Е.2 мы также добавили некоторые ссылки на литературу по каноническому формализму в калибровочных теориях поля. Перевод книги сделан коллективом в составе В.Р. Гаврилова (гл. 13-14), Г.Н. Измайлова (гл. 4-5), С.С. Моливера (гл. 4-5, приложения), СВ. Сушкова (гл. 2-3), Н.Р. Хуснутдинова (гл. 7-12), СВ. Червона (гл. 1, б, предисловие). И.Л. Бухбиндер СВ. Червон
Предисловие автора В этой книге планируется дать полное введение в общую теорию относительности. Предполагается, что она послужит как учебником для студентов старших курсов, так и руководством для научных работников. Хотя эти две цели в некотором смысле противоречивы, но в их рамках часть I данной книги преследует первую цель. В ней рассматриваются вопросы, которые обычно включаются в вводные курсы по теории относительности: основы дифференциальной геометрии, уравнения Эйнштейна, гравитационное излучение, стандартная космологическая модель и решение Шварцшильда. В части II книги, которая содержит широкий выбор актуальных проблем, основной акцент сделан на второй цели. Однако даже здесь я старался объяснить все основные идеи на начальном уровне. Если бы я читал односеместровый вводный курс по общей теории относительности, то я изложил бы большую часть материала части I наряду с основным содержанием приложений В и С. Для полного годового курса я выбрал бы далее различные главы из части II, как основу материала для чтения во втором семестре. Например, главы 8 и 9, а также часть главы 12 могли бы составлять односеместровый курс по глобальным методам. Глава 7, дополненная текущей литературой, могла бы послужить основой курса по методам получения точных решений. Глава 10 и приложение Е, дополненные чтением специальной литературы, могли бы использоваться для курса по динамике в общей теории относительности. Глава 12 (дополненная сопутствующим материалом из глав 8, 9 и 11) и глава 14 могли бы составлять курс по классическим и квантовым свойствам черных дыр. Следует заметить, что главы второй части книги практически независимы друг от друга и, большей частью, могут читаться не в порядке следования при следующих основных исключениях: предшествующее изучение главы 8 существенно для понимания главы 9; изучение главы 8 наряду с основными вопросами глав 9 и 11 необходимо для изучения первых двух разделов главы 12. Один из наиболее трудных вопросов, который возникает при написании книги по общей теории относительности, это в каком разделе книги представить довольно солидный кусок необходимого математического материала. Большая часть этого материала (например,
Ар^ттяслови6 автора 15 ензорное исчисление и кривизна) требуется даже при формулировке общей теории относительности. Некоторый материал (например, производные Ли и поля Киллинга) может не рассматриваться первоначально, но вскоре становится необходимым, чтобы сделать обсуждение более ясным и упростить вычисления. В конечном счете, некоторый математический материал (например, многие теоремы о топологических пространствах) действительно не требуется до изучения части II книги. Если весь этот материал представить в начале книги, это составило бы значительное препятствие для изучения общей теории относительности. С другой стороны, если бы математические результаты вводились только "по мере необходимости" в поздних главах, математическая дискуссия стала бы в значительной степени разбитой на части, и эти части прерывали бы обсуждение физических результатов. Наилучшее решение этой проблемы, которое я мог найти, заключалось в том, чтобы поместить весь математический материал, необходимый для формулировки общей теории относительности, в главы 2 и 3, и затем включить оставшиеся математические вопросы в приложения А, В и С. Таким образом, читатель может приступать к изучению, начиная с главы 4, без лишних окольных путей, но обсуждение всех математических вопросов остается незатронутым, и можно обращаться к математическим понятиям по мере необходимости при работе с текстом. Поэтому следует подчеркнуть, что приложения А, В и С являются неотъемлемой частью этой книги. Результаты, выведенные в при- ложених В и С, используются во многих местах на протяжении всей книгиТа определения и результаты по топологическим пространствам, которые собраны в приложении А, часто упоминаются в главах 8 и 9. Еще одна необычная организационная особенность этой книги заключается в том, что лагранжева и гамильтонова формулировки общей теории относительности также вынесены в приложение. Часто гамильтонова формулировка представляется в связи с формулировкой начальных данных в общей теории относительности, но так как утверждения и доказательства результатов о них не зависят от гамильтоно- вой формулировки, я счел логически более ясным обсуждать вопрос 0 начальных данных независимо. Этот факт оставляет лагранжеву и гамильтонову формулировки как вопросы, которые не связаны с материалом других глав, причем этого материала слишком мало, чтобы составить целую главу на их собственной основе, но слишком важ- Ь1й, чтобы его пропустить. Поэтому эти вопросы рассматриваются в приложении Е. оадачи даются в конце каждой главы по соответствующей теме. Меется значительное разнообразие в трудности осмысления и вычис-
16 Предисловие автора ления, необходимого для решения задач, но совсем немного тривиальных "механических" упражнений, и нет таких, которые, по моему мнению, необычайно трудные (т.е. я думаю, что могу их решить). Часть моего замысла при подборе задач (особенно во второй части книги) заключалась в том, чтобы ввести важные побочные указания, для которых мне не хотелось делать крюк в тексте. Поэтому, если даже читатель определился, что он не будет делать никаких упражнений, может все-таки ему стоит прочесть условие задач. Я извлек пользу из многочисленных встреч и обсуждений со многими коллегами при планировании и написании этой книги. Влияние Роберта Героха должно быть очевидно читателям, знакомым с его точкой зрения на общую теорию относительности. Некоторые из аргументов, использованных в главе 3, заимствованы непосредственно из заметок по курсу, который мы преподавали совместно в 1975. В особенности я хочу поблагодарить тех коллег, кто нашел время и взял на себя труд прочитать частично (а в нескольких случаях - полностью) книгу и прислать мне свои пожелания по ее улучшению. Это Абхай Аштекар, Арвинд Борде, С.Чандрасекхар, Давид Гарфинкель, Джон Фридман, Роберт Герох, Джеймс Хартль, Джеймс Изенберг, Бернард Кэй, Карел Кучарж, Лианг Сан-бин, Роджер Пенроуз, Михаэль Тёнер и Уильям Унру. Дополнительная благодарность Давиду Гарфинкелю за проверку большей части уравнений. Я хочу поблагодарить Сьюзен Ланкастер и Рокси Боерсма за печатную работу по подготовке черновика рукописи и Фреда Флауэрса за печатание окончательного варианта рукописи для набора. С благодарностью принимается поддержка Национального научного фонда (NSR grant PHY 80 26043) Чикагского университета во время написания этой книги. В заключение я хочу поблагодарить свою супругу Веронику за изрядное терпение, проявленное в течение трех лет, которые потребовались мне, чтобы написать эту книгу.
Обозначения и соглашения В этой книге мы будем придерживаться определенного соглашения о знаках (Misner, Thome, Wheeler 1973). В частности, мы используем сигнатуру метрики -+++, определяем тензор Римана формулой (3.2.3), а тензор Риччи - (3.2.25). Однако мы сделаем одно существенное исключение из этих правил. Метрику -+++ мы выбрали потому, что она в целом гораздо удобнее альтернативного вырианта Н Чтобы облегчить чтение тем, кто неискушен в математических обозначениях, мы перечисляем ниже определения некоторых стандартных математических символов, часто используемых в тексте. U A U В обозначает объединение множеств А и В. П А П В обозначает пересечение множеств А и В, С А С В обозначает, что А является подмножеством В. — В — А обозначает дополнение множества А до множества В. € р € А обозначает, что р является элементом множества А. {|} {р € A\Q} обозначает множество, состоящее из тех элементов р множества Л, которые удовлетворяют условию Q. х прямое произведение, т.е. Ах В суть множество элементов {(а,6)|ае Ли еВ}. 0 пустое множество. R множество вещественных чисел. Кп множество комбинаций из п вещественных чисел. множество комплексных чисел. С Сп множество комбинаций из п комплексных чисел. :~~* f : A-+ В обозначает, что функция / является отображением из множества А в множество В. ° fog обозначает композицию отображений g : А —> В и / : В —► С, т.е. для р е А мы имеем (/ о g)p = f[g{p)]. и f[A] обозначает образ множества Л, создаваемый отображением /, т.е. множество {/(х)|ж £ А}.
18 Обозначения и соглашения Сп множество n-кратно непрерывно дифференцируемых функций. С°° множество бесконечно непрерывно дифференцируемых (т.е. гладких) функций. В дополнение, некоторые определенные в книге символы встречаются часто, но не всегда заново определяются каждый раз, когда используются. Поэтому для удобства читателя мы перечисляем такие символы ниже, указывая раздел книги, где дано соответствующее определение. S замыкание множества S (прилож. А). int(S) внутренняя часть множества 5 (прилож. А). S граница множества S (прилож. А). £v производная Ли, связанная с векторным полем va (прилож. С). Т множество гладких функций из многообразия М в множество R (разд. 2.2). Vp касательное пространство в точке р многообразия (разд. 2.2). V* пространство, дуальное к Vp (разд. 2.3). I+(S) хронологическое будущее множества S (разд. 8.1). J+(S) причинное будущее множества 5 (разд. 8.1). D+(S) будущая область причинности замкнутого ахронального множества S (разд. 8.3). #+(S) будущий горизонт Коши замкнутого ахронального множества (разд. 8.3). У+ будущая нулевая бесконечность (разд. 11.1). г° пространственная бесконечность (разд. 11.1). Символы /"(5),J~(S),D~(S),H~(S) и </~ определены аналогично тем, что выше, с заменой слова "будущее" на "прошлое". D(S) обозначает D+(S) П D'(S), a H(S) обозначает H+(S) П H'(S). Наконец, круглые и квадратные скобки вокруг индексов обозначают симметризацию и антисимметризацию соответственно, как определено формулами (2.4.3) и (2.4.4).
Часть I Основы общей теории относительности
Глава 1 Введение 1.1 Введение Общую теорию относительности - теорию пространства, времени и гравитации - Эйнштейн сформулировал в 1915 году. Ее часто считают очень серьезной и трудной для понимания теорией. Отчасти это связано с тем, что новая точка зрения на пространство и время, выдвинутая в общей теории относительности, требует для своего понимания определенных усилий, поскольку противоречит глубоко укоренившимся интуитивным представлениям. И в некоторой степени потому, что математический аппарат (а именно дифференциальная геометрия), необходимый для четкой формулировки идей и обоснования уравнений общей теории относительности, был непривычен для большинства физиков. Хотя общей теории относительности повсеместно придали статус великолепной теории, многие физики не признавали ее потенциальных возможностей, и, видимо, по этой причине предмет общей теории относительности почти не разрабатывался на протяжении значительного периода ее истории. Серьезный интерес к общей теории относительности возродился в конце 1950-х, особенно благодаря деятельности Принстонской группы под руководством Джона Уиллера и Лондонской групы под руководством Германа Бонди. Хотя довольно трудно установить причины, по которым то или иное направление в физике получает развитие, два обстоятельства, связывающие общую теорию относительности с другими областями физики и астрономии, внесли значительный вклад в незатухающий интерес к общей теории относительности, который возник в то время. Первое обстоятельство - это астрономическое открытие высоко энергетических компактных объектов, в частности, квазаров и компактных гамма-источников. Вполне вероятно, что гравитационный коллапс и/или сильные гравитационные поля играют здесь важную Р°ль, а если так, то общая теория относительности будет необходима, чтобы понять структуру этих объектов. Современная теория гравитационного коллапса, сингулярностей и черных дыр была разработана в Редине 1960-х, в значительной степени благодаря этому стимулу.
22 Глава 1. Введение Вторым фактором, способствующим возобновлению интереса к общей теории относительности, является понимание того факта, что хотя гравитация может быть слишком слабой, чтобы играть важную роль в лабораторных экспериментах, тем не менее представляется очень важной разработка квантовой теории гравитации для нашего дальнейшего понимания законов природы. Чтобы приблизиться к этой цели, может потребоваться более глубокое понимание некоторых аспектов классической теории гравитации - общей теории относительности. Интерес к этой программе значительно усилило предсказание квантового рождения частиц в гравитационном поле черной дыры, а также прогресс в изучении калибровочных теорий и их роли в физике элементарных частиц. Однако, даже если отвлечься от потенциального значения общей теории относительности для астрономии и других областей физики, эта теория сама по себе высказывает много поразительных утверждений, касающихся структуры пространства и времени, а также природы гравитационного поля. Каждый изучающий общую теорию относительности не может не почувствовать, что приобретает глубокое понимание того, как устроена природа. Цель этой книги - представить основы общей теории относительности. Мы будем использовать более современную геометрическую точку зрения, чем та, которой пользовался Эйнштейн. И мы, конечно, будем обсуждать последние достижения и результаты, но основное содержание теории таково, каким его представил Эйнштейн более полувека тому назад1. Эту главу мы начнем с обсуждения структуры пространства и времени, а также основных идей теории относительности с интуитивной, физической точки зрения. Более полное обсуждение дано Герохом (Geroch 1978a) и Уолдом (Wald 1977a). Последующее изложение материала в этой книге будет посвящено тому, чтобы придать основным идеям теории относительности математическую точность, а также проанализировать их следствия. 1.2 Пространство и время в дорелятивистской физике и в специальной теории относительности Возможно, наиболее сильное препятствие в постижении специальной и общей теории относительности возникает из-за трудности по- 1 Книга P.M. Уолда была издана в 1984 году.- Прим. ред.
1.2. Пространство и время в дорелятивистской физике 23 нимания того, что некоторые установленные ранее основные предположения о природе пространства и времени просто неверны. Поэтому мы начинаем с разъяснения нескольких ключевых предположений о пространстве и времени. Как с прошлой, так и с современной точки зрения, пространство и время имеют по крайней мере следующую обшую структуру. Мы можем считать, что пространство и время (пространство-время) являются континуумом, состоящим из событий, причем все события могут рассматриваться как точки пространства в некоторый момент времени. Более того, все события (или, по крайней мере, все события в достаточно малой окрестности данного события) могут единственным образом характеризоваться четырьмя числами: на обычном языке это три числа, описывающие положение в пространстве, и одно, описывающее время. Как будет обсуждаться в гл. 2, математически точной формулировкой этих идей является утверждение, что пространство-время представляет собой четырехмерное многообразие. Однако в теориях, предшествующих теории относительности, считалось, что пространство-время имеет следующую дополнительную структуру: для данного события р в пространстве-времени имеется естественное, не зависящие от наблюдателя понятие событий, которые происходят "в то же самое время", что и р. Более точно, для данных двух событий р и q должно выполняться одно из следующих трех взаимно исключающих положений: (1) Для некоторого наблюдателя или материального тела возможно, в принципе, перейти от события q к событию р; в этом случае говорят, что q находится в прошлом по отношению к р. (2) Возможно перейти от р к q, в этом случае говорят, что q находится в будущем по отношению к р. (3) Для некоторого наблюдателя или материального тела невозможно, в принципе, находиться как в событии д, так и в событии р. В дорелятивистской физике предполагается, что события третьей категории формируют трехмерное множество и определяют понятие одновременности с событием р, как показано на рис. 1.1. Как оказалось, убеждение, что причинная структура пространства- семени имеет характер, показанный на рис. 1.1, является ошибочным. в специальной теории относительности вышеуказанная классификация отношений причинности между событиями все еще остается. Ре- шающее отличие заключается в том, что события категории (3) фор- иРуют более чем трехмерный набор; соотношение причинности меж- *v событием р и другими событиями представлено в общих чертах на РИс- 1.2. События категории (3) далее могут подразделяться следую- м °бразом: (i) События, которые принадлежат границе множества
24 Глава 1. Введение время jr пространство Будущее Одновременные /^события Прошлое Рис. 1.1. Диаграмма показывает причинную структуру пространства-времени в дорелятивистской физике. Для заданного события р все остальные события в пространстве-времени являются либо будущим по отношению к р, либо прошлым р, либо одновременным с р событиями. Одновременные события формируют трехмерную поверхность в пространстве-времени точек будущего р. Эти события не могут быть достигнуты ни какой частицей с ненулевой массой, начинающей движение в р, но могут достигаться световыми сигналами, испущенными из р. Они формируют "световой конус будущего" р (трехмерное множество), (ii) События на световом конусе прошлого для р, который определяется аналогично предыдущему случаю. (Ш) События категории (3), которые не принадлежат ни световому конусу прошлого, ни световому конусу будущего. Говорят, что эти события являются пространственноподобными по отношению к р и составляют некоторое четырехмерное множество. Ключевой факт, прямо относящийся к вышеизложенному, заключается в том, что в специальной теории относительности не существует понятия абсолютной одновременности; не существует абсолютных трехмерных поверхностей в пространстве-времени, как те, что показаны на рис. 1.1. Как мы увидим далее, наблюдатель все еще может определить понятие, для которого события происходят "в одно и то же время", что и данное событие, определяя таким образом трехмерную поверхность в пространстве-времени. Однако полученное им понятие зависит от способа его движения. (С другой стороны, световые конусы на рис. 1.2 являются абсолютными поверхностями.) Представление о наличии абсолютной одновременности является глубоко укоренившимся понятием. Тот факт, что понятия абсолютной одновременности не существует, является одним из наиболее трудных моментов в процессе привыкания к специальной теории относительности. В специальной теории относительности (как и в дорелятивистской физике) имеется понятие инерциального, "неускоренного", движения,
1.2. Пространство и время в дорелятивистской физике 25 Будущее Пространственно-, подобные области рис. 1.2. Диаграмма показывает причинную структуру пространства-времени в специальной теории относительности. Теперь "световой конус" р, а не "поверхность одновременности" с р играет главную роль в определении причинных отношений р с другими событиями а именно, движения материального тела, которое осуществляется, если на тело не действуют внешние силы. Всякий инерциальный наблюдатель может помечать события в пространстве-времени следующим образом. Он может сам построить жесткий каркас объемной решетки и пометить узловые точки решетки каркаса декартовыми координатами х, г/, z согласно геометрии каркаса (по предположению - евклидовой). Затем, он может иметь в своем распоряжении часы, помещенные в каждый узел решетки, и может синхронизовать каждые часы со своими часами некоторым симметрическим методом, т.е. путем проверки того, что данные часы и его часы дают одинаковые показания, когда они получают сигнал, испущенный симметричным образом наблюдателем, расположенным посредине между данными двумя часами. (Так как причинная структура пространства-времени такова, как показано на рис. 1.2, а не на рис. 1.1, синхронизация не является простым действием.) Наблюдатель может переносить решетку вместе с синхронизированными часами невращающимся способом. Теперь каждое событие в пространстве-времени может помечаться координатами узла решетки (я, у, г), в котором происходит событие при считывании времени * синхронизированных часов этого узла. Метки £, ж, у, z, соотнесенные с событиями таким способом, называют глобальными инерциальными координатами. Если два таких инерциальных наблюдателя выполнили вышеизложенную процедуру, то можно сравнить координатные метки, которые 0ни приписали событиям. В дорелятивистской физике (где такая процедура нанесения меток осуществима с той лишь разницей, что син- Ронизация часов является тривиальной) при условии, что наблюдать О помечает событие р координатами t, x, у, z, а наблюдатель О' „Световой конус будущего Световой конус прошлого
26 Глава 1. Введение X о. ч* * * ф Поверхность / # * V. одновременности •ф * * события & Поверхность одновременности события О Рис. 1.3. Пространственно-временная диаграмма иллюстрирует тот факт, что в специальной теории относительности определение одновременности с событием р различно для инерциальных наблюдателей О и О' движется в х-направлении со скоростью v, проходя мимо наблюдателя О в момент, соответствующий меткам t = x = y = z = Q, координатные метки, которые наблюдатель О' соотносит с событием р, таковы t' = t, (1.2.1) х' = х - vt, (1.2.2) У' = У, (1.2.3) z' = z. (1.2.4) Однако в специальной теории относительности координатные метки О' будут соотноситься с метками О при помощи преобразований Лоренца tf = (t - vx/c2)/(l - у2/с2)1*2, (1.2.5) х' = {х - vt)/{\ - v2/c2)1!2, (1.2.6) У' = У, (1.2.7) z' = г, (1.2.8) где с - скорость света. Уравнение (1.2.5) показывает, что понятие одновременности, определяемое наблюдателем О (именно, £=const), отличается от того, которое определяется О' (£'=const), как показано на рис. 1.3. 1.3 Метрика пространства-времени В предыдущем разделе мы описали, как инерциальный наблюдатель О может помечать события в пространстве-времени глобальными инерциальными координатами £, х, у, z. Однако фундаментальный
Метрика пространства-времени 27 инцип специальной теории относительности заключается в том, что существует привилегированных инерциальных наблюдателей. Как видели выше, другой инерциальный наблюдатель, используя идейную процедуру, определяет другие метки t',x\y',z' к событиям в оостранстве-времени. Таким образом, координатные метки сами по gge не имеют внутреннего значения, так как они зависят больше от того какой наблюдатель делает запись меток, чем от свойств самого поостранства-времени. Наиболее интересным представляется определить, какие величины имеют абсолютный смысл, независимый от наблюдателя, т.е. истинным образом характеризуют внутреннюю структуру пространства-времени. Это эквивалентно определению того, какие функции глобальных инерциальных координат являются независимыми от выбора инерциальной системы. В дорелятивистской физике ответ следующий. Временной интервал Д£ между двумя событиями имеет абсолютное значение; все наблюдатели получат одинаковое значение At. Более того, пространственный интервал |Дх| между двумя одновременными событиями не зависит от наблюдателя. Однако вышеуказанные величины (или функции от них) являются единственными, имеющими абсолютный смысл. Например, каждый из наблюдателей, движущихся с ненулевой относительной скоростью, получит различные значения для пространственного интервала между неодновременными событиями. В специальной теории относительности ни временной интервал, ни пространственный интервал между "относительно одновременными" событиями (т.е. событиями, определяемыми как одновременные отдельным наблюдателем) не имеют абсолютного смысла. Величина, которая не зависит от наблюдателя, представляет собой пространственно-временной интервал /, определенный выражением I = -{At)2 + i [(Да;)2 + (Ay)2 + (Az)2]. (1.3.1) Действительно, преобразования Пуанкаре (множество всех возможных преобразований между глобальными инерциальными координатами) состоят в точности из линейных преобразований, которые оставля- Ют I неизменным. Пространственно-временной интервал / и функции ^ I являются единственными величинами, не зависящими от наблюдателя и характеризующими пространственно-временные отношения между событиями. Что действительно замечательно в выражении для /, так это то, То оно является квадратичным по разностям координат, в точно- Ти как функция расстояния в евклидовой (т.е. плоской, положитель- 0 °пределенной) геометрии. Действительно, единственное отличие -
28 Глава 1. Введение знак минус перед (At)2 - позволяет быть / нулевым или отрицательным. Мы будем говорить об / как о метрике пространства-времени по аналогии с обычной евклидовой метрикой. (Более точно, метрика пространства-времени в специальной теории относительности будет определена позже таким образом, что она является тензорным полем, связанным с формулой для пространственно-временного интервала между двумя "бесконечно близкими" событиями; см. ниже уравнение (4.2.2).) Как мы увидим в гл. 3, это отличие в сигнатуре метрики создает очень малое различие при математическом исследовании метрики. В частности, определение геодезических линий ("наиболее возможных прямых линий") и кривизны проводятся для метрик с сигнатурой I точно так же, как и для обычных положительно определенных метрик. Интересно отметить, что, как обсуждается более полно в гл. 4, траектории в пространстве-времени инерциаль- ных наблюдателей в специальной теории относительности являются геодезическими для пространственно-временной метрики, а кривизна, связанная с /, равна нулю, то есть геометрия пространства-времени в специальной теории относительности является плоской. 1.4 Общая теория относительности Предшествовавшие специальной теории относительности дореля- тивистские понятия пространства и времени наполняли, наряду с другими идеями, формулировку законов физики. Когда эти понятия были отброшены, оставалась задача модификации и переформулировки физических законов, чтобы они были согласованы с пространственно- временной структурой, задаваемой специальной теорией относительности. Теория электромагнетизма Максвелла была уже согласована со специальной теорией относительности. И действительно, ее несовместимость с дорелятивистскими понятиями о структуре пространства- времени без введения привилегированных инерциальных систем отсчета, привела непосредственно к открытию специальной теории относительности. Ньютоновская теория тяготения не согласуется со специальной теорией относительности, так как в ней используется понятие мгновенного воздействия одного тела на другое. Однако можно было бы попытаться несколько модифицировать ньютоновскую теорию тяготения, чтобы она находилась в рамках специальной теории относительности. Несмотря на это, две ключевые идеи, положенные Эйнштейном в основу новой теории гравитации, не следовали по этому пути, и, скорее, происходили поиски совершенно новой теории пространства-
1 4. Общая теория относительности 29 времени и гравитации, теории, которая во всех отношениях перевер- нула наши представления о пространстве и времени настолько, насколько специальная теория относительности сделала это ранее. Первая идея заключается в том, что все тела подвержены действию гравитации, и действительно, все тела падают в точности одинаковым образом в гравитационном поле. Этот факт, известный как принцип эквивалентности, выражается в ньютоновской теории тяготения как утверждение о том, что гравитационные силы, действующие на тело, пропорциональны их инертным массам. Поскольку движение является независимым от природы тел, траектории свободно падающих тел определяют привилегированное множество кривых в пространстве-времени точно так же, как в специальной теории относительности траектории в пространстве-времени инерциальных (свободных) тел определяют привилегированное множество кривых, независимых от природы этих тел. Это предполагает возможность приписать свойства гравитационного поля самой структуре пространства- времени. Как уже упоминалось в предыдущем разделе, траекториями инерциальных тел в специальной теории относительности являются геодезические пространственно-временной метрики. Тогда, возможно, траектории свободно падающих тел всегда являются геодезическими, но метрика пространства-времени не всегда такая, которая задана в специальной теории относительности. Тогда то, что мы подразумеваем под гравитационным полем, могло бы быть вообще не новым полем, а, скорее, соответствовало бы отклонению геометрии пространства- времени от плоской геометрии специальной теории относительности. В дальнейшем мы обсудим эти идеи в гл. 4. Вторая идея, мотивировавшая формулировку общей теории относительности, основывалась на не очень строгих соображениях, называемых принципом Маха. В специальной теории относительности, как и в дорелятивистских представлениях о пространстве-времени, структура пространства-времени задается раз и навсегда и не подвергается влиянию материальных тел, которые могут в нем присутствовать. В частности, "инерциальное" и "невращательное" движения не подвержены воздействию материи во Вселенной. Мах, как и ряд ранних Философов и их последователей (в частности, Риман), сочли эту идею Удовлетворительной. Вернее, Мах чувствовал, что все вещество во селенной должно давать вклад в локальное определение "неускорен- °сти" и "невращательности"; что во Вселенной, свободной от мате- и> эти концепции не должны иметь смысла. Эйнштейн принял эти ^еи и Решительно вознамерился искать теорию, где, в отличие от спе- Ьн°й теории относительности, структура пространства-времени Двергается воздействию присутствующей материи.
30 Глава 1. Введение Новая теория пространства, времени и гравитации - общая теория относительности, предложенная Эйнштейном, - констатирует следующее: внутренние, независящие от наблюдателя свойства пространства- времени, описываются метрикой аналогично специальной теории относительности. Однако пространственно-временная метрика не обязана иметь ту (плоскую) форму, какую она имеет в специальной теории относительности. Действительно, кривизна, т.е. отклонение метрики пространства-времени от плоской, отвечает за физические эффекты, приписываемые обычно гравитационному полю. Более того, кривизна пространства-времени связана с тензором энергии-импульса материи в пространстве-времени посредством уравнения, постулированного Эйнштейном. Таким образом, в соответствии с некоторыми (но не всеми!) идеями Маха, структура пространства-времени (воплощенная в пространственно-временной метрике) связана с материей, заполняющей пространство-время. До настоящего времени, как установлено, предсказания общей теории относительности находятся в превосходном согласии с экспериментами и наблюдениями (см. ниже разд. 6.3 и (Will 1981)). Основная часть этой книги посвящена изучению следствий этой теории. Однако наша первая задача - дать точное математическое выражение идеям, которые мы обсудили в этой главе. Прежде всего мы должны дать точную формулировку представления о том, что пространство-время является четырехмерным континуумом. Это понятие, вместе с определением многообразия, дано в разд. 2.1. Далее мы должны ввести основные математические понятия, необходимые для обсуждения искривленной геометрии: векторы и тензоры (2.2), метрика (2.3), операторы дифференцирования (3.1), кривизна (3.2) и геодезические (3.3). На протяжении почти всей дискуссии мы будем применять представленный математический аппарат как к дифференциальной геометрии обычных поверхностей (с положительно определенной метрикой), так в равной мере и к геометрии пространства-времени (с метрикой лоренцевой сигнатуры). После освоения этих математических методов и техники вычислений, мы будем готовы начать наше изучение общей теории относительности в гл. 4. Задача (Парадокс машины и гаража). Отсутствие понятия абсолютной одновременности в специальной теории относительности приводит ко многим мнимым парадоксам. Один из наиболее известных таких па-
л 4. Общая теория относительности 31 адоксов касается машины и гаража равной собственной длины. Водитель въезжает в гараж, а дежурный по гаражу проинструктирован захлопнуть дверь, как только задний бампер машины войдет в гараж. До мнению дежурного, "машина претерпевает лоренцево сокращение и легко войдет в гараж, когда я захлопну дверь". По мнению водителя "гараж претерпевает лоренцево сокращение и будет слишком мал ддя машины, когда я въеду в гараж". Нарисуйте пространственно- временную диаграмму, отражающую вышеуказанные события, и объясните, что случилось в действительности. Является ли верным утверждение дежурного? Является ли верным утверждение водителя? Предположите для определенности, что машина пробивает дальнюю стену гаража без остановки или замедления.
Глава 2 Многообразия и тензорные поля В этой главе мы закладываем основы точной математической формулировки общей теории относительности, получая некоторые основные свойства многообразий и тензорных полей. Как будет определено в разд. 2.1, n-мерное многообразие представляет собой множество, которое имеет локальную дифференциальную структуру пространства Rn, но не обязательно обладает его глобальными свойствами. В разд. 2.2 мы определяем касательные векторы, как операторы производных по направлению, действующие на функции, заданные на многообразии. Здесь же мы получаем некоторые важные свойства координатных базисов касательного пространства и касательных к кривым. В разд. 2.3 вводятся тензоры и определяется концепция метрики. Наконец, в разд. 2.4 мы вводим абстрактные индексные обозначения для тензоров, которые далее будут использованы в книге. В этой главе мы употребляем целый ряд стандартных математических символов, и читатель, незнакомый с этими обозначениями, должен обращаться к разделу "Обозначения и соглашения" в начале книги. 2.1 Многообразия Как отмечалось в предыдущей главе, наш жизненный опыт говорит нам, что пространство-время представляет собой "четырехмерный континуум" в том смысле, что для характеристики любого события в нем требуется четыре числовых величины. В дорелятивист- ской физике, как и в специальной теории относительности, предполагается, что это утверждение верно глобально, т.е. что все события в пространстве-времени могут быть поставлены во взаимно однозначное непрерывное соответствие с точками R4. Однако в общей теории °тносительности мы будем находить геометрию пространства-времени Из Решения уравнений, поэтому мы не хотим заранее и необоснованно опираться на какие-либо воззрения на природу глобальной структуры Ространства-времени. Наша ситуация очень похожа на ту, в которую 0гли бы попасть гипотетические исследователи поверхности Земли эдолго до открытий Колумба и Магеллана. Такие исследователи мог- бы заметить, что в небольшой окрестности вблизи них положение поверхности Земли характеризуется с помощью двух чисел. Однако
34 Глава 2. Многообразия и тензорные поля они допустили бы серьезную ошибку, если бы экстраполировали этот результат к выводу, что все точки на поверхности Земли могут быть поставлены во взаимно однозначное соответствие точкам R2 непрерывным образом. Таким образом, что нам требуется как математический базис для начала исследования пространственно-временной структуры (так же, как и поверхности Земли), так это точное понятие многообразия, т.е. множества, в котором окрестность каждой точки "подобна" Rn, но которое может иметь вполне отличные от Rn глобальные свойства. В примере с Землей наши гипотетические исследователи могли бы осознать, что поверхность, которую они исследуют, "живет" в пространстве высшей размерности: в евклидовом пространстве R3 всех пространственных точек (по крайней мере, в согласии с дорелятивист- скими понятиями пространства и времени). Поэтому изучение двумерных поверхностей, вложенных в R3, обеспечивало бы нас подходящей математической основой для анализа структуры земной поверхности, и абстрактное определение многообразия было бы излишним. Однако в общей теории относительности пространство-время само по себе естественным образом не живет (насколько это известно) в каком-либо евклидовом пространстве высшей размерности, поэтому абстрактного определения не избежать. В действительности же такое определение оказывается очень полезным, даже для изучения обычных поверхностей в R3. Прежде чем определить концепцию многообразия, напомним читателю, что открытый шар в Rn, радиуса г с центром в точке у = = (у1, • • •»Уп) состоит из точек х таких, что \х - у\ < г, где г п I 1/2 \*-у\= Е^-Л2 • U=i J Открытое множество в Rn - это любое множество, которое может быть представлено как объединение открытых шаров. Понятие открытого множества превращает Rn в топологическое пространство в том смысле, как это обсуждается в прилож. А. По существу, многообразие - это множество, собранное из частей, которые "подобны" открытым подмножествам Rn при условии, что эти части могут быть гладко "сшиты" друг с другом. Более точно, n-мерное, класса С°°, вещественное многообразие М - это множество, снабженное набором подмножеств {Оа}, удовлетворяющих следующим свойствам: (1) Каждая точка р е М лежит по-крайней мере в одном 0Q, т.е. {Оа) покрывает М.
2.1. Многообразия 35 рис. 2.1. Иллюстрация отображения фрофа1, возникающего при пересечении двух координатных систем (2) Для каждого а существует взаимно однозначное отображение Оа на Ua, то есть фа : Оа —*• £/Q, где C/Q - открытое подмножество Rn. (3) Если любые два множества Оа и Ор пересекаются, ОаГ\Ор ф$ (где 0 обозначает пустое множество), то мы можем рассматривать отображение фроф~1 (где о обозначает композицию), которое преобразует точки из ipa[0QnOp] С Ua С Rn в точки из фр[ОаГ\Ор] cUpCW1 (см. рис. 2.1). Мы требуем, чтобы эти подмножества Rn были открытыми, а отображения принадлежали классу С°°, т.е. были бесконечно непрерывно дифференцируемы. (Поскольку здесь мы имеем дело с отображениями из Rn в Rn, то мы можем использовать понятие класса функций С°° из математического анализа.) Каждое отображение фа математики обычно называют картой, а физики - системой координат. Мы будем использовать оба этих термина на равных основаниях. Чтобы избежать появления новых многообразий вследствие простого удаления или добавления системы координат, удобно также потребовать в определении М, чтобы накрытие \Oq} и семейство карт {фа} были максимальны, т.е. чтобы в определении говорилось обо всех координатных системах, удовлетворяющих Условиям (2) и (3). Определение аналитического многообразия класса ^ совпадает с данным выше с соответствующим изменением в усло- Вии (3). Наконец, чтобы определить комплексное многообразие, необ- ХоДимо в условиях (2) и (3) просто заменить Rn на Сп. Мы можем определить топологию на многообразии М, требуя, что- 1 все отображения фа в нашем максимальном наборе были гомео- МоРфизмами (см. определения в прилож. А). Действительно, кажется
36 Глава 2. Многообразия и тензорные поля более естественным продолжать введение топологии на многообразии, определяя многообразие как топологическое пространство, удовлетворяющее вышеприведенным свойствам, причем каждое фа считать гомеоморфизмом. (Мы не сделали так просто, чтобы избежать включения в основной текст книги математический формализм топологических пространств.) Апеллируя к топологическим пространствам, мы будем рассматривать в книге только те многообразия, которые являются хаусдорфовыми и паракомпактнымщ смысл этих терминов разъясняется в прилож. А. Евклидово пространство Rn представляет собой тривиальный пример многообразия, которое может быть накрыто одной картой, например, О = Rn и ф - тождественное отображение. Более интересным примером многообразия является 2-сфера 52 S2 = {(я1,*2,*3) € R3| (х1)2 + (х2)2 + (х3)2 = l} . Всю 2-сферу 52 нельзя непрерывно и взаимно однозначно отобразить в R2, однако таким образом можно отобразить отдельные "куски" 52, которые затем можно "гладко сшить" друг с другом. Например, если мы определим шесть полусферических открытых множеств О*, г = = 1,2,3 следующим образом: Ol± = {(x1,x2,x3)€52|±xi>0}, то оказывается, что {Of} покрывает 52. Более того, каждое множество Of может быть гомеоморфно отображено в открытый диск D = {(х,у) £ К2|ж2 + у2 < 1} на плоскости с помощью отображений проекции /{*" : Of —► D, /f : Of —> D и т.д., определенных как fi{xl,x2,xz) = (rr2,x3) и т.д. Можно проверить, что функции перекрытия ffoifj1)"1 принадлежат классу С°° в их области определения (задача 1). Таким образом, S2 - двумерное многообразие. Аналогично можно показать, что n-мерная сфера Sn также является многообразием. Имея два многообразия М и М' размерности п и п' соответственно, мы можем превратить прямое произведение пространств М х М', состоящее из всех пар (р,р')> гДе Р € М и р' £ М', в (п+п')-мерное многообразие следующим образом: если фа : Оа —► Ua и ф'р : О'р —► Up - карты, то мы определим карту фар : Оар —► UapcRn+n' на М х М', выбирая Оа/з = Оа х Op, Uap = Ua x Up и полагая фар(р,р') = = yl>a{p)i$'p{jf) • Легко проверить, что семейство карт {фа/з} удовлетворяет свойствам, которые требуются для определения структуры многообразия на М х М'. Большинство многообразий, которые мы
р 2.Векторы 37 будем рассматривать в книге, можно представить прямым произведением евклидова пространства Rn и сферы Sm. Структура, заданная системами координат на многообразиях, позволяет нам определить понятия дифференцируемости и гладкости отображений многообразий друг на друга. Пусть М и М' - многообразия, а Фа я Фв ~ соответствующие семейства карт. Говорят, что / : М —> М' есть отображение класса С°°, если для каждых а и /? отображение ф'до/оф"1, которое переводит UQ С Rn в Up С Rn , есть отображение класса С°° в том смысле, как это определено в математическом анализе. Если / : М —► М' есть взаимно однозначное отображение класса С°°, имеющее обратное отображение класса С°°, то / называется диффеоморфизмом, и говорят, что МиМ' диффеоморфны. Диффеоморф- ные многообразия имеют идентичную структуру. 2.2 Векторы Без сомнения, концепция векторного пространства знакома большинству читателей. В дорелятивистской физике предполагалось, что пространство имеет структуру трехмерного векторного пространства, и правила сложения и скалярного произведения пространственных смещений удовлетворяют аксиомам векторного пространства1. В специальной теории относительности пространство-время также имеет естественную структуру четырехмерного векторного пространства. Однако при рассмотрении геометрии искривленного пространства (как в общей теории относительности) структура векторного пространства теряется. Например, не существует естественного способа определить сумму "кривых векторов", т.е. способа прибавить к одной точке на сфере другую так, чтобы в результате была указана третья точка на сфере. Тем не менее, структура векторного пространства может быть вновь обнаружена в пределе "бесконечно малых смещений" в окрестности точки. Именно понятие "бесконечно малых смещений" или касательных векторов лежит в основании исчисления на многообразиях. Поэтому ниже мы уделим большое внимание тому, чтобы дать точное Математическое определение этой концепции. Для многообразий, подобных сфере, которые возникают естествен- Ь1М образом как поверхности, вложенные в Rn, интуитивное понятие Нательного вектора в точке р таково: это вектор, лежащий в каса- ^ьной плоскости, как показано на рис. 2.2. Для вложенных в Rn ic7~ с м-> например, (Royden 1963), где приводится список аксиом векторного про- Фанства.
38 Глава 2. Многообразия и тензорные поля многообразий эта идея может быть реализована математически точно. Однако во многих случаях, и важнейший из них - это общая теория относительности - многообразие задано без вложения в Rn. Таким образом, важно (и в перспективе очень полезно) дать определение касательного вектора, не используя его возможное вложение в Rn, а опираясь лишь на внутреннюю структуру многообразия. Рис. 2.2. Касательная плоскость к сфере в точке р в R3 Такое определение обеспечивается представлением касательного вектора как производной по направлению. В Rn существует взаимно однозначное соответствие между векторами и производными по направлению. Вектор v = (v1,...,*/1) определяет оператор производной по направлению ^ v^(d/dx^), и наоборот. Действие производных по направлению на функции определяется свойством линейности и "правилом Лейбница". Рассмотрим многообразие М. Пусть Т обозначает множество С°° функций, действующих из М в R. Определим касательный вектор v в точке р € М как отображение v : Т —► R, которое (1) линейно и (2) подчиняется правилу Лейбница: (1) v(af + Ьд) = av(f) + bv(g), V/, ^f;a,6eR; (2) v(fg) = f(p)v(g)+g(p)v(f). Отметим, что из условий (1) и (2) следует, что, если h £ ^-постоянная функция, т.е. h(q) = с для всех q £ М, то v(h) = 0, поскольку из (2) мы получаем v(h2) = 2cv(ft), в то время как из (1) мы получаем v(h2) = v(ch) = cv(h). Хотя на первый взгляд это может показаться неочевидным, данное определение несомненно точное и придает концепции "бесконечно малого смещения" внутренний смысл на многообразии. Во-первых, легко увидеть, что множество Vp касательных векторов в точке р имеет структуру векторного пространства с законом сложения (v\ +г>2)(/) = = vi(f) + v2{f) и с законом скалярного произведения (av)(f) = av(f)- Второе существенное свойство Vp дается следующей теоремой.
2 2. Векторы 39 Теорема 2.2.1. Пусть М - n-мерное многообразие, р € М, a Vp обозначает касательное пространство в точке р. Тогда dim Vp = п. Доказательство. Мы покажем, что dim Vp = п, конструируя базис Vp, т.е. определяя п линейно независимых касательных векторов, заметающих Vp. Пусть ф : О —> U С Rn - локальная система координат с р £ О (см. рис. 2.3). Если / € Т, то по определению, / о ф~г : U —> R принадлежит классу С°°. Для /х = 1,..., п определим Х^ : Т —► R как V/)=i(/o*-1) (2.2.1) V>(p) где (х1,..., жп) - декартовы координаты в Rn. Тогда Jfi,..., Хп - касательные векторы, которые, как легко заметить, линейно независимы. Для того чтобы показать, что они заметают Vp, мы используем следующий результат из математического анализа (см. задачу 2): Если F : Rn —* R принадлежит классу С°°, то для каждой точки а = (о1,... ,an) Е Rn существуют функции класса С°° Ям такие, что для всех xGln имеем п F(a?) = F(a) + £(*" - a")#M(s). (2.2.2) /x=l Более того, получаем, что 8F я» = а? (2.2.3) Используем этот результат, полагая, что F = /оф 1 иа = ф(р). Тогда Для всех q еО получаем п /(<?) = № + £ & о tffo) - х" о ^(р)] Я„М*)). (2.2.4) Пусть v G VJ,. Покажем, что v является линейной комбинацией векто- Р°в -X"i» •.., Хп. Для этого подействуем v на /, принимая во внимание ^2-2.4), используя правило Лейбница и свойство линейности для v и Учитывая тот факт, что действие v на константу (такую, как f(p)) Дзет нуль. В результате получим п v(f) = v[f(p)] + Y{[xftoi>(q)-x»o4,(p)]\ у{Н,1оф) +
40 Глава 2. Многообразия и тензорные поля Рис. 2.3. Диаграмма, иллюстрирующая определение производных по направлению Хр в доказательстве теоремы 2.2.1 + (Ям о ^)| у[х» о ф - хм о 1р(р)]\ = \р ) п (2.2.5) /х=1 Но как следует из (2.2.3), Н^сф(р) - это просто Х^(/). Таким образом, для всех / £ Т мы получаем д=1 (2.2.6) где коэффициенты Vм представляют собой значения v при действии на функцию х** о ^, ^ = v(xMo^). (2.2.7) В результате, мы выразили произвольный касательный вектор v как сумму Хм, п v = ]TVXM, (2.2.8) ц=1 □ и тем самым закончили доказательство. Базис {Хц} пространства Vp, введенный при доказательстве теоремы 2.2.1, называется координатным базисом, он очень важен сам по себе. Часто векторы Х^ обозначают просто как д/дх^. Если бы мы выбрали другую карту *ф\ то получили бы другой координатный базис {XI}. Конечно, мы можем выразить Х^ в новом базисе {Х^}-
Векторы 41 Используя правила дифференцирования сложной функции, получаем К, (2.2.9) " Ох'» дх» где x'v - v-гя компонента отображения ф' о ф~1. Из уравнений (2.2.8) и (2.2.9) следует, что компоненты v'v вектора v в новом координатном базисе связаны с компонентами v^ в старом базисе соотношением Соотношение (2.2.10) известно как закон преобразования векторов. Гладкая кривая С на многообразии М определяется просто как отображение класса С°° из R (или интервала R) в М, С : R —► М. С каждой точкой р € М, лежащей на кривой С, мы можем связать касательный вектор Т € Vp следующим образом. Для / € Т мы положим T(f) равным производной функции / о С : R —► R, вычисленной в точке р, т.е. Т(/) = d(/ о C)/dt. Отметим, что определенный ранее базисный вектор Х^ координатной системы гр является касательным вектором к кривой на М, которая получена при фиксированных значениях всех координат, за исключением х*1. Отметим также, что при выборе координатной системы *ф кривая С на М будет отображаться в кривую хм (t) в пространстве Rn. Тогда для любой / G Т мы получаем Г(/> - £« • С) - £ £tf • *-'>£ - Е £*-№ (2.2.11) Таким образом, в любом координатном базисе компоненты Т7* касательного к кривой вектора даны соотношением Г" = —. (2.2.12) at До сих пор мы фиксировали точку р е М и рассматривали касательное пространство Vp в этой точке. Мы, конечно, можем определить vq и в другой точке g € М. Важно подчеркнуть, что в том случае, когда мы располагаем только структурой многообразия, мы не можем Явственным способом идентифицировать Vq с Vp\ иначе говоря, не УЩествует способа, позволяющего определить, является ли касатель- Ь1Й вектор в точке q "тем же самым", что и касательный вектор в
42 Глава 2. Многообразия и тензорные поля точке р. В гл. 3 мы увидим, что лишь в том случае, когда задана дополнительная структура (а именно, связность или оператор производной на многообразии), мы можем определить понятие "параллельного переноса" векторов из р в q вдоль кривой, соединяющей эти точки. Однако, если кривизна отлична от нуля, отождествление Vp с Vq, произведенное таким образом, будет зависеть от выбора кривой. Касательное поле v на многообразии М определяется заданием касательного вектора v\p € Vp в каждой точке р Е М. Вопреки тому факту, что касательные пространства Vp и Vq в различных точках являются различными векторными пространствами, существует естественное определение понятия, означающего гладкое изменение v от точки к точке. Если / - гладкая (С°°) функция, то в каждой точке р € М компонента v\p(f) - это число, т.е. v(f) - это функция на М. Говорят, что касательное поле v гладкое, если для каждой гладкой функции / функция v(f) тоже гладкая. Поскольку легко убедиться, что поля базисных векторов Х^ гладкие, отсюда следует, что векторное поле v гладкое тогда и только тогда, когда его компоненты v** в заданном координатном базисе - гладкие функции. В эвристическом обсуждении, проведенном выше, мы представили касательные векторы как "бесконечно малые смещения". Покажем теперь, что их точный смысл может быть передан следующим образом. Пусть М - многообразие. Однопараметрическая группа диффеоморфизмов, <t>t - это отображение класса С°° из R х М —» М такое, что для фиксированного t € П£ фг : М —> М является диффеоморфизмом, и для всех t, s € R выполняется фг° фа = Фг+s- (В частности, из последнего соотношения следует, что фг=о - тождественное отображение.) Мы можем связать векторное поле v с фг следующим образом: для фиксированной точки р G М, фь(р) ' К —► М - это кривая, которая называется орбитой фг и проходит через р при t = 0. Определим v\p как касательный вектор к этой кривой при t = 0. Таким образом, ассоциированные с однопараметрической группой (конечных) преобразований М касательные векторы образуют векторное поле v, которое можно рассматривать в качестве инфинитезимальных генераторов этих преобразований. Наоборот, имея гладкое векторное поле v на М, мы можем задать вопрос, можно ли найти интегральные кривые поля v, т.е. такое семейство кривых на М, которое обладает свойством, что одна и только одна кривая из этого семейства проходит через каждую точку р G М, и касательный вектор к этой кривой в точке р - это вектор v\p? Ответ на данный вопрос положительный: если мы выберем координатную систему в окрестности точки р так же, как в доказательстве теоремы
о Тензоры. Метрический тензор 43 2 2.1, то увидим, что задача о нахождении таких кривых сводится к решению системы ^=^(х1,...,хл), (2.2.13) обыкновенных дифференциальных уравнений в Rn, где v** - /z-ая компонента v в координатном базисе {д/дх**}. Данная система уравнений имеет единственное решение, полностью определенное начальной точкой t = 0, и, следовательно, каждое гладкое векторное поле v обладает единственным семейством интегральных кривых (см., например, (Coddington, Levinson 1995)). Имея интегральные кривые в каждой точке р € М, мы определяем диффеоморфизм фг{р) так, чтобы точка р была начальной точкой интегральной кривой г>, задаваемой параметром t. Если исключить потенциальные проблемы, возникающие из той возможности, что интегральные кривые v могут распространяться только на конечные значения параметра кривой, то тогда фг{р) будет однопараметрической группой диффеоморфизмов. В заключение этого раздела отметим, что, имея два гладких векторных поля v и w, мы можем определить новое векторное поле [v,w], которое называется коммутатором v и w и определено как [v, w](f) = v[w(f)} - w[v(f)], (2.2.14) (см. задачу 3). Заметим, что коммутатор любых двух векторных полей Хц и Хи, принадлежащих к некоторому координатному базису, обращается в нуль. (Этот факт следует непосредственно из определения координатного базиса, приведенного в доказательстве теоремы 2.2.1, и из равенства смешанных частных производных в Rn.) И наоборот, имея набор Х\,..., Хп неисчезающих векторных полей, коммутирующих друг с другом и являющихся линейно независимыми в каждой точке, мы всегда можем найти систему координат, в которой они являются базисными векторными полями (см. задачу 5). 2.3 Тензоры. Метрический тензор Основываясь на понятии векторов смещения, можно ввести понятие тензоров, необходимое для рассмотрения многих представляющих интерес величин. Оказывается, что многие величины имеют линейную \или мультилинейную) зависимость от смещения. Рассмотрим, напри- МеР> измерение магнитного поля (скажем, в контексте дорелятивист- Ск°й физики). При этом для каждой ориентации датчика записыва- ^ся число: напряженность магнитного поля в заданном направлении.
44 Глава 2. Многообразия и тензорные поля Так как имеется бесконечное число возможных ориентации датчика, то, в принципе, нам потребуется бесконечное число замеров для определения магнитного поля. Однако в этом нет необходимости, поскольку напряженность магнитного поля имеет линейную зависимость от ориентации датчика. Все что нам требуется - это снять измерения в трех линейно независимых положениях датчика; замеры, произведенные в других направлениях, будут равны линейной комбинации этих измерений. Этот факт позволяет нам интерпретировать магнитное поле как вектор или, точнее, как дуальный вектор. Дуальный вектор можно определить как набор из трех чисел (т.е. результатов замеров датчика), связанных с базисом пространственных векторов смещения (тремя независимыми ориентациями датчика), которые преобразуются по определенному закону при замене базиса. Однако ниже мы дадим более простое и непосредственное определение дуального вектора как линейного отображения из множества пространственных векторов смещения в множество чисел. Итак, сейчас мы определили магнитное поле как дуальный вектор, но, как мы увидим в конце этого раздела, в силу того, что пространство имеет определенную на нем метрику, мы можем естественным образом сопоставить любому дуальному вектору обычный вектор пространственного смещения. Аналогично, многие другие физические величины имеют такую же линейную зависимость от векторов пространственного смещения, но при этом они еще могут зависеть более чем от одного такого вектора. Например, рассмотрим для обычного материального тела, находящегося в равновесии, плоскость с вектором нормали га, проходящую через точку р тела. В точке р мы можем измерить силу F, действующую в направлении / на единицу площади заданной плоскости. Мы увидим, что F будет линейно зависеть от выбора пи/. Таким образом, хотя имеется бесконечное число возможных вариантов выбора гаи/, значение F для любых га и / можно вычислить, зная 3x3 числа, а именно, зная значения F, найденные в случае, когда направления га и / совпадают с базисными. Это позволяет нам дать следующее определение тензора: тензор представляет собой мультилинейное (т.е. линейное по всем переменным) отображение из множества векторов (или дуальных векторов) в множество чисел. Тензор, отображающий пару векторов (га, Г) в значения F, известен как тензор напряжений в точке р материального тела. Дадим теперь точное математическое определение тензоров и обсудим их свойства. Пусть V - любое конечномерное векторное пространство над множеством действительных чисел. (В первую очередь
л з. Тензоры. Метрический тензор 45 нам интересен случай касательного пространства, т.е. V = Vp.) Рассмотрим множество V* линейных отображений / : V —► R. Определяя очевидным образом сумму и скалярное произведение таких линейных отображений, мы получим естественную структуру векторного пространства на V*. Будем называть V* дуальным к V векторным пространством, а элементы V* - дуальными векторами. Если vi,..., vn - базис V, мы можем можем определить элементы vl*,..., vn* € V* как ^Ы = *"1М (2.3.1) где <5М1/ = 1? если А* = *Л и <^1/ = 0> если № Ф v- (Формула (2.3.1) определяет действие Vм на базисные элементы; их действие на произвольный вектор v € V определяется формулой (2.3.1) и свойством линейности.) Прямым следствием определения (2.3.1) (задача 6) является тот факт, что {*/**} образует базис V*, который называется дуальным базисом к базису {v^} пространства V. В частности, отсюда следует, что dim V* = dim V. Соответствие vM <-*- vM* приводит к изоморфизму между V и V*, однако этот изоморфизм зависит от выбора базиса {Vfjt}, так как не существует естественного способа отождествления V* с V (если только на V не задана какая-либо дополнительная структура, такая, как выделенный базис или метрика, о которой речь пойдет ниже). Мы можем использовать предыдущее построение для того, чтобы, начиная с векторного пространства V*, получить дважды дуальное векторное пространство к V, которое мы обозначим как V**. Вектор v** £ у** представляет собой линейное отображение из V* в R. Отметим, что V** является естественно изоморфным к исходному векторному пространству V. Каждому вектору v £ V мы можем сопоставить отображение из V** такое, что его значение, соответствующее векто- РУ w* G Г, есть просто u*(v). Этим способом мы получим взаимно однозначное линейное отображение V в V**, которое будет биекцией, так как dimV = dimV**. Таким образом, повторная операция дуальности не дает ничего нового; мы можем естественно отождествить V** с ис*одным векторным пространством V. Такое отождествление будет пРедполагаться в дальнейшем обсуждении. Теперь мы готовы определить понятие тензора. Пусть V - конечномерное векторное пространство, и V* - его дуальное векторное пространство. Тензор Т типа (к, I) над V - это мультилинейное отображение > * ' * v ' к I
46 Глава 2. Многообразия и тензорные поля Иначе говоря, заданным к дуальным векторам и I обычным векторам отображение Т сопоставляет число, причем так, что если мы зафиксируем все векторы и дуальные векторы кроме какого-либо одного, то отображение будет линейным относительно оставшейся переменной. Таким образом, согласно данному определению, тензор типа (0,1) является дуальным вектором. Аналогично, тензор типа (1,0) представляет собой элемент V**. Но поскольку мы отождествляем V** с V, тензор типа (1,0) есть не что иное, как обычный вектор. Благодаря отождествлению V** с V мы можем рассматривать тензоры более высоких типов, используя различные (хотя, конечно, эквивалентные) подходы. Например, тензор Т типа (1,1) является мультилинейным отображением V* х V —► R. Следовательно, при фиксированном V € Т, T(-,v) является элементом V**, который мы отождествляем с элементом V. Таким образом, данному вектору из V отображение Т сопоставляет линейно другой вектор из V. Другими словами, мы можем рассматривать тензор типа (1,1) как линейное отображение из V в V, и наоборот. Аналогично, мы можем рассматривать Т как линейное отображение из V* в V*. Множество T(fc,/) всех тензоров типа (&,/)> дополненное очевидными правилами для операций суммы и скалярного произведения, имеет структуру векторного пространства. Благодаря свойству муль- тилинейности, тензор оказывается однозначно заданным своими значениями на векторах базиса {v^} в V и дуального базиса {vy} в V*. Поскольку имеется nfc+/ независимых способов заполнения "позиций" для тензора типа (к,1) с такими базисными векторами (где п = dim V = dim V*), то размерность векторного пространства Т(к,1) равна nk+l. Введем теперь две простые, но важные операции с тензорами, которые будут часто использоваться в дальнейшем. Первая операция называется сверткой по отношению к г-ой (дуальный вектор) и j-ой (вектор) позициям и представляет собой отображение С : T(k,l) —* —► T(k — 1,/ — 1), определенное следующим образом. Если Т - тензор типа (&,/), то п СТ=^Т(...,^,...;...,^,...), (2.3.2) <7=1 где {va} - базис V, {va } - дуальный базис, и эти векторы расположены на г-ой и j-ой позициях Т. (Отметим, что свертка тензора типа (1,1), рассматриваемого как линейное отображение из V в V, представляет собой просто след отображения.) Тензор СТ, полученный таким
л з# Тензоры. Метрический тензор 47 фбразом, не зависит от выбора базиса {v^}, поэтому операция свертки действительно хорошо определена (см. задачу 6). Вторая операция с тензорами - это внешнее произведение. Имея тензор Т типа (к, I) и другой тензор Т" типа (&', Z'), мы можем построить новый тензор типа (к + к',1 + /'), который называется внешним произведением ГиГ'и обозначается как Т ® Т' по следующему простому правилу. Для данных (к + к') дуальных векторов v1*,..., vk~*~k * и (/ + /') векторов w\,..., wj+j/ мы определим Т <8> Т", действуя на эти векторы так, чтобы получить произведение T(vim,..., vk*; w\,..., гу/) и 2^(1;*+1*,..., tifc+fc#*; ti/i+i,..., ад+iO в R. Таким образом, один из способов конструирования тензоров заключается в построении внешних произведений векторов и дуальных векторов. Тензор, который может быть представлен в виде такого внешнего произведения, называется простым2. Если {v^} - базис V и vv* -дуальный базис, то легко показать, что nk+l простых тензоров {vMl ® • • • • • ® Уцк ® гЛ* ® • • • ® г/"'*} дают базис Т(ку /). Таким образом, каждый тензор Т типа (fc, I) может быть выражен как сумма простых тензоров из этого набора: п Т = J2 ^"'"V-n «mi ® • • • ® *"Г• (2.3.3) /ilf...,l/! = l Коэффициенты разложения по базису T/il"'/ifcl/1...^ называются колс- поненгаалш тензора Т по отношению к базису {vM}. Отметим, что мы следуем стандартным соглашениям при обозначении компонент, отмечая верхними индексами /х, связь с векторами и нижними индексами Vj - связь с дуальными векторами. Используя компоненты, получаем следующие формулы для свертки и внешнего произведения. Предположим, что тензор Т имеет компоненты T/4l""''*„1...„J как в (2.3.3). Тогда свертка СТ тензора Г имеет следующие компоненты: п (СГ)"1"*-^-.^-! = ЕТМ1""""fc-V *..•„_!. (2.3.4) <7=1 Если Г' имеет компоненты T,/il"'/lfcI/j...„|', тогда внешнее произведение ^ = Г ® Г7 имеет следующие компоненты: ° T 1/1—1/|+|/—-* 1/1—l/l-l «'l+l—1>|+|/' ^•°-°; Многие авторы называют простым также тензор типа (0,/), который является °лностью антисимметричной частью простого тензора (см. (2.4.4) ниже).
48 Глава 2. Многообразия и тензорные поля Предыдущее обсуждение применимо к произвольному конечномерному векторному пространству V. Давайте рассмотрим случай, представляющий для нас особый интерес, когда V является касательным пространством Vp в точке р многообразия М. В этом случае V* обычно называют кокасательным пространством в р, и векторы из V* называют кокасательными векторами. Мы также будем называть векторы из Vp контравариантными векторами, и векторы из V* - ковариант- ными векторами. Как обсуждалось в разд. 2.2, в данной системе координат мы можем построить координатный базис д/дх1,...,д/дхп в Vp. Ассоциированный дуальный базис в V* обычно обозначается как dr1,. ..,dxn. (Таким образом мы подчеркиваем, что dxM является просто символом для линейного отображения, определенного как dx**(d/dxu) = (JMi/.) Как уже было показано, при замене координатной системы компоненты г/м вектора v в новом базисе связаны с компонентами Vм в старом базисе векторным законом преобразования '* = ХУ|£- (2-3-6) /1=1 Пусть Up обозначают компоненты дуального вектора а> по отношению к дуальному базису dx*1. Тогда из уравнений (2.3.1) и (2.3.6) следует, что при преобразовании системы координат компоненты преобразуются согласно ^V = E^^7- (2.3.7) Вообще, компоненты тензора Т типа (fc, l) преобразуются как ' ' J^ fir'**'1 Ят»' 1 „<...,<- 2^ / ■*•■•■*asm дх,»[- <2-3^ /ilf...,1/1=1 v** Формула (2.3.8) известна как тензорный закон преобразования. Часто тензор определяют иначе, чем выше, используя уравнение (2.3.8) как основополагающее свойство. Определение тензора, которое привели мы, имеет то преимущество, что с его помощью, вообще говоря, легче представить тензор как мультилинейное отображение на векторах и дуальных векторах, чем как набор чисел, связанных с координатной системой и меняющихся по закону (2.3.8) при смене системы координат. Фактически, как будет показано в этой книге, вводить базис и рассматривать компоненты тензора неэффективно вообще, поэтому не будем беспокоиться о том, как эти компоненты изменяются при замене базисов.
2 з. Тензоры. Метрический тензор 49 Совокупность тензоров, заданных на касательных пространствах у в каждой точке р многообразия М называется тензорным полем. Понятия гладкости функции и (контравариантного) векторного поля v уже определены в разд. 2.2. Будем говорить, что гладкое ковариантное векторное поле ш принадлежит классу С°°, если для каждого гладкого векторного поля v функция ш(у) - гладкая. Также будем говорить, что тензор Т типа (к, I) является гладким, если для всех гладких ко- вариантных векторных полей о;1,... ,ик и гладких контравариантных векторных полей v\,..., vi T(uj1 ,..., и>к; v\,..., vi) - гладкая функция. Понятие тензорного поля класса Ск вводится аналогично. Введем теперь понятие метрики. На интуитивном уровне предполагается, что метрика говорит нам о "бесконечно малом квадрате расстояния", связанном с "бесконечно малым смещением". Как уже обсуждалось в разд. 2.2, интуитивное понятие "бесконечно малого смещения" точно отображается концепцией касательного вектора. Таким образом, поскольку "бесконечно малый квадрат расстояния" должен быть квадратичным по смещению, метрика g должна быть линейным отображением из Vp x Vp в множество чисел, т.е. тензором типа (0,2). Кроме того, требуется, чтобы метрика была симметричной и невырожденной. Под симметричностью мы подразумеваем, что для всех v\,V2 € Vp выполняется g(vi,V2) = g(v2jVi). Под невырожденностью мы подразумеваем, что равенство g{v,v\) = 0 для всех v G Vp выполняется только в случае v\ = 0. Итак, метрика g на многообразии М есть симметричное невырожденное тензорное поле типа (0,2). Другими словами, метрика - это (необязательно положительно определенное) внутреннее произведение в каждой точке касательного пространства. В координатном базисе метрика g может быть выражена через свои компоненты как g=J2^»dx»®dx1'. (2.3.9) Иногда для обозначения метрического тензора вместо g используется ds2, в этом случае формула (2.3.9) записывается следующим образом: de2 = S^d^d^, (2.3.10) гДе, следуя обычной практике, мы опускаем знак внешнего произведе- Ния между dxM и dxu. Обозначения, использованные в (2.3.10), выражают интуитивное представление о метрике как о "бесконечно малом квадрате расстояния". Имея метрику g, мы всегда можем найти ортонормированный ба- 3Uc vi,-.-,vn касательного пространства в каждой точке р, т.е. такой
50 Глава 2. Многообразия и тензорные поля базис, что g{v^vu) = 0, если \i Ф v и giy^Vy) = ±1 (см. задачу 7). Конечно, имеется множество других ортонормированных базисов в р, однако число базисных векторов, для которых g(vM, v^) = +1, и число таких векторов, для которых g(vM, v^) = —1, не зависит от выбора ор- тонормированного базиса (задача 7). Число знаков + и — называется сигнатурой метрики. В обыкновенной дифференциальной геометрии мы обычно имеем дело с положительно определенными метриками, т.е. метриками с сигнатурой + + Ь С другой стороны, метрика пространства-времени имеет сигнатуру — + ++. Положительно определенные метрики называются римановымщ метрики с сигнатурами, подобными сигнатуре пространства-времени (один минус и остальные плюсы), называются лоренцевыми3. Как было определено выше, метрика g в каждой точке р £ М представляет собой тензор типа (0,2) над Vp, т.е. мультилинейное отображение Vp х Vp —> R. В то же время мы можем рассматривать g как линейное отображение из Vp в V* вида v —► g(-, v). Благодаря невырожденности g, это отображение является взаимно-однозначным эпиморфизмом. В частности, для него существует обратное отображение. Поэтому мы можем использовать g для того, чтобы установить взаимнооднозначное соответствие между векторами и дуальными векторами. Более того, для заданной метрики g мы можем использовать это соответствие так, чтобы совершенно избежать необходимости введения дуальных векторов. Обычно так и делается, и этим объясняется, почему концепция дуальных векторов не является привычной для большинства физиков. Однако в общей теории относительности метрика пространства-времени определяется в результате решения уравнений, и, поскольку метрика не известна с самого начала, мы будем сохранять явное различие между векторами и дуальными векторами. 2.4 Абстрактные индексные обозначения В предыдущем разделе мы ввели понятие тензоров и определили ряд операций над ними. Однако даже при проведении простейших манипуляций с тензорами возникают две серьезные проблемы с обозначениями. (1) Тензоры высших типов представляют собой функции многих векторов и дуальных векторов. При выполнении таких операций, как свертка, необходимо отслеживать, какие позиции тензорных аргумен- 3В отечественной литературе термин евклидова метрика принят наряду с термином риманова.- Прим. ред.
2 4. Абстрактные индексные обозначения 51 гОВ задействованы. Введение нового символа для обозначения, скажем, частичной свертки данного тензора, создает громоздкость и превращает даже простые операции в очень сложные по форме. (2) Как отмечалось, данный тензор можно представлять различными эквивалентными способами. Поэтому важно разработать такую схему обозначений, простую и последовательную, чтобы одни и те же выражения можно было выписывать, невзирая на выбранную точку зрения. Обозначения, которые решают эти проблемы и используются в большинстве работ по теории относительности, а также в большинстве работ (преимущественно старых) по дифференциальной геометрии, следующие. Как отмечалось в разд. 2.3, если мы вводим базис, то мы можем характеризовать тензор его компонентами T/il",/ifc„1...„l. Обозначения заключаются в записи всех уравнений в терминах этих компонент. Это решает проблемы (1) и (2), потому что в этом случае получаются уникальные и простые выражения для операций типа свертки и внешнего произведения в терминах компонент. В то же время у компонентных обозначений есть серьезный недостаток. В том случае, если мы не фиксируем конкретный базис, который используем, уравнения, которые мы выписываем, действительно представляют собой тензорные уравнения. Однако иногда бывает удобным использовать определенный тип базиса, например, координатный базис, выбранный с учетом симметрии пространства-времени. Если мы поступаем таким образом, тогда уравнения, которые мы записываем в тензорных компонентах, могут быть действительными только в этом базисе. Поэтому важно ясно различать уравнения, которые выполняются для тензоров, и уравнения, которые выполняются для их компонент только в заданном базисе. Однако это различие скрыто компонентными обозначениями. Мы будем использовать абстрактные индексные обозначения, которые на практике являются просто небольшой модификацией компонентных обозначений. Они обладают всеми преимуществами компонентных обозначений и при этом свободны от вышеуказанных недостатков. Идея заключается в том, чтобы, не задавая определенный базис, использовать обозначения для тензоров, воспроизводящие выражения для их базисных компонент (как, если бы мы задали базис). Правила следующие. Тензор типа (k,l) будет обозначаться буквой, снабженной к контравариантными и I ковариантными строчными ла- Тинскими индексами: T0l'"afcbi-6r Таким образом, например, Tabcde °б°значает4 тензор типа (3,2). Латинские индексы здесь должны рас- ТЪчнее говоря, мы можем рассматривать То6с^е как обозначение тензора Т и
52 Глава 2. Многообразия и тензорные поля сматриваться как напоминание о номере и типе переменных, на которые распространяется действие тензора, а не как базисные компоненты. Любые строчные латинские буквы могут быть помещены в любую позицию, но в уравнении одна и та же буква должна занимать одну и ту же позицию в обеих частях уравнения. По аналогии с компонентным выражением (2.3.4) (только опуская знак суммы), мы будем обозначать свертку тензора, используя ту же букву как для тензора, но при этом повторяя индексы в позициях, по которым производится свертка. Таким образом, ТаЬсье обозначает тензор типа (2,1), полученный сверткой тензора Tabcde типа (3,2) по второй контравариантной и первой ковариантной позициям. Внешнее произведение двух тензоров обозначается просто при помощи их записи рядом друг с другом (опуская знак ®). Таким образом, TabcdeS^g обозначает тензор типа (4,3), полученный в результате внешнего произведения Tabcde И 5V Используя индексные обозначения, мы имеем возможность записывать только действительно тензорные уравнения, поскольку при этом мы не вводим никакого базиса. Если все же базис вводится, то, конечно, в этом случае мы должны брать компоненты тензоров и записывать уравнения для них. Чтобы различать уравнения для компонент и (выглядящие очень похоже) тензорные уравнения в индексных обозначениях, мы будем придерживаться следующих соглашений. Для меток (индексов) в компонентных обозначениях всегда будут использоваться греческие буквы, как имело место выше. Таким образом, например, Т^хар обозначает базисную компоненту тензора Tabcde- Для любого тензорного уравнения, записанного в индексных обозначениях, соответствующее уравнение для базисных компонент (в котором для верхних и нижних индексов использованы греческие буквы вместо латинских) будет выполняться независимо от выбора базиса. И наоборот, для любого действительно тензорного уравнения (т.е. такого, которое выполняется независимо от выбора базиса), связывающего базисные компоненты, соответствующее тензорное уравнение в индексных обозначениях также является верным. Таким образом, индексные и компонентные обозначения различаются скорее трактовкой появляющихся в уравнении величин, чем по сути (т.е. формой, которую принимают уравнения). Главное преимущество индексных обозначений заключается в том, что при их использовании необязательно вводить базис, и при этом все уравнения, записанные в индексных обозначениях, являются уравнениями между тен- элементов а, 6, с, d, e из набора меток, которые размечают "позиции" этого тензора (Penrose, Rindler 1984).
<l 4. Абстрактные индексные обозначения 53 3орами> поскольку только лишь действительно тензорные уравнения могут быть выражены в этих обозначениях. Конечно, компонентные обозначения все еще могут использоваться, в том случае, когда желательно выписать нетензорные уравнения для базисных компонент в некотором базисе. При таком подходе можно увидеть явное различие в обозначениях между действительно тензорными уравнениями и уравнениями для компонент, записанными в некотором базисе. Дополнительные правила для обозначений применяются к метрическому тензору как в индексных, так и в компонентных обозначениях. Поскольку метрика g является тензором типа (0,2), то она обозначается gab. Действуя метрикой на вектор va, мы получаем дуальный вектор gabvb. Удобно обозначить этот вектор просто как va, тем самым подчеркивая явно изоморфизм между Vp и V*, определенный с помощью gab. Обратный тензор к gab (который, как отмечалось в конце разд. 2.3, существует вследствие невырожденности gab) является тензором типа (2,0) и может быть обозначен как (Г1)00. Удоб НО, однако, отбросить "степень" -1, указывающую на обратный тензор, и обозначать его просто как g*6. При этом не возникает никакой путаницы, поскольку верхняя позиция индексов служит отличием обратной метрики от метрики. Таким образом, по определению g?bgbc = Sac, где Sac (рассматриваемое как отображение из Vp в Vp) является тождественным отображением. Если мы применим обратную метрику к дуальному вектору а>а, то обозначим результирующий вектор £*ьиь просто как uA Вообще, повышение или понижение индексов у любого тензора обозначается с помощью метрики или обратной метрики, действующей на соответствующую позицию тензора. Таким образом, например, если Tabcde является тензором типа (3,2), то Tabcde обозначает тензор gbf^h^Ta^chj^ Это обозначение оказывается самосогласованным, поскольку тензор, который получается в результате последовательного поднятия и опускания данного индекса, является идентичным исходному тензору. Более того, обозначение оказывается также самосогласованным, будучи примененным к самой метрике, так как £° = ^^gcdi те- 8?b ~ это тензор gab с поднятыми индексами. Индексные обозначения могут быть также использованы, чтобы ВьЧ>азить свойства симметрии тензоров. Тензор ТаЬ типа (0,2) перево- д*Ит пару векторов (va,wa) в число Tabvawb. Мы можем рассмотреть Новый тензор, полученный перестановкой порядка, в каком тензор ТаЬ Действует на эту пару векторов, т.е. тензор, который переводит (va, wa) * *abvbwa. В индексном обозначении этот тензор обозначается как ТЬа. ^им образом, например, уравнение ТаЬ = ТЬа говорит нам, что тен- °Р ^аб - симметричный. Аналогичные правила применяются к л ю-
54 Глава 2. Многообразия и тензорные поля бой паре ковариантных или контравариантных индексов для тензоров высших типов. Удобно ввести специальные обозначения для полностью симметричных и полностью антисимметричных частей тензоров. Если Таь - тензор типа (0,2), то мы определим Г(в6) = \{ТаЬ + Тьа), (2.4.1) Т[аЬ] = \{ТаЬ-ТЬа). (2.4.2) Более широко, для тензора Tai...ai типа (0,1) мы определим ^(ai-aj) = J\ ^^aw(1)-aw(0» (2.4.3) 7Г r[ai».a,] = ц^ЬТа^гу.-а^у (2.4.4) 7Г где сумма берется по всем перестановкам 7г из 1,..., /, и Sv равно +1 для четных и -1 для нечетных перестановок. Аналогичные определения применяются для любой группы взятых в скобки ковариантных или контравариантных индексов, например, T^c[de] = J [Tabcde + Tbacde - Tabced - Tbaced] . (2.4.5) Полностью антисимметричное тензорное поле Гв1...в| типа (0,/) Гв1...в| =Г[в1...в|], (2.4.6) называется дифференциальной I-формой. Некоторые свойства дифференциальных форм обсуждаются в прилож. В. В том случае, когда мы имеем дело только с дифференциальными формами, бывает удобно отбрасывать индексные обозначения и обозначать /-форму Т01...0, просто как Т. Однако, исключая некоторые примеры с дифференциальными формами и несколько случаев, в которых индексные обозначения могут привести к путанице, как в случаях с коммутаторами и с производными Ли (см. прилож. С), в дальнейшем в книге мы будем использовать индексные обозначения. Задачи 1. (а) Покажите, что функции перекрытия /* о (/*)~1 принадлежат классу С°°, завершая, таким образом, данное в разд. 2.1 доказательство, что S2 является многообразием.
i Абстрактные индексные обозначения 55 (b) Покажите с помощью явного построения, что для того, чтобы покрыть 52, достаточно двух координатных систем (а не шести, как выше в тексте). (52 невозможно покрыть одной картой, это следует из того факта, что S2 компактно, а каждое открытое подмножество R2 некомпактно; см. при- лож. А.) 2. Докажите, что любая гладкая функция F : Шп —► R может быть записана в форме (2.2.2). (Подсказка: для п = 1 используйте тождество F{x) - F(a) = {x-a) [ F'[t(x - а) + a]dt, Jo затем по индукции проведите доказательство для любого п.) 3. (а) Проверьте, что коммутатор, определенный в (2.2.14), удовлетворяет свойству линейности и правилу Лейбница и, следовательно, определяет векторное поле. (b) Пусть X, У, Z - гладкие векторные поля на многообразии М. Проверьте, что их коммутатор удовлетворяет тождеству Якоби: [[X, Y), Z] + [[У, Z], X] + [[Z, X], У] = 0. (c) Пусть Y\,..., Уп - гладкие векторные поля на n-мерном многообразии М, такие, что в каждой точке р G М они формируют базис касательного пространства Vp. Тогда в каждой точке мы можем разложить каждый коммутатор [Уа,У]д] в базисе, тем самым определяя функции C7Q/j = ~C7^Q как [Ya,Y0] = y£c\0Yy. 7 Получите уравнения для C7Q/g, используя тождество Якоби. (Это уравнение оказывается полезным алгебраическим соотношением, если C7Q/j являются константами, как в случае, когда Уь...,Уп лево- (или право-) инвариантные векторные поля на группе Ли (см. разд. 7.2).)
56 Глава 2. Многообразия и тензорные поля 4. (а) Покажите, что в любом координатном базисе компоненты коммутатора двух векторных полей v и w представляются как (b) Пусть Yi,..., Yn - векторные поля такие, как в задаче 3(b). Пусть У1*,..., Yn* - дуальный базис. Покажите, что компоненты {Y1 )м поля Уу в любом координатном базисе удовлетворяют соотношению (Подсказка: сверните обе части с (yaY(Ypy.) 5. Пусть Yi,..., Yn - гладкие векторные поля на n-мерном многообразии М такие, которые формируют базис Vp в каждой точке р е М. Предположим, что [Уа»^/з] = 0 для всех а, (3. Докажите, что в окрестности каждой точки р € М существуют координаты yi,..., 2/п, такие, что Yi,..., Yn являются координатными векторными полями, Ум = д/ду^. (Подсказка: в открытом шаре в Rn уравнения df/dx** = FMc/x = l,...,n для неизвестной функции / имеют решение тогда и только тогда, когда dF^/dx" = dFv/dx**. (Смотри конец прилож. В.1, где приводится утверждение, обобщающее этот результат.) Используйте этот факт вместе с результатами задачи 4(b) для получения новых координат.) 6. (а) Проверьте, что дуальные векторы {v** }, определенные уравнением (2.3.1), составляют базис V*. (b) Пусть vi,...,vn - базис векторного пространства V, и v1*,...,vn* - его дуальный базис. Пусть w € V и и Е V*- Покажите, что w = ^2vam{w)vQ1 а а (c) Докажите, что оператор свертки, определенный (2.3.2), не зависит от выбора базиса.
л Абстрактные индексные обозначения 57 7. Пусть V - n-мерное векторное пространство, g - метрика на V. (a) Покажите, что всегда можно найти ортонормированный базис vi,...,vn в V, т.е. такой базис, что g{va,vp) = ±8ар. (Подсказка: используйте индукцию.) (b) Покажите, что сигнатура g не зависит от выбора ортонор- мированного базиса. 8. (а) Метрика плоского трехмерного евклидова пространства имеет вид ds2 =dz2 + dy2+d22. Покажите, что компоненты метрики g^u в сферических полярных координатах г, 0, <р, определенных соотношениями Г = (Х2 + у2 + 22)1/2, COS0 = Z/Г, tglf = t//x, заданы следующим образом: d52=dr2-hr2d02+r2sin20d^2. (b) Метрика пространства-времени в специальной теории относительности имеет вид d52 = -d*2+drr2+d</2+d*2. Найдите компоненты метрики g^u и обратной (контравари- антной) метрики gf*u во "вращающихся координатах", определенных соотношениями *' = *, х' = (х2 + у2)1/2 cos(y> - uit), y' = (x2 + y2)l/2sm(ip-u;t), z' = z, где tgip = y/x.
Глава 3 Кривизна Наше интуитивное представление о кривизне возникает главным образом в связи с двумерными поверхностями, вложенными в обычное трехмерное евклидово пространство. Как правило, мы представляем поверхность искривленной, так как она каким-то образом изгибается в R3. В гл. 9 мы уточним это понятие, определив внешнюю кривизну поверхности, вложенной в пространство высшей размерности. Однако здесь мы намерены исследовать кривизну пространства-времени. Наше пространственно-временное многообразие М с метрикой gab не является естественно вложенным (по крайней мере, как нам до сих пор известно) в пространство высшей размерности. Таким образом, нам необходимо разработать внутреннее понятие кривизны, которое можно было бы применить к любому многообразию без ссылки на пространство высшей размерности, в которое это многообразие могло бы быть вложено. Такое понятие кривизны можно определить в терминах параллельного переноса. На таких поверхностях, как плоскость (рис. 3.1) или сфера (рис. 3.2), мы имеем интуитивное понятие (которое будет математически более точно определено ниже) о том, что означает фраза: сохранить вектор "указывающим в том же направлении" (но всегда в пространстве касательном к многообразию) при его движении вдоль пути. Если мы совершаем параллельный перенос вектора вдоль любого замкнутого пути на плоскости, то вектор, полученный при возвращении в исходную точку, всегда совпадает со своим начальным значением. Однако на сфере это не так. На рис. 3.2 показано, как вектор после перемещения вдоль контура возвращается назад повер- нУтым по отношению к своему начальному значению. Этот основной прием позволяет нам охарактеризовать плоскость как плоскую, :* 3.1. Параллельный перенос вектора va вдоль замкнутой кривой на плос- Ти- Вектор va всегда "возвращается", показывая то же самое направление, и первоначально
60 Глава 3. Кривизна Рис. 3.2. Параллельный перенос вектора va вдоль замкнутой кривой на сфере. В данном случае замкнутая кривая состоит из трех взаимно ортогональных сегментов больших кругов. Вектор va при этом возвращается повернутым на 90° а сферу как искривленную, и вообще, как только мы установили способ "параллельного переноса" векторов вдоль кривых, мы можем внутренним образом охарактеризовать кривизну любого многообразия. Альтернативную характеристику кривизны можно также дать следующим образом. Геодезическая - это кривая, вдоль которой параллельно переносится ее касательный вектор, т.е. это "наиболее прямая" кривая. Пространство будет искривленным тогда и только тогда, когда некоторые первоначально параллельные геодезические перестают быть параллельными, т.е. нарушается пятый постулат Евклида. Имея лишь пространство со структурой многообразия, мы не располагаем естественным понятием параллельного переноса. Причина этого заключается в том, что касательные пространства Vp и Vq в двух разных точках р и q являются различными векторными пространствами, и поэтому не существует способа установить, что некоторый вектор в точке р является тем же вектором в точке q. Таким образом, определение параллельного переноса требует чего-то большего, чем просто структуры многообразия. Нетрудно убедить себя, что представление о параллельном переносе векторов должно быть эквивалентным понятию о нахождении производных от векторных полей. Если мы знаем, как параллельно перенести вектор вдоль кривой, то мы можем определить производную векторного поля в направлении кривой; аналогично, имея понятие производной, мы можем определить параллельно перенесенный вектор как вектор, производная от которого вдоль данной кривой равна нулю. Оказывается, что удобнее всего работать непосредственно с понятием оператора производной, и именно так мы поступим в этой главе. Неспособность вектора вернуться к своему первоначальному значению при параллельном переносе вокруг
о \t Операторы ковариантной производной и параллельный перенос 61 бесконечно малой замкнутой кривой формулируется как потеря коммутативности производных. Таким образом, понятие кривизны может быть определено в терминах нарушения коммутативности последовательных производных от тензорных полей. Этой программе мы будем следовать в разд. 3.2. Откуда возникает эта дополнительная структура, необходимая для определения параллельного переноса или оператора производной? В разд. 3.1 мы покажем, что при задании метрики (любой сигнатуры) всегда имеется единственное определение параллельного переноса, которое сохраняет внутреннее произведение любой пары векторов. Таким образом, существование метрики приводит к естественному понятию параллельного переноса и, следовательно, к внутреннему понятию кривизны многообразия. Это именно то понятие кривизны пространства-времени (M,gab), которое нас интересует. Однако нам представляется более удобным, приступая к изложению материала, вначале дать общие определения оператора ковариантной производной, параллельного переноса и кривизны и лишь затем обратиться к вопросу о том, как эти понятия связаны с метрикой. Мы продолжим наше изложение именно таким образом. Операторы производной и параллельный перенос определяются в разд. 3.1, определение кривизны дано в разд. 3.2. В этих разделах изложение имеет много общего с неопубликованными заметками Роберта Героха. В разд. 3.3 вводится понятие геодезической линии и выводится уравнение геодезического отклонения, выражающее кривизну через отклонение от параллельности первоначально параллельных геодезических линий. В заключение, в разд. 3.4 обсуждаются способы вычисления кривизны. 3.1 Операторы ковариантной производной и параллельный перенос Оператор производной V (иногда называемый ковариантной про- вводной)1 на многообразии М - это отображение, которое переводит Ка*дое гладкое (или попросту дифференцируемое) тензорное поле ти- Па (М) в гладкое тензорное поле типа (k J + 1) и удовлетворяет пя- J* свойствам, перечисленным ниже. В индексных обозначениях, если 1 ais61.6/ € Т(к,1), то мы будем обозначать тензорное поле, получа- » дальнейшем мы будем использовать термин "оператор ковариантной про- ^Дной", что лучше согласуется с терминологией, принятой в отечественной литературе.- Прим. ред.
62 Глава 3. Кривизна ющееся в результате действия V на Т, как VcTai'"akb1—br Часто бывает удобно обозначение с индексом, прикрепленным непосредственно к оператору производной, записывая последний как Va, хотя в некоторой степени это является неточным использованием индексных обозначений, так как Va не является дуальным вектором. Пять условий, которые определяют оператор производной, в индексной записи выглядят следующим образом: 1. Линейность: для всех А,В € T(kJ) и a,/? e R Vc(aAei-efcb1...6|+i9Bei-e*b1...bl) = aVCi4e*'"eV..bl + 2. Правило Лейбница: для всех А е T(fc,Z), В £ T(k',V) Ve [Aa*"•"V-b,**1'""*'*».*!,,] = [VeAa*"'a*bl...bl]Bc*"'c"dl...dg, + 3. Коммутативность с операцией свертки: для всех A G Т(к, I) Vd(Aei"-c-"eV..c...b|) = V<fi4ei-c"-e*bl...c...bj. 4. Согласованность с понятием касательных векторов как производных по направлению скалярных полей: для всех / € F и всех ta£Vp t(f) = taVaf. 5. Отсутствие кручения2: для всех / € Т vav6/ = v6va/. Пятое условие иногда опускают, и действительно, имеются такие теории гравитации, где это условие не накладывается. Однако в общей теории относительности считается, что оператор производной удовлетворяет условию 5 и, если только не предполагается иначе, все операторы производных, рассматриваемые в книге, будут считаться свободными от кручения. 2Если это условие не накладывать, то можно показать, что существует тензор ТсаьУ антисимметричный по а и Ь, такой, что VaVb/ - Vf,Va/ = —TcabVcf (см- задачу 1). Тсаъ называется тензором кручения, таким образом условие 5 устанавливает, что тензор кручения равен нулю.
3.1. Операторы ковариантной производной и параллельный перенос 63 Полезно отметить, что условия 4 и 5 вместе с правилом Лейбница позволяют нам получить простое выражение для коммутатора двух векторных полей va и wb в терминах произвольного оператора производной Va. Рассматривая действие коммутатора на произвольную гладкую функцию /, мы получаем следующее: [vM(f) = v{w(f)}-w{v(f)} = = vaVa(wbVbf) - waVa(vbVbf) = = {vaS7awb-waVavb}Vbf. (3.1.1) Таким образом, [v, w]b = vaVawb - waVavb. (3.1.2) Наша первая важная задача заключается в том, чтобы показать, что операторы ковариантной производной существуют. Пусть ф - система координат и {д/дх*1} и {dx**} - сопряженные координатные базисы. Тогда в области, покрываемой этими координатами, мы можем определить оператор производной 9а, называемый обычной производной, следующим образом. Для любого гладкого тензорного поля Tai"afcbi -bt возьмем его компоненты Т7*1"7** „!...„, в этом координатном базисе и определим dcTai "akbi--bi как тензор3, компоненты которого в этом координатном базисе равны частным производным д(Т*Х1'"*1к1/1...1/1)/дх<т. Все пять условий выполняются, благодаря стандартным свойствам частных производных. Например, благодаря равенству смешанных частных производных, условие 5 выполняется для всех тензорных, а не только для скалярных полей. Таким образом, имея координатную систему ф, мы можем сконструировать ассоциированный с ней дифференциальный оператор da. Конечно, выбор другой координатной системы ф' ведет к другому дифференциальному оператору &а, т.е. компоненты тензора dcTai '^^...fy в новых (штрихованных) координатах не будут равны частным производным штрихованных компонент Tai"'0fc61..6i по отношению к штрихованным ко- °рдинатам. Таким образом, оператор обыкновенной производной оказывается координатно зависимым, т.е. не является естественно ассоциированным со структурой многообразия. Однозначно ли определяются операторы производной? По усло- вию 4 любые два оператора производных Va и Va должны одинаково Действовать на скалярные поля. Чтобы исследовать их возможное различие при действии на тензоры более высоких рангов, возьмем дуаль- н°е векторное поле шь и рассмотрим разность Va{f^b) — Va(fvb) для Здесь, как совокупность чисел в системе координат, безотносительно к преоб- разованию в другую систему координат.- Прим. ред.
64 Глава 3. Кривизна произвольного скалярного поля /. По правилу Лейбница мы получаем Ve(M)-Ve(M) = (Vaf)ub + fVaUb - (Ve/H " f^a^b = = /(Vau;6 - Vaw6). (3.1.3) где мы опять использовали свойство 4. В некоторой точке р и Va^b и VaUb зависят от того, как шъ изменяется при движении из р. Однако (3.1.3) показывает, что разность Va(fu>b) — Va(/u;fc) зависит только от значения иъ в точке р. Чтобы увидеть это, мы предположим, что ш'ь равно и>ь в р, и покажем, что получим тот же самый результат, заменяя и>ь на и'ь. Так как разность ш'ь—иъ исчезает в точке р, то, в соответствии с результатами задачи 2 гл. 2, мы можем найти гладкие функции /(Q), (a) исчезающие в р, и гладкие дуальные векторные поля //£ ', такие, что u'b-ub = itf«»fb*)- (ЗЛ-4) Q=l Следовательно, используя (3.1.3), мы получаем в точке р a = £ /(a){V0/4a) - Va/x[a)} = 0, (3.1.5) a так как /(a) = 0 в р. Таким образом, мы получаем Vaa;; - Vau^ = Vau>6 - Vaa;6, (3.1.6) что доказывает наше утверждение. Итак, мы показали, что Va — Va определяет отображение дуальных векторов в точке р (в отличие от дуальных векторных полей, определенных в окрестности р) в тензоры типа (0,2) в р. По свойству 1 это отображение является линейным. Поэтому (Va — Va) определяет тензор типа (1,2) в точке р, который мы обозначим как Ссаъ- Таким образом, мы показали, что для любых двух данных операторов производных Va и Va существует тензорное поле Ссаь, такое, что Vacj6 = Vaa;6 - Ccabuc. (3.1.7) Это соотношение демонстрирует нам возможное различие действия Va и Va на дуальные векторные поля.
о д. Операторы ковариантной производной и параллельный перенос 65 Свойство симметрии для Ссаь следует немедленно из условия 5. Полагая, что иь = V&/ = V&/, мы находим VaV6/ = VaVb/ - Cca6Vc/. (3.1.8) Поскольку и VaVb/ и VaVb/ симметричны по а и 6, то Ссаь также должен обладать этим свойством: ССаЬ = ССЬа. (3.1.9) Уравнение (3.1.9), конечно, не обязано выполняться, если требование об отсутствии кручения опущено. Различие в действии Va и Va на векторные поля и тензорные поля высших рангов определяется уравнением (3.1.7), правилом Лейбница и свойством 4. Для каждого векторного поля ta и поля 1-формы иа свойство 4 говорит нам, что (Ve - Va)(ujbtb) = 0. (3.1.10) С другой стороны, по правилу Лейбница мы получаем (Ve - Va)(^6) = (CCabUc)tb + Шъ&а ~ Va)*6- (3.1.11) Таким образом, переобозначая соответствующим образом индексы, по которым выполняется свертка, мы находим "b[(Ve " Va)*6 + CbactC] = 0. (3.1.12) для всех и>ь. Отсюда следует, что Vatb = Vatb + Cbactc. (3.1.13) Продолжая рассуждать подобным образом, мы можем вывести общее выражение для действия Va на произвольное тензорное поле через Va и СсаЬ. Для Г € T(fc, I) мы находим v a-*- ci-'-ci — va-* ci'-ci ' / v ^ ad± c\---ci i 0 Таким образом, различие между двумя операторами ковариантных пРоизводных Va и Va полностью характеризуется тензорным полем ^°аб. И наоборот, нетрудно проверить, что если Va - оператор кова- Риантной производной, и Ссаь - произвольное гладкое тензорное поле
66 Глава 3. Кривизна симметричное по нижним индексам, тогда оператор Va, определенный уравнением (3.1.14), также будет оператором ковариантной производной. Все это показывает нам, что мы имеем большую свободу в выборе оператора ковариантной производной, поскольку на n-мерном многообразии тензорное поле Ссаь имеет п2(п+1)/2 независимых компонент, определенных в каждой точке. Наиболее важное применение уравнение (3.1.14) находит в случае, когда Va представляет собой обычный оператор производной да. В этом случае тензорное поле Ссаь обозначается Гсаь и называется символами Кристоффеля. Таким образом, например, мы записываем Va*b = datb + Tbactc. (3.1.15) Поскольку мы знаем, как вычислять обычную производную, ассоциированную с данной системой координат, то уравнение (3.1.15) (и более общее уравнение (3.1.14), где вместо Va и Сьас подставлены да и Г6ас), указывает нам, как вычислять производную Va при условии, что мы знаем Г6ас. Еще раз отметим, что символы Кристоффеля представляют собой тензорное поле, ассоциированное с оператором производной Va и системой координат, определяющей оператор да. Однако, если мы делаем замену координат, то мы также должны изменить и обычный оператор производной да на д*а и, таким образом, изменить тензор Гсаь на новый тензор Г/Саь. Следовательно координатные компоненты тензора Гса5 в нештрихованных координатах не связаны с компонентами Г/с05 в штрихованных координатах тензорным законом преобразования (2.3.8), так как мы изменили не только координаты, но и сами тензоры. Имея оператор ковариантной производной Va, мы можем определить понятие параллельного переноса вектора вдоль кривой С с касательным вектором ta. Вектор va, заданный в каждой точке на кривой, называется параллельно перенесенным при движении вдоль кривой, если вдоль кривой выполняется уравнение taVavb = 0. (3.1Л6) Вообще, параллельный перенос тензора произвольного ранга можно определить как taVaTb*'bkCl...Cl = 0. (3.1.17) Выбирая систему координат и используя (3.1.15), мы можем преобразовать уравнение (3.1.17): tadavb + taTbacvc = 0, (3.1.18)
„ 1 Операторы ковариантной производной и параллельный перенос 67 или, используя компоненты в координатном базисе и параметр t вдоль кривой, ^ + £*TV"A = 0. (3.1.19) Отсюда следует, что параллельный перенос вектора va зависит только от значений va на кривой, поэтому в отличие от векторных полей, свойства параллельного переноса векторов можно определять только вдоль кривой. Более того, из свойств обыкновенных дифференциальных уравнений следует, что уравнение (3.1.19) всегда имеет однозначно определенное решение для любого заданного начального значения va. Таким образом, вектор в точке р на кривой однозначно определяет "параллельно перенесенный вектор" везде на кривой. Мы можем использовать понятие параллельного переноса для того, чтобы выполнить отождествление (т.е. взаимнооднозначное отображение) касательных пространств Vp и Vq в точках р и д, если зададим оператор производной и кривую, соединяющую р и q. Математическая структура, возникающая из такого отождествления (зависящего от кривой) касательных пространств в двух различных точках, называется связностью. И наоборот, можно начать с общего понятия связности и использовать его для определения оператора производной. Как мы уже видели выше, для заданной структуры многообразия можно определить много различных операторов производных, причем нет естественного способа, позволяющего предпочесть один другому. Однако теперь мы покажем, что если на многообразии задана метрика Sabi T0 естественный выбор оператора производной выполняется однозначно. Дело в том, что метрика приводит к естественному условию, которое мы можем наложить на понятие параллельного переноса. Для двух данных векторов va и wa мы потребуем, чтобы их внутреннее произведение gabvawb оставалось неизменным при параллельном переносе вдоль любой кривой. Таким образом, мы требуем, чтобы taVa {gbcvb™c) = 0 (3.1.20) Для vb и wc, удовлетворяющих (3.1.16). Используя правило Лейбница, получаем tavbwcVagbc = 0. (3.1.21) Уравнение (3.1.21) будет выполняться для всех кривых и параллельно перенесенных векторов тогда и только тогда, когда Vagbc = 0. (3.1.22)
68 Глава 3. Кривизна Это уравнение задает дополнительное условие, которое мы накладываем на V0. Согласно следующей теореме, это уравнение однозначно определяет Va. Теорема 3.1.1. Пусть gab - метрика. Тогда существует однозначно определенный оператор ковариантной производной Va, удовлетворяющий условию Vag6c = О- Доказательство. Пусть Va - любой оператор ковариантной производной, например, оператор обычной производной, ассоциированный с системой координат. Попытаемся найти С°аь так, чтобы оператор ковариантной производной, определенный при помощи Va и Ссаъ, обладал бы требуемым свойством. Мы докажем теорему, показав, что однозначное решение для Ссаь существует. Согласно уравнению (3.1.14) Ссаъ удовлетворяет соотношению О = Veftc = Va&c - Cdabgdc - Cdacgbdy (3.1.23) т.е. Ccab + Cbac = Vagbc (ЗЛ-24) Меняя порядок индексов, мы также получаем СсЬа + СаЬс = Vbgac, (3.1.25) Cbca + СасЬ = Vcgab.. (3.1.26) Найдем сумму (3.1.24)) и (3.1.25) и вычтем из нее (3.1.26). Используя свойства симметрии (3.1.9) для Ссаь, получаем 2Ccab = Vagbc + Vbgac - Vc&b, (3.1.27) т.е. Сс«ь = \fd {V„gbc + Vbgoc - Vcgab}. (3.1.28) Такой выбор Ccab дает решение уравнения (3.1.22) и является очевидно однозначным, что завершает доказательство. □ Таким образом, метрика gab естественно определяет оператор ковариантной производной Va. Далее везде в книге в случае, когда метрика задана, мы будем всегда выбирать естественный оператор ковариантной производной. Кроме того, уравнения (3.1.14) и (3.1.28) показывают нам,^ак можно выразить Va через любой другой оператор производной Va. В частности, символы Кристоффеля записываются с помощью оператора обычной производной в виде Гсаб = \$* {dagbd + dbgad - ddgab) , (3.1.29)
3.2. Кривизна 69 и следовательно, компоненты символов Кристоффеля в координатном базисе выглядят следующим образом: Таким образом, мы можем вычислить Гса& (а значит и оператор кова- риантной производной Va) с помощью частных производных компонент метрики в координатном базисе. 3.2 Кривизна В предыдущем разделе было показано, что при заданном операторе производной мы можем определить параллельный перенос вектора из точки р в точку q вдоль кривой С. Однако вектор из Vq, который мы получаем с помощью этой процедуры параллельного переноса из некоторого вектора из Vp, будет, в ообщем случае, зависеть от выбора кривой, соединяющей эти точки. Как уже отмечалось в начале этой главы, мы можем использовать зависимость параллельного переноса от пути для того, чтобы определить понятие кривизны как внутреннее. В этом разделе мы осуществляем эту программу, определяя прежде всего тензор кривизны Римана как меру, характеризующую ненулевой результат коммутирования двух операторов производной, последовательно примененных к дуальному векторному полю. Затем мы показываем, что этот тензор непосредственно связан с зависимостью от пути параллельного переноса; в частности, изменение вектора, параллельно перенесенного вдоль малой замкнутой петли, определяется тензором Римана. В следующем разделе мы покажем, что тензор Римана также полностью описывает и другую характеристику кривизны, о которой упоминалось раньше: в искривленном многообразии первоначально параллельные геодезические перестают быть параллельными. Пусть Va - оператор ковариантной производной, ша - дуальное векторное поле, / - гладкая функция. Подействуем двумя операторами производных на fwa: VaV6(/a;c) = Va(u;cV6/ + /V6u;c) = (3.2.1) = (VaV6/)a;c + Vb/VaWc + Va/Vfea;c + /VaVba;c. Если мы вычтем отсюда тензор УбУа(/о;с), то первые три члена в пра- вой части (3.2.1) сократятся с соответствующими членами выражения
70 Глава 3. Кривизна Рис. 3.3. Параллельный перенос вектора va вдоль малой замкнутой петли. Как показано в тексте, изменение va с точностью до второго порядка по At и As определяется тензором Рима на в точке р для VbVa(/u;c), и получится следующий простой результат (VaV6 - V6Va)(/u;c) = Д VaV6 - VbVa)a;c. (3.2.2) Согласно тем же самым аргументам, которые приведены выше при обсуждении операторов производных (см. (3.1.3)), мы можем заключить, что тензор (VaVb — V&Va)u;c в точке р зависит только от значений ис в р. Поэтому оператор (VaV& — VtVa) определяет линейное отображение из множества дуальных векторов в точке р во множество тензоров типа (0,3) в р; т.е. действует как тензор типа (1,3). Таким образом, мы показали, что существует тензорное поле Да&<Л такое, что для всех дуальных векторных полей ис получаем Va Vfea;c - VbVaa;c = Rabcd wd. (3.2.3) Rabc называется тензором кривизны Римана. Покажем сначала, что тензор Rabcd непосредственно связан с отклонением вектора от своего первоначального значения при параллельном переносе вдоль малой замкнутой кривой. Удобно сконструировать малую замкнутую петлю в точке р € М, выбирая двумерную поверхность 5, содержащую точку р, и выбирая координаты на этой поверхности t и s. (Для простоты координаты точки р можно положить равными (0,0).) Рассмотрим петлю, которая получается при сдвиге вдоль отрезка s = 0 на величину At, затем вдоль отрезка t = At на величину As, и затем назад на Д£ и As так, как показано на рис. 3.3. Пусть va - некоторый вектор в точке р (не обязательно касательный к 5). Перенесем его параллельно вдоль этой замкнутой петли. Проще всего вычислить изменение va при возвращении в точку р, полагая, что и;а - это произвольный дуальный вектор, и находя изменение скаляра
3.2. Кривизна 71 vauja при движении вдоль петли. Для малых At изменение 8\ для vaua вдоль первого отрезка пути имеет вид (3.2.4) (At/2,0) где производная, вычисленная в средней точке, обеспечивает нам то свойство, что это выражение является точным вплоть до второго порядка малости по величине смещения At. Мы можем переписать 8\ как Si = AtTbVb(vaua)\{At/2)0) = = AtvaTbS7bUa\(At/2,0), (3.2.5) где Ть - карательный вектор к отрезку петли s= const, причем TbVbVa= = 0 в соответствии с уравнением (3.1.16). Аналогичные выражения получаются для изменений #2, #з и #4, вычисленных вдоль других отрезков рассматриваемой петли. Объединяя два "Д£-приращения", 6\ и <5з, получаем в результате «1 + S3 = Д* KT6V6u;a|(At/2,o) - vaTbVbua\{bt/2As)} > (3-2.6) аналогично можно объединить J2 и ^ Так как член в скобках зану- ляется при As —> 0, то в первом порядке малости по At и As полное изменение величины vaua (и значит полное изменение величины va) равно нулю; т.е. параллельный перенос не зависит от выбора пути в первом порядке малости по At и As. Чтобы вычислить изменение величины vau>a во втором порядке малости, нужно оценить член в скобках в (3.2.6) в первом порядке малости. Мы выполним это с помощью следующей процедуры. Возьмем кривую t = At/2 и рассмотрим параллельный перенос va и TbVbVa вдоль этой кривой от (At/2,0) до {At/2, Аз). Вектор va в (At/2, As) в первом порядке по As равен параллельно перенесенному вдоль этой кривой вектору va в (Д£/2,0), поскольку, как уже показано, параллельный перенос не зависит от пути вплоть до первого порядка малости. С другой стороны, в первом порядке величина TbVbUa в (At/2, As) будет отличаться от аналогичной величины, полученной параллельным переносом из (At/2,0), на значение AsScVc(TbVbWa)i где Sc - касательный вектор к отрезкам петли t = const. Следовательно, член в скобках просто представляет собой эту величину, свернутую с va. Таким образом, во втором порядке По At и As мы получаем Si + <53 = -Д* AsvaScVc(TbVbua), (3.2.7) Si = At-^(vaua)
72 Глава 3. Кривизна причем мы можем оценить с той же точностью все тензоры в точке р. Добавляя аналогичные выражения для #2 и 8±, находим полное изменение величины vaua: 8(уаша) = AtAsva{TcVc(SbVbua)-ScVc(TbVbua)}>= = At As vaTcSb(VcVb - VfeVc)u;a = = AtAsvaTcSbRcbadud, (3.2.8) где во второй строке мы использовали тот факт, что координатные векторные поля Та и Sb коммутируют (см. конец разд. 2.2 и (3.1.2)), и на последнем шаге - определение тензора Римана (3.2.3). Но уравнение (3.2.8) выполняется для всех ша тогда и только тогда, когда полное изменение величины va (с точностью до второго порядка по At и As) имеет вид Sva = At As vdTcSbRcbda. (3.2.9) Это и есть желаемый результат. Он показывает, что тензор Римана действительно является мерой зависимости параллельного переноса от пути. Из определения (3.2.3) мы можем с помощью процедуры, полностью аналогичной выводу (3.1.14), выразить результат действия коммутатора операторов производных на произвольные тензорные поля через тензор Римана. Чтобы найти соответствующее выражение для векторного поля £а, мы рассмотрим дуальное векторное поле ша. Тогда, используя свойство 5 для оператора ковариантной производной, правило Лейбница и определение (3.2.3), мы найдем О = (VaVb - V6Va)(*cu,c) = = Va(u>cV6*c + tcVbuc) - Vb{ucVatc + tcVauc) = = cjc(VaV6 - VbVa)tc + *c(VaV6 - V6Va)u;c = = ojc(VaVb-VbVa)tc + tcudRabcd. (3.2.10) Таким образом, мы получаем (VaVb - V6Va)*c = -Rabdctd. (3.2.11) По индукции для произвольного тензорного поля TCl"Ckdl...dl находим к (VaV6 - V6Va)Tc- 'c*dl.,.dl = -^RabeCiTC>'e'-C*dl...dl + t=l I + X>a6d/TCl"CV.e...dr (3.2.12) 3=1
о 2. Кривизна 73 Установим далее четыре основных свойства тензора Римана: 1. Rabc = ~Rbac > (3.2.13) 2. %6c]d = 0, (3.2.14) 3. Для оператора ковариантной производной Va, естественно связанного с метрикой, т.е. Va&c = О Rabcd = -Rabdc, (3.2.15) 4. Выполняется тождество Бианки: V(ai?bc)de = 0. (3.2.16) Свойство 1 является тривиальным следствием определения (3.2.3) для Rabcd- Чтобы доказать свойство 2, заметим, что для произвольного дуального векторного поля иа и для любого оператора ковариантной производной Va выполняется соотношение V[aV6a;c] = 0. (3.2.17) Это уравнение мы можем доказать с помощью (3.1.14), подставляя обыкновенную производную да вместо Va и используя коммутативность обыкновенных производных и симметрию Ссаь — ^саЬ (см. (3.1.9)). (В обозначениях дифференциальных форм формула (3.2.17) гласит, что d2u; = 0 (см. прилож. В).) Таким образом, мы получаем 0 = 2V[aV6a;c] = V[aV6a;c] - V[6Vaa;c) = R[abc]dud (3.2.18) для всех ил, что доказывает свойство 2. Свойство 3 следует из уравнения (3.2.12), примененного к метрике gab. Мы находим, что 0 = (VaV6 - V6Va)gcd = Rabceged + Rabdegce = Rabcd + Rabdc, (3.2.19) что доказывает свойство 3. Из свойств 1, 2 и 3 следует, что тензор Римана также обладает следующим полезным свойством симметрии (см. задачу 3): Rabcd = Rcdab- (3.2.20)
74 Глава 3. Кривизна Наконец, чтобы доказать тождество Бианки, свойство 4, мы подействуем коммутатором операторов ковариантных производных на производную дуального векторного поля. Используя уравнение (3.2.12), получим (VaV6 - V6Va)Vca;d = RabceVeujd + flab/Vcu;/. (3.2.21) С другой стороны, мы имеем Va(V6Vca;d - VcV6a>d) = Уа(Д6с/ые) = ^eVai?6c/ + /?6c/Vau;e. (3.2.22) Выполняя антисимметризацию по индексам а, Ь и с в (3.2.21) и (3.2.22), обнаруживаем, что их левые части равны. Тогда приравнивая правые части, получаем R[abc)eVeVd + Rlab\d\fVc)Vf = "eV[ofl6c]de + i2[bc|rf,e Va]0^e, (3.2.23) где вертикальные линии указывают на то, что антисимметризация по d не проводится. Первый член в левой части последнего выражения зануляется по формуле (3.2.14), а вторые члены с обеих сторон сокращаются. Таким образом, для всех ше мы получаем "eV[aRbc)de = 0, (3.2.24) что доказывает свойство 4. Будет полезно разложить тензор Римана на "следовую" и "бесследовую" части. По свойствам антисимметрии 1 и 3 след тензора Римана, вычисленный по его первым двум или последним двум индексам, равен нулю. Однако его след по второму и четвертому индексам (или, что эквивалентно, по первому и третьему индексам) определяет тензор Риччи Rac'. Rac = Rabc • (3.2.25) По формуле (3.2.20) Rab удовлетворяет следующему свойству симметрии: Rac = Rca- (3.2.26) Скалярная кривизна R определяется как след тензора Риччи: Я = Даа. (3.2.27) "Бесследовая часть" называется тензором Вейля Cabcd и для многообразий размерности п ^ 3 определяется следующим уравнением: 2 / \ 2 Rabcd = Cabcd + ^^2 \^[cR^ ~ 8b[cRd\a) ~ , __ ^z _ у Rga[c8d]b' (3.2.28)
3.3. Геодезические 75 Тензор Вейля удовлетворяет свойствам симметрии 1, 2 и 3 тензора Ри- мана и является бесследовым по всем своим индексам. Также он имеет очень простое поведение при конформных преобразованиях метрики (см. прилож. D) и по этим соображениям его иногда называют конформным тензором. Свертка тождества Бианки (3.2.16) приводит к важному уравнению для Rab- Находим Vai?6cda + VbRcd - VcRbd = 0. (3.2.29) Поднимая с помощью метрики индекс d и выполняя свертку по Ь и d, мы получаем VaRca + VbRcb - Vci? = 0, (3.2.30) или VaGab = 0, (3.2.31) где Gab = Rab - \Rgab- (3-2.32) Тензор Gab называется тензором Эйнштейна. Он появляется в уравнениях Эйнштейна, поэтому дважды свернутое тождество Бианки (3.2.31) играет важную роль, обеспечивая непротиворечивость уравнений Эйнштейна (см. гл. 4 и 10). 3.3 Геодезические Полагаясь на интуицию, можно считать, что геодезические - это линии "искривленные настолько мало, насколько это возможно"; они являются "наиболее прямыми", какие только возможно представить в искривленной геометрии. Пользуясь заданным оператором ковариант- ной производной Va, определим геодезическую как кривую, у которой касательный вектор переносится параллельно самому себе, т.е. такую кривую, чей касательный вектор Та подчиняется уравнению TaVaTb = 0. (3.3.1) В действительности, чтобы наше интуитивное представление соответствовало понятию о кривой, которая "настолько прямая, насколько это возможно", достаточно потребовать только, чтобы касательный вектор кРивой указывал в том же направлении, что и он сам при параллель- ном переносе, а не требовать, чтобы его длина при этом сохранялась.
76 Глава 3. Кривизна Более слабое условие получается, если не требовать, чтобы касательный вектор не имел постоянной длины: гауаТ6 = аТЬ^ (3.3.2) где а - произвольная функция на кривой. Однако легко показать, что если первоначально была задана кривая, для которой выполнялось уравнение (3.3.2), то всегда можно переопределить параметризацию так, что будет выполняться уравнение (3.3.1) (см. задачу 5). Таким образом, мы можем без потери общности рассматривать только кривые, для которых выполняется условие (3.3.1). Параметризация, приводящая к уравнению (3.3.1), называется аффинной параметризацией. Соответственно, наше определение геодезической будет включать требование, что она является аффинно параметризованной. (Некоторые авторы применяют термин геодезическая к любой кривой, удовлетворяющей уравнению (3.3.2).) Мы сможем лучше понять природу уравнения геодезической, выписывая компоненты этого уравнения в координатном базисе. В координатной системе ф геодезическая отображается в кривую x^(t) в Rn. Согласно уравнению (3.1.14), компоненты Тм вектора Та в данном координатном базисе удовлетворяют уравнению ^ + J2 ^ovTaTv = 0. (3.3.3) В то же время из уравнения (2.2.12) следует, что компоненты Тм - это просто Т" = -5-. (3.3.4) Поэтому в координатном базисе уравнение геодезической принимает вид -^Г + ЕГ"-^-НГ=0. (3.3.5) <7,I/ Уравнение (3.3.5) представляет собой связанную систему п обыкновенных дифференциальных уравнений второго порядка для п функций x^(t). Из теории обыкновенных дифференциальных уравнений известно, что единственное решение (3.3.5) всегда существует при любых заданных начальных значениях х^ и dx^/dt. Это означает, что для любой точки р е М и любого касательного вектора Та € Vp всегда существует единственная геодезическая, проходящая через р в направлении Та. Отметим, что решения уравнений движения в классической
3,3. Геодезические 77 механике обладают тем же свойством: существует единственное решение при заданных начальных положениях и скоростях. Существование и единственность геодезических позволяет нам использовать их для построения координатных систем, очень удобных для некоторых вычислительных задач. Пусть р е М. Определим отображение, называемое экспоненциальным отображением, из касательного пространства Vp в М, ставя в соответствие каждому вектору Та € Vp точку из М, лежащую на геодезической, проходящей через р с касательным вектором Та, и отвечающую единичному значению аффинного параметра. Для больших Та геодезическая может встретить сингулярность до того, как аффинный параметр достигнет значения t = 1. Также геодезические могут пересекаться, нарушая тем самым взаимную однозначность экспоненциального отображения. Однако можно показать, что всегда существует (достаточно малая) окрестность вблизи нуля VPi для которой экспоненциальное отображение определено и взаимно однозначно (например, (Bishop, Crittenden 1964)). Поскольку Vn является n-мерным векторным пространством, мы можем отождествить его с Rn, а затем использовать экспоненциальное отображение, которое даст нам координатную систему, называемую римановыми нормальными координатами в точке р. Эти координаты обладают свойством, что все геодезические, проходящие через р, отображаются в прямые линии, проходящие через нуль Rn. Как следует из уравнения (3.3.5), в этой координатной системе компоненты T**av символа Кристоффеля обнуляются в точке р. Данный факт делает римановы нормальные координаты особенно полезными в том случае, когда проводятся вычисления в заданной точке. В случае, когда оператор ковариантной производной Va возникает из метрики gab, часто рассматривают другой тип координатной системы, называемый гауссовыми нормальными координатами, или синхронными координатами. Эти координаты особенно полезны для вычислений в ситуациях, когда задана выделенная гиперповерхность 5, т.е. (п— 1)-мерное вложенное подмногообразие n-мерного многообразия М (см. прилож. В). В каждой точке р £ S касательное пространство *р многообразия S может естественно рассматриваться как (п — 1)- мерное подпространство касательного пространства Vp многообразия М. Поэтому существует вектор па G Vp с однозначно определенным Направлением и произвольной длиной, ортогональный (по отношению к метрике gab) ко всем векторам из Vp. Этот вектор па называют нор- Мальным к 5. В случае римановой метрики па не может лежать в Vp\ ^Учае метрики с индефинитной сигнатурой п° может быть изотроп- Нь1м вектором, gabnanb = 0. При этом он лежит в Vp, и S называется
78 Глава 3. Кривизна Рис. 3.4. Построение нормальных гауссовых координат с началом на гиперповерхности 5. Геодезические, ортогональные к 5, в конце концов могут пересечься, но до этого пересечения нормальные гауссовы координаты корректно определены, и поверхности St постоянного времени t остаются ортогональными к геодезическим линиям изотропной гиперповерхностью в точке р. Если S нигде не является изотропной, то мы можем нормировать па условием gabnanb = ±1. Гауссовы нормальные координаты могут быть определены для любой неизотропной гиперповерхности следующим образом (рис. 3.4). Для каждой точки р € S мы строим единственную геодезическую, проходящую через р с касательным вектором па. Затем выбираем произвольные координаты (ж1,... ,xn_1) на (части) S и отмечаем каждую точку в окрестности (этой части) S параметром t вдоль геодезической, на которой она лежит, и координатами х1,...,хп"1 точки р G 5, из которой геодезическая выходит. Геодезические, выходящие из 5, могут со временем пересечься или попасть в сингулярную точку, однако в (достаточно малой) окрестности каждой точки р € S отображение q —► (ж1,..., xn~l, t) определяет нужную нам карту. Важное свойство, которым обладают гауссовы нормальные координаты, заключается в том, что геодезические остаются ортогональными ко всем гиперповерхностям St, определенным условием t = const. Для гиперповерхности So = S это утверждение верно по построению. Для того, чтобы доказать, что это свойство остается верным также для всех St, лежащих в области определения конструкции, достаточно показать, что поле векторов па, касательных к геодезическим, остается ортогональным ко всем полям векторов координатного базиса X*,...,Х%-\, порождающих касательное пространство к St- Обозначив через Ха любое из этих полей, мы получаем
3.3. Геодезические 79 nbS7b(naXa) = nanbVbXa = = naXbVbna = = \xbVb{nana) = = 0, (3.3.6) где первое равенство следует из уравнения геодезической, второе - из того факта, что па и Хь, будучи элементами координатного базиса на Л/, коммутируют, третье равенство следует непосредственно из правила Лейбница, и, наконец, последнее - из того факта, что условие нормировки папа = ±1 на S сохраняется при параллельном переносе, а значит, величина папа является постоянной на М. Так как паХа = 0 на 5, то (3.3.6) показывает, что это условие сохраняется также и вне S, что и следовало доказать. Еще одно свойство геодезических, соответствующих некоторому порожденному метрикой оператору производной, заключается в том, что они отвечают экстремуму длины кривой между двумя точками, измеренной с помощью данной метрики. Для гладкой (или просто дифференцируемой) кривой С на многообразии М с римановой метрикой gab длина I определяется как 1 = J\gabTaTb)1'2 &t, (3.3.7) где Та - касательный вектор к С и t - параметр кривой. Для метрики с лоренцевой сигнатурой —h H Ь кривая называется времениподобной, если длина ее касательного вектора всюду отрицательна, изотропной, если gabTaTb = 0; и пространственнопо- добной, если gabTaTb > 0. Длину пространственноподобных кривых можно определить формулой (3.3.7); длина изотропных кривых равна нулю; для времениподобных кривых мы изменим знак выражения под знаком квадратного корня и будем использовать термин собственное врелсл г вместо длины кривой: г = j {-gabTaTb)1'2 At. (3.3.8) Длина кривой, меняющейся от точки к точке от времениподобной к пРостранственноподобной, не определена. Отметим, что, поскольку картельный вектор геодезической переносится параллельно и, значит,
80 Глава 3. Кривизна его длина является постоянной, геодезические в лоренцевом многообразии не могут меняться от времениподобных к пространственнопо- добным или изотропным. Отметим также, что длина (или собственное время) кривой не зависит от способа ее параметризации. Определяя новую параметризацию s = s(t), мы получим новый касательный вектор 5° = (dt/ds)Ta и новую длину е = J [gabS«Sb]1/2 ds = J [g^T'T*]1/2 fgds = l. (3.3.9) Получим теперь условие, при котором длина кривой, заключенной между двумя точками, принимает экстремальное значение, т.е. найдем те кривые, чья длина не изменяется вплоть до первого порядка малости при произвольной гладкой деформации, оставляющей концевые точки фиксированными. Вычислим изменение длины кривой при малой деформации, выбрав некоторую систему координат и работая вЕп. (В гл. 9 мы повторим эти вычисления, не вводя координат, а также вычислим вторую вариацию длины кривой.) Для определенности рассмотрим пространственноподобную кривую. Записывая (3.3.7) в координатном базисе, получаем Ь Г I1/2 Л \^ё^ Л dt\ ( dt, (3.3.10) где С(а) = р и C(b) = q - концевые точки кривой. Задача нахождения экстремума / с математической точки зрения идентична задаче нахождения экстремума действия в лагранжевой механике. Для вариации I получаем 61 -f Ja 2-rV a dt -1/2 1 y> dgap „dx^dxM 2 2^ dx" X dt dt j a,0 dt. dxa d(6x0) 0 dt dt (3.3.11) Без потери общности (так как длина не зависит от выбора параметризации) мы можем полагать, что исходная кривая была параметризована таким образом, что гг^гы, , v^ dx"dx" W
3.3. Геодезические 81 При таком выборе параметризации условие экстремума принимает вид (При интегрировании по частям граничные члены не появляются, потому что 6х& обнуляется в концевых точках.) Уравнение (3.3.12) в случае произвольных 5х& выполняется тогда и только тогда, когда -2^^-^-2г-а^-^-5Г + 2^"9^"'5Г"НГ = а (3'313) ос a,A a,A С учетом (3.1.25) для Гаа\, мы видим, что (3.3.13) представляет собой уравнение геодезической (3.3.5). (Если бы мы не выбрали параметризацию gabTaTb = 1 для С, то получили бы уравнение геодезической в форме (3.3.2).) Таким образом, длина кривой с фиксированными концевыми точками принимает экстремальное значение тогда и только тогда, когда эта кривая геодезическая. Аналогичные рассуждения показывают, что кривые с экстремальным значением собственного времени между двумя точками представляют собой времениподобные геодезические. Из этих же рассуждений следует, что уравнение геодезической (с аффинной параметризацией) можно получить, варьируя лагранжиан £ = E^-5"S- (3314) Во многих случаях наиболее эффективный способ вычисления символов Кристоффеля Т^аи в заданном координатном базисе состоит в том, что для лагранжиана (3.3.14) выписываются соответствующие уравнения Эйлера-Лагранжа и далее, путем сравнения с (3.3.5), определяются компоненты Т^аи. На многообразии с римановой метрикой всегда можно найти кривые с произвольно большой длиной, связывающие две любые точки. В то же время длина является ограниченной снизу, и кривая наименьшей длины, связывающая две точки (предполагаем, что нижняя граница длины достижима), с необходимостью представляет экстремальное значение длины, являясь, таким образом, геодезической. Следовательно, кратчайший путь между двумя точками всегда оказывается
82 Глава 3. Кривизна "самым прямым путем из всех возможных". Однако данная геодезическая, связывающая две точки, не является обязательно кратчайшим путем между ними. Например, если на многообразии с лоренцевой метрикой выбраны две точки, которые можно соединить времениподобной кривой, то всегда можно найти времениподобные кривые со сколь угодно малым собственным временем, связывающие эти точки (см. рис. 9.5 гл. 9). В некоторых пространственно-временных многообразиях собственное время времениподобных кривых, связывающих две данные точки, не является обязательно ограниченным сверху; однако, если кривая наибольшего собственного времени существует, она обязана быть времениподобной геодезической. Повторим, однако, еще раз, что данная геодезическая необязательно имеет максимальное собственное время между двумя точками. В гл. 9 мы введем понятие сопряженных вдоль геодезической точек и покажем, что их отсутствие является необходимым и достаточным условием для того, чтобы геодезическая представляла локальный максимум собственного времени (или, в случае риманова многообразия, локальный минимум длины) между двумя точками. Последняя задача этого параграфа состоит в выводе уравнения девиации геодезических, т.е. уравнения, описывающего присущую геодезическим тенденцию ускоренно сближаться или расходиться в зависимости от кривизны многообразия. Это исследование приведет нас к новой характеристике кривизны, а также сыграет важную роль в понимании уравнений Эйнштейна (см. разд. 4.3) и аргументов, относящихся к теоремам о сингулярностях (см. гл. 9). Пусть 7s (t) - гладкое однопараметрическое семейство геодезических (см. рис. 3.5), т.е. для каждого s e Ш кривая 7s является геодезической (параметризованной аффинным параметром t) и отображение (t,s) —► 7s(t) - гладкое взаимнооднозначное с гладким обращением. Пусть Е обозначает двумерное подмногообразие, заметаемое кривыми 7s (t). Мы можем выбрать s и t в качестве координат на Е. Векторное поле Та = (d/dt)a является касательным к семейству геодезических и, следовательно, подчиняется уравнению TaVaTb = 0. (3.3.15) Векторное поле Ха = (d/ds)a представляет собой смещение к бесконечно близкой геодезической и называется вектором девиации. Существует определенная "калибровочная свобода" в выборе Ха в том смысле, что Ха меняется с изменением Та при замене аффинной параметризации геодезических 7s(£)» t —> t' = b(s)t + c(s) (см. задачу 5). Стоит отметить, что в том случае, когда геодезические образуют-
3.3. Геодезические 83 I Рис. 3.5. Однопараметрическое семейство геодезических 7а с касательной Та и вектором девиации Ха ся с помощью оператора производной, ассоциированного с метрикой gob, Ха всегда можно выбрать ортогональными к Та. А именно, перемасштабируя t с помощью зависящего от s множителя, мы можем обеспечить, чтобы величина gabTaTb (автоматически являющаяся константой вдоль каждой геодезической) не зависила от s. Так как Ха и Т° представляют собой координатные векторные поля, то они коммутируют: TbVbXa = X6V6Ta, (3.3.16) поэтому с помощью таких же вычислений, как в (3.3.6), можно убедиться, что ХаТа является константой вдоль каждой геодезической. Переопределяя параметризацию каждой 7s (t) путем добавления константы (зависящей от s) к ty мы можем добиться, чтобы кривая C(s), состоящая из точек с t = 0, была ортогональна всем геодезическим. Таким образом, при такой аффинной параметризации 7s(t) мы получаем, что ХаТа = 0 в точке t = 0 и, следовательно, ХаТа = 0 везде. Величина va = TbVbXa определяет скорость изменения вдоль геодезической величины смещения к бесконечно близкой геодезической. Поэтому мы можем интерпретировать va как относительную скорость бесконечно близкой геодезической. Аналогично, величину аа = TcVcva = TCVC (T6V6Xa), (3.3.17) можно интерпретировать как относительное ускорение бесконечно близкой геодезической в семействе геодезических. Получим теперь
84 Глава 3. Кривизна уравнение, связывающее аа с тензором Римана. Для этого запишем аа = TcVc(TbVbXa) = = TcVc(XbVbTa) = = (TcVcXb)(VbTa) + XbTcVcVbTa = = (XcVcTb)(V6Ta) + XbTcVbVcTa - RcbdaXbTcTd = = XcVc{TbVbTa) - RcbdaXbTcTd = = -RcbdaXbTcTd. (3.3.18) (3.3.18) известно как уравнение девиации геодезических. С его помощью мы можем увидеть еще одну характеристику кривизны, а именно, для всякого семейства геодезических условие аа = 0 выполняется тогда и только тогда, когда Rabcd = 0. Таким образом, геодезические будут ускоренно сближаться или расходиться (и, в частности, первоначально параллельные геодезические, т.е. такие, у которых первоначально va = TbVbXa = 0, перестанут быть параллельными) тогда и только тогда, когда Rabcd Ф 0. 3.4 Методы вычисления кривизны В разд. 3.2 мы пришли к определению тензора Римана в ходе доказательства существования тензорного поля, удовлетворяющего уравнению (3.2.3) для всех дуальных векторных полей ша. Однако аргументы, приведенные в пользу существования такого поля, не говорят прямо, как вычислить Rabcd, зная метрику gab. Поскольку умение вычислять кривизну является ключевым фактором при решении уравнений Эйнштейна общей теории относительности, мы посвятим этот раздел методам вычисления тензора Rabc • 3.4.1 Координатный метод Чтобы вычислить кривизну координатным методом, мы начнем с выбора системы координат. Далее, выразим оператор ковариантной производной Va через обычные производные да в этой системе координат и выпишем компоненты символа Кристоффеля Гсаь так, как это было показано в разд. 3.1. Для дуального векторного поля иа получаем V6a;c = дьис - Ydbcu>d, (3.4.1) и, таким образом, VaV6o;c = да(дьис - Tdbcud) -
о 4. Методы вычисления кривизны 85 - Геаб(део;с - rdeca;d) - - Геас(дьше - rd6ea;d). (3.4.2) Следовательно определение (3.2.3) можно представить как Rabcd(*d = [-2a[ard6]c + 2rec[ord6]e]a;d. (3.4.3) При выводе последнего выражения нами использована коммутативность обычных производных и свойство симметрии символа Кристоф- феля Гсаь (3.1.9). Так как уравнение (3.4.3) справедливо для всех и^ мы можем "сократить" ид в обеих частях, чтобы найти требуемую формулу для Rabc • Подставляя в нее компоненты тензоров в координатном базисе, ассоциированном с выбранной системой координат, мы получаем следующую формулу ^ир = Ъх" **р ~~ Ъх» ир ~*~" ai/ — Г ирТ QM), (3.4.4) a в которой обычные производные понимаются как частные производные компонент по координатам. Таким образом, для вычисления Rabcd в метрике gab сначала находим компоненты метрики gMI/ в заданном координатном базисе. Затем вычисляем компоненты Гам„ по формуле (3.1.25) (или выводим их из компонент уравнения геодезической (3.3.5), полученного из лагранжиана (3.3.14)). Наконец, вычисляем компоненты R^upa по формуле (3.4.4). Далее, компоненты тензора Риччи можно получить сверткой уравнения (3.4.4): Rpp — 2^R\ivp — - £ дх-г^р дх» У?1""') 5> r^-r^rV). (3.4.5) Укажем несколько фактов, полезных для вычислений в координатам базисе. Мы можем представить компоненты метрики gM„ в задан- н°м базисе в виде матрицы. Тогда компоненты f*iV обратной метрики ™* будут представлять собой элементы матрицы, обратной к (gMI/). **ведем обозначение g для определителя (gM1/) g = det(gtlu). (3.4.6)
86 Глава 3. Кривизна Тогда собственный элемент объема на многообразии М, индуцированный метрикой gab, имеет вид ^/(gfdx1.. .dxn (см. прилож. В). Для свернутого символа Кристоффеля Г°а5 можно получить простую формулу. Из уравнения (3.1.25) следует Используя формулу для обратной матрицы, нетрудно показать, что V,(X ° Таким образом, мы получаем Г,»-И£?-Я;'-Л1- (3.4.9, Это полезная формула, поскольку Гааь появляется в выражении для тензора Риччи Rab, а также в формуле для дивергенции произвольного векторного поля Та, записанной в координатном виде. В самом деле, с учетом (3.4.9), мы имеем VaT° = даТа + ГааЬТь = - ^ш^Шт'у <3-4Л0) У координатного метода есть преимущество: он обеспечивает непосредственную механическую процедуру для вычисления кривизны. Обычно метрика задается своими компонентами в координатном базисе, поэтому все, что нам необходимо делать, чтобы получить кривизну, это вычислить частные производные и суммировать их по формулам (3.1.25) и (3.4.4). С другой стороны, даже в простейших случаях эти непосредственные вычисления оказываются чрезвычайно трудоемкими, а " негеометрическая" природа таких вычислений часто затрудняет поиск алгебраических ошибок. 3.4.2 Метод ортонормированного базиса (тетрады) Несмотря на то, что координатный метод имеет преимущество, обеспечивая непосредственную процедуру вычисления Va и Даб<Л ДОЯ многих задач тензорного исчисления более удобным оказывается использование ортонормированного базиса. Отметим, что координатный
о 4. Методы вычисления кривизны 87 базис {д/дх^} не является ортонормированным, за исключением тривиального случая плоского пространства-времени в декартовых координатах. Таким образом, мы можем ввести "неголономный", т.е. некоординатный ортонормированный базис, составленный из гладких векторных полей (ем)а, удовлетворяющих условию Ы'Ыа = 77^, (3.4.11) где fy«/ = diag(-l,...,-l,l,...,l). (Здесь греческие индексы /i и и принимают значения 1,..., п и нумеруют базисные компоненты; а латинский а представляет индексное обозначение, указывающее лишь, что ем - это вектор.) В четырехмерном пространстве-времени, а иногда и в случае большей размерности, {(ем)а} называется тетрадой. Следствием условия (3.4.11) является полезное соотношение ]Г»ГЫа(е„)ь = <50ь, (3-4.12) где 5аь - это тождественное отображение, и rfv - обратная матрица для t^i/ (такая, что rfv = 77^). Чтобы доказать справедливость (3.4.12), достаточно убедиться, что его свертка с произвольным базисным вектором (еа)ь дает верное равенство. Поскольку процедура вычисления кривизны тетрадным методом существенно отличается от аналогичной процедуры координатного метода, здесь будет полезно указать три ключевых свойства, которые необходимо учитывать при вычислении кривизны метрики. (1) Оператор ковариантной производной согласован с метрикой, т.е. Vaft>c = = 0. (2) Оператор ковариантной производной не имеет кручения (свойство 5 разд. 3.1). (3) Тензор Римана определяется оператором ковариантной производной с помощью (3.2.3). В координатном методе: свойство (2) выражается формулой (3.1.9), свойство (1) (при условии (2)) - формулой (3.1.29), свойство (3) - формулой (3.4.4). Как будет показано ниже, свойства (1) и (2) можно выразить совсем по-иному, если использовать ортонормированный базис. Начнем с определения 1-форм связности a;a/iI/ как иа^ = Ы6УаЫ6. (3.4.13) Компоненты а>д/л/ 1-формы ujafXl/ называются коэффициентами вращения Риччи: "Ад, = (ел)аЫьУ0(е„)ь. (3.4.14) ^фтонормированность векторов {(ем)а} приводит к t*Vi/ = (ем) Va(e„)b =
88 Глава 3. Кривизна = -(e,)6Va(e/i)b = = -(-/«„„, (3.4.15) где использована согласованность метрики Vag6c = 0. И наоборот, из уравнений (3.4.15) и (3.4.11) следует Vag6c = 0. Таким образом, в ортонормированием базисе свойство (1) принимает простой вид <*Vi/ =a;ai/M- (3.4.16) (Заметим, что симметрия тензора Таци, наоборот, следует из свойства (2).) Сравнивая свойство антисимметрии коэффициентов вращения Риччи со свойством симметрии символов Кристоффеля, мы можем сделать вывод о значительном преимуществе тетрадного подхода: действительно, всего имеется п2(п +1)/2 (=40 при п = 4) компонент ГАД1/ и только п2(п — 1)/2 (=24 при п = 4) компонент ш\^у. Тензор Римана можно выразить через коэффициенты вращения Риччи следующим образом. Компоненты Rabcd в нашем ортонормированием базисе имеют вид iW = flebaf(eP)e(e<r)b(eM)c(ei,)d = = (eP)a(ea)b(e/i)c(VaV6-VbVa)(el/)c. (3.4.17) В то же время мы имеем ЫсУаУ6Ыс = Va {McVb(e„)c} - [Va(eM)c] [Уь(е„)с], (3.4.18) и кроме того, [Va(eM)c][V6(eI/)c] = [Va(eM)^]5c/[Vb(el/)c] = (3.4.19) Таким образом, из определения 1-формы связности (3.4.13) получаем ~ Y1 ^ [МарцМЬаи - ^6/3/x^aai/] } • (3.4.20) Мы можем переписать соотношение (3.4.20) через коэффициенты вращения Риччи следующим образом: Rpop.v = {ep)aVa^<Ttiv - {eoYVaUpnv - " Z2 ^ {Up&pVocLV - UappUpoiV + UpQaUan» " ^afip^aiiv) » (3.4.21)
3.4. Методы вычисления кривизны 89 где последние два члена компенсируют компоненты watll/ внутри производных в первых двух членах. Поскольку иа/ли - скаляр, то кова- риантную производную Va в (3.4.21) можно заменить обычной производной да. Таким образом, (3.4.21) говорит нам, как выразить тензор кривизны через wa\iw И наконец, компоненты тензора Риччи можно вычислить по формуле Rp» = J2ri<TI/Rpw (3.4.22) Формула (3.4.20) или формула (3.4.21) являются законченными выражениями свойства (3) для вычисления кривизны. Следовательно в этом подходе нам осталось только выразить свойство (2) (т.е. сформулировать для Va условие отсутствия кручения). Существуют две различные процедуры для этого. Первая начинается с замечания, что условие отсутствия кручения позволило нам выразить коммутатор двух векторных полей через оператор ковариантной производной Va уравнением (3.1.2). И наоборот, из того, что уравнение (3.1.2), в котором индексы понимаются как базисные, выполняется для любого векторного поля, следует, что оператор ковариантной производной Va не имеет кручения. Таким образом, мы можем выразить свойство (2) в форме коммутационных соотношений для базисных векторных полей: (e<,)a[eM,e„Je = {ea)a {M6V6(e„)a - (e,)bV6(e/1)a} = ш^у -шУ911. (3.4.23) Это дает п2(п — 1)/2 уравнений, решение которых позволяет найти Мощ, (см. задачу 8). Чтобы получить альтернативную процедуру, заметим, что из определения 1-формы связности следует V(a(Ob] = ^гГМаШЦм (3.4.24) что можно проверить, сворачивая выражение (3.4.24) с произвольными базисными векторами (ер)а(ел)6. Однако условие отсутствия кручения подразумевает, что антисимметризованная производная 1-формы не зависит от оператора ковариантной производной, поэтому последний можно заменить обычной производной да: д[аЫь] = £^И^)[а"б]^. (3.4.25)
90 Глава 3. Кривизна И наоборот, справедливость уравнения (3.4.25) для всех базисных векторов означает, что Va не имеет кручения. Таким образом, уравнение (3.4.25) является альтернативным (3.4.23) выражением свойства (2). Уравнения (3.4.20) и (3.4.25) можно записать более элегантно с использованием дифференциальных форм (см. прилож. В). Для этого давайте отбросим дуальный векторный индекс а у иа1хи и (е^)а и используем жирный шрифт для обозначения форм. Для удобства также поднимем и опустим греческие индексы базиса с помощью tfv и t]^v. В результате получим ^ = Zy*<*W (3-4-26) а В обозначениях дифференциальных форм уравнение (3.4.25) теперь принимает вид dea = 5^eMAw^. (3.4.27) Кроме того, уравнение (3.4.20) можно записать как Я/ = do;/ + J2 <V* л "«". (3-4-28) a где Ир» суть 2-форма, соответствующая ЯаЬци- Уравнения (3.4.27) и (3.4.28) иногда называют уравнениями структуры. Итак, мы получили две основные процедуры для вычисления кривизны в ортонормированных базисах. В первой процедуре реализуется подход, в котором коэффициенты вращения Риччи непосредственно находятся из решения коммутационных соотношений (3.4.23) и затем подставляются в уравнение (3.4.21). Второй подход - впервые обсуждавшийся Мизнером (Misner 1963) в контексте вычислений в общей теории относительности - использует уравнение (3.4.27) (=(3.4.25)) для определения 1-форм связности, с помощью которых кривизну можно получить из уравнения (3.4.28) (=(3.4.20)). Главное преимущество второго подхода заключается в относительной простоте вычисления левой части уравнения (3.4.27). В простых случаях оказывается возможным угадать решение для иа^ и без вычислений. При этом удается избежать большой работы, такой, которая требуется для решения уравнения (3.4.23), или, что еще труднее, для вычисления ГаМ1/. Мы проиллюстрируем это в гл. 6. Заметим, что в обоих подходах, прежде чем начинать вычисления, мы сначала должны ввести систему координат. Цель тетрадного метода состоит не в том, чтобы избежать
о 4. Методы вычисления кривизны 91 введения системы координат, а в том, чтобы использовать среди прочих координатных базисов тот, в котором наиболее удобно выполнять разложение тензоров. Вариант подхода, использующего непосредственные вычисления, был развит Ньюманом и Пенроузом (Newman, Penrose 1962). (Этот подход был мотивирован спинорными методами (см. гл. 13) и специально адаптирован для случая четырехмерной лоренцевой метрики.) Вместо выбора ортонормированного базиса при этом выбирается "изотропная тетрада", состоящая из двух изотропных векторов 1а и п°, таких, что 1апа = — 1; базис дополняется выбором двух ортонормиро- ванных пространственноподобных векторов ха и ?/а, ортогональных к Iе и па, и определением комплексного вектора та = (ха + iya)/y/2. Аналогами 24 вещественных коэффициентов вращения Риччи орто- нормированной тетрады являются 12 комплексных величин, называемых спиновыми коэффициентами. Они связаны с изотропной тетрадой аналогом уравнения (3.4.13); кривизна выражается через спиновые коэффициенты по аналогии с уравнением (3.4.21). Получена точная форма соответствующих уравнений (Newman, Penrose 1962; Pirani 1965). Подход Ньюмана-Пенроуза доказал свою эффективность при решении многих задач общей теории относительности. Какой метод - координатного базиса, ортонормированного базиса, или изотропной тетрады - следует использовать для вычислений? Нет универсального ответа. Во многих простых случаях подход ортонормированного базиса, использующий уравнения (3.4.27) и (3.4.28), требует значительно меньших усилий по сравнению с другими, при условии, что удается решить уравнение (3.4.27) для 1-форм связности. В тех случаях, когда изотропный вектор играет геометрически значимую роль, особенно в алгебраически специальных пространствах- временах (см. гл. 7), подход Ньюмана-Пенроуза является, вероятно, наиболее полезным. Кроме того, в некоторых случаях высокой симметрии удается построить адаптированную с учетом симметрии систему координат, в которой метод координатного базиса оказывается предпочтительным. Наконец, в общем случае, в отсутствие симметрии или геометрически предпочтительных векторов, способных выполнять роль естественного базиса, все методы одинаково трудоемки. В заключение отметим, что в этом разделе мы представили координатный и тетрадный методы вычисления тензора Римана для данной метрики. Однако полученные уравнения в равной степени применимы и в более часто встречающейся ситуации, когда тензор кривизны является заданным (например, уравнениями Эйнштейна, как обсуждается в следующей главе), и мы хотим найти метрику. Более того,
92 Глава 3. Кривизна даже в тех случаях, когда мы не собираемся вычислять кривизну или определять метрику, полученные выше уравнения обеспечивают нас полезными соотношениями между метрикой и ее кривизной, особенно если хорошо адаптировать систему координат или тетраду к свойствам рассматриваемого пространства-времени. Задачи 1. Пусть свойство 5 (условие "отсутствие вращения") удалено из определения оператора ковариантной производной в разд. 3.1. (a) Покажите, что существует тензор ТсаЬ (называемый тензором вращения), такой, что для всех гладких функций / мы имеем v0vb/-vbve/ = -Tcobvc/. (Указание: повторите вывод уравнения (3.1.8), полагая, что оператор ковариантной производной Va не имеет кручения.) (b) Покажите, что для произвольных гладких векторных полей Ха и Ya мы имеем TcabXaYb = XaVaYc - YaVaXc - [Х,У]С. (c) Для данной метрики gab покажите, что существует единственный оператор ковариантной производной Va с кручением Т саЬ, такой, что Vcgab = 0. Получите аналог уравнения (3.1.29), выразив оператор ковариантной производной через обычные производные да тензора ТсаЬ. 2. Пусть М - многообразие с метрикой gab и ассоциированным оператором ковариантной производной Va. Решение уравнения VaVaa = 0 называется гармонической функцией. Рассмотрим случай, когда М - двумерное, будем полагать, что а - гармоническая функция. Пусть еаь - антисимметричное тензорное поле, удовлетворяющее условию еаьеаЬ = 2(—l)s, где s - это число минусов в сигнатуре метрики. Рассмотрим уравнение Va@ = = €a6Vba. (а) Покажите, что условия интегрируемости (см. задачу 5 гл. 2, или прилож. В) для этого уравнения выполняются и, следовательно, решение /3 локально существует. Покажите, что /?
4. Методы вычисления кривизны 93 также гармоническая, т.е. VaVa/? = 0. (/? называется гармонической функцией, сопряженной с а.) (Ь) Покажите, что если выбрать а и /? в качестве системы координат, то метрика примет вид ds2 = ±Q2(a,/?)[da2 + (-l)sd/32]. (a) Покажите, что Rabcd = Rcdab- (b) В n-мерном случае тензор Римана имеет п4 компонент. Однако, с учетом симметрии (3.2.13), (3.2.14) и (3.2.15), не все эти компоненты независимы. Покажите, что число независимых компонент п2(п2 — 1)/12. 3. (а) Покажите, что в двумерном случае тензор Римана принимает вид Rabcd = Rga[c8d\b- (Указание: используйте результат задачи 3(b), чтобы показать, что величины ga[c£d]6 составляют векторное пространство тензоров, обладающих симмет- риями тензора Римана.) (Ь) Используя аналогичные аргументы, покажите, что в трехмерном случае тензор Вейля тождественно равен нулю; т.е. при п = 3 уравнение (3.2.28) выполняется при Cabcd = 0. 4. (а) Покажите, что любую кривую, чей касательный вектор удовлетворяет уравнению (3.3.2), можно параметризовать заново таким образом, чтобы выполнялось уравнение (3.3.1). (Ь) Пусть t - аффинный параметр геодезической 7- Покажите, что все другие аффинные параметры этой геодезической принимают вид at + 6, где а и Ь постоянные. 5. Метрика евклидового пространства R3 в сферических координатах имеет вид ds2 = dr2 + r2(d02 + sin2 в dip2) (см. задачу 8 гл. 2). (a) Вычислите компоненты символа Кристоффеля Г^„ в этой системе координат. (b) Выпишите компоненты уравнения геодезической в этой системе координат и проверьте, что решения соответствуют прямым линиям в декартовых координатах. 6. Как было сказано в задаче 2, произвольную лоренцеву метрику на двумерном многообразии всегда можно локально представить в форме ds2 = П2(х,£)[—d£2 + da:2]. Вычислите тензор кривизны Римана этой метрики: (i) координатным методом из разд. 3.4.1, (ii) тетрадным методом из разд. 3.4.2.
94 Глава 3. Кривизна 7. Используя антисимметрию иа^и относительно // и и (см. формулу (3.4.15)), покажите, что u>A/xi/ = Ъш^и) - 2и7[Д1/]Л. Используйте эту формулу вместе с уравнением (3.4.23), чтобы найти u\fxu в терминах коммутаторов (или антисимметризован- ных производных) ортонормированных базисных векторов.
Глава 4 Уравнения Эйнштейна В этой главе мы представим математически точную постановку идей, в общих чертах описанных во введении. Начнем с объяснения элементарных понятий геометрии пространства и тензорного характера физических законов по отношению к пространству в дорелятиви- стской физике. Последующее обсуждение специальной теории относительности будет полностью аналогично предыдущему, с заменой термина "пространство" на термин "пространство-время". Нашей следующей (и наиболее важной) задачей будет формулировка общей теории относительности и обеспечение мотивации для вывода уравнения Эйнштейна, которое связывает геометрию пространства-времени с распределением материи во Вселенной. Наконец, мы будем изучать общую теорию относительности в пределе слабой гравитации. Мы покажем, что в соответствующих обстоятельствах общая теория относительности воспроизводит предсказания теории гравитации Ньютона. Мы также покажем, что в общей теории относительности гравитация имеет динамические степени свободы, которые могут возбуждаться движением вещества, т.е. общая теория относительности предсказывает существование гравитационного излучения. 4.1 Геометрия пространства в дорелятивистской физике. Общая и специальная ковариантность. В дорелятивистской физике предполагается, что пространство имеет строение многообразия R3. Далее допускается, что связь точек пространства с элементами (ж1, ж2, ж3) из R3 может быть естественным способом достигнута путем конструирования "жесткой прямоугольной Решетки" из мерных стержней. Координаты получающегося таким образом пространства известны под названием декартовых координат. Многие различные системы жестких решеток (т.е. многие декартовы системы координат) являются допустимыми; их можно особым образом поставить во взаимно однозначное соответствие с элементами ^"Параметрической группы вращений и трансляций пространства R3. Поэтому декартовы координатьГ (ж1, ж2, ж3) точки в пространстве сами
96 Глава 4. Уравнения Эйнштейна по себе не имеют какого-либо внутреннего смысла. Однако расстояние D между двумя точками, х и х, определенное в терминах декартовых координат соотношением D2 = (х1 - х1)2 + (х2 - х2)2 + (х3 - х3)2, (4.1.1) не зависит от выбора самой декартовой координатной системы и, таким образом, может рассматриваться как описывающее внутреннее свойство пространства. Эта формула расстояния между двумя точками приводит к понятию метрики пространства hab (в смысле разд. 2.3) следующим образом. Согласно (4.1.1) расстояние между двумя "близко расположенными" точками равно (SD)2 = (6х1)2 + {6х2)2 + (<Jx3)2. (4.1.2) Это предполагает, что метрика пространства дается выражением (в обозначениях (2.3.10)) ds2 = (dx1)2 + (dx2)2 + (dx3)2, (4.1.3) или, в индексных обозначениях, в декартовом координатном базисе имеем Лаб = ^мЛ^а^Чб, (4.1.4) где hpU = diag(l, l, 1). Это определение каь не зависит от выбора декартовой системы координат; т.е. такое же тензорное поле каь могло бы получиться, если бы мы выбрали другую декартову систему координат. Исследуем геометрию, определенную с помощью (4.1.4). Так как компоненты метрики в декартовом координатном базисе являются константами, то обычный оператор дифференцирования в этой системе координат удовлетворяет уравнению dahbc = 0. (4.1.5) Следовательно, эта обычная производная является оператором кова- риантного дифференцирования, связанным с hab, и, таким образом, в этой системе координат все компоненты Г%с обращаются в нуль (что также можно увидеть непосредственно из (3.1.25)). Поскольку частные производные коммутируют на всех тензорах посредством (3.2.3), то кривизна исчезает, т.е. метрика %аь является плоской. Согласно (3.3.5)
4.1. Геометрия пространства в дорелятивистской физике 97 пространственные геодезические являются в точности такими кривыми, которые, будучи выражены в декартовых координатах, представ^ ляют собой "прямые линии", т.е. такие кривые, декартовы координаты которых линейно зависят от аффинного параметра. Следовательно, существует единственная геодезическая, соединяющая любую пару точек, и длина этой геодезической, согласно (3.3.7), выражается соотношением (4.1.1). Таким образом, наша метрика (4.1.4) воспроизводит формулу расстояния, которая сама послужила для определения метрики. Итак, наши предположения о пространстве в дорелятивистской физике привели к утверждению, что пространство является многообразием R3, допускающим плоскую риманову метрику. Наоборот, допуская, что пространство представляет собой R3 с плоской римановой метрикой, мы можем вывести все наши начальные предположения. Можно использовать геодезические плоской метрики, чтобы построить декар- тову систему координат, используя тот факт, что изначально параллельные геодезические линии остаются параллельными ввиду отсутствия кривизны. Формула расстояния (4.1.1) будет оставаться в силе, и следовательно, чтобы построить "жесткую прямоугольную решетку", можно монтировать мерные стержни на декартовы координатные линии. Таким образом, все, до сих пор сказанное в этом разделе, заключается утверждением: пространство является многообразием R3 с определенной на нем плоской римановой метрикой. Рассмотрим теперь физически интересные величины в пространстве. Во всех физических экспериментах измеряют числа, так что все физические величины должны быть в конечном счете представлены числами. Однако многие величины, интересные с физической точки зрения, например, магнитное поле или тензор напряжений, упомянутые в начале разд. 2.3, чтобы быть представлеными в виде чисел, требуют дополнительной спецификации базиса векторов. Самым общим классом величин, представляющих интерес, являются отображения векторов и дуальных векторов в числа. Так как любое аналитическое отображение может быть расширено по Тейлору как сумма мульти- линейных отображений, мы видим, что тензорные поля, т.е. мульти- линейные отображения векторов и дуальных векторов в числа, представляют собой чрезвычайно широкий класс величин. Действительно, °бщность математической категории тензорных полей оказалась достаточно велика для того, чтобы практически все величины1, которые Рассматриваются в физике, могли быть представлены как тензорные Спинорные поля возникают в физике и включают в себя более широкий класс ъвктов, чем тензорные поля; см. гл. 13.
98 Глава 4. Уравнения Эйнштейна поля. Законы физики, управляющие этими величинами, могут быть выражены тензорными уравнениями, т.е. равенствами между тензорными полями, определенными на пространстве. К формулировке физических законов дорелятивистского описания пространства, а также в специальной и общей теории относительности применяется важнейший принцип, именуемый общая ковариантность. Принцип общей ковариантности в этом контексте утверждает, что метрика пространства есть единственная величина, подходящая для описания пространства, которая может появиться в физических законах. Подробнее: в любом законе физики нет выделенных векторных полей или их предпочтительных базисов, относящихся только к структуре пространства. Эта идея играет важную роль в мотивации формулировки специальной и общей теории относительности, но принцип довольно неясный, поскольку фраза "относящийся к пространству" не имеет точного значения. В истории физики имела место длительная дискуссия о тензорной природе физических законов и принципе общей ковариантности, так что здесь нелишне отметить ее итоги среди других формулировок этих идей. В многочисленных формулировках физических законов предполагается, что координатная система уже выбрана и физические уравнения записаны в компонентной форме с использованием координатного базиса. (Отметим, что, с нашей точки зрения, это уже предполагает, что законы физики представлены тензорными уравнениями.) Теперь, если наша формулировка общей ковариантности была бы опровергнута, скажем, существованием привилегированного векторного поля va, тогда стало бы возможным адаптировать координатную систему к этому векторному полю таким образом, чтобы, скажем, (д/дх1)а = va. Если бы мы записали компоненты физического уравнения в такой адаптированной координатной системе без точного включения va в это уравнение, а просто подставляя всюду компоненты вектора Vм = (1,0, ...,0), то мы бы, конечно, нашли, что форма уравнения не сохраняется, когда мы делаем координатное преобразование, которое нарушает наше условие (д/дх1)а = va. Следовательно, при таком толковании можно было бы прийти к выводу, что в рассмотренном примере уравнения не сохраняют своей формы при общих координатных преобразованиях. Более того, можно было бы заключить, что уравнения не тензорные, так как их компоненты не подчиняются преобразованию (2.3.8) при преобразованиях координат. Однако, с нашей точки зрения, нетензорную природу уравнений можно отнести на счет неудачи точного включения дополнительной геометрической структуры в уравнение. Если это включение все же сделано, то уравне-
4.1. Геометрия пространства в дорелятивистской физике 99 ния будут иметь тензорный характер, но наша формулировка принципа всеобщей ковариантности нарушиться появлением дополнительных величин, относящихся к пространству. Хорошим примером применения принципа общей ковариантности, который иллюстрирует разницу между этими двумя точками зрения, является следующее утверждение: символ Кристоффеля Гсаь не мо- ясет появиться (сам по себе в недифференциальной форме) ни в одном законе физики. С нашей точки зрения, Гс0ь есть тензор, но он эквивалентен наделению особыми свойствами обычной производной да. Однако эта обычная производная является дополнительной геометрической величиной по отношению к пространству, не выводимой из метрики (хотя она совпадает с оператором ковариантной производной, удовлетворяющим (3.1.17), поскольку Гс0ь = 0), так что появление Тсаь нарушает нашу формулировку общей ковариантности. С другой точки зрения, Гсаь не может появиться поскольку, как уже было отмечено в разд. 3.1, его координатные компоненты при общих координатных преобразованиях не преобразуются по формуле (2.3.8). Законы дорелятивистской физики также подчиняются принципу специальной ковариантности. Смысл этого принципа можно пояснить следующим образом. Метрика пространства (4.1.4) допускает нетривиальную группу изометрий (см. прилож. С), а именно, 6-параметричес- кую группу вращений и сдвигов в пространстве R3 вместе с дискретной симметрией четности. Рассмотрим расположенное в пространстве семейство наблюдателей О, которые производят измерения физического поля. Рассмотрим другое семейство наблюдателей О', полученное действием изометрий на семейство О. Принцип специальной ковариантности гласит, что любая физически возможная серия измерений, полученная наблюдателями из О, также является физически возможной серией измерений для наблюдателей из О'. Это подразумевает существование действия группы изометрий на состояния измеряемых физических полей. Важность принципа специальной ковариантности заключается главным образом в том, что в соответствующем контексте можно использовать действие этой группы, чтобы вывести или, по крайней мере, мотивировать возможные законы, управляющие физическими полями. Это будет проиллюстрировано в гл. 13, где - скорее в контексте специальной теории относительности, а не дорелятивистской физики - принцип специальной ковариантности будет использо- Ван для мотивации вывода динамических законов, которым удовлетворяют поля массы т и спина s. Принцип специальной ковариантности тесно связан с принципом °бидей ковариантности. Предположим, что объект, представляющий
100 Глава 4. Уравнения Эйнштейна интерес с физической точки зрения, описывается тензорным полем Та"ь-.-. Если принцип общей ковариантности справедлив, то уравнения, определяющие тензорное поле Ta"V-, должны включать в себя только Га'"ь..., метрику hab, a также величины, определенные посредством hab, как например, оператор ковариантного дифференцирования в метрике Ла&. Более того, все величины, измеряемые наблюдателями О, должны быть представимы скалярами, возникающими из сверток Та"ъ... и его производных по базисным векторным полям (еа)а, связанных с О. Пусть ф будет изометрией. Тогда если вышеприведенные предположения имеют силу, то действие ф на T°"V-, как определено в прилож .С, создает тензорное поле ф*Та"ь.-> которое будет удовлетворять уравнениям физического поля и приводить к таким же измеряемым величинам для наблюдателей О', что и Ta"V. для наблюдателей О. Таким образом, для физических величин, описываемых тензорными полями и удовлетворяющих тензорным уравнениям, специальная ковариантность физических законов по отношению к преобразованиям изометрии по сути следует из общей ковариантности. (Отметим однако, что формулировка специальной ковариантности, данная выше, не требует, чтобы физические величины описывались тензорными полями; и, действительно, в гл. 13 мы будем использовать принцип специальной ковариантности, чтобы мотивировать введение спинорных полей.) С другой стороны, принцип общей ковариантности по существу может рассматриваться как формулировка идеи специальной ковариантности, которая применима в случае отсутствия изометрии. Специальная ковариантность законов физики подразумевает, что если мы выбираем систему координат и записываем уравнения в координатных компонентах без точного включения метрики в уравнение^ а просто повсюду подставляя ее координатные компоненты h^u (например, diag(l, 1,1) в декартовых координатах), то форма уравнений сохранится при координатных преобразованиях, соответствующих изометриям, по той простой причине, что численные значения компонент /iM„ остаются неизменными при этих преобразованиях. Таким образом, специальную ковариантность можно рассматривать как выражение инвариантности уравнений, записанных в компонентной форме, при "специальной" группе преобразований координат (а именно тех, что соответствуют изометриям), в то время как общую ковариантность можно считать выражением (совершенно другого типа) инвариантности уравнений при общих преобразованиях координат. Исторически сложилось, что формулировки специальной и общей ковариантности играют важную роль в дискуссиях о теории относительности; действи-
4.2. Специальная теория относительности 101 хельно, сами названия "специальная" и "общая" теория относительности берут свое начало в этих формулировках специальной и общей ковариантности. 4.2 Специальная теория относительности В разд. 1.2 мы уже описали главные изменения в наших представлениях о пространстве и времени, привнесенные специальной теорией относительности. Сейчас мы вновь сформулируем эти идеи в духе, весьма близком дискуссии, изложенной в предыдущем разделе. В специальной теории относительности предполагается, что пространство-время имеет структуру многообразия R4. Как уже указывалось в разд. 1.2, считается, что в пространстве-времени существует выделенное семейство движений, относимых к "инерциальным" или к "неускоренным" движениям. Далее допускается, что инерциальные наблюдатели могут соорудить жесткую решетку из метровых стержней, синхронизовав часы, помещенные в узлах решетки, и помечать каждое событие в постранстве-времени координатами решетки ж1, ж2, х3 и показаниями часов t. Такое отображение пространства-времени в R4 называется глобальной инерциальной системой координат. Возможны многие другие глобальные инерциальные системы координат. Более точно, различные такие системы могут быть поставлены во взаимно однозначное соответствие с элементами 10-параметрической группы Пуанкаре. Таким образом, метки ж1, ж2, ж3 в момент времени t = x° данного события не имеют внутреннего смысла. Однако, как уже отмечалось в разд. 1.3, пространственно-временной интервал / между двумя событиями жиж, определенный (в системе единиц, где с = 1) посредством / = -(ж0 - ж0)2 + (ж1 - ж1)2 + (ж2 - ж2)2 + (ж3 - ж3)2, (4.2.1) имеет то же самое значение во всех глобальных инерциальных системах координат и, таким образом, может рассматриваться как представляющий внутреннее свойство пространства-времени. Аналогично нашему обсуждению в предыдущем разделе, (4.2.1) пРедполагает, что мы определяем метрику пространства-времени г)аъ как з Vab = J2 Ч^ЫМ&сЧъ, (4.2.2) гДе r/Ml/ = diag(—1,1,1,1) и {жм} - любая глобальная координатная Система. Итак, полученное таким образом тензорное поле г}аь не зави-
102 Глава 4. Уравнения Эйнштейна сит от выбора глобальных инерциальных координат. Еще раз, обычный оператор производной да в глобальных инерциальных координатах удовлетворяет уравнению дащс = 0, (4.2.3) и, таким образом, является оператором ковариантного дифференцирования, связанным с метрикой пространства-времени. Кроме того, поскольку частные производные коммутируют, кривизна т]аъ исчезает. Геодезические линии г)аь есть именно те кривые, которые являются прямыми линиями при их выражении в глобальных инерциальных координатах. В частности, времениподобные геодезические линии т)аЬ являются точными мировыми линиями инерциальных наблюдателей в пространстве-времени. Таким образом, специальная теория относительности утверждает, что пространство-время является многообразием R4 с определенной на нем плоской метрикой лоренцевой сигнатуры, И наоборот, как уже было сказано, в этом утверждении содержится вся специальная теория относительности, так как взяв R4 с плоской лоренцевой метрикой, мы можем использовать геодезические линии этой метрики, чтобы построить глобальные инерциальные координаты, и так далее. Физически интересные величины в специальной теории относительности вновь представлены тензорными полями, но теперь величины, которые в дорелятивистской физике рассматривались как пространственные тензоры, в специальной теории относительности рассматриваются как формирующие пространственно-временные тензоры. В контексте специальной теории относительности принцип общей ковариантности утверждает, что метрика пространства-времени 7]аь является единственной величиной, относящейся к структуре пространства- времени, которая может появиться в любом физическом законе. Полагают, что этот принцип применим к законам физики в специальной теории относительности с одним значительным изменением. Эксперименты, показывающие нарушения четности и (косвенно) демонстрирующие отсутствие симметрии относительно обращения времени, показали, что в физических законах могут появиться два дополнительных аспекта структуры пространства-времени: ориентация времени и пространственная ориентация пространства-времени. Под "ориентацией времени" мы понимаем непрерывный повсюду в пространстве- времени выбор, из которого следует, что половина светового конуса представляет направление будущего, а вторая его половина - направление прошлого (см. рис. 1.2 и начало гл. 8 для дальнейшего обсуждения этого понятия в контексте искривленного пространства-
4.2. Специальная теория относительности 103 времени). Под "ориентацией пространства" мы понимаем непрерывный выбор "правосторонних", в сравнении с "левосторонними" орто- нормальными триадами, пространственноподобных векторов в каждой точке или, что равнозначно, уточнение непрерывного не обращающегося в нуль полностью антисимметричного тензорного поля еаЬс = в[аЬс] н& пространстве-времени, удовлетворяющего условию taeabc = 0 для некоторого времениподобного векторного поля2 ta. Поэтому эти два дополнительных аспекта структуры пространства-времени очевидно входят в законы физики. Аналогично считают, что законы физики в специальной теории относительности удовлетворяют принципу специальной ковариантности по отношению к собственным преобразованиям Пуанкаре, т.е. по отношению к трансляциям, вращениям и бустам в пространстве-времени, но не по отношению к обращениям во времени, преобразованиям четности или их композиции. Хотя эти последние "несобственные" преобразования являются изометрия- ми, они не сохраняют всю соответствующую структуру пространства- времени, так как обращают время и/или пространственную ориентацию в пространстве-времени. Опишем более явно формулировку некоторых законов физики в специальной теории относительности. Мы уже упоминали, что кривые классифицируются как времениподобные, нулевые или пространствен- ноподобные в соответствии с тем, какова норма 7}аьТаТь касательной, является ли эта норма отрицательной, нулевой или положительной соответственно. Специальная теория относительности утверждает, что траектории материальных частиц в пространстве-времени являются всегда времениподобными кривыми. (Это, конечно, просто переформулировка хорошо знакомого утверждения "ничто не может двигаться быстрее света"). Мы можем параметризовать времениподобные кривые собственным временем т, определенным уравнением r = J(-r1abTaTb)1/2dt, (4.2.4) где t представляет произвольную параметризацию кривой (с возрастающим параметром t, соответствующим течению "вперед во времени"), а вектор Та - касательная к кривой при этой параметризации. Согласно специальной теории относительности, г является в точности тем временем, которое будет отсчитываться по часам, переносимым 23аметим, что если ta выбрано непрерывным, что определяет направление времени, то cabcd = -*[ae6cd] Дает ориентацию в пространстве-времени в смысле при- лож. В. Любые из двух ориентации - (i) ориентация времени, (ii) пространственная ориентация и (iii) пространственно-временная ориентация в пространстве-времени Минковского - обусловливают третью.
104 Глава 4. Уравнения Эйнштейна вдоль данной кривой. Различные времениподобные кривые, соединяющие пару событий, могут иметь различные истекшие времена ("парадокс близнецов"), а различные пути между двумя точками пространства могут иметь различные длины. Как уже говорилось в разд. 3.3, максимум прошедшего времени между двумя событиями задается геодезическим (т.е. инерциальным) движением. Касательный вектор иа к времениподобной кривой, параметризи- рованной с помощью т, называется 4-скоРостью кривой. Непосредственно из определения г следует, что 4-скорость имеет единичную длину иаиа = -1. (4.2.5) Как уже упоминалось выше, частица, не подверженная воздействию внешних сил, будет двигаться по геодезической, а именно, ее 4-скорость будет удовлетворять уравнению движения иадаиь = 0, (4.2.6) где да - оператор ковариантного дифференцирования, связанный с 7]аь, т.е. обычный оператор дифференцирования в глобальной инерци- альной системе координат. Если силы присутствуют, то правая часть уравнения (4.2.6) будет ненулевой (см., например, далее уравнение (4.2.26)). Все материальные частицы имеют признак, известный как "масса покоя" га, который проявляется как параметр в уравнениях движения при наличии сил. 4-вектор энергии-импульса ра частицы массы т определяется как ра = тиа. (4.2.7) Энергия частицы, измеренная наблюдателем, присутствующим на месте частицы, 4-скорость которого есть va, определяется уравнением Е = -pava. (4.2.8) Поэтому в специальной теории относительности энергия, как установлено, должна быть "временной компонентой" 4-векторара. Для частицы, находящейся в состоянии покоя по отношению к наблюдателю (т.е. при va = г*а), уравнение (4.2.8) сводится к известной формуле Е = тс (в нашей системе единиц, где с = 1). Так как метрика пространства- времени rjab плоская и, таким образом, параллельный перенос независим от пути, мы можем определять энергию частицы, измеряемую наблюдателем, который не находится на месте частицы, как энергию
4.2. Специальная теория относительности 105 частицы, измеряемую наблюдателем, который находится на месте частицы, имея 4-скорость, параллельную 4-скорости удаленного наблюдателя. Непрерывное распределение материи в специальной теории относительности описывается симметричным тензором Таб, называемым тензором напряжений-энергии-импульса. Для наблюдателя с 4-скоростью va компонента TabVavb интерпретируется как плотность энергии, т.е. массы-энергии единицы объема, измеряемой этим наблюдателем. Для обычной материи эта величина будет неотрицательной: Tabvavb > 0. (4.2.9) Если ха ортогонален к va, то компонента ТаьУахь интерпретируется как плотность импульса материи в х°-направлении. Если уа также ортогонален к va, то Таьхауь представляет жа-у6-компоненту тензора напряжений в веществе, определенного в начале разд. 2.3. Поэтому тензор напряжений в дорелятивистской физике объединяется с плотностями энергии и момента, образуя тензор напряжений-энергии- импульса специальной теории относительности. Следуя установившейся практике, мы часто будем сокращать термин "тензор напряжений- энергии-импульса" до "тензор напряжений-энергий" или даже "тензор напряжений"3. Идеальная жидкость по определению является непрерывным распределением материи с тензором энергии-импульса Таь вида ТаЬ = fmauh + Р (rjab + иащ), (4.2.10) где иа единичное времениподобное векторное поле, представляющее 4-скорость жидкости. Согласно вышеизложенной интерпретации тензора Таь функции р и Р являются плотностью массы-энергии и давлением жидкости соответственно, измеренными в ее системе покоя. Жидкость называется "идеальной" ввиду отсутствия вкладов теплопроводности и напряжений, вызываемых вязкостью. Уравнение движения идеальной жидкости, не подверженной воздействию внешних сил, даТаЬ = 0. (4.2.11) Записывая уравнение (4.2.11) в терминах р, Р и иа и проектируя полученное уравнение параллельно и перпендикулярно иь, находим: иадар + (р + Р)даиа = 0, (4.2.12) В дальнейшем мы будем использовать термин "тензор энергии-импульса", как Широко принято в отечественной литературе.- Прим. ред.
106 Глава 4. Уравнения Эйнштейна (Р + р)иадащ + (flab + иащ) даР = 0. (4.2.13) В нерелятивистском пределе Р < р, и** = (1,гТ) и vdP/dt < |VP|, эти уравнения приобретают вид g + tf.(p0) = O, ^{^+(? ^)4=-^р- (4-2-15) Таким образом, мы видим, что (4.2.11) сводится к уравнению сохранения массы, уравнению (4.2.14) и уравнению Эйлера (4.2.15). Уравнение (4.2.11) имеет важную физическую интерпретацию. Рассмотрим семейство инерциальных наблюдателей с параллельными 4- скоростями va, так что дьУа = 0. Согласно вышеизложенной интерпретации Таь, величина Ja = -Tabvb (4.2.16) представляет собой 4-вектор плотности тока массы-энергии жидкости, измеряемой этими наблюдателями. Следствием (4.2.11) является да Ja = 0. (4.2.17) По теореме Гаусса-Остроградского (см. прилож. В) уравнение (4.2.17) приводит к тому, что на трехмерной границе 5 любого четырехмерного пространственно-временного объема V имеем / JanadS = 0, (4.2.18) где па - единичная нормаль, направление которой определено в прилож. В. Применяя вышесказанное к объему, изображенному на рис. 4.1, мы видим, что изменение энергии жидкости в этом объеме (т.е. вклад в интеграл от верхней и донной частей S в (4.2.18)) равно интегрированному по времени потоку энергии в объем жидкости (т.е. вклад от "боковой" части 5). Поэтому уравнение (4.2.18) имеет следствием сохранение энергии. Наоборот, сохранение энергии, измеряемой всеми инер- циальными наблюдателями, требует выполнения уравнения (4.2.11). Таким образом, в более общем виде сохранение энергии приводит к тому, что уравнение (4.2.11) должно выполняться для всех непрерывных распределений материи, а не только для идеальных жидкостей. Чтобы проиллюстрировать описание полей в специальной теории относительности, мы приведем два примера: скалярное поле и электромагнитное поле. Хотя классическое скалярное поле не существует (4.2.14)
4.2. Специальная теория относительности 107 Рис. 4.1. Пространственно-временная диаграмма, показывающая плотность тока массы-энергии Ja в объем V пространства-времени в природе, для многих целей поучительно рассмотреть поле ф, удовлетворяющее уравнению Клейна-Гордона: дадаф-т2ф = 0. (4.2.19) Тензор напряжений-энергий этого скалярного поля определяется по формуле4 Tab = дафдьф - \г)аъ (дсфдсф + гп2ф2). (4.2.20) К тому же Tab удовлетворяет энергетическому условию (4.2.9) и сохраняется (уравнение (4.2.11)) в силу уравнения поля (4.2.19). В дорелятивистской физике как электрическое поле Е, так и магнитное поле В являются пространственными векторами. В специальной теории относительности эти поля объединены в единое пространственно-временное тензорное поле Fab> которое антисимметрично по своим индексам, Fab = —Fba- Поэтому Fab имеет шесть независимых компонент. Для наблюдателя, движущегося с 4-скоростью va, величина Еа = Fabvb (4.2.21) интерпретируется как электрическое поле, измеренное этим наблюдателем, в то время как Ba = -\eabcdFcdvb (4.2.22) 4 Общие предписания для определения тензора напряжений-энергий поля обсуждаются ниже, в прилож. Б.
108 Глава 4. Уравнения Эйнштейна определяется как магнитное поле. Здесь eabcd ~ полностью антисимметричный тензор положительной ориентации с нормой eabcd£abcd = — 24 (см. прилож. В), так что в правом ортонормированном базисе мы имеем €0123 = 1. В терминах тензора электромагнитного поля Fab уравнения Максвелла приобретают простой и изящный вид: daFab = -4тг/ь, (4.2.23) d[aFbc] = 0, (4.2.24) где ja является 4-вектором плотности тока электрического заряда. Отметим, что антисимметрия Fab приводит к уравнению 0 = dbdaFab = -4тгдь jb (4.2.25) Поэтому уравнения Максвелла имеют следствием dbjb = 0, которое по тем же аргументам, что приведены выше к уравнению для Ja, утверждает, что электрический заряд сохраняется. Уравнение движения частицы заряда q, движущейся в электромагнитном поле Fa6, имеет вид иадаиъ = —Fbcuc. (4.2.26) га В этом уравнении обычный закон лоренцевой силы переформулирован в терминах Fab. Тензор энергии-импульса электромагнитного поля равен Tab = -^ lFacFbc - \rjabFdeFde J . (4.2.27) Опять Таь удовлетворяет энергетическому условию (4.2.9), и если ja = = 0, то в силу уравнений Максвелла мы имеем d*Tab = 0. Если ja ф 0, то тензор энергии-импульса электромагнитного поля Таь сам по себе не сохраняется, но по-прежнему сохраняется суммарный тензор энергии- импульса поля и заряженной материи. В силу обращенной леммы Пуанкаре (см. прилож. В), уравнение (4.2.24) приводит к тому, что существует векторное поле Аа (называемое векторным потенциалом), такое, что Fab = даАь - дьАа. (4.2.28) В терминах Аа уравнения Максвелла принимают вид да (даАь - дьАа) = -4тг/ь. (4.2.29)
4.2. Специальная теория относительности 109 У нас есть калибровочная свобода прибавить градиент да\ функции X к Аа, так как согласно (4.2.28) эта прибавка оставляет Fab без изменений. Решая уравнение дадаХ = -дьАь (4.2.30) для х» мы можем сделать калибровочное преобразование, чтобы наложить условие лоренцевой калибровки: даАа = 0, (4.2.31) при котором, благодаря коммутативности производных в плоском пространстве-времени, уравнение (4.2.29) принимает вид дадаАь = -47TJ6. (4.2.32) Мы можем искать решения уравнений Максвелла в виде волн с постоянной амплитудой: Аа = Caei5, (4.2.33) где Са является постоянным векторным полем (т.е. полем постоянной нормы и всюду параллельным самому себе), а функция S называется фазой волны. Для получения решения с ja = 0 фаза должна удовлетворять (из уравнения (4.2.32)) dadaS = 0, (4.2.34) daSdaS = 0, (4.2.35) и (из уравнения (4.2.31)) CadaS = 0. (4.2.36) Теперь для любой функции / на любом многообразии с метрикой вектор Va/ нормален (т.е. ортогонален) к поверхностям постоянного значения функции /, поскольку для любого вектора £а, касательного к поверхности, имеем taVaf = 0. Уравнение (4.2.35) утверждает, что нормаль ка = 9а5 к поверхности постоянного значения S является нулевым вектором, кака = 0. Мы называем такую поверхность нулевой гиперповерхностью. Отметьте, что нулевые гиперповерхности имеют такое свойство: их собственный нормальный вектор карателен к гиперповерхности. Дифференцирование (4.2.35) дает
по Глава 4. Уравнения Эйнштейна О = db(daSdaS) = = 2(das)(dbdas) = = 2(das)(dadbs) = = 2кадакь, (4.2.37) т.е. интегральные кривые ка являются нулевыми геодезическими линиями. Действительно, поскольку вывод (4.2.37) из (4.2.35) применим также в искривленном пространстве-времени (при повсеместной замене да на Va), отсюда следует, что все нулевые гиперповерхности в лоренцевом пространстве-времени порождаются нулевыми геодезическим5 линиями. Частота волны (т.е. скорость изменения фазы волны со знаком минус), измеренная наблюдателем с 4-скоростью va, представляется выражением ш = -vadaS = -v°Jka. (4.2.38) Наиболее важными решениями уравнений Максвелла в виде (4.2.33) являются плоские волны: з S=^fc/ix'i, (4.2.39) /i=0 где {хм} - глобальные инерциальные координаты и кц - константы (и, таким образом, ка - постоянное векторное поле). Из теории преобразований Фурье следует, что все решения уравнений Максвелла, если они имеют хорошую асимптотику, т.е. спадают до нуля достаточно быстро на больших пространственных расстояниях, могут быть выражены суперпозициями плоских волн. Вышеприведенные рассуждения предполагают, что электромагнитные возмущения, т.е. световые сигналы, распространяются вдоль нулевых геодезических линий, см. (4.2.37). Это предположение действительно верно: запаздывающая функция Грина для уравнений Максвелла имеет несущее множество, ограниченное световым конусом прошлого (Jackson 1962), так что электромагнитное излучение от источника, которое достигает события р, зависит только от того, где находился источник на световом конусе прошлого р. Поэтому термин "световой конус", который введен выше, обоснован уравнениями Максвелла: свет действительно распространяется вдоль светового конуса. 5Вывод (4.2.37) соответствует случаю, когда имеется функция 5, для которой все гиперповерхности постоянного значения 5 являются нулевыми. Для единственной нулевой гиперповерхности стремление eabcdkcVd(keke) к нулю показывает, что ка карателен к (неаффинно параметризированной) нулевой геодезической.
4.3. Общая теория относительности 111 4.3 Общая теория относительности Теория Максвелла является исключительно успешной теорией электричества, магнетизма и света, которая изящно встроилась в структуру специальной теории относительности. Поэтому можно было бы ожидать, что следующим логическим шагом стала бы разработка новой теории другой классической силы - тяготения, которая обобщит ньютоновскую теорию и сделает ее совместимой со специальной теорией относительности точно так же, как теория Максвелла обобщила ку- лоновскую электростатику. Однако Эйнштейн избрал совершенно другой путь и вместо этого разработал общую теорию относительности - новую теорию структуры пространства-времени и тяготения. Как уже упоминалось в вводной главе, принцип эквивалентности и принцип Маха обеспечивали первичную мотивацию для формулировки новой теории. Чтобы выяснить, уместен ли принцип эквивалентности, гласящий, что все тела одинаково падают в гравитационном поле, к развитию новой точки зрения на тяготение, рассмотрим, как измеряется электромагнитное поле в специальной теории относительности. Первым шагом является размещение "опорных наблюдателей", не подверженных воздействию электромагнитных сил (т.е. они электрически нейтральны, не имеют магнитного дипольного момента и пр.) или любых других сил. Эти наблюдатели называются инерциальными и удовлетворяют уравнению движения по геодезической (4.2.6). Следующим шагом является приведение в движение заряженного пробного тела. Мировая линия этого тела будет удовлетворять уравнению (4.2.26), и по наблюдению отклонения от движения по инерции (для достаточно многих пробных тел) можно определить Fab. Если мы применим эту процедуру к тяготению, то сразу же столкнемся с серьезной проблемой: в силу принципа эквивалентности у нас нет возможности "изолировать" наблюдателя или тела от гравитационной силы, так как мы не располагаем простым прямым физическим способом создать инерциального наблюдателя в том же смысле, что использован в электромагнетизме. Любой наблюдатель будет двигаться точно так же, как и пробное тело, так что у нас нет естественного "опорного движения", чтобы сравнить движение наблюдателя с движением пробного тела. Поэтому нет у нас и простого прямого способа измерения поля гравитационной силы. Возможно, конечно, что существуют сложные процедуры для этих построений и измерений. Если бы специальная теория относительности была верна, то можно было бы построить жесткую решетку инерциальных наблюдателей по-
112 Глава 4. Уравнения Эйнштейна средством измерений пространства-времени, т.е. можно было бы с помощью часов и метровых стержней измерить метрику пространства- времени (плоского) и определить его геодезические линии. Было бы необходимо оснастить инерциальных наблюдателей ракетными двигателями, а кроме того, чтобы поле гравитационный силы можно было определить точно так же, как и для электромагнетизма. Принцип эквивалентности мог бы тогда рассматриваться как своеобразная причуда закона гравитационной силы, точно так же, как он рассматривается в стандартных трактовках теории Ньютона. Основная структура общей теории относительности возникает из рассмотрения противоположной возможности: мы в принципе не можем - даже с помощью сложных процедур - построить жесткую решетку инерциальных наблюдателей в смысле специальной теории относительности и измерять гравитационную силу. Это сводится к следующей смелой гипотезе: метрика пространства-времени не является плоской, как было принято в специальной теории относительности. Мировые линии свободно падающих тел в гравитационном поле являются просто геодезическими линиями в метрике (искривленного) пространства-времени. Таким образом, "опорные наблюдатели" (геодезические линии метрики пространства-времени) автоматически совпадают с тем, что было предварительно рассмотрено в качестве траекторий в поле гравитационной силы. В результате этого у нас нет выразительного способа описания гравитации как силового поля; скорее, мы вынуждены рассматривать гравитацию как проявление структуры пространства-времени. Хотя абсолютная гравитационная сила не имеет смысла, относительная гравитационная сила (т.е. приливная сила) между двумя близко расположенными точками уже имеет смысл и может быть измерена наблюдением относительного ускорения двух свободно падающих тел. Это относительное ускорение имеет непосредственное отношение к искривлению пространства-времени, в соответствии с уравнением отклонения от геодезической (3.3.18). Как же точка зрения общей теории относительности, что нет такой вещи, как квадрат гравитационной силы, совместима с хорошо известным "фактом", что поле гравитационный силы на поверхности Земли равно 980 см/с2? Напомним, что, со стандартной ньютоновской точки зрения, действие гравитационной силы на объект, помещенный на поверхности Земли, уравновешивается действием силы нормального давления, что оставляет тело в равновесии, т.е. "в покое". С точки зрения общей теории относительности, только сила нормального давления Земли, действующая на тело, является силой. Вследствие действия этой силы тело движется (т.е. отклоняется от движения по геодезиче-
4.3. Общая теория относительности ИЗ ской) с ускорением 980 см/с2. Тем не менее оно остается в стационарном состоянии потому, что в геометрии искривленного пространства- времени вблизи Земли орбиты трансляционной симметрии времени отличаются от геодезических линий метрики. Мы могли бы использовать трансляционную симметрию времени этого примера, чтобы определить предпочтительное множество опорных наблюдателей. А затем можно было бы определить поле гравитационной силы Земли так, чтобы это поле было равно ускорению тела со знаком минус, которое тело должно испытывать, чтобы оставаться на геодезической. Таким образом, в этом случае гравитации может быть приписан хорошо определенный смысл силового поля. Однако в отсутствие трансляционной симметрии времени, например, в случае, когда есть несколько массивных тел в относительном движении, не существует естественного множества кривых, сопоставление которых с геодезическими линиями можно было бы использовать для определения гравитационной силы. (Это замечание также применимо к наблюдателю в движущейся лаборатории вблизи Земли, который не будет осведомлен о трансляционной симметрии времени.) Поэтому, хотя мы и можем осознанно говорить о поле гравитационной силы Земли, но это совершенно особое понятие, применимое только к ситуациям с трансляционной симметрией времени. В общем случае нет предпочтительных опорных наблюдателей, и только приливная сила - относительное ускорение близкорасположенных геодезических - хорошо определена. Таким образом, в общей теории относительности мы не утверждаем, что пространство-время является многообразием R4 с определенной на нем плоской метрикой г)аь- Эта возможность соответствует не приливным силам, т.е. не гравитационному полю, и не является единственной возможностью. Структура общей теории относительности допускает лоренцеву метрику gab, чтобы пространство-время было искривлено. Действительно, утверждается, что пространство-время должно быть искривлено во всех случаях, когда с физической точки зрения присутствует гравитационное поле. Поскольку мы признаем искривленные геометрии, то гораздо естественнее допустить, что пространство-время имеет строение многообразия М, но не R4. Следовательно, в общей теории относительности мы a priori не накладываем ограничения на пространственно-временное многообразие. Завершающей ключевой особенностью общей теории относительности является уравнение Эйнштейна, которое связывает геометрию пространства- времени с распределением материи. Мы обсудим это уравнение далее, но сначала остановимся на природе законов физики в новых рамках структуры пространства-времени, которая задана общей теорией от-
114 Глава 4. Уравнения Эйнштейна носительности: пространство-время является многообразием М, на котором определяется лоренцева метрика gab. Законы физики в общей теории относительности подчиняются двум основополагающим принципам: (1) принципу общей ковариантности, который уже обсуждался в двух предыдущих разделах, утверждающему, что и метрика gab и величины, получаемые из нее. являются единственными пространственно-временными величинами, которые могут появиться в уравнениях физики; (2) требованию, что в пределе плоской метрики gab уравнения должны сводиться к тем, что получены в рамках специальной теории относительности. Как уже упоминалось выше, первый принцип является неопределенным, потому что нечетко определен термин "пространственно-временная величина". Как будет показано ниже, эти два принципа сами по себе неоднозначно определяют законы физики в общей теории относительности. Однако, наряду с простотой и эстетикой, они служат руководством, которое во многих случаях непосредственно ведет к естественным претендентам на роль физических законов. Поскольку основная структура общей теории относительности обобщает структуру специальной теории относительности только в том, что позволяет многообразию отличаться от R4, а метрике быть неплоской, мы можем продолжать представлять физические величины тем же типом тензорных полей, что и в специальной теории относительности. Поэтому в общей теории относительности: движение частиц продолжает представляться времениподобной (в метрике gab) кривой; идеальные жидкости все так же описываются в терминах 4-скорости и°, плотности р и давления Р; электромагнитное поле представлено антисимметричным тензором Fab. Однако уравнения этих полей необходимо изменить. Два вышеупомянутых принципа предполагают следование простому правилу: в уравнениях, справедливых в специальной теории относительности, плоская метрика rjab заменяется везде на gab и, соответственно, дифференциальный оператор с?а, связанный с т]аЬ, заменяется на дифференциальный оператор Va, относящийся к метрике gab. Это правило, в сущности, служит для связи частиц и полей в гравитации и является аналогичным правилу "минимальной подстановки" ра —► ра — еАа связи такого рода в электромагнетизме. Однако, как мы покажем далее, это правило не вполне свободно от неоднозначности. Таким образом, в общей теории относительности мы вновь определяем 4-скорость иа частицы как единичную касательную (измеряемую
4.3. Общая теория относительности 115 с помощью gab) к ее мировой линии. А движение свободной частицы соответствует уравнению движения по геодезической: txaVau6 = 0, (4.3.1) где Va - оператор ковариантного дифференцирования, связанный с gab. Если ускорение6 a6 = uaVaub частицы не обращается в нуль, то говорят, что на частицу действует сила fb = таь, где т масса (покоя) частицы. Например, если частица имеет массу (покоя) т и заряд q и помещена в электромагнитное поле Fab, то ее уравнение движения содержит силу Лоренца: uaVaub = ±Fbcuc, (4.3.2) т где индекс поднимается и опускается с помощью ga6, т.е. Fbc = ^dFdc- (Мы вновь подчеркиваем, что нет естественной плоской метрики, определенной на пространстве-времени, и, по принципу общей коваринт- ности, только gab может появиться в уравнениях). 4-импульс частицы определен ра = тиа. (4.3.3) Энергия частицы, определяемая наблюдателем, который находится на мировой линии частицы в той точке (событии), в которой измерена энергия, вновь равна Е = -pava, (4.3.4) где va - 4-скорость наблюдателя. Однако здесь есть одно важное отличие: поскольку пространство-время искривлено, то нет хорошо определенного понятия параллельности векторов в различных точках, параллельный перенос зависит от траектории переноса. Поэтому нет естественного "глобального семейства" инерциальных наблюдателей, и данный наблюдатель не может, строго говоря, определять энергию удаленной частицы. В общей теории относительности непрерывное распределение материи и поля снова описывается тензором энергии-импульса ТаЬ. Тензор энергии-импульса идеальной жидкости представляется выражением Tab = риаЩ + Р (gab + иащ) (4.3.5) и подчиняется уравнению движения V°Ta6 = 0, (4.3.6) 6Нужно четко отличать (абсолютное) ускорение аь от относительного ускорения на геодезической, которое обсуждается в разд. 3.3.
116 Глава 4. Уравнения Эйнштейна которое приводит к результату иа Vap + (р + Р) Vaua = 0, (4.3.7) (р + Р)иа Vaub + (gab + иаиь) V°P = 0. (4.3.8) Но теперь интерпретация уравнения (4.3.6) изменена. Семейство наблюдателей представлено единичным времениподобным векторным полем va. Если можно найти такое векторное поле, котЬрое ковари- антно постоянно, т.е. VaVb = 0, или для которого просто V(av&) = 0, тогда мы бы имели Va(TabVb) = 0. Применяя вариант теоремы Гаусса для искривленного пространства-времени (см. прилож. В), мы вновь получили бы строгое сохранение энергии в виде (4.2.18) для 4-вектора энергии-импульса Ja = -TabVb, который измеряется наблюдателями, представленными vb. Однако в искривленном пространстве-времени в общем случае нельзя найти г;°, удовлетворяющего vava = — 1 и V(atb) = 0. (В самом деле, V(aVf,) = 0 является уравнением Киллинга и имеет силу тогда и только тогда, когда va генерирует однопарамет- рическую группу изометрий (см. прилож. С).) Поэтому аргумент, что уравнение (4.3.6) подразумевает строгое сохранение энергии, теряет силу. С физической точки зрения это разумно, потому что гравитационные приливные силы могут произвести работу над жидкой средой и увеличить или уменьшить ее энергию, измеренную локально7. Однако, если рассмотреть область пространства-времени размером меньше радиуса кривизны, то, с физической точки зрения, приливные силы могут совершить небольшую работу, и энергия жидкости приблизительно сохранится. Но и за этой малой областью пространства-времени можно найти векторные поля с VbVa « 0, и, таким образом, уравнение (4.3.6) дает приблизительное сохранение энергии, измеряемой этими наблюдателями. Таким образом, (4.3.6) можно интерпретировать как уравнение локального сохранения энергии вещества в небольших областях пространства-времени. Вследствие этой интерпретации, ожидается, что (4.3.6) применимо ко всей материи и полям, а не только к идеальной жидкости. Наиболее естественное обобщение уравнения, удовлетворяющего скалярному полю Клейна-Гордона, в искривленном пространстве-времени 7 Можно было бы надеяться восстановить закон сохранения энергии включением тензора энергии-импульса гравитационного поля, как в теории Ньютона. Однако в общей теории относительности не существует имеющего смысл локального выражения для гравитационного тензора энергии-импульса, а значит, нет имеющего смысл локального закона сохранения, который приводит к утверждению о сохранении энергии. Тем не менее, как будет обсуждаться в гл. 11, сохранение полной энергии изолированной системы можно определить, хотя локального выражения для плотности энергии нет.
4.3. Общая теория относительности 117 дается нашим правилом "минимальной подстановки": г]аь —> ga^ &a —► ->Va, VaVa0 - т2ф = 0. (4.3.9) Тензор энергии-импульса поля ТаЬ = ЧафЧъФ - \gab {ЪсфЪсФ + т2ф2), (4.3.10) удовлетворяет V°Ta6 = 0. Мы должны указать, однако, что существует много других возможных обобщений уравнения (4.2.19), которые совместимы с двумя основными принципами, указанными выше. Например, таким обобщением является VaVa</> - т2ф - аЯф = 0, (4.3.11) где a - постоянная. Действительно, уравнение (4.3.11) с а = 1/6 возникает естественным образом при рассмотрении его конформной инвариантности (см. прилож. D). Уравнения Максвелла в искривленном пространстве-времени приобретают вид VaFa6 = -47Г76, (4.3.12) V[aFbc] = 0. (4.3.13) Тензор энергии-импульса электромагнитного поля выражается из (4.2.27) заменой г)аь на gab Таь = -^ hacFbc - \gabFdeFde} . (4.3.14) Как и раньше, уравнение (4.3.13) позволяет нам ввести вектор-потенциал Аа (по крайней мере локально). Однако уравнения Максвелла для Аа в лоренцевой калибровке содержат явное слагаемое с кривизной, полученное в результате перестановки производных при выводе уравнения (4.2.32); мы находим VaVaAb - RdbAd = -47TJ6. (4.3.15) Это иллюстрирует значительный недостаток нашей минимальной подстановки. Если бы мы только произвели замену производных в уравнениях Максвелла вида (4.2.32), то пришли бы к уравнению (4.3.15) без тензора Риччи. В данном случае мы можем предпочесть (4.3.15) альтернативному уравнению без слагаемого RdbAd, потому что (4.3.15) подразумевает сохранение тока Vaja = 0 (задача 1), в то время как
118 Глава 4. Уравнения Эйнштейна альтернативное уравнение противоречит сохранению тока. Однако этот пример показывает, что правило минимальной подстановки само по себе не является единственным предписанием. В случаях, когда пространственно-временной масштаб изменения электромагнитного поля много меньше кривизны, можно было бы ожидать, что решения уравнений Максвелла имеют вид волны с почти постоянной амплитудой, т.е. решения вида s Аа = CatiS, (4.3.16) где производные Са "малы". Подстановка (4.3.16) в уравнение (4.3.15) при jb = 0, а также пренебрежение "малым" слагаемым УбУ6Са и слагаемым с тензором Риччи приводит к результату Va5Va5 = 0, (4.3.17) т.е. мы вновь находим, что поверхности постоянной фазы являются нулевыми и, таким образом, (тот же аргумент, что был упомянут выше для плоского пространства-времени) вектор ка = Va5 является касательным к нулевой геодезической линии. Это говорит о том, что в данном приближении (известном как приблиэюение геометрической оптики) свет распространяется по нулевой геодезической линии, предположение, которое можно подтвердить анализом функции Грина. Мы уже описали, как общая теория относительности трактует тяготение в терминах геометрии искривленного пространства-времени, и проиллюстрировали природу законов физики в этой новой схеме структуры пространства-времени. Что остается в общей теории относительности, так это уравнение, которому удовлетворяет метрика пространства-времени. Именно здесь вступает в действие принцип Маха. Перед тем как описывать геометрию пространства-времени, отметим, что общая теория относительности утверждает, что геометрия пространства-времени в соответствии с некоторыми идеями Маха (см. разд. 1.4) подвержена влиянию распределения материи во Вселенной. Таким образом, теперь метрика пространства-времени становится не только фоном места действия, на котором разыгрываются законы физики, но и динамической переменной, которая реагирует на содержание материи в пространстве-времени, как должно быть в случае, когда геометрия пространства-времени используется для описания гравитации. Какое уравнение описывает связь между геометрией пространства- времени и распределением материи? Важной подсказкой для вывода
4.3. Общая теория относительности 119 уравнения оказалось сравнение описания приливной силы в ньютоновской теории тяготения и общей теории относительности. В ньютоновской теории гравитационное поле можно представить потенциалом ф, и приливное ускорение^двух близко расположеных частиц определяется величиной (х - V)V0, где х - вектор их относительного положения. С другой стороны, в общей теории относительности из уравнения (3.3.18) приливное ускорение двух близко расположеных частиц получается равным Rcbdavcxbvd, где va - 4-скорость частиц, ха - 4-вектор их относительного положения. Приведенное выше сравнение говорит о том, что мы установили соответствие Rcbdavcvd «-> дьдаф. (4.3.18) Ньютонов потенциал связан с плотностью массы уравнением Пуассона V20 = 4тгр, (4.3.19) где р - плотность массы (т.е. плотность энергии) материи. Напоминаем читателю, что здесь и по всему тексту мы используем систему единиц, где G = с = 1. Далее, как уже обсуждалось выше, в специальной и общей теории относительности энергетические свойства материи описываются тензором энергии-импульса Таь, и мы имеем соответствие Tabvavb ~ р, (4.3.20) где va является 4-скоростью наблюдателя. Соответствия (4.3.18) и (4.3.20) вместе с уравнением (4.3.19) наводят на мысль, что Rcadavcvd = 4nTcdVcvd, что в свою очередь подразумевает уравнение поля Rcd = 47гТС{*. Действительно, это уравнение и было первоначально постулировано Эйнштейном. Однако такое уравнение поля имеет серьезный недостаток. Как обсуждалось выше, тензор энергии-импульса удовлетворяет VcTcd = 0. С другой стороны, свернутое тождество Бианки (3.2.31) говорит, что Vc(Rcd — \gcdR) = 0. Таким образом, равенство Rcd и 47гТс<* означало бы V<ji? = 0, т.е. что R и, следовательно, Т = Таа постоянны везде во Вселенной. Это весьма нефизичное ограничение на распределение материи, и оно вынуждает нас отказаться от этого уравнения, что быстро понял Эйнштейн (Einstein 1915b). Однако в самом затруднении заключается и выход из него. Если вместо предыдущего мы рассмотрим уравнение Gab = Rab - ^Rgab = 8тгГвЬ, (4.3.21)
120 Глава 4. Уравнения Эйнштейна то противоречие между тождеством Бианки и локальным сохранением энергии исчезает: действительно, тождество Бианки имеет следствием локальное сохранение энергии, если уравнение (4.3.21) выполняется. Кроме того, соответствия, которые послужили основанием для вывода уравнения, не нарушаются. Вычисляя след (4.3.21), мы находим, что R = -8тгГ, (4.3.22) и, таким образом, Rab = 87Г (Таь - ^аЬ^) • (4-3.23) В случаях, где должна применяться ньютонова теория, для наблюдателя, который находится в состоянии близком к "покою" относительно масс, измеряемая им энергия материи будет значительно превышать внутренние напряжения в веществе (в системе единиц, где с = 1), так что имеем Т « —р = — TabVavb. Поэтому в данном случае уравнение (4.3.23) все еще приводит к RabVavb « 47rTabVavb. Уравнение (4.3.21) является искомым уравнением поля общей теории относительности. Оно было записано Эйнштейном в 1915 году и известно как уравнение Эйнштейна. В целом, содержание общей теории относительности можно резюмировать следующим образом: пространство-время является многообразием М, на котором определена лоренцева метрика gab. Кривизна gab связывается с распределением материи в пространстве-времени уравнением Эйнштейна (4.3.21). Большая часть остального содержания книги посвящена изучению решений уравнения Эйнштейна и их физических свойств. Однако, прежде чем завершить этот раздел, мы сделаем три кратких замечания о природе данного уравнения. Первое замечание касается его математической природы. Если мы выбираем систему координат и выражаем компоненты базиса R^u системы координат в терминах gMI/, то, как следует из разд. 3.4.1, тензор R^ зависит от производных от g^ до второго порядка и является сильно нелинейным по g^ (хотя он линеен по второй производной £М1/). Поэтому уравнение Эйнштейна эквивалентно системе связанных нелинейных дифференциальных уравнений в частных производных второго порядка относительно компонент метрики g^u. Для метрики лоренцевой сигнатуры эти уравнения имеют гиперболический (т.е. являются волновыми уравнениями) характер (см. гл. 10). Как будет показано в гл. 10, у нас есть правильное число уравнений и неизвестных, чтобы корректно сформулировать начальные данные. Некоторые методы решения уравнения Эйнштейна обсуждены в гл. 7.
4.3. Общая теория относительности 121 Второе замечание касается того, как следует рассматривать уравнение Эйнштейна. В некотором смысле уравнение Эйнштейна (4.3.21) аналогично уравнению Максвелла (4.2.32) с тензором энергии-импульса Tab, который является источником гравитационного поля, примерно так же, как ток ja служит источником электромагнитного поля. Однако есть важное различие. Имеет смысл решать уравнение Максвелла, вначале определяя ja, а затем находить Аа. Можно попытаться решать уравнение Эйнштейна, определяя сначала Таь, а затем находя gab. Однако в этом нет большого смысла потому, что до тех пор, пока неизвестно gab, мы не знаем, как физически толковать Таъ', в самом деле, рассмотренные выше формулы для Таъ жидкостей и полей явно содержат метрику. Таким образом, в общей теории относительности нужно одновременно искать решения и для метрики пространства-времени, и для распределения материи. Эта особенность добавляет трудности при решении уравнения Эйнштейна при наличии источников. Заключительное замечание касается уравнений движения материи. Из нашего представления теории видно, что вначале постулируются уравнения движения частиц, уравнения непрерывного распределения материи и полей, а затем дается уравнение Эйнштейна, связывающее распределение материи с кривизной пространства-времени. Однако уравнение Эйнштейна имеет следствием соотношение VaTab = О, а оно содержит значительный объем информации о поведении материи. Действительно, для идеальной жидкости соотношение VaTab = О полностью содержит уравнения движения. Поэтому для жидкости мы можем сэкономить на количестве предположений, просто прстулируя форму ТаЬ; при этом уравнения движения жидкости уже содержатся в уравнении Эйнштейна. Отметьте, что для идеальной жидкости с Р = 0, т.е. для жидкости, составленной из "пылевидных" зерен, которые не оказывают силового действия друг на друга, уравнение движения жидкости (4.3.8), вытекающее из VaTa& = 0, свидетельствует, что отдельные пылевидные частицы двигаются по геодезическим. В более общем виде можно показать (Фок 1939; Geroch, Jang 1975), что соотношение V°T06 = 0 имеет следствием тот факт, что любое достаточно "малое" тело, чья самогравитация достаточно "слаба", должно перемещаться по геодезической. Следовательно, само по себе уравнение Эйнштейна фактически имплицирует гипотезу о геодезической, о том, что мировые линии пробных тел являются геодезическими линиями пространственно-временной метрики. Это демонстрирует важную самосогласованность уравнения Эйнштейна с основной структурой общей теории относительности. Заметьте, однако, что тела, которые являются достаточно "большими", чтобы ощущать приливные
122 Глава 4. Уравнения Эйнштейна силы гравитационного поля, будут отклоняться от движения по геодезической. Уравнения движения таких тел можно также найти из условия VaTab = 0 (Papapetrou 1951; Dixon 1974). 4.4 Теория гравитации в линейном приближении: ньютонов предел г и гравитационное излучение Целью этого раздела является обсуждение приближения, в котором гравитация является "слабой". С позиций общей теории относительности это означает, что метрика пространства-времени почти плоская. На практике это превосходное приближение к гравитационным явлениям в природе, кроме явлений, относящихся к гравитационному коллапсу, черным дырам и крупномасштабной структуре Вселенной. В гл. 7 мы представим систематическое развитие теории малых гравитационных возмущений произвольного решения. Сейчас мы просто будем предполагать, что отклонение 7аб фактической метрики пространства-времени gab = Vab+lab (4.4.1) от плоской метрики г)аь "мало". (Поскольку нет естественной положительно определенной метрики на пространстве-времени, то нет и естественной длины, на которой может быть измерена "малость" тензоров. Точное определение "малости" в этом контексте - это условие, что компоненты 7/л/ из 7аб должны быть значительно меньшими 1 в некоторой глобальной инерциальной системе координат т)аь-) Под "теорией гравитации в линейном приближении" мы понимаем такое приближение в общей теории относительности, которое получается при использовании (4.4.1) вместо gab в уравнении Эйнштейна и сохранении лишь слагаемых, линейных по 7а&- Обозначим да дифференциальный оператор, связанный с плоской метрикой г)аь8 Для того чтобы не скрывать 7аб в поднятом или опущенном индексе, удобнее поднять и опустить индекс тензора с помощью Vab и 7]аЬ, а не с помощью gab и g°6. В остальной части этого раздела мы хотим принять данное соглашение об обозначениях с некоторым исключением: обратную метрику будет все еще означать сам тензор g°b, а не r}ac,qbdgcd. Следует отметить, что в линейном приближении ^Ь = Г)аЪ_1аЬ^ (442) 8Напомним, что в плоской метрике г)аъ оператор да совпадает с оператором ковариантного дифференцирования.- Прим.ред.
4.4. Теория гравитации в линейном приближении 123 поскольку произведение правых частей (4.4.1) и (4.4.2) отличается от единичного оператора только слагаемыми, квадратичными по 7аб- Линеаризованное уравнение Эйнштейна можно получить следующим образом. В глобальной инерциальной системе координат в линейном приближении по 7оЬ символ Кристоффеля равен Гсаь = \vcd {dalbd + dbiad - ddlab). (4.4.3) В линейном приближении по 7аб тензор Риччи (3.4.5) есть Rab = дсгсаЬ-дагссЬ = = ^Ь7а)с - \&дс1аЬ - \дадьъ (4-4.4) где 7 = 7сс Таким образом, тензор Эйнштейна в линейном приближении равен Gab = Rab ~ \rfabR{1) = *?д(ь1а)с - \cfdclab - - \дады - \паЬ (Г&чы - &дс1) • (4.4.5) Это выражение можно упростить, введя определение lab = lab ~ 2^67- (4.4.6) Известно, что в терминах %ь линеаризованное уравнение Эйнштейна приобретает вид <%? = -\&дс%ь + аса(б7а)с - ^ПаЬ^^ы = 8тгГаЬ. (4.4.7) Как подробно обсуждается в прилож. С, в общей теории относительности существует свобода калибровки, соответствующая группе диффеоморфизмов: если ф : М —► М есть диффеоморфизм пространства-времени, то метрики gab и <l>*gab представляют одну и ту же геометрию пространства-времени, где ф* - отображение на тензорные поля, индуцированное ф. В линейном приближении это приводит к тому, что два возмущения 7аб и ^'аЬ представляют собой одно и то же физическое возмущение, если (и только если) они отличаются под действием "инфинитезимального диффеоморфизма" на плоской метрике г]аь. Как обсуждалось в разд. 2.2, "инфинитезимальный диффеоморфизм" образован векторным полем fa, a из прилож. С следует, что
124 Глава 4. Уравнения Эйнштейна индуцированное таким инфинитезимальным диффеоморфизмом изменение в тензорном поле определяет производную Ли. Это означает, что 1аЬ и 7аб + £iVab описывают одно и то же физическое возмущение. Из прилож. С видно, что мы можем выразить £^г}аь в терминах дифференциального оператора да плоской метрики: АЧвЬ = && + *&. (4.4.8) Это означает, что теория гравитации в линейном приближении имеет свободу калибровки вида lab -> lab + да£ь + ftfa, (4.4.9) весьма похожую на электромагнитную калибровочную свободу Аа —► —► Аа + даХ- Эту калибровочную свободу 1аь можно также вывести без использования техники прилож. С из закона преобразования тензора (2.3.8). Согласно (2.3.8) компоненты 7аЬ отличаются в первом порядке от jab 4- да£ь + дь£а просто преобразованием координат и, таким образом, представляют то же самое физическое возмущение. Мы можем использовать эту калибровочную свободу, для упрощения линеаризованного уравнения Эйнштейна. Решая уравнение дьдьи = -#67аб. (4.4.10) относительно £а, мы можем выполнить калибровочное преобразование (4.4.9) и получить условие дь%ь = 0, (4.4.11) которое является аналогом лоренцевой калибровки. В этой калибровке линеаризованное уравнение Эйнштейна упрощается: дсдс%ь = -16тгТа6, (4.4.12) и приобретает сходство с уравнением Максвелла (4.2.32). В вакууме (при Таь = 0) уравнения (4.4.11) и (4.4.12) в точности совпадают с уравнениями безмассового поля со спином 2 в плоском пространстве- времени (впервые (Fierz, Pauli 1939), см. гл. 13). Таким образом, в линейном приближении общая теория относительности сводится к теории безмассового поля со спином 2. Поэтому общую теорию относительности в целом можно рассматривать как теорию безмассового поля со спином 2, испытывающего нелинейное самодействие. Однако следует заметить, что понятия массы и спина поля требуют присутствия плоской фоновой метрики т]аь, которая есть в линейном приближении, но не в полной теории, так что вне контекста линейного приближения нельзя дать точный смысл утверждению, что в общей теории относительности гравитация трактуется как безмассовое поле со спином 2.
4.4. Теория гравитации в линейном приближении 125 4.4.1 Ньютонов предел Общая теория относительности может иметь большую эстетическую привлекательность, но это не означает, что ее предсказания находятся в согласии с природой. Мы знаем, что теория тяготения Ньютона дает превосходные предсказания в широком диапазоне условий. Поэтому первый решающий тест общей теории относительности заключается в том, чтобы свести ее предсказания к предсказаниям ньютоновской теории тяготения в данных условиях, когда известно, что теория Ньютона справедлива: а именно, когда гравитация слаба, относительное движение источников много медленнее, чем скорость света с, а внутренние напряжения вещества много меньше плотности массы- энергии (в системе единиц, где с = 1). Когда гравитация слаба, то в общей теории относительности должно иметь силу линейное приближение. Тогда допущения об источниках можно переформулировать следующим образом: существует глобальная инерциальная система координат паь, такая, что ТаЬ « ptah, (4.4.13) где ta = (д/дх°)а - "направление времени" этой системы координат (уравнение (4.4.13) утверждает, что Таь имеет только "временно- временную" компоненту; пренебрежение "пространственно-временными" компонентами есть по сути утверждение, что скорости (а также плотности импульса) являются малыми, в то время как пренебрежение "пространственно-пространственными" компонентами есть утверждение о том, что внутренние напряжения малы). Поскольку источники "медленно меняются", то мы ожидаем, что геометрия пространства- времени изменяется также постепенно, и, таким образом, мы ищем решения уравнения (4.4.12), в которых производные по времени от %ь пренебрежимо малы. С этими предположениями в нашей глобальной инерциальной системе координат компоненты уравнения (4.4.12) для всех /х и i/, кроме д = v = 0, таковы V27^ = 0, (4.4.14) в то время как V27oo = -16тгр, (4.4.15) где V2 обозначает обычный пространственный лапласиан. Единственное решение уравнения (4.4.14), хорошо ведущее себя на бесконечности, - это 7/11/ = 0 (решения 7/л/ = const также допустимы, но калибровочными преобразованиями их можно свести к случаю constant=0).
126 Глава 4. Уравнения Эйнштейна Поэтому в ньютоновом пределе наше решение для возмущенной метрики 7оЬ равно lab = lab ~ -jT]abl = ~ (4tatb + 2г}аЬ) ф, (4.4.16) где ф = -^7оо удовлетворяет уравнению Пуассона г \72ф = 4тгр. (4.4.17) Движение пробных тел в этой геометрии искривленного пространства-времени описывается уравнением геодезической ^ + Е^(*г)(*г)в0' (4А18) d2 dr2 где х**(т) - мировая линия частицы в глобальных инерциальных координатах. Для движения много медленнее, чем скорость света, во втором слагаемом мы можем аппроксимировать 4-скорость dxa/dr как (1,0,0,0), а собственное время г можно приближенно считать координатным временем t. Поэтому находим, что ^jT = -Г&. (4.4.19) Из нашего решения (4.4.16) для ц = 1,2,3 получаем Г£, = -!£М = -^ Г4 4 20) где вновь производные ф по времени были отброшены. Таким образом, движение пробных тел описывается уравнением a = -V<£, (4.4.21) где а = d2x/dt2 - ускорение тела относительно глобальных инерциальных КООрДИНаТ 7]аЬ- Очевидно, что (4.4.17) и (4.4.21) - основные уравнения ньютоновской теории тяготения и, таким образом, общая теория относительности действительно сводится к ньютоновской теории тяготения в соответствующем пределе. Отметим, однако, что несмотря на то, что предсказания общей теории относительности согласуются с ньютоновской теорией тяготения, основополагающая точка зрения общей теории относительности принципиально другая. С ньютоновской точки зрения,
4.4. Теория гравитации в линейном приближении 127 Солнце создает гравитационное поле, которое оказывает силовое действие на Землю, что, в свою очередь, приводит к движению Земли по траектории вокруг Солнца, а не по прямой. С общерелятивистской точки зрения, масса-энергия Солнца придает кривизну геометрии пространства-времени. Земля находится в свободном движении (нет сил, воздействующих на нее), и движется по геодезической линии метрики пространства-времени; но так как пространство-время искривлено, то эта траектория является орбитой вокруг Солнца. С ньютоновской точки зрения, Земля испытывает ускорение; с общерелятивистской точки зрения, это инерциальные наблюдатели плоской метрики Г)аъ ДОЛЖНЫ УСКОРЯТЬСЯ. Полезно изучить предсказания теории гравитации в линейном приближении, когда учитываются эффекты движения источников в низших порядках малости. Если мы продолжим пренебрегать внутренними напряжениями, тензор энергии-импульса аппроксимируется линейным приближением по скорости Tab = 2t{a Jb) - ptatb, (4.4.22) где Jb = —Tabta - 4-вектор плотности тока массы-энергии. Линеаризованное уравнение Эйнштейна вновь предсказывает, что пространственно-пространственные компоненты тензора %& удовлетворяют волновому уравнению без источника, но теперь пространственно-временные и временно-временные компоненты удовлетворяют уравнению дадаЧоц = 167rJM. (4.4.23) Таким образом, Аа = — \jabtb точно удовлетворяет уравнению Максвелла в лоренцевой калибровке с источником Ja. Если вновь предположить, что производные по времени ^аь пренебрежимо малы, то пространственно-пространственные компоненты %ь исчезают, и мы находим, что в линейном приближении по скорости пробного тела уравнение геодезической теперь дает (задача 3) 5=-E-4vxB, (4.4.24) где Е и В определены через Аа теми же формулами, что и в электродинамике. Это в точности уравнение с силой Лоренца электродинамики (при q = га), кроме знака минус и коэффициента 4 в слагаемом с "магнитной силой". Таким образом, теория гравитации в линейном приближении предсказывает, что движение массы производит магнитные гравитационные эффекты, очень похожие на магнитные эффекты электродинамики.
128 Глава 4. Уравнения Эйнштейна И последний, немного тревожащий пункт, нуждающийся в дополнительных комментариях. Выше мы показали, что общая теория относительности сводится к ньютоновской теории гравитации в соответствующем пределе, но, строго говоря, чтобы это продемонстрировать, мы вышли за рамки линейного приближения. Причиной является использование уравнения геодезической для описания движения пробного тела. Как упоминалось в конце разд. 4.3, "гипотеза о геодезической" логически вытекает из условия VaTab = 0, которое в свою очередь является следствием уравнения Эйнштейна. Однако в линейном приближении уравнение Эйнштейна (4.4.7) или (4.4.12) фактически имеет следствием условие даТаь = 0 (это разумно, поскольку в линейном приближении Таь уже "мало", так что отклонения оператора ковариантного дифференцирования от дифференциального оператора плоской метрики да вносит вклад лишь в высшем порядке). Но условие ^Таь = 0 означает, что пробные тела движутся по геодезической линии плоской метрики г)аъ\ т.е. если не выходить за пределы линейного приближения, то можно предсказать, что пробные тела не подвержены действию силы тяжести. Таким образом, при выводе уравнения (4.4.21) мы фактически вышли за пределы линейного приближения. Это, конечно, не делает наше рассуждение недействительным, но иллюстрирует сложности, которые возникают, когда пытаются вывести уравнения движения тел из уравнения Эйнштейна с помощью теории возмущений за пределами плоского пространства-времени. Чтобы получить хорошее приближение к решению данного порядка, нужно несколько иначе взглянуть на решения уравнений высшего порядка. 4.4.2 Гравитационное излучение Одно из наиболее значительных изменений в теории на пути от закона Кулона в электростатике к уравнениям Максвелла в электродинамике заключается в том, что электромагнитное поле становится динамической сущностью. Электромагнитное излучение может свободно распространяться через пространство-время. Подобное же изменение происходит, и когда идут от теории тяготения Ньютона к общей теории относительности: гравитационное излучение существует; т.е. рябь в кривизне пространства-времени может распространяться через пространство-время. В линейном приближении распространение гравитационного излучения описывается линеаризованным уравнением Эйнштейна без источников (см. выше (4.4.11) и (4.4.12)): да%ь = 0, (4.4.25) д?дс%ь = 0. (4.4.26)
4.4. Теория гравитации в линейном приближении 129 При выводе этих уравнений в начале этого раздела была выбрана калибровка (4.4.25). Однако остается свобода сделать дальнейшие калибровочные преобразования jab —> lab + да£ь + дь£а, обеспечивающие дьдьС = 0, (4.4.27) так как такие преобразования не изменяют уравнения (4.4.25). Это весьма похоже на электродинамику, где лоренцева калибровка устанавливает векторный потенциал Аа неоднозначно, и мы имеем ограниченную калибровочную свободу Аа —► Аа + даХ ПРИ условии дадаХ = 0. (4.4.28) При рассмотрении электромагнитного излучения удобно использовать остающуюся калибровочную свободу, чтобы установить компоненту Aq равной нулю в области свободной от источника (ja = 0) в некоторой глобальной инерциальной системе координат. Такой калибровки, называемой кулоновой или радиационной, можно достичь следующим образом. На поверхности постоянного времени t = to нашей глобальной инерциальной системы координат решаем уравнение V2x = - V • А, (4.4.29) и определяем решение уравнения (4.4.28) х во всем пространстве-времени, причем начальное значение на поверхности t = to дается с помощью (4.4.29), а начальная производная по времени равна d\jdt = — Ао. (То, что единственное решение (4.4.28) существует для произвольных начальных значений \ и ^х/dt логически вытекает из результатов разд. 10.1). Тогда функция /, определенная / = Ао + дх/Ы, (4.4.30) согласно (4.2.32) и (4.4.28) будет удовлетворять dadaf = -47TJ0. (4.4.31) Далее, на исходной поверхности t = to имеем / = 0, (4.4.32) Таким образом, если в рассматриваемой области (или, точнее, если для каждой точки р мы имеем jo = 0 на световом конусе р между ней и
130 Глава 4. Уравнения Эйнштейна поверхностью t = to) нет источников, то единственное решение (4.4.31) с начальными условиями (4.4.32) и (4.4.33) есть / = 0, и калибровочное преобразование Аа —► Аа + даХ приводит к желаемому услойию Ао = 0 тогда, когда лоренцева калибровка сохраняется. Примерно таким же образом в случае теории гравитации в линейном приближении мы можем использовать ограниченную калибровочную свободу (4.4.27), чтобы получить радиационную калибровку 7 = 0, 7о/х = 0 при /х = 1,2,3 в области без источников (Таь = 0). Как дополнительное вознаграждение мы также получаем 7оо = 0> если повсюду в пространстве-времени нет источников (т.е. не только в нашей области), и хорошее поведение на бесконечности. Чтобы найти радиационную калибровку, мы решаем на начальной поверхности t = £0 уравнения 2(~+V-() = -7 (4.4.34а) 2[-V2£0 + V • (dg/dt)] = -df/dt (4.4.34b) И+ё = -70"' ("=1'2'3> (4-4-34с> ^ + aSr(f) = -& (" = 1'2'3)' (4'4-34d) и получаем начальные значения £о> £ь &» £з и их первые производные по времени. Потом мы находим с этими начальными значениями £а - решение (4.4.27). Та же аргументация, что и в электромагнетизме, справедлива в отношении калибровочного преобразования, порождаемого £°: оно даст 7 = 0 и 7о/х = 0 (/z = 1,2,3) в области без источников, причем калибровка (4.4.25) остается. Наше вознаграждение 7оо = 0 появляется следующим образом. Так как 7 = 0? имеем уаь = 7аЬ- Так как 7о/х = 0 для /л = 1,2,3, то калибровка (4.4.25) дает ^ = 0. (4.4.35) Линеаризованное уравнение Эйнштейна (4.4.12) в таком случае принимает вид V27oo = -1б7гГ00. (4.4.36) Но если Too = 0 повсюду в пространстве-времени, то единственным решением (4.4.36), которое хорошо ведет себя на бесконечности, является 7оо = constant. С помощью дополнительного калибровочного преобразования получаем 7оо = 0 без нарушения какого-либо из предыдущих условий.
4.4. Теория гравитации в линейном приближении 131 Мы используем эту радиационную калибровку, чтобы найти решения линеаризованного уравнения Эйнштейна без источников. Плоские волны lab = НаЬ exp f i J2 к^ ) > (4.4.37) где Наь - постоянное тензорное поле, будут удовлетворять (4.4.26) тогда и только тогда, когда £ fc/% = 2 ^Г^у = 0- (4.4.38) /i fA,V Условия радиационной калибровки требуют (для v = 0,1,2,3) з ]rV#MI/ = 0, (4.4.39а) м=о Н0и = О, (4.4.39Ь) з ^Я% = 0. (4.4.39с) /х=0 Так как (4.4.39а) и (4.4.39Ь) приводят к ^ Н0ики = 0, то только восемь из этих девяти уравнений независимы. Поскольку существует 10 независимых компонент #м„, то для Наь остается два линейно независимых решения. Эти два решения описывают два независимых поляризационных состояния плоских гравитационных волн. Произвольное хорошо ведущее себя решение линеаризованного уравнения Эйнштейна в вакууме, т.е. произвольный пакет гравитационного излучения, можно выразить суперпозицией этих решений в виде плоских волн. Как бы мы могли обнаружить присутствие гравитационного излучения? Наиболее верным и прямым методом является изучение относительного ускорения двух масс, т.е. измерение гравитационной приливной силы. Для двух близко расположенных свободно падающих тел это ускорение описывается уравнением отклонения от геодезической (3.3.18). В нашем случае, если два тела находятся почти "в покое" в глобальной инерциальной системе координат г)аь, мы имеем daX^ -^2" « Х>"°одХ", (4.4.40)
132 Глава 4. Уравнения Эйнштейна где Ха - вектор отклонения. В радиационной калибровке (полагая <у00 = 0) из (3.4.4) мы получаем очень простое выражение для соответствующих компонент линеаризованного тензора Римана: RvOOfi = - rJ£" (радиационная калибровка). (4.4.41) (Между прочим, эта формула показывает, что решения в виде плоских волн, которые мы получили выше, физически значимы, так как производят ненулевую кривизну, т.е. их нельзя исключить никаким дополнительным калибровочным преобразованием.) Поэтому, в принципе, гравитационное излучение можно обнаружить точно отслеживая (скажем, с помощью лучей лазера) разделение двух свободно подвешенных масс; такую схему обнаружения можно реализовать на практике в недалеком будущем. В качестве варианта, если массы движутся не свободно, а связаны твердым куском вещества, то гравитационные приливные силы будут вызывать внутренние напряжения в веществе. Периодические внутренние напряжения вызвали бы упругие колебания по всему куску вещества, и их можно было бы обнаружить, если частота гравитационного излучения близка к резонансной частоте куска. Такую схему регистрации гравитационного излучения впервые предложил Джозеф Вебер, затем ее унаследовал ряд исследовательских групп. (Детали этих и других схем обнаружения гравитационных волн имеются в обзорах (Douglass, Braginsky 1979).) Необходимо подчеркнуть, что для обнаружения гравитационного излучения нужна предельная чувствительность. Для физически разумных астрофизических источников гравитационных волн не ожидается, что значения компонент 7/XI/ в радиационной калибровке в соответствующем диапазоне частот будут иметь величину большую, чем 10"17, см. например, (Thorne 1978). Согласно (4.4.40) и (4.4.41) это означает, что незначительное относительное смещение АХ/Х двух свободных масс не должно превышать 10~17, т.е. свободные массы, разнесенные на 1 метр, будут перемещены гравитационной волной примерно на 1/100 диаметра ядра! Внутренние напряжения в веществе соответствующе малы. Тем не менее многие исследователи верят, что однозначное обнаружение гравитационного излучения - дело недалекого будущего. Как создаются гравитационные волны? Наиболее вероятные источники (относительно) интенсивных всплесков гравитационного излучения возникают при коллапсе (см. гл. 12), где гравитация не является слабой; в таких случаях линейное приближение нельзя использовать, поэтому мы должны решать нелинейное уравнение Эйнштейна без приближений, и в связи со сложностью данной задачи наше знание этих процессов рудиментарно. Поэтому полезно изучить проблему
4.4. Теория гравитации в линейном приближении 133 генерации излучения в линейном приближении, где легко получить общее решение. Так как каждая составляющая 7аб удовлетворяет неоднородному уравнению скалярной волны в обыкновенных производных (4.4.12), то решение выражается через функцию источника с помощью той же запаздывающей функции Грина, что используется в теории скалярного поля и в электродинамике, а именно: 7^(x) = 4|^^d5(x'), (4.4.42) Л где Л обозначает световой конус прошлого для точки х и dS = r2drdf2 - элемент объема на световом конусе. Условие калибровки (4.4.11) для 7аб будет удовлетворено в силу линеаризованного закона сохранения ^Таъ = 0, так что (4.4.42) позволяет оценить гравитационные эффекты, вызываемые источниками в линейном приближении. (Условия радиационной калибровки, конечно, не наложены, так как источники присутствуют.) Интересно оценить наше решение в пределе медленного движения, т.е. в тех случаях, когда типичные скорости источника много меньше скорости света. (Точнее, мы рассмотрим предел, когда пространственное протяжение источника много меньше, чем типичный диапазон длин волн излучения.) В электродинамике этот предел известен как дипольное приближение, так как в этом случае основная часть излучения обусловлена изменением дипольного момента источника. Для того чтобы проанализировать указанный предельный случай гравитационного поля, мы выполним Фурье-преобразование всех величин по временной переменной t нашей глобальной инерциальной системы координат т)аь, оставляя пространственные переменные без преобразования. По определению 1 f°° %и(ш, x) = -==j %u{t, x )elu*d*, (4.4.43) и аналогично выполним Фурье-преобразование ТД1/. Из (4.4.42) следует V(«", *) = 4 / TZ^m exP(Mf - f |)dV, (4.4.44) где "дополнительный" множитель ехр(го;|х-х/|) возникает из-за того, что первоначальный интеграл (4.4.42) был взят по световому конусу прошлого. Нам нужно получить решения лишь для пространственно-
134 Глава 4. Уравнения Эйнштейна пространственных компонент 7/п/> так как остальные компоненты 7о,, легко выразить через 7/ii/ с помощью калибровочного условия (4.4.11): -*"** = t%r- (4А45> Поскольку мы интересуемся вычислением поля излучения, достаточно получить наше решение в "дальней зоне" R » 1/cj, где R означает расстояние от источника. В интересующем нас пределе представляющие интерес частоты достаточно малы, так что множитель ехр(га>|х—х'|) слабо изменяется в разложении по частотам источника, и мы можем заменить ехр((га>|х—х'|)/|х—х'|) на ехр(го>Д)/Д, а затем вынести его из-под интеграла. Оставшийся интеграл от пространственно- пространственных компонент Таь вычисляем следующим образом: = -iu}ff0,/xt,= = -у /(f°"x'1 + f0'V/) = д /Ма refop ,. Л -*£{/= F(r°^v)- [ /3=1 к" ' = -у [т™7ГтГ&х, (4.4.46) где во второй и пятой строках мы использовали теорему Гаусса, чтобы избавиться от полной дивергенции, а также сохранение Таь, чтобы выразить дивергенцию от пространственных компонент через производные по времени от временных компонент. Итак, в дальней зоне мы получаем решение: 7^ = ~3~д-^Н 0*." = 1.2,3), (4.4.47) где Яци - Фурье-преобразование тензора квадрупольного момента ^ = 3 / Т^х^х'^х. (4.4.48) Обратное Фурье-преобразование (4.4.47) дает W*.*) = ЙГйИ О*»" = 1.2,3), (4.4.49)
4.4. Теория гравитации в линейном приближении 135 где производная вычислена в момент запаздывающего времени t' = ^t — R. Таким образом, основная доля гравитационного излучения в приближении медленного движения возникает из-за темпа изменения квадрупольного момента источника. Запрет на дипольное излучение с физической точки зрения можно понять как результат сохранения импульса, который не позволяет дипольному моменту массы изменяться во времени. Вследствие запрета на дипольное излучение, излучение гравитационных волн в пределе медленного движения слабее, чем излучение в электродинамике в сопоставимых ситуациях. Проблема энергии в общей теории относительности требует деликатного рассмотрения. В общей теории относительности нет физически значимого понятия локальной плотности энергии гравитационного поля. Основная причина этого непосредственно связана с тем, что пространственно-временная метрика gab описывает как пространственно-временную структуру фона, так и динамику гравитационного поля, однако неизвестен естественный способ расщепить ее на "фоновую" и "динамическую" части. Так как хотелось бы отнести энергию к динамическому способу описания гравитации, а не к пространственно- временной структуре фона, то кажется маловероятным, чтобы понятие локальной плотности энергии могло получиться без соответствующего разложения пространственно-временной метрики. Тем не менее для изолированной системы полную энергию можно найти, если рассмотреть гравитационное поле на больших расстояниях от системы. Кроме того, для изолированной системы хорошо определен поток энергии, уносимой из системы гравитационным излучением. Развернутую дискуссию об энергии в общей теории относительности мы отложим до гл. 11. Однако для малых отклонений от плоского пространства-времени мы бы ожидали, что по аналогии со скалярным и электромагнитным полями (см. уравнения (4.2.20) и (4.2.27)), полная энергия и поток энергии излучения гравитационного поля квадратичны по полю 7аб- Формула для энергии и потока энергии излучения выводится с помощью следующих соображений. Линеаризованное вакуумное уравнение Эйнштейна G$bcd) = 0 ' (4.4.50) утверждает, что тензор Эйнштейна для метрики т]аЬ + 7аЬ зануляется в первом порядке по 7аб- Но во втором порядке по 7аЬ вакуумное уравнение Эйнштейна, вообще говоря, не выполняется. Действительно, компоненты тензора Риччи, квадратичные по 7аб> находятся (задача 4) так: Rab = \lCddadblcd-4Cddcd{alb)d +
136 Глава 4. Уравнения Эйнштейна \(daKd)db7Cd + (dd4Cb)dldJc)a + 4 + \ddbdcdc^b)-\(dc7)dclab- - {ddlcd - \дс1)д{аЪ)с. (4.4.51) Поэтому для того, чтобы сохранить решение вакуумного уравнения Эйнштейна во втором порядке, мы должны подправить 7а&, добавив к нему такое слагаемое уаЬ , чтобы G^b^) + G^bed]=0, (4.4.52) где (в случае Ra^ = 0) Ga^ = Ra)J - ^VabR^- Мы можем записать (4.4.52) в виде G$b£)]=**tab, (4-4.53) где tab = ~G$bcd]. (4.4.54) Таким образом, приближение второго порядка по 7а& приводит к такой же поправке к пространственно-временной метрике, как и обычная материя с тензором энергии-импульса tab- Более того, tab симметричен и сохраняется, datab = 0, при условии, конечно, что 7а& удовлетворяет линеаризованному уравнению Эйнштейна в вакууме (4.4.50). Это означает, что мы будем рассматривать tab как эффективный тензор энергий-напряжений гравитационного поля, имеющий смысл во втором порядке по отклонению метрики от плоской. Но эту интерпретацию нельзя принимать слишком буквально. Во-первых, локальное построение tab, квадратичное по 7а&, так же как его симметрии и свойства сохранения, не будут затронуты, если добавить к нему тензор вида dcddUacbdi где Uacbd локально построен из 7аб> квадратичен ПО 7а6 И удовлетворяет ТеНЗОрНЫМ СИММетрИЯМ Uacbd = U[ac]bd = = Uac[bd\ = Ubdac- (Действительно, компоненты псевдотензора Ландау- Лифшица, квадратичные по 7аб (Ландау, Лифшиц 1962), отличаются от нашего выражения для tab таким слагаемым). Более того, tab даже не калибровочно-инвариантен; т.е. если заменить 7аб на 7аЬ + 2д(а&)> то tab не остается неизменным. Это одно из проявлений вышеуказанного факта отсутствия в общей теории относительности осмысленного понятия локального тензора энергии-импульса гравитационного поля. Однако полная энергия, связанная с 7аб, -/• food я, (4.4.55)
4.4. Теория гравитации в линейном приближении 137 Х*4 7^< Рис. 4.2. Пространственно-подобная гиперплоскость Е. Полная энергия, содержащаяся в гравитационном излучении, получена интегрированием too no E (где интеграл берется по пространственно-подобной гиперплоскости £, изображенной на рис. 4.2,) является калибровочно-инвариантной в следующем смысле. Предположим, что возмущенная пространственно- временная метрика Т]аь + 7об асимптотически плоская, в том смысле, что инерциальные составляющие jab и их производные стремятся к нулю при г —> оо: 7/и/ = 0{1/г), др^^и = 0(1/г2) и dydpj^ = = 0(1/г3). (Отметим, что эти условия гарантируют сходимость интеграла (4.4.55), который определяет Е.) Тогда для любого калибровочного преобразования £а, которое сохраняет эти асимптотические условия, величина Е не изменяется: #[7аб] = Е[^аь + 2(?(а£ь)]. Нужны довольно длительные расчеты, чтобы непосредственно продемонстрировать эту калибровочную инвариантность Е, но простое доказательство ограниченной калибровочной инвариантности представлено в задаче 7. Более того, нетрудно проверить, что Е не изменяется, если выражение dcddUacbd с помощью упомянутых выше свойств добавляется к tab, так как интеграл по объему от этого выражения можно преобразовать по теореме Гаусса в поверхностный интеграл, который зануляется с учетом асимптотических условий. Аналогично, если пространство-время вначале не зависит от времени, потом проходит зависящую от времени фазу, и вновь становится независящим от времени, то общая энергия излучения АЕ = - [taodSa (4.4.56) является калибровочно независимой, хотя локальный поток энергии —tao и не является калибровочно инвариантным. Интеграл (4.4.56) берется по трехмерной времениподобной поверхности 5, изображенной на рис.4.3. Из него ясно, как действует предельный переход г —> оо на такую поверхность, причем на 7об наложены вышеуказанные условия асимптотической плоскостности при г —► оо вдоль асимптотически ну-
138 Глава 4. Уравнения Эйнштейна s Рис. 4.3. Асимптотически нулевые гиперповерхности Ei и Ег. Гравитационное излучение "регистрируется" на Еь но не "регистрируется" на Ег. Энергия АЕ, унесенная на бесконечность гравитационным излучением, определяется интегралом по времен и подобной гиперповерхности 5 левых поверхностей Ei и Ег в стационарных режимах. (Отметим, что в режиме зависимости от времени эти условия не были бы согласованы, так как в соответствие с нашим решением (4.4.42), мы ожидаем, что дрУщ, = 0(1 /г). В гл. 11 мы уточним предельный переход г —► оо вдоль нулевых поверхностей введя понятие нулевой бесконечности.) Используя (4.4.54) и (4.4.56), мы можем вычислить энергию, уносимую гравитационным излучением, для случая решения (4.4.49), полученного при возмущении метрики, создаемом медленно меняющимся источником. Длительный расчет (в котором многие слагаемые, будучи собраны вместе, сводятся к нулю) дает конечный результат АЕ= [ Pdt, (4.4.57) где и Qnv является бесследовым тензором квадрупольного момента Qnu = Яц» - -^S^q. (4.4.59) Эта формула показывает, что энергия, уносимая гравитационным излучением в "обыкновенных лабораторных процессах", крайне мала. Например, согласно (4.4.58), поток энергии гравитационного излучения от стержня массы М и длины L, который вращается относительно
4.4. Теория гравитации в линейном приближении 139 своего центра с частотой П (так что Таь колеблется с частотой 2П), равен 1С Prod = ^M2L4fi6, (4.4.60) где мы возвратили G и с в формулу, чтобы перейти к "негеометри- зованным" единицам. Поэтому стержень в 1 килограмм и длиной в 1 метр, вращающийся в угловой скоростью 1 радиан в секунду, излучает энергию в виде гравитационных волн с исключительно малым расходом энергии: приблизительно 10~47 эрг в секунду. Даже если мы увеличим стержень до астрономических размеров, поток гравитационной энергии излучения будет мал. И только в явлениях, вызванных сильными гравитационными полями, которые создаются в гравитационном коллапсе, можно ожидать ббльших потерь энергии. Наконец, обсудим обоснованность нашего решения для гравитационного излучения (4.4.42)-(4.4.49), а также для потока энергии излучения (4.4.58) от самогравитирующих источников. Как должно быть ясно из проведенных выкладок, решение (4.4.42) сохраняет силу для гравитационного излучения от таких источников, как вращающиеся стержни или массы, связанные пружинами, при том ограничении, что гравитация достаточно слаба и линейное приближение справедливо. Уравнения (4.4.49) и (4.4.58) имеют силу, если в добавление к сказанному и скорости источника малы. Однако, понятно, что наш вывод. неверен для излучения от источников, в которых существенна самогравитация, например, от почти ньютоновской системы двойной звезды, даже если гравитация слабая в том смысле, что инерциальные компоненты 7/д/ много меньше 1, и движение источника может быть медленным. Причина уже упоминалйть в конце разд.4.4.1: чтобы получить ньютонов предел согласованно, нужно выйти за рамки линейного приближения. В линейном приближении две звезды просто не вращались бы друг вокруг друга, а двигались бы по геодезическим плоской метрики, т.е. по прямым. Любое другое предположение несовместимо с даТаь = 0, которое логически вытекает из линеаризованного уравнения Эйнштейна. Даже если 7/xi/ ^ 1> нелинейные слагаемые в 7аб «е пренебрежимо малы при сопоставлении с компонентами внутреннего напряжения в Та&. Однако формулы для излучения от самогравити- рующей почти ньютоновской системы можно получить путем восстановления всех выражений более высокого порядка по 7аб в полевом уравнении Эйнштейна. В этом случае почти ньютоновское движение материального источника уже совместно. Нелинейные слагаемые в уаъ можно перенести в правую часть уравнения поля и рассмотреть как эффективный гравитационный тензор энергии-импульса tab. (Здесь Ьаь
140 Глава 4. Уравнения Эйнштейна включает все нелинейные слагаемые из Gab, а, не только квадратичные, как было определено выше для £а&.) Наше решение (4.4.42) теперь верно при условии замены Таь на (Таь + iab), хотя это больше не "решение", так как 1аь зависит от 7аб- В приближении медленного движения, мы вновь получаем (4.4.49) и (4.4.58), где £оо теперь включено в определение квадрупольного момента. Однако в почти ньютоновских ситуациях мы ожидаем, что Too ^ ^ось так что гравитационный вклад в квадрупольный момент должен быть пренебрежимо мал. Поэтому (4.4.49) и (4.4.58) должны остаться справедливыми без изменения для почти ньютоновской системы. Однако вывод этих уравнений с той же степенью точности и строгости, как в несамогравитирующем случае, пока не сделан. Вышеизложенные предсказания о потере энергии системами, обусловленной распространением гравитационного излучения, теперь подтверждены наблюдениями. Если две звезды при движении друг вокруг друга теряют энергию, то радиус их орбиты уменьшается, а орбитальная частота соответственно растет. Однако, так как потеря энергии из-за гравитационногб излучения такой системы крайне мала (задача 9), то реализация наблюдения ускорения вращения, обусловленного гравитационным излучением, требует: (i) крайне близких траекторий двойной звезды (что делает общерелятивистские эффекты настолько большими, насколько они допустимы), (ii) способности измерять изменения за период с крайне высокой точностью. Обнаружена замечательная бинарная система, удовлетворяющая этим двум свойствам (Hulse, Taylor 1975). Эта система состоит из двух компактных тел на эллиптической орбите с максимальным относительным расстоянием всего лишь ~ 1011 см (т.е. около одного радиуса Солнца). Наиболее важен тот факт, что одно из тел является пульсаром (см. конец разд. 6.2) и испускает радиоимпульсы в равномерном темпе, подобно часам. Так как время прибытия сигналов от пульсара можно измерить с очень высокой точностью, то запаздывания или опережения, обусловленные изменениями в положении и скорости пульсара, а также орбитальные параметры бинарной системы можно определить с соответственно высокой точностью. К тому же точность тем выше, чем дольше наблюдают за системой. В последние годы точность определения времени одного витка орбиты уже стала достаточно высокой, чтобы наблюдать повышение орбитальной частоты (Taylor, McCulloch 1980). Величина этого повышения находится в превосходном согласии с той величиной, что связана с потерей энергии, обусловленной гравитационным излучением, которая предсказана с помощью (4.4.58). Поэтому, если изменение орбитального периода в точности той же величины, что предсказывает
4.4. Теория гравитации в линейном приближении 141 общая теория относительности, не создается в указанной системе по какой-то другой причине, то можно утверждать, что эффект потери энергии из-за гравитационного излучения наблюдался. Задачи 1. Покажите, что уравнения Максвелла (4.3.12) имеют следствием строгое сохранение заряда, Va ja = 0. 2. (а) Пусть a - р-форма на n-мерном ориентированном многообразии с метрикой gab, т.е. aai...ap - полностью антисимметричное тензорное поле (см. прилож.В). Определим форму *а дуальную к a "av-.fcn-p = -ja01 '0p€ai...ap61..bn_p, где 6ai...an - естественный элемент объема на М, т.е. полностью антисимметричное тензорное поле, определенное с точностью до знака уравнением (В.2.9). Покажите, что **а = = (—l)s+p(n-p)a, где 5 - число минусов, встречающихся в сигнатуре gab. (b) Покажите, что уравнения Максвелла (4.3.12) и (4.3.13) с помощью дифференциальных форм (см. прилож. В) могут быть записаны как d*F = 47r*j, dF = 0. Отметьте, что если мы применяем теорему Стокса (см. прилож.В) к первому уравнению, то получаем /Е *j = ^ Js *F, где Е - трехмерная гиперповерхность с двухмерной границей S. Но -JE*j = — /sJa^odE - в точности суммарный электрический заряд е в объеме Е, где ta - единичный вектор, нормальный к Е, а —fs*F = JsEanadA - в точности интеграл от нормальной компоненты Еа = Fabtb на 5. Поэтому теорема Гаусса электродинамики в искривленном пространстве-времени продолжает оставаться в силе. (c) Определим для каждого /? £ [0,2п] тензорное поле Fab = = Fab cos/3+ * Fab sin 0. Мы называем Fab дуальным вращением Fab на "угол" /?. Как сразу же следует из задачи (Ь),
142 Глава 4. Уравнения Эйнштейна если Fab удовлетворяет уравнениям Максвелла без источника (ja = 0), то Fab удовлетворяет тем же уравнениям. Покажите, что тензор энергии-импульса Таъ решения Fab такой же, что и у Fab. 3. (а) Получите уравнение (4.4.24). (b) Покажите, что "гравитационные электрические и магнитные поля" Е и В внутри сферической оболочки массы М и радиуса Д (с М < Д), медленно вращающейся с угловой скоростью о;, равны Е = 0, В=--и. (c) Покоящийся в центре оболочки наблюдатель (см. задачу (Ь)) параллельно переносит вдоль своей (геодезической) мировой линии вектор Sa с Saua = 0, где иа - касательный вектор к мировой линии. Покажите, что инерциальные составляющие S испытывают прецессионное движение dS/dt = = U х 5, где U = 2В = §(М/Д)сЗ. Этот эффект Лензе- Тирринга (Thirring, Lense 1918) можно интерпретировать как "увлечение инерциальных систем координат", обусловленное вращением оболочки (Brill, Cohen 1966). В центре оболочки локальный стандарт "невращения", определяемый параллельным переносом вдоль геодезической, изменен по сравнению с тем, каким он был бы без оболочки, что до некоторой степени согласуется с принципом Маха. 4. Отталкиваясь от уравнения (3.4.5) для Rab и тщательно сохра- (2) няя квадратичные по 7аб выражения, получите (4.4.51) для Rab подстановкой rjab + 7ab для gab. 5. Пусть Tab будет симметричным сохраняющимся тензорным полем (т.е. Tab = Тьа, даТаь = 0) в пространстве-времени Мин- ковского. Покажите, что существует тензорное поле Uacbd с сим- метриями Uacbd = U[ac]bd = Uac[bd\ = Ubdac, такими, что Таь = = dcddUacbd- (Подсказка: для любого векторного поля va в пространстве-времени Минковского, удовлетворяющем dava = 0, существует тензорное поле sab = —sba такое, что va = dbSab. (Это логически вытекает из обратной леммы Пуанкаре (см. конец при- лож. В.1), примененной к 3-форме eabcdVd. Используйте этот факт, чтобы показать, что Таъ = dcWcab, где Wcab = И^св]ь. Затем используйте dcWc[ab] = 0, чтобы получить желаемый результат.)
4.4. Теория гравитации в линейном приближении 143 6. Как уже обсуждалось, в общей теории относительности неизвестно правильное выражение для локального тензора энергии- импульса гравитационного поля. Однако четырехиндексный тензор Tabcd можно построить из кривизны методом, довольно похожим на способ, которым тензор внутренних напряжений электромагнитного поля составлен из Fab (уравнение (4.2.27)). Определим тензор Бела-Робинсона через тензор Вейля Tabcd = CaecfCbed + Т^ае ^Ь*3kChicfCj d = 3 = CaecfCbedf - 2^alb^jk]cfCjkdf, где eabcd определен в прилож. В, и было использовано (В.2.13). Откуда следует, что TabCd = T(abcd)- (Это легко установить из спинорного разложения тензора Вейля, данного в гл. 13). (a) Покажите, что Taacd = 0. (b) Используя тождество Бианки (3.2.16), покажите, что в вакууме, Rab = 0, имеем VaTabCd = 0. 7. (а) Покажите, что полная энергия Е в (4.4.55) не зависит от времени, т.е. величина Е не изменяется, если интегрирование проведено по гиперповерхности Е' со сдвинутым относительно Е временем. (Ь) Пусть £0 - калибровочное преобразование, которое исчезает вне ограниченной области пространства. Покажите, что E[jab] = Е[чаъ + 2д{а£ь)] сравнением с Е[чаЬ + 2д{а?ь)], где ££ - новое калибровочное преобразование, которое совпадает в окрестности гиперплоскости Е с £а и исчезает в окрестности другой гиперплоскости Е'. 8. Две равных точечных массы М прикреплены к концам пружины жесткости К. Пружина приводится в колебание. Какова доля энергии колебания пружины, уносимой излучением за время одного периода колебания в квадрупольном приближении (4.4.58)? 9. Бинарная система звезд состоит из двух звезд массы М и обладает пренебрежимо малым радиусом R почти ньютоновской круговой орбиты обращения звезд друг вокруг друга. Полагая, что для этой системы имеет силу (4.4.58), вычислите темп роста орбитальной частоты из-за гравитационного излучения.
Глава 5 Однородная изотропная космология Общая теория относительности была сформулирована в предыдущей главе. Суть теории содержит утверждение в конце разд. 4.3: пространство-время является четырехмерным многообразием, которое определяет метрику gab с сигнатурой Лоренца. Метрика непосредственно связана с распределением материи в пространстве-времени уравнением Эйнштейна Gab = SnTab. Один из наиболее существенных вопросов, выдвинутых теорией, такой: какое решение уравнения Эйнштейна описывает пространство- время, которое мы наблюдаем, т.е. какое решение соответствует нашей Вселенной или по крайней мере идеализированной модели нашей Вселенной? Чтобы ответить на этот вопрос, мы сначала должны собрать исходную информацию на основе наблюдательных данных и предположений о природе нашей Вселенной. Владея этой информацией, мы затем сможем решить уравнения Эйнштейна и сделать предсказания, касающиеся динамической эволюции Вселенной. В этой главе мы будем исследовать структуру нашей Вселенной, как ее предсказывает общая теория относительности при допущении, что существующая Вселенная однородна и изотропна. Точная математическая формулировка этого предположения дается в разд. 5.1. Динамические предсказания общей теории относительности выводятся в разд. 5.2. В разд. 5.3 мы обсуждаем две важные особенности однородной изотропной космологической модели: космологическое красное смещение и горизонты частиц. Наконец, в разд. 5.4 мы даем краткое изложение истории нашей Вселенной. 5.1 Однородность и изотропность В космологии как физическом учении о Вселенной очень сложно Доказать какую-либо теорию, обращаясь только к данным наблюдения. За время нашей жизни и даже за время существования человеческой цивилизации мы имеем прямой контакт только с ничтожно малой областью пространства-времени нашей Вселенной. В то время как с помощью наших телескопов можно наблюдать весьма удален-
146 Глава 5. Однородная изотропная космология ные объекты, с точки зрения обычных человеческих масштабов следует признать, что в космических масштабах эти приборы сообщают сведения только о некоторой части нашего светового конуса прошлого. Поэтому наш подход к предмету космологии в основном возникает из наших философских воззрений или предубеждений. Данные наблюдений могут подтверждать эти предубеждения, но вообще говоря, нельзя ожидать, что данные наблюдений окончательно доказывают, что предубеждения правильны. Тем не менее космологические модели, рассматриваемые в этой главе, обеспечили исключительно полное представление о природе Вселенной. Со времен Коперника обычно предполагалось, что мы не занимаем в нашей Вселенной привилегированного положения; так что если бы мы располагались в ее различных областях, то основные характеристики нашего окружения казались бы теми же самыми. Также естественно принять, что Вселенная изотропна, т.е., что нет преимущественных направлений в пространстве, что наблюдения на достаточно крупных масштабах должны приводить к результатам, которые не зависят от направления, вдоль которого мы ведем наблюдения. Эти философские воззрения об однородности и изотропности получили убедительное подтверждение в современных наблюдениях. Несмотря на то, что наблюдения за распределением галактик в нашей Вселенной показали кластеризацию галактик в скопления в широком диапазоне масштабов длин, а недавние наблюдения (Kirshner, Oemler, Schechter, Shectman 1981) выявили большие области, лишенные галактик, тем не менее на еще более крупных масштабах распределение галактик оказалось однородным и изотропным. Подсчеты источников радиоизлучения, изотропия рентгеновского излучения и фонового гамма-излучения также поддерживают гипотезы об однородности и изотропности Вселенной на больших масштабах. Еще более сильным наблюдательным свидетельством однородности и изотропности нашей Вселенной стало обнаружение излучения с температурой около ЗК, заполняющего нашу Вселенную. Это излучение, как измеренное с очень высокой точностью, является изотропным. Как сказано в разд. 5.4, предполагается, что это излучение имеет космологическое происхождение, и было бы очень трудно объяснить его существование и его изотропность, если бы гипотеза об однородности и изотропности Вселенной не имела бы силы как очень хорошее приближение на больших масштабах. Поэтому в остальной части этой главы мы будем развивать теорию предположения, что Вселенная однородна и изотропна. Наша первая задача заключается в том, чтобы точно сформулировать математический смысл этого предположения. Проще говоря, однородность
5.1. Однородность и изотропность 147 Рис. 5.1. Гиперповерхности пространственной однородности в пространстве- времени. По определению однородности, для каждого t и каждой пары р, q € Et существует изометрия пространства-времени, которая переводит р в q означает, что в любой данный "момент времени" каждая точка "пространства" должна "выглядеть аналогично" любой другой точке. Точная формулировка может быть дана следующим образом: говорят, что пространство-время является (пространственно) однородным, если существует однопараметрическое семейство пространственноподоб- ных гиперповерхностей £*, расслаивающих пространство-время (см. рис. 5.1) так, что для каждого t и для любых точек р, q € £* существует изометрия метрики пространства-времени gab, которая переводит р в q (см. определение изометрии в прилож. С). Что касается изотропии, то, во-первых, следовало бы указать, что, вообще говоря, в каждой точке по крайней мере один наблюдатель может видеть Вселенную как изотропную. Например, если Вселенную заполняет обычное вещество, то любой наблюдатель, движущийся относительно этого вещества, должен видеть анизотропное распределение скоростей вещества. Помня об этом, можно дать точную формулировку понятию изотропии следующим образом: говорят, что пространство- время (пространственно) изотропно в каждой точке, если существует конгруэнция времениподобных кривых (т.е. наблюдателей) с касательными, обозначенными иа, заполняющих пространство-время (см. рис. 5.2) и удовлетворяющих следующему свойству. Для любой заданной точки р и двух любых заданных единичных "пространственных" касательных векторов з?, s§ € Vp (т.е. векторы в точке р ортогональны к иа) существует изометрия gab, которая оставляет р и иа в р неизменными, но поворачивает s£ в sg. Поэтому в изотропной Вселенной невозможно построить геометрически выделенный касательный вектор, ортогональный к иа. Нетрудно понять, что в случае однородного и изотропного пространства-времени поверхности однородности £* должны быть ортого-
148 Глава 5. Однородная изотропная космология Щ Рис. 5.2. Мировые линии изотропных наблюдателей в пространстве-времени. По определению изотропии, для любых двух векторов з? и s§. ортогональных к иа в точке р, существует изометрия пространства-времени, которая оставляет р и иа в р неизменными, но поворачивает sj в s§ нальными к касательным иа мировых линий изотропных наблюдателей. Если это не так, то полагая единственность изотропных наблюдателей и семейства однородных поверхностей Е*, факт невозможности совпадения касательного подпространства с ортогональным к иа касательным пространством Е* позволил бы нам придумать геометрически предпочтительный пространственный вектор в нарушение изотропии. (Если изотропные наблюдатели или семейство однородных поверхностей не единственны, как это может быть в особых случаях, например, в плоском пространстве-времени, то можно все же доказать существование семейства изотропных наблюдателей, ортогональных к семейству однородных поверхностей.) Далее, метрика пространства- времени gab индуцирует риманову метрику hab(t) на каждой поверхности Е*, ограничивая действие gab в каждой точке р £ Е* векторами, касательными к Е*. Индуцированная пространственная геометрия на поверхностях Е* существенно ограничена из-за следующих требований: (i) в силу однородности должны быть изометрии hab, которые переводят любую р Е Е* в любую q € Et; (ii) в силу изотропии невозможно построить какие-нибудь геометрически предпочтительные векторы на Ее. Теперь мы покажем, что второе требование, будучи следствием изотропии, является особенно ограничивающим. Рассмотрим тензор Ри-
5.1. Однородность и изотропность 149 мана ^Rabcd на Е*, построенный из hab. Если мы поднимаем третий индекс с помощью /iab, то мы можем рассматривать ^Rabcd в точке р как линейное отображение L векторного пространства 2-форм W (т.е. антисимметричных тензоров ранга (0,2)) в точке р в себя L : W —► W. Вследствие (3.2.20) L симметрично, т.е. это самосопряженное отображение (с естественным, положительно определенным внутренним произведением на W, определенным в метрике hab). Поэтому W имеет ортонормированный базис собственных векторов L. Если бы собственные значения этих собственных векторов отличались, тогда мы смогли бы указать геометрическую процедуру для выбора предпочтительной 2-формы ври, следовательно, предпочтительного вектора в р. Таким образом, чтобы не нарушать изотропию, все собственные значения L должны быть одинаковыми. Это означает, что L кратно тождественному оператору, L = KL (5.1.1) То есть ™Rabcd = К6с[а6% (5.1.2) Поэтому, опуская индекс, имеем (3)Rabcd = Khc[ahb]d. (5.1.3) Требование (i) однородности приводит к тому, что К должно быть постоянной величиной, т.е. она не может изменяться от точки к точке на Е*. Интересно отметить, что фактически требование (и) изотропии в каждой точке так же приводит к постоянству К. Чтобы доказать это, мы подставим (5.1.3) в тождество Бианки (3.2.16): 0 = D[e {3)Rab]cd = {DleK)hMahb]d, (5.1.4) где Da обозначает дифференциальный оператор на Et, связанный с hab. (Мы употребляем обозначение Da вместо Va во избежание путаницы с метрически совместимым дифференциальным оператором на четырехмерном пространстве-времени, который ассоциирован с gab.) На многообразии размерности три или более, правая часть (5.1.4) будет зануляться тогда и только тогда, когда DeK=0, т.е. К постоянная. Поэтому мы можем фактически обходиться без предположения о наличии однородности при обсуждении геометрии Е*. Пространство, в котором справедливо уравнение (5.1.3) (с AT=const), называется пространством постоянной кривизны. Можно показать (Eisenhart 1949), что любые два пространства постоянной кривизны
150 Глава 5. Однородная изотропная космология одинаковой размерности и с одинаковой сигнатурой метрики, в которых одинаковы значения К, должны быть (локально) изометрическими. Поэтому наша задача определения допустимых пространственных геометрий на £* будет завершена, если мы перечислим пространства постоянной кривизны, включающие все значения К. Это легко сделать. Все положительные значения К достигаются на 3-сферах, определенных как поверхности в четырехмерном плоском евклидовом пространстве R4, декартовы координаты которых удовлетворяют условию x2 + y2 + z2 + w2 = R2. (5.1.5) В сферических координатах метрика единичной 3-сферы равна ds2 = #2 + sin2 ф (йв2 + sin2 вдф2). (5.1.6) Значение К = 0 достигается в обычном трехмерном плоском пространстве. В декартовых координатах эта метрика равна ds2 = dx2 + dy2 + d*2. (5.1.7) Наконец, все отрицательные значения К достигаются на трехмерных гиперболоидах, определенных как поверхности в четырехмерном плоском пространстве лоренцевой сигнатуры (т.е. в пространстве-времени Минковского), глобальные инерциальные координаты которых удовлетворяют условию t2-x2-y2-z2 = R2. (5.1.8) В гиперболических координатах метрика на единичном гиперболоиде равна ds2 = dip2 + sh2 <ф (d02 + sin2 вдф2). (5.1.9) Следует подчеркнуть появление новых возможностей для описания глобальной пространственной структуры нашей Вселенной. В дореля- тивистской физике, так же, как и в специальной теории относительности, предполагалось, что пространство имеет плоскую структуру, которая дается вышеуказанной возможностью К = 0. Но даже при сильных ограничениях, возникших из предположений об однородности и изотропии, структура общей теории относительности допускает две иные отличающиеся друг от друга возможности. Возможность существования пространственной геометрии 3-сферы особенно интересна, так как это компактное многообразие (см. прилож. А) и поэтому описывает Вселенную, которая конечна, но не имеет границы. Такая Вселенная называется "замкнутой", в то время как Вселенная
5.1. Однородность и изотропность 151 с некомпактными пространственными сечениями, такими, которые задаются геометрией плоскости и гиперболоида, называется "открытой". (Можно построить замкнутые Вселенные с плоской или гиперболической геометриями посредством топологического отождествления при ее построении, но этот путь не кажется естественным.) Таким образом, общая теория относительности поднимает интригующий вопрос: является ли замкнутой или открытой наша Вселенная? Мы обсудим постановку этого вопроса в конце разд. 5.4. Так как изотропные наблюдатели ортогональны к поверхностям однородности, то мы можем выразить четырехмерную метрику пространства-времени gab как 8аЬ = -иаЩ + habit), (5.1.10) где для каждого t метрика hab(t) описывает: (а) сферу, или (Ь) плоское евклидово пространство, или (с) гиперболоид на £*. Можно выбрать удобные координаты на четырехмерном пространстве-времени следующим образом. Выберем, соответственно, или (а) сферические координаты, или (Ь) прямоугольные координаты, или (с) гиперболические координаты на одной из гиперповерхностей однородности. Затем "перенесем" эти координаты на каждую другую гиперповерхность однородности посредством наших изотропных наблюдателей; т.е. мы приписываем определенную метку пространственной координаты каждому наблюдателю. Наконец, мы помечаем каждую гиперповерхность посредством собственного времени г, отсчитываемого по часам, переносимых любым из изотропных наблюдателей. (Вследствие однородности все изотропные наблюдатели должны прийти к согласию при измерении разности по времени между любыми двумя гиперповерхностями.) Таким образом, г и наши пространственные координаты помечают каждое событие во Вселенной. Выраженная в этих координатах метрика пространства-времени имеет вид Г Ш2 + sin2 ф (d02 + sin2 0d<f>2)] ds2 = -dr2 + а2(т) • { {dx2 + dy2 + dz2) , (5.1.11) { [dr/>2+sh2xP(de2 + sm20d(f>2)] где в скобке отмечены три возможности, соответствующие трем допустимым пространственным геометриям. [Чтобы выглядеть более похожей на другие случаи, метрика для пространственно-плоского случая могла бы быть записана в сферической системе координат как ф/>2 + ф2 (d02 + sin2 0d<l)2).] Общая форма метрики (5.1.11) приводит к
152 Глава 5. Однородная изотропная космология космологической модели Робертсона-Уокера. Итак, только наши предположения однородности и изотропии определили метрику пространства-времени с точностью до трех дискретных возможностей пространственной геометрии и произвольной положительной функции а(т). Чтобы определить пространственную геометрию и а(т), обратимся к уравнению Эйнштейна. 5.2 Динамика однородной изотропной Вселенной Наша цель теперь подставить метрику пространства-времени (5.1.11) в уравнения Эйнштейна (4.3.21), чтобы получить предсказания динамической эволюции Вселенной. Первым шагом будет описание материи, содержащейся во Вселенной, с помошью ее тензора энергии- импульса Таь, который входит в правую часть уравнений Эйнштейна. Предполагается, что большая часть массы-энергии во Вселенной в настоящий момент находится в обычной материи и сконцентрирована в галактиках. Хотя, как обсуждается в конце этой главы, существует достаточно много неопределенностей и несоответствий в определениях массы, так что даже это утверждение еще не является безоговорочным. На космических масштабах, с которыми мы имеем дело, каждую из галактик можно идеализировать, представив ее "пылинкой". Скорости хаотического движения галактик малы, так что "давление" этой пыли галактик незначительно. Вследствие изотропии мировые линии галактик должны совпадать с мировыми линиями изотропных наблюдателей. (Если это не так, то можно было бы использовать относительное движение галактик и наблюдателей, чтобы определить предпочтительное пространственное направление.) Поэтому с хорошим приближением тензор энергии-импульса материи в нынешней Вселенной принимает вид Tab = риаЩ, (5.2.1) где р - средняя плотность материи. Однако другие виды массы-энергии также существуют во Вселенной. Как уже упомянуто выше, тепловое распределение излучения при температуре около ЗК заполняет Вселенную. Это излучение может быть также описано тензором энергии-импульса идеальной жидкости, но с давлением не равным нулю; действительно, для безмассового теплового излучения имеем Р = р/3. Вклад этого излучения в тензор энергии-импульса настоящей Вселенной незначителен, но, как будет показано дальше в этом
5.2. Динамика однородной изотропной Вселенной 153 разделе и в разд. 5.4, предсказывается, что это излучение создает преобладающий вклад в Таь на ранней стадии эволюции Вселенной. Таким образом, при рассмотрении уравнений Эйнштейна мы будем полагать, что Tab имеет форму, обобщающую свойства идеальной жидкости, Tab = рПаЩ + P(gab + ^б). (5.2.2) При ограничении нашего исследования такой формой Таь не происходит потери общности, так как это действительно наиболее общий вид Т06) который совместим с однородностью и изотропией. Теперь возникает задача вычисления Gab для метрики (5.1.11) и приравнивания его 87гГаб согласно (5.2.2). A priori мы получим 10 уравнений, соответствующих 10 независимым компонентам симметричного двухиндексного тензора. Однако нетрудно понять, что вследствие симметрии пространства-времени только два уравнения окажутся независимыми в этом случае. А именно, вектор GabUb (а также ТаЬщ) не может иметь пространственную компоненту, иначе изотропия будет нарушена. Поэтому "пространственно-временные" компоненты уравнений Эйнштейна тождественно равны нулю. Аналогично, если мы проектируем оба индекса Gab на однородную гиперповерхность и поднимаем индекс с помощью пространственной метрики, то тот же самый аргумент, что привел нас к (5.1.1), указывает, что получающийся в результате тензор должен быть кратен тождественному оператору. Поэтому недиагональные "пространственно-пространственные" компоненты уравнений Эйнштейна должны исчезать, а диагональные "пространственно-пространственные" компоненты дают одинаковые уравнения. Таким образом, независимые составляющие уравнений Эйнштейна - это просто: GTT = 87гТтт = 8тгр, (5.2.3) G** = 8тг7;* = 8тгР, (5.2.4) здесь GTT = GabUaub и G** = GabSasb, где sa - любой единичный вектор, касательный к гиперповерхностям однородности. Теперь нам осталась только механическая задача - выразить GTT и G** через а(т). Мы представим решение только для случая плоской пространственной геометрии, т.е. ds2 = -dr2 + а2(т) (dx2 + dy2 + dz2), (5.2.5) используя способ координатного базиса. Согласно (3.1.25) ненулевые компоненты символа Кристоффеля сводятся лишь к Гтхх = Ттуу = TTZZ = aa, (5.2.6)
154 Глава 5. Однородная изотропная космология Vх хт = Vх тх = rV = ГУ гу = Г*хг = Г* TZ = а/а, (5.2.7) где а = da/dr. Следовательно, по формуле (3.4.5) независимые компоненты тензора Риччи равны Rtt = —За/а, Поскольку Р = —Rtt "Ь ЗР** = то мы получаем Ргг + ^Р = За2 /а2 = 8тгр, (5.2.11) Р** - ^Р = -1- - %: = 8тгР. (5.2.12) 2 а а2 Применяя первое уравнение, мы можем переписать второе уравнение как За/а = -4тг(р + ЗР). (5.2.13) Повторяя вычисление для сферической и гиперболической геометрий (задача 2), мы получаем общие уравнения эволюции для однородной изотропной космологии: 3d/a2 = 8тгр - 3fc/a2, (5.2.14) За/а = -4тг(р + ЗР), (5.2.15) где к = +1 для 3-сферы, к = О для плоского пространства и к = — 1 для гиперболоида. Точные решения этих уравнений для случаев пыли (Р = 0) и излучения (Р = р/3) представлены в табл. 5.1. Однако сначала мы исследуем некоторые важные качественные свойства решений. Первый поразительный результат - Вселенная не может быть статической - обеспечивается лишь тем, что р > 0 и Р ^ 0. Этот вывод прямо следует из уравнения (5.2.15) и указывает нам, что a < 0. Поэтому Вселенная должна всегда или быть расширяющейся (а > 0) или сжимающейся (а < 0) (возможно, за исключением момента времени, когда расширение сменяется сжатием). Уточним природу такого расширения или сжатия: масштаб длины между всеми изотропными (5.2.8) a a2 = -+2-r. 5.2.9) a az 6G + £)' («-"О) GTT — G.. =
5.2. Динамика однородной изотропной Вселенной 155 наблюдателями (в частности, между галактиками) со временем меняется, но нет предпочтительного центра расширения или сжатия. Действительно, если R - расстояние (измеренное на однородной поверхности) между двумя изотропными наблюдателями в момент времени г, то темп изменения R равен dR Rda v=^ = -?T = HR, (5.2.16) dr a dr где Н(т) = а/а называется постоянной Хаббла. (Отметим, однако, что значение Н со временем меняется.) Уравнение (5.2.16) известно как закон Хаббла. Обратите внимание, что v может быть больше, чем скорость света, если расстояние R достаточно велико. Это не противоречит основному принципу специальной и общей теории относительности, что "ничто не может перемещаться быстрее, чем свет", так как сам принцип относится к локально измеренной относительной скорости двух тел в таком же пространственно-временном событии, а не к глобально определенной скорости между удаленными объектами. То, что расширение Вселенной происходит в соответствии с законом (5.2.16), подтверждено наблюдением красных смещений далеких галактик. Далее в этой главе будет представленно более детальное объяснение этих наблюдений. Подтверждение этого поразительного предсказания общей теории относительности является ярким успехом теории. К сожалению, историческое развитие событий омрачило этот успех. Эйнштейн был так огорчен предсказанием динамической Вселенной, что предложил модифицировать свои уравнения, дополнив их новым слагаемым следующим образом: Gab+ Л&6 = 8тгГа6, (5.2.17) где Л - новая универсальная постоянная природы, называемая космологической постоянной. (Можно показать (Lovelock 1972), что линейная комбинация Gab и gab образует наиболее общий двухиндексный симметрический тензор, который является бездивергентным и может быть построен локально из метрики и ее производных до второго порядка. Поэтому (5.2.17) является наиболее общей модификацией, которая не слишком изменяет основные свойства уравнений Эйнштейна. Если Л ф О, то невозможно получить ньютоновскую теорию при медленном движении в приближении слабого поля; но если Л достаточно мала, то отклонения от теории Ньютона были бы незаметны.) С этой дополнительной однопараметрической степенью свободы статические решения существуют, однако они требуют точной подгонки
156 Глава 5. Однородная изотропная космология параметров и неустойчивы, во многом подобны карандашу, поставленному на заостренный конец (см. задачу 3). Так, Эйнштейн смог модифицировать теорию, чтобы получались статические решения. После наблюдений Хабблом в 1929 году красного смещения, доказывающего расширение Вселенной, начальная мотивация для введения Л была утрачена. Тем не менее введение Л повторялось из раза в раз, когда между теорией и наблюдениями возникали противоречия, только для того, чтобы быть вновь отброшенной, когда эти противоречия разрешались. В последующем мы примем, что Л = 0. Полагая, что Вселенная расширяется, а > 0, мы понимаем из уравнения (5.2.15), что а < 0, так что Вселенная должна была расширяться все быстрее и быстрее при обращении времени вспять. Если бы Вселенная всегда расширялась в нынешнем темпе, то во время Т = а /а = Н~1 тому назад мы имели бы а = 0. Так как фактически ее расширение было более быстрым, то время, при котором а было равно нулю, было еще ближе к настоящему времени. Поэтому приняв однородность и изотропию, общая теория относительности делает поразительное предсказание, что во время, меньшее чем Я"1 тому назад, Вселенная находилась в особом состоянии: расстояние между всеми "точками пространства" было равно нулю; плотность материи и кривизна пространства-времени были бесконечными. Это сингулярное состояние Вселенной называется большой взрыв. Отметим, что природа этой сингулярности состоит в однородном сжатии пространства до "нулевого размера". Большой взрыв не представляет собой взрыва материи, сконцентрированной в точке предсу- ществовавшего несингулярного пространства-времени, как это иногда описывается и как можно предполагать из самого названия. Так как пространственно-временная структура сама по себе сингулярна при большом взрыве, то нет смысла ни физического, ни математического, спрашивать о состоянии Вселенной "до" большого взрыва. Нет естественного способа расширить пространственно-временное многообразие и метрику за сингулярность большого взрыва. Поэтому общая теория относительности приводит к точке зрения, что Вселенная имеет начало в большом взрыве. В течение многих лет обычно предполагалось, что предсказание о сингулярном начале Вселенной соответствовало просто предположениям о точной однородности и изотропии, так что если эти предположения были бы ослаблены, то при малых а получили бы несингулярный "отскок", а не сингулярность. Однако теоремы о сингулярности в общей теории относительности (гл. 9) показывают, что сингулярности - это неотъемлемые свойства космологических решений; они исключили возможность близости решений моделей с "от-
5.2. Динамика однородной изотропной Вселенной 157 скоком" и однородных изотропных моделей. Конечно, ожидается, что в экстремальных условиях, весьма близких к сингулярности большого взрыва, квантовые эффекты станут значительными, и предсказания классической общей теории относительности окажутся несправедливыми (гл. 14). Перед обсуждением качественных предсказаний общей теории относительности о будущей эволюции Вселенной полезно получить уравнение для эволюции плотности вещества. Умножая уравнение (5.2.14) на а2, дифференцируя его по г и затем исключая а с помощью (5.2.15) (или непосредственно из уравнения (4.3.7)), мы получаем р + 3(р + Р)а/а = 0. (5.2.18) Поэтому для пыли (Р = 0) находим уравнение pa3 = const, (5.2.19) которое выражает сохранение массы покоя, в то время как для излучения (Р = р/3) pa4 = const. (5.2.20) В этом случае при возрастании а плотность энергии убывает быстрее, чем объем а3, так как излучение совершает работу над своим окружением в каждом элементе объема при расширении Вселенной. (То же, но на языке фотонов, объясняется так: концентрация фотонов уменьшается как а~3, но каждый фотон теряет энергию как а-1 из-за красного смещения, см. разд. 5.3.) Сопоставление выражений (5.2.19) и (5.2.20) показывает, что хотя доля излучения в современной Вселенной может быть пренебрежимо мала, его вклад в суммарную плотность массы достаточно давно в прошлом (а —► 0) должен был доминировать над вкладом обычного вещества. Теперь качественные особенности будущей эволюции нашей Вселенной можно увидеть. Уравнение (5.2.14) показывает, что если fc=0 или -1, то а никогда не обратится в нуль. Поэтому, если Вселенная сейчас расширяется, то она должна продолжать расширяться всегда. Действительно, для любой материи сР^О при возрастании а плотность р должна уменьшаться по крайней мере (как для пыли) так же быстро, как а""3. Поэтому ра2 —► 0 при а —> оо. Следовательно, если к = 0, то "скорость расширения" а асимптотически стремится к нулю при т —► оо, в то время как, если к = —1, то а —» 1 при г —* оо. Однако, если к = +1, Вселенная не может расширяться всегда. Первое слагаемое правой части уравнения (5.2.14) уменьшается вместе с а быстрее, чем второе слагаемое, и поскольку левая часть должна
158 Глава 5. Однородная изотропная космология Таблица 5.1. Космологии Робертсона-Уокера при заполнении пылью и излучением Пространственная геометрия 3-сфера, к = +1 Плоская, к = 0 Гиперболическая, к = -1 "Пыль" Р = 0 а = \С{\ -cost;) г = \C(r)- sin rj) а = (9С/4)1/3т2/з а = lC(cosh77 — 1) т = lC(sinh77-?7) Тип материи Излучение o=V^7[l-(l-r/4/C7)2]1/2 о = (4С')1/4г1/2 а = ч/С7[(1+т/ч/С7)2-1]1/2 быть положительной, то имеется критическая величина ас, такая, что а ^ ас. Кроме того, а не может асимптотически приближаться к ас при г —> оо, потому что величина а ограничена снизу вследствие (5.2.15). Поэтому, если к = -Ы, то за конечное время после рождения Вселенной в большом взрыве она достигнет максимального размера ас, a затем начнет вновь сжиматься. Та же аргументация, что выше дала объяснение, почему большой взрыв кладет начало Вселенной, теперь показывает, что за конечное время после того, как наступит повторное сжатие, произойдет "большой хруст" - конец Вселенной. Следовательно, уравнения динамики общей теории относительности показывают, что пространственно замкнутая Вселенная с метрикой 3-сферы будет существовать только на конечном промежутке времени. Теперь обратим наше внимание на точное решение уравнений (5.2.14) и (5.2.15) для случаев пыли и излучения. Наиболее эффективная процедура для этого - исключить р, используя (5.2.19) или, соответственно, (5.2.20), а затем подставить его в уравнение (5.2.14). Для пыли получим а2 - С/а + к = 0, (5.2.21) где С = 87гра3/3 - константа. Для излучения: а? - С/а + к = О, (5.2.22)
5.2. Динамика однородной изотропной Вселенной 159 т Рис. 5.3. Динамика Вселенной Робертсона-Уокера, заполненной пылью где С = 8жра4/3. Если есть уравнение (5.2.19) (или, соответственно, (5.2.20)), то уравнение (5.2.15) уже излишне, так что все, что нам нужно решить - это обыкновенное дифференциальное уравнение первого порядка (5.2.21) (или, соответственно, (5.2.22)). Решения для а(т) легко получаются элементарными методами. Эти решения для шести случаев, представляющих интерес, сведены в табл. 5.1. Графики а(т) в зависимости от г показаны на рис. 5.3 и рис. 5.4. Решение для Вселенной с геометрией 3-сферы, заполненной пылью, первым нашел Фридман (Фридман 1922). Оно называется космологией Фридмана, хотя в некоторых работах ссылаются на все решения из табл. 5.1 как на фрид- мановские. а(т) Т Рис. 5.4. Динамика Вселенной Робертсона-Уокера, заполненной излучением 'И?
160 Глава 5. Однородная изотропная космология 5.3 Космологическое красное смещение. Горизонты 5.3.1 Красное смещение Мы уже упомянули, что самым прямым наблюдаемым свидетельством расширения Вселенной служит красное смещение спектральных линий далеких галактик - космологическое красное смещение. В этом разделе мы получим формулу красного смещения для общей космологической модели Робертсона-Уокера с метрикой (5.1.11). Предположим, что в событии Pi во время т\ изотропный наблюдатель испускает фотон частоты ш\. Предположим, что этот фотон наблюдает другой изотропный наблюдатель в событии Ръ во время Т2, как представлено на рис. 5.5. Мы хотим найти частоту а^, которую будет измерять этот второй наблюдатель. Решение всех задач о красном смещении в специальной и общей теориях относительности обусловлено следующими двумя обстоятельствами: (1) в приближении геометрической оптики свет движется по нулевым геодезическим линиям (разд. 4.3); (2) частота светового сигнала волнового вектора fc°, измеряемая наблюдателем, движущимся с 4-скоростью иа, равна (4.2.38) ш = -каиа. (5.3.1) Поэтому мы всегда можем найти наблюдаемую частоту вычислением нулевой геодезической линии, определяемой начальным значением ка в точке излучения, и последующим вычислением правой части (5.3.1) в точке наблюдения. Однако, когда присутствуют симметрии, мы часто можем ускорить эту процедуру, применяя следующее правило, доказанное в при- лож. С.З. Пусть £а - векторное поле Киллинга, т.е. такое векторное поле, которое порождает однопараметрическую группу изометрий, как сказано в прилож. С. Пусть ta - касательная к геодезической кривой. Тогда ta£a - постоянно вдоль геодезической. В этом случае несложно непосредственно подсчитать красное смещение, не обращаясь к соображениям симметрии (см. задачу 4), но мы вычислим красное смещение, применяя эти соображения, потому что они дают лучшее понимание того, почему получен простой конечный результат (5.3.6). Первый шаг - заметить, что при выборе любой из трех пространственных геометрий мы можем найти пространственно-временное векторное поле Киллинга £°, которое указывает направление проекции ка на Ei в [мировой] точке Pi и направление проекции ка на Ег в точке Рг-
5.3. Космологическое красное смещение. Горизонты 161 Рис. 5.5. Пространственно-временная диаграмма, показывающая испускание светового сигнала как событие Pi и его получение как событие Рг Например, в случае плоской пространственной геометрии без потери общности мы можем допустить, что проекция ка на Ei в Pi показывает направление (д/дх)а. Тогда в начале ка(д/ду)а = ka(d/dz)a = 0 и так как (д/ду)а и (d/dz)a - векторные поля Киллинга, то эти внутренние произведения обращаются в нуль и в точке Рг. Поэтому проекция ка на Е2 в Р2 также направлена вдоль {д/дх)а, и £а = (д/дх)а - искомое векторное поле Киллинга. Подобные рассуждения обосновывают существование £° в сферическом и гиперболическом случаях. Более того, во всех случаях длина £а в Рг отличается от его длины в Pi пропорционально изменению масштабного фактора а Вселенной при переходе от Ei к Е2, т.е. (ГС«)1/21л = fl(n) (5.3.2) Чтобы найти красное смещение, отметим, что так как ка - изотропный вектор, то в любой точке его проекция на иа должна иметь ту же величину, что и его проекция на Е, так что в Pi Поэтому имеем Аналогично имеем ka'* = -ka[e/{?b)l/2]\pi- «1 = [(fc«D/(^6)1/2] ^=[(кае)/(еы1/2]\р. (5.3.3) (5.3.4) (5.3.5)
162 Глава 5. Однородная изотропная космология Однако согласно отмеченному выше результату о внутреннем произведении векторных полей Киллинга и касательных к геодезической векторов имеем (Ла^*)^ = (&а£а)|р2- Поэтому находим ц2 _ (£ьЫ1/21р. _ g(ri) ,,,„, где мы использовали (5.3.2). Этот результат имеет простое объяснение. Так как Вселенная расширяется, то длина волны каждого фотона возрастает пропорционально величине расширения. Фактор красного смещения z определяется согласно Ai U2 a(ri) Для света, излучаемого близкими галактиками, имеем т2 — т\ « Д, где R - собственное расстояние до галактики в настоящее время. Далее, для близких галактик имеем а(т2) « а(п) + (т2 - п)а. (5.3.8) Поэтому находим линейное соотношение z « -Д = ЯД, (5.3.9) a открытое Хабблом для расстояний, определяемых по красному смещению. Красные смещения далеких галактик будут отклоняться от этого линейного закона в зависимости от того, как а(т) изменяется с т. 5.3.2 Горизонт частиц При изучении космологических моделей в общей теории относительности возникает следующий вопрос: какая часть нашей Вселенной, в принципе, может быть наблюдаема из данного события Р? Точнее, в частном случае космологических моделей Робертсона-Уокера мы можем спросить, какие изотропные наблюдатели (т.е. галактики) могли бы послать сигнал, который достигает данного изотропного наблюдателя в событии Р (или ранее)? Граница между мировыми линиями, которые можно увидеть в Р, и теми, которые нельзя увидеть, называется горизонтом частиц в Р. Так как Вселенная "съеживается до нуля", если идти к сингулярности большого взрыва, то можно было бы ожидать, что все изотропные наблюдатели могут связываться друг с другом, посылая сигналы друг другу в очень ранний период истории
5.3. Космологическое красное смещение. Горизонты 163 Вселенной, когда они были весьма близки друг к другу. Однако сейчас мы покажем, что это не так в случае моделей Робертсона-Уокера, которые достаточно быстро расширяются из начальной сингулярности большого взрыва. Таким образом, мы продемонстрируем существование нетривиальных горизонтов частиц в классе моделей Робертсона- Уокера, который включает все решения табл. 5.1. Случай плоской пространственной геометрии наиболее прост для такой демонстрации: ds2 = -dr2 + а2(т) (dx2 + dy2 + d*2) (5.3.10) и мы сосредоточим наше внимание на нем. Производя преобразование координат т —► £, определенное формулой ^JWY (5ЛЛ1) мы можем переписать метрику (5.3.10) как ds2 = a2(t) (-dt2 + dx2 + dy2 + d*2). (5.3.12) Записанная в такой форме, она делает очевидным, что данная метрика просто кратна метрике плоского пространства-времени Минковского. Такая метрика называется конформно плоской. Существенность этого замечания в его следствии, что вектор будет времениподобным, нулевым или пространственноподобным в метрике (5.3.12) тогда и только тогда, когда он имеет такое же свойство по отношению к плоской метрике ds2 = -d*2 + dx2 + dy2 + d*2. (5.3.13) Поэтому послать сигнал от одного события к другому (т.е. соединить два события времениподобной или изотропной кривой) можно в метрике (5.3.12) тогда и только тогда, когда это можно сделать в плоской метрике (5.3.13). Помня это, нетрудно понять, что наблюдатель в событии Р сможет получать сигнал от всех остальных изотропных наблюдателей тогда и только тогда, когда интеграл (5.3.11), который определяет £, расходится при приближении к сингулярности большого взрыва г —► 0. А именно, если этот интеграл расходится, что будет в случае а(т) ^ ат для некоторой константы а при г —> 0, то модель Робертсона-Уокера будет конформно соответствовать всему пространству-времени Минковского (т.е. нижний предел t будет —оо), и таким образом, горизонта частиц не будет. С другой стороны, если интеграл сходится, то модель Робертсона-Уокера будет конформно соответствовать только части пространства-времени Минковского выше
164 Глава 5. Однородная изотропная космология Рис. 5.6. Структура причинности решений Робертсона-Уокера вблизи сингулярности большого взрыва. Горизонт частиц существует, так как наблюдатель не может "видеть" всех остальных изотропных наблюдателей во Вселенной поверхности t = const, и горизонты частиц будут существовать, как показано на рис. 5.6. Как видно из табл. 5.1, для А; = 0 даже в случае пыли имеем а(т) ос г2/3. Так как а(т) будет больше, если Р > 0, то для всех пространственно плоских решений Робертсона-Уокера уравнения Эйнштейна интеграл (5.3.11) будет сходиться при г —► 0, и горизонты частиц действительно имеют место. Для гиперболической и сферической геометрий при г —* О поведение а(т) становится таким же, как в плоском случае, поскольку слагаемым, включающим к, в уравнении (5.2.14) можно пренебречь. Сходный анализ показывает, что во всех этих решениях горизонты частиц существуют и имеют ту же природу, что в плоском случае. Для сферической геометрии пространственная протяженность Вселенной конечна, и можно спросить, исчезнут ли горизонты частиц в конце концов, или они будут существовать, когда Вселенная перейдет на сжатие, ведущее к сингулярности "большого хруста" (задача 5)? Ответ таков, что в сферической Вселенной, заполненной пылью, табл. 5.1, горизонт частиц исчезает в момент максимального расширения, т.е. световой сигнал, испущенный при большом взрыве, пройдет точно полпути в любом направлении во Вселенной к моменту максимального расширения, так что наблюдатель в этот момент, глядя во всех направлениях, смог бы получить сигналы от всех остальных изотропных наблюдателей. Однако в сферической Вселенной, заполненной излучением, световой сигнал будет проходить ровно полпути по Вселенной за всю историю Вселенной, так что горизонты частиц остаются существовать вплоть до "большого хруста". Существование горизонта частиц в космологических моделях Робертсона-Уокера ставит следующую интересную проблему. Наличие
5.3. Космологическое красное смещение. Горизонты 165 космического микроволнового фона (коротко о нем в следующем разделе) дает нам достаточно оснований предположить, что нынешняя Вселенная однородна и изотропна с весьма высокой степенью точности. Мы знаем много обычных систем, например газ, заключенный в сосуд, которые часто находятся в исключительно однородных и изотропных состояниях. Однако привычное объяснение, почему такие системы имеют такое однородное и изотропное состояние, говорит, что они имели возможность внутреннего взаимодействия и выравнивания температуры. Так, например, даже если газ в сосуде был первоначально, скажем, в неоднородном состоянии, то эти неоднородности будут быстро "смыты" за время, порядка времени пролета через сосуд. Однако такой тип объяснений скорее всего не приложим к Вселенной с горизонтом частиц, поскольку различные части Вселенной не могут даже посылать сигналы друг другу, а еще меньше взаимодействовать в той степени, чтобы выровнять температуру. Поэтому, чтобы объяснить однородность и изотропность нынешней Вселенной, нужно постулировать одно из двух. (a) Вселенная была "рождена" в крайне однородном, изотропном состоянии. (b) Очень ранняя Вселенная существенно отличалась от моделей Робертсона-Уокера, так что горизонты отсутствовали. Затем неоднородности и анизотропия "стерлись", возможно, в результате таких эффектов, как вязкость материи или обратное действие квантового рождения частиц [на гравитацию], и Вселенная приблизилась к модели Робертсона-Уокера. Хотя первое "объяснение" может показаться довольно неестественным, аргументы в его пользу есть (Penrose 1979). Второе объяснение активно разрабатывалось по отношению к явлению затухания анизотропии, начиная с работы Мизнера (Misner 1969), но пока не считается успешным, поскольку недостаточно правдоподобно представило картину эволюции от "хаотического" начального состояния к модели Робертсона-Уокера. Объяснение (Ь) также страдает от той потенциально серьезной трудности, что неоднородности (которые еще недостаточно исследованы) растут, а не гасятся в самогравитирующей системе, как можно было бы ожидать в общем случае на достаточно крупных масштабах. Недавно, однако, было предположено, что очень Ранняя Вселенная могла пройти "инфляционную фазу" (коротко о ней в следующем разделе), приводящую в моделях Робертсона-Уокера к колоссальному расширению горизонта частиц. Инфляционная фаза предлагает возможное объяснение того, как первоначально "хаотическая" Вселенная могла развиться во Вселенную, которая имеет боль-
166 Глава 5. Однородная изотропная космология шие области однородности и изотропности. Однако следует иметь в виду, что мы не владеем в настоящее время квантовой теорией гравитации (гл. 14), а такая теория может играть важную роль в объяснении начального состояния нашей Вселенной. 5.4 Эволюция нашей Вселенной В этом разделе мы кратко обрисуем историю нашей Вселенной от большого взрыва до настоящего времени. Картина, которую мы представим, "стандартна" , т.е. подразумевает, что Вселенная хорошо описывается на протяжении всей своей истории решением Робертсона- Уокера, и помимо того, справедливы дополнительные предположения о материи, заполняющей Вселенную. Хотя в пользу этой картины есть веское подтверждающее свидетельство: существование космического микроволнового фона, и объяснение в ее рамках распространенности в космосе гелия, следует иметь в виду, что ни одно из ее предположений не является неоспоримым. Множество расчетов и большая часть наблюдательных данных, которые идут в ход при построении такой истории Вселенной, представлены в обзорах (Peebles 1971; Weinberg 1972), и мы отсылаем читателей к этим работам за количественными нюансами. О природе ранней Вселенной многое может быть понято на основании того, что уменьшение масштабного фактора а при движении назад в направлении к прошлому оказывает такое же локальное влияние на материю, как если бы материя была помещена в ящик, чьи стенки сжимаются в том же темпе. Поэтому, как это случилось бы и в сжимающемся ящике, вклад излучения в энергию-импульс по сравнению с вкладом обычной материи (т.е. барионов) возрастает в прошлом, как уже отмечено в разд. 5.2. Плотность энергии космического микроволнового фона в нынешней Вселенной оценивается значением в 1000 раз меньшим, чем вклад плотности массы вещества, хотя это отношение имеет погрешность не менее множителя 10, столь большую из-за сложности определения нынешней плотности обычной материи. Таким образом, если считать, что состояние излучения при возврате в прошлое непрерывно (например, что оно не было, скажем, испущено галактиками), то согласно уравнениям (5.2.19) и (5.2.20), когда масштабный фактор а составлял менее 1/1000 от его современного значения, это излучение должно было бы давать преобладающий вклад в плотность энергии Вселенной. Поэтому можно было бы ожидать, что модель Вселенной, заполненной излучением, будет хорошим приближением для динамики Вселенной до этой стадии, в то время как модель Вселен-
5.4. Эволюция нашей Вселенной 167 ной, заполненной пылью, должна быть хорошим приближением после нее. Можно ожидать, что подобно разогреву газа в сосуде при его сжатии, материя и излучение во Вселенной становятся горячее по мере уменьшения а и становятся бесконечно горячими при приближении к большому взрыву а —> О.1 Если ранняя Вселенная существовала с преобладанием излучения, как мы предполагаем, то для всех моделей (fc = 0, ±1) зависимость а и р от г при малых г сводится к решению при к = 0: а(т) = (4С)1'4тг'2, (5.4.1) '"зйЬ" (5А2) Здесь и далее в этом разделе мы восстанавливаем все G и с в уравнениях. Если излучение обладает тепловым распределением, то плотность вещества р дается следующим выражением, полученным из квантовой статистической механики частиц с нулевой массой: t=l где п - количество видов излучения, gi - коэффициент вырождения по спину, at принимает значение 1 для бозонов и 7/8 для фермио- нов. Массивные частицы, чьи массы намного меньше кТ, эффективно действуют как частицы с нулевой массой и должны быть включены в (5.4.3) как "виды излучения". Формулы (5.4.1), (5.4.2) и (5.4.3) приводят к Т ос р1/4 ос а-1, как ожидается из соотношения для красного смещения (5.3.6). Есть важный вопрос: будет ли взаимодействие материи и излучения в ранней Вселенной продолжаться в достаточно быстром временном масштабе, чтобы тепловое равновесие устанавливалось локально (т.е. в пределах горизонта частиц)? Если ответ отрицательный, то самосогласованность предположения, что материя имеет тепловой спектр, сомнительна, и предсказанная эволюция вещества и излучения может зависеть от нюансов предполагаемого начального распределения. Если ответ на вопрос положительный, тогда мы имеем относительно простую задачу развития теплового распределения материи 1Не было бы противоречия и в предположении, что в очень ранней Вселенной излучения не было, а имелась только холодная материя, такая как барионы. Однако модель "холодного большого взрыва" имела бы значительные проблемы согласования с существованием в настоящее время космического микроволнового Фона и с правильным содержанием гелия во Вселенной, которые естественно объясняются стандартной моделью "горячего большого взрыва", излагаемой здесь.
168 Глава 5. Однородная изотропная космология вплоть до того времени, когда равновесие больше не поддерживается. Масштаб времени t& расширения Вселенной - это время, когда происходит значительное изменение масштабного фактора а, то есть tE ~ а/а = 2т, (5.4.4) согласно уравнению (5.4.1). С другой стороны, масштаб времени для взаимодействий равен 1 а2 U ~ ос — ос т3/2/а(Т), (5.4.5) пас а ' где предполагается, что количество взаимодействующих частиц сохраняется, так что их концентрация п имеет порядок а~3, и возможная зависимость поперечного сечения взаимодействия а от энергии явно указана записью а как функции температуры. Сопоставление (5.4.4) и (5.4.5) показывает, что если только а не спадает при высоких энергиях сильно, то при достаточно ранних временах у нас будет tj ^Ие, так что тепловое равновесие может быть достигнуто. (Фактически возможно, что при очень высоких энергиях у взаимодействия элементарных частиц появляется "асимптотическая свобода", и а действительно спадает достаточно быстро, чтобы обеспечить tj > Ье при г —> 0. Однако, даже если это так, то для энергий меньших, чем 1015 ГэВ, опять должно получиться tj > tE, и тепловое равновесие все равно должно достигаться в очень раннее время.) С другой стороны, по мере развития Вселенной так или иначе будет £/>£#, и материя выйдет из теплового равновесия. Таким образом, изложенные соображения приводят к следующей общей картине эволюции нашей Вселенной. Вселенная возникла как горячий (Т —► оо), плотный (р —► оо) "суп" материи и излучения в тепловом равновесии. Однако по мере развития Вселенной тепловое равновесие не поддерживалось, когда t\ стало больше Ье» Доля энергии излучения в ранней Вселенной была преобладающей. Однако ко времени, когда а достиг приблизительно 1/1000 его настоящего значения, доминировать стал вклад обычной материи в энергию Вселенной, и динамика Вселенной стала как у модели Робертсона-Уокера, заполненной пылью. Теперь мы продолжим развивать некоторые важные подробности этой эволюционной истории. Классическая общая теория относительности предсказывает, что в течение первых 10~43 секунд эволюционной истории Вселенной величина кривизны пространства-времени была слишком большой, если выражать ее длиной Планка (Gft/c3)1/2 « 10~33см. По соображениям размерности мы ожидаем, что квантовые эффекты гравитационного
5.4. Эволюция нашей Вселенной 169 поля весьма важны в эту эпоху (гл. 14), и значит, предсказания классической общей теории относительности нельзя принимать всерьез. Мы можем ожидать, что классическая общая теория относительности становится справедливой позже, но при экстремальных условиях, описывающих эпоху очень ранней Вселенной (при г = 10~43 с имеем р ~ 1092 г-см~3!), - едва ли нужно это подчеркивать, - все утверждения о поведении материи являются гипотетическими. Имеется два интересных и важных эффекта, которые могли иметь место в очень ранней Вселенной во время, всего на несколько порядков позже времени Планка. Первый относится к динамике очень ранней Вселенной. Некоторые модели квантовой теории поля, которые пытаются объединить сильное и электрослабое взаимодействия, предсказывают, что при очень высоких температурах в состоянии теплового равновесия квантового поля будет происходить фазовый переход. В этих моделях, если происходит "суперохлаждение", может оказаться существенным "вакуумный" вклад вида Xgab (где Л - большая положительная константа) в тензор энергии-импульса Таь поля. Поэтому очень ранняя Вселенная могла проходить фазу, где динамика такая, как в пустой Вселенной с большой положительной космологической постоянной. Следовательно, если эти модели правильны, то, как впервые предположил Гус (Guth 1981), может существовать "инфляционный" режим очень ранней Вселенной, когда она приблизительно подчиняется решению деСиттера (задача ЗЬ) и расширяется очень быстро. Если это происходит, то, как сказано в конце разд. 5.3, горизонт частиц в нынешней Вселенной мог бы быть гораздо шире, чем при экстраполяции всех решений табл. 5.1 назад к большому взрыву. Дальнейшее обсуждение инфляционных космологических моделей читатель найдет в обзорах (Gibbons, Hawking, Siklos 1983). Второй эффект касается производства барионов. Есть веское основание считать (Steigman 1976), что материя, содержащаяся во Вселенной, состоит из барионов, а не из антибарионов, т.е. симметрии материя-антиматерия нет. Возможно, наша Вселенная была просто рождена с избытком барионов над антибарионами, и, действительно, это должно быть так, если барионное число строго сохраняется. Однако также допустимо, что Вселенная началась в симметричном состоянии материя-антиматерия, и что избыток барионов образовался в очень ранней Вселенной. Чтобы это произошло, взаимодействия элементарных частиц с высокой энергией в очень ранней Вселенной должны удовлетворять следующим свойствам. (1) Не должно сохраняться барионное число, что вполне понятно. (2) Взаимодействия должны нарушать зарядовое сопряжение С и комбинацию зарядового сопряже-
170 Глава 5. Однородная изотропная космология ния с четностью СР. (Если любая из этих симметрии сохраняется, то будут произведены равные количества барионов и антибарионов.) (3) Они должны приводить к выходу из теплового равновесия. (Это потому, что частицы и античастицы имеют одинаковые массы, так что в тепловом равновесии они будут рождаться в равных количествах.) Неравновесные явления могли начаться естественным образом из-за существования массивной частицы с временем распада больше времени расширения £#, когда температура Вселенной упала ниже массы этой частицы (так что рождение частицы по существу прекращается). Замечательно, что теории "великого объединения" сильного, электромагнитного и слабого взаимодействий в настоящее время предсказывают все три этих свойства, и, таким образом, могут объяснить асимметрию материя-антиматерия в нашей Вселенной. Мы вновь возвращаемся к ходу истории ранней Вселенной при г = = 1 секунда, когда плотность вещества р « 5 х 105гсм~3, и температура Т « 1010К. Хотя эти условия являются экстремальными по обыкновенным стандартам, мы теперь находимся в режиме достаточно низких плотностей энергии и вещества, чтобы сделать надежные предсказания. В это время материя во Вселенной состоит почти целиком из нейтрино, фотонов, электронов, позитронов, нейтронов и протонов в тепловом равновесии; температура достаточно низка, так что равновесная доля более массивных элементарных частиц незначительна. Где-то на этой стадии взаимодействия нейтрино становятся достаточно слабыми, чтобы они отделились от остальной материи. В дальнейшей истории Вселенной они просто пассивно смещаются в красную часть спектра с более низкой энергией. Так как смещение спектра теплового излучения (и —► и;/а) в красную часть суть то же самое, что тепловой спектр при более низкой температуре (Т —► Т/а), Вселенная в настоящее время должна быть заполнена нейтрино со спектром абсолютно черного тела при температуре Т « 2 К. Однако ставить задачу обнаружения этих нейтрино, значило бы выходить очень далеко за рамки ныне доступной чувствительности детектирования. По мере остывания Вселенной темпы реакций превращения протонов в нейтроны и обратно быстро падают до значений гораздо меньших, чем темп расширения Вселенной. Следовательно, отношение нейтрон-протон "замораживается" примерно на значении 1 : 6 при т~1,5 секунды. (Протоны более распространены, чем нейтроны, поскольку они почти на 1МэВ легче, и, таким образом, их содержится больше при тепловом равновесии до того, как наступит "замораживание".) Конечно, выражение "замораживание" не должно быть понято слишком буквально, так как "выключение" взаимодействий не мгновенно,
5.4. Эволюция нашей Вселенной 171 и к тому же отношение нейтрон-протон продолжает медленно уменьшаться и позже вследствие распада нейтронов. При г = 4 секунды имеем р = 3 х 104г-см~3, иГ«5х 109К« « 0,5 МэВ приблизительно равна массе электрона и позитрона. В этот период равновесная популяция электронов и позитронов быстро уменьшается, скорость образования падает ниже скорости аннигиляции, и вскоре после этого времени все позитроны проаннигилируют, оставляя относительно малую популяцию остаточных электронов. По существу вся энергия электрон-позитронных пар передается фотонам, нагревая их до температуры в «1,4 раза больше, чем температура нейтрино. Когда температура падает примерно до 109 К при т « 3 минуты, то довольно резко начинается ядерный синтез, производящий *Ие. Фактически в тепловом равновесии доля *He при таких плотностях барионов была бы заметна при еще более высоких температурах (~ 3,5 х 109 К), но до т=3 минуты ядерный синтез весьма незначителен, так как ключевую роль в ядерных реакциях, дающих на выходе гелий, играет дейтерий ?Н, но равновесная доля ^ весьма мала до тех пор, пока температура не упадет до 109 К. Ядерный синтез элементов тяжелее ^е почти не происходит из-за больших кулоновских барьеров и отсутствия стабильных ядер с атомными массами 5 и 8. В пределах временного интервала в несколько минут практически все нейтроны, которые не распались ко времени "замораживания", превращаются в *Не. Это приводит к созданию доли ^е по массе приблизительно 25% и много меньших долей синтезированных попутно ?Н, %е и 'Li, а также к пренебрежимо малому количеству других элементов. Процентное содержание *He не очень чувствительно к принятому значению барионной плотности, так как оно управляется, главным образом, отношением нейтрон-протон при "замораживании", но доли других элементов, в частности весьма чувствительны к барионной плотности. Относительно низкая барионная плотность может порождать долю ^ свыше 5 х 10"4 по массе, в то время как высокая барионная плотность (в особенности плотность достаточная, чтобы "замкнуть Вселенную", как обсуждается ниже), увеличивает эффективность цепочки реакций, производящей ^е, и приводит к доле ^ на много порядков ниже. Трудно наблюдать распространенность гелия в космосе, но как оказалось, доля в 25% находится в согласии с наблюдениями. Наличие этого количества гелия во Вселенной нельзя просто объяснить другими процессами (в частности, есть оценка, что ядерный синтез в звездах порождает долю гелия всего лишь в несколько процентов), и поэтому предсказание образования гелия в процессе ядерного синтеза большого взрыва надо рассматривать как крупный успех теории.
172 Глава 5. Однородная изотропная космология После периода ядерного синтеза Вселенная, конечно, продолжает свое расширение и остывает. Следующее космическое событие важнейшего значения имело место, когда температура упала приблизительно до 4000 К. Это произошло при г~4х 105лет, если во Вселенной все еще преобладало излучение, но это произошло бы немного раньше, если во Вселенной уже стало преобладать вещество. При этой температуре и ниже, свободные электроны и протоны объединились, формируя нейтральный водород. Действительно, ко времени, когда температура упала до 2000 К, доля ионизованного водорода составляла всего ~ 10~4. Как результат этого события, названного рекомбинацией (хотя, конечно, электроны и протоны никогда до того не "комбинировались"), произошло стремительное разъединение материи и излучения, так как сечения рассеяния фотонов на свободных заряженных частицах значительно больше, чем на нейтральных Н и Не. Действительно, фотоны эффективно полностью выделились из материи после рекомбинации, и просто охлаждались при расширении Вселенной во время остальной части ее эволюции. Поэтому нынешняя Вселенная должна быть заполнена этим излучением, которое возникло при большом взрыве, со спектром абсолютно черного тела при низкой температуре, чьи фотоны последний раз взаимодействовали с веществом во время рекомбинации. Именно такой радиационный фон с температурой Т « 2,7 К (соответствующей максимуму в микроволновом диапазоне) и был открыт Пензиасом и Уилсоном (Penzias, Wilson 1965). Существование этого излучения было бы трудно объяснить еще каким-либо способом, таким образом, оно обеспечивает главное подтверждение изложенной картины эволюции нашей Вселенной. Более того, измеренное излучение оказалось изотропно с высокой точностью. (Обнаружена анизотропия "дипольного типа" порядка M),l% (Smoot, Gorenstein, Muller 1977), но она, по-видимому, объясняется движением Земли по отношению к "предпочтительной системе покоя" космологии Робертсона-Уокера.) Это обеспечивает весьма веское свидетельство, что Вселенная была почти однородной и изотропной по крайней мере вплоть до времени рекомбинации. Разъединение материи и излучения в эту эпоху дало также главный толчок росту гравитационных возмущений, ведущих к образованию галактик. Непосредственно перед рекомбинацией давление, создаваемое излучением, задерживало рост гравитационных возмущений, вовлекавших массы меньшие, чем приблизительно 1О17М0, что гораздо больше, чем типичные галактические массы (~ 1О11М0). Однако после рекомбинации давление излучения не влияло на материю, и грави-
5.4. Эволюция нашей Вселенной 173 тационные неустойчивости могли возникать по всему диапазону масс ^ 1О5М0. Поэтому неравномерности в распределении материи начали расти после рекомбинации, что привело к образованию галактик, звездных скоплений и звезд. Однако детали этого процесса не совсем поняты в настоящее время (Peebles 1980). В некоторое время между г ~ 103 лет и т ~ 107 лет обычная материя стала преобладающей формой энергии во Вселенной. (Точное время, когда это произошло, неясно, потому что плотность вещества современной Вселенной известна со значительной неопределенностью.) Динамика Вселенной изменилась от режима решения с "заполнением излучением" к режиму решения с "заполнением пылью". Наконец, при г ~ 10 ч-20 миллиардов лет Вселенная достигла своего настоящего состояния. В итоге общая теория относительности, дополненная предположением об однородности и изотропии и предположением о материальном содержании Вселенной, создала замечательно успешную картину истории нашей Вселенной. Среди ее наиболее заметных достижений - обоснование распространенности гелия в космосе и объяснение космического микроволнового излучения. Интересно, что если принять эту картину, то некоторые нетривиальные ограничения налагаются на: (1) массы стабильных элементарных частиц со слабым взаимодействием, (2) число типов частиц с нулевой массой в тепловом равновесии в ранней Вселенной. Чтобы объяснить первое ограничение, предположим, что электронное или мюон- ное нейтрино имеет массу га или что существует некоторая массивная устойчивая частица, которая участвует только в слабых взаимодействиях. Тогда поведение этой частицы в ранней Вселенной было бы таким же, как и безмассового нейтрино. Однако в современной Вселенной она вносила бы вклад в энергию не ~ 10~4 эВ на частицу (соответствующий Т ~ 2 К), а га на частицу. Если бы эти частицы были очень массивны, то их популяция была бы "заморожена" при очень малой численности, когда они выпали бы из теплового равновесия в ранней Вселенной, и они бы не дали большого вклада в современное значение плотности энергии Вселенной. Но если бы их масса лежала в диапазоне от ЮГэВ до 100 эВ, то эти частицы безусловно доминировали в массе-энергии Вселенной, и оказали бы динамические воздействия на темп расширения Вселенной, что несовместно с наблюдениями. Поэтому наша космологическая теория и наблюдения накладывают строгие ограничения на допустимые массы стабильных частиц со слабым взаимодействием.
174 Глава 5. Однородная изотропная космология Существование других видов безмассовых частиц (например, нейтрино) в тепловом равновесии в ранней Вселенной не повлияло бы на современную плотность вещества Вселенной, так как их энергия сместилась бы в красную часть спектра при расширении Вселенной. Од. нако они оказали бы важное динамическое влияние на раннюю Вселенную, потому что, согласно (5.4.3), безмассовые частицы влияли бы на связь между р и Г, делая Т меньше для данного р. Поскольку при малых г связь между риг всегда дается формулой (5.4.2) для Вселенной с преобладанием излучения, мы видим, что Т(т) будет уменьшаться, т.е. данная температура будет устанавливаться в более раннюю эпоху при более высоком темпе расширения. Наиболее важное следствие этого эффективного ускорения темпа расширения Вселенной заключается в том, что отношение нейтрон-протон будет "заморожено" при более высокой температуре, приводя к более высокому проценту содержания нейтронов. Следовательно, в эру ядерного синтеза будет произведено больше гелия2. На основе предположения, что барионная плотность в ранней Вселенной соответствует по крайней мере современной плотности вещества, наблюдаемой в небольших группах галактик (см. ниже), установленно, что если имеется более четырех видов нейтрино, то будет произведена неприемлемо высокая доля гелия. Так как известно, что существуют электронные и мюонные нейтрино, а также кажется вероятным существование нейтрино, связанного с недавно открытым т-лептоном, то представляется, что данный космологический предел оставляет мало места для существования других видов безмассовых частиц в тепловом равновесии ранней Вселенной. А что относительно будущей эволюции нашей Вселенной? Самый важный вопрос, относящийся к будущей эволюции, - является ли наша Вселенная "открытой" или "замкнутой", т.е. соответствует ли она варианту к = 0, -1 или варианту к = +1? Как установленно в разд. 5.2, если Вселенная открыта, то она будет расширяться всегда, а если она замкнута, то будет в конечном счете снова сжиматься. Мы можем выразить основные уравнения (5.2.14) и (5.2.15), управляющие динамикой современной Вселенной, через постоянную Хаббла Н = а/а и параметр замедления q, определенный соотношением q = -da/a2. (5.4.6) Так как в нынешней Вселенной Р « О, имеем Я2 = SirGp/S - кс2/а2, (5.4.7) 2Однако если темп расширения чрезвычайно ускорен, то для реакций нуклеосинтеза даже не будет достаточно времени, и синтез гелия будет замедляться.
5.4. Эволюция нашей Вселенной 175 Определяя ft как ft = 8nGp/3H2, (5.4.9) мы видим, что g = ft/2, и Вселенная замкнута (А: = 1), если и только если ft>l, т.е. при р> рс = ЗЯ2/87гС В настоящее время есть четыре основных независимых наблюдательных подтверждения, которые в сочетании с записанными выше уравнениями указывают на то, открыта Вселенная или замкнута: (i) отношение между красным смещением и видимой звездной величиной далеких объектов, (ii) плотность вещества в настоящей Вселенной, (Ш) возраст Вселенной, (iv) космическая доля дейтерия. Мы кратко обсудим по очереди каждое из них. В конце разд. 5.3.1 установлено, что для достаточно близких объектов мы имеем линейную связь (5.3.9) между красным смещением z и собственным расстоянием R в настоящее время. Кроме того, для достаточно близких объектов видимая светимость объекта пропорциональна его абсолютной светимости, деленной на R2. (Для очень удаленных объектов нужно исправить это простое соотношение вследствие расширения Вселенной и кривизны пространства.) Поэтому, если мы рассматриваем объекты с фиксированной абсолютной светимостью, то для достаточно близких объектов получим линейную связь между In г и 1п[видимая светимость] = видимая звездная величина. Мы не будем обсуждать здесь трудные задачи: (а) как найти "стандартные свечи", т.е. объекты с фиксированной абсолютной светимостью, и (Ь) как калибровать их абсолютную светимость (или, что эквивалентно, их расстояние) с помощью цепочки аргументов, в которой близлежащие стандартные свечи используются для калибровки более далеких стандартных свечей (Weinberg 1972). Связь между In z и видимой звездной величиной действительно найдена линейной, соответствующей значению Я Я ~ 50с_1Мпс_1км, 1 Мпс (мегапарсек) «Зх 1019 км. (5.4.10) Из-за погрешности определения абсолютных расстояний это значение Я, вполне возможно, может иметь ошибку по крайне мере в 2 раза. И действительно, некоторые недавние измерения дали Я ~ 100 км/с Мпс. Для достаточно удаленных объектов связь между видимой звездной величиной и In z будет отклоняться от линейной некоторым °бразом, зависящим от динамической эволюции а(т) и, в меньшей степени, от пространственной геометрии. В принципе, исследуя эти отклонения от линейности, мы можем определять д, которое в свою очередь
176 Глава 5. Однородная изотропная космология укажет нам, является ли Вселенная открытой (q ^ 1/2) или замкнутой (q > 1/2). Однако на практике эти отклонения начинают проявляться только для объектов, находящихся на таких больших расстояниях (z ^ 0,2, то есть R ^ 103Мпс), что их свет, достигающий нас, был испущен в значительно более раннюю эпоху. Поэтому по эволюционным соображениям есть причина сомневаться в том, на самом ли деле наши наиболее далекие стандартные свечи - ярчайшие галактики в скоплениях галактик - являются "стандартными". Эти галактики могли быть существенно ярче или бледнее в прошлом. До тех пор, пока эти эволюционные эффекты не будут лучше поняты, невозможно при данном подходе сделать окончательные выводы: является ли Вселенная открытой или замкнутой. Параметр Q может быть определен непосредственно измерением плотности вещества р в нынешней Вселенной и постоянной Хаббла Н. Как упомянуто выше, неопределенность в калибровке расстояний приводит к значительной погрешности значения Н. К счастью, однако, калибровка масштаба длины входит и в определение р таким образом, что отношение О, ос р/Н2 не зависит от этих неопределенностей, и поэтому Г2 можно определить намного точнее, чем р или Я. В нынешней Вселенной, как оказалось, обычная материя дает преобладающий вклад в р; плотность энергии космического микроволнового фона в ~ 10~3 раз меньше приведенной ниже ориентировочной плотности вещества. Представляется, что по сути вся материя во Вселенной сконцентрирована в галактиках, так как большинство возможностей существования межгалактической материи исключены по наблюдательным или теоретическим соображениям. Массы достаточно близких (^ 15Мпс) спиральных галактик можно оценить по их скоростям вращения. Массу скоплений галактик можно оценить по скоростям хаотического движения отдельных галактик, полагая, что скопления гравитационно связаны. При сравнении масс, найденных этими методами, возникают некоторые интересные расхождения: массы галактик в бинарных системах и малых кластерах, определенные вторым методом, оказались больше (приблизительно в 3 раза), чем массы галактик, определенные первым методом. К тому же массы галактик в больших кластерах оказались больше (по крайней мере в 2 раза и, возможно, значительно больше), чем массы, полученные для малых кластеров. Возможное объяснение первого расхождения заключается в том, что галактики обладают массивным гало слабо светящегося вещества, чья дополнительная масса не влияет на кривую галактического вращения. Поэтому по первому методу, когда оценивается только масса светящейся внутренней части галактики, суммарная масса недооце-
5.4. Эволюция нашей Вселенной 177 нивается. Причина второго расхождения менее понятна, но его можно объяснить присутствием межкластерного вещества или просто тем обстоятельством, что галактики в больших кластерах могли бы стремиться быть существенно более массивными, чем галактики в малых скоплениях. Если взять типичную массу галактик такой, как получается по второму методу для малых кластеров, то находим Г2 ~ 0,04, что соответствует р ~ 2 х 10~31 г-см~3 при использовании постоянной Хаббла (5.4.10). Это дает свидетельство в пользу открытой Вселенной, но остаются многие возможности для существования скрытой массы, так что это свидетельство не является окончательным. Так как наша Вселенная в настоящее время существует с преобладанием материи и должна была бы быть такой почти всю свою историю, то из нашего решения по табл. 5.1 находим, что если к = 0, то возраст Вселенной соотносится с постоянной Хаббла (5.4.10) согласно rc = A-i,3x 1010лет. (5.4.11) оН Если к = — 1, то т>тс, а если к = +1, то неравенство перевернется. Поэтому сопоставление фактического возраста Вселенной с критическим возрастом тс будет указывать нам, существует ли Вселенная открытой или замкнутой. Вспомним, однако, что существует значительная неопределенность в значении Н и, таким образом, в значении тс. Возраст Вселенной может быть оценен по возрасту самых старых объектов, которые мы можем найти: это шаровые звездные кластеры (чей возраст можно оценить по теории звездной эволюции) и элементы, произведенные первыми звездами (чей возраст можно определить радиоактивным датированием, если элемент радиоактивен). Исследование этих объектов устанавливает возраст Вселенной в интервале от 10 до 20 миллиардов лет. Грубое равенство этого возраста с тс обеспечивает дальнейшее сильное подтверждение происхождения Вселенной в результате большого взрыва. Однако погрешности обеих оценок возраста слишком велики, чтобы позволить нам заключить, что Вселенная открыта или что она замкнута. Последний аргумент о том, является ли Вселенная открытой или замкнутой, - это содержание дейтерия в космосе. Как упомянуто выше, если плотность барионов в ранней Вселенной была достаточна, чтобы дать в нынешней Вселенной барионную плотность больше критического значения рс = 3#2/87rG, to после эры ядерного синтеза должно остаться весьма незначительное количество дейтерия. Однако измерения распространенности дейтерия в космосе дали значение относительной доли его массы ~2х 10~5, соответствующее современному значению О, ~ 0,1. Это дает свидетельство в пользу открытой
178 Глава 5. Однородная изотропная космология Вселенной, но остаются значительные лазейки, такие как возможный синтез дейтерия в иных процессах, или что большая часть плотности вещества нынешней Вселенной находится не в барионной материи (например, в типах нейтрино с массой ~100 эВ). В заключение: многие важные вопросы космологии ждут своего решения. Но уже ясно, что общая теория относительности обеспечила нас в высшей степени успешной картиной структуры пространства- времени нашей Вселенной. Задачи 1. Покажите, что метрика Робертсона-Уокера (5.1.11) может быть выражена в виде Г dr2 ds2 = -dr2 + a2(r) + r2(d02 + sin20d<£2) I-kr2 Какая часть 3-сферы (к = +1) покрывается этими координатами? 2. Получите уравнения Эйнштейна (5.2.14) и (5.2.15) для 3-сферы (к = +1) и для гиперболоида (к = — 1). 3. (а) Рассмотрите модифицированное уравнение Эйнштейна (5.2.17) с космологической постоянной Л. Выпишите аналоги уравнений (5.2.14) и (5.2.15) с постоянной Л. Покажите, что статические решения этих уравнений возможны тогда и только тогда, когда к = +1 (3-сфера) и Л > 0. (Эти решения называются статическими Вселенными Эйнштейна), Для Вселенной Эйнштейна, заполненной пылью (Р = 0), свяжите "радиус Вселенной" а с плотностью р. Исследуйте малые возмущения этого "равновесного" значения а и покажите, что статическая Вселенная Эйнштейна неустойчива. (Ь) Рассмотрите модифицированное уравнение Эйнштейна с Л > 0 и Таь = 0. Получите пространственно однородное изотропное решение в случае к = 0. (В результате полученное пространство-время фактически есть однородное изотропное пространство-время, известное как пространство- время де Ситтера. Решения с к = ±1 соответствуют различным выборам пространственноподобных гиперповерхностей в этом пространстве-времени (Hawking, Ellis 1973).)
5.4. Эволюция нашей Вселенной 179 4. Получите формулу космологического красного смещения (5.3.6) с помощью следующего аргумента: (a) Покажите, что ¥аЩ = (cL/a)hab, где Наъ определяется с помощью (5.1.10) и а = da/dr. (b) Покажите, что вдоль любой нулевой геодезической линии имеем dw/dX = — какь^аЩ = —{a/a)w2, где А - аффинный параметр вдоль геодезической. (c) Покажите, что результат (Ь) дает (5.3.6). 5. Рассмотрите радиальное {dO/dX = d(j>/dX = 0) распространение нулевой геодезической линии в космологии Робертсона-Уокера (5.1.11). (a) Покажите, что для всех трех пространственных геометрий изменение в координате ф луча в промежутке от т\ до т^ равно Аф = f*2 dr/a(r). Здесь ф определяется так, чтобы в плоском случае (к = 0) она была обыкновенной радиальной координатой ф = (ж2 + у2 + г2)1/2. (b) Покажите, что в сферической модели, заполненной пылью, луч света, испущенный при большом взрыве, ко времени "большого хруста" проходит точно весь путь по Вселенной. (c) Покажите, что в сферической модели, заполненной излучением, луч света, испущенный при большом взрыве, ко времени "большого хруста" проходит точно полпути по Вселенной.
Глава 6 Решение Шварцшильда В предыдущей главе говорилось о некоторых удивительно точных теоретических предсказаниях о пространственно-временной структуре нашей Вселенной, полученных на основе общей теории относительности. Однако космологические наблюдения в настоящее время поставлены не настолько хорошо, чтобы обеспечить точные количественные проверки общей теории относительности. Желаемые количественные проверки возможны по гравитационному полю нашей солнечной системы, где могут выполняться точные измерения. Поэтому очень важно найти решение уравнений Эйнштейна для внешнего гравитационного поля статического сферически-симметричного тела (такого, каким с высокой точностью является наше Солнце и многие другие тела). Эта проблема была решена Карлом Шварцшильдом (Schwarzschild 1916a) всего через несколько месяцев после того, как Эйнштейн опубликовал свою версию полевых уравнений гравитационного поля в вакууме. Решение Шварцшильда, несомненно, остается одним из наиболее важных среди известных точных решений уравнений Эйнштейна. Как уже установлено в разд. 4.4.1, предсказания общей теории относительности при малых скоростях в приближении слабого поля сводятся к ньютоновской теории тяготения. Тем не менее решение Шварцшильда, которое точно описывает внешнее гравитационное поле сферического тела, предсказывает тонкие отклонения от теории Ньютона для движения планет в нашей солнечной системе. Кроме того, оно предсказывает "искривление лучей света" Солнцем, гравитационное красное смещение и эффекты "задержки сигналов". Эти четыре предсказания были надежно подтверждены точными измерениями. Действительно, за исключением измерений по бинарному пульсару (см. конец гл. 4), все предсказания, полученные на основе решения Шварцшильда в режиме слабого поля нашей солнечной системы, являются единственными предсказаниями общей теории относительности, которые проверены количественно с высокой точностью. Следует отметить, что решение Шварцшильда предоставляет нам гораздо большее, чем возможность предсказывать тонкие эффекты, встречающиеся в нашей солнечной системе. Как будет рассмотрено ниже в разд. 6.2, достаточно массивные тела сами по себе не способны противостоять полному гравитационному коллапсу. После того, как коллапс сферического тела произошел, внутренняя геометрия прост-
182 Глава б. Решение Шварцшильда ранства-времени будет описываться решением Шварцшильда, и оно, таким образом, сообщает нам многое о поведении сильного гравитационного поля в общей теории относительности. Как будет разъяснено в разд. 6.4, вакуумное решение Шварцшильда, описывающее конечный результат гравитационного коллапса, содержит пространственно- временную сингулярность, которая скрыта внутри черной дыры. Само решение Шварцшильда мы получим тетрадным методом в разд. 3.4.2. В разд. 6.2 мы рассмотрим внутренние материальные источники внешнего вакуумного решения Шварцшильда и, таким образом, получим релятивистские уравнения звездных структур. Време- ниподобные и нулевые геодезические в метрике Шварцшильда изучены в разд. 6.3, и там же предсказаны четыре теста общей теории относительности: гравитационное красное смещение, прецессия орбиты Меркурия, искривление лучей света и "задержка световых сигналов". И наконец, в разд. 6.4 мы исследуем режим сильного гравитационного поля вакуумного решения Шварцшильда. 6.1 Вывод решения Шварцшильда Мы ищем все решения уравнений Эйнштейна, которые описывают внешнее гравитационное поле статического сферически-симметричного тела. То есть мы хотим найти все четырехмерные метрики лорен- цевой сигнатуры, для которых тензор Риччи обращается в нуль и которые являются статическими и допускают сферическую симметрию. Наша первая задача - определить более точно значение терминов "статический" и "сферически-симметричный", а также выбрать удобную систему координат для анализа данного класса пространств-времен. В нижеследующей дискуссии мы предполагаем, что читатель изучил прилож. С (или будет обращаться к нему по мере необходимости). Говорят, что пространство-время является стационарным, если существует однопараметрическая группа изометрий фг, орбитами которой являются времениподобные кривые. Эти группы изометрий представляют собой "трансляционную симметрию времени" пространства- времени. Эквивалентное определение: пространство-время называется стационарным, если оно допускает поле времениподобных векторов Киллинга £°. Говорят, что пространство-время статическое, если оно стационарно и, кроме того, существует (пространственноподобная) гиперповерхность Е, которая ортогональна к орбитам изометрий. Согласно теореме Фробениуса (прилож. В), это эквивалентно требованию, что поле времениподобных векторов Киллинга £° удовлетворяет уравнению £[aV6£c] = 0. (6.1.1)
6.1. Вывод решения Шварцшильда 183 Возможно, что смысл этого дополнительного условия ортогональности на гиперповерхность будет более понятным при введении подходящих координат для статических пространств-времен по следующей схеме. Если fа Ф О повсюду на Е, тогда в окрестности Е любая точка будет находиться на однозначно определяемой орбите £а, которая проходит через Е. Предполагая £° Ф О, мы выбираем произвольные координаты х** на Е и помечаем каждую точку р в этой окрестности Е параметром t орбиты, которая имеет начало на Е и оканчивается в точке р, и координатами орбиты х1, х2, х3 на Е. Так как в данной системе координат используется параметр Киллинга t в качестве одной из координат, то метрические компоненты в этом координатном базисе не будут зависеть от t. Более того, поскольку поверхность Ее определена как совокупность точек, "координаты времени" которых имеют значение £, то она является образом Е при изометрии <\>t\ отсюда также следует, что каждая Ее ортогональна £а. Таким образом, в этих координатах метрические компоненты принимают форму з ds2 = -V2(x\x2,x3)dt2 + J2 Ky^\x2,x3)dx^dxu, (6.1.2) где V2 = -^a^°, а отсутствие перекрестного члена d£dxM выражает ортогональность £а по отношению к Е. Стационарная, но не статическая метрика неизбежно должна иметь перекрестный член dtdx^ в любой координатной системе, которая использует параметр Киллинга как одну из координат. Можно понять, исходя из точной формы статической метрики (6.1.2), что диффеоморфизм, определенный как t —> — t (т.е. отображение, которое переводит каждую точку на каждой Ее в точку с такими же пространственными координатами на Е_е) есть изометрия. Поэтому в добавление к трансляционной симметрии времени t —> t + const, которую допускают все стационарные пространства-времена, статическое пространство-время допускает также симметрию "отражения времени". С физической точки зрения, поля, которые являются инвариантными относительно временнбй трансляции, могут терять инвариантность по отношению к отражению времени при наличии вращательного движения, так как отражение времени будет изменять направление вращения, и поэтому не будет восстанавливаться первоначальная конфигурация. Таким образом, например, вращающийся жидкий шар может иметь независящее от времени распределение вещества и скорости, но не допускать симметрию отражения времени. В рассмотренном здесь случае нарушение (6.1.1) приводит к тому, что
184 Глава 6. Решение Шварцшильда орбиты, прилегающие к £а, "закручиваются" друг вокруг друга. Это помогает объяснить, почему (6.1.1) является необходимым и достаточным условием для существования симметрии отражения времени. Говорят, что пространство сферически симметрично, если его группа изометрий содержит подгруппу, изоморфную группе SO(3), и что орбиты этой подгруппы (т.е. совокупность точек, полученных при действии этой подгруппы на данную точку) представляют собой двумерные сферы - окружности. Тогда изометрий SO(3) интерпретируются с физической точки зрения как вращения, и поэтому сферически симметричное пространство таково, что его метрика остается инвариантной при вращениях. Метрика пространства-времени индуцирует метрику на каждой орбите-окружности, и эта последняя в силу симметрии вращения должна быть кратна метрике единичной окружности и поэтому может всецело характеризоваться полной поверхностью А двумерной сферы. Для сферически-симметричных пространств удобно ввести функцию г, определенную соотношением г = (Л/47Г)1/2. (6.1.3) Таким образом, в сферических координатах (0, ф) метрика на каждой орбите-окружности принимает форму ds2 = r2(d02 + sin2 вдф2). (6.1.4) Функция г в плоском трехмерном евклидовом пространстве соответствовала бы значению радиуса сферы, т.е. расстоянию от поверхности сферы до ее центра. Однако в искривленном пространстве сфера не обязана иметь центр (структура многообразия может быть, скажем R х 52, а не R3); и даже если центр есть, то функция г не обязана иметь какое-либо отношение к расстоянию до центра. Тем не менее мы будем говорить об г как о "радиальной координате" на сфере. Если пространство-время является как статическим, так и сферически симметричным, и если статическое поле векторов Киллинга £а является единственным (как мы предполагаем), тогда £а должно быть ортогональным к орбитам-окружностям. Именно, если £а единственно, то оно должно быть инвариантным относительно всех изометрий вращения. Однако это приводит к тому, что его (векторного поля) проекция на любую орбиту-окружность исчезает, так как ненулевое векторное поле на сфере не может быть инвариантным относительно всех вращений. Поэтому орбиты-окружности располагаются полностью внутри гиперповерхностей Et ортогонально £а. Удобные координаты в пространстве-времени могут быть получены следующим
6.1. Вывод решения Шварцшильда 185 образом: выбираем сферу на Е = Ео, а на ней - сферические координаты (6,ф). Мы "переносим" эти сферические координаты на другие сферы Е при помощи геодезических, ортогональных к сфере А (аналогично тому, как мы использовали изотропных наблюдателей, чтобы "перенести" координатные метки на другие гиперповерхности в разд. 5.1). В том случае, если V0r ф О, мы выбираем (г, 0,0) как координаты на Ее, и, наконец, мы выбираем (£,г, 0, ф) как координаты пространства-времени в соответствии с вышеописанной процедурой (6.1.2). В этих координатах метрика произвольного статического сферически-симметричного пространства-времени1 принимает простую форму ds2 = -f(r)dt2 + /i(r)dr2 + r2(d02 + sin2 вдф2). (6.1.5) Следует помнить, однако, что в дополнение к хорошо понятному разрыву сферических координат на северном и южном полюсах сфер, эта координатная система терпит разрыв в точках, где £а = 0 или Var = О (или, в более общем случае, где £а и Var становятся колинеарными). Как мы увидим в разд. 6.4, это происходит в области сильного поля решения Шварцшильда. Большая часть работы, необходимая для статического сферически- -симметричного вакуумного решения уравнений Эйнштейна, теперь завершена, так как мы свели общую проблему определения 10 неизвестных функций (компонент метрики gMI/) от четырех переменных (четырех координат) к определению двух функций (/ и h) от одной переменной (г). Оставшаяся задача заключается в том, чтобы подсчитать компоненты тензора Риччи Rab для метрики (6.1.5) и решить уравнение Rab = 0 для / и h. Мы будем вычислять Даь, используя второй тетрадный подход разд. 3.4.2. Удобный ортонормальный базис для метрики (6.1.5) таков: Ы« = /1/2(d*)„, (6.1.6а) (ei)a = ft1/2(dr)a, (6.1.6b) (e2)a = r{A9)a, (6.1.6c) (e3)0 = rsin<9(d</>)0. (6.1.6d) 1 Стоит отметить, что любое стационарное сферически-симметричное решение должно быть статическим. Причина та же, что в статическом случае: стационарное поле Киллинга £° должно быть ортогонально к орбитам-окружностям, и, кроме того, £aVar = 0, так как г - геометрическая величина. Следовательно, £а должно быть ортогональным к гиперповерхности Е, генерируемой интегральными кривыми Var, начинающимися на орбите-окружности. (Если Var = 0, то приведенные аргументы теряют силу, но вывод об ортогональности гиперповерхности к fa остается верным.)
186 Глава 6. Решение Шварцшильда Используя обычную производную да нашей координатной системы, получаем 0[а(ео)ь) = \r1/2f'(dr)[a(dt)b], (6.1.7) 0[«(ei)6] = 0, (6.1.8) д[а(е2)ь] = (dr)Ie(dff)4, (6.1.9) а|«(ез)ч = аав(6г)1а(дф)ц+гств(Щ1а(дф)ц, (6.1.10) где /' = d//dr. Таким образом, согласно уравнению (3.4.25) (или эквивалентно уравнению (3.4.27)), мы должны решить нижеследующие уравнения для 1-форм связности wa/J„ = — wa„M: \f-l/2f'(dr)[a(dt)b] = hl/2(dr)[aub]0l +r(d0)[au;6]o2+ +rsin0(d0)[aa;6]o3, (6.1.11) 0 = /1/2(d*)[a"6]oi + r№[aujb]12 + r sm0(d<f>)lau;b]13l (6.1.12) (dr)[e(cW)4 = -f1/2(dt)[au;b]20+ +/i1/2(dr)[aa;bl2i + r sin0(d</>)[au;6]23, (6.1.13) sme(dr)[a(d<t>b] +rcos9(de)la(d<t>)b] = -f1/2(dt)[aub]30+ +/i1/2(dr)[au;6]3i + r(d0)lau;b]32. (6.1.14) Вполне убедительное предположение при решении уравнения (6.1.11) таково: ^602 = ^603 = 0, (6.1.15) 1 /' ^601 = 2(/М1/2 + al(<Hb> (6.1.16) где функцию а\ невозможно определить из уравнения (6.1.11). Тогда подстановка этого пробного решения в уравнение (6.1.12) приводит к требованию а\ = 0. Из уравнения (6.1.12) мы можем также угадать ^612 = ^613 = 0» но это привело бы к дальнейшей несовместимости, так что мы просто заключаем, что и>ы2 = a2(d0)b + a3(d0)b, (6.1.17) "ыз = а4(#)ь + -?^(с10)б. (6.1.18) sine/ Подставляя наше пробное решение в уравнение (6.1), находим а2 = -Л"1/2, (6.1.19)
6.1. Вывод решения Шварцшильда 187 /l1/2 ^623 = —a3(dr)b + <*ь(йф)ь. г sin и Наконец, подстановка в уравнение (6.1) дает а3 = 0, а4 = -/i-1/2sin0, С*5 = — COS в. (6.1.20) (6.1.21) (6.1.22) (6.1.23) То, что мы не обнаружили несовместимости, означает, что наше пробное решение (продиктованное первоначальным предположением шьо2 = = <*>&оз = 0) фактически является частным решением. Таким образом, мы установили, что ^602 = ^боз = 0, (6.1.24) 1 /' "Ш = 2(А}^' (6Л>25) ШЬ12 = -Н-1/2(дв)ь, (6.1.26) мыз = -/r1/2sin0(d<£)b, (6.1.27) ^623 = -cos^(d0)6. (6.1.28) Из уравнения (3.4.20) (или, что то же самое, из (3.4.28)) мы находим тензор Римана, причем полные вычисления значительно проще по сравнению с другими подходами (см. задачу 2) Даш = -Rabio = ^ [(fh)-1/2f] (dr)[a(d*)fe], (6.1.29) Да602 = ~Rab20 = r1/2h-lf'(d0)[a(dt)b], (6.1.30) ДабОЗ = -i?a63O = /-1/2ft-7'sine(d0)[o(dt)6], (6.1.31) Да612 = -Rab21=h~V2h'(dr)la(de)bh (6.1.32) RablS = -Rab31=Sin0h-V2h'(dr)[a(d<t>)bh (6.1.33) Дабгз = -Rab32 = 2(l-h-l)sme{de)[a(d<t>)b]. (6.1.34) Тензор Риччи легко высчитывается из тензора Римана по формуле (3.4.22). Приравнивая его нулю, мы получаем вакуумные уравнения Эйнштейна для статического сферически симметричного пространства-времени 0 = Roo = ДоЮ + #020 + Д()30 = = \(fhr1/2i [(A)"172/'] + (г-А)-1/', (6.1.35)
188 Глава 6. Решение Шварцшильда О = Rxx=-\{fh)-1l2±[{fh)-^f]+(rh*)-ih', (6.1.36) О = Л22 = -^(г/Л)-1/' + ^(гЛ2Г1Л' + г-2(1-/1-1),(6.1.37) где ЛД1/ = Rab(e^)a(ev)b. Также мы находим, что Дзз — -^22? и что недиагональные компоненты R^ тождественно обращаются в нуль, как можно было бы предсказать по соображениям симметрии, подобным использованным в разд. 5.2. Складывая уравнения (6.1.35) и (6.1.36), получаем уравнение f'/f + h'/h = 0, (6.1.38) которое имеет следствием f = Kh~l, (6.1.39) где К - константа. Перемасштабируя координату времени t —> Klf2t, можно сделать К = 1. Тогда уравнение (6.1.37) дает -/' + 1—J- = 0, (6.1.40) г т.е. ^(г/) = 1, (6.1.41) откуда / = 1 + С/г, (6.1.42) где С - константа. Выражения (6.1.42) вместе с (6.1.39) (при К = 1) решают уравнения (6.1.35)-(6.1.37), и таким образом, мы находим общее решение вакуумных уравнений Эйнштейна для статического сферически-симметричного пространства-времени, открытое Шварцшильдом ds2 = - (l + j\ dt2 + (l + 7) dr2 + r2dfi2, (6.1.43) где <Ю2 - сокращение для (d02 + sin2 0d<f)2). Пожалуй, первое, что следует отметить в решении Шварцшильда, это что оно является асимптотически плоским2, т.е. при г —► оо метрические компоненты обращаются в компоненты пространства-времени Минковского в сферических координатах. Это позволяет нам интерпретировать метрику Шварцшильда как внешнее гравитационное поле 2В гл. 11 будет дано точное общее определение асимптотической плоскостности.
6.1. Вывод решения Шварцшильда 189 изолированного тела. Мы можем придать смысл постоянной С, сравнивая поведение пробного тела в режиме слабого поля (г —► оо) с поведением пробного тела в ньютоновской теорией тяготения. Исследование геодезических метрики Шварцшильда (см. разд. 6.3) или, что эквивалентно, непосредственное сравнение метрики Шварцшильда с ньютоновской метрикой, которая обсуждалась в разд. 4.4.1 (которая, однако, не была представлена в калибровке, удобной для сравнения), показывает, что для больших г поведение пробного тела в решении Шварцшильда с параметром С согласуется с поведением пробного тела в ньютоновском гравитационном поле массы М = —С/2 (т.е. после восстановления всех G и с в формулах GM/c2 = -С/2). Таким образом мы интерпретируем (—С/2) как полную массу поля3 и можем записать метрику Шварцшильда в ее окончательной форме: d*2 = - (i - ^) л2 + (i - ™) ~l ^ + Лю'. (6.1 44) Замечательной особенностью решения Шварцшильда является то, что метрические компоненты становятся сингулярными в режиме сильного поля как при г = 2М, так и при г = 0. Такое сингулярное поведение компонент может быть следствием либо (i) разрывности координат, используемых, чтобы получить общую форму метрики (6.1.5), потому что £а = 0 или Var = 0 (или £° и Var становяться колине- арными); либо (и) истинной сингулярности структуры пространства- времени. Мы увидим в разд. 6.4, что "сингулярность" при г = 2М вызвана только разрывностью координат, в то время как сингулярность при г = 0 является истинной физической сингулярностью. Однако мы отметим здесь, что "сингулярность" при г = 2М возникает при радиальной координате, равной 2GM Ш (а 1 а*\ г3 = —2~ ** ТГ км' (6.1.45) с2 М0 где М0 «2х 1033г - масса Солнца. Таким образом, для "обычного тела", такого как Солнце или Земля, радиус Шварцшильда rs гораздо меньше, чем радиус самого тела, где, конечно, вакуумное решение Шварцшильда уже недействительно. В самом деле, координатная и физическая сингулярности при г = г3 и г = 0, соответственно, уместны только для тел, которые претерпели полный гравитационный коллапс. 3Общее определение полной массы для асимптотически плоских решений (основанное на этой идее исследование гравитационного поля на удалении) будет дано в гл. 11.
190 Глава б. Решение Шварцшильда В завершение отметим, что вакуумные уравнения Эйнштейна также могут быть решены для сферически симметричного пространства- времени общего вида без предположения о статичности. Как было впервые показано Биркгоффом (Birkhoff 1923), решение Шварцшильда остается единственным и для этой более общей системы уравнений. Таким образом, все сферически симметричные пространства-времена с Rab = 0 - статические. Этот результат, известный как теорема Биркгоффа (Hawking, Ellis 1973), представляет собой полную аналогию тому, что кулоновский потенциал - это единственное сферически- симметричное решение уравнений Максвелла в вакууме. Другая интерпретация того же утверждения гласит: в гравитации, как и в электромагнетизме, не существует монопольного (т.е. сферически-симметричного) излучения. 6.2 Внутренние решения Теперь мы обратим внимание на статические сферически-симметричные решения уравнений Эйнштейна с тензором энергии-импульса идеальной жидкости ТаЬ = риащ + Р (gab + иащ). (6.2.1) Чтобы сочетаться со статической симметрией пространства-времени 4-скорость жидкости иа должна совпадать по направлению со статическим векторным полем Киллинга £а, т.е. и* = -(е0)а = -/1/2(d*)°, (6.2.2) где / - функция, появляющаяся в общей форме метрики (6.1.5). Решения, которые мы ищем, описывают возможные внутренние структуры жидкостных источников внешней метрики Шварцшильда, поэтому наше исследование даст уравнения структуры статических жидкостных объектов, таких как звезды. Уравнения Эйнштейна с жидкостным источником получаются просто добавлением соответствующих компонент тензора энергии-импульса в уравнения (6.1.35)-(6.1.37). Возьмем те три уравнения, которые независимы 87г7оо = 8пр = Goo = Яоо + « (Ro + -Ri + R>2 + R3 ) = = {rh^h' + r-^l-h-1), (6.2.3)
6.2. Внутренние решения 191 8яТц = 87гР = С11=Дп-^(До0 + Д11 + Д22 + Лз3) = = (rfhr'f'-r-^l-h-1), (6.2.4) 8тгГ22 = 8^P = G22 = i(A)-1/2A[(//l)-i/2/'] + + \{rfh)-4' ~ \(rh2)-lh'. (6.2.5) Уравнение (6.2.3) содержит только h. (Это можно было бы предсказать, основываясь на общем анализе структуры уравнений Эйнштейна гл. 10, который показывает, что уравнение Goo = вяТоо представляет собой "ограничение начальных значений", вовлекающее в статическом случае только геометрию пространственноподобной гиперповерхности Е, ортогональной к £а, и поэтому оно не должно содержать /.) Уравнение (6.2.3) можно преобразовать к виду ^ И1 - Л"1)] = 8*А (6.2.6) из которого сразу следует решение для h Mr)_H Mr)1"1 (6.2.7) где га = Г 2ш0 (г) = 4тг / p(r')r'2dr' + а, (6.2.8) здесь а - константа. Гладкость метрики на Е при г = 0 требует, чтобы при г —> 0 площади сфер приближались к 47Г квадрата их собственных радиусов, т.е. чтобы h(r) —► 1 при г —► 0. Таким образом, чтобы устранить "коническую сингулярность" метрики при г = 0, мы обязаны положить а = 0. Так как Е должна быть пространственноподобной для статической конфигурации, мы видим, что h ^ 0 - необходимое условие статичности, т.е. г ^ 2m(r). (6.2.9) Если р = 0 при г > Я, то наше решение для h (6.2.7) сшивается с вакуумным решением Шварцшильда с полной массой = 4тг / Jo М = m(R) = 4тг / p(r)r2dr. (6.2.10) Jo Выражение (6.2.10) формально совпадает с выражением для полной массы в ньютоновской теории тяготения. Отметим, однако, что эта
192 Глава 6. Решение Шварцшильда формальная аналогия обманчива, потому что собственный элемент объема на £ (см. прилож. В) имеет вид у/Щд3х = h1/2r2smвdrdвdф, так что полная собственная масса такова fR г = 47Г / р(г) 1 Jo L Мр = 4тг/ р(г)\1 2^)1_1/2 dr. (6.2.11) Разность между М и Мр можно интерпретировать как гравитационную энергию связи Еь конфигурации ЕЬ = МР- М, (6.2.12) которая всегда положительна, так как Мр > М. Если мы определим новую функцию ф f = е2*, (6.2.13) то уравнение (6.2.4) принимает вид дф т(г) + 4ят3Р dr r[r — 2m(r)] (6.2.14) В ньютоновском пределе имеем г3Р «С т(г) и га(г) «С г, так что (6.2.14) упрощается до ? « ^- (6-2.15) dr r^ Это не что иное как сферически симметричное уравнение Пуассона для ньютоновского гравитационного потенциала. Таким образом, в статическом сферически симметричном случае мы можем рассматривать ф = \ In/ как аналог ньютоновского потенциала в общей теории относительности. Для нестационарных конфигураций, однако, в общей теории относительности отсутствует общепринятый аналог ньютоновского потенциала. Если мы подставим наши результаты (6.2.7) и (6.2.14) в последнее из уравнений поля (6.2.5), то, очевидно, получим уравнение для dP/dr. Однако, можно избавить себя от громоздкой алгебры такой подстановки, если заметить, что Ыь8тгУаГа6 = (еДУа(8тгГа6 - Gab) = = Va [Ыь(87гГ°6 - Gab)] - шаЬц(8тгТаЬ - Gob), (6.2.16) где иаьц = Уа(ем)ь. Фиксируя /х = 1, находим, что первый член в правой части (6.2.16) зануляется, если справедливо (6.2.4). Таким образом.
6.2. Внутренние решения 193 поскольку LJ221 ф О, мы видим (учитывая уравнения (6.2.3) и (6.2.4)), что обращение в нуль (87гТ22 — G22) эквивалентно тому, что (ei)6VaTa6 = 0, (6.2.17) и, следовательно, можем заменить (6.2.5) уравнением (6.2.17). Мы уже подсчитали в (4.3.8) эту компоненту VaTa6 для идеальной жидкости и, таким образом, без дальнейших вычислений, получаем (используя Ыб = ft1/2(dr)b = h-V2{d/dr)b) Л-1/2^ = _(Р + p){ei)bUaVauh = -/Г1'2^, (6.2.18) йг йг где при выводе последнего равенства использованы (6.2.2) и (6.2.13). Учитывая уравнение (6.2.14), можно исключить дф/dr, чтобы получить наш окончательный результат dP /г. чга(г) + 4тгг3Р ,„Л11Лч dF°-(P + ^r[r-Mr)]' (6'2Л9) известное как уравнение Толмана-Оппенгеймера-Волкова гидростатического равновесия. В ньютоновском пределе (Р <^С р и га(г) <С г) оно сводится к ньютоновскому уравнению гидростатического равновесия4 £ и .ВНР. (6.2.20) dr г2 В итоге мы нашли, что геометрия пространства-времени внутри статической сферической жидкостной звезды такова: ds2 = -c2*dt2 + где /.m.\ r i i ^Щ dr2 + r2dfi2, (6.2.21) 771 (г) = 4тг / /9(r,)r,2dr/, (6.2.22) ./о и ф определяется из уравнения (6.2.14). Необходимым и достаточным условием равновесия служит уравнение (6.2.19). Таким образом, для жидкого вещества с заданным уравнением состояния Р = Р(р) равновесные конфигурации можно найти следующим образом: мы произвольным образом задаем плотность в центре Интересно, что, хотя общая теория относительности мало влияет на равновес- Hbie конфигурации звезд, имеющих Р < ри га(г) < г, она все же имеет суще- Ственное влияние на стабильность звезд с уравнением состояния Р = Срх при Л близких к критическому значению 4/3 (Chandrasekhar 1964).
194 Глава 6. Решение Шварцшильда рс и, следовательно, давление в центре Рс = Р(рс)- Затем интегрируем (6.2.19) и (6.2.22) по направлению от центра до тех пор, пока не достигнем поверхности звезды Р = р = 0, и в этой точке мы сшиваем решение с вакуумным решением Шварцшильда (6.1.44). Окончательно находим 0, интегрируя уравнение (6.2.14) при граничном условии ф —» 0 при г —> оо (или, эквивалентно, требуя, чтобы ф достигало значения вакуумного решения на поверхности звезды). Эта процедура отличается от той, что используется в ньютоновской теории, только тем, что уравнение (6.2.19) заменяет (6.2.20), а (6.2.14) - (6.2.15). Наиболее важное различие между равновесными конфигурациями в общей теории относительности и ньютоновской теории тяготения можно увидеть в том, что (принимая Р ^ 0) для заданной функции плотности p(r) ^ 0 правая часть релятивистского уравнения гидростатического равновесия (6.2.19) всегда больше по величине, чем правая часть ньютоновского уравнения (6.2.20). Это означает, что для заданной плотности р(г) центральное давление Рс, необходимое для равновесия, всегда больше в общей теории относительности, чем в ньютоновской теории; т.е. в общей теории относительности, труднее поддерживать равновесие. Это эффектно иллюстрирует рассмотрение конфигураций однородной плотности, соответствующих несжимаемой жидкости с плотностью ро, и следовательно (как в общей теории относительности, так и в ньютоновской теории) 3 т(г) = -тгг3ро {г ^ Д). (6.2.24) Ньютоновское уравнение гидростатического равновесия (6.2.20) легко интегрируется и дает результат (для г ^ R) Р{г)=2-кр1{В?-г2), (6.2.25) где наложено граничное условие P(R) = 0. Таким образом, центральное давление ньютоновской звезды с однородной плотностью Рс = |*рЖ = ©1/3М2/зр</з (и.») конечное при любых значениях ро и Я, т.е. равновесие может быть достигнуто при достаточно больших давлениях для всех ро и R. С другой
6.2. Внутренние решения 195 стороны, общерелятивистское уравнение гидростатического равновесия (6.2.19) тоже можно строго проинтегрировать, как это впервые сделал Шварцшильд (Schwarzschild 1916b), получив rv> - Р° (1 _ 2Мг2/Я3)!/2 - 3(1 - 2М/Д)!/2 • ^""' Таким образом, центральное давление, необходимое для равновесия звезды с однородной плотностью в общей теории относительности, 1-(1-2М/Д)У2 Рс-роЗ(1-2М/Д)1/2-1- {6-2'28) Для R^> M выражение (6.2.28) сводится к ньютоновскому значению (6.2.26). Однако теперь Рс становится бесконечным, если 3(1-2М/Д)1/2 = 1, (6.2.29) т.е. когда R = jM. (6.2.30) Таким образом, в общей теории относительности звезды с однородной плотностью и массой М > 4R/9 просто не могут существовать. Сформулировать этот же результат по-другому можно, сказав, что максимально возможная масса звезды с однородной плотностью ро равна / м—^п- <б-2'з,) Существование верхнего предела массы в общей теории относительности не следует из того, что рассмотрение ограничили однородными звездами. Фактически, если мы примем5 только, что плотность р(г) неотрицательная монотонно убывающая функция г, dp/dr ^ 0, то можно вывести следующие два типа верхнего предела массы для статических сферических звезд в общей теории относительности: (i) Для звезд фиксированного радиуса R максимально возможная масса, достигаемая при однородном значении плотности, Мтах = = 4Д/9. Действительно, предположение р ^ 0 следует из предположения о монотонном убывании dp/dr ^ 0, так как внутреннее решение должно в конечном итоге соответствовать внешнему решению Шварцшильда с р = 0. Наоборот, предположение dp/dr ^ 0 следует из р ^ 0, если мы дополнительно предположим, что жидкость подчиняется уравнению состояния Р = Р(р) сР^Ои dP/dp ^ 0, так как уравнение (6.2.12) dP/dr ^ 0.
196 Глава 6. Решение Шварцшильда (ii) Для фиксированного уравнения состояния (которое физически реалистично при малых плотностях) с плотностью ниже ро верхний предел массы существует независимо от уравнения состояния при плотностях больше, чем ро- (Значение этого верхнего предела массы, конечно, зависит от значения ро и предполагается, что уравнение состояния удерживает плотность ниже ро.) Теперь мы должны вывести верхний предел массы (i) и затем показать, как получается верхний предел (ii). Существование верхнего предела массы при фиксированном радиусе звезды R уже следует из условия h ^ О, которое, как видно из неравенства (6.2.9), приводит к тому, что необходимое условие статичности таково М ^ R/2. (6.2.32) Мы можем уточнить этот предел до М ^ 4Д/9, используя соотношение / ^ О, которое утверждает, что поле Киллинга £а - повсюду времениподобно. Чтобы это сделать, предполагая лишь, что р ^ 0 и dp/dr ^ 0, без каких бы то ни было предположений о давлении Р, мы должны проверить те два независимых уравнения поля (6.2.3)-(6.2.5), которые не содержат Р. Мы уже разрешили (6.2.3) относительно А, так что оставшееся уравнение получится вычитанием (6.2.5) из (6.2.4) О = Сц - G22 = i(rA)-1/' - r~2{\ - ft"1) + iCrfc2)"1/*' - -\Uh2)-l,2±[Uh)-Wf]. (6.2.33) Подставив наше решение (6.2.7) для h во второе и третье слагаемые и выполнив несколько алгебраических преобразований, находим 6_ dr r-lh-l/2*fl/2 dr = (А)1/2 d m(r) dr г3 (6.2.34) Так как dp/dr ^ 0, то средняя плотность, пропорциональная т(г)/г3, тоже должна монотонно убывать по г, поэтому имеем 6_ dr dr £0. (6.2.35) Интегрируя это неравенство по направлению к центру с поверхности звезды R до радиуса г, получаем rft1/2 dr (1 - 2М/Д)1/2 d yl/2 Я/i1/2 dr 1/2 R dr 0-¥ \ 1/2 r=R M_ Я3' -БТ, (6.2.36)
6.2. Внутренние решения 197 где мы учли, что наше внутреннее решение должно гладко сшиваться6 с решением Шварцшильда (6.1.44), поэтому мы вычислили производную Z1/2 при г = Я, используя внешнюю метрику Шварцшильда. Умножая неравенство (6.2.36) на r/i1/2 и интегрируя его еще раз к центру от R до 0, получаем fW(0)<(l-2M/r)W-£f*[l- 2т(гУ~1/2 rdr. (6.2.37) Здесь мы вновь использовали /*/2(Я) = (1 - 2М/Я)1/2, а также явное решение (6.2.7) для ft. Теперь условие dp/dr ^ 0 приводит к тому, что га(г) не может быть меньше, чем то значение, которое она бы имела в случае звезды однородной плотности (dp/dr = 0) m(r) > Mr3/R3. (6.2.38) Следовательно, второй член в правой части (6.2.37) будет по модулю меньше первого при равенстве в (6.2.38). Таким образом, получаем М fR^ 2Мг2Г1/2 J rdr = /^(ока-гм/я)1/*-^ я3 = Ъ-{\-2М/В)^-\. (6.2.39) Поэтому условие f1/2 ^ 0 означает, что необходимым условием статичности является (1-2М/Д)1/2^ -, (6.2.40) о т.е. М ^ 4Д/9, (6.2.41) что и является ожидаемым результатом. Еще раз подчеркнем, что абсолютно никаких предположений о давлении звезды Р не было использовано при выводе неравенства (6.2.41). Если верхний предел массы при фиксированном радиусе существует, то не удивительно, что существует верхний предел массы при заданном уравнении состояния с плотностью, меньшей ро (принимаем, что это уравнение состояния физически разумно и что dp/dr ^ 0). Если уравнение состояния не становится очень "жестким" (т.е. не ведет к высокому давлению Р) при малых плотностях (это то, что мы подразумевали, говоря о "физической разумности"), тогда верхний предел массы будет существовать для звезд, плотность которых повсюду 6До тех пор, пока ри Р непрерывны при г = Я, уравнения (6.2.3)-(6.2.5) гарантируют, что h и / являются здесь по крайней мере функциями класса С1.
198 Глава 6. Решение Шварцшильда меньше ро- Так как dp/dr ^ 0, звезды, плотность которых не может быть меньше ро, должны состоять из ядра с массой то и радиусом го, где р ^ ро, которое охвачено оболочкой, где р < ро- При заданном уравнении состояния для р < ро полная масса М определяется параметрами то и го. Функция M(mo,ro) будет непрерывной по то и г0. Однако, так как плотность ядра повсюду не менее ро, имеем нижний предел массы для ядра т0 > -тгг^ро. (6.2.42) С другой стороны, имея верхний предел полной массы (6.2.41), мы ожидали бы, что есть верхний предел для массы ядра то при заданном ее радиусе го. Действительно, та же самая выкладка, что привела к (6.2.41), за исключением того, что теперь радиус ядра го используется как граничный вместо радиуса на поверхности звезды Я, а уравнение (6.2.14) - вместо сшивки с решением Шварцшильда, чтобы найти dfl/2/dr при го, приводит к усилению пределов на параметры, mo ^ ?r0 [l - б7гг*Р0 + (1 + 6тгг2р0)1/2] , (6.2.43) где Ро = Р{ро) ~ давление на границе ядро-оболочка. Но неравенства (6.2.42) и (6.2.43) ограничивают значения то и го в замкнутой области плоскости (то, го). Таким образом, М(то,го) непрерывна на замкнутом множестве. Следовательно, М ограничена! Следует отметить, что верхние пределы массы для заданного уравнения состояния при всех плотностях возникают и в ньютоновской теории. Важное отличие, свойственное общей теории относительности, состоит в том, что предел не зависит от уравнения состояния при достаточно высоких плотностях. Поэтому неопределенность нашего знания о физически корректных уравнениях состояния неизбежна при очень высоких плотностях, и независимость от уравнения состояния существенна при выводе строгого верхнего предела массы. В холодном веществе с плотностью намного меньшей, чем ядерная (~ 1014 гсм~3), основной вклад в давление вносят вырожденные электроны. При "низких" плотностях электронов (n<Cra3c3/ft3 ~ 1031 см~3, где те - масса электрона) этот источник при Т = О обеспечивает давление Р Ш***У#*. (6.2.44) 5гае в то время как при высоких плотностях (n^>m3c3//l3) имеем P=M3^!nvs. (6.2.45)
6.2. Внутренние решения 199 ■Я 1.0 ( 0.5 0 1.0 2.0 3.0 4.0 tog„R(km) Рис. 6.1. Равновесные конфигурации холодного вещества. При данном уравнении состояния Р = Р(р) равновесная конфигурация однозначно определяется значением центральной плотности рс. Массы и радиусы таких конфигураций показаны здесь в диапазоне от ~ 105 г-см~3 в точке А до ~ 1017 г-см~3 за точкой D. В режиме белого карлика значения М и R зависят частично от того, какой состав звезды принять. В режиме нейтронной звезды значения М и R сильно зависят от того, какое принять состояние вещества, и каковы взаимодействия между элементарными частицами, составляющими звезду. Для последнего режима рисунок дает лишь грубый набросок качественных свойств, > найденных для некоторых уравнений состояния При плотностях, приближающихся к ядерной, холодное вещество существует главным образом в форме свободных нейтронов, и важным становится давление вырожденных нейтронов. Точная форма, обретаемая уравнением состояния, конечно, зависит от предположений относительно формы вещества при рассматриваемых плотностях и микроскопических сил, действующих между фундаментальными составляющими. В то время как эти факторы хорошо изучены при низких плотностях, значительные неопределенности возникают при ядерных плотностях и выше. Масса М и радиус R равновесных конфигураций холодного вещества при центральных плотностях между ~ 105 и ~ 1017гсм~3 показаны на рис. 6.1. Для плотностей около и выше ядерной рис. 6.1 представляет только набросок качественных особенностей, найденных для физически разумных уравнений состояния, так как точные значения М и R в этой области зависят от многих предположений. (Значения параметров в режиме ядерной плотности табулированы точнее, чем на рисунке, при широком охвате уравнений состояния (Arnett, Bowers 1977).) Даже при плотностях значительно ниже ядерной предсказываемые равновесные конфигурации зависят отчасти от предположений
200 Глава 6. Решение Шварцшильда относительно структуры звезды. Холодные тела на сегменте АВ кривой представляют стабильные равновесные конфигурации, поддерживаемые давлением вырожденных электронов. Эти тела известны как белые карлики. Как впервые показано Чандрасекхаром (Chandrasekhar 1939), максимальная масса белого карлика7 Мс«1,4( —J M0, (6.2.46) где /хN - число нуклонов на электрон, М0 - масса Солнца (~ 2 х 1033 г). В ньютоновской теории при фиксированном значении p,N масса монотонно возрастает вместе с центральной плотностью, приближаясь к предельной массе (6.2.46) для конфигураций с рс —> оо при радиусе R —» 0. В общей теории относительности при фиксированном значении fiN у кривой появляется "гистерезисное" поведение (т.е. масса начинает убывать вместе с рс) при конечном значении рс (Chandrasekhar, Тоорег 1964), хотя величина Мс существенно не меняется. Однако неустойчивость в точке В на рис. 6.1 возникает благодаря увеличению /zN при высоких плотностях из-за конверсии протонов и электронов в нейтроны. Общие соображения (Sorkin 1981) показывают, что в точке В кривой начинается нестабильность конфигураций сегмента ВС. Однако конфигурации на сегменте CD стабильные. Такие тела, называемые нейтронными звездами, состоят главным образом из нейтронов и поддерживаются в равновесии в значительной степени давлением вырожденных нейтронов. Так как плотность вещества в нейтронной звезде сравнима с плотностью атомных ядер, нейтронная звезда во многом похожа на гигантское высоко обогащенное нейтронами ядро (с атомным весом ~ 1057), за исключением того, что оно связано скорее гравитацией, чем ядерными силами. Из-за неопределенностей в уравнении состояния значение максимально возможной массы M(D) нейтронной звезды значительно более неопределеное, чем предельная масса белого карлика (6.2.46). Однако наиболее физически разумные уравнения состояния приводят к M(D) меньшему, чем 2М0. За точкой D кривой конфигурации вновь становятся нестабильными. 7Мы можем понять, почему должен существовать верхний предел этой величины, сравнивая центральное давление, необходимое для удержания плотности ньютоновской однородной звезды (6.2.26), с пределом высокой плотности давления электронов (6.2.45). Беря р = nNmNny где mN означает массу нуклона, приравнивая оба давления и восстанавливая в формулах G и с, получаем порядок оцениваемой величины he 3/2 1 М© МС' <* »К *1
6.2. Внутренние решения 201 Если опять применить аргумент о верхнем пределе массы к уравнению состояния холодного вещества, выбирая ро порядка ядерных плотностей (так что имеются некоторые неопределенности в уравнении состояния ниже ро), получается строгий верхний предел массы ~ 5М0 (Hartle 1978). Если, как принято считать, общие свойства уравнения состояния соответствуют плотности несколько меньше ядерной, то строгий верхний предел массы ~ 2М@ кажется реалистичным верхним пределом максимально возможной массы сферического тела, состоящего из холодного вещества. Мы должны подчеркнуть, однако, что наш анализ приложим только к статическому случаю, и поэтому эти верхние пределы массы не обязательно справедливы, например, для быстро вращающихся тел. Существование верхнего предела массы для холодного вещества имеет чрезвычайно важные следствия для отдаленного будущего звезд. Обычные звезды сопротивляются коллапсу под действием их собственного веса посредством давления идеального газа, обеспеченного высокой температурой. Это давление гораздо выше того, что создается холодным веществом при сопоставимых плотностях, и найденные выше предельные массы холодных звезд не применимы. Однако горячие звезды излучают энергию со своей поверхности, и если эта энергия не пополняется, гидростатическое равновесие не может поддерживаться. Если бы звезды не имели источника энергии, то они бы сжимались вначале очень медленно, но в конечном итоге на динамических масштабах времени развития нестабильностей до тех пор, пока были бы достигнуты такие высокие плотности, что давление "холодного вещества" доминировало бы над тепловым. В этой фазе, если масса звезды была бы достаточно малой, чтобы стабильное равновесие было достигнуто при давлении такого холодного вещества, звезда просто охлаждалась бы, оставаясь навсегда в статическом равновесии. С другой стороны, если бы масса звезды превышала верхний предел массы для холодного вещества, то равновесие никогда не могло бы установиться, и звезда претерпела бы полный гравитационный коллапс. Звезды фактически, конечно, имеют внутренний источник энергии: ядерные реакции. Следовательно, они способны оттягивать свою конечную судьбу обычно на миллиарды лет, хотя очень массивные на гораздо более короткое время, т.е. либо поддержание давления холодного вещества, либо полный коллапс. Однако это не меняет фундаментального заключения, что звезды с массой больше, чем верхний предел массы холодного вещества, должны в конце концов претерпеть полный гравитационный коллапс, если, конечно, они не сбросят достаточно массы во время звездной эволюции, так чтобы оказаться ниже этого предела.
202 Глава G. Решение Шварцшильда Когда звезда формируется за счет конденсации облака газа, она сжимается и разогревается до тех пор, пока центральная температура и плотность станут достаточно высоки, чтобы там начались ядерные реакции превращения водорода в гелий. Тогда коллапс звезды останавливается, и наступает долговременное равновесие, пока, наконец, не вырастет большое ядро из гелия. Если звезда достаточно массивна, начнется сжатие этого ядра, пока не станут возможными реакции синтеза более тяжелых элементов, чем гелий. Этот процесс может повторяться вновь, пока не будет синтезировано большое ядро из наиболее стабильных ядер никеля и железа. Критический фактор, управляющий тем, насколько далеко пойдет звезда по данной эволюционной последовательности, определяется тем, достаточно ли высоко давление вырожденных электронов, чтобы на любой стадии поддержать равновесие. Если масса звезды больше А/с, определенной пределом (6.2.46), то давление вырожденных электронов не сможет поддерживать звезду, и у нее вырастет большое ядро из никеля и железа (если только неустойчивости взрывного ядерного горения не возникнут на предыдущей стадии и не разорвут звезду буквально на части). Однако, если масса звезды меньше Мс, сжатие навсегда останаовится на предыдущей стадии. Никаких ядерных реакций потом происходить не будет, и звезда просто охладится навсегда до стабильной конфигурации белого карлика. Если М больше Мс, то когда ядро из никеля и железа вырастет до массы ~ Мс, это ядро просто не сможет поддерживать само себя: давления вырожденных электронов будет недостаточно, и станет невозможным дальнейшее производство энергии в ядерных реакциях. Следовательно, ядро претерпит гравитационный коллапс. К тому времени, когда плотность коллапсирующего ядра достигнет ядерной плотности, давление вырожденных нейтронов и ядерные силы создадут значительное давление холодного вещества. Если полная масса коллаисирующей части звезды ниже верхнего предела массы холодного вещества (~ 2М©), то коллапс может остановиться с образованием нейтронной звезды. Существование нейтронных звезд подтверждено открытием пульсаров - астрономически наблюдаемых объектов, которые испускают точно воспроизводимые сигналы с периодом в доли секунды. Единственное жизнеспособное теоретическое объяснение пульсаров состоит в том, что они представляют собой нейтронные звезды, которые обладают "горячим пятном", вращающимся с периодом сигнала и ориентирующимся на нас при каждом повороте. Когда коллапс ядра останавливается или замедляется при ядерных плотностях, должны возникать ударные волны, и они будут рас-
6.3. Геодезические в пространстве-времени Шварцшильда 203 пространяться наружу, в оболочку звезды. Вполне возможно, что эта ударная волна во многих случаях отвечает за сброс внешней оболочки звезды с громадным выделением энергии и образованием суперновой. В настоящее время, однако, не вполне понятно, как это происходит в деталях. Тем не менее, открытие пульсаров в окрестностях Краба и остатков суперновой Вела обеспечило убедительное наблюдательное подтверждение той картины, что возникновение суперновой сопряжено с коллапсом ядра звезды на конечной стадии ее эволюции. Итак, в заключение, если масса звезды достаточно мала, она может достичь конечного равновесия в форме белого карлика или нейтронной звезды. Однако, если масса коллапсирующей части звезды больше, чем верхний предел массы холодного вещества, то равновесие может быть не достигнуто никогда, и произойдет полный гравитационный коллапс. Как обсуждается в конце разд. 6.4, конечной стадией такого коллапса в сферическом случае будет черная дыра Шварцшильда. 6.3 Геодезические в пространстве-времени Шварцшильда В этом разделе мы проанализируем поведение пробных тел и световых лучей во внешней области (г > 2М) решения Шварцшильда, применяя времениподобные и нулевые геодезические геометрии Шварцшильда. Конечно, наш анализ геодезических в режиме сильного гравитационного поля (г близко к 2М) физически относится только к звездам высокой плотности или к полностью коллапсировавшим объектам, но результаты в режиме слабого гравитационного поля (г ^> М) применимы к "обычным телам", таким как Солнце. Чтобы непосредственно решить уравнение геодезических в форме (3.3.5), потребовалось бы изрядно потрудиться. К счастью, почти всех эти затрат можно избежать, если воспользоваться преимуществом симметрии решения Шварцшильда с помощью утверждения С.3.1 при- лож. С: внутреннее произведение иа£а поля Киллинга £° на касательную к геодезической иа постоянно вдоль геодезической. Как мы увидим дальше, применение интегралов движения позволяет свести проблему поиска геодезических к проблеме одномерного движения частицы в эффективном потенциале. 6.3.1 Гравитационное красное смещение Утверждение С.3.1 сразу позволяет нам вывести формулу разности частот испущенного и полученного светового сигнала между двумя статическими наблюдателями, т.е. для гравитационного красного
204 Глава 6. Решение Шварцшильда смещения. (Подобный вывод космологического красного смещения в расширяющейся однородной и изотропной Вселенной был сделан в разд. 5.3.1.) Рассмотрим двух наблюдателей 0\ и С?2? 4-скорости которых, и" и и2, карательны к статическому полю Киллинга £а (такие наблюдатели и называются статическими). Предположим, что 0\ испускает световой сигнал в мировой точке Р\, а Ог получает этот сигнал в мировой точке Рч (рис. 6.2). Как показано в разд. 4.3, в приближении геометрической оптики световой сигнал распространяется по нулевой геодезической, касательную к которой обозначим ка. Частота излучения "1 = " (J**?)|Л , (6.3.1) в то время как частота, измеренная наблюдателем, получающим сигнал, "2 = - {Киа2)\Р2. (6.3.2) Однако, так как и* и и2 - единичные векторы, которые указывают направление времениподобных векторов fa поля Киллинга, мы имеем «!=[*7(-Ль)1/а]|л (б.з.з) <=[е/(-С%)1/2]\р2. (6.3.4) Применяя утверждение С.3.1, мы имеем (fca£a)|p! = (&a£a)|p2> таким образом мы получаем Ы1^(-166)1/2к=(1-2М/га)*/а "2 Ы%У'2\р2 (l-2M/n)V2' ^л> где использовано точное выражение £6& = gtt = — (1 — 2М/г) в пространстве-времени Шварцшильда, а г\ и г2 - радиальные координаты 0\ и Ог соответственно. Заметим, однако, что сделанная выкладка справедлива в произвольном стационарном пространстве-времени. Соотношение (6.3.5) показывает, что при г\ > г2 (т.е. когда излучатель ближе к центру гравитационного притяжения, чем приемник) мы получаем ш2 < u>i, т.е. частота света будет уменьшаться ("смещаться в сторону красного цвета"). Физический смысл этому придает квантовая теория, в которой энергия фотона пропорциональна его частоте Е = /Ы, и нам следует ожидать, что энергия фотона понижается по мере того, как он "выбирается из гравитационной потенциальной ямы". Действительно, в пределе, когда М гораздо меньше, чем г\ и г2, как
6.3. Геодезические в пространстве-времени Шварцшильда 205 Рис. 6.2. Пространственно-временная диаграмма посылки светового сигнала статического наблюдателя 0\ статическому наблюдателю Ог в случае над поверхностями обычных тел, формула (6.3.5) принимает вид Am ПМ ПМ (6.3.6) Аи ш GM GM + С2Г\ О ' СгГ2 где мы восстановили все G и с. Это можно интерпретировать словами: если локально измеренная энергия фотона имеет приращение ЙДо;, то оно пропорционально разности ньютоновской гравитационной потенциальной энергии между точками измерения: (hw/c2)(-GM/n +GM/r2). Гравитационное красное смещение было измерено и оказалось в согласии с предсказаниями общей теории относительности с точностью в пределах 1% экспериментальной погрешности. Первый лабораторный эксперимент (Pound, Rebka 1960) использовал эффект Мёссбауэра для измерения очень малых смещений частоты фотонов на поверхности Земли при их падении с башни8. Гравитационное красное смещение спектральных линий Солнца и некоторых белых карликов тоже было °бнаружено при наблюдениях, но точность этих измерений при про- верке формулы (6.3.5) не так высока из-за конвективных движений Речь идет о башне Джефферсоновской физической лаборатории Гарвардского Университета.- Прим. ред.
206 Глава 6. Решение Шварцшильда (которые уширяют спектральные линии) в случае Солнца, а также ряда других погрешностей в случае белых карликов. Ближе к нашему времени формула гравитационного красного смещения была подтверждена с точностью 0,01% по данным слежения за водородным мазером, запущенным с ракеты (Vessot, Levine 1979; Vessot etal. 1980). Было также потверждено существование "гравитационного растяжения времени", эффекта, подобного гравитационному красному смещению, наблюдаемого при сравнении показаний атомных часов, установленных на самолете и на Земле (Hafele, Keating 1972; Alley 1979). Стоит отметить, что, как доказано в разд. 6.2, максимальное значение М/r на поверхности статического сферического тела (при dp/dr ^ ^ 0 повсюду внутри тела) равно 4/9. Поэтому по формуле (6.3.5) максимальное красное смещение света, испущенного с поверхности статической звезды, равно 071 UJ2 uj(r = оо) т.е. для красного смещения гл. 5, мы имеем c(r = 9M/4)=3i (вд7) г\ = ^ UJ2 -1 = 2. (6.3.8) max Это исключает возможность, что наблюдаемые красные смещения больше 2 (как обычно обнаруживается у квазаров) могут возникать только от гравитационного красного смещения света, испущенного с поверхности статического сферического тела. 6.3.2 Прецессия перигелия Чтобы узнать больше о поведении световых лучей и пробных тел во внешнем гравитационном поле сферического тела, нам надо решить уравнения времениподобных и нулевых геодезических. Во-первых, мы отмечаем, что благодаря симметрии инверсии в —> 7г — в метрики Шварцшильда, если начальная точка и касательный вектор геодезической находятся в "экваториальной плоскости" в = 7г/2, то и вся геодезическая должна лежать в этой "плоскости". Поскольку любую геодезическую можно перевести в геодезическую, начинающуюся на экваториальной плоскости (а следовательно, экваториальную целиком), путем вращательной изометрии, то без потери общности мы можем сосредоточить свое внимание на изучении только экваториальных геодезических, что мы и сделаем.
б.З. Геодезические в пространстве-времени Шварцшильда 207 Компоненты координатного базиса касательной иа к кривой, параметризованной т, равны (см. формулу (2.2.12)) dx** и" = ^~ = х». (6.3.9) QT Для времениподобных геодезических мы выбираем в качестве г собственное время, а для нулевых геодезических мы выбираем в качестве г аффинный параметр. Поэтому для рассматриваемых случаев имеем (помня, что в = 7г/2) -* = ёаЬиЛиЪ = -(1 - 2M/r)t2 + (1 - 2M/r)~lr2 + г2ф2, (6.3.10) где {1 (времениподобные геодезические) ,„ „ . 0 (нулевые геодезические) При выводе гравитационного красного смещения мы уже пользовались величиной Е = -ёаЬ(;аиь = (1 - 2M/r)t, (6.3.12) которая представляет собой интеграл движения, где £° = (d/dt)a обозначает статическое поле Киллинга. В случае времениподобных геодезических на больших расстояниях от центра притяжения г ^> М, где метрика становится плоской и норма £а принимает значение -1, Е сводится к формуле специальной теории относительности для полной энергии частицы с единичной массой покоя, измеренной статическим наблюдателем. Вообще говоря, мы можем интерпретировать Е для времениподобных геодезических как величину, представляющую полную энергию (включая гравитационную потенциальную энергию) на единицу массы покоя частицы, движущейся по рассматриваемой геодезической, по отношению к статическому наблюдателю на бесконечности, поскольку это и есть энергия, которая потребовалась бы такому наблюдателю, чтобы поместить частицу с единичной массой покоя на данную орбиту. Аналогично, в случае нулевой геодезической hE представляет собой полную энергию фотона. Если применить утверждение С.3.1, то поле вращения Киллинга 'Ф0, = (д/дф)а тоже приводит к интегралу движения Ь = 8аЬфаиь = г2ф. (6.3.13) Мы можем интерпретировать L как угловой момент на единицу массы покоя частицы на времениподобной геодезической, и hL - как угловой момент фотона на нулевой геодезической. В ньютоновском пре-
208 Глава 6. Решение Шварцшильда деле формула (6.3.13) просто выражает второй закон Кеплера: равные площади ометаются за одинаковое время. В общей теории относительности пространственная геометрия не евклидова, и мы не можем трактовать (6.3.13) с помощью "ометаемой площади", но интересно, что простая форма (6.3.13) (при соответствующей интерпретации г и ф = йф/дт) остается в точности верной в режиме сильного поля. Подставляя (6.3.12) и (6.3.13) в соотношение (6.3.10) и группируя члены, получаем без особого труда наше окончательное уравнение геодезических ^♦К'-¥)(£"И* <""> Уравнение показывает, что радиальное движение на геодезической такое же, как движение частицы единичной массы с энергией Е/2 в обычной одномерной нерелятивистской механике в эффективном потенциале ¥, 1 ML2 ML2 /„«^x V=2K-"T + 2F--F- (6ЛЛ5) Как только радиальное движение в этом эффективном потенциале определено, угловое движение и изменение временной координаты легко находятся из уравнений (6.3.13) и (6.3.12). Принципиально новая особенность, которую вносит общая теория относительности в форму потенциала (6.3.15) в дополнение к "ньютоновскому слагаемому" (—кМ/г) и "центробежному барьеру" L2/2r2, это новый член (—ML2/r3), который преобладает над центробежным барьером при малых г. Прежде всего мы рассмотрим времениподобные геодезические с к = 1. Экстремумы эффективного потенциала V даются уравнением 0 = ^ = r~4 (Mr2 - L2r + 3ML2). (6.3.16) Оно имеет корни L2±(L4-12L2M2)l/2 R± = L__ L_. (6.3.17) Таким образом, если L2 < 12М2, то экстремумов у V нет, как показано на рис. 6.3. Частица, направляющаяся к центру притяжения (г ^ 0), при условии L2 < Y2M2 будет падать прямо на поверхность г = 2М и, действительно, продолжит свое падение в пространственно-временную сингулярность г = 0 (см. разд. 6.4). При L2 > 12М2 легко проверить, что экстремум Я+ является минимумом V, в то время как R- - максимумом, как показано на рис. 6.4.
6.3. Геодезические в пространстве-времени Шварцшильда 209 i Лм [/ 4М 6М X Рис. 6.3. Эффективный потенциал V на времениподобных геодезических в случае L2 = 6М2 Таким образом, стабильные круговые орбиты (г = 0) существуют при радиусе г = Д+, а нестабильные круговые орбиты - при г = Д_. Для L^> М формула для Я+ принимает вид R+ « L2/M, (6.3.18) который есть не что иное, как ньютоновский радиус круговой орбиты частицы с угловым моментом L на единицу массы, которая вращается вокруг сферического тела массы М. Это подтверждает выбор постоянной С при выводе решения Шварцшильда (6.1.43) равной (—2М). Отметим, что в соответствии с (6.3.17) Д+ ограничен диапазоном Я+ > 6М. (6.3.19) Таким образом, в общей теории относительности не существует стабильных круговых орбит при радиусах меньших 6М. Более того, нестабильные круговые орбиты заключены в диапазоне ЗМ < Д_ < 6М. (6.3.20) Таким образом, круговых орбит вообще не существует при радиусах меньших ЗМ. При обычном одномерном движении частицы ее энергия в те моменты, когда частица оказывается в минимуме или максимуме потенциала V, равна, конечно, значениям V в этих точках. Применяя, эту математическую аналогию к уравнению (6.3.14), мы находим, что истинная энергия на единицу массы покоя Е частицы на круговой орбите радиуса R дается выражением так что R — 'I'M
210 Глава 6. Решение Шварцшильда 0.55 Рис. 6.4. Эффективный потенциал на времен и подобных геодезических в случае L2 = 24М2. Обратите внимание, что масштаб V значительно увеличен по сравнению с рис. 6.3 где использовано условие (6.3.16), чтобы исключить L2, выразив его через R, принимающий значение R+ или Д_. Отметим, что, если R ^ ^ 4М, мы имеем Е ^ 1, и действительно Е —► оо при R —► ЗМ. Таким образом, частицы на нестабильных круговых орбитах радиусом от ЗМ до 4М будут уходить на бесконечность при возмущениях, направленных от центра. Энергия связи Ев на единицу массы покоя для последней стабильной круговой орбиты при R = 6М такова: Ев = 1 - Е = 1 - (8/9) 1/2 :0,06. (6.3.23) Далее, как обсуждено в разд. 4.4.2 для слабых полей, частица, двигающаяся по орбите в геометрии Шварцшильда, будет испускать гравитационное излучение. Из-за радиационного торможения ее движение будет немного отклоняться от геодезической. Частица, первоначально находившаяся на круговой орбите при R > М (а значит сЕ«1), должна медленно по спирали переходить на меньшие радиусы по мере того, как она теряет энергию на гравитационное излучение, оставаясь все время на почти круговой орбите до тех пор, пока достигнет орбиты радиуса R = 6М. В этой фазе орбита становится нестабильной и частица должна быстро падать до г = 0. В соответствии с (6.3.23) около 6% исходной массы-энергии частицы будет испущено за время, которое потребуется частице, чтобы скатиться по спирали к R = 6М. (Для метрики Керра (см. гл. 12) с а = М соответствующая доля излученной энергии равна 42%.) Это показывает, что хотя в примерах
6.3. Геодезические в пространстве-времени Шварцшильда 211 разд.4.4.2 испускание гравитационного излучения найдено очень слабым, астрофизические соображения подсказывают разумные процессы, в которых большие количества энергии могут быть преобразованы в гравитационное излучение. Если частицу слегка столкнуть с "равновесного" радиуса #+ стабильной круговой орбиты, то частица будет осциллировать на радиусах, близких к R+. При достаточно малых смещениях она будет совершать простое гармоническое движение с частотой шг по формуле ^r = fceff = d2V\ М(Д+-6М) dr2 я+ Rl(R+-my (6'3-24) где использовано (6.3.16), чтобы исключить L2, и мы должны подчеркнуть, что "время", которое определяет частоту u;r, - это собственное время частицы г в противовес координатному времени t геометрии Шварцшильда. С другой стороны, для круговой орбиты угловая частота и>ф = ф определяется из уравнения (6.3.13) ш+ = Щ = 111(11+-шу (63-25) где вновь использовано (6.3.16), чтобы исключить L2. В пределе ньютоновских орбит Д+ » М мы получаем иг « и>ф. Если ujr = Шф, то частица возвращалась бы точно на данное значение г через один орбитальный период, т.е. орбита была бы замкнутой. Действительно, в ньютоновской теории тяготения все ограниченные орбиты, а не только почти круговые, представляют собой замкнутые эллипсы. То, что в общей теории относительности иг не может быть равным Шф, означает, что орбиты не замкнутые; скорее имеется прецессия угла между направлениями, в которых достигается максимальное и минимальное значения г. Для почти круговых орбит этот темп прецессии дается формулой и)р = и>ф-ыг = - [(1 - 6М/Д+)1/2 - l] шф. (6.3.26) В пределе i?+ ^> M мы получаем в низшем неисчезающем порядке ЗМ3/2 3(GM)3/2 4/2 с2д5/2 (6.3.27) где мы восстановили все G и с в окончательной формуле. Мы рассмотрели только почти круговые орбиты, более общий анализ показывает
212 Глава 6. Решение Шварцшильда (Weinberg 1972), что в низшем неисчезающем порядке прецессия произвольной эллиптической орбиты имеет темп ■• - *GM)"- (6.3.28, р с2(1-е2)а5/2' где а - главная полуось эллипса, а е - его эксцентриситет. Общая теория относительности предсказывает для орбиты планеты Меркурий темп прецессии 43 угловые секунды в сто лет. Точно такая остаточная прецессия наблюдалась (с учетом известных эффектов, таких как возмущения от планеты Венера) еще до формулировки общей теории относительности и была необъяснимой загадкой. Объяснение прецессии орбиты Меркурия общей теорией относительности стало одним из наиболее волнующих первых успехов теории. Хотя общерелятивистская прецессия орбиты Меркурия предельно мала, аналогичная прецессия, наблюдаемая для орбиты бинарного пульсара (конец гл. 4), составляет около 4° в год. Этот результат использован для оценки масс двух тел этой системы. 6.3.3 Отклонение лучей света Теперь мы обращаемся к рассмотрению нулевых геодезических. Полагая к = 0 в (6.3.14), находим, что эффективный потенциал для нулевых геодезических есть просто V = ^(r-2M). (6.3.29) Таким образом, форма V не зависит от L и, как показано на рис. 6.5, единственный экстремум V - это максимум, имеющий место при г = = ЗМ. Таким образом, в общей теории относительности нестабильные круговые орбиты фотонов имеют радиус ЗМ, так что с точки зрения физики, гравитация имеет очень сильное влияние на распространение световых лучей в режиме сильного поля. Минимальная энергия Е, необходимая для преодоления вершины потенциального барьера, вычисляется по аналогии с (6.3.21) lE> = V(R = 3M) = ^L, (6.3,Ю) т.е. L2/E2 = 27M2. (6.3.31) Далее, для светового луча, распространяющегося в плоском пространстве-времени, непосредственно из определений L и Е следует, что
6.3. Геодезические в пространстве-времени Шварцшильда 213 Рис. 6.5. Эффективный потенциал V для нулевых геодезических L/E представляет собой известный параметр столкновения - минимальное расстояние, на которое луч приближается к центру притяжения г = 0. Так как геометрия Шварцшильда асимптотически плоская, то для светового луча, начавшегося из асимптотически плоской области (г ;» М) отношение L/E будет представлять прицельный параметр *>=§, (6.3.32) хотя теперь он уже и не является "минимальным расстоянием столкновения" До- Таким образом, геометрия Шварцшильда будет захватывать любой фотон, посланный в ее сторону с прицельным параметром, меньшим, чем критическое значение Ьс равное Ьс = 33/2М. (6.3.33) Следе )вательно, сечение захвата о фотонов в геометрии Шварцшильда а = тгб* = 27тгМ2. (6.3.34) Чтобы проанализировать эффект "отклонения световых" лучей, не захваченных геометрией Шварцшильда, удобно вывести неявную формулу пространственной орбиты светового луча, выразив г из уравнения (6.3.14), а ф - из уравнения (6.3.13). Деля одно на другое, получаем дф dr E2-£(r-2AI) -1/2 (6.3.35) Мы хотим найти приращение Аф = 0+ос - 0_оо угловой координаты ф светового луча в геометрии Шварцшильда, которое описывает полное отклонение луча от первоначального направления на всем пути, как показано на рис. 6.6. Чтобы не быть захваченным, луч должен иметь
214 Глава 6. Решение Шварцшильда Рис. 6.6. Схема эффекта отклонения светового луча прицельный параметр b больший, чем критическое значение (6.3.33). В этом случае орбита луча будет иметь "точку поворота" при наибольшем радиусе Ro, для которого V(Ro) = Е2/2, т.е. для наибольшего корня уравнения9 dr йф который равен = 0 Яо Д^ - 62(До - 2М) = 0, (6.3.36) 26 Яо = —7= COS v3 1 / 33/2М\1 - arccos f — J . (6.3.37) Благодаря зеркальной симметрии орбиты, вклады в Аф, которые определяются по двум частям пути, до точки поворота и после нее, равны. Следовательно, по формуле (6.3.35) находим полное приращение угловой координаты Аф Аф = 2 оо •/ Яо dr [г46-2 - r(r - 2М)] 1/2- (6.3.38) Удобно сделать замену переменной и = 1/г, после которой (6.3.38) принимает вид Аф 1/Яо = 2 / *L J (б-2 - и2 +1 2Ми3) 1/2- (6.3.39) В случае плоского пространства-времени М = 0 имеем До = Ь, и (6.3.39) дает просто &Ф\м=о = 2axcsm(b/Ro) = т, (6.3.40) 9Уравнения симметричной касательной к кривой (6.3.35).- Прим. ред.
6.3. Геодезические в пространстве-времени Шварцшильда 215 как, очевидно, и должно быть в этом случае, когда траектория - прямая линия. Когда М Ф О, в соответствии с (6.3.39) Аф будет не равно 7г, т.е. существует ненулевое отклонение светового луча от первоначального направления, физическую причину которого мы можем объяснить как гравитационное притяжение в геометрии Шварцшильда. Мы хотим вычислить отклонение светового луча с точностью до первого порядка по М. Вообще, вычисление этой величины довольно запутано, если пытаться варьировать М, удерживая Ь фиксированным в (6.3.39), потому что предел интегрирования l/Ro зависит от М, и подынтегральное выражение расходится на этом пределе. Однако мы можем обойти эти трудности, работая сМийо как с независимыми переменными. Другими словами, когда мы варьируем М, мы сравниваем Аф для световых лучей, которые имеют одну и ту же радиальную координату Шварцшильда Ro в точке поворота, а не, скажем, световые лучи с одним и тем же прицельным параметром Ь. (Несложно понять, что в первом порядке по М не имеет значения, сохраняем ли мы фиксированными Ь и Ro или нет, но в высших порядках по М имеет значение, сравниваем ли мы световые лучи с одним и тем же значением Ь или До или нет.) Исключая Ь с помощью (6.3.36), получаем 1/Яо Аф -■/ du (Rq2 - 2МД^3 - и2 + 2Ми3) 1/2* (6.3.41) Дифференцируя (6.3.41) по М при фиксированном До и вычисляя результат при М = 0, мы получаем дАф ОМ 1/Яо f=0 J (Щ - u3)du м=о J (R^2 - 2MR^3 -u2 + 2Mu3) 1/6 ь-з _ „,з 3/2 М=0 п f Ь~3-и3 л 4 =2У(н-^в>" (6-3, 42) Таким образом, в первом порядке по М угол отклонения света дается „формулой 8ф = Аф — 7г « М дАф ЭМ м=о 4М _ 4GM Ь ~ be2 ' (6.3.43) гДе мы на последнем этапе вновь восстановили все G и с.
216 Глава 6. Решение Шварцшильда Для светового луча, скользящего по поверхности Солнца, формула (6.3.43) предсказывает отклонение в 1,75 угловой секунды. Это отклонение светового луча звезды при ее прохождении вблизи края Солнца наблюдают во время солнечных затмений, начиная с экспедиции Эд- дингтона 1919 года (Dyson, Eddington, Davidson 1920), подтверждая, таким образом, это важное предсказание общей теории относительности. Но из-за многочисленных трудностей точность [оптических] измерений по этой схеме лишь около 10%. А вот для радиоволн удалось добиться точности около 1%: измерения отклонения лучей во время затмения квазара Солнцем (Fomalont, Sramek 1976) оказались в согласии с формулой (6.3.43). 6.3.4 Временная задержка сигналов Еще один эффект, связанный с поведением нулевых геодезических в геометрии Шварцшильда, это временная задержка радиолокационного сигнала, испущенного с Земли. Чтобы проанализировать этот эффект, мы берем из (6.3.12) £, а из (6.3.14) берем г, и посредством деления первого на второе получаем dr \ т ) I \ г ) гг Интегрирование этого уравнения вдоль траектории нулевой геодезической дает полное изменение At временной координаты Шварцшильда вдоль траектории. Рассмотрим теперь следующую ситуацию. Сигнал локатора испускается с Земли, которая имеет радиальную координату Re Шварцшильда. Сигнал проходит рядом с Солнцем, имея параметр минимального расстояния До» и затем отражается от планеты, расположенной в Rp. Сигнал затем возвращается по той же траектории на Землю, как показано на рис. 6.7. (Пренебрегаем движением Земли и планеты за время прохождения сигнала.) Сколько времени Дт пройдет по часам земного наблюдателя между излучением и приемом сигнала? Мы хотим вычислить Дт с точностью до первого порядка по М. Интегрируя уравнение (6.3.43) и затем дифференцируя по М (оставляя До фиксированным), в полной аналогии с выводом эффекта отклонения светового луча получаем (задача 5): Д* = ?[(Д2-Л2)1/2 + (^-^)1/2] + (6.3.44)
6.3. Геодезические в пространстве-времени Шварцшильда 217 Рис. 6.7. Схема эффекта временной задержки сигнала локатора 2GM Н^% -я2,) 1/2- + 21п /Де- Доу/2+/Др-^у/2 RoJ .Rp + Ro) } Rp + (Др - Д0) 1/2 До (6.3.45) Следует отметить, что мы сформулировали задачу - чисто для математического удобства - как варьирование М для сравнения нулевых геодезических с одним и тем же До, а не, скажем, нулевых геодезических с одним и тем же прицельным параметром Ь или с одним и тем же полным изменением угла Аф при прохождении от Де до Др. В отличие от расчета отклонения светового луча, теперь члены первого порядка по М существенно зависят от того, какие параметры нулевых геодезических оставить фиксированными при варьировании М. Собственное время Дт, которое проходит по наземным часам, связано с изменением координатного времени At формулой Дт = (1-2М/Де)1/2Д*. (6.3.46) Таким образом, с точностью до первого порядка по М отраженный сигнал локатора будет зафиксирован на Земле спустя Дт = - 2GM сЗД J[(^-^)1/2 + ^-^)1/2]+^ (6.3.47) после его посылки. Здесь At дается формулой (6.3.45). В сущности формула (6.3.47) сама по себе не очень полезна для прямой проверки эффекта задержки, как его предсказывает общая
218 Глава 6. Решение Шварцшильда теория относительности, поскольку содержит параметры Де, Rp и До, которые не определены с необходимой точностью. Поэтому процедура для проверки предсказания эффекта задержки должна основываться на формуле, позволяющей найти, какого изменения Дт ожидать за время многократного повторения сигнала локатора (из-за движения Земли и планеты), причем все параметры (в частности, орбитальные параметры планет) должны считаться неизвестными. Тогда, используя "наилучшее соответствие" с наблюдательными данными, можно определить все параметры. Когда теоретическая формула выведена именно так, она превосходно приспособлена для согласования с данными наблюдений. С другой стороны, небольшое изменение поправки общей теории относительности, - в частности, получающееся при подстановке (1 — 2~iM/r)~l в качестве grr при 7 отличной от единицы только на 0,2%, - дает формулу, которую нельзя удовлетворительно подогнать к наблюдательным данным. (Эти данные высочайшей точности в действительности получены не радиолокацией планет, а слежением за космическим аппаратом - источником сигнала (Reasenberg etal. 1979).) Таким образом, данное предсказание общей теории относительности было подтверждено с высокой точностью. Подводя итог: анализ времениподобных и нулевых геодезических в геометрии Шварцшильда приводит к ряду важных предсказаний, которые были проверены наблюдениями в солнечной системе: гравитационное красное смещение, прецессия орбит планет, отклонение световых лучей и задержка локационных сигналов. Эти предсказания дают возможность устроить жесткие количественные проверки общей теории относительности, и приятно сознавать, что к нашему времени общая теория относительности очень успешно прошла эти проверки. 6.4 Расширение Крускала Сейчас мы обратим внимание на анализ особенностей при г = 2М и г = 0 в координатном базисе метрических компонент решения Шварцшильда. В разд. 6.2 было установлено, что для любой статической равновесной конфигурации область г ^ 2М будет находиться во внутренней части физического источника гравитационного поля. Поэтому анализ сингулярностей при г = 2М и г = 0 для вакуумного решения Шварцшильда не относится к изучению гравитационного поля статической звезды, как это впервые было замечено Шварцшильдом. Однако, как упоминалось в конце разд. 6.2, достаточно массивные тела подвергнутся полному гравитационному коллапсу, и область г ^ 2Л/
6.4. Расширение Крускала 219 вакуумного решения Шварцшильда напрямую относится к описанию завершения этого коллапса. Всякий раз, когда метрические компоненты координатного базиса имеют особенности при определенных значениях координат, тому есть две возможные причины: (1) геометрия пространства-времени действительно является сингулярной; или (2) пространственно-временная геометрия несингулярна, но координаты не способны должным образом покрыть некоторую область пространства-времени. В общем, не так просто определить, какая из этих двух возможностей реализуется в заданной ситуации. (И действительно, непросто даже сформулировать точное общее определение понятия "сингулярность в геометрии пространства-времени". Мы отложим полное обсуждение ->той проблемы до гл. 9.) Вполне естественно было бы проверить возможность (1), вычисляя скаляр кривизны, например, RabcdRabcd- В случае, если скаляр расходится "в сингулярности метрических компонент", следует проверить, что эта "сингулярность" при конечном аффинном параметре принадлежит некоторой геодезической (так что "сингулярность" не находится "на бесконечности", а если так, то она в самом деле не является сингулярностью). Однако, как показано в гл. 9, можно получить пространственно-временные сингулярности там, где скаляры кривизны не расходятся. Было бы естественным подтверждать (2) прямым построением расширения "несингулярной области" исходной метрики, т.е. такого (несингулярного) пространства-времени (А/,£а6), которое включало бы исходное пространство-время (M,gab) как собственное подмножество. При этом было бы желательно найти координатное преобразование, которое устраняло бы сингулярности компонент исходной метрики. В случае метрики Шварцшильда, мы уже отмстили, что координаты Шварцшильда, будут иметь особенности там, где времен и подобное поле Киллинга £а становится параллельным V"r. Далее мы увидим, что это происходит при г = 2М, и что "сингулярность" при г = 2М— это просто координатная особенность. С другой стороны, сингулярность при г = О - это истинная сингулярность геометрии пространства- времени, что можно продемонстрировать, вычисляя инвариант кривизны RabcdRabcd по формулам (6.1.29). Мы начинаем, однако, с рассмотрения двух простых примеров, которые помогут пролить свет на суть проблемы. Как первый пример рассмотрим двумерную метрику ds2 = -^dt2 + dx2, (6.4.1) определенную в области координат —оо < х < х, О <. / ос. Ка-
220 Глава 6. Решение Шварцшильда жется, что эта метрика содержит сингулярность при t = 0. Однако истинная природа геометрии пространства-времени может быть выявлена посредством координатного преобразования t —► t' = 1/t. В новых координатах метрика, как легко заметить, является плоской ds2 = -{dt')2 + dx2, (6.4.2) а исходное пространство представляет собой, как видим, часть t' > 0 пространства-времени Минковского. Таким образом, кажущаяся сингулярность при t = 0 в исходной метрике (6.4.1) в действительности представляет собой t' —► оо в пространстве-времени Минковского и вовсе не является сингулярностью, но просто соответствует покрытию бесконечной области пространства-времени конечным интервалом изменения координаты. Геометрия пространства-времени является геодезически полной при t —> 0 (£' —► оо), т.е. все геодезические, приближающиеся к t = 0, простираются до произвольно больших значений своего аффинного параметра. С другой стороны, пространство- время (6.4.1) не является геодезически полным при t —> оо (tf —* 0). Тем не менее мы можем расширить исходное пространство "за предел t = оо", добавляя часть t' ^ 0 пространства-времени Минковского. Этот пример прекрасно иллюстрирует, как можно впасть в заблуждение, интерпретируя координатные метки, такие как t, физически бессмысленными величинами. Он также иллюстрирует, как подходящее координатное преобразование может помочь проанализировать, что в действительности происходит в пространстве-времени. Наш второй пример, как будет видно, является близким аналогом решения Шварцшильда, и по этой причине мы будем его детально анализировать. Рассмотрим пространство-время Риндлера ds2 = -x2dt2 + dx2, (6.4.3) с областью изменения координат —оо <£<оо, 0<х<оо. Кажется, что эта метрика имеет сингулярность при х = 0. (Определитель gMI/ зануляется при х = 0, так что компоненты обратной метрики g^u сингулярны при х = 0.) Геодезические ограничены конечной длиной при х = 0, но вычисление скаляров кривизны не показывает наличия особенностей10 при х —> 0, позволяя нам предположить, что сингулярность может быть просто координатной особенностью. Эта метрика недостаточно проста, чтобы успешно найти координатные пре- 10Фактически кривизны у метрики Риндлера нет. Это непосредственно указывает, что пространство-время Риндлера должно быть просто частью двумерного пространства-времени Минковского. Однако, чтобы выявить аналогию с метрикой Шварцшильда, мы предпочитаем не использовать этот факт при нашем анализе.
6.4. Расширение Крускала 221 образования методом проб и ошибок, поэтому нам нужен более систематический подход. Вообще говоря, наилучшей процедурой было бы введение новых координат, которые тесно связаны с геометрией пространства-времени. Этого можно достичь, например, за счет введения семейства геодезических, которые "направлены в сингулярность", и использования аффинного параметра вдоль геодезических как одной из координат. Вообще говоря, не существует метода гарантированного устранения координатных сингулярностей. Например, для координат, основанных на семействе геодезических, будут возникать новые сингулярности всякий раз, когда геодезические пересекаются. Однако в двумерных пространствах-временах действительно существует метод, дающий существенную гарантию выполнения анализа координатных сингулярностей. Это так потому, что в двух измерениях нулевые геодезические подразделяются (по крайней мере локально) на два класса: "входящие" и "выходящие". Причем внутри каждого класса две различные нулевые геодезические не могут пересечься, так как тогда их касательные совпали бы в точке пересечения, что означало бы совпадение геодезических повсюду. Это наводит нас на введение нулевых координат, т.е. таких, первая из которых постоянна вдоль каждой "выходящей" геодезической, а вторая постоянна вдоль каждой "входящей" геодезической. При таком подходе наша координатная сетка будет основываться на геометрической (без особенностей) "сетке" нулевых геодезических. Единственный тип координатных сингулярностей, который может появиться при использовании нулевых координат в двумерных пространствах-временах, возникает из-за неудачной параметризации геодезических, но это можно исследовать и исправить, сравнив координатную параметризацию с аффинной. Нулевые геодезические пространства-времени Риндлера легко найти из условия изотропности О = gabkakb = -хЧ2 + я2, (6.4.4) где ка - касательная к геодезической, и точка означает производную по аффинному параметру. Уравнение (6.4.4) означает, что (dt/dx)2 = 1/х2, (6.4.5) поэтому вдоль каждой геодезической мы имеем t = ±\nx + const, (6.4.6) гДе знак плюс относится к "выходящим" геодезическим, а знак минус - к "входящим" геодезическим. В силу (6.4.6) мы можем определить
222 Глава 6. Решение Шварцшильда нулевые координаты (г/, v) следующим образом u = t-\nx, (6.4.7) v = * + lnx. (6.4.8) В координатах (u,v) метрические компоненты имеют простой вид ds2 = -ev~ududv. (6.4.9) Выполняя координатные преобразования (6.4.7) и (6.4.8), мы все еще не достигнем нашей цели - изучения сингулярности при х = 0. Причина заключается в том, что координатные интервалы — оо < и < < оо и — оо < v < оо все еще покрывают только область х > О исходного пространства-времени Риндлера. Однако мы уже способны перепараметризировать нулевые геодезические новыми координатами U = U(и), V = V(v), которые покажут, как расширить пространство- время за "х = 0" (или "и = оо" и "v = —оо"). Вид метрики (6.4.9) достаточно простой, чтобы мы могли легко угадать нужное преобразование, но для большей систематичности мы подсчитаем аффинный параметр вдоль нулевых геодезических. Это наиболее просто сделать, используя тот факт, что "вектор временной трансляции" (d/dt)a исходной метрики Риндлера (6.4.3) представляет собой поле векторов Киллинга и поэтому Е = -gabka(d/dt)b = x2dt/d\ (6.4.10) есть интеграл движения. Здесь Л - аффинный параметр. Тогда, подставляя х и t из (6.4.7) и (6.4.8) и полагая и — const, мы находим для выходящих нулевых геодезических Л - ^ у e"-udr- = С + (е-"/2£) е'\ (6.4.11) где С - постоянная. Таким образом, Aout = ev - аффинный параметр вдоль выходящих геодезических. Аналогичное вычисление показывает, что Xin = —e~u аффинный параметр вдоль входящей геодезической. (Отметим, что ограниченность Aout и Ai„ показывает, что все нулевые геодезические исходного пространства-времени Риндлера являются неполными.) Этот результат наводит на мысль сделать координатное преобразование U = -e~u, V = ev, которое приводит метрику к предельно простой форме ds2 = -dUdV. (6.4.12)
6.4. Расширение Крускала 223 Рис. 6.8. Пространство-время Риндлера, представленное как "клин" I двумерного пространства-времени Минковского Исходное пространство-время Риндлера соответствует координатным интервалам U < О, V > 0. Однако уже больше нет никакой сингулярности метрических компонент при (7 = 0 или V = 0, так что теперь мы можем расширить пространство-время, снимая органичения на U и V: -оо < U < оо, -оо < V < оо. Окончательное координатное преобразование Т = (U + V)/2, X = (V — U)/2 преобразует метрику в легко узнаваемую форму ds2 = -dT2 + dX2, (6.4.13) показывающую, что наше расширенное пространство-время не что иное, как пространство-время Минковского! Исходные координаты (£, х) выражаются через окончательные координаты Минковского (Т, X) следующим образом = (х2-г2)1/2, Т 1 t = Arth— = - In X 2 х + т (6.4.14) \х-ту (6А15) Из соотношений (6.4.14) и (6.4.15) можно увидеть, что пространство- время Риндлера представляет собой клин X > \Т\ пространства-времени Минковского, т.е. область I на рис. 6.8. Исследование преобразований (6.4.14) и (6.4.15) или рис. 6.8 выявляет природу координатной сингулярности: изотропные линии X = ±Т ошибочно помечены исходными координатами как х = 0, t = ±oo. Наше преобразование к нулевым геодезическим координатам ([/, V) позволило нам "прорвать" координатный барьер X = \Т\ и расширить исходное пространство- время на все пространство-время Минковского.
224 Глава 6. Решение Шварцшильда Отметим, что "трансляционная симметрия времени" метрики Рицд- лера (6.4.3) в действительности соответствует "симметрии буста" пространства-времени Минковского. Наблюдатели при постоянном х испытывают постоянное ускорение а = 1/я, которое расходится при х —* о. Легко проверить, что статические наблюдатели в пространстве-времени Шварцшильда должны испытывать собственное ускорение, чтобы "оставаться в покое" в "гравитационном поле", а = (1—2M/r)~l/2M/r2 которое расходится при г —> 2М. Таким образом, поведение временной координаты Шварцшильда при г —> 2М аналогично поведению временной координаты Риндлера при х —> 0. (В самом деле, математическую аналогию двух метрик можно еще усилить, вводя новую пространственную координату у = х2, чтобы придать метрике Риндлера форму ds2 = -ydt2+4y~ldy2.) Поэтому не должно удивлять, что координатная сингулярность метрики Шварцшильда при г = 2М очень похожа на координатную сингулярность пространства-времени Риндлера, как мы сейчас и покажем. Пространство-время Шварцшильда, конечно, четырехмерное, но из-за сферической симметрии только nr-t часть" метрики имеет значение для анализа природы сингулярности при г = 2М. Поэтому мы изучим двумерную метрику ds2 = -(1 - 2M/r)dt2 + (1 - 2M/r)~ldr2. (6.4.16) Мы применяем описанный выше двумерный метод с использованием выходящих и входящих радиальных нулевых геодезических пространства-времени Шварцшильда. Условие изотропности, аналогичное (6.4.4), таково 0 = gabkakb = -(1 - 2M/r)i2 + (1 - 2M/r)~lf2, (6.4.17) которое означает, что Таким образом, радиальные нулевые геодезические Шварцшильда удовлетворяют соотношению t = ±r*+ const, (6.4.19) где "черепашья координата Редже-Уиллера" г* определяется согласно г* =г + 2М1п(г/2М-1), (6.4.20)
fi 4. Расширение Крускала 225 «гак что dr*/dr = (1 — 2М/г) *. Нулевые координаты (и, v) мы определяем согласно u = t-r+, (6.4.21) v = * + rv (6.4.22) В этих координатах11 метрика (6.4.16) принимает вид ds2 = -(1 - 2M/r)du2dv2, (6.4.23) где г теперь рассматривается как функция и и v, определенная неявным образом г + 2М In (^ - l) = г. = ^. (6.4.24) Используя соотношение (6.4.24), мы можем переписать метрику (6.4.23) ds2 = _^ie-r/2Me{v-u)/4Mdu2dv2j {& 4 25) Г где мы факторизовали метрические компоненты сомножителями е~г/2М/г, которые несингулярны при г —> 2М (т.е. при м —* оо или v —> —оо) и имеют простую зависимость от w и v. Сравнение с метрикой Риндлера (или (6.4.9) или вычисление аффинного параметра вдоль нулевых геодезических) подсказывает, что нужно определить новые координаты U и V согласно U = -е"и/4М, (6.4.26) V = +e+v/4M. (6.4.27) В новых переменных метрика принимает вид ds2 = _¥Mle-r/2MdU2dy2 (64 28) Г Теперь больше нет сингулярности при г = 2М (т.е. при U = О или V = 0), и поэтому мы можем расширить решение Шварцшильда, позволяя U и V принимать все значения, совместимые с г > 0. Сингулярность, которая все еще остается при г = 0, является физической: как отмечено выше, скаляр кривизны RabcdRabcd при г = 0 расходится, поэтому сингулярность нельзя устранить дальнейшим координатным преобразованием. 11 "Гибридные" координаты (и, г) или (v,r) известны как координаты Эддингтона-Финкельштейна (Eddington 1924; Finkelstein 1958).
226 Глава 6. Решение Шварцшильда Рис. 6.9. Расширение К рус кал а пространства-времени Шварцшильда Если мы выполним заключительное преобразование Т = {U+V)/2, X = (V — £/)/2, то полная метрика Шварцшильда примет окончательную форму, полученную Крускалом (Kruskal 1960; Szekeres 1960), ^2 = _ 32^е_г/2М ^^ + ^ + r2 ^2 + s.n2 в6ф2^ (б 4 2g) Соотношения между старыми координатами (t,r) и новыми (Т, X) имеют вид (ш " *) еГ/2М = ** ~ г2' (6'4'30) 4=ln(^)=2Arthi- <6-4-31) В метрике (6.4.29) координату г следует рассматривать как функцию от X и Т, определенную соотношением (6.4.30). Область изменения координат X и Г определяется требованием г > 0, что дает X2-N2> -1. (6.4.32) Пространственно-временная диаграмма расширения Крускала показана на рис. 6.9. Причинная структура расширенного пространства- времени Шварцшильда вполне ясна из конструкции диаграммы, где радиальные нулевые геодезические представляют собой линии под углами 45° к координатным осям Крускала. Расширение Крускала в значительной мере подобно расширению Риндлера, а различаются они в основном следующим: (1) пространство-время Шварцшильда четырехмерно, так что каждая точка рис. 6.9 представляет собой двумерную
6.4. Расширение Крускала 227 сферу радиуса г; (2) в области расширения при X = ±(Т2 - I)1/2, как показано на диаграмме, имеются физические сингулярности. Отметим, что сингулярности при "г = 0" имеют пространственноподобный характер и располагаются в будущем области II и прошлом области III, а вовсе не соответствуют "времениподобной линии в начале координат", как можно было бы предположить, основываясь на наивной интерпретации координат Шварцшильда (г,£). Особенности координат (£,г) можно также увидеть на "диаграмме Крускала", рис. 6.9. Из соотношения (6.4.30) мы видим, что Var = 0 при X = Т = 0, и нетрудно проверить, что статическое поле Киллинга £а здесь также зануляется. Отметим еще, что Var и (а становятся колинеарными вдоль нулевых линий X = ±Т. Отсутствие £° при X = Т = 0 приводит к неправильной маркировке линий X = ±Т при "t = ±oo" аналогично поведению t-координаты в пространстве-времени Риндлера. Отметим, однако, что хотя координаты Крускала очень удобны при исследовании области "сильного поля" геометрии Шварцшильда, они непригодны для анализа асимптотически плоской области г —► оо. Расширенное пространство-время Шварцшильда имеет весьма удивительную структуру. Область I рис. 6.9 соответствует исходной области г > 2М решения Шварцшильда и физически может интерпретироваться как представляющая внешнее гравитационное поле сферического тела. Однако радиально падающий в области I наблюдатель пересечет нулевую линию X = Т и войдет в область И. Как только этот наблюдатель войдет в область II, он уже никогда не сможет ее покинуть. В пределах конечного собственного времени (см. задачу 6) он будет неотвратимо падать в сингулярность при X = (Т2 — I)1/2 и, действительно, любой световой сигнал, который он посылает из области II, будет оставаться в этой области и тоже будет падать в сингулярность. По этой причине об области II говорят как о черной дыре. (Общее определение понятия черной дыры будет дано в гл. 12.) Область III имеет в точности "обращенные во времени" свойства области II, и ее называют белой дырой. Любой наблюдатель, находящийся в области III, должен возникать из пространственно-временной сингулярности X = -(Т2 - I)1/2 и в течение конечного времени должен покинуть область III. Наконец, область IV имеет свойства, идентичные свойствам исходной области I. Она представляет собой другую асимптотически плоскую область пространства-времени, которая расположена "внутри радиуса" г = 2М. Как это может происходить - лучше всего иллюстрирует исследование геометрии пространственноподобной поверхности Т = 0, показанной на рис. 6.10. Отметим, однако, что наблюдатель в области I не может общаться ни с одним наблюдателем из области
228 Глава 6. Решение Шварцшильда Рис. 6.10. Пространственная геометрия гиперповерхности t = 0 пространства- времени Шварцшильда, показанная так, как она выглядела бы, если была бы погружена в плоское пространство. (Одно измерение скрыто, т.е. топология гиперповерхности Rx52, а не R х 5. Так что каждая окружность, такая какая показана для г = 2М, в действительности представляет собой двумерную сферу.) Часть поверхности, расположенная на рисунке выше "горловины" при г = 2М, соответствует части, расположенной в области I рис. 6.9; часть ниже г = 2М расположена в области IV рис. 6.9 IV: как видно из рис. 6.9, посланный из области I в сторону области IV световой сигнал будет двигаться вместо этого в черную дыру и окажется "проглоченным" сингулярностью пространства-времени. Какую часть этой картины расширенного решения Шварцшильда мы должны воспринимать всерьез? Расширенное решение Шварцшильда, конечно, является совершенно верным решением вакуумных уравнений Эйнштейна, и как таковое представляет собой возможную структуру пространства-времени в общей теории относительности. Однако для "производства" полностью расширенного решения Шварцшильда мы должны "начать" с двух асимптотически плоских областей пространства-времени вместе с начальной сингулярностью в области III, которая их связывает. Нет причины верить, что исходная конфигурация любой области нашей Вселенной соответствует этим начальным условиям, поэтому нет причины верить, что любая область нашей Вселенной описывается всем расширенным решением Шварцшильда (хотя, конечно, эту возможность нельзя просто исключить). Однако, как установлено в разд. 6.2, достаточно массивные тела подвергнутся полному гравитационному коллапсу. Внутренняя метрика этих тел не будет метрикой Шварцшильда, так как там Таь Ф 0, но на всех стадиях коллапса метрика вне сферического тела будет метрикой Шварцшильда, потому что эта метрика, как отмечено в конце разд. 6.1, представляет собой единственное сферически симметричное вакуумное решение уравнений Эйнштейна. Следовательно, геометрия пространства- времени, соответствующая гравитационному коллапсу сферического тела, будет такой, как показано на рис. 6.11. Области III и IV - полно-
6.4. Расширение Крускала 229 г=0 (сингулярность) г=0 (начало координат) коллапсирующая материя Рис. 6.11. Пространство-время, возникающее при полном гравитационном коллапсе сферического тела. Области III и IV расширенного пространства-времени Шварцшильда полностью "покрыты" коллапсирующим веществом. Однако создается (часть) области II черной дыры стью (так же как и области I и II - частично) будут "покрыты" веществом, а значит-замещены "нормальной" пространственно-временной областью. Однако область пространства-времени, соответствующая области II расширенного вакуумного пространства-времени Шварцшильда, будет создаваться, когда радиальная координата коллапсирующе- го тела станет меньше 2М. Другое представление пространственно- временной геометрии, порождаемой сферическим коллапсом, показано на рис. 6.12. Таким образом, области III и IV расширенного решения Шварцшильда являются вероятно нефизическими, но область II очень важна с физической точки зрения: полный гравитационный коллапс сферического тела всегда создает область черной дыры Шварцшильда в пространстве-времени. Задачи 1. Пусть М - трехмерное многообразие, обладающее сферически- симметричной римановой метрикой с Var ф 0, где г определяется формулой (6.1.3).
230 Глава 6. Решение Шварцшильда V V Рис. 6.12. Другое представление пространства-времени рис. 6.11. Здесь восстановлена одна из двух скрытых размерностей, так что каждая из окружностей на коллапсирующем теле соответствует двумерной поверхности тела в фиксированный момент времени. Однако световые конусы уже не представляются линиями под углом в 45°. Действительно, п ростра нственноподобная природа сингулярности и неотвратимый захват сингулярностью любой частицы или луча света в области г < 2М здесь иллюстрируется "откреплением" ^светового конуса будущего в области сильного поля (a) Показать, что можно ввести новые "изотропные" радиальные координаты г так, что метрика принимает вид ds2 = H(r)[dr* + r*(m2}. (Это показывает, что всякое сферически-симметричное трехмерное пространство является конформно-плоским.) (b) Показать, что изотропные координаты метрики Шварцшильда таковы: ds2 = - (1 - М/2г)2 (1 + М/2?)2 tf+fl + ^Y^ + ^M2]. 2. Найти тензор Риччи Rab для статического сферически-симметричного пространства-времени (6.1.5), используя метод координатных компонент разд. 3.4.1. Сравнить затраты труда с теми,
6.4. Расширение Крускала 231 которые пошли на вычисления при тетрадном подходе, приведенные в тексте разд. 3.4.1. 3. Рассмотрите свободные от источников (ja = 0) уравнения Максвелла (4.3.12) и (4.3.13) в статическом сферически-симметричном пространстве (6.1.5). (a) Обосновать, что общая форма тензора электромагнитного поля, который обладает статической и сферической сим- метриями пространства-времени Fat = 2A(r)(eo)[a(ei)b] + +2В(г)(е2)[а(ез)ь]> где (ем)а определяется из системы уравнений (6.1.6а). (b) Показать, что если В(г) = 0, то общее решение уравнений Максвелла в форме, представленной в предыдущем пункте, таково: A(r) = —q/r2, где q может интерпретироваться как полный заряд. (Решение, полученное при В (г) ф 0, является "дуальным вращением" вышеуказанного решения, представляющее собой поле магнитного монополя.) (c) Записать и решить уравнения Эйнштейна Gab = 8кТаь с тензором энергии-импульса электромагнитного поля, соответствующим решению предыдущего пункта. Показать, что общее решение представляет собой метрику Райсснера-Норд- стпрёма ds2 = - 1 + ~ dt2+ 1 + ^ dr2+r2dft2. \ г г*) \ г г1) 4. Пусть (M,go6) - стационарное пространство-время с временипо- добным полем Киллинга £а. Пусть V2 = -£а£а- (a) Показать, что ускорение аь = uaVaub стационарного наблюдателя дается формулой аъ = V6 In V. (b) Предположить дополнительно, что (М, gab) - асимптотически плоское, т.е. что существуют координаты t, x, у, z (при £а = (d/dt)a) такие, что компоненты gab стремятся к diag(-l, 1,1,1) при г —► оо, где г = (х2 + у2 + г2)1/2. (См. гл. 11 для дальнейшего обсуждения асимптотической плоскостности.) Как и в случае метрики Шварцшильда, "энергия, измеренная на бесконечности", частицы с массой га и
232 Глава 6. Решение Шварцшильда 4-скоростью иа равна Е = — т£аиа. Предположим, что частица с массой т удерживается стационарно посредством (безмассовой) струны, другой конец которой удерживается стационарным наблюдателем, находящимся на большом расстоянии г. Пусть F обозначает силу, с которой струна действует на частицу. В соответствии с пунктом (а) задачи 4, имеем F = mV~l(Va WaV)1^2. Рассуждая на основе закона сохранения энергии, покажите, что сила, которая действует на наблюдателя на бесконечности на другом конце струны, равна Fqo = VF. Таким образом, величина силы, действующей на бесконечности, отличается от силы, действующей локально на фактор красного смещения. 5. Вывести формулу (6.3.45) запаздывания сигнала в общей теории относительности. 6. Показать, что любая частица (необязательно двигающаяся по геодезической) в области II (г < 2М) расширенного пространства- времени Шварцшильда (рис. 6.9) должна уменьшать свою радиальную координату со скоростью, заданной неравенством |dr/d£| ^ (2М/г — I)1/2. Отсюда вывести максимальное время пребывания любого наблюдателя в области II г = пМ (около 1О"5М/М0 секунд), т.е. что любой наблюдатель в области II будет втянут в сингулярность г = 0 за это собственное время. Показать, что к этому максимальному времени стремится время движения в свободном падении (т.е. геодезического движения) из положения г = 2М при jE7 —>► 0.
Часть II Современные методы в общей теории относительности
Глава 7 Методы решения уравнений Эйнштейна Общая теория относительности, изложенная в гл. 4, дает полное классическое описание структуры пространства-времени и гравитации. Все разумные с физической точки зрения пространства-времена соответствуют решениям уравнений Эйнштейна (4.3.21). Таким образом, решая уравнения Эйнштейна для пространств-времен, представляющих интерес для физики, мы можем получить полное предсказание интересующих нас явлений. К сожалению, уравнения Эйнштейна являются сложной системой связанных нелинейных уравнений в частных производных и, что типично для большинства нелинейных уравнений в частных производных, не существует общих методов получения всех решений. Действительно, за исключением решений Робертсона- Уокера и Шварцшильда (детально рассмотренных в гл. 5-6), решения Керра (гл. 12), и нескольких других решений, упомянутых в настоящей главе, были найдено всего несколько решений, представляющих физический интерес. В этой главе мы обсудим некоторые методы, которые были использованы для получения физически значимых решений. Наше обсуждение методов решения уравнений Эйнштейна является далеко не исчерпывающим. Более того, мы не будем пытаться перечислять все решения, которые были получены, или обсуждать их свойства. Скорее нашей целью является представление некоторых наиболее важных методов получения решений. В разд. 7.1 мы анализируем стационарные решения с аксиальной симметрией и показываем, каким образом уравнения Эйнштейна в вакууме могут быть сведены к системе двух связанных уравнений для двух неизвестных функций, с последующим решением ее в квадратурах. К сожалению, даже эти уравнения являются сложными для решения, кроме случая статического пространства, когда возможно получить полное решение задачи. В разд. 7.2 анализируются пространственно однородные (но не изотропные) космологические модели и показывается, как уравнения Эйнштейна могут быть сведены к решению связанной системы обыкновенных дифференциальных уравнений. (Такая система всегда может быть решена численно, если этого нельзя сделать аналитически и, таким образом, нет препятствий для полу-
236 Глава 7. Методы решения уравнений Эйнштейна чения всех однородных космологических решений.) В разд. 7.3 представлено краткое описание процедуры получения решений с использованием для упрощения специальных алгебраических свойств тензора Вейля. Эта техника позволила найти большое количество решений, хотя только несколько из них имеют прямой физический интерес. В разд. 7.4 в общих чертах намечена процедура конструирования новых решений из заданного решения, обладающего векторным полем Киллинга. Такая техника чрезвычайно полезна для генерирования стационарных аксиально-симметричных решений. Наконец, в разд. 7.5 выводятся уравнения, описывающие малые возмущения известного точного решения. Хотя невозможно найти точное решение в близкой окрестности другого решения, много полезной информации можно получить из теории возмущений. 7.1 Стационарные аксиально-симметричные решения В разд. 6.1 уже сказано, что пространство-время называется стационарным, если существует однопараметрическая группа изометрий atj орбиты которой являются времениподобными кривыми. Таким образом, каждое стационарное пространство-время обладает времени- подобным векторным полем Киллинга £а (см. прилож. С)* (Наоборот, каждое пространство-время с времениподобным векторным полем Киллинга, орбиты которого замкнуты, является стационарным.) Аналогично, мы называем пространство-время аксиально симметричным, если существует однопараметрическая группа изометрий ХФч орбитами которой являются замкнутые пространственноподобные кривые, что подразумевает существование пространственноподобного векторного поля Киллинга фа, чьи интегральные кривые замкнуты. Пространство- время называется стационарным и аксиально симметричным, если оно обладает обеими симметриями и дополнительно действие изометрий at и хф коммутирует: °ь°Хф = ХФ°°и (7.1.1) т.е. вращения коммутируют с временными трансляциями. Легко видеть, что это эквивалентно условию коммутирования векторных полей £а и фа: K,V>]=0. (7.1.2) Стационарные аксиально симметричные пространства представляют значительный интерес в общей теории относительности, поскольку
7.1. Стационарные аксиально-симметричные решения 237 они описывают равновесные конфигурации аксиально симметричных вращающихся тел. Таким образом, для того, чтобы обобщить результаты разд. 6.2 для объяснения вращения, необходимо уметь решать уравнения Эйнштейна с идеальной жидкостью в качестве источника, при наличии этих симметрии. Стационарные аксиально симметричные вакуумные решения также представляют большой интерес по той причине, что они описывают внешнее гравитационное поле вращающихся тел и необходимы для сшивки с внутренними решениями. Коммутативность £° и фа означает, что можно выбрать координаты (х° = t, х1 = ф, х2, х3) таким образом, что как £° = (d/dt)a, так и гра = (д/дф)а будут координатными векторными полями. Как показано в прилож.С, компоненты метрики в такой системе координат не будут зависеть от t и </>, поэтому метрика принимает вид: ds2 = E^^2^3)dx"dx". (7.1.3) Таким образом, мы должны найти 10 неизвестных функций £Д1/, зависящих от двух переменных. Покажем, что посредством последующего подходящего выбора координатной системы, некоторого слабого условия (см. условие (i) в теореме 7.1.1) и использования уравнений Эйнштейна, можно привести метрику к форме (7.1.22), содержащей только три функции двух переменных, и свести проблему решения уравнений Эйнштейна к решению двух уравнений для двух неизвестных функций (7.1.24) и (7.1.25) с квадратурой для третьей функции (7.1.26) и (7.1.27). Первое существенное упрощение связано с тем, что при выполнении условий последующей теоремы двумерные подпространства касательного в каждой точке пространства, которое натянуто на векторы, ортогональные £а и фа, являются интегрируемыми, т.е. касательными к двумерным поверхностям. Сначала сформулируем и докажем эту теорему, затем обсудим ее приложение для упрощения общей формы стационарных аксиально симметричных метрик. Теорема 7.1.1. Пусть £а и ^° представляют собой два комму- тирующих поля Киллинга, таких, что (i) выражения ^[a^b^c^d] и ^[а'ФьЧс'ФсЦ равны нулю по крайней мере в одной точке пространства-времени (что, в частности, верно, если либо £°, либо фа равны нулю в какой-либо точке); (И) £аДа(6£с^1 = ipaRa[bZc*l>d] = 0. Тогда двумерные плоскости, ортогональные к £а u^a, являются интегрируемыми. Доказательство. Эта теорема является непосредственным приложением теоремы Фробениуса (см. прилож. В). Необходимо определить,
238 Глава 7. Методы решения уравнений Эйнштейна когда плоскости, ортогональные 1-формам £а и фа, являются интегрируемыми. В соответствии с дуальной формулировкой теоремы Фробе- ниуса (теорема В.3.2) необходимым и достаточным условием интегрируемости являются V[e6] = (М%&] + (М2)[а^Ц, (7.1.4) V[a^b] = (<?%&} + {(т2)[аФь), (7.1.5) где (ц1)а, (А*2)а> (°"1)aJ (&2)а являются произвольными 1-формами. До- кажем теорему, проверяя справедливость уравнения (7.1.4). Справедливость уравнения (7.1.5) доказывается аналогичным образом. Уравнение (7.1.4) эквивалентно соотношению Ыь^сЦ = 0, (7.1.6) что в свою очередь эквивалентно €abcdrtbV4d = 0, (7.1.7) где eabcd является элементом объема, ассоциированным с метрикой (см. прилож. В). Определим вектор вращения иа поля £° соотношением: и>а = eabcdtbV4d. V (7.1.8) (В соответствии с уравнением (В.3.6), ша измеряет нарушение ортогональности вектора £а и гиперповерхности.) Теперь задача состоит в том, чтобы показать, что фаша = 0. Из условия (i) известно, что величина фаиа равна нулю по крайней мере в одной точке, поэтому она будет равна нулю везде тогда и только тогда, когда ее производная тождественно равна нулю. Имеем: V6W>°a;a) = фаЧьиа+иаЧьФа = = V Va^6 + va VbV>° + 2^a V[ba;a] = = i>;b + 2^aV[6u;a], (7.1.9) где была использована формула (С.2.13) для производной Ли. Однако групповой диффеоморфизм \Ф, порожденный фа, оставляет как £а (поскольку фа и £° коммутируют), так и метрику (поскольку фа является полем Киллинга) инвариантными. Поэтому \Ф должен оставлять инвариантным любое тензорное поле, которое может быть составлено
7.1. Стационарные аксиально-симметричные решения 239 из £а и метрики. Поскольку шь является таким тензорным полем, мы должны иметь1 £фшь = 0. (7.1.10) Таким образом, для завершения доказательства осталось вычислить V[5a>a]. Имеет место соотношение eabcdVcud = eabcdedefgVc(ev'?) = = 6Vc(^cV^bl), (7.1.11) где были использованы уравнения (В.2.11) и (В.2.13). Используя уравнение Киллинга (С.3.1), получаем £[<=Va£bl = 1 {£CV°£6 + £bVc£a + CVb£c} . (7.1.12) О Однако находим, что Vc(£cVa£b) = (Vcf)V4b + ^cVcVa^ = = -eRabcdSd = 0. (7.1.13) Здесь использован след уравнений Киллинга, чтобы устранить первое слагаемое, и уравнение (С.3.6) - чтобы выразить второе слагаемое через тензор Римана. Для получения конечного результата использована антисимметрия тензора Римана по двум последним индексам. С другой стороны, имеем Vc(£bVc£a + £aV6£c) = (Vc£6)(Vc£a) + (Vc£a )(V6£C) + £6VcVc£a + + rVcVV = 2£'6VcV|c|£al = = -2£l6flaUc, (7.1.14) где использованы уравнения Киллинга для получения второго равенства, а также уравнение (С.3.9) для получения третьего равенства. Таким образом, находим V[aa;b] = —^abcd£cdefVeuf = = -eabcdZcRdete, (7.1.15) 1 Другая возможность увидеть это состоит в том, что и £а, и Va> и любой тензор Та-"6c...d, чьи компоненты Ta-^rho...a сконструированы из компонент fa и g и их производных по координатам, должны удовлетворять соотношению д(Та...рр а)/дф = 0. Это и доказывает, что £^Та--Рр...а = 0 в соответствии с Уравнением (С.2.4). То, что соотношение «£^и>ь = 0 выполняется, также можно Доказать непосредственно, используя формулы прилож. С (задача 1).
240 Глава 7. Методы решения уравнений Эйнштейна и, наконец, Чь(Фаь>а) = 2фаЪ[ьиа] = = -2ebacdipaZcRdee = 0, (7.1.16) по условию (И). Это завершает доказательство. D Условия теоремы 7.1.1 выполняются для широкого класса стационарных аксиально симметричных пространств, представляющих физический интерес. В частности, если пространство-время является асимптотически плоским, должна существовать "ось вращения", на которой фа исчезает и условие (i) удовлетворяется. Для вакуумного пространства-времени Rab = 0, и условие (и) выполняется тривиально. Условие (ii) также выполняется, когда Таь = (87г)_1(Даб — ^gabR) является тензором энергии-импульса идеальной жидкости с 4-скоростью в плоскости, натянутой на £° и фа (т.е. круговой поток), или тензором энергии-импульса стационарного аксиально симметричного электромагнитного поля (Carter 1969). В пространствах, удовлетворяющих условиям теоремы 7.1.1, можно выбрать координаты я2, х3 в одной из ортогональных двумерных плоскостей и "протянуть" эти координаты в оставшуюся часть пространства-времени вдоль интегральных кривых полей £а и гра. В координатах (£, 0, х2,х3) компоненты метрики принимают вид: (-V W 0 0 I W X 0 0 *"" 0 0 g22 g23 \ 0 0 g23 g33 где V = -g00 = -£а£а, W = g01 = £афа, X = gn = фагра1 а блоки 2x2 состоят из нулей из-за ортогональности д/дх2 и д/дх3 с d/dt и д/дф. (Физическая интерпретация W устанавливается в задаче 3.) Таким образом, теорема 7.1.1 позволяет свести число неисчезающих метрических компонент к шести. В отсутствии теоремы 7.1.1 только две компоненты метрики в блоках 2x2 можно было бы положить равными нулю, используя имеющуюся свободу в выборе координат, связанных с(аи фа. До сих пор мы не конкретизировали, каким образом выбираются координаты х2 и х3 на двумерной поверхности и, как будет видно далее, можно достигнуть существенного упрощения разумным выбором этих координат. Определяем скалярную функцию р соотношением: (7.1.17) р2 = VX + W2, (7.1.18)
7.1. Стационарные аксиально-симметричные решения 241 т.е. р2 является определителем t-ф части метрики со знаком минус. Предполагая, что Vap ф 0, выбираем р в качестве одной из координат х2 на двумерной поверхности. Другую координату z = х3 выбираем так, что Va2 и Vap ортогональны. (Это достигается тем, что требование z=const вдоль интегральных кривых Vap единственным образом определяет z с точностью до преобразований z —+ z' = f(z).) В координатах t, ф, р, z метрика принимает вид ds2 = -V (dt - и)дф)2 + V-хр2(1ф2 + П2 (dp2 + Adz2), (7.1.19) где w = W/V. Таким образом, мы свели неизвестные метрические компоненты к четырем функциям V, w, fi, Л двух переменных р, z. Метрика (7.1.19) является общей для стационарного аксиально симметричного пространства-времени, удовлетворяющего условиям теоремы 7.1.1. Дальнейшее упрощение формы метрики можно осуществить для вакуумных пространств, где Rab = 0. Компоненты Rab в плоскости, натянутой на £° и фа, можно вычислить из уравнения (С.3.9) или, альтернативно, из формул в общекоординатном базисе (разд. 3.4.1). Уравнение 0 = Rlt + ЯфФ = (Vat)Rabtb + {ЪаФ№аЫрь (7.1.20) приводит к DaDap = 0, (7.1.21) где Da - оператор ковариантной производной на двумерной поверхности, натянутой на р и 2, с индуцированной метрикой ds2 = Г22 (dp2 + +Adz2). Таким образом, р является гармонической функцией, т.е. удовлетворяет двумерному уравнению Лапласа на двумерной поверхности. Это приводит к двум важным следствиям: (1) Если р Ф const, то можно показать, что Vap может исчезать только в изолированных точках. Поскольку наши координаты р и z хорошо определены везде, кроме тех областей, где Vap = 0, это означает, что наша координатная система может быть плохо определенной только в изолированных точках. Фактически во многих ситуациях доказывается, что Vap ф 0 везде, поэтому координаты р, z хорошо определены глобально (Carter 1973). (2) Из уравнения (7.1.21) непосредственно следует, что Л является функцией только z. Таким образом, можно использовать оставшуюся координатную свободу для того, чтобы преобразовать z (z —> f A1/2dz) и положить Л = 1. (Подчеркнем, что тогда z становится гармонической функцией, сопряженной к р, см. задачу 2 гл. 3.) Кроме тривиального, постоянного масштабного преобразования
242 Глава 7. Методы решения уравнений Эйнштейна и сдвига начала координат t, ф, z мы полностью определили нашу систему координат.. В этих координатах метрика принимает удивительно простую форму (Papapetrou 1953, 1966): d52 = -V (dt - wd<t>f + V~l [рЧф2 + e27 (dp2 + dz2)] , (7.1.22) где 7 = ^ In (Vfi2). Подчеркнем, что в плоском пространстве-времени (V = 1, w = 7 = 0) координаты 0, р, z являются обычными цилиндрическими координатами. При выводе формулы (7.1.22) уравнения Эйнштейна использовались только в условии (ii) теоремы 7.1.1 и в уравнении (7.1.20). Оставшиеся компоненты вакуумных уравнений Эйнштейна Лаь = 0 могут быть вычислены непосредственно с использованием методов разд. 3.4.1. Не будем здесь входить в детали, а просто приведем конечные результаты. Получаем четыре независимых уравнения для V, w и 7- Первые два затрагивают только функции Уйти более удобно записываются через трехмерную (нефизическую) метрику: d**=p^2+dp2 + dz2 (7.1.23) и в терминах оператора производной V плоского пространства с такой метрикой. (Мы используем обычное векторное обозначение V вместо индексного для того, чтобы обойти путаницу, связанную с метрикой истинного пространства-времени.) В таких обозначениях первые два уравнения представляют собой уравнения для аксиально симметричных скалярных полей V, w в нефизическом трехмерном плоском пространстве с метрикой (7.1.23). Уравнения имеют вид: V • Ы-1 W + p~2V2wVw\ = 0, V • {p~2V2Vw\ = 0, (dV\2 _ fdV\2] _ Yl IV—V _ (НЕ \др) \dz)\ 4р[{др) \dz <tl _ _P_9V_dV_ ^V^dwdw dz V2 dp dz p dp dz' 97 = _p_ dp 4V2 Возможно, что последние два уравнения переполняют систему. Однако условия интегрируемости d2^/dzdp = d2ry/dpdz тождественно удовлетворяются вследствие (7.1.24) и (7.1.25). Следовательно, для заданного решения уравнений (7.1.24) и (7.1.25) решение уравнений (7.1.26) и (7.1.27) всегда существует и единственно с точностью Д°
7.1. Стационарные аксиально-симметричные решения 243 аддитивной константы. Это решение можно получить в явном виде контурным интегрированием (7.1.26) и (7.1.27): 7(Р) " 7(9) = f (^dp + gcfc) . (7.1.28) Таким образом, кроме вычислений, требуемых для получения в явном виде 7? проблема нахождения всех стационарных аксиально симметричных вакуумных уравнений Эйнштейна свелась к решению уравнений (7.1.24) и (7.1.25) для двух аксиально симметричных функций V и w в обычном трехмерном евклидовом пространстве. Это является значительным упрощением первоначальной задачи получения решения полного набора уравнений Эйнштейна для 10 неизвестных функций g. Тем не менее, за исключением статических решений, рассмотренных ниже, эти уравнения все равно достаточно трудно решить. Существует ограниченное число решений, полученных прямым интегрированием уравнений (7.1.24) и (7.1.25). (В тех случаях, где решение было получено, использовались в основном координаты, отличные от риг (Zipoy 1966; Chandrasekhar 1983).) Эти уравнения можно переписать, используя потенциалы (Ernst 1968). Несколько решений, представляющих физический интерес, были найдены прямым исследованием таких модифицированных уравнений (Tomimatsu, Sato 1972, 1973). Тем не менее в результате недавнего прогресса методов генерирования решений (кратко рассмотренных в разд. 7.4) был разработан алгоритм получения всех асимптотически плоских стационарных аксиально симметричных решений, хотя требуемые вычисления в рамках такой процедуры остаются достаточно громоздкими. Случай статических аксиально симметричных пространств (с аксиально симметричным полем Киллинга гра, лежащим в гиперповерхности, ортогональной статическому полю Киллинга) является наиболее важным исключением, когда уравнения успешно используются. В таком случае имеем w = 0, и уравнение (7.1.25) тривиально выполняется, а если мы определим х = 1п V, то уравнение (7.1.24) сводится к простому виду: V2x = 0, (7.1.29) т.е. х является аксиально симметричным решением обычного уравнения Лапласа в трехмерном плоском пространстве. Поскольку все решения этого уравнения известны в явном виде, то можно получить все статические аксиально симметричные решения уравнений Эйнштейна. Впервые такой анализ статических аксиально симметричных пРостранств-времен проведен Вейлем (Weyl 1917), соответствующие Решения часто называют решениями Вейля. Необходимо подчеркнуть,
244 Глава 7. Методы решения уравнений Эйнштейна что свойства решения уравнения (7.1.29) не связаны простым способом со свойствами метрики пространства-времени, которое его генерирует. В частности, монопольное решение уравнений Лапласа не порождает сферически-симметричного пространства-времени. Для того, чтобы этой процедурой получить сферически-симметричное решение Шварцшильда, необходимо выбрать в качестве х потенциал конечного стержня, расположенного вдоль оси z и проходящего через начало координат, с постоянной массой на единицу длины. 7.2 Пространственно однородные космологические решения В гл. 5 подробно изучены пространственно однородные изотропные решения уравнений Эйнштейна. Эти модели успешно объясняют многие наблюдаемые свойства Вселенной. Однако наша Вселенная определенно не является точно однородной и изотропной, и хотелось бы лучше понять возможное динамическое поведение Вселенной в отсутствие этих симметрии. В гл. 5 показано, что пространственная изотропия в каждой точке предполагает пространственную однородность, и первым простейшим шагом в направлении обобщения моделей Робертсона-Уокера было бы получить пространственно однородные, но анизотропные решения. Можно ожидать, что такая задача легко решаема, поскольку при наличии пространственной симметрии только изменения во времени должны быть нетривиальными. Таким образом, уравнения Эйнштейна должны свестись к системе обыкновенных дифференциальных уравнений. Главная цель этого раздела - показать, что это действительно так, она достигается выводом уравнений (7.2.41)- (7.2.43). Решения этих уравнений дают интересную модель поведения Вселенной вблизи начальной сингулярности (Collins, Ellis 1979). В начале гл. 5 пространственно однородное пространство-время определено как пространство, обладающее группой изометрий, орбитами которой являются пространственноподобные гиперповерхности, на которые расслаивается (т.е. через каждую точку проходит одна из орбит) пространство-время. Первой задачей является точное определение природы требуемой группы изометрий и выяснение некоторых важных свойств такой группы. Понятие группы Ли, которую мы собираемся определить, обобщает на случай "т параметров" понятие одно- параметрической группы преобразований, рассмотренной в разд. 2.2. Вначале напомним читателю, что группа Q - это набор элементов с отображением Q x Q —> Q, называемым "умножением", и выделен-
7 2. Пространственно однородные космологические решения 245 ным элементом е, называемым единицей, причем: (1) закон умножения ассоциативен, gx(g2&) = (8182)83* (2) Д™ любого g € Q имеем eg ~ 8е = 8\ (3) для любого g € Q существует элемент G, обозначаемый g"1 и называемый обратным к g, такой, что gg~l = g~lg= е. Многие наборы, состоящие из конечного числа элементов, дают примеры групп. Хорошим примером группы с бесконечным числом элементов является совокупность диффеоморфизмов многообразия М с композицией в качестве "умножения", фф = ф о 0, и единицей е, являющейся тождественным отображением, е(р) = р для всех р € М. Аналогично, совокупность изометрий многообразия М с метрикой gab также образует группу, которая является подгруппой группы диффеоморфизмов, поскольку композиция двух изометрий и обратная изомет- рия являются изометриями. Группой Ли G размерности т называется группа, которая в то же время является m-мерным многообразием, такая, что обратное отображение i(g) = g~l и закон умножения /(g^fe) = g\g^ являются гладкими функциями из С°°. Таким образом, элемент группы Ли локально можно охарактеризовать посредством т параметров. Операции умножения и обратного отображения гладко зависят от этих параметров. Группа диффеоморфизмов многообразия М не является (конечномерной) группой Ли, поскольку эта группа "слишком велика", чтобы ее можно было охарактеризовать га параметрами. Однако можно показать, что группа изометрий всегда является (возможно нульмерной или несвязной) группой Ли. Фактически, как видно из прилож. С.З, группа Ли изометрий многообразия М размерности п не может иметь размерность выше, чем п(п + 1)/2. Установим ряд свойств групп Ли, которые понадобятся при анализе однородных космологических моделей. Пусть G является группой Ли размерности га. Из гладкости г и / следует, что для каждого h G G отображение Ы8) = hg, (7.2.1) называемое левым сдвигом на Л, является диффеоморфизмом. Пусть Фь обозначает отображение тензоров, индуцированное фн (см. прилож. С). Если векторное поле va на G удовлетворяет соотношению Ф1уа = va (7.2.2) Для всех h G G, тогда поле va называется левоинвариантным. В более общем случае говорят, что тензорное поле является левоинвариантным, если оно инвариантно под действием ф£ для любого h £ G. Легко видеть, что левоинвариантные векторные поля образуют векторное
246 Глава 7. Методы решения уравнений Эйнштейна пространство, поскольку сумма и произведение на скаляр левоинва- риантных полей также является левоинвариантным полем. Ясно, что левоинвариантное векторное поле определяется его величиной в Ve - пространстве, касательном к единичному элементу е, поскольку если va левоинвариантно, то имеем va\h = rh[va\e]. (7.2.3) Наоборот, если определить векторное поле через его значение в е уравнением (7.2.3), то получим левоинвариантное векторное поле. Таким образом, левоинвариантное векторное поле на G образует т-мерное векторное пространство. Если ф является диффеоморфизмом какого-либо многообразия, а va и wa два векторных поля, то Ф'([уМ) = [Ф*М,ФЧ^)], (7.2.4) где [ , ] обозначает коммутатор, определенный в разд. 2.2. Таким образом, если va и wa - левоинвариантные векторные поля на группе Ли, то коммутатор [u,w]a также будет левоинвариантным векторным полем. Поскольку коммутатор зависит линейно от va и wa, то это предполагает, что существует левоинвариантное тензорное поле саьс, такое, что [v,w]a = cabCvbwc. •. (7.2.5) Тензорное поле саьс называется тензором структурных констант группы Ли. Из его определения непосредственно следует, что саьс = -сас6. (7.2.6) Более того, из тождества Якоби для коммутаторов [и, [v, и;]] + [t/, [w, и]] + [w[u, v]] = 0 (7.2.7) следует, что ced[acdbc] = 0. (7.2.8) Конечномерное векторное пространство с тензором саьс типа (1,2), удовлетворяющим уравнениям (7.2.6) и (7.2.8), называется алгеброй Ли. Выше было показано, что левоинвариантное векторное поле какой- либо группы Ли является алгеброй Ли. Таким образом, каждая группа Ли порождает алгебру Ли. Наоборот, можно показать, что каждая алгебра Ли порождает единственным способом группу Ли с точностью до глобальной топологической структуры. Более точно, для данной
7.2. Пространственно однородные космологические решения 247 алгебры Ли существует единственная односвязная группа Ли, чья алгебра Ли совпадает с данной алгеброй Ли2. Эта теорема сильно упрощает анализ групп Ли, поскольку с алгебрами Ли работать легче. Пусть аа является левоинвариантным дуальным векторным полем. Если va - левоинвариантное векторное поле, тогда aava есть константа такая, что О = Vb(aava) = vaVbaa + aaVbva, (7.2.9) где Va является оператором производной на G. Если va и wa являются левоинвариантными векторными полями, то получаем 2vawbV[aab] = (vawb - vbwa)Vaab = = -vaabVawb + abwaVavb = = -ab[v,w]b = = -abcbcdvcwd. (7.2.10) Таким образом, получаем, что любое левоинвариантное дуальное векторное поле аь удовлетворяет соотношению: 2V(aa6] = -acccab. (7.2.11) Отображение правого сдвига \ы определенное уравнением Xh{g) = = gh, также является диффеоморфизмом. Правоинвариантное тензорное поле определяется аналогично левоинвариантному. Как отмечалось в разд. 2.2, любое векторное поле порождает однопараметриче- скую группу диффеоморфизмов. Пусть ха - правоинвариантное векторное поле, и пусть tpt ~ однопараметрическая группа диффеоморфизмов. Поскольку ха правоинвариантно, имеем XhO<t>t=<i>t°Xh (7.2.12) для всех h Е G. Следовательно, определяя h(t) = <fo(e), получаем для любых g € G: Ш = Фь ° Х8(е) = Xg о Фь(е) = Xg[h(t)] = h(t)g = ^h{t)(g). (7.2.13) Таким образом, получаем 4n = 1>h(t), (7.2.14) 2Существование группы Ли, связанной с алгеброй Ли, следует из теоремы Адо (см. например, (Jacobson 1962)). Существование односвязной группы Ли следует из построения универсальной накрывающей группы, описанной в гл. 13. Доказана и единственность (Warner 1971).
248 Глава 7. Методы решения уравнений Эйнштейна т.е. правоинвариантное векторное поле является инфинитезимальным генератором левых сдвигов. Это означает, что если ха является пра- воинвариантным векторным полем, a va - левоинвариантным, то 0 = £xva = [x,v]a. (7.2.15) Аналогично, если ха является правоинвариантным векторным полем, и аа левоинвариантным дуальным векторным полем, то О = £хаь = xaVaab + aaV&za, (7.2.16) где Va - оператор производной. Следовательно, если ха и уа оба являются правоинвариантными, а аь левоинвариантно, то вычислениями, аналогичными тем, что были сделаны при выводе (7.2.10), найдем 2*YVIea4 = уьхаVaa6 - хьуаVaa6 = = -ybotaVbxa + xbaaVbya = = *а[х,у)а- (7.2.17) С другой стороны, из уравнения (7.2.11) имеем 2xat/6 V[aab] = *У (-accca6). (7.2.18) Таким образом, находим [хМс = -ссаЬхауь, (7.2.19) т.е. с точностью до знака правоинвариантное векторное поле удовлетворяет таким же коммутационным соотношениям как и левоинвари- антное поле. Заметим, что из уравнения (7.2.19) следует, что сааЬ также является правоинвариантным3. Применим теперь изложенные факты о группах Ли к однородным космологическим моделям. По определению в пространственно однородном пространстве-времени (M,ga6) существует семейство про- странственноподобных гиперповерхностей Е*, таких, что для любой пары точек p,q € Е* существует элемент g : М —* М группы Ли G изометрий такой, что g(p) = q. (Говорят, что G действует транзитив- но на каждой £*.) Ограничимся таким случаем, когда для всех Et и для всех р, q £ Е* существует единственный элемент g€ G такой, что g(p) = q. В этом случае говорят, что G действует просто транзитивно 3Тензор ccdacdcb симметричен по индексам а и 6. Для полупростой группы Ли он также невырожден. Таким образом, полупростая группа Ли обладает естественной биинвариантностью (т.е. лево и правоинвариантность) метрики gab = ccdac<icb-
7.2. Пространственно однородные космологические решения 249 на каждой Е*. Это неявно предполагает, что dimG = dimEt = 3. Фактически без потери общности можно ограничиться просто транзитивным действием, поскольку единственным случаем, где G не действует просто транзитивно или не обладает подгруппой с просто транзитивным действием4 является группа 50(3) х R, действующая на "цилиндре" 52 х R (орбитами 50(3) являются двумерные сферы) (MacCallum 1979). Пространственно однородные модели с такой группой изометрии (называемые моделямии Кантовского-Сакса) можно рассмотреть отдельно, используя похожую технику (Ryan, Shepley 1975). Преимущество рассмотрения просто транзитивного действия в том, что для произвольно выбранной точки р € Е* можно элементам группы G поставить в соответствие точки Et с помощью отображения g —> g(p). (Простая транзитивность действия необходима для обеспечения однозначного соответствия.) При такой идентификации G и Е* действие изометрии g на Е* соответствует левому умножению на G. Поэтому тензорное поле на Et, которое сохраняется при изометри- ях, в частности, пространственная метрика каь на Е*, точно соответствует левоинвариантному тензорному полю на G. В частности, это означает, что векторное поле на Е*, сохраняющееся при изометриях, удовлетворяет коммутационным соотношениям (7.2.5), и, аналогично, инвариантные дуальные векторы удовлетворяют (7.2.11). Более того, инфинитезимальные генераторы изометрии на Е*, т.е. векторные поля Киллинга на Е*, соответствуют правоинвариантным векторным полям на G. Следовательно, векторные поля Киллинга на Е* удовлетворяют коммутационным соотношениям (7.2.19). Наша задача теперь состоит в том, чтобы привести метрику пространственно однородного пространства-времени с просто транзитивной группой к каноническому виду. Рассмотрим одну однородную гиперповерхность Ео. Идеальным был бы выбор пространственных координат таким образом, чтобы пространственные компоненты пространственно-временной метрики были бы независимы от пространственных координат. Однако, кроме простейшего случая группы трансляций G = R3, это невозможно сделать по той причине, что координатные векторные поля должны коммутировать, но в соответствии с уравнением (7.2.19) векторные поля Киллинга не коммутируют, за исключением случая саьс = 0. Вообще говоря, только одно векторное поле Киллинга можно использовать в качестве координатного векторного поля, но это не особенно полезно. Вместо этого выбираем базис 4В частности, все группы изометрии однородных изотропных моделей гл. 5 обладают подгруппами, которые имеют просто транзитивное действие на однородных поверхностях.
250 Глава 7. Методы решения уравнений Эйнштейна дуальных векторных полей (сг1)а, (сг2)а, (<т3)а, сохраняющихся при изо- метриях (что можно сделать, выбирая базис в р Е Ео и определяя базис везде посредством "левых сдвигов"). Поскольку пространственная метрика Наь на Ео, получаемая ограничением пространственно- временной метрики gab на векторы, касательные к Ео, является лево- инвариантной, имеем з hab = J2 Л^ЮаЛ, (7.2.20) а,/9=1 где компоненты Наь являются постоянными на Ео, т.е. не зависящими от пространственного положения. Пусть р € Ео, пусть ta обозначает единичную нормаль к Ео в точке р, и пусть 7 является геодезической, определяемой (р,£в). Тогда 7 будет ортогональна всем пространственным гиперповерхностям, которые она пересекает, поскольку по утверждению С.3.1, касательная к 7 должна всегда оставаться ортогональной ко всем пространственным векторным полям Киллинга по той причине, что она первоначально им ортогональна. Параметризуем другие пространственно однородные гиперповерхности собственным временем £, соответствующим пересечению геодезической 7 с гиперповерхностью. Тогда векторное поле ta = —Vat будет везде ортогонально к каждой Е* (поскольку t является постоянной на Е*), и все интегральные кривые будут геодезическими (с tata = — 1), так как это верно по построению вдоль 7 и, следовательно, верно везде на каждой Ее вследствие пространственной однородности. Определим дуальные векторные поля ((та)а на всем пространстве-времени через их значения на начальной поверхности Ео посредством "переноса Ли" вдоль £а, т.е. полагая £t((Ta)a = 0 (7.2.21) или эквивалентно определяя (сга)а на гиперповерхности Е* соотношением (O.W = #К(0)]а, (7.2.22) где фг означает однопараметрическую группу диффеоморфизмов, порожденную ta. Из (7.2.21) непосредственно следует, что повсюду (сга)а ta = 0. По той причине, что фг строится чисто геометрически, как нетрудно понять, она должна коммутировать с изометрией g Фь °ё = 8°Ф^ (7.2.23)
7.2. Пространственно однородные космологические решения 251 Это немедленно следует из того, что на каждой £* (т.е. не только на £о) векторный базис (ста)а инвариантен при пространственных изо- метриях. Заметим также, что 2*aV[a(Ob] = taVa(cra)b-taVb(va)a = = *aVa(Ob + (aa)aVbt° = = £t(a°)b = 0. (7.2.24) Таким образом, V[a(aa)b] не имеет компонент, перпендикулярных к Е*. Поскольку часть V[a(<7°%], спроектированная на Et, удовлетворяет уравнению (7.2.11) вследствие инвариантности (<та)а при пространственных изометриях, имеем 2V[a(<7a)6] = -ссаь(<т*)с. (7.2.25) Заключением всего вышеизложенного обсуждения является следующее. Для пространственно однородных пространств, на которых пространственная группа изометрий G действует просто транзитивно, многообразие имеет следующую структуру: М = R x G. Определяя функцию t и левоинвариантные векторные поля (сг1)0, (a2)a и (a3)a на М способом, описанным выше, можно представить пространственно- временную метрику gab выражением з &6 = "Va*V6*+ Y, ha(3(t)(<Ta)a(<jP)b, (7.2.26) где векторные поля (aa)a удовлетворяют соотношению V[aK)6] = -\ссаь{<та)с. (7.2.27) Поэтому, чтобы сконструировать пространственно однородные космологические модели, просто выбираем трехмерную группу Ли G, базис левоинвариантных дуальных векторных полей на G и функции hab(t) (или, эквивалентно, выбираем зависящую от времени левоин- вариантную метрику hab(t) на G). Тогда пространственно-временная метрика на R x G определяется уравнением (7.2.26). Таким методом можно получить все однородные космологические модели с простым транзитивным действием. Таким образом, не считая особого случая, отмеченного выше, где действие группы Ли не является просто транзитивным, программа получения всех общерелятивистских пространственно однородных космологических моделей завершается (1) получением всех трехмерных
252 Глава 7. Методы решения уравнений Эйнштейна групп Ли G и (2) выписыванием и решением уравнений Эйнштейна для метрики (7.2.26). Первая задача была решена Бианки (Bianchi 1897), который получил все трехмерные алгебры Ли и разделил их на девять типов. (Как подчеркивалось выше, эти алгебры Ли однозначно соответствуют всем односвязным трехмерным группам Ли.) Здесь мы выведем слегка модифицированную версию классификацию Бианки (Ellis, MacCallum 1969). Мы ищем всевозможные тензоры ссаь в трехмерном векторном пространстве V, удовлетворяющие соотношению ссаь = сс^ь] и тождеству Якоби (7.2.8). Пусть еаьс - фиксированная 3-форма на V, т.е. совершенно антисимметричный тензор типа (0,3). Для заданного сс0{, определяем Аа и МаЬ: Аа = сьЬа, (7.2.28) МаЬ = 16acd(c6crf _ 5bAd^ (722g) где еаЬс является совершенно антисимметричным тензором типа (3,0), удовлетворяющим соотношению еаЬссаьс = 3! = 6. Сворачивая (7.2.29) с eaef и используя уравнение (В.2.13), получаем eaefMab = cbef - 8\eAfV (7.2.30) Сворачивая это уравнение по е и 6, а затем используя определение (7.2.28), находим, что МаЪ симметричен: ММ = 0. (7.2.31) Таким образом, мы показали, что в любом трехмерном векторном пространстве тензор ссаь, удовлетворяющий соотношению ссаь = сс[аь], может быть записан в виде ccab = Mcdedab + 6faAbh (7.2.32) где Mcd = Mdc. Подстановка этого выражения в тождество Якоби (7.2.8) приводит к замечательно простому результату: МаЬАь = 0. (7.2.33) Таким образом, трехмерная алгебра Ли определяется дуальным вектором Аа и симметричным тензором Ма6, удовлетворяющими уравнению (7.2.33). Если Аа = 0, тогда уравнение (7.2.33) тривиально выполняется. В этом случае (далее "класс А") алгебры Ли классифицируются (т.е.
7.2. Пространственно однородные космологические решения 253 определяются единственным образом с точностью до изоморфизма) рангом и сигнатурой (с точностью до общего знака) МаЬ. Следовательно в данном случае существуют шесть различных алгебр Ли: (i)Mab = О, (ii) rank(Mab) = 1, (iii) rank(Ma6) = 2, сигнатура (+, -), (iv) rank(Mab) = 2, сигнатура (+,+), (v) rank(Ma6) = 3, сигнатура (+,+,-), (vi) rank(Ma6) = 3, сигнатура (+,+,+). Если Аь ф О (далее "класс В"), тогда из уравнения (7.2.33) следует, что ранг МаЬ не может быть выше двух. Поэтому существуют четыре возможности выбора ранга и сигнатуры (с точностью до общего знака) МаЬ- Однако в тех двух случаях, когда ранг МаЬ равен двум, можно определить скаляр а формулой AeAf = aMacMbdecdeeabf, (7.2.34) поскольку тензоры в обеих частях этого уравнения не равны нулю и должны быть пропорциональны друг другу. В результате в классе В существуют два однопараметрических семейства алгебр Ли, которые классифицируются сигнатурой тензора второго ранга МаЬ и величиной а, так же как и две другие алгебры Ли, соответствующие случаю нулевого (т.е. Маь = 0) или первого рангов МаЪ. Имеются таблицы, содержащие в явном виде формулы компонент ссаь в подходяще выбранном базисе для всех отмеченных выше алгебр Ли (Taub 1951; Ryan, Shepley 1975). Чтобы выписать уравнения Эйнштейна, необходимо вычислить кривизну метрики (7.2.26). Наиболее простой процедурой вычисления является определение левоинвариантного ортонормированного базиса {е»)а (который, однако, не удовлетворяет (7.2.21)) соотношениями (е0)а = Va*, (7.2.35) з (eQ)a = ^BQ/3(t)(Oa (a = 1,2,3). (7.2.36) /3=1 Чтобы базис (ед)а был ортонормированным, величины Вар должны Удовлетворять уравнению 6a(3 = Y,BcnB(36h"fS (a,/? =1,2,3), (7.2.37) где ha& - компоненты обратной метрики hab в базисе дуальном к (<та)а- (Существует, конечно, известная свобода в выборе BQp; для оконча- тельной спецификации Ва/з можно наложить дополнительные уело-
254 Глава 7. Методы решения уравнений Эйнштейна вия, как, например, условие симметрии Вар = Вра (Ryan, Shepley 1975).) В таком ортонормированном базисе получаем: V[a(e0)b] = VIeV4t = 0 (7.2.38) для a = 1,2,3: 3 1 = ^VV[flt(e7)r-ccfl6(ea)c, (7.2.39) 7=1 l где Аау = ^2p(dBQp/dt)(B~1)^, и было использовано уравнение (7.2.27). Уравнения (7.2.38) и (7.2.39) в совокупности с уравнением (3.4.24) определяют 1-формы, и кривизну можно вычислить тетрадным методом из разд. 3.4.2. Эта процедура выражает тензоры кривизны Римана и Риччи через табулированные матрицы Вар и тензоры структурных констант ссаь (Ryan and Shepley 1975). Однако, используя уравнение (7.2.37), можно выразить Вар через hap (это возможно потому, что выбранные группы Ли и hap полностью определяются метрикой (7.2.26), поэтому кривизна должна выражаться через них). Тогда полученные формулы можно записать в виде тензорных уравнений на кривизну через метрику hab(t) на £* и тензор структурных констант ссаь- Мы не будем описывать здесь детали этих длинных вычислений, а просто представим конечный результат. Определяя КаЬ соотношением Kab = \£thab, (7.2.40) (как обсуждалось более подробно в гл. 9 и 10, Каь{Ь) является внешней кривизной поверхности Et), получаем следующие формулы для компонент Саб(ео)а(ео)6, Gbchba{eo)c и hcahdbRcd тензоров кривизны Эйнштейна и Риччи: 2<?аь(ео)а(е0)6 = (Каа)2 - КаЬКаЬ - сааЬсссъсасЬссаь - - \-\саЪсСаЬс, (7.2.41) Gbchba(eo)c = Rbchba(eo)c = Kbcccba + Kbaccbc, (7.2.42) hCah bRcd = £tKab + К°сКаЪ ~ 2КасКСь + -CacdCbC — 4 - cccdc{ab)d - ccdac<<cd\. (7.2.43)
7.2. Пространственно однородные космологические решения 255 Справа в (7.2.41)-(7.2.43) все индексы опускаются и поднимаются с помощью пространственной метрики hab и обратной к ней hab соответственно. Теперь уравнения Эйнштейна Rab = О эквивалентны равенству нулю левых частей (7.2.41)-(7.2.43). (Невакуумные уравнения Эйнштейна получаются приравниванием левых частей (7.2.41)-(7.2.43) к соответствующим компонентам тензора энергии-импульса.) Используя определение (7.2.40) для Каь, можно проверить, что если (7.2.41) и (7.2.42) имеют нулевые левые части "в начальный момент", т.е. на гиперповерхности Ео, то они выполняются и всегда, когда левая часть (7.2.43) равна нулю. Другими словами, производная по времени (7.2.41) и (7.2.42) автоматически равна нулю вследствие выполнения уравнений (7.2.40) и (7.2.43). Причина этого непосредственно связана с тождеством Бианки VaGa6 = 0 и будет обсуждаться в гл. 10. Таким образом, (7.2.41) и (7.2.42) - это уравнения связей, наложенных на начальные значения величин Каь и hab- (Правая сторона (7.2.41)-(7.2.43) безусловно содержит hab в явном виде через поднимание и опускание индексов.) С другой стороны, уравнения (7.2.40) и (7.2.43) описывают эволюцию hab и Каъ- Если спроектировать уравнения (7.2.40) и (7.2.43) на начальный базис (crQ)a, то получится система обыкновенных дифференциальных уравнений, в которых dhab/dt и dKab/dt выражаются через hab, Каь и групповые структурные константы c7Q/j. Из теории обыкновенных дифференциальных уравнений хорошо известно, что для заданных начальных значений hab и Каь существует единственное решение уравнений (7.2.40) и (7.2.43). Итак, чтобы получить пространственно однородное решение вакуумных уравнений Эйнштейна, необходимо решить уравнения связи (7.2.41) и (7.2.42) для начальных значений hab и Каь в момент t = 0. Тогда единственное решение получается из уравнений эволюции (7.2.40) и (7.2.43). Хотя в большинстве случаев невозможно проинтегрировать эти уравнения аналитически, прямое численное интегрирование такой системы обыкновенных дифференциальных уравнений всегда можно сделать. Аналогичное заключение справедливо и для невакуумных уравнений Эйнштейна с подходящими источниками. В качестве иллюстрации этой процедуры найдем все пространственно однородные вакуумные решения в простейшем случае группы Ли G = R3 с обычным сложением в качестве группового "умножения". (Такой случай называется тип I в классификации Бианки групп Ли.) Поскольку групповое умножение коммутативно, то генераторы левых сдвигов должны коммутировать, поэтому из уравнения (7.2.19) имеем ссаь = 0. Следовательно, любой базис левоинвариантных вектор-
256 Глава 7. Методы решения уравнений Эйнштейна ных полей образует координатный базис, и для любого выбора (o"Q)0> построенного описанным выше способом, можно найти такие координаты я, у, z на R3, что (al)a = (dx)G, (а2)а = (dy)a, (а3)а = (dz)a. (Простой выбор ссаЬ = 0, конечно, является единственным случаем, для которого это можно сделать.) Без потери общности можно выбрать ортонормированный базис (<та)а на начальной поверхности Ео и, вращая его, диагонализовать Каъ на Ео. Тогда уравнения эволюции (7.2.40) и (7.2.43) с ссаь = 0 означают, что в базисе (ст°)а, который вне начальной поверхности определяется уравнением (7.2.21), должны оставаться ортогональными в течении всего времени как hap, так и Кар. Таким образом, имеем Кар = diag(fci,*a,fc3), (7.2.44) ha0 = <Иа8(/ь/2,/з), (7.2.45) h?# = diag^f1,/^1,^1). (7.2.46) По построению, на начальной поверхности /Q = 1. Связь (7.2.42) в начальный момент тривиально выполняется, и единственное условие на начальную величину kQ имеется в уравнении (7.2.41), которое дает вместе с /Q = 1 условие (fci + k2 + k3)2 = k\ + k\ + Щ. (7.2.47) Уравнения эволюции (7.2.40) и (7.2.43) дают ka « \f, (7.2.48) it = -(e^W2/»1^- <7-2-49> Следовательно, находим ■{-(?«- = lE^1**]'»1*»- (7-2-50) Суммируя уравнение (7.2.50) no a, получаем dK/dt = -К2, (7.2.51)
7.2. Пространственно однородные космологические решения 257 где К = J^afa1^ = Kaa- За исключением тривиального решения К = О (пространство Минковского) общим решением уравнения (7.2.51) является К = 1/i, (7.2.52) где постоянная интегрирования была включена в определение нулевого значения t. Подстановка нашего решения (7.2.52) в уравнение (7.2.50) дает ^(fa1ka)=-\(f-1ka), (7.2.53) общим решением которого является следующее выражение falka=Pa/U . (7.2.54) гдера - константы. Следовательно, используя формулу (7.2.48), получаем уравнение общее решение которого fa = Cat2p% (7.2.56) где CQ - постоянные. Тогда уравнение (7.2.48) (или уравнение (7.2.54)) дает ka = CapQt2p«-1. (7.2.57) Подстановка решений (7.2.56) и (7.2.57) в уравнение (7.2.52) дает связь £ра = 1. (7.2.58) а Уравнения (7.2.56) и (7.2.57) при условии (7.2.58) являются общим решением уравнений эволюции (помимо решения с пространством Минковского). Используя t = 1 в качестве начальной поверхности, на которой действуют условия /Q = 1, и fcQ удовлетворяют связям (7.2.47), получаем Са = 1, (7.2.59) (5>) = ЕЙ- (7.2.60) Итак, общим пространственно однородным вакуумным решением (помимо решения с пространством Минковского) уравнений Эйнштейна с просто транзитивной группой Ли G = R3 является ds2 = -dt2 + t2pidx2 + t2p4y2 + t2p*dz2, (7.2.61)
258 Глава 7. Методы решения уравнений Эйнштейна где pi, р2, Рз ~ постоянные, удовлетворяющие уравнениям (7.2.58) и (7.2.60). (7.2.61) известно как решения Казнера (Kasner 1925). Одним из решений уравнений (7.2.58) и (7.2.60) является р\ = 1, Р2 = Рз = 0. В решении Казнера с таким выбором констант ра можно узнать пространство-время Риндлера (пересеченное R2), рассмотренное в разд. 6.4, в котором необходимо поменять местами t и х. В этом случае явная сингулярность при t = 0 является координатной сингулярностью, и решение Казнера (7.2.61) есть просто клин в пространстве Минковского, отмеченный как область II на рис. 6.8. Однако все другие решения, отличные от тривиального, в котором два параметра из ра зануляются, являются неплоскими пространствами с физической сингулярностью при t = 0. Подчеркнем, что за исключением тривиального решения, все решения уравнений (7.2.58) и (7.2.60) должны иметь два положительных pQ и третье отрицательное. Таким образом, решения Казнера описывают однородную Вселенную, которая расширяется в двух направлениях, но сжимается в других. Интересно, что анализ динамики однородных вакуумных решений с G=SU(2) (IX тип Биан- ки) показывает, что около первоначальной сингулярности эволюция описывается рядом "эпох Казнера", связанных "переходными режимами", в которых величины ра изменяются (Белинский, Халатников, Лифшиц 1970). 7.3 Алгебраически специальные решения В предыдущих двух разделах (как и в гл. 5-6) рассказано о том, какой прогресс в получении физически интересных решений уравнений Эйнштейна достигнут для пространств с высокой степенью симметрии. В этом разделе мы кратко обсудим другой тип упрощающих предположений для получения решений, который связан с алгебраическими свойствами тензора кривизны. К сожалению, многие решения, найденные именно таким способом, физически не столь значимы, поскольку характер этого упрощающего предположения является более математическим, чем физическим. Тем не менее этот подход является наиболее успешным для получения большого класса точных решений, и некоторые очень важные решения, такие как метрика Керра (гл. 12), были найдены на этом пути. Точно так же, как и в случае пространственных метрик, рассмотренных в начале разд. 5.1, можно понимать тензор Римана Rab°d как линейное отображение шестимерного пространства антисимметричных тензоров типа (0,2) (т.е. 2-форм) в себя. Это отображение является самосопряженным, поскольку Rabcd = Rcdab- Однако необходимо под-
7.3. Алгебраически специальные решения 259 черкнуть, что в отличие от случая римановой метрики, рассмотренной в разд. 5.1, внутреннее произведение 2-форм посредством пространственно-временной метрики gab не является положительно определенным, и известная теорема о том, что самосопряженное линейное отображение имеет полный ортонормированный базис собственных векторов (которая выполняется в любом конечномерном векторном пространстве с положительно определенным внутренним произведением), здесь не применима. Анализ структуры тензора Римана как линейного отображения впервые был сделан А.З. Петровым (Петров 1954, 1969). Мы не будем здесь вдаваться в детали анализа тензора кривизны, а приведем сразу важный вывод. Вообще говоря, существуют в точности четыре различных нулевых направления (т.е. нуль-векторы ка, определенные с точностью до масштабного преобразования ка —► Afca), которые удовлетворяют соотношению kbkck[eCa]bc[dkf] = О, (7.3.1) где С abed - тензор Вейля, определенный уравнением (3.2.28). Нулевые направления, удовлетворяющие соотношению (7.3.1), называются главными нулевыми направлениями. Таким образом, любой тензор, удовлетворяющий алгебраическим условиям, которым удовлетворяет тензор Вейля в четырехмерном векторном пространстве лоренцевой сигнатуры, обладает в общем случае четырьмя главными нулевыми направлениями. Доказательство этого результата тензорными методами требует значительной работы. Простейший вывод этого результата можно сделать спинорными методами, и мы представим его в гл. 13. Хотя в общем случае тензор Вейля обладает четырьмя различными главными нулевыми направлениями, возможно совпадение некоторых из этих нулевых направлений, что приводит к меньшему количеству главных нулевых направлений. В этом случае тензор удовлетворяют более сильному условию, чем (7.3.1). Пространства, имеющие менее четырех главных нулевых направлений в каждой точке, называются алгебраически специальными пространствами. Различные типы алгебраически специальных пространств собраны в табл. 7.1.5 В алгебраически специальных пространствах можно выгодно использовать условия, которым удовлетворяют совпадающие главные нулевые направления, выбирая нулевую тетраду (см. обсуждение формализма Ньюмена-Пенроуза в конце разд. 3.4), так чтобы один из 5Типы пространств Эйнштейна в табл. 7.1 задают классификацию по Петрову.- Прим.ред.
260 Глава 7. Методы решения уравнений Эйнштейна Таблица 7.1. Алгебраическая классификация пространств Тип I II II-II[D] III IV[N] Описание Алгебраически общий; четыре различных главных нулевых направления Одна пара главных нулевых направлений совпадает Две пары главных нулевых направлений совпадают Три главных нулевых направления совпадают Все главные нулевые направления совпадают Условие на (совпадающие) главные нулевые направления ка kbkck[eCa]bc[dkf] = 0 kbkcCabc[dhe] = 0 kbkcCabc[dke) = 0 (два решения) kcCabc[dke] = 0 kcCabcd = 0 нулевых векторов был расположен вдоль совпадающих главных нулевых направлений. Некоторые тетрадные компоненты тензора Вей- ля тогда будут равны нулю. Это дает дополнительные уравнения на компоненты связности (т.е. на спиновые коэффициенты в формализме Ньюмена-Пенроуза) помимо тех, которые накладывают уравнения Эйнштейна. Используя эти дополнительные условия, можно точно проинтегрировать уравнения Эйнштейна во многих случаях. Мы не будем здесь пытаться представить какие-либо детали того, как можно найти алгебраически специальные решения. Например, с помощью этого подхода прямым интегрированием уравнений Ньюмена-Пенроуза найдены все явные решения типа П-П уравнений Эйнштейна в пустоте (Kinnersley 1969). Имеются обзоры алгебраически специальных решений (Kramer, Stephani, MacCallum, Hertl 1980). 7.4 Методы генерирования решений Часто бывает, что для уравнения существует алгоритм конструирования новых решений из уже полученного. Например, в обычной электростатике можно сконструировать новое решение уравнения Лапласа из решения, полученного "методом инверсии" (Jackson 1962)6. Хотя такие методы часто легко применимы, они обычно страдают серьезным недостатком по той причине, что сгенерированные решения 6 Метод инверсии работает потому, что инверсия сферы отображает евклидову метрику в себя (т.е. является "конформной изометрией"), а уравнение Лапласа имеет простые свойства при конформных преобразованиях (см. прилож. D).
7.4. Методы генерирования решений 261 не имеют физического интереса или даже вовсе не согласуются с условием решаемой задачи. Оказывается, что если имеется решение вакуумных уравнений Эйнштейна Rab = 0 с векторным полем Киллинга £а, то существует процедура конструирования однопараметрического семейства решений, для которого £° остается полем Киллинга. Получены разные алгоритмы такого рода (Ehlers 1957), мы представим наиболее общий из них (Geroch 1971). Используем доказанный в разд.7.1 факт (7.1.15), что в вакуумном пространстве-времени вектор вращения иа поля Киллинга £°, определенный соотношением "а = €a6cd£6VC£d, (7.4.1) удовлетворяет уравнению V[aa;6] = 0. (7.4.2) Следовательно, как отмечено в конце прилож. В.1, локально существует скалярная функция и, такая, что ша = Vaa;, (7.4.3) (о; называется скаляром вектора вращения поля £а). Более того, используя (В.2.13), находим eo6e/Ve [eabcdV4d] = -4VeVe^. (7.4.4) Отсюда, используя (С.3.9) и вакуумные уравнения Эйнштейна Rab = = 0, получаем V[e {€ab)cdV4d} = 0, (7.4.5) что предполагает (локальное) существование 1-формы аь, такой, что V[oab) = leabcdV4d- (7.4.6) Добавляя к аь градиент некоторого скалярного поля, можно добиться выполнения соотношения ?аа=ш. (7.4.7) Наконец, аналогичными расчетами (задача 5) показываем, что V(e {2AV0^, + u;€Qb]cdVc^} = 0, (7.4.8) где А = Г&, (7.4.9)
262 Глава 7. Методы решения уравнений Эйнштейна и тогда локально существует 1-форма /3&, такая, что V[a(3b] = 2AV«& + u>€abcdVc£d. (7.4.10) Можно добиться, чтобы /Зь удовлетворяла соотношению £<7?a = a;2 + A2-l. (7.4.11) Алгоритм генерирования новых решений из заданного решения можно сформулировать следующим образом. Пусть gab является решением вакуумных уравнений Эйнштейна Rab = 0 с векторным полем Киллинга £°. Определим о;, аа и (За соотношениями, выписанными выше. Для каждого 0 € [0,7г] определим gafe(0) соотношением Ъы№) = °8аь + 2sin^(a76) + -^— 7а7б, . (7.4.12) где <т(0) и 7а(0) определяются уравнениями a = (cos0-u;sin0)2 + A2sin20, (7.4.13) 7a = 2aacos0-/?asin0. (7.4.14) Тогда для любых в метрика gafc(0) является решением вакуумных уравнений Эйнштейна, Более того, £а остается полем Киллинга для &б(0)- Заметим, что при 0 = 7Г метрика ga&(0) переходит в gab; иначе &б(0) является в общем случае другим решением. Также отметим, что даже если gab несингулярна, £аь(0) может иметь сингулярности за счет плохого поведения а>, аа или /За, что вполне вероятно вследствие невозможности их глобального определения. Читатель может проверить прямым вычислением, что уравнение (7.4.12) действительно служит решением вакуумных уравнений Эйнштейна. Более глубокое понимание этого алгоритма читатель найдет в первоисточнике (Geroch 1971), где дан вывод (7.4.12). К сожалению, процедура (7.4.12) не сохраняет все физически интересные особенности первоначальной метрики. В частности, gab(0) не будет в общем случае асимптотически плоской, даже если gab является таковой. Более того, (7.4.12) дает только однопараметрическое семейство решений. Если снова применить тот же алгоритм к £аь(0), то это не приводит к появлению новых решений. Однако, если gab имеет два коммутирующих векторных поля Киллинга £а и 'ф0, (как в случае стационарных аксиально-симметричных пространств разд. 7.1), то можно показать следующее (Geroch 1972а). Во-первых, гра продолжает оставаться векторным полем Киллинга метрики gafc(0), полученной процедурой (7.4.12) с использованием
7.5. Возмущения 263 поля Киллинга £а. Следовательно, можно применять этот алгоритм к ga6(0), используя вектор Киллинга фа для того, чтобы сгенерировать двухпараметрическое семейство решений ga&(0, в') из первоначального решения gab. Тогда можно снова применить преобразование (7.4.12) к &ь(*). Во-вторых, процедура не воспроизводит в общем случае предыдущего решения, а приводит к трехпараметрическому семейству решений. Действительно, многократное применение алгоритма (7.4.12) генерирует бесконечномерную группу преобразований. Недавно было доказано (Hauser, Ernst 1981) предположение (Geroch 1972a), что все асимптотически плоские стационарные аксиально-симметричные решения вакуумных уравнений Эйнштейна могут быть получены из пространства Минковского с помощью элементов этой группы. Более того, известно как генерировать такие асимптотически плоские решения с требуемыми значениями мультипольных моментов (Hoenselaers, Kinnersley, Xanthopoulos 1979; Xanthopoulos 1981). К сожалению, алгебраические вычисления, требуемые для этих решений, остаются достаточно громоздкими и фактически только несколько решений известны в явном виде. Тем не менее этот метод генерирования бесспорно является одним из важнейших методов решения уравнений Эйнштейна. 7.5 Возмущения Как подчеркнуто в начале этой главы, известно относительно немного физически интересных точных решений уравнений Эйнштейна. Известные решения, такие как решения Робертсона-Уокера (гл. 5) и решение Шварцшильда (гл. 6), могут многое рассказать о космологии и гравитационных полях изолированных тел, но они оставляют без ответа множество вопросов. Например, хотелось бы знать, как развиваются со временем малые неоднородности распределения материи во Вселенной Робертсона-Уокера, или как ведет себя почти сферическая звезда, слегка выведенная из равновесия, или что случится, если небольшое количество гравитационного излучения упадет на черную дыру Шварцшильда. Безнадежно пытаться найти точные решения, описывающие эти процессы. Однако, если отклонение от известного решения мало, имеет смысл искать приближенное решение, полагая Sab = °8аЬ + 7аб (где °gab является известным точным решением) и "линеаризуя" по уаь уравнения Эйнштейна. Мы уже использовали такую процедуру в разд. 4.4 в случае, когда °gab - метрика Минковского Vab- Здесь мы систематизируем общую процедуру вывода линеаризо-
264 Глава 7. Методы решения уравнений Эйнштейна ванных уравнений для вакуумных уравнений Эйнштейна и получим в явном виде уравнения вакуумных возмущений вблизи произвольного точного решения. Рассмотрим уравнение £{g) = О (7.5.1) для неизвестной функции g (в более общем случае она может представлять собой набор функций или тензорных полей). В нашем случае g является метрикой пространства-времени вместе с переменными, описывающими распределение материи, а £ представляет собой уравнение Эйнштейна. Предположим, что известно некоторое точное решение °g и предположим, что нам интересно изучить ситуации, в которых отклонение от °g мало. То что мы реально хотим получить - это одно- параметрическое (или многопараметрическое) семейство g(X) точных решений S\g{X)] = 0, (7.5.2) где А измеряет масштаб возмущений в том смысле, что (i) g(X) является дифференцируемой функцией А, и (ii) g(0) = °g. Таким образом, малые А соответствуют малым отклонениям от °g, а функция g(X) для малых А дает точное возмущенное решение. Однако уравнение (7.5.2) может быть слишком трудным для решения. Тем не менее, можно получить более простое уравнение из (7.5.2), дифференцируя его по А и полагая А равным нулю, ЗХ [*(*(*))] = 0. (7.5.3) А—О Уравнение (7.5.3) является линейным для величины dg 7=dA (7.5.4) А=0 т.е. его можно выразить в следующей форме Цу) = 0, (7.5.5) где С - линейный оператор. (Уравнение (7.5.5) называется "линеаризацией" (7.5.1) относительно °g.) Поскольку линейные уравнения много легче решить, чем нелинейные, можно надеяться реально решить уравнение (7.5.5), даже если уравнение (7.5.1) не поддается решению. Если возможно решить уравнение (7.5.5), то °g+ A7 должно давать хорошее приближение для g(\) при достаточно малых А и можно исследовать интересующие нас физические вопросы.
7.5. Возмущения 265 Описанная выше процедура дает мощный инструмент для получения приближенных решений. Используя технику возмущений, необходимо помнить о двух важных моментах. (1) Очень трудно в общем случае оценить ошибку, возникающую при замене g(X) на °g + Л7, т.е. трудно определить насколько мало должно быть Л для того, чтобы приближенное решение имело достаточную точность. (2) Как уже было показано, существование однопараметрического семейства решений g(X) предполагает существование решения уравнения (7.5.5), в котором 7 = (dg/dA)|A=o- Однако существование решения 7 уравнения (7.5.5) не обязательно предполагает существование соответствующего однопараметрического семейства решений g(X) уравнения (7.5.2), т.е. возможны ложные решения уравнения (7.5.5). Таким образом, "ли- неаризационная стабильность" - существование точных решений, соответствующих решению линеаризованных уравнений, должна быть исследована до анализа возмущений, чтобы результаты теория возмущений были достаточно надежны. Выведем теперь линеаризованные вакуумные уравнения Эйнштейна (7.5.5) для метрических возмущений 7аб точного решения °gab уравнений Эйнштейна в вакууме Rab = 0. (7.5.6) Прежде всего необходимо вычислить тензор Риччи Rab(X) для метрики gab(X) в подходящей форме, точнее через "фоновую метрику" °gab. Дифференцирование этого выражения по А при А = 0 дает требуемые уравнения. Пусть AVa обозначает оператор производной, ассоциированный с ga6(A), и пусть °Va обозначает оператор производной, ассоциированный с °gab. В соответствии с общим анализом разд. 3.1, разница между AVa и °Va определяется тензорным полем Ссаб(А), которое (см. уравнение (3.1.23)) имеет вид CcabW = \efdW { °V„gbd(A) + <Vbged(A) - <Vdgeb(A)} . (7.5.7) Тензор Римана Rabcd(X), ассоциированный с gab(X), можно выразить через °Rabcd(X) и Ссаб(А), заменяя оператор производной AVa в определении тензора Римана (3.2.3) его выражением через °Va и Ссаб(А). Двигаясь далее тем же способом, как и при выводе уравнения (3.4.3), получаем Дабе = Дабе - 2V[aC Ь]с + 2Сес[аС цв. (7.5.8) Таким образом, тензор Риччи метрики gab(X) имеет вид Rac = -2 °V|aC\)c + 2Cec[aC\]e, (7.5.9)
266 Глава 7. Методы решения уравнений Эйнштейна где учтено, что °Rac = О, поскольку °gab является решением вакуумных уравнений Эйнштейна. Уравнение (7.5.9) выражает RacW в удобном виде для взятия производной RacW = (dRac(А)/(1А)|а=о по Л при Л = 0. Из определения CcabW следует, что эта величина равна нулю при Л = 0, и по этой причине слагаемые квадратичные по Ссаь не дают вклада в Rac- Таким образом, получаем Дас = -2%С66]С, (7.5.10) где Саб = dCcab dA Из уравнения (7.5.7) находим, что (7.5.11) А=0 С°аЬ = \ V" {Ч,7Ь<* + °Vb1ad ~ °Vrf7ab} , (7.5.12) где .. _ <*ёаЬ 1аЬ~ dA (7.5.13) А=0 и было использовано °Va(0&c) = 0- Подставляя (7.5.12) в (7.5.10) получаем следующее линеаризованное уравнение Эйнштейна для fab- 0 = Rac = -I Vd0Va°Vc76d - »Vd0V6°Vd7ac + Vd°V6°V(c7a)d. (7.5.14) Поскольку все величины, за исключением 7аб> используют теперь только фоновую метрику °gab, далее мы не пишем нуль у фоновой метрики и ее оператора производной, а для опускания и поднимания индексов будем использовать фоновую метрику gab и обратную к ней g*b. В этих обозначениях уравнение (7.5.14) принимает вид 0 = "5VaVc7 - \vbVb4ac + VbV(c7a)6, (7.5.15) где 7 = 7aa = 5a67a6- Заметим, что уравнение (7.5.15) находится в согласии с уравнением (4.4.4) в специальном случае пространства Минковского, т.е. при gab = rjab и Va = da. Уравнение (7.5.15) можно упростить подходящим выбором калибровки. В конце разд. С.2 прилож. С показано, что величины 7аб и 7аЬ + 2V(at7fc) представляют собой одно и то же возмущение, где va - произвольное векторное поле. Так же как и в специальном случае возмущений пространства-времени Минковского разд. 4.4, можно решить
7.5. Возмущения 267 волновое уравнение в искривленном пространстве-времени (теорема 10.1.2 гл. 10) VbVbva + дЛь = -V67ab, (7.5.16) где lab = lab - 2&Ь7, (7.5.17) и, таким образом, можно положить Vb7a6 = 0. (7.5.18) В этой калибровке след уравнения (7.5.15) дает VaVa7 = 0. (7.5.19) Следовательно, можно использовать дополнительную калибровочную свободу 7аб —► lab + 2V\aWb) с условием VbVbWa + RabWb = 0, чтобы удовлетворить условиям на начальные значения (4.4.34а) и (4.4.34Ь) в искривленном пространстве-времени, из которых по теореме 10.1.2 получаем 7 = 0 во всем пространстве-времени. Таким образом, для произвольного вакуумного возмущения 7аЬ произвольного вакуумного решения gab всегда можно выбрать поперечную бесследовую калибровку, в которой Va7a6 = 0, 7 = 0. (7.5.20) Однако в общем случае не существует аналога радиационных калибровочных условий 70д = 0, (/х = 1,2,3), использованных для возмущений в плоском пространстве-времени, где есть возможность удовлетворить (7.5.20). Из свойств тензора Римана имеем VbV(c7a)b = V(cV67a)b + R\ca)dldb + Д\с|6|\)<* = = V(cV67a)6 + flbcad7d6, (7.5.21) где во второй строке мы использовали, что Rbca idb симметрично по с и а, и Rcd = Rbcb = 0, поскольку gab - вакуумное решение. Таким образом, в поперечно-бесследовой калибровке, задаваемой (7.5.20), линеаризованные уравнения Эйнштейна имеют простой вид VbV67ac - 2Rbcadldb = 0. (7.5.22)
268 Глава 7. Методы решения уравнений Эйнштейна Имеется замечательная аналогия этого уравнения с уравнением Максвелла (4.3.15) в калибровке Лоренца. Несмотря на простую форму уравнения (7.5.22), необходимо помнить, что, за исключением плоской фоновой метрики, уравнение (7.5.22) представляет собой очень сложную систему связанных дифференциальных уравнений в частных производных. Успешный анализ возмущений сделан только в нескольких случаях, в которых фоновая метрика или имеет множество симметрии, или обладает упрощающими свойствами. Но даже в этих случаях результаты были получены не с помощью прямого интегрирования уравнений (7.5.22) или (7.5.15). Линеаризационная стабильность вакуумных уравнений Эйнштейна, т.е. существование однопараметрического семейства точных решений, соответствующих решению линеаризованного уравнения, подробно изучена (Fisher, Marsden 1979). Если фоновое пространство-время (M,ga6) является "замкнутым", т.е. если оно обладает компактной про- странственноподобной гиперповерхностью Коши Е (гл. 8), то уравнения Эйнштейна линеаризационно стабильны относительно (M,ga6) тогда и только тогда, когда (M,gab) не обладают векторным полем Киллинга. Если (M,gab) обладает полем Киллинга, то чтобы одно- параметрическое семейство gabW существовало, необходимо, чтобы lab удовлетворяли интегральным (второго порядка) условиям связи, в которых используются векторы Киллинга. С другой стороны, полагают, что линеаризационная стабильность выполняется для асимптотически плоских возмущений всех асимптотически плоских фоновых пространств (даже если имеется поле Киллинга), хотя это было доказано только для плоского фона. Задачи 1. Доказать прямым вычислением, что £>фШа = 0 (см. (7.1.10)), не используя аргументы, данные в тексте, т.е. доказать вначале, что £tl>£abcd = 0, а затем использовать только то, что £ф£а = 0 и формулы при лож. С. 2. Вывести уравнения Эйнштейна (7.1.24)-(7.1.27) для метрики (7.1.22). 3. Для стационарной аксиально-симметричной метрики в форме (7.1.17) определим локально невращающихся наблюдателей как семейство наблюдателей, которые находятся в "покое" по отно-
7.5. Возмущения 269 шению к гиперповерхности t = const, т.е. чьи 4-скорости иа пропорциональны V°£. (a) Показать, что момент количества движения L таких наблюдателей равен нулю, где L определяется соотношением L = иафа (см. (6.3.13)). (b) Показать, что такие наблюдатели вращаются с координатной угловой скоростью дф/dt = —W/X. Поскольку в общем случае метрика (7.1.17) представляет собой внешнее поле стационарного аксиально-симметричного вращающегося тела (или черной дыры), можно интерпретировать d0/d£ как "увлечение инерциальной системы" , производимое вращающейся материей в соответствии с принципом Маха. 4. Поскольку любая изометрия ф оставляет тензор Вейля инвариантным, ф*Cabcd = Cabcd, тогда, если ка является главным нулевым вектором, то ф*ка тоже является таковым. Поскольку в каждой точке существует только дискретный набор главных нулевых векторов, то, если ф% является гладкой однопарамет- рической группой изометрий, которая оставляет точку р е М фиксированной, тогда ф* должны оставлять инвариантными все главные направления в р. Используйте этот факт для того, чтобы доказать следующие результаты (без вычисления Cabcd и его главных нулевых направлений): (a) Каждое сферически симметричное пространство-время является алгебраически специальным. Более того, каждое статическое сферически симметричное пространство-время (6.1.5) является алгебраическим типом П-П. (b) Пространства Робертсона-Уокера (5.1.11) являются конформно ПЛОСКИМИ: Cabcd = 0. 5. Вывести уравнение (7.4.8).
Глава 8 Причинная структура Причинная структура пространства-времени в специальной теории относительности кратко уже описана в разд. 1.2. С каждым событием р пространства-времени связан световой конус (см. рис. 1.2). Одну половину конуса будем называть "будущее", а другую - "прошлое". События, лежащие во внутренней области светового конуса будущего, представляют собой события, которых может достичь частица, начинающая движение из точки р. Вся эта область составляет "хронологическое будущее" события р. Хронологическое будущее р вместе с событиями, лежащими непосредственно на конусе, составляют "причинное будущее" р. Это события, на которые в принципе может повлиять сигнал, испущенный из р. В общей теории относительности причинная структура пространства-времени локально имеет такую же качественную природу, как и в плоском пространстве-времени специальной теории относительности. Однако вследствие нетривиальной топологии пространственно- временных сингулярностей или же "изменения" направления светового конуса при перемещении от точки к точке могут появиться существенные глобальные отличия. В данной главе мы приведем определения и основные результаты, касающиеся причинной структуры пространства-времени в общей теории относительности. Эти результаты представляют интерес не только сами по себе, но и являются существенной частью доказательства теорем о сингулярностях, которые мы обсудим в следующей главе. Имеются книги и статьи, посвященные причинной структуре (Hawking, Ellis 1973; Penrose 1972; Geroch 1970b), основная часть обсуждаемого здесь материала основана на этих работах. В разд. 8.1 даются определения хронологического и причинного будущего в общей теории относительности и выводятся некоторые их свойства. Условия того, что пространство-время "ведет себя причинно хорошо" обсуждаются в разд. 8.2. Наконец, в разд. 8.3 определяются понятия областей зависимости и глобальной гиперболичности, а также выводятся многочисленные свойства глобально гиперболических пространств. Результаты, полученные в этой главе, существенно зависят от аппарата теории топологических пространств, основные положения которого изложены в прилож. А. Предполагается, что читатель уже прочитал это приложение или будет к нему обращаться в процессе чтения.
272 Глава 8. Причинная структура В этой главе будут обсуждаться произвольные пространства-времена (M,ga6), т.е. выполнения уравнений Эйнштейна для метрики gab не требуется. Некоторые примеры могут показаться искусственными, поскольку они конструируются с помощью удаления точек и/или топологического отождествления в пространстве-времени Минковского. Тем не менее они дают прекрасные иллюстрации характеру явлений, которые могут происходить в более естественных моделях пространства-времени в рамках общей теории относительности. 8.1 Будущее и прошлое: определения и результаты Пусть (M,gab) - пространство-время. Касательное пространство Vp в каждой точке (событии) р Е М изоморфно пространству-времени Минковского. Назовем световой конус, проходящий через начало Vp, световым конусом в точке р. Этим мы подчеркиваем, что световой конус в точке р является подмножеством Vp, а не М1. Как и в специальной теории относительности, одну половину светового конуса в точке р Е М можно называть "будущее", а другую - "прошлое". Однако в неодносвязных2 пространствах может случиться так, что невозможно разделить "прошлое" и "будущее" для любой точки р из М. Пример такого пространства, для которого невозможно сделать непрерывное разделение, показан на рис. 8.1. Говорят, что пространство-время (М, gab) является ориентируемым во времени, если такое разделение можно сделать. (Это свойство пространства-времени аналогично, но в то же время и отлично от понятия ориентируемости многообразия, определенного в прилож. В.2.) Таким образом, неориентируемые во времени пространства-времена имеют патологические свойства, потому что в этом случае мы не можем непротиворечиво различить понятия "вперед по времени" и "назад по времени". Далее мы будем рассматривать только ориентируемые во времени пространства-времена и будем предполагать, что в каждой точке уже сделано разделение светового конуса на половинки "будущее" и "прошлое". Временипо- добный или нулевой вектор, лежащий в половине "будущее" светового конуса, будем называть направленным в будущее. 1 Необходимо подчеркнуть, что некоторые авторы используют термин "световой конус" для подмножества М, порожденного нулевыми геодезическими, проходящими через р (фактически мы использовали такое определение в гл. 1). Название "нулевой конус" используется для обозначения того, что мы называем "световой конус". 2См. гл. 13 для определения неодносвязных многообразий.
8.1. Будущее и прошлое: определения и результаты 273 < отождествить > ^ 00 % Рис. 8.1. Неориентируемое во времени пространство-время Следующая лемма выражает важное свойство любого ориентированного во времени пространства-времени. Лемма 8.1.1. Пусть (M,gab) ориентируемо во времени. Тогда существует (не единственное) гладкое не обращающееся в нуль време- ниподобное векторное поле ta на М. Доказательство. Поскольку М паракомпактно, можно выбрать гладкую риманову метрику каь на М (см. прилож. А). В каждой точке р € М существует единственный направленный в будущее временипо- добный вектор ta, который минимизирует величину gabvavb для векторов г>а, удовлетворяющих условию kabVavb = 1. Этот вектор ta будет гладко изменяться на М и будет представлять собой искомое векторное поле. □ Наоборот, если можно выбрать непрерывное времениподобное векторное поле, тогда (M,go6) является ориентируемым во времени. Пусть (M,ga6) - ориентированное во времени пространство-время. Говорят, что дифференцируемая кривая \{t) является времениподоб- ной направленной в будущее кривой, если в каждой точке р € А касательный вектор ta является направленным в будущее времениподоб- ным вектором. Подчеркнем, что в соответствии с этим определением, если ta равен нулю в одной точке, то А не является времениподобной кривой3. Аналогично говорят, что А является направленной в будущее причинной кривой, если в каждой точке р € А, вектор ta является направленным в будущее времениподобным или нулевым вектором. 3Условие строгой времениподобности вектора ta налагается для того, чтобы кривая \(t) = p для всех t не являлась времениподобной. Подчеркнем, что это делает понятие дифференцируемой времениподобной кривой зависящим от параметризации. Ниже мы определим не зависящее от параметризации понятие непрерывной, направленной в будущее времениподобной кривой.
274 Глава 8. Причинная структура Таким образом, на причинной кривой ta может обращаться в нуль. Аналогичные определения применяются для направленных в прошлое времениподобных или причинных кривых. Хронологическое будущее точки р Е М, обозначаемое как /+(р), определяется как множество событий, которые могут быть достигнуты посредством направленной в будущее времениподобной кривой, начинающейся в точке р I+(p) = {q e М|существует направленная в будущее времениподобная кривая \(t) : А(0) = р, Л(1) = q}. (8.1.1) Поскольку всегда можно сделать достаточно малые смещения конечной точки времениподобной кривой, сохраняя ее времениподобную природу, то для любой точки q € 1+(р) существует открытая окрестность О точки q, такая, что О С /+(р). (Формальное доказательство этого положения можно сделать, используя теорему 8.1.2.) Таким образом, /+(р) всегда является некоторым открытым подмножеством М. Заметим, что в общем случае р £ 1+(р)- Это имеет место, если существует замкнутая времениподобная кривая, начинающаяся и заканчивающаяся в р. Для любого подмножества S С М определим /+(5) выражением I+(S) = (J 1+(р). (8.1.2) pes Поскольку объединение открытых множеств открыто, то /+ (5) всегда является открытым множеством. Имеем также I~*~[I+(S)] = I+(S) и /+(5) = /+(5), где S обозначает замыкание S (см. задачу 1). Аналогичные определения и свойства относятся и к хронологическому прошлому 1~(р) и /~(5). Причинное будущее р € М, обозначаемое J+(p), определяется так, же как и /+(р), за исключением того, что в (8.1.1) "направленная в будущее времениподобная кривая" заменяется на "направленная в будущее причинная кривая". Таким образом, всегда р Е </+(р). В плоском пространстве-времени */+(р) является замкнутым подмножеством. Однако в общем случае J+(p) может и не быть замкнутым. Пример такого пространства-времени приведен на рис. 8.2. В разд. 8.3 мы докажем, что J+(p) замкнуто в глобально гиперболическом пространстве- времени. Определим J+(S) = [J J+(p) (8.1.3) pes и аналогично причинное прошлое J~(p) и J~(S).A 4 В некоторых работах используются обозначения р-<-<дир-<<7 соответственно
8.1. Будущее и прошлое: определения и результаты 275 / q ^(удалить точку) р Рис. 8.2. Пространство Минковского с удаленной точкой на световом конусе будущего точки р. В этом пространстве-времени не существует причинной кривой, соединяющей р и q, и поэтому q & J+(p), но q G J*(p)- Таким образом, J+(p) не замкнуто В пространстве Минковского i4" (р) состоит только из тех точек, которые могут быть достигнуты направленными в будущее геодезическими, начинающимися в р. Граница /+(р) множества 1+(р) создается направленными в будущее нулевыми геодезическими, начинающимися в р. В произвольном пространстве-времени ни одно из этих утверждений в общем случае не выполняется. Это показано на рис. 8.2 как простейший пример пространства-времени, полученного из пространства- времени Минковского путем удаления точек. Но все же локально эти свойства всегда остаются справедливыми, что выражается следующей теоремой. Теорема 8.1.2. Пусть (M,gab) является произвольным пространством-временем, up € М. Тогда существует выпуклая нормальная окрестностьр, т.е. открытое мноэюество U cp eU, такое, что для всех q,r e U существует единственная геодезическая 7, соединяющая q иг и леэюащая в U. Более того, для любого U мноэюество 1+(р) П U состоит из всех точек, достигаемых направленными в будущее геодезическими, начинающимися ври лежащими внутри U, а /+(р) DU создается направленными в будущее нулевыми геодезическими в U, выходящими из р. Хотя теорема 8.1.2 интуитивно может показаться очевидной, формальное доказательство ее нетривиально, отсылаем читателя к списку литературы (Hicks 1965 р. 134; Hawking, Ellis 1973 prop.4.5.1). Для q £ /+(р) и q € J+(p).
276 Глава 8. Причинная структура Если q G «/+(р), и Л является причинной кривой, начинающейся ври заканчивающейся в д, то А можно покрыть выпуклыми нормальными окрестностями и, используя компактность Л (поскольку она получается непрерывным отображением замкнутого интервала), можно выделить конечное подпокрытие (см. прилож. А). Если в любой из таких окрестностей кривая Л перестает быть нулевой геодезической, тогда с помощью теоремы 8.1.2 можно деформировать ее в этой окрестности во времениподобную кривую и затем распространить эту деформацию на другие окрестности для того, чтобы получить времениподобную кривую из р в q. Таким образом, получаем следующее следствие теоремы 8.1.2, которое будет усилено теоремой 9.3.8 в гл. 9. Следствие. Если q € J+{p) — 1+(р), тогда любая причинная кривая, соединяющая р и q, должна быть нулевой геодезической. Используя аналогичные аргументы, можно увидеть, что для любого набора S С М имеем J+(S) С /+(5). Поскольку ясно, что /+(5) С С J+(S), то получаем J+(S) = I+(S). Аналогично имеем /+(5) = = int[J+(5)] и, следовательно, границы хронологического и причинного будущего всегда равны /+(5) = J+(S) (см. задачу 2). Говорят, что подмножество S С М является ахрональным, если не существуют p,q € S такие, что q € /+(р), т.е. если I+(S) П S = 0, где 0 обозначает пустое множество. Следующая теорема утверждает, что граница хронологического будущего любого подмножества пространства Минковского всегда является "хорошо определенной" трехмерной ахрональной поверхностью. Теорема 8.1.3. Пусть (M,ga6) является ориентируемым во времени пространством-временем, и S С М. Тогда I+(S) (если это непустое множество) является ахрональным трехмерным вложенным С0-подмногообразием М. Доказательство. Пусть q € I+{S). Если р Е /+(5), тогда q € 1~(р) и, поскольку 1~(р) является открытым множеством, некоторая открытая окрестность О точки q содержится в 1~(р), как показано на рис. 8.3. Поскольку q находится на границе /+(5), имеем О П I+(S) ф 0, и поэтому ре /+[0 П /+(5)] С I+(S). Это доказывает, что I+(q) С I+(S). Аналогично получаем I~(q) С М — /+ (5). Если /+(5) не является ахрональным, можно найти q,r € /+(5) такие, что г € I+{q), и следовательно г G /+(5). Однако это невозможно, поскольку I+(S) является открытым множеством и, таким образом, I+(S) П I+{S) = 0. Это доказывает, что /+(5) является ахрональным. Для того, чтобы получить структуру многообразия /+(5), мы определяем римановы нормальные координаты x°,xl,x2,xz в точке q € I+(S) и рассматриваем
8.1. Будущее и прошлое: определения и результаты 277 Рис. 8.3. Пространственно-временная диаграмма, показывающая множество 5 и его границу в будущем /+(S) в теореме 8.1.3 достаточно малую окрестность q такую, что вектор (д/дх°)а всюду времениподобен, и каждая из интегральных кривых с направляющим вектором (д/дх°)а входит в I+(q) С /+(S) и I~(q) CM- /+(5). Но это предполагает, что каждая такая интегральная кривая пересекает /+(5), и поскольку /+(5) является ахрональным, то в пересечении должна быть только одна точка. Таким образом, в каждой такой окрестности мы имеем взаимно однозначную связь точек /+(5) с координатами (я1, я2, ж3), характеризующими интегральную кривую вектора (д/дх°)а. Более того, из ахрональности /+(5) очевидно, что координата х° в точке пересечения должна быть непрерывной функцией (фактически функцией класса С1"")5, координат (ж1, ж2, а;3), и отмеченное выше отображение окрестности q в /+(5) в R3 является гомоморфизмом в индуцированной на I+(S) топологии. Повторяя эту конструкцию для всех q G /+(5), получаем семейство С0 согласованных карт, покрывающих I+(S), что делает I+(S) некоторым вложенным подмногообразием. □ Прежде чем двигаться дальше, необходимо ввести несколько понятий, которые будут играть важную роль в рассуждениях этой главы и гл. 9. Хотя для многих задач достаточно рассматривать только дифференцируемые (даже С°°) кривые, все же лучше расширить рассмотрение на непрерывные кривые, когда приходится брать пределы (как мы будем делать далее). Определения времениподобной или причинной кривых можно расширить до случая непрерывных кривых, требуя, чтобы пары точек на кривой можно было локально соединить соответственно дифференцируемой времениподобной или причинной кривыми. Более точно, говорят, что непрерывная кривая А является направленной в будущее (или причинной) кривой, если для каждой точки р € А существует выпуклая нормальная окрестность U точки р такая, что при А(^),А(^2) € Е/, *i < £2 существует направленная 5(Hawking, Ellis 1973).
278 Глава 8. Причинная структура в будущее дифференцируемая времениподобная (или, соответственно, причинная) кривая в U из X(t\) в Л(^). Ясно, что времениподобная или причинная природа непрерывной кривой не изменяется при непрерывной, взаимно однозначной репараметризации, и в дальнейшем мы будем полагать эквивалентными две кривые, различающиеся такой ре- параметризацией . Далее мы определяем понятие продолжаемости непрерывной кривой. Необходимо отчетливо различать то, что кривая "убегает на бесконечность", "всегда бежит вокруг" или "движется в сингулярность" от того, что кривая где-то "останавливается" просто потому, что мы не определили ее движение дальше. Это различие можно точно сформулировать, используя понятие конечной точки кривой. Пусть X(t) является направленной в будущее причинной кривой. Мы говорим, что точка р е М является конечной точкой в будущем кривой А, если для любой окрестности О точки р существует to такое, что X(t) Е О для всех t > to. (Таким образом, вследствие хаусдорфовости М, кривая А может иметь по крайней мере одну конечную точку в будущем. Подчеркнем также, что конечная точка не обязательно лежит на кривой, т.е. нет необходимости в существовании такого t, что X(t) = р.) Говорят, что кривая А непродолжаема в будущее, если она не имеет конечных точек в будущем. Непродолжаемость в прошлое определяется аналогично. Подчеркнем, что если А является дифференцируемой причинной кривой с конечной точкой р в будущем, то может быть невозможным продолжение А за р как дифференцируемой причинной кривой, но А всегда можно продолжить как непрерывную причинную кривую, добавляя непрерывную причинную кривую к А в точке р. Имеется следующая важная техническая лемма, относящаяся к продолжаемости причинных кривых. Лемма 8.1.4. Пусть А является непродолжаемой в прошлое причинной кривой, проходящей через точку р. Тогда существует непро- должаемая в прошлое кривая 7> проходящая через любую точку q E /+(р) такая, что 7 £ ^+(А). Доказательство. Без потери общности можно предположить, что значения параметра t кривой А лежат в области [0, оо). Выбираем произвольную риманову метрику на М (Geroch 1970b). Используя теорему 8.1.2, можно сконструировать времениподобную кривую j(t) при t £ [0,1], которая начинается в q и удовлетворяет свойствам: 7 С /+(А) и d[^(t), А(£')] < const/(l -hi), где if € [0,1]. Расстояние d[a,b] - это наибольшая нижняя граница длины всех кривых (измеренной с помощью римановой метрики), соединяющих точки а и Ь. По индукции можно
8.1» Будущее и прошлое: определения и результаты 279 непрерывно продолжить y(t) до кривой, определенной при t £ [0,n] для любого п (т.е. для t £ [0, оо)), сохраняя эти свойства. Полученная кривая 7 будет непродолжаема в прошлое, поскольку любая конечная точка 7 была бы конечной точкой и Л. Таким образом, 7 является требуемой кривой. □ Другим понятием, играющим значительную роль в этой главе и гл. 9, является сходимость причинных кривых. Пусть {Ап} - последовательность причинных кривых. Говорят, что точка р G М является точкой сходимости последовательности {Ап}, если для любой открытой окрестности О точки р существует такое iV, что ХпГ\0 ф 0 для всех п > N. Говорят, что кривая А является кривой сходимости последовательности {Ап}, если каждая точка р е X является точкой схождения. Аналогично говорят, что точка р является предельной точкой последовательности {Ап}, если каждую открытую окрестность р пересекает бесконечно много Ап. Говорят, что кривая А является предельной кривой последовательности {Ап}, если существует подпоследовательность {AJJ, для которой А является кривой сходимости. (Таким образом, если А является предельной кривой, тогда каждая точка р € А является предельной точкой. Подчеркнем, однако, что кривая 7» каждая точка которой (р Е 7) является предельной точкой, не обязана быть предельной кривой.) Следующий результат играет ключевую роль во многих последующих доказательствах. Лемма 8.1.5. Пусть {Хп} является последовательностью непро- должаемых в будущее причинных кривых, которые имеют предельную точку р. Тогда существует непродолжаемая в будущее причинная кривая А, проходящая через р, которая является предельной кривой последовательности {Ап}. Доказательство. (Набросок, см. (Hawking, Ellis 1973).) Выбираем выпуклую нормальную окрестность точки р и шар, имеющий в нормальных римановых координатах точки р радиус R и содержащий в себе эту окрестность. Мы выбираем подпоследовательность последовательности {Ап}, сходящуюся к р и, используя компактность координатной сферы радиуса Д, подподпоследовательность, которая сходится к какой-либо точке на этой сфере. Затем рассматриваем последовательно все координатные сферы, чьи радиусы являются частью, лежащей в интервале от 0 до 1, радиуса R и предельные точки, лежащие на этих сферах, которые являются подпоследовательностями, сходящимися к этим точкам. Далее берем замыкание этого набора предельных точек и показываем, что такая процедура определяет непрерывную причинную предельную кривую А. Затем возвращаемся к конечной
280 Глава 8. Причинная структура Рис. 8.4. Пространственно-временная диаграмма, показывающая последовательность точек в 1+(С), сходящуюся кр€ /+(С) в теореме 8.1.6 точке кривой Л, лежащей на сфере радиуса Д, и повторяем процедуру. Действуя таким образом мы неограниченно продолжаем кривую Л.6 □ Необходимо подчеркнуть, если каждая Ап в лемме 8.1.5 является времениподобной кривой, то предельная кривая А может быть только причинной кривой, т.е. последовательность времениподобных кривых сходится к нулевой кривой. Подобным образом, даже если все Ап являются гладкими кривыми, кривая А может быть только непрерывной. Непосредственным применением доказанной леммы является теорема, характеризующая природу границ различного типа хронологического будущего. Теорема 8.1.6. Пусть С является замкнутым подмножеством пространственно-временного многообразия М. Тогда каждая точка р € 1+(С) и р £ С лежит на нулевой геодезической А, которая находится внутри 1+{С) и либо является непродолжаемой в прошлое, либо имеет конечную точку в прошлом на С. Доказательство. Выберем последовательность точек {qn} в /+(С), которая сходится к р, как показано на рис. 8.4. Пусть для каждой точки qn кривая Ап является направленной в прошлое времениподобной кривой, соединяющей qn с точкой на С. Рассмотрим далее новое 6Необходимо подчеркнуть, что используемые рассуждения показывают существование продолжаемой предельной кривой, проходящей через р, а также то, что какая-либо продолжаемая предельная кривая может быть далее продолжена в качестве предельной кривой. Для того, чтобы доказать существование непродолжаемой предельной кривой (т.е. максимального элемента в наборе предельных кривых, получаемых процедурой присоединения), необходимо использовать лемму Цорна. Однако доказательство леммы 8.1.5 можно сделать, не привлекая лемму Цорна.
8.2. Условия причинности 281 Рис. 8.5. Пространственно-временная диаграмма двумерного плоского пространства-времени с топологией R x 51. Нулевая геодезическая /+(р) имеет будущую конечную точку q пространственно-временное многообразие М — С, получаемое удалением множества С. (Здесь используется условие замкнутости С. В противном случае М — С не является многообразием.) На М — С каждая Лп является непродолжаемой в прошлое кривой, и р представляет собой предельную точку последовательности {Лп}. Следовательно по лемме 8.1.5 существует непродолжаемая в прошлое причинная кривая Л, проходящая через р. Каждая точка кривой Л является предельной точкой последовательности в /+(С), и поэтому Л С /+(С). С другой стороны, если какие-либо точки кривой Л были в /+(С), тогда по следствию теоремы 8.1.2 мы могли бы иметь р Е /+(С), поскольку р можно было бы соединить с С причинной кривой, не являющейся нулевой геодезической. Это противоречит тому, что р £ 1+(С). Таким образом, Л € 1+(С). Более того, ахрональность /+(С) (теорема 8.1.3 вместе со следствием теоремы 8.1.2) предполагает, что Л должна являться нулевой геодезической. Наконец, поскольку Л является непродолжаемой в прошлое кривой в М — С, то в М она должна либо оставаться непродолжаемой в прошлое, либо иметь конечную точку в прошлом на С. □ Пример кривой Л, проходящей через точку q и непродолжаемой в прошлое показан на рис. 8.2. Заметим, что хотя кривая А не может изменить конечной точки, кроме точки на С, она может иметь конечную точку в будущем. Пример такой кривой Л показан на рис. 8.5. 8,2 Условия причинности В этом разделе мы кратко обсудим различные формулировки того, что пространство-время "причинно хорошо себя ведет". Хотя в соответствии с теоремой 8.1.2 все пространства-времена в рамках об-
282 Глава 8. Причинная структура отождествить ррГ Рис. 8.6. Пространство-время Минковского с отождествленными гиперповерхностями t = 0 и t = 1. Показана замкнутая времен и подобная кривая, проходящая через точку р щей теории относительности локально имеют качественно одинаковую причинную структуру, такую же как в специальной теории относительности, глобально они могут иметь существенное различие. Например, можно сконструировать (плоское) пространство-время с топологией S1 х R3 отождествлением гиперповерхностей t = 0 и t = 1 пространства-времени Минковского, как показано на рис. 8.6. Интегральными кривыми векторного поля (d/dt)a в этом пространстве являются замкнутые времениподобные кривые, и нетрудно видеть, что для всех р £ М имеем /+(р) = 1~(р) = М. Таким образом, в этом пространстве-времени наблюдатель по "своему желанию" может без труда переделывать события прошлого. Кроме того в пространствах-временах с нетривиальными замкнутыми причинными кривыми (т.е. замкнутыми причинными кривыми, отличными от тривиальной кривой \{t) = р, для всех t) могут существовать строгие условия устойчивости решений уравнений, описывающих распространение физических полей. Подчеркнем, что существование пространств с замкнутыми причинными кривыми нельзя отрицать, основываясь на "искусственных" топологических отождествлениях, таких как на рис. 8.6, поскольку легко сконструировать примеры с топологией R4, просто "скручивая" световые конусы, как показано на рис. 8.7. Существует убеждение, что пространства-времена с нетривиальными замкнутыми причинными кривыми являются физически нереальными. Однако, даже если пространство-время не обладает замкнутыми причинными кривыми, оно может быть "на грани" нарушения причинности, как показано на рис. 8.8. В этом примере существуют причинные кривые, которые проходят "бесконечно близко" к самим себе, тем не менее не пересекая себя. Поскольку произвольно малое возмущение метрики такого пространства-времени может нарушить причин- гл
8.2. Условия причинности 283 Рис. 8.7. Пространство-время с топологией R4, в котором световые конусы "опрокидываются" настолько, чтобы могли существовать замкнутые времени- подобные кривые ность, такие пространства-времена представляются физически нереальными. Математическое обоснование существования пространств- времен таких, как показано на рис. 8.8, часто появляется в доказательствах теорем, касающихся глобальной структуры пространств-времен, и поэтому очень важно сформулировать точные условия, которые характеризуют поведение причинных кривых указанного типа. удалить точку Рис. 8.8. Пространство-время, нарушающее сильную причинность. Световые конусы "опрокидываются" настолько, чтобы кривая, проходящая через р, стала нулевой геодезической (которая, однако, не является замкнутой кривой, поскольку из многообразия удалена одна точка). В этом пространстве-времен и не существует замкнутых причинных кривых, но все же существуют причинные кривые, проходящие через р, которые проходят "бесконечно близко" к самим себе Одной из таких характеристик является сильное условие причинности. Говорят, что пространство-время (M,ga6) является сильно причинным, если для всех р € М и любой окрестности О точки р существует окрестность V точки р, содержащаяся в О такая, что не существует причинной кривой, пересекающей V более одного раза. Таким образом, если пространство-время нарушает условие сильной причинности в р, то в окрестности р существуют причинные кривые, которые проходят бесконечно близко к самим себе.
284 Глава 8. Причинная структура В таком пространстве-времени замкнутые причинные кривые могут быть получены при малых деформациях метрики gab в произвольной малой окрестности точки р. В примере, изображенном на рис. 8.8, условие сильной причинности нарушается в каждом событии р. Полезное следствие сильной причинности выражает следующая лемма. Лемма 8.2.1.Пусть (M,gab) является сильно причинным и пусть К С М компактно. Тогда каждая причинная кривая А, содержащаяся в К, должна иметь в К конечные точки в прошлом и будущем. Доказательство. Без потери общности можно предположить, что параметр t кривой Л пробегает значения от —оо до +оо. Пусть {U} представляет собой возрастающую последовательность чисел, стремящихся к бесконечности, и пусть Pi = \{U). Поскольку {pi} является последовательностью в К, тогда по теореме Больцано-Вейерштрасса (А.9 прилож. А) она имеет предельную точку р Е К. Предположим, что возможно найти открытую окрестность О точки р такую, что не существует £о € К такого, что X(t) Е О для всех t > to. Тогда тоже самое должно выполняться для любой открытой окрестности V С О. Это означает, что А пересекает каждую такую окрестность V более одного раза, поскольку бесконечно много точек последовательности {X(U)} входят в V, но X(t) никогда не остается в V. Это противоречит предположению сильной причинности в р. Таким образом, р является будущей конечной точкой А. Аналогично доказывается то, что прошлая конечная точка q Е К кривой А также существует. □ Хотя наложение условия сильной причинности исключает пример пространства-времени, изображенного на рис. 8.8, можно сконструировать более сложные примеры, в которых сильная причинность выполняется, но деформация gab в бесконечно малой окрестности двух или более точек приводит к появлению замкнутых причинных кривых. Таким образом, сильная причинность не полностью выражает условие того, что мы не находимся на грани нарушения причинности. Однако такое условие удовлетворительно выражается более сильным понятием устойчивой причинности, определенным ниже. Пусть ta является времениподобным вектором в точке ре М. Определим gob в точке р соотношением 8аЬ = 8аЬ-Ыь, (8.2.1) где gab - метрика пространства-времени. Легко видеть, что go6 в точке р тоже имеет лоренцеву сигнатуру. Более того, световой конус в
8.2. Условия причинности 285 метрике gafe строго больше, чем в метрике gab, т.е. каждый времени- подобный и нулевой векторы в gab являются времениподобными векторами в ga6. Если пространство-время было "на грани" того, чтобы появились замкнутые причинные кривые, то, разворачивая световой конус в каждой точке, можно было бы получить замкнутые времени- подобные кривые. Это наводит на определение "устойчиво причинного" пространства-времени (M,gab) как такого, в котором существует непрерывное не обращающееся в нуль векторное поле ta такое, что пространство-время (M,gab) (где ga6 определяется формулой (8.2.1)) не имеет замкнутых времениподобных кривых. Следующая теорема показывает, что устойчивая причинность эквивалентна существованию "глобальной функции времени" на пространстве-времени. Это весьма усиливает предположение, что требования устойчивой причинности достаточно для исключения каких-либо патологий. Теорема 8.2.2. Пространство-время (M,gab) является устойчиво причинным тогда и только тогда, когда существует дифференцируемая функция f на М такая, что Va/ - направленное в прошлое времениподобное векторное поле. Доказательство. Достаточность. Поскольку Va/ является направленным в прошлое векторным полем, то вдоль каждой направленной в будущее кривой с касательным вектором va имеем gabvaVbf > О, и, таким образом, v(f) > 0. Следовательно / строго возрастает вдоль каждой направленной в будущее времениподобной кривой. Тогда ясно, что не может быть замкнутых времениподобных кривых на (M,ga6), поскольку / не может возвратиться к своему первоначальному значению. Положим далее ta = Va/ и определим метрику go6 уравнением (8.2.1). Легко проверить, что обратная к ga6 метрика имеет следующий вид: ^6 = ^ + *а*7(1-'%) Таким образом, получаем TbVafVbf = tata + {tata)2/(l - tctc) = tata/(l - tctc) < 0, (8.2.3) где все индексы в правых частях уравнений (8.2.2)-(8.2.3) поднимаются и опускаются с помощью gab и ^ъ. Следовательно g° Vfe/ является времениподобным вектором в метрике ga6. Используя далее те же самые аргументы, как было сделано выше, получаем, что не существует замкнутых времениподобных кривых в пространстве-времени (M,ga6). Таким образом, (M,ga6) является устойчиво причинным. (8.2.2)
286 Глава 8. Причинная структура Необходимость (набросок), см. (Hawking, Ellis 1973). Имеем устойчиво причинное (М, gab). Требуется сконструировать глобальную функцию времени. Подходящего кандидата можно получить следующим образом. Используя паракомпактность М и рассуждения, аналогичные изложенным в конце прилож. А, можно показать, что всегда можно определить непрерывную меру объема [J, на М такую, что полный объем М конечен, ц[М] < оо. Определим F(p)=/x[/-(p)]. (8.2.4) Тогда F строго возрастает вдоль всех направленных в будущее причинных кривых (с неисчезающими касательными) и, таким образом, является подходящим кандидатом для глобальной функции времени. К сожалению, F не является непрерывной. Тем не менее, для устойчиво причинных пространств можно получить непрерывную функцию, обладающую этими свойствами, усредняя F по близким пространствам с "раскрытыми" световыми конусами. Более точно, пусть ta является времениподобным векторным полем, таким, что пространство с метрикой ga6, определенной уравнением (8.2.1), не имеет замкнутых времениподобных кривых. Для значений а, лежащих в интервале О ^ a < 1, определим (ga)ab соотношением (gjab = gab ~ Ottatb, (8.2.5) а FQ(p) уравнением Fa(p) = p[I-(p)], (8.2.6) где/" (р)обозначает хронологическое прошлое точки р в метрике(ga)ab- Можно показать, что усреднение FQ no a приводит к непрерывной функции, которая строго возрастает вдоль причинных кривых. Дальнейшее "сглаживание" этой функции дает дифференцируемую функцию с требуемыми свойствами. □ Отсюда имеем следующее следствие: Следствие. Устойчивая причинность содержит в себе сильную причинность. Доказательство. Пусть / является глобальной функцией времени на М. Для заданной точки р € М и какой-либо открытой ее окрестности О можно выбрать открытую окрестность V С О точки р, имеющую такую форму, что предельная величина / вдоль каждой направленной в будущее причинной кривой, выходящей из V, больше, чем предельная величина / на каждой направленной в будущее причинной кривой, входящей в V (см. рис. 8.9). Поскольку / возрастает вдоль каждой
8.3. Области зависимости. Глобальная гиперболичность 287 Рис. 8.9. Окрестность V точки р, использованная в доказательстве следствия теоремы 8.2.2 направленной в будущее кривой, то не существует причинной кривой, которая может дважды входить в V. □ В заключение отметим, что устойчивая причинность является подходящим понятием, выражающим идею того, что пространство-время не находится "на грани" плохого причинного поведения. 8.3 Области зависимости. Глобальная гиперболичность В предыдущих разделах наше внимание было сфокусировано на множествах событий I+(S) и J~*~(S), на которые могли бы повлиять события множества 5. В этом разделе мы будем иметь дело с набором событий, которые в смысле, описанном ниже, являются "полностью детерминированными" множествами событий S (по техническим причинам мы рассмотрим замкнутое ахрональное множество). Также будем использовать свойства пространств-времен (или областей пространств-времен), в которых все события "детерминируются" подходящим множеством 5. Вначале рассмотрим важное свойство замкнутых ахрональных множеств. Для замкнутого и ахронального S определим край S (edge(5)) как множество точек р Е S таких, что каждая открытая окрестность О точки р содержит точки q € /+(р) и г £ 1~(р) и времениподобную кривую Л от г до q, которая не пересекает S (см. рис. 8.10). Нам часто будут нужны замкнутые ахрональные множества без края. (Такие наборы иногда называют срезами.) Повторяя доказательство теоремы 8.1.3, получаем следующий результат.
288 Глава 8. Причинная структура Рис. 8.10. Пространственно-временная диаграмма, иллюстрирующая определение края замкнутого ахронального множества 5 Рис. 8.11. Пространственно-временная диаграмма, показывающая область зависимости в будущем D+(S) и горизонт Коши #+(S) замкнутого ахронального множества S в пространстве-времени Минковского с удаленной точкой Теорема 8.3.1. Пусть S является (непустым) замкнутым ахро- нальным множеством с краем (S) = 0. Тогда S - трехмерное, вложенное, класса С0 подмногообразие М. Пусть далее S является замкнутым ахрональным множеством (возможно с краем). Определим будущую область зависимости 5, обозначаемую D+(S), соотношением D~*~(S) = {p Е М|каждая непродолжаемая в прошлое причинная кривая, проходящая через р, пересекает 5}. (8.3.1) Подчеркнем, что всегда S С D+(S) С J+(S), и поскольку 5 ахрональ- но, то D+(S) П I~(S) = 0. Структура множества D+(S) иллюстрируется рис. 8.11-8.12. Наше определение D+(S) находится в согласии с одними авторами (Hawking, Ellis 1973), но слегка отличается от данного другими (Penrose 1972; Geroch 1970b), которые использовали "вре- мениподобную кривую" вместо "причинной кривой". Множество D+(S) представляет интерес по той причине, что если "ничто не может двигаться быстрее света", то любой сигнал, посланный в р е D+(S), должен быть уже "зарегистрированным" в 5. Поэтому, если бы имелась информация о "начальных условиях" на
8.3. Области зависимости. Глобальная гиперболичность 289 Рис. 8.12. Пространственно-временная диаграмма, показывающая D*(S) и H+(S) замкнутого ахронального множества 5 в пространстве-времени Мин- ковского. Здесь S является "асимптотически нулевым" справа и "точно нулевым" слева. Этот пример показывает, что H+(S) может пересекать S, даже если edge(S) = 0 S, то мы могли бы предсказать, что случится в р £ D+(S). И наоборот, если р е I*{S) и р & £>+(5), тогда можно было бы послать сигнал в р, не влияющий на 5, и знание условий на 5 было бы не достаточно для определения условий в р. Эти ожидания подтверждаются анализом распространения решений гиперболических волновых уравнений, представляющих собой физические поля в искривленном пространстве-времени (гл.10). Область зависимости в прошлом множества 5, обозначаемая D~(S), определяется заменой "будущее" на "прошлое" в (8.3.1). Вновь из условий на S мы можем "предсказать в прошлом" условия во всех q £ D~(S). Полная область зависимости множества 5, обозначаемая D(S), определяется простым соотношением D(S) = D+(S) U D~(S). (8.3.2) Таким образом, D(S) представляет собой полный набор событий, для которых все условия должны быть детерминированы знанием условий на 5. Замкнутое ахрональное множество Е, для которого D(E) = М, называется поверхностью Коши. Из этого определения сразу следует, что для любой поверхности Коши Е выполняется edge(S) = 0. Поэтому по теореме 8.3.1 каждая поверхность Коши является вложенным С0 подмногообразием М. Это подтверждает использование нами термина "поверхность" для описания Е, и поскольку Е ахронально, можно под Е понимать поверхность "постоянного времени" во всей Вселенной. Говорят, что пространство-время (M,ga6) глобально гиперболично, если оно обладает поверхностью Коши Е. (Это определение отличается
290 Глава 8. Причинная структура по форме как от первоначального определения (Leray 1952), так и от более позднего варианта (Hawking, Ellis 1973), но все же все варианты эквивалентны (см. замечание в конце этой главы).) Поэтому в глобально гиперболичном пространстве-времени вся будущая и прошлая история Вселенной может быть предсказана (в будущем или в прошлом) из условий в фиксированный момент времени на поверхности Е. Наоборот, в пространстве-времени, не являющемся глобально гиперболичным, нарушается предсказуемость в том смысле, что полное знание условий в один "момент времени" может быть недостаточно для определения всей истории Вселенной. Есть основания верить, что все физически реальные пространства-времена должны быть глобально гиперболичными (см. гл. 12) (Penrose 1979). Но даже если не требовать глобальной гиперболичности, можно применять доказанные ниже для глобально гиперболичных пространств-времен теоремы к любой области вида int[i}(5)] для любого замкнутого ахронального множества S. Замыкание области зависимости в будущем множества 5, D+(S), характеризуется следующим свойством. Утверждение 8.3.2. Событие р £ D+(S) тогда и только тогда, когда каждая непродолжаемая в прошлое времениподобная кривая, проходящая через р, пересекает S. Доказательство. Если существует непродолжаемая в прошлое времениподобная кривая, проходящая через р, которая не пересекает 5, то легко видеть, что то же самое свойство должно выполняться для любой открытой окрестности О точки р. В этом случае О П D+(S) = 0 и р 0 D+(S). Наоборот, предположим, что каждая непродолжаемая в прошлое времениподобная кривая, проходящая через р, пересекает S. Тогда или р £ S С D+(S) С D+(S) или р £ I+{S). Если последнее выполняется, то выберем q £ /~(р)П/+(5) и предположим, что непродолжаемая в прошлое времениподобная причинная кривая А, проходящая через д, не пересекает S. Тогда либо (i) А остается в /+(5), либо (и) А пересекает /+(5) в точке г £ S. В любом случае мы могли бы сконструировать непродолжаемую в прошлое времениподобную кривую, выходящую из р, которая не пересекает 5. (В случае (i) используем лемму 8.1.4 для того, чтобы получить времениподобную кривую 7 С /+(А) С /+(5); в случае (ii) используем следствие теоремы 8.1.2, чтобы получить времениподобную кривую из р до г, а затем продолжим ее в прошлое.) Таким образом, для любой точки q £ I~(p)C\I+(S) имеем q £ D+ (5). Поскольку каждая открытая окрестность р £ /+ (S) пересекает I {р) П /+(5), то р £ D+(S). П
8.3. Области зависимости. Глобальная гиперболичность 291 Некоторые свойства внутренних областей D~*~(S) и D(S) можно получить из следующей леммы, доказательство которой оставим в качестве упражнения (задача 3). Лемма 8.3.3. int[D+(S)] = r[D+(S)] П I+(S) int[D(5)] = r[D+(S)] П I+[D~(S)] Из определения поверхности Коши следует, что, если Е является поверхностью Коши, то каждая непродолжаемая причинная кривая пересекает Е. Фактически имеем следующий более сильный результат. Утверждение 8.3.4. Пусть Е является поверхностью Коши, и А является непродолэюаемой причинной кривой. Тогда А пересекает Б, /+(Е) u /-(E). Доказательство. Предположим, что Л не пересекает /~(Е). По лемме 8.1.4 можно найти непродолжаемую в прошлое времениподобную кривую 7 С /+(А) С /+[Е U /+(Е)] = /+(Е). Если продолжим 7 сколь угодно далеко в будущее, она либо не пересечет Е, либо ахрональность Е нарушится. Поскольку каждая непродолжаемая причинная кривая пересекает Е, то такая кривая 7 не существует. Таким образом, А должна входить в /~(Е). Аналогично А должна входить в /+(Е). □ Пусть 5 является замкнутым ахрональным множеством. Определим горизонт Коши будущего для множества 5, обозначаемый Я+(5), следующим образом #+(S) = D+(S) ~ J-[D+(5)]. (8.3.3) Как будет далее показано более подробно (см. следствие утверждения 8.3.6), H+(S) и аналогично определенное H~(S) являются мерой того, что S не является поверхностью Коши. Примеры H+(S) показаны на рис. 8.11 и 8.12. Ясно, что Я+(5) всегда является замкнутым, по- скольку оно является пересечением двух замкнутых множеств D+(S) и М - I~[D+(S)]. Более того, имеем r[H+(S)} с г[ЩЩ} = = r[D+(S)]c С M-H+(S). (8.3.4) Таким образом, I~[H+(S)] ПЯ+(5) = 0, и H+(S) является ахрональным. Действительно, H+(S) является частью границы прошлого
292 Глава 8. Причинная структура множества D+(S); в частности, H+(S) = [/+(5) US] П/ - [D+(S)} (см. задачу 5). Одно из главных свойств H~*~(S) устанавливает следующая теорема. Теорема 8.3.5. Каждая точка р € H+(S) лежит на нулевой геодезической А, целиком содержащейся в H+(S), которая является или непродолжаемой в прошлое или имеет конечную точку в прошлом на краю S. Доказательство. Основная идея доказательства аналогична той, что была использована в теореме 8.1.6. Пусть р € H+(S) и р & edge(S). Тогда или (i) р € I+(S), или (и) р € 5, но р & edge(S). Во-первых докажем, что в любом случае нетривиальная, направленная в прошлое нулевая геодезическая, содержащаяся в Я+(5), проходит через р. В случае (i), поскольку р £ I~[D+(S)], для каждой точки q € 1+{р) существует непродолжаемая в прошлое причинная кривая из </, которая не пересекает 5. Пусть {qn} является последовательностью точек в /+(р), которая сходится кр, и пусть {Ап} является соответствующей последовательностью кривых, как показано на рис. 8.13. Поскольку р является предельной точкой {Ап}, то по лемме 8.1.5 существует непродолжаемая в прошлое предельная причинная кривая А последовательности {Ап}, которая проходит через р. Предположим далее, что кривая А вошла в открытое множество /+(S)n/~[D+(S)] С D+(5). Тогда для достаточно больших п нашлась бы такая кривая Ап, которая этому противоречит, так как Ап П D+(S) = 0, поскольку каждая кривая Ап не пересекает S. В частности, из соотношения /~(р) С I~[D+(S)] = = I~[D+(S)] следует, что внутри I+(S) кривая является направленной в прошлое причинной кривой, проходящей через р, которая не проникает в 1~(р). Таким образом, по следствию теоремы 8.1.2 кривая А внутри /+(5) является нулевой геодезической. Более того, если бы направленная в прошлое времениподобная кривая из точки в \C\I+(S) не пересекала 5, то можно было бы сконструировать направленную в прошлое времениподобную кривую из точки р, обладающую таким же свойством. По утверждению 8.3.2 это невозможно, поскольку р € D+(S), и по этому же утверждению имеем [АП/+(5)] С D+(S). Таким образом, А П /+(5) С Я+(5). Собирая вместе все эти утверждения, получаем нетривиальный направленный в прошлое сегмент нулевой геодезической А, лежащий в Я+(5) и начинающийся в точке p<E#+(S)n/+(S). В случае (ii), когда р Е 5, но р & edge(S), используем определение edge(S), чтобы установить существование открытого множества О такого, что не существует причинной кривой, содержащейся в О, исхо-
8.3. Области зависимости. Глобальная гиперболичность 293 Рис. 8.13. Точка р 6 H+(S) П I+(S) с последовательностью точек qn 6 /+(р), сходящейся к р в теореме 8.3.5 дящей из точки q G I+(p) П О, которая могла бы попасть в I~{S) П О, не пересекая 5. Аналогичным образом устанавливается существование нетривиальной направленной в прошлое нулевой геодезической, проходящей через р и остающейся в H+(S). Наконец, предположим, что направленная в прошлое нулевая геодезическая Л покидает Я+(5), т.е. часть Л, содержащаяся в Я+(5), имеет конечную точку в прошлом г. Поскольку Я+(5) замкнуто, имеем г € H+(S). Если г # edge(S), то можно найти нетривиальный направленный в прошлое сегмент нулевой геодезической Л' в Я+(5), начинающийся в г. Однако, если сегмент Л' не являлся продолжением Л, то по следствию теоремы 8.1.2 можно было бы найти временипо- добную кривую, соединяющую точку на Л с точкой на Л'. Это могло бы нарушить ахрональность H+(S). Это доказывает, что Л не может иметь конечную точку в прошлом, кроме как на edge(S). □ Полный горизонт Коши замкнутого ахронального множества 5 определяется следующим образом: H(S) = H+(S) U Н-(5), (8.3.5) где H~(S) определяется заменой прошлого на будущее в определении H+(S). Используя лемму 8.3.3, нетрудно показать, что горизонт Коши отмечает границу области зависимости 5. Утверждение 8.3.6. H(S) = D(S). Мы оставляем доказательство этого утверждения в качестве примера (задача 6). В качестве прямого следствия имеем:
294 Глава 8. Причинная структура Следствие. Если М связное, то непустое замкнутое ахрональ- ное множество Е является поверхностью Коти для (M,go6) тогда и только тогда, когда #(Е) = 0. Доказательство. Если D(E) = 0, то имеем D(H) = int[Z}(E)] = £>(E), и D(E) является или открытым, или замкнутым. Таким образом, поскольку D(E) D Е ф 0 и М связно, имеем £>(Е) = М. □ Это следствие ведет к следующему полезному критерию поверхности Коши. Теорема 8.3.7. Если Е - замкнутое ахрональное множество без границы7, то Е является поверхностью Коши тогда и только тогда, когда каждая непродолжаемая нулевая геодезическая пересекает Е и входит в J+(E) ti/-(E). Доказательство. Достаточность является частным случаем утверждения 8.3.4. Для доказательства необходимости достаточно показать, что если Е не является поверхностью Коши, тогда по крайней мере одна нулевая геодезическая не пересекается с /+(Е) или с /~(Е). Но если Е перестает быть поверхностью Коши, тогда по крайней мере одно из i/+(E) или Я~(Е) является непустым (за исключением того случая, когда М является несвязным, и Е не пересекает компоненту М, поскольку тогда результат тривиален). Если, например, Н+ (Е) ф 0, то по теореме 8.3.5 (поскольку edge(E) = 0) существует непродолжаемая в прошлое нулевая геодезическая, которая всегда остается в Я+(Е) и никогда не пересекает /~(Е). Ясно, что при продолжении этой геодезической бесконечно в будущее, она все равно не пересечет /+(Е). В противном случае нарушится ахрональность Е. □ Далее, пусть (M,ga6) является глобально гиперболичным пространством-временем с поверхностью Коши Е. Легко видеть, что в М не могут существовать замкнутые времениподобные кривые: замкнутая времениподобная кривая, пересекающая Е, может нарушить ахрональность Е, в то время как замкнутая времениподобная (либо причинная) кривая, не пересекающая Е, может нарушить глобальную гиперболичность, поскольку можно было бы двигаться "кругом и вокруг" и определить непродолжаемую причинную кривую, не пересекающую Е. Фактически, как мы увидим дальше (теорема 8.3.14), (M,go6) должно быть причинно устойчивым. Вначале покажем, что сильная причинность требует выполнения следующей леммы. 7Требование, чтобы Е не имела границы, можно убрать из предположений этой теоремы (Geroch 1970b).
8.3. Области зависимости. Глобальная гиперболичность 295 Лемма 8.3.8. Пусть (M,gab) - глобально гиперболичное пространство-время. Тогда (M,gab) является сильно причинным. Доказательство. В глобально гиперболичном пространстве-времени с поверхностью Коши Е очевидно имеем М = /+(E)UEU/~(E). Предположим, что сильная причинность нарушается в точке р € /+(Е). Непосредственно из определения сильной причинности следует, что невозможно найти выпуклую нормальную окрестность U точки р, содержащуюся в /+(Е), и плотное семейство открытых множеств Оп С С/, сходящихся к р таких, что для каждого п можно найти направленную в будущее времениподобную кривую, которая начинается в Оп, затем покидает U и заканчивается в Оп. Используя лемму 8.1.5, можно найти предельную Л, проходящую через р. Хотя каждая из Лп является продолжаемой, ясно, что Л должна быть или непродолжаемой, или замкнутой причинной кривой через р. В этом случае движением "кругом и вокруг" ее можно сделать непродол жаемой. Поскольку нет кривых Ап, которые входят в /~(Е), или же нарушится ахрональность Е, то А также не входит и в /~(Е). Это противоречит утверждению 8.3.4. Таким образом, сильная причинность не может быть нарушена в р G Е или по той же причине в точке р € /~(Е). В случае р Е Е возможно выбрать последовательность {Оп} такую, что любая направленная в будущее времениподобная кривая, начинающаяся в Оп, должна покинуть Оп и войти в /+(Е). И вновь мы могли бы найти, что предельная кривая А не может войти в /~"(Е), что противоречит утверждению 8.3.4. □ В оставшейся части этого раздела мы будем иметь дело с пространством причинных кривых, соединяющих две точки глобально гиперболичного пространства-времени. Аргументы, использованные в доказательствах, дают прекрасную иллюстрацию абстрактных топологических методов, основные положения которых имеются в прилож. А. Пусть (M,gab) является сильно причинным пространством-временем и р, q € М. Определим набор С(р, q) непрерывных направленных в будущее причинных кривых из р в д, в котором кривые, отличающиеся только репараметризацией, считаются одинаковыми. (Конечно C{p,q) будет пустым, за исключением того случая, когда q Е J+(p).) Мы определяем топологию У на С(р, д), объединяя (С(р, д), &) в топологическое пространство следующим образом. Пусть U С М является открытым. Определим 0(i7) С С(р, q) соотношением 0(U) = {Xe C(p,q)\X С U]. (8.3.6) Другими словами, 0(U) состоит из всех причинных кривых из р в 9> полностью лежащих в U. Определим нашу топологию <^, называя
296 Глава 8. Причинная структура подмножество О из C(p,q) открытым, если его можно представить следующим образом: 0 = [jO(U), (8.3.7) где каждое 0{U) имеет вид (8.3.6). Поскольку 0{U\) П 0(£/г) = 0(U\ П (/г), то легко проверить, что ЗГ действительно определяет топологию на C(p,q). Ввиду того, что мы ограничили рассмотрение пространствами, в которых не существуют замкнутые причинные кривые, подмножество Л из М не может содержать подмножество Л' из М или само содержаться в нем, если A, A' Е C(p, q) являются различными причинными кривыми. Тогда из свойств топологии на М следует, что топология & на С(р, q) является хаусдорфовой. Более того, в отсутствие замкнутых причинных кривых & удовлетворяет второй аксиоме счетности (Geroch 1970b). Наконец, сходимость в & определяется следующим образом: Ап —► А, если для каждого открытого множества U С М, в котором находится кривая Act/, существует N такое, что Ап С U для всех п> N. Если мы требуем выполнения сильной причинности в М, то можно показать, что это понятие сходимости эквивалентно понятию сходимости кривых, определенное в разд. 8.1. Аналогично понятие "предельной кривой" А последовательности {Ап} в смысле разд. 8.1 совпадает с понятием точки накопления в топологических пространствах (прилож. А). Ключевой теоремой, на которой основаны все последующие результаты этого раздела, является следующая. Теорема 8.3.9. Пусть (M,gab) является глобально гиперболичным пространством-временем up,q Е М. Тогда C(p,q) компактно. Доказательство. Поскольку топология на С(р, q) удовлетворяет второй аксиоме счетности, то по теореме Больцано-Вейерштрасса А.9 прилож. А достаточно показать, что каждая бесконечная последовательность точек {Ап} (т.е. кривых) в C(p,q) имеет точку накопления (т.е. предельную кривую А) в С(р,д). Во-первых, рассмотрим случай, когда р,д Е J9~(E), где Е является поверхностью Коши в (M,ga6), и пусть {Ап} является последовательностью в C(p,q), как показано на рис. 8.14. Если мы (временно) уберем q из М, тогда {Ап} становится последовательностью непродолжаемых в будущее причинных кривых, начинающихся в р. Следовательно, по лемме 8.1.5 существует непродол- жаемая в будущее (ъ М — q) предельная кривая А, начинающаяся в р. Поскольку ни одна из Ап не входит в /+(Е), то это справедливо и для А. Если далее мы восстановим точку q, тогда в М: или (i) А останется
g.3. Области зависимости. Глобальная гиперболичность 297 Рис. 8.14. Последовательность {Л„} причинных кривых из р в q в случае, когда р, q e D~(E) в теореме 8.3.9 непродолжаемой, или (ii) q будет конечной точкой Л. Возможность (i) исключается утверждением 8.3.4, поскольку Л не входит в /+(D). Следовательно Л (с добавленной точкой q) дает требуемую предельную кривую. Случай, когда p,g € Z?+(E), очевидно следует из тех же соображений. Таким образом, единственным нетривиальным случаем остается тот, когда р G Z}-(£), q Е /+(£). Для данной последовательности {Л„} в С(р, q) вышеприведенные аргументы доказывают существование направленной в будущее предельной кривой Л, которая начинается ври входит в /+(£). Выбираем г G АП/+(Е) и выделяем подпоследовательность {\'п} такую, что каждая точка на сегменте Л между риг является предельной точкой этой подпоследовательности. Далее изменим процедуру на обратную и рассмотрим последовательность непродол- жаемых в прошлое (в М — р) причинных кривых {AJJ, начинающихся в q. Из тех же соображений, как и выше, получаем предельную кривую А' из д, которая входит в /~(Е) и поэтому должна проходить через г, поскольку г является предельной точкой {\'п}, и если А' не продолжается в г, она должна была бы остаться в /+(г) С /+(Е). Таким образом, соединяя сегмент А' от г до q с сегментом от р до г, получаем требуемую кривую. □ Компактность C(p,q) приводит к соответствующей компактности подмножества J+(p) П J~{q) в топологии многообразия. Теорема 8.3.10. Пусть (M,gab) является глобально гиперболичным пространством-временем и p,q £ М. Тогда J+(p) U J~(q) компактно. Доказательство. Поскольку паракомпактность предполагает, что топология многообразия удовлетворяет второй аксиоме счетности (см.
298 Глава 8. Причинная структура прилож. А), то по теореме Больцано-Вейерштрасса А.9 достаточно показать, что каждая последовательность {гп} точек в J+{p) U J~{q) имеет точку накопления г. Для доказательства этого положим, что {Ап} является последовательностью причинных кривых из р в q таких, что А„ проходит через гп. Поскольку С(р, q) компактно и удовлетворяет первой аксиоме счетности, то по теореме Больцано-Вейерштрасса находим подпоследовательность {\'п}, которая сходится к кривой А Е Е C{p,q). Рассмотрим далее А как подмножество М. Поскольку это множество компактно (кривая А является непрерывным отображением замкнутого интервала из R), то можно найти открытую окрестность U С М кривой А такую, что U компактно. (Для доказательства покроем А открытыми множествами с компактным замыканием, используем компактность А, чтобы выделить конечное подпокрытие, и сделаем объединение.) По определению сходимости существует целое N такое, что для всех п > N имеем А^ С U. Поскольку г'п € А^ и U С С/, то имеем подпоследовательность {г'п}, содержащуюся в U. Из компактности U следует, что существует точка накопления г € U. Если г £ А, то мы могли бы войти в противоречие с тем, что А является пределом {\'п}. Таким образом, имеем г Е А С J+(p)H J~(q), и значит г является искомой точкой накопления последовательности {гп}. □ Из теоремы А.2 прилож. А получаем следующее следствие. Следствие. В глобально гиперболичном пространстве-времени множество J+(p) П J~(q) замкнуто. Фактически нетрудно видеть, что само J+ (p) должно быть замкнуто. А именно: если это не так, мы могли бы найти точку г Е «/+(р), но г 0 */+(р). Выберем q Е 1+(г). Тогда мы могли бы иметь г Е Е J+(p) П J~(q), ног ^ J+(p) П J~(q), что находится в противоречии с тем, что J+{p) П J~{q) замкнуто. Можно усилить эти аргументы и получить следующий более общий результат, доказательство которого оставлено в качестве упражнения (задача 7). Теорема 8.3.11. Пусть (M,gab) является глобально гиперболичным пространством-временем и К С М компактно. Тогда J+(K) замкнуто. Напомним, что для любого подмножества 5 имеем I+(S) С J+{S) С С /+(5). Значит, теорема 8.3.11 показывает, что для компактного множества К в глобально гиперболичном пространстве-времени имеем J+(K) = I+(K). Это предполагает, что 1+{К) С J+(K), и в этом случае можно усилить теорему 8.1.6 и получить, что каждую р Е 1*(К) можно соединить с К направленной в прошлое нулевой геодезической,
g#3. Области зависимости. Глобальная гиперболичность 299 лежащей в 1*(К). Тогда явление, показанное на рис. 8.2, не может иметь место для компактных множеств в глобально гиперболичном пространстве-времени. Пусть (M,gab) - глобально гиперболичное пространство-время с поверхностью Коши Е. Для q € D+(E) определим С(Е,д) как множество непрерывных направленных в будущее причинных кривых из Е до Я, и определим топологию на C(E,q) так же, как и для С(р,д). Те же самые аргументы, которые были использованы в теореме 8.3.9, приводят к тому, что С(Е, q) компактно. Повторение доказательства теоремы 8.3.10 устанавливает следующую теорему. Теорема 8.3.12. Пусть (M,gab) является глобально гиперболичным пространством-временем с поверхностью Коши Е uq £ D+(E). Тогда */+(Е) П J~(q) компактно. Наши заключительные результаты касаются топологии и причинной структуры глобально гиперболичных пространств-времен. Утверждение 8.3.13. Предположим, что Е и Е' являются поверхностями Коши пространства-времени (M,gab). Тогда Е и Е' го- меоморфны. Доказательство. По лемме 8.1.1 существует нигде не равное нулю времениподобное векторное поле ta на М. Поскольку Е и Е' являются поверхностями Коши, каждая интегральная кривая поля ta должна иметь в точности одну точку пересечения с Е и Е'. Отображение Е на Е' посредством связи точек, лежащих на одной и той же интегральной кривой £а, приводит к непрерывному взаимнооднозначному отображению с непрерывным обратным отображением. □ Наша последняя теорема во много раз усиливает лемму 8.3.8. Теорема 8.3.14. Пусть (M,gab) является глобально гиперболичным пространством-временем. Тогда (M,ga6) - устойчиво причинно. Более того, глобальную функцию времени f можно выбрать так, что каждая поверхность постоянного значения f является поверхностью Коши. Таким образом, М можно расслоить поверхностями Коши, и топология М имеет вид R х Е, где Е обозначает поверхность Коши. Доказательство. (Набросок.) Как и в теореме 8.2.2, мы вводим меру объема ц на, М так, чтобы /х(М) было бы конечным, и определяем Функцию /~ соотношением Г(р) = ц[Г(р)]. (8.3.8)
300 Глава 8. Причинная структура Пользуясь тем, что для всех q £ М области J+(q) и J~{q) замкнуты, можно показать, что f~(p) непрерывна (т.е. "усреднения", как в теореме 8.2.2, не требуется) (Hawking, Ellis 1973; Geroch 1970b). Таким образом, /~ определяет непрерывную глобальную функцию времени, которую можно "сгладить", чтобы получить дифференцируемую глобальную функцию времени. А это доказывает устойчивую причинность. Чтобы получить следующие более сильные выводы теоремы, мы определяем /+ соотношением f+(p) = n[l+(p)], (8.3.9) и / соотношением /(Р) = /-(Р)//+(Р)- (8.3.10) Тогда / непрерывно, и каждая поверхность постоянного уровня функции / - это замкнутое ахрональное множество. Остается показать, что каждая непродолжаемая причинная кривая пересекает каждую поверхность постоянного уровня /. Так должно быть, если /~(р) стремится к нулю вдоль каждой непродолжаемой в прошлое причинной кривой, и если аналогично f+(p) стремится к нулю вдоль каждой непродолжаемой в будущее причинной кривой, поскольку тогда / пройдет через все значения в интервале (0, Н-оо) на каждой непродолжаемой причинной кривой. Чтобы доказать это (ad absurdum), мы предположим, что А - непродолжаемая в прошлое причинная кривая, начинающаяся в точке q, вдоль которой /"не стремится к нулю в прошлом. Тогда найдется точка р такая, что р £ /""(г) для всех г € А. Значит, А должна содержаться в множестве J~(q) r\J+(p)- Однако по теореме 8.3.10 это множество компактно, и по лемме 8.3.8 имеется устойчивая причинность. Таким образом, по лемме 8.2.1 А должна иметь точку окончания в прошлом, что противоречит исходному предположению о непродолжаемости А в прошлое. Итак, /~ должна стремиться к нулю при движении по А в прошлое. Ясно, что аналогичное свойство есть также и у /+. □ Замечание. Наше определение глобальной гиперболичности (М, gab) заключается в (I) существовании поверхности Коши. Другое определение (Lerey 1952) существенно опиралось на (II) сильную причинность и то, что C(p,q) компактно для всех p,q £ М. Третье определение (Hawking, Ellis 1973) основано на (III) сильной причинности и том, что J+(p) П J~(q) компактно. Лемма 8.3.8 и теорема 8.3.9 доказывают (1)=>(П), а теорема 8.3.10 (11)=»(III), поскольку в доказательстве используется только компактность С(р, q). Наконец, теорема 8.3.14 устанавливает (Ш)=>(1), поскольку только свойства, полученные из (III),
8.3. Области зависимости. Глобальная гиперболичность 301 играют роль в конструировании поверхности Коши. Таким образом, все три определения эквивалентны. Задачи 1. Докажите, что для любого подмножества S пространственно- временного многообразия М выполняется (a) /+[/+(5)] = /+(5) (b) /+(5) = /+(5), где 5 - замыкание 5. 2. Пусть S - какое-либо подмножество пространственно-временного многообразия М. Дайте доказательство следующих двух утверждений, сделанных в тексте: (a) J+(S)cF(5) (b)/+(5) = int[J+(S)]. 3. Доказать лемму 8.3.3. 4. Пусть (M,ga6) является глобально гиперболическим пространством-временем с поверхностью Коши Е и С С Е замкнуто. Показать, что J+(E) = D+(C) U J+ (Е - С). 5. Доказать, что для любого замкнутого ахронального множества S имеем #+(S) = [/+(5) U 5] П [jT[D+(5)]]. 6. Доказать утверждение 8.3.6. 7. Доказать теорему 8.3.11. 8. (а) Пусть (М, gab) является глобально гиперболическим пространством-временем с поверхностью Коши Е. Пусть С С Е замкнуто, но не обязательно компактно. Докажите, что J+(C) замкнуто. (b) Найти пример замкнутого ахронального множества 5 в пространстве-времени Минковского такого, что J~*~{S) не- замкнуто. (Подсказка: рассмотрите некомпактное подмножество нулевой плоскости.)
Глава 9 Сингулярности В гл. 5 мы изучали динамику однородной, изотропной Вселенной. Там мы нашли, что, если в настоящее время Вселенная расширяется (как это следует из наблюдений), то некоторое конечное время назад она должна родиться из некоторого сингулярного состояния с бесконечной плотностью и бесконечной кривизной пространства-времени. В разд. 6.4 мы изучали расширенную геометрию Шварцшильда. Там было найдено, что в "г = 0" имеется бесконечная сингулярность пространственно-временной кривизны. Соответственно, появление сингулярности предсказывается также в конце гравитационного коллапса сферического тела. Однако эти предсказания возникновения сингулярностей в космологии и гравитационном коллапсе основаны исключительно на анализе решений с очень высокой степенью симметрии. Вполне возможно, что это может дать совершенно неверную картину формирования сингулярности. Например, в ньютоновской теории гравитации при выведении из равновесия сферической невращающейся пылевой оболочки сингулярность появится в г = 0, если вся материя одновременно достигнет начала. Однако, если нарушить сферическую симметрию оболочки или привести ее во вращение, то такая сингулярность не появится. Поэтому можно было бы ожидать, что в общей теории относительности несферический коллапс не будет в общем случае приводить к сингулярности. Аналогично, если проследить назад по времени эволюцию Вселенной, которая не является точно однородной и изотропной, возможно, что вместо сингулярности "большого взрыва" общая теория относительности могла бы предсказать появление несингулярной фазы с высокой плотностью, которая могла бы снова расширяться в прошлом. Если это так, то в общей теории относительности можно было бы получить жизнеспособную модель несингулярной замкнутой Вселенной с бесконечным количеством циклов расширения, сжатия и "отскока". Поэтому имеется значительный интерес к тому, чтобы определить, являются ли предсказания сингулярностей простыми артефактами высокой степени симметрии известных точных решений, или сингулярности являются истинными внутренними особенностями решений, описывающих космологию и гравитационный коллапс в общей относительности.
304 Глава 9. Сингулярности Цель этой главы состоит в обсуждении теорем о сингулярностях в общей теории относительности. Эти теоремы показывают, что сингулярности являются истинными, общими особенностями космологических и коллапсирующих решений. Хотя эти теоремы дают очень мало информации о природе сингулярностей, они показывают, что такие модели как несингулярная "отскакивающая Вселенная" несовместимы с общей теорией относительности при условии, когда материя удовлетворяет некоторым энергетическим условиям, и в пространстве- времени выполняется ряд других требований. Предсказание сингулярностей несомненно показывает нарушение общей теории относительности в том, что ее классическое описание гравитации и материи не может быть удовлетворительным в экстремальных условиях вблизи пространственно-временной сингулярности. Действительно, из размерных соображений можно ожидать, что классическое описание пространственно-временной структуры нарушается на масштабах планковской длины Zp = (ftG/c3)1/2 « 10~33см (см. гл. 14) Следовательно, классическая общая теория относительности определенно должна нарушаться в тот или более ранний момент, когда она предсказывает появление пространственно-временной кривизны порядка /р2. Хотя теоремы о сингулярностях не доказывают того, что сингулярности классической теории относительности должны приводить к неограниченно большой кривизне, они говорят о появлении в космологии и гравитационном коллапсе условий, в которых квантовые или другие эффекты, нарушающие классическую теорию относительности, будут играть доминирующую роль. Мы начинаем наше обсуждение теорем о сингулярностях в разд. 9.1 с попытки определения термина "сингулярность". Хотя легко можно узнать сингулярности в "большом взрыве" решения Робертсона - Уокера или в "г = 0" решения Шварцшильда, все же чрезвычайно тяжело дать удовлетворительное общее понятие этого термина. Мы мотивируем понятия неполноты времениподобной и нулевой геодезических, как критерия наличия сингулярности, хотя даже это понятие имеет некоторые нежелательные особенности. Это является тем критерием, который используется в теоремах о сингулярностях. Основная идея теорем о сингулярностях следующая. Как уже было показано в разд. 3.3, геодезические являются кривыми экстремальной длины. После вывода некоторых полезных уравнений, описывающих геодезические конгруэнции в разд. 9.2, мы получаем в разд. 9.3 критерии, при которых времениподобная геодезическая перестает удовлетворять локальному максимуму "длины" (т.е. собственного времени) между двумя точками или между точкой и трехмерной поверхностью-
о 1. Что является сингулярностью? 305 ^1ы получаем аналогичные критерии, при которых нулевая геодезическая не остается на поверхности будущего точки или двухмерной поверхности. Используя неравенства на тензор Риччи, которые следуют из свойств локальной положительности тензора энергии-импульса (это единственное место в анализе, где используются уравнения Эйнштейна), мы показываем, что при подходящих обстоятельствах "достаточно длинные" времениподобные геодезические не могут быть кривыми максимальной длины, а "достаточно длинные" нулевые геодезические не могут оставаться на границах прошлого или будущего. Однако в разд. 9.4 для того, чтобы установить существование времениподобных кривых максимальной длины в глобально гиперболических пространствах мы даем глобальные доводы, использующие компактность пространства причинных кривых (см. разд. 8.3). Аналогичный результат (теорема 8.3.1) для нулевых геодезических был уже получен в гл. 8. Противоречие между этими результатами (даже если не предполагается глобальная гиперболичность пространства-времени) приводит к теоремам о сингулярностях разд. 9.5. В подходящих обстоятельствах "достаточно длинные" времениподобные или нулевые геодезические не существуют, т.е. должна быть неполнота времениподобной или нулевой геодезических. 9.1 Что является сингулярностью? Интуитивно сингулярность пространства-времени - это "место", где кривизна "усиливается", или имеет место другое "патологическое поведение". Трудность создания удовлетворительного, точного определения сингулярности проистекает из отмеченных в кавычках понятий. Безусловно, большинство серьезных (и возможно непреодолимых) трудностей появляется из попытки придать определенный смысл сингулярности как некоторого "места". Во всех физических теориях, кроме общей относительности, многообразие и структура метрики пространства-времени заранее предполагается; мы знаем "где и когда" обо всех пространственно-временных событиях, и нашей целью является определение физических величин в этих событиях. Если физическая величина является бесконечной или иным образом неопределенной в точке пространства-времени, то можно сказать, что в этой точке есть сингулярность. Таким образом, можно, например, легко определить точный смысл того, что кулоновское решение уравнений Максвелла в специальной теории относительности имеет сингулярность в событиях, удовлетворяющих уравнению "г = 0". Однако в общей теории относительности ситуация совершенно иная. Мы пытаемся найти са-
306 Глава 9. Сингулярности мо многообразие и метрическую структуру пространства-времени. По. скольку понятие события имеет физический смысл только тогда, ко гда многообразие и метрическая структура определены вокруг него, наиболее естественный подход в общей относительности такой, что пространство-время состоит из многообразия М и метрики ga6, определенной всюду на М. Таким образом, сингулярность "большого взрыва" решения Робертсона - Уокера не рассматривается как часть пространственно-временного многообразия. Это не есть "место" или некоторый момент "времени". Аналогично, только область "г > 0" является частью пространства-времени Шварцшильда. В отличие от кулонов- ского решения в специальной теории относительности "г = 0" не является "местом". На основе примеров решений Робертсона - Уокера и Шварцшильда можно было бы ожидать, что все же возможно определить понятие сингулярной границы пространства-времени. Идея состоит в том, чтобы добавить точки, представляющие сингулярность (т.е. точки "г = О" в пространстве-времени Робертсона - Уокера и "г = 0" в пространстве- времени Шварцшильда), и определить топологическое пространство или может быть даже многообразие с границей1, состоящей из добавленных точек. Это позволило бы нам говорить о сингулярности более точно как о "месте", хотя метрика там и не определена. Однако, если это можно сделать "руками" в некоторых простых случаях как пространства Робертсона - Уокера или Шварцшильда, серьезные трудности все же возникают при попытке дать общую рекомендацию для определения сингулярной границы. Во-первых, наивные определения, основанные на выражениях для координатных компонент метрики, не имеют возможности дать общий рецепт, поскольку явную структуру сингулярности можно легко изменить координатным преобразованием, что иллюстрируется простыми примерами, подобные которым имеются в начале разд. 6.4 (где не было истинной сингулярности). Было предложено несколько независимых от координат рецептов для определения сингулярной границы, в частности "д-граница" (Geroch 1968b) и "6-граница" (Schmidt 1971). Однако эти рецепты и все другие с аналогичными свойствами дают границы с патологическими топологическими свойствами даже в простейших случаях (Johnson 1977; Geroch, Liang, and Wald 1982). Герох, Кронхаймер и Пенроуз (Geroch, Kronheimer and Penrose 1972) определили понятие причинной границы пространства-времени, используя класс эквивалентности непродол- жаемых в будущее и прошлое времениподобных кривых (называемых соответственно TIP и TIF), для определения точек границы. Все же См. в при лож. В определение "многообразия с границей".
-, Что является сингулярностью? 307 екоторые трудности появляются при отождествлении процедур TIP TIF и в определении топологии пространства-времени с добавленными граничными точками. Таким образом, в настоящее время нет полностью удовлетворительного общего понятия сингулярной границы2. До тех пор пока такое определение не будет сделано, мы не можем рассматривать сингулярность как "место". Конечно, наша неспособность описать сингулярность как "место" в точных математических терминах не умаляет очевидный факт существования сингулярностей, скажем, в пространствах Робертсона - Уокера и Шварцшильда. Это просто означает, что мы должны найти другие пути, чтобы характеризовать сингулярность. Одним из них является подчеркивание того, что кривизна в этих пространствах "усиливается", т.е. она неограничена при стремлении г —► 0 в пространствах Робертсона - Уокера и в пределе г —► 0 в пространстве Шварцшильда. Однако мы наталкиваемся на ряд серьезных трудностей, если делаем попытку использовать понятие "усиливающейся" кривизны в качестве общего критерия сингулярностей. Во-первых, кривизна описывается тензорным полем Rabcd, и если использовать плохое поведение компонент этого тензора или его производных для критерия сингулярностей, то можно попасть в затруднительное положение, поскольку это плохое поведение компонент может быть следствием скорее плохого поведения координат или тетрадного базиса, чем кривизны. Чтобы обойти эту проблему, можно рассмотреть скаляры, полученные из кривизны, такие как R, RabRab, RabcdRabcd и аналогичные скаляры, являющиеся полиномами по производным тензора кривизны. Но, даже если величина некоторого скаляра будет неограничена в пространстве-времени, кривизна может возрасти, как только мы "уйдем на бесконечность", хотя в этом случае мы не хотели бы называть пространство-время сингулярным. С другой стороны, для "плоских гравитационных волн", т.е. типа IV вакуумных решений уравнений Эйнштейна (см. разд. 7.3), все такие полиномы по скалярам кривизны исчезают, но все же тензор кривизны может быть сингулярным! [Аналогичное поведение имеет место для плоско-волновых решений = f(u)n\adb)U уравнений Максвелла в специальной теории относительности, где и = t — я, па является постоянным векторным полем, Многообразие с определенной на нем римановой метрикой можно сделать метрическим пространством, используя наибольшую нижнюю границу длин кривых, соединяющих две точки в качестве функции расстояния. Для метрического пространства конструкция Коши (см., например, Royden 1963) дает полностью удовлетворительное понятие "сингулярной границы". Однако лоренцева метрика не дает естественного понятия функции расстояния, поэтому конструкция Коши здесь не "Рименима.
308 Глава 9. Сингулярност] ортогональным к даи, а / -произвольная функция. Все полиномиальные инварианты поля Fab и его производных тождественно исчезают но Fab будет сингулярным, если f(u) сингулярна.] Более того, в физически разумных случаях пространства могут быть сингулярными без какого-либо плохого поведения тензора кривизны. Например, можно удалить "клин" в пространстве-времени Минковского, состоящий из точек с азимутальными углами ф в интервале 0 < ф < фо- Затем отождествить соответственные точки ф = 0 и ф = 0о- Полученное пространство можно сделать многообразием со структурой R4, переопределив координатные окрестности точек с ф = 0 (включая г = 0). Плоская метрика в первоначальном пространстве-времени в точках с ф ф о (где структура многообразия неизменна) естественно определяется в нашем новом многообразии, и она может быть гладко продолжена в точки с</> = 0иг>0. Однако ее нельзя гладко продолжить в г = 0. Имеется "коническая сингулярность" при г = 0 (и, таким образом, мы должны исключить г = 0 из пространства-времени), хотя тензор кривизны Rabcd везде тождественно исчезает! Поэтому общее определение сингулярности с помощью "усиливающейся" кривизны является неудовлетворительным. Определение сингулярностей посредством детального перечисления других возможных типов "патологического поведения" метрики пространства-времени так же бесполезно, поскольку появляется бесконечное число возможных патологий. Как же тогда можно характеризовать сингулярное пространство- время? Безусловно, наиболее удовлетворительной идеей до сих пор является использование "дыр", оставленных после удаления сингулярностей в качестве критерия их наличия. Эти "дыры" можно было бы обнаружить тем, что должны быть геодезические, которые имеют конечную аффинную длину, т.е. более точно должны существовать геодезические, которые являются непродолжаем ым и по крайней мере в одном направлении, но имеют только конечную область аффинного параметра. Говорят, что такие геодезические неполны. (Для време- ниподобных и пространственноподобных геодезических конечная аффинная "длина" эквивалентна конечному собственному времени или длине, и поэтому использование аффинного параметра просто обобщает понятие "конечной длины" для нулевых геодезических.) Таким образом, можно определить сингулярное пространство-время, если оно обладает по крайней мере одной неполной геодезической3. Тогда можно классифицировать сингулярность, определенную через неполноту 3В случае многообразия с римановой метрикой неполнота геодезической эквивалентна неполноте Коши (см. сноску 2 и, например, (Kobayashi and Nomizu 1963) для доказательства эквивалентности).
л Что является сингулярностью? 309 i i i I i I рис. 9.1. Пространственно-временная диаграмма пространства-времени (R4,go6), конформного пространству-времени Минковского (Ш4,г]аь), т.е. gab = П2т]аь (см. прилож. D). Конформный фактор П выбираем сферически симметричным и П = 1 при г > 1. Из сферической симметрии Q следует, что кривая г = 0 является времен и подобной геодезической пространства с метрикой gab. Если выбрать Q таким образом, что П(г = 0, t) —► 0 достаточно быстро при t —► оо, то эта времениподобная геодезическая будет неполной. Однако все пространственноподобные и нулевые геодезические просто "проходят через" мировую трубку ненулевой кривизны и поэтому полны геодезической, когда (i) какой-то скаляр, полиномиальный по Rabc ? и его ковариантные производные резко возрастают вдоль геодезической ("сингулярность скалярной кривизны"), или (ii) если нет такого сильно растущего скаляра, но компонента Rabc или ее ковариантные производные в параллельно переносимой тетраде сильно возрастают вдоль геодезической ("сингулярность параллельно переносимой кривизны"), или (ill) нет ни такого скаляра кривизны, ни такой компоненты, которые сильно возрастают ("сингулярность не по кривизне"). Одним из возражений такому определению является то, что пространства, которые в любом случае несингулярны, но просто имеют "искусственно" удаленные точки, могут рассматриваться как син- гУлярные. Однако мы можем обойти эту возможность, ограничивать рассмотрением только непродолжаемых пространств, т.е. пространств, которые не изометричны подмножеству другого пространства. Более серьезным возражением является то, что геодезическая ^полнота не всегда соответствует интуитивному понятию того, что существуют "дыры" в пространстве-времени, полученные вырезани- ем сингулярностей. Если имеется "дыра", тогда неполнота должна
310 Глава 9. Сингулярносц иметь место для всех типов геодезических. На рис. 9.1 показан пример пространства-времени, которое геодезически полно по простран- ственноподобным и нулевым геодезическим, но неполно по временипо- добным геодезическим. "Поворачивая этот пример на бок", получаем пространство-время, геодезически полное по времениподобным и нулевым геодезическим, но неполное по пространственноподобным геодезическим. Таким образом, в последнем случае есть сингулярность, но нет наблюдателя или светового луча, которые могли бы ее достигнуть! Другие примеры такого рода имеются в задаче 1. Более того, существуют пространства, которые полны по времениподобным, нулевым или пространственноподобным геодезическим, но обладают непродолжае- мыми в будущее времениподобными кривыми с ограниченным ускорением, которые имеют конечную собственную длину (Geroch 1968c). В соответствии с определением такое пространство-время необходимо рассматривать как несингулярное, хотя существует космический корабль с достаточным количеством топлива и наблюдатель в нем, который может закончить свое существование за конечное время. Можно привести большое количество серьезных примеров несоответствия геодезической неполноты интуитивному понятию вырезания сингулярных "дырок". В компактном пространстве-времени каждая последовательность точек имеет точку сгущения, и поэтому в более строгом интуитивном смысле "дырки" не существуют. Тем не менее, существуют компактные пространства, которые геодезически неполны. Такой пример, данный Мизнером (Misner 1963), приведен в задаче 2. Несоответствие геодезической неполноты и существования "дырок" очевидно тесно связано с обсужденной выше трудностью определения сингулярности как "места". Тем не менее имеется серьезная физическая патология в любом неполном по времениподобным или нулевым геодезическим пространстве-времени. В таком пространстве-времени существует возможность по крайней мере для одной свободно падающей частицы или фотона прекратить свое существование за конечное "время" (т.е. аффинный параметр) или же начать свое существование некоторое конечное время тому назад. Таким образом, даже если не имеется полностью удо- влетворительного общего понятия сингулярностей, можно называть такие пространства физически сингулярными. Это есть то свойство, которое доказывается для широкого класса пространств теоремами о сингулярностях. Для имеющейся неполноты по времениподобным или нулевым геодезическим хотелось бы больше знать о характере сингулярности, т.е. является ли она сингулярностью кривизны [типы W и (и)] или сингулярностью не по кривизне. К сожалению, теоремы °
д 2. Конгруэнции времениподобных и нулевых геодезических 311 сйнтулярностях не дают информации о природе сингулярностей, существование которых доказано. 9.2 Конгруэнции времениподобных и нулевых геодезических Пусть М является многообразием, и О С М является открытым множеством. Конгруэнцией в О является семейство кривых таких, что через каждую р € О проходит в точности одна кривая этого семейства. Таким образом, касательные к конгруэнции дают векторное поле в О, и наоборот, как обсуждалось в разд. 2.2, каждое непрерывное векторное поле порождает конгруэнцию кривых. Говорят, что конгруэнция является гладкой, если соответствующее векторное поле является гладким. В этом разделе мы определим расширение, сдвиг и тензор вращения конгруэнции времениподобных и нулевых геодезических в пространстве-времени (M,gab) и выведем уравнения для скорости их изменения при движении вдоль кривых этой конгруэнции. Во-первых, рассмотрим гладкую конгруэнцию времениподобных геодезических. Без потери общности можно предположить, что геодезические параметризуются собственным временем т, и поэтому векторное поле касательных £° нормировано на единицу £a£a = — 1. Тогда тензорное поле Ваъ, определенное соотношением Bab = Vb£a, (9.2.1) будет полностью "пространственным", т.е. Babe = BabZb = 0. (9.2.2) Физическая интерпретация Ваь видна из следующего. Рассмотрим гладкое однопараметрическое подсемейство 7s (т) геодезических этой конгруэнции, и rf ортогональный вектор отклонения от 7о этого подсемейства (см. разд. 3.3). Тогда rf представляет собой инфинитезимальное пространственное перемещение от 7о к соседней геодезической этого подсемейства. Имеем £&а = 0 (9.2.3) и поэтому ^V6r/a = rtbVbe = Ваы)ъ. (9.2.4) Таким образом, В% характеризует то, что поле rf не переносится параллельно. Наблюдатель на геодезической 7о найдет соседние геодезические, окружающие его растянутыми и повернутыми линейным отображением Ваь.
в °аЪ Uah = = = Ва /la5, В(аЬ) ~ Blab]- «вЛвь, 312 Глава 9. Сингулярности Определим "пространственную метрику" Иаь соотношением Kb = gab + &»&• (9.2.5) Таким образом, hab = g?chcb является оператором проектирования на подпространство касательного пространства, перпендикулярного £<* Определим растяжение 0, сдвиг <таь и вращения иаь конгруэнции уравнениями: (9.2.6) (9.2.7) (9.2.8) Поле Bab разлагается следующим образом: Bab = T^Ohab + (Tab + U>ab- (9.2.9) Отметим, что благодаря уравнению (9.2.2) и теореме Фробениуса конгруэнция локально ортогональна гиперповерхности тогда и только тогда, когда иаь = 0 (см. прилож. В). Из уравнения (9.2.2) видим, что ааь и иаь являются чисто пространственными, т.е. (таь€ь = иаъ£ъ = 0. Из уравнения (9.2.4) следует, что вдоль любой геодезической в конгруэнции в измеряет среднее расширение инфинитезимально близких геодезических; шаь, являющаяся антисимметричной частью линейного отображения Ваь, измеряет их вращение; ааь - сдвиг, т.е. первоначальная сфера в касательном пространстве, параллельно переносимая вдоль £а переносом Ли, будет деформироваться в эллипсоид, с главными осями вдоль собственных векторов а%, и со скоростями, являющимися собственными значениями а%. Ясно, что уравнение девиации геодезических (3.3.18) приводит к уравнениям для скорости изменения 0, оаь и шаь вдоль каждой геодезической в конгруэнции. Эти уравнения легко вывести. Имеем tcVcBab = ^VcV6^ = ^V6Vc^a + /?c6ad^d = = V6(£cVc£a) - (Vb£c)(Vc£a) + RcbadZcU = = -BCbBac + Rcba44d. (9.2.Ю) Взяв след уравнения (9.2.10), получаем Г?с0 = ^ = ~\в2 - ааЬааЬ + шаЬшаЬ - Rcdetd. (9.2.U)
л о Конгруэнции времениподобных и нулевых геодезических 313 SM; Яесследовая, симметричная часть уравнения (9.2.10) имеет вид 2 1 . . £cVc°ab = ~^0aab - aacacb - uacucb + -hab(acdaca - иышса) + + CcbadZ4d+ \&аЪ, (9.2.12) где Rab является пространственной бесследовой частью Rab, т.е. Rab = hachbdRc — 7;habhcdRc • (9.2.13) Наконец, антисимметричная часть уравнения (9.2.10) дает 2 rVcWeb = -^0шаЬ - 2ac[bu;a]c. (9.2.14) Уравнение (9.2.11) известно как уравнение Рачаудхури и является ключевым уравнением в доказательстве теорем о сингулярностях. Обратим далее наше внимание на исследование свойства положительности последнего слагаемого в правой стороне этого уравнения. Используя уравнения Эйнштейна, можно записать это слагаемое следующим образом: RabCe = 87Г Tab ~ 2Т&6 £°£° = 8тг Tab?? + \Т (9.2.15) Величина Таь£а£ь представляет собой плотность энергии материи, измеренной наблюдателем с 4-скоростью £°. Обычно полагают, что любая классическая материя имеет неотрицательную плотность энергии, т.е. ТаьС? > 0 (9.2.16) Для любого времениподобного вектора £°. Это условие известно как слабое энергетическое условие. Кажется физически разумным, что тензор энергии-импульса материи не будет таким большим и отрицательным, чтобы сделать правую сторону уравнения (9.2.15) отрицательной. Это означает, что TabZ4b>-\T (9.2.17) Для любого времениподобного поля £°. Такое условие называется силъ- ным энергетическим условием. Для полноты упомянем также другое энергетическое условие, которое, как полагают, выполняется для физической материи. Для любого направленного в будущее времениподобного вектора £а величина — Таь£ь должна являться направленным
314 Глава 9. Сингулярности в будущее времениподобным или нулевым вектором. Поскольку для наблюдателя с 4-скоростью £а величина — T%£b представляет собой измеренную им энергию-импульс плотности 4-тока материи, то это условие, известное как условие энергодоминантности, можно интерпретировать как условие того, что скорость потока энергии материи всегда меньше скорости света. Эту интерпретацию можно сделать более точной. Действительно, можно доказать, что, если Таь сохраняется (т.е. VaTab = 0), удовлетворяет условию энергодоминантности и исчезает на замкнутом, ахрональном множестве 5, тогда он также исчезает и в D(S) (см. лемму 4.3.1 из Hawking and Ellis 1973). Заметим, что условие энергодоминантности заключает в себе слабое энергетическое условие, но в других отношениях три энергетических условия являются математически независимыми предположениями. В частности, сильное энергетическое условие не содержит в себе слабое энергетическое условие4. Оно "сильнее" только в том смысле, что оно является более сильным физическим требованием (9.2.17), чем (9.2.16). Тензор энергии-импульса Таь симметричен по двум его индексам, но, поскольку метрика gab не является положительно определенной, линейное отображение Т% векторов в векторы не обязательно диа- гонализуется, т.е. отображение имеет не обязательно четыре линейно независимых собственных вектора. Однако, за исключением тензора энергии-импульса нулевой жидкости (конкретнее Таь имеет форму Tab = plak +PixaXb + Р2УаУь, где /° является нулевым, а ха и уа орто- нормальными пространственноподобными векторами, перпендикулярными /°), все тензоры энергии-импульса, представляющие физическую материю, диагонализуемы. Собственные вектора Tg, соответствующие различным собственным значениям, автоматически ортогональны, в то время как собственные вектора, соответствующие одному собственному значению, можно выбрать ортогональными так, что в диагональном случае Таъ принимает вид Tab = ptah + P\XaXb + Р2УаУЬ + РЗ^а^Ь, (9.2.18) где {£°, гг°, т/°, za} представляют собой ортонормальный базис с времениподобным вектором ta. Собственное значение р можно интерпретировать как плотность энергии покоя материи, а собственные значения РьР2>Рз называются главными давлениями. Для Таъ в форме (9.2. 18) вышеприведенные энергетические условия эквивалентны следующие 4В некоторых работах "слабое энергетическое условие" определяется так, чТ° неравенство Таькакь ^ 0 выполняется для всех нулевых ка. В этом случае сильное энергетическое условие определенно содержит в себе слабое энергетическо условие.
л 2. Конгруэнции времениподобных и нулевых геодезических 315 условиям. Слабое энергетическое условие выполняется тогда и только тогда, когда р^О и /о + рг^О (г = 1,2,3). (9.2.19) Сильное энергетическое условие эквивалентно следующему: з P + J^Pi^O и р + Рг^О (г = 1,2,3). (9.2.20) г=1 Таким образом, слабое и сильное энергетические условия будут выполняться только при условиях, что р > 0 и не существует отрицательного давления (т.е. натяжений), сравнимого по величине или большего р. Наконец, условие энергодоминантности эквивалентно тому, что р>\Р1\ (г = 1,2,3). (9.2.21) Вернемся далее к уравнению Рачаудхури (9.2.11). Как уже отмечалось выше, если выполняются уравнения Эйнштейна и удовлетворяется сильное энергетическое условие для Таь, тогда последнее слагаемое в правой стороне уравнения (9.2.11) будет отрицательным. Физически это можно интерпретировать как проявление гравитационного притяжения. Если конгруэнция ортогональна гиперповерхности, то имеем шаь = 0, и поэтому исчезает третье слагаемое. Второе слагаемое —0аЪ&аЪ явно неположительно. Таким образом, при этих предположениях находим ^ + \в2 ^ 0, (9.2.22) ат о что означает ^(О > i, (9.2.23) и, следовательно, 0-1(т)^в^ + \г, (9.2.24) где #о - начальная величина в. Предположим далее, что во отрицательно, т.е. что конгруэнция изначально сходится. Тогда уравнение (9.2.24) означает, что в~1 должно проходить через ноль, т.е. в —> —оо в интервале собственного времени т < 3/|0о|- Таким образом, мы доказали следующую лемму. Лемма 9.2.1. Пусть £а является касательным полем к гиперповерхности ортогональной времениподобной геодезической конгруэнции. Предположим, что Rab€a£b ^ 0, как в случае выполнения уравнений Эйнштейна для пространства-времени и сильного энергетического условия для материи. Если в приобретает отрицательную
316 Глава 9. Сингулярности величину во в какой-либо точке на геодезической в конгруэнции, тогда в стремится к — оо вдоль геодезической в интервале собственного времени т ^ 3/|#о|- Вообще, сингулярность в 0, предполагаемая в лемме 9.2.1, представляет собой просто сингулярность в конгруэнции, но не сингулярность в структуре пространства-времени. Это просто означает, что каустики будут обнаруживаться в конгруэнции, если везде имеется сходимость. Выводы леммы 9.2.1 справедливы для конгруэнции в пространстве-времени Минковского и во многих других пространствах-временах, свободных от сингулярностей. Однако в следующих трех разделах мы покажем, что в некоторых пространствах-временах выводы леммы 9.2.1 вместе со свойствами, полученными из глобальных аргументов, доказывают существование сингулярностей пространства- времени. Рассмотрим далее конгруэнцию нулевых геодезических. Снова параметризуем геодезические аффинным параметром Л, но в отличие от времениподобного случая не имеется естественного пути нормировки касательно векторного поля ка, и в связи с этим нет возможности подгонки масштаба Л на различных геодезических. Во времениподоб- ном случае мы ограничились рассмотрением вектора девиации rja, ортогонального к £°. Там фактически были две независимые (хотя и связанные) причины для этого. (1) Имеем £aVa(fbf/6) = £a£6Va776 = = &А7?6 + la€bVa€b = 0, при условии, что fa£a нормировано на константу. Таким образом, £a7/a постоянно вдоль каждой геодезической и поведение "неортогональной11 части rja не имеет значения. (2) Векторы девиации, которые отличаются только множителем от £а представляют собой смещение к соседней геодезической. Ортогональность фиксирует естественное "калибровочное условие" на т]а. В случае конгруэнции нулевых геодезических вышеприведенные причины для ограничения выбора вектора девиации применимы, но теперь они ведут к двум независимым ограничениям. Во-первых, для любого вектора девиации rja снова имеем kaVa(kbf]b) = къ£к'ПЬ+Ч1акъ х xVafcb = 0, так что кьг)ь не изменяется вдоль каждой геодезической. Это означает, что произвольный вектор девиации т]а можно представить в виде суммы вектора, не ортогонального к fca, который параллельно переносится вдоль геодезической и вектора, перпендикулярного к ка. (Заметим, однако, что нет естественного, единственного пути такого разложения rja.) Таким образом, поведение "неортогональной" части т]а снова не представляет интереса, и мы можем ограничить рассмотрение векторами девиации, удовлетворяющими условию rjaka = 0. Во-вторых, векторы отклонения, отличающиеся только множителем
q 2. Конгруэнции времениподобных и нулевых геодезических 317 оТ fe°, снова описывают перемещение к соседней геодезической. Поэтому физически интересной величиной реально является класс эквивалентности векторов девиации, в котором два вектора девиации эквивалентны, если их разница пропорциональна ка. Поскольку ка является нулевым и поэтому ортогонален сам себе, второе ограничение независимо от первого и это сводит физически интересный класс векторов девиации к двумерному подпространству, которое далее мы рассмотрим более подробно. Пусть Vp обозначает касательное пространство в точке р £ М. Касательный вектор в Vp, ортогональный ка, образует трехмерное подпространство, которое мы обозначим через Vp. Определим Vp как векторное пространство классов эквивалентности векторов в Vp, где х°, уа € Vp эквивалентны, если существует число с G R такое, что ха—уа = = ска. Тогда Vp является двумерным векторным пространством, хотя его невозможно идентифицировать как подпространство Vp. Как было объяснено выше, представляющие интерес вектора девиации живут в векторном пространстве Vp. Касательный вектор ta € Vp не дает естественным образом касательного вектора в Vp, поскольку нет естественного пути разложения его на сумму вектора в Vp и вектора, не лежащего в Vp. Однако, если ta G Vp (т.е. если taka = 0), тогда ta естественным образом дает вектор ta в Vp в виде его класса эквивалентности. С другой стороны, дуальный вектор fjba £ V* естественно дает дуальный вектор jl e (Vp)* ограничением его действия на векторы в Vp. Однако Да естественно дает дуальный вектор Да G (V^,)* тогда и только тогда, когда Jiaka = fiaka = 0. Более широко, тензор Та1'"акь1...ь1 на Vp естественным образом дает тензор Та1"'акь1...ь1 на Vp тогда и только тогда, когда в результате свертывания любого его индекса с ка или ка и свертки оставшихся индексов с векторами или дуальными векторами, которые дают элементы Ур или (Vp)*, всегда получаем нуль. Для тензоров, удовлетворяющих этому свойству, операция взятия внешнего произведения коммутиру- 611 с "проектированием" на тензоры на Vp. Более того, для тензора, Удовлетворяющего более сильному условию, что свертка одного из его индексов с ка или ка дает нуль, проектирование в Vp коммутирует со сверткой. Пространственно-временная метрика gab удовлетворяет изложенному выше условию и, таким образом, дает тензор на Vp, который мы °б°значим как Наь, Нетрудно видеть, что hab является положительно °нределенной (т.е. сигнатуры -Н-) метрикой на Vp. (С другой стороны,
318 Глава 9. Сингулярности тензор hab на Vp, полученный ограничением действия gab на векторы в Vp, является вырожденным, поскольку habkb = 0, и поэтому hab не является метрикой на Vp.) Подчеркнем, что обратная метрика hab есть просто "ошляпленный" тензор, ассоциированный с g"6. Рассмотрим далее конгруэнцию нулевых геодезических с касательным векторным полем ка. Тензорное поле Bab = S/bka (9.2.25) также удовлетворяет этому свойству и, таким образом, приводит к "ошляпленному" тензорному полю ВаЬ. Можно разложить ВаЬ следующим образом: Ваъ = -zOhab + даь + £аь, (9.2.26) где в = habBab, (9.2.27) Эаь = В(аЬ)--вКаЬ, (9.2.28) "аъ = B[abh (9.2.29) так что 0, даь и Qab снова имеют физическую интерпретацию как, соответственно, расширение, сдвиг и тензор вращения конгруэнции. Изменение численного множителя в члене \0hab (по сравнению с \0hab во времениподобном случае) связано просто с тем, что векторное пространство является теперь двухмерным, а не трехмерным. Те же вычисления, как и в случае вывода уравнения (9.2.10) в про- странственноподобном случае дают kcVcBab + BcbBac = Rcbadkdkc. (9.2.30) Надевая шляпки в этом уравнении, получаем kcVcBab + В%Вас = R^kckd. (9.2.31) Наконец, подставляя наше разложение (9.2.26) для ВаЬ и выделяя след, симметричную бесследовую и антисимметричную части, полУ' чаем соответственно d0 _ _1 d\ " 2 kcVcaab = -eaab + Ccbadkckd, (9.2.33) ± = Ae2-aabd«b + QabQab-Rcdkckd, (9.2.32) ал I
q 2. Конгруэнции времениподобных и нулевых геодезических 319 kcVcQab = -0Qab. (9.2.34) Подчеркнем, что последнее слагаемое в правой стороне уравнения (9.2.23) исчезает тогда и только тогда, когда Ccbadkckdxayb = 0 для всех ха,уь, ортогональных к ка. Это эквивалентно условию k\eCb)cd[akf)kckd = О, которое является ни чем иным, как условием того, что ка является главным нулевым вектором тензора Вейля5 (см. разд. 7.3). Природа уравнения (9.2.32) для расширения нулевых геодезических очень близка к природе уравнения Рачаудхури (9.2.11). Единственное существенное изменение состоит в том, что, используя уравнения Эйнштейна, получаем Rabkakb = 8nTabkakb. (9.2.35) Таким образом, все что нужно для того, чтобы последнее слагаемое в уравнении (9.2.32) не было положительным это то, что для всех нулевых ка: ТаЬкакь > 0. (9.2.36) Если сильное энергетическое условие (9.2.17) выполняется, то для всех времениподобных £° имеем Таь£а£ь - $Т€а€ь ^ 0, и вследствие уравнения (9.2.36) это будет выполняться для всех нулевых ка. Аналогично, если выполняется слабое энергетическое условие (9.2.16), то вследствие непрерывности уравнения (9.2.36) это также будет выполняться. Для диагонализуемых Таь (9.2.18) необходимым и достаточным условием удовлетворения уравнения (9.2.36) для любых ка является p + ft ^0(i = l,2,3). (9.2.37) Таким образом, требования на Та&, необходимые для обеспечения неположительности последнего члена уравнения (9.2.32), слабее, чем соответствующие требования в пространственно-временном случае. Используя те же аргументы, которые привели к лемме 9.2.1, получаем следующий результат. 5Поэтому из уравнения (9.2.23) следует, что, если сдвиг Эаь конгруэнции нулевых геодезических исчезает, тогда ка является главным нулевым вектором. В случае вакуумного пространства-времени Яаь = 0 получаются значительно более сильные результаты. Если даь = 0, тогда ка должен быть двойным главным нуле- вЬ1м вектором. Наоборот, если ка является двойным главным нулевым вектором в вакуумном, алгебраически специальном пространстве-времен и, тогда он является Касательным к бессдвиговой конгруэнции нулевых геодезических. Эти результа- ты известны как теорема Гольдберга - Сакса, ее доказательство можно найти в (Newman and Penrose 1962).
320 Глава 9. Сингулярности Рис. 9.2. Пространственно-временная диаграмма, иллюстрирующая понятие сопряженных точек вдоль геодезической 7 Лемма 9.2.2. Пусть ка является касательным полем гиперповерхности ортогональной нулевой геодезической конгруэнции. Предположим, что Rabkakb ^ 0, как было бы в случае выполнения уравнений Эйнштейна для пространства-времени и слабого или сильного энергетического условий для материи. Если расширение в становится отрицательной величиной во в какой-либо точке на геодезической в конгруэнции, то в стремится к —оо вдоль этой геодезической в конгруэнции в интервале аффинной длины Л ^ 2/|^о|- 9.3 Сопряженные точки Пусть М является многообразием, на котором определена связность, и 7 является геодезической с касательным вектором va. Решение па уравнения девиации геодезических VaVa(vbVbVC) = -Rabd^V^ (9.3-1) (см. уравнение (3.3.18)) называется полем Якоби на 7- Говорят, что пара точек р, q G 7 является сопряженной, если существует поле Якоби 7/а, не равное тождественно нулю, которое исчезает как в р, так и в Q- Таким образом, р и q сопряжены, если некоторая "инфинитезима^ь- но близкая" геодезическая пересекает 7 и в р, и в q, как показано на рис. 9.2.
g#3. Сопряженные точки 321 В качестве простейшего примера можно привести северный и южный полюса на сфере в римановой геометрии, которые являются сопряженными для каждой "геодезической по долготе". Заметим, однако, что определение требует только существования поля Якоби, исчезающего в р и q; нет необходимости в существовании геодезической, отличной от 7, проходящей через р и q. Наоборот, существование геодезической, отличной от 7 и проходящей через р и q, не означает, что р и q сопряжены или даже, что некоторая точка, сопряженная к р, существует между р и q. Далее будет показано, что сопряженные точки представляют интерес, так как они характеризуют тот факт, что времениподобная геодезическая перестает быть локальным максимумом собственного времени между двумя точками, а нулевая геодезическая не остается на границе будущего точки. (Аналогично, в римановой геометрии они характеризуют то, что геодезическая локально перестает быть кривой минимальной длины, соединяющей точки.) Во-первых, рассмотрим сопряженные точки времениподобных геодезических. Мы начинаем с получения критерия существования сопряженных точек, используя результаты предыдущего раздела. Пусть 7 является времениподобной геодезической с касательной £°, и р € 7- Рассмотрим конгруэнцию всех времениподобных геодезических, проходящих через р. (Эта конгруэнция является, конечно, сингулярной в р.) Тогда каждое поле Якоби, исчезающее в р, является вектором девиации этой конгруэнции. Покажем, что точка q € 7? лежащая в будущем точки р, сопряжена с р тогда и только тогда, когда расширение в этой конгруэнции стремится к —оо в q. Для этого удобно ввести ортонормальный базис пространственных векторов е\, е^, eg, ортогональных к £° и параллельно переносимых вдоль 7- Поскольку компоненты if вектора девиации rf этой конгруэнции удовлетворяют линейным обыкновенным дифференциальным уравнениям ^ = - J2 **{>№№, (э.3.2) величина rf в момент т должна линейно зависеть от начальных данных 7^(0) и dr7/i/dr(0) в р. Так как по построению rj^(0) = 0, то мы Должны иметь
322 Глава 9. Сингулярности Подставляя это соотношение в уравнение (9.3.2) мы видим, что матрица А^и(т) удовлетворяет уравнению = - £ RaeSefA**. (9.3.4) dr2 Ясно, что ^4^(0) = 0 и di4/il//dr(0) = 8^и. Далее, q будет сопряженной к р тогда и только тогда, когда существуют нетривиальные начальные данные (т.е. &q^/6.r{G) ф 0), для которых rf — 0 в q. Из уравнения (9.3.3) следует, что это возможно тогда и только тогда, когда det А^у = 0 в q, и поэтому условие det A^v = 0 является необходимым и достаточным условием существования точки, сопряженной к р. Подчеркнем, что между сопряженными точками detA^ ф 0, и поэтому матрица, обратная к Л*У, существует. Ясно, что матрица А^и должна быть связана с тензорным полем Ваь = Vb^a конгруэнции. Чтобы найти это соотношение, заметим, что ^ = rVaT?" = TVa [ЫьЛЬ] = 3 = £В"«»Л (9.3.5) o=l Используя уравнение (9.3.3), находим V и получаем (°) = Евм^^г(°)- (9-3-7> ^—' dr dr // a,i/ Таким образом, в матричных обозначениях имеем dA/dr = В А, (9.3.8) т.е. В = ^А~\ (9.3.9) dr Следовательно, получаем в = ГхВ = tr dr"1 (9.3.Ю)
9.3. Сопряженные точки 323 где tr обозначает след матрицы. Однако из формулы для обратной матрицы любой несингулярной матрицы А имеем6 tr t* 1 d:(detA), (9.3.11) det A dr и поэтому fl=^-(ln|deti4|). (9.3.12) dr Поскольку А удовлетворяет обыкновенному дифференциальному уравнению (9.3.4), то d(deti4)/dr не может стать бесконечным где-либо вдоль кривой 7- Таким образом, если в —► — оо в д, то из уравнения (9.3.12) следует, что det Л —► 0 в q. Наоборот, если det Л —► 0 в <?, то в —► —оо в q. Итак, как и требовалось, мы доказали, что необходимым и достаточным условием того, что q сопряжена р, является то, что для любой конгруэнции времениподобных геодезических, исходящих из р, мы имеем в —► — оо в q. Конгруэнция времениподобных геодезических, проходящих через р, ортогональна гиперповерхности. Действительно, как доказано в лемме 4.5.2 в книге Хокинга и Эллиса (Hawking and Ellis 1973), внутри выпуклой нормальной окрестности р геодезические этой конгруэнции ортогональны поверхностям постоянного значения собственного времени т вдоль геодезических, и из уравнения (9.2.14) следует, что, если шаь исчезает в один момент времени, оно должно исчезать во все другие моменты времени. Поэтому мы можем использовать лемму 9.2.1 и установить следующий результат о существовании сопряженных точек: Утверждение 9.3.1. Пусть (M,gab) является пространством- временем, удовлетворяющим условию Rab€a£b ^ 0 для любого време- ниподобного £°. Пусть 7 ~ времениподобная геодезическая и р € 7- Предположим расходимость конгруэнции времениподобных геодезических, исходящих в будущее точки р, достигает отрицательной величины во в г € 7- Тогда в интервале собственного времени т < 3/|#о| от г вдоль 7 существует точка qf сопряженная с р, в предположении, что 7 является продолжаемой достаточно далеко. Фактически существование пары сопряженных точек на полной времениподобной геодезической 7 может быть доказано при гораздо 6Эта формула ранее была использована в уравнении (3.4.8). Она тесно связана с "^Ждеством exp(trC) = det[exp(C)] для любой матрицы С, которое легко доказать, Полагая, что С имеет треугольный вид.
324 Глава 9. Сингулярности более слабых условиях, чем использованных в утверждении 9.3.1. Если Rab€a€b ^ 0 везде вдоль геодезической и Яаь€а£ь > 0 в точке г £ 7, то можно показать, что для р, расположенной достаточно далеко от г расширение времениподобной геодезической конгруэнции, исходящей из р, должно быть отрицательным в г. Следовательно, р будет иметь сопряженную точку q на 7- Однако даже если Rab€a£b = 0 везде на 7, то оаъ не может исчезать в окрестности г при условии, что слагаемые с кривизной в правой стороне уравнения (9.2.12) не равны нулю в точке г G 7- Поскольку в правой стороне уравнения Рачаудхури слагаемое —оаъоаЪ также появляется, то аналогичными аргументами устанавливается существование сопряженных точек. Таким образом, все, что требуется для существования сопряженных точек на 7> это выполнение условия Даь£°£6 ^ 0 везде на 7 и Яаь£а£Ь Ф 0 по крайней мере в одной точке 7- Полное доказательство этого результата можно найти в утверждении 4.4.2 книги Хокинга и Эллиса (Hawking and Ellis 1973). Говорят, что пространство-время (M,gab) удовлетворяет общему времениподобному условию, если каждая времениподобная геодезическая обладает по крайней мере одной точкой, в которой 7 и Rab€a£b ф 0. Хотя общее времениподобное условие может нарушаться в специальных, идеализированных моделях пространств, кажется правдоподобным, что оно выполняется во всех физически реалистичных "общих" пространствах. Принимая во внимание предыдущий абзац, имеем следующий результат, который играет важную роль в доказательстве теоремы 9.5.4, отмеченной в разд. 9.5. Утверждение 9.3.2. Пусть (M,gab) удовлетворяет общему времениподобному условию, и предположим, что Rab€a£b ^ 0 для всех времениподобных £а. Тогда каждая полная времениподобная геодезическая обладает парой сопряженных точек. Далее обратимся к связи между сопряженными точками и свойством экстремальности длины времениподобных геодезических. Пусть р, q G М и рассмотрим гладкое однопараметрическое семейство гладких времениподобных кривых Xa{t) между р и #, где параметр t кривой выбирается так, чтобы для всех а мы имели AQ(a) = р, Aa(6) = Я- Обозначим касательные вектора (d/dt)a через Та, а вектора девиации (д/да)а через Ха. Тогда Ха исчезает как в р, так и в д, и как обычно имеем всюду £ТХа = TbVbXa - XbVbTa = 0. Длина каждой кривой дается соотношением /ь /(<М)Л, (9.3.13)
о 3. Сопряженные точки 325 гДе / = {—TaTa)lf2. В разд. 3.3 мы показали, что необходимым и достаточным условием того, что кривая 7 является экстремалью т для всех возможных гладких семейств AQ с Ло = 7 является то, что кривая 7 является геодезической. Повторим вычисления еще раз в координатно инвариантной форме и затем вычислим вторую вариацию длины дуги. Имеем dot Ja да = / XaVa(-TbTb)l,2dt = Ja = - f -TbXaVaTbdt = Ja J = - J -TbTV^dt = Ja J = - f rav, Ja fb = / XbTaVa Ja l7Ta (ВД)Л, Ja dt+ / XbTaVa{Tb/f)dt (9.3.14) поскольку TaVa{f-lTbXb) = d(f-lTbXb)/dt, а Хь исчезает в конечных точках. Поэтому, полагая а = О, видим, что dr/da = О для произвольного Хь тогда и только тогда, когда TbVa{Tb/f) = 0 при a = О, что и является уравнением геодезической в произвольной параметризации. Вторая вариация длины дуги имеет вид: ^ = J XcVc[XbTaVa(Tb/f)]dt. (9.3.15) Вычисляя это выражение при а = 0, в предположении, что Ао является геодезической, находим da2 a=0 = / Xb(XcVcTa)Va(Tb/f)dt + Ja гь + / XbTaXcVcVa(Tb/f)dt = Ja = / Xb{TcVcXa)Va(Tb/f)dt + Ja
326 Глава 9. Сингулярности + / XbTaXcVaVc(Tb/f)dt + Ja + / XbTaXcRcabdTd/fdt = Ja b XbTcVc[XaVa(Tb/f)]dt + l Ja fb / XbTaXc Ja RcabTd/fdt. (9.3.16) Слагаемое в квадратных скобках можно переписать следующим образом: XaVa(Tb/f) = jXaVaTb-jiTbXaVaf = = ^TaVaXb + ±TbTaVa J Г jTcXc , (9.3.17) где были использованы те же манипуляции, как и при выводе уравнения (9.3.14), а также уравнение геодезической при а = 0. Уравнение (9.3.16) можно переписать в более узнаваемой форме, выбирая параметризацию / = 1 вдоль геодезической Ло и вектор девиации Ха ортогональным Та вдоль Aq. Тогда получаем da2 = / Xb{TcVc(TaVaXb) + RcabdTaTdXc}dt = a=0 Ja = / Xb(OX)bdt, (9.3.18) Ja где О - оператор, появляющийся в уравнении девиации геодезических (9.3.1). Используя эту формулу можно установить следующую теорему. Теорема 9.3.3. Пусть 7 является гладкой времениподобной кривой, соединяющей две точки p,q € М. Тогда необходимым и достаточным условием, что 7 является локальным максимумом собственного времени между р и q при гладких однопараметрических вариациях является то, что 7 является геодезической, в которой меэюоУ р и q нет точек, сопряженных р. Доказательство. (Набросок.) Если 7 не геодезическая, тогда, используя уравнение (9.3.14), можно сконструировать однопараметрическое
л з. Сопряженные точки 327 Рис. 9.3. Пространственно-временная диаграмма иллюстрирует, что если геодезическая 7. соединяющая точки р и q, имеет точку г, сопряженную к р и лежащую между р и q, то соседняя времен и подобная кривая у', соединяющая р и q, может быть сконструирована так, что она имеет ббльшее собственное время, чем 7 (см. теорему 9.3.3) семейство кривых Аа, таких, что dr/da > 0 при а = 0. Если 7 геодезическая, но имеющая между р и q сопряженную точку г, тогда можно найти вектор девиации Xg такой, что (ОХо)а = 0 и Xg исчезает в р и г. Из уравнения (9.3.18) вариация Ха = Xg между риг, при условии Ха = 0 между г и q не дает изменения г во втором порядке (см. pnc.feffig3.9). "Сглаживанием угла" в точке г такой вариацией7 можно сделать гладкую девиацию, для которой d2r/da2 > 0 при а = 0. Наоборот, если 7 является геодезической без сопряженных к р точек между р и q, тогда определенная выше матрица А будет несингулярной между р и <7, и поэтому можно определить У = $3l/(-4~1)Mi/^I/. Подставляя Х^^"^ для X** в уравнение (9.3.18), можно показать, что выражение сРт/da2 явно отрицательно при а = 0. Эти расчеты можно найти в утверждении 4.5.8 в книге Хокинга и Эллиса (Hawking and Ellis 1973). □ Понятие, аналогичное сопряженности двух точек вдоль времени- подобной геодезической, можно определить для точки и гладкой (или по крайней мере, С2) пространственноподобной гиперповерхности Е. (Под гиперповерхностью мы понимаем вложенное трехмерное подмно- гообразие (см. прилож. В).) Во-первых, определим внешнюю кривизну Заметим, что этот аргумент "сглаживания угла" делается для (инфинитези- мэльного) вектора девиации, но не для реальной (конечной) геодезической. Для Дальнейшего обсуждения смотрите (Penrose 1972).
328 Глава 9. Сингулярности Каь поверхности Е. Пусть £а является единичным касательным по» лем конгруэнции времениподобных геодезических, ортогональных к Е. Определим КаЬ соотношением Каъ = Ve& = ВЬа, (9.3.19) где подразумевается вычисление тензоров на поверхности Е. Заметим что Каъ - чисто пространственная величина, т.е. Каь£а = Каъ£ъ = о. Поскольку эта конгруэнция явно ортогональна гиперповерхности, мы имеем иаь = 0, и поэтому Каь является симметричным, Каь = Кьа. Следовательно, используя уравнение (С.2.16), можно выразить КаЬ в следующем виде: КаЬ = £ А#аЬ = = зА^аб, (9.3.20) где hab было определено уравнением (9.2.5) и на последнем шаге было использовано уравнение геодезической. hab является пространственной метрикой, индуцированной на гиперповерхностях постоянного собственного времени, получаемых из Е вдоль геодезической конгруэнции, ортогональной к Е. Таким образом, Каь измеряет скорость изменения этой пространственной метрики при движении вдоль конгруэнции, т.е. измеряет "изгибание" Е в пространстве-времени (M,go6). Действительно, поскольку гауссовы нормальные координаты (см. разд. 3.3) ассоциированы с £а (см. прилож. С), то в этих координатах мы имеем к^ = \% <9-3-21) что укрепляет нашу интерпретацию величины Каь, как "производной по времени" от Наь. След внешней кривизны часто обозначают через К: К = Каа = habKab. (9.3.22) Таким образом, имеем К = 0, (9.3.23) где в - расширение геодезической конгруэнции, ортогональной Е. Говорят, что точка р на геодезической 7 геодезической конгруэН' ции, ортогональной Е, является сопряженной к Е вдоль 7> еслИ с^ ществует ортогональный вектор девиации rf конгруэнции, который не
о 3. Сопряженные точки 329 рис. 9.4. Пространственно-временная диаграмма, показывающая точку р с Е вдоль геодезической 7- (Две изображенные геодезические предполагаются "ин- финитезимально близкими") равен нулю на Е, но исчезает в р. Таким образом, интуитивно р является сопряженной с Е, если две "инфинитезимально близкие" геодезические, ортогональные к Е, пересекают р, как показано на рис. 9.4. По тем же самым соображениям, как и в случае сопряженной пары точек, р будет сопряженной к Е тогда и только тогда, когда расширение в конгруэнции геодезических, ортогональных к Е, стремятся к —оо в р. Поскольку эта конгруэнция явным образом ортогональна гиперповерхности, то применение леммы 9.2.1 дает следующий результат. Утверждение 9.3.4. Пусть (M,gab) - пространство-время, удовлетворяющее условию RabZaZb > О ЗЛЯ всех времениподобных £°. Пусть Е является пространственноподобной гиперповерхностью с К = в < 0 в точке q G Е. Тогда в интервале собственного времени г ^ 3/\К\ существует точка р, сопряженная с Е вдоль геодезической 7» ортогональной к Е и проходящей через q, в предположении, что 7 является продолжаемой достаточно далеко. Более того, аргументами, аналогичными тем, что были использованы при доказательстве теоремы 9.3.3, можно доказать следующую теорему. Теорема 9.3.5. Пусть 7 является гладкой времениподобной кри- вой, соединяющей точку р G М с точкой q на гладкой пространственноподобной гиперповерхности Е. Тогда необходимым и достаточным Условием того, что 7 локально максимизирует собственное время между р иТ, при гладких однопараметрических вариациях является ^о, что 7 является геодезической, ортогональной к Е, и не суще- с*пвует сопряженных с Е точек, лежащих между Пир. Рассмотрим далее сопряженные точки на нулевых геодезических. **3 уравнения девиации геодезических непосредственно следует, что
330 Глава 9. Сингулярности для любого поля Якоби rf на нулевой геодезической /х с касательным вектором ка имеем fccVc[A;bVb(A;a77a)] = 0. (9.3.24) Это означает, что г}а не может исчезать в двух точках р, q £ /х, кроме kaVa = 0 везде вдоль /х. Более того, если поле rf является полем Якоби, тогда поле rf + (a + 6A)A;a тоже является таковым с постоянными a и 6, и поэтому р и q будут сопряженными тогда и только тогда, когда существует поле Якоби rf, которое отличается от нуля как в р, так и в q только на вектор ка с некоторым множителем. Таким образом, вдоль нулевой геодезической /х точки p,j € /х будут сопряженными тогда и только тогда, когда вектор rf в V (см. разд. 9.2) удовлетворяет уравнению девиации геодезических и исчезает в р и q. Ясно, что все такие rf, которые исчезают в р, появляются как вектора девиации нулевой геодезической конгруэнции, содержащей двухмерное семейство нулевых геодезических из точки р. По тем же соображениям, что были сделаны во времениподобном случае, q будет сопряжена с р тогда и только тогда, когда расширение в такой нулевой геодезической конгруэнции достигает — оо в q. Таким образом, лемма 9.2.2 предполагает следующий результат. Утверждение 9.3.6. Пусть (M,gab) - пространство-время, удовлетворяющее условию Rabkakb ^ 0 для всех нулевых ка. Пусть /х является нулевой геодезической upG//. Предположим, что сходимость в нулевых геодезических, выходящих из р, становится отрицательной величиной во в г € /х. Тогда в интервале аффинного параметра А ^ 2/|#о| существует точка q, сопряженная с р вдоль \i, предполагая, что /х является продолжаемой достаточно далеко. Вновь этот результат можно усилить следующим образом. Если Rabkakb ^ 0 всюду на полной нулевой геодезической /х и существует по крайней мере одна точка г Е /х, в которой либо Rabkakb > 0, либо fc[eCa]6c[dfcf]fc6kc Ф 0, тогда \х обладает парой сопряженных точек. Говорят, что пространство-время (М, gab) удовлетворяет общему нулевому условию, если каждая нулевая геодезическая имеет по крайней мере одну точку, в которой или Rabkakb ф 0 или k[eCa]bc[<tkf]kbkc Ф 0? т-е- п0 крайней мере одну точку, где k[eRa]bc[dkf]kbkc ф 0. Поэтому, в полной аналогии с утверждением 9.3.2, имеем: Утверждение 9.3.7. Предположим, что (M,gab) удовлетворяет общему нулевому условию и Rabkakb > 0 для всех нулевых ка. Тогда каждая полная нулевая геодезическая обладает парой сопряженных точек.
g#3. Сопряженные точки 331 Выше уже обсуждалось, в каком случае времен и подобную геодезическую 7? имеющую сопряженные точки, можно изменить так, чтобы получить кривую ббльшей длины между точками р и q. Если сопряженная к р точка г, находящаяся между р и q на 7? существует, то мы можем найти более длинную кривую, используя подходящую "бесконечно близкую" геодезическую между риг, следуя затем вдоль 7 от г до q и "сглаживая угол" в г. Точно так же, используя сопряженные точки, нулевую геодезическую /i, соединяющую рид, можно изменить так, чтобы получить времениподобную кривую между р и q. Снова, если имеется сопряженная точка г между р и д, то можно найти "бесконечно близкую" нулевую геодезическую из р в г, следуя затем вдоль /х от г до q и "сглаживая угол" для того, чтобы получить времениподобную кривую из р в q. Таким образом, по аналогии с теоремой 9.3.3, мы получаем следующий результат, полное доказательство которого можно найти в книге Хокинга и Эллиса (Hawking and Ellis 1973). Теорема 9.3.8. Пусть }i является гладкой причинной кривой и p,q € fi. Тогда не существует гладкого однопараметрического семейства причинных кривых Ха, соединяющих р и qy такого, что Ао = /х и \а является времениподобной кривой для всех а > О (т.е. /х невозможно гладко деформировать во времениподобную кривую) тогда и только тогда, когда \х представляет собой нулевую геодезическую без сопряженных к р точек между р и q вдоль /i. Для нулевых геодезических понятие сопряженности также можно определить для точки и двумерной пространственноподобной поверхности (т.е. вложенного подмногообразия) S. В каждой точке q G S будут существовать в точности два направленных в будущее нулевых вектора fc?,^, ортогональных к S. Если 5 ориентируема, то можно непрерывно выбрать к* и Щ на S и определить два семейства нулевых геодезических, которые можно назвать "выходящие" и "входящие" семейства. (Даже если 5 неориентируема, мы все же можем определить эти два семейства локально в окрестности любой точки.) Мы будем называть каждое из этих семейств конгруэнцией, даже в случае, если каждое простирается только на нулевую гиперповерхность, а не на открытую область пространства-времени. Расширение 0, сдвиг даъ и тензор вращения 0аь = 0 этой конгруэнции хорошо определены, поскольку все вектора девиации, ортогональные к касательным ка геодезической, включаются в конгруэнцию. Пусть /х является нулевой геодезической в одной из этих конгруэнции. Говорят, что точка р Е /х сопряжена к S вдоль /х, если вдоль // существует вектор девиации rf1
332 Глава 9. Сингулярности конгруэнции, который ненулевой на 5, но исчезает в р. По аналогии с утверждением 9.3.4 имеем: Утверждение 9.3.9. Пусть (M,gab) является пространством- временем, удовлетворяющим условию Rabkakb > О для всех нулевых ка. Пусть S - гладкое двумерное пространственноподобное подмногообразие, такое, что расширение в, скажем "выходящих" нулевых геодезических, имеет отрицательную величину во в q Е S. Тогда в области аффинного параметра А ^ 2/|#о| существует точка р, сопряженная к S вдоль выходящей нулевой геодезической [i, проходящей через q. По аналогии с теоремой 9.3.5 имеем: Теорема 9.3.10. Пусть S - гладкое двумерное пространственно- подобное подмногообразие и /i - гладкая причинная кривая от S к р. Тогда необходимым и достаточным условием того, что ц не может быть гладко деформирована во времениподобную кривую, соединяющую Sup, является то, что д - нулевая геодезическая, ортогональная S без сопряженной к S точки между Sup. В качестве следствия этой теоремы и результатов гл. 8 мы получаем следующую теорему, которая будет использована в доказательстве теоремы о сингулярностях 9.5.3. Теорема 9.3.11. Пусть (M,gafe) является глобально гиперболическим пространством-временем и К - компактное, ориентируемое, двумерное пространственноподобное подмногообразие М. Тогда каждая р е 1+(К) лежит на направленной в будущее нулевой геодезической, которая начинается в К и ортогональна К, а также не имеет ни одной точки, сопряженной К между Кир. Доказательство. То, что р лежит на нулевой геодезической из К следует из замечаний после теоремы 8.3.11. Если бы эта нулевая геодезическая не была ортогональна К или имела бы сопряженную точку, тогда по теореме 9.3.10 мы бы имели р е 1+{К), и поэтому р & 1+{К). О 9.4 Существование кривых максимальной длины В прошлых двух разделах мы установили с помощью "локальных вычислений необходимый критерий того, что времениподобная кривая
q 4. Существование кривых максимальной длины 333 является кривой максимальной длины между двумя точками (теорема 9.3.3) или между точкой и гиперповерхностью Е (теорема 9.3.5), а также условия, при которых эти критерии не появляются (утверждения 9.3.1 и 9.3.4). В этом разделе мы рассматриваем глобальные аргументы, использующие компактность пространств причинных кривых С(р,я) и C(E»tf)> определенных в разд. 8.3, для того, чтобы доказать существование кривых максимальной длины в глобально гиперболических пространствах. В следующем разделе мы увидим, что при этих предположениях эти два множества результатов ведут к противоречиям, если все геодезические полны, давая таким образом теоремы о сингулярностях. Длина т гладкой (или даже С1) кривой Л между точками p,q G М с касательной Та = (d/dt)a дается формулой г[Л] = [(-T'Ta^dt. (9.4.1) Однако для глобальных аргументов этого раздела необходимо обобщить это понятие длины непрерывной причинной кривой между р и q для того, чтобы длина т была определена для всех кривых в C(p,q). Пусть C(p,q) обозначает подмножество C{p,q), состоящее из гладких времениподобных кривых с топологией, индуцированной C(p,q). Тогда (с возможным исключением случаев, в которых нулевые геодезические соединяют р и q) C{p,q) плотно в C(p,q), т.е. за исключением некоторых нулевых геодезических каждую непрерывную причинную кривую можно выразить в виде предела (в топологии C(p,q)) последовательности гладких времениподобных кривых. Если длины г были непрерывны в С(р, д), то можно было бы расширить г до непрерывной функции на всем С(р,д), полагая r[fi] = lim т[Лп], п—*оо где {Ап} является последовательностью в C(p,q), сходящейся к непрерывной причинной кривой /х € C(p,q). Но, как показано на рис. 9.5, г не является непрерывной на С(р, q). Бесконечно близко в топологии С(р, q) к любой времениподобной кри- вой можно найти гладкую времениподобную кривую - "зигзаг" с бесконечно малой длиной. Тем не менее ниже мы покажем, что т^явля- ^ся полунепрерывной сверху на С(р,д), т.е. для каждой A Е C(p, g), Для любого е > О существует открытая окрестность О С С(р, q) на А, такая, что для всех А' е О имеем т[\'] < г [A]-he. Данное полунепрерывное сверху на С(р, q) т можно расширить на полунепрерывную сверху
334 Глава 9. Сингулярности Рис. 9.5. Гладкая времен и подобная кривая ц от р до q. Бесконечно близко к д в топологии C(p,q) находится гладкая времен и подобная кривая р! с бесконечно малым собственным временем функцию на C(p,q) следующим образом. Для р е C(p,q) и некоторой открытой окрестности О С С(р, q) кривой р, определяем Т[0] = sup{r[A]|A е О, А е С(р,<?)}, (9.4.2) где "sup" обозначает наименьшую верхнюю границу. Тогда определим т[р] следующим образом: т[р] = inf{T[0]|0 - некоторая открытая окрестность /х}, (9.4.3) где inf обозначает наибольшую нижнюю границу. Таким образом, ключевым моментом, позволяющим нам расширить определение г на С(р>#)> является следующее утверждение. Утверждение 9.4.1. Пусть (M,gab) - сильно причинное пространство-время. Пусть p,q € М и q Е 1+(р). Тогда г является полунепрерывным сверху на C(p,q). Доказательство. Пусть А £ C{p,q). Параметризуем А собственным временем и обозначим ее касательный вектор через иа. Внутри нормальной окрестности каждой точки г G А пространственноподобны геодезические, ортогональные iz°, образуют трехмерную пространст- венноподобную гиперповерхность. В достаточно малой открытой окрестности U С М на А эти гиперповерхности будут расщеплять и, т* через каждую точку U будет проходить единственная гиперповер ность. На окрестности U мы определяем функцию F, полагая, F(p) равняется величине собственного времени на А в пересечении что АС
о 4. Существование кривых максимальной длины 335 гиперповерхностью, на которой лежит р. Тогда VaF является време- липодобным вектором везде в £/, и на_А имеем иа = —VaF, так, что qaF^aF = -1 на Л. Пусть далее р Е C(p,q) и р С U. Параметризуем функцией F и обозначим ее касательный вектор через va. Поэтому 0 нашей параметризации имеем vaVaF = 1. (9.4.4) Разлагаем va следующим образом: va = aVVaF + ma, (9.4.5) где maVa-F = 0, и поэтому та является пространственноподобным. Сворачивая уравнение (9.4.5) с VaF и используя уравнение (9.4.4), вычисляем а и находим, что va = V°F/(V6FVbF) + ma. (9.4.6) Таким образом, получаем vava = (VFVaF)"1 + mama, (9.4.7) и поэтому {-vava)1'2 < (-VaFVaF)"1/2, (9.4.8) поскольку та является пространственноподобным. Поскольку вектор VaF является непрерывным, то для данного е > 0 можно выбрать окрестность U' С U на кривой Л таким образом, что (-VaFVaF)-1/2 < < 1 -f б/т [Л] в £/'. Тогда для всех р € С(р, q) в открытой окрестности О' в C(p,q), определенной С/', имеем Т[р] = f(-vava)1/2dF < т[Л] + б, (9.4.9) Что и доказывает полунепрерывность сверху. □ В разд. 8.3 мы определили С(£,р) для поверхности Коши Е в гло- ^ально гиперболическом пространстве-времени. Более широко, мы мо- Жем по аналогии определить С(£,р) для любого ахронального множества в сильно причинном пространстве-времени. Теми же аргумен- т^ми, как и выше, устанавливаем, что г является полунепрерывной ВеР*у функцией на пространстве C(p,q) гладких времениподобных Ривьгх от Е до р. Таким образом, теми же аргументами можно рас- ирить т до полунепрерывной сверху функции, определенной на всем с(£,9).
336 Глава 9. Сингулярности В предыдущем разделе мы показали, что необходимым и достаточным условием того, что гладкая кривая локально максимизиру. ет длину между двумя точками или между точкой и гиперповерхпо стью является то, что она является геодезической без сопряженных точек. Поскольку мы уже расширили определение г на непрерывные кривые, т.е. возможность того, что непрерывная, но не гладкая кривая между точками или точкой и гиперповерхностью может иметь длину ббльшую или равную длине какой-либо геодезической. Однако эту возможность можно исключить следующим образом. Прямым вычислением можно доказать, что в какой-либо открытой нормальной окрестности U единственная геодезическая, соединяющая две причин- носвязанные точки г, s £ U, имеет длину, строго ббльшую чем любая другая кусочно-гладкая причинная кривая, соединяющая эти точки (для доказательства см. утверждение 4.5.3 в книге Хокинга и Элли- са (Hawking and Ellis 1973)). Таким образом, из полунепрерывности сверху непрерывная причинная кривая //, соединяющая г и s в {/, должна удовлетворять условию r[fj] < г[7]. Однако, если выполняется равенство при /х ф 7, то положим, что точка q такая, что q € /z, но Q & 7- Пусть 7ь72 являются сегментами геодезических, соединяющих г с q и q с 5, соответственно. Поскольку по полученному выше результату 7i максимизирует длину между г и q, a 72 - между q и s, имеем t[7i] + т[72] > т[ц\ = т[у], что противоречит тому, что 7 имеет длину, строго ббльшую длины любой другой кусочно-гладкой кривой между г и s. Таким образом, в любой выпуклой нормальной окрестности единственная геодезическая, соединяющая любую пару причинно связанных точек, имеет длину строго ббльшую, чем длина любой другой непрерывной причинной кривой, соединяющей эти точки. Поэтому произвольная непрерывная причинная кривая, соединяющая любые две точки, не может быть кривой максимальной длины между этими точками, если только она не является геодезической, поскольку в том случае, если она перестает быть геодезической в какой-либо точке, то мы не сможем деформировать ее в выпуклой нормальной окрестности этой точки так, чтобы получить более длинную кривую. Таким образом, используя теорему 9.3.3, получаем следующий результат. Теорема 9.4.2. Пусть (M,ga6) является сильно причинным пространством-временем. Пусть p,q € М, и q £ J+(p) и рассмотрим функцию длины т, определенную на C(p,q). Необходимым условием того, что т достигает максимальной величины на 7 £ C(p,q), является то, что 7 является геодезической, не имеющей ни одной сопрЯ' женной к р точки между р и q.
9.5. Теоремы о сингулярностях 337 Так же, используя теорему 9.3.3, имеем Теорема 9.4.3. Пусть (M,gab) является сильно причинным пространством-временем. Пусть р G М, и Е является ахрональной, гладкой пространственноподобной гиперповерхностью, и рассмотрим функцию длины т, определенную на С(Е,д). Необходимым условием того, что г достигает максимальной величины на 7 € С(Е,р) является то, что 7 является геодезической, ортогональной Е без сопряженных к Е точек между Е up. Этот результат, конечно, не утверждает, что т должна достигать максимальной величины. Мы заканчиваем этот раздел доказательством двух ключевых результатов, которые показывают, что максимум всегда достигается в глобально гиперболических пространствах. Теорема 9.4.4. Пусть (M,ga6) является глобально гиперболическим пространством-временем. Пусть p,q e M и q € J+(p). Тогда существует кривая 7 € C(p,q), на которой г достигает своего максимального значения на С(р, q). Доказательство. По теореме 8.3.9 С(р, q) является компактным, и по утверждению 9.4.1 г является полунепрерывной сверху. Следовательно, по обобщению теоремы Л.6 прилож. А, г ограничена и достигает своего максимума. □ Теорема 9.4.5. Пусть (M,ga6) является глобально гиперболическим пространством-временем. Пусть р £ М, и Е является поверхностью Коти. Тогда существует кривая 7 £ C(E,g), на которой г достигает своего максимально значения на С(Е,д). Доказательство. Снова, С(Е,р) является компактным, и г - полунепрерывной сверху функцией. □ 9.5 Теоремы о сингулярностях Мы развили аппарат, необходимый для доказательства некоторых теорем о сингулярностях. Далее приводится полное доказательство трех теорем, которые устанавливают существование сингулярностей в смысле неполноты времениподобной или нулевой геодезических при Условиях, подходящих для космологии и гравитационного коллапса. Затем мы просто процитируем четвертую теорему, которая устанавливает существование сингулярностей при существенно более слабых предположениях.
338 Глава 9. СингулярноСТи Первую теорему, которую мы докажем, можно интерпретировать таким образом, что, если Вселенная является глобально гиперболи ческой и в один момент времени расширяется везде со скоростью, отличной от нуля, то Вселенная должна иметь сингулярное начало конечное время назад. Теорема 9.5.1. Пусть (M,gab) является глобально гиперболическим пространством-временем и Яаь£°£6 ^ О для любого временипо- добного £а, что было бы так при выполнении уравнений Эйнштейна и сильного энергетического условия для материи. Предположим, что существует гладкая (или по крайней мере С2) пространственно- подобная поверхность Коти Е, для которой след внешней кривизны (для направленной в прошлое нормальной геодезической конгруэнции) везде удовлетворяет условию К ^ С < 0, где С — постоянная. Тогда не существует направленной в прошлое времениподобной кривой от Е, имеющей длину больше, чем 3/|С|. В частности, все направленные в прошлое времениподобные геодезические неполны. Доказательство. Предположим, что существует направленная в прошлое времениподобная кривая Л от Е с длиной большей, чем 3/|С|. Пусть р - точка на Л, лежащая на расстоянии меньшем 3/|С| от Е. По теореме 9.4.5 существует кривая максимальной длины 7 от р до Е, которая также должна иметь длину больше, чем 3/|С|. По теореме 9.4.3 7 должна быть геодезической без сопряженных точек между Е и р. Это, однако, противоречит утверждению 9.3.4, которое гласит, что 7 должна иметь сопряженные точки между Е и р. Таким образом, первоначальная кривая Л не может существовать. □ Нежелательным и сильным предположением в теореме 9.5.1 является глобальная гиперболичность Вселенной. Действительно, из теоремы 9.5.1 кажется более разумным заключить, что всюду расширяющаяся Вселенная скорее должна потерять свойство глобальной гиперболичности, чем стать сингулярной. Поскольку теорема 9.4.5 играет в доказательстве критическую роль, кажется невозможным исключить предположение о глобальной гиперболичности. Мы будем доказывать теорему, следуя Хокингу (Hawking 1967), не опуская этого предположения. Основной платой за это удаление является дополнительное предположение компактности Е (т.е. Вселенная является "замкнутой") и существенно более слабое заключение, что по крайней мере одна направленная в прошлое геодезическая (а не все направленные в прошлое времениподобные кривые) должна быть неполна.
Q 5. Теоремы о сингулярностях 339 Теорема 9.5.2. Пусть (M,gab) является сильно причинным8 пространством-временем и Rab€a£b ^ 0 для любого времениподобного £а, что было бы так при выполнении уравнений Эйнштейна и сильного энергетического условия для материи. Предположим, что существует компактная, не имеющая края, ахрональная, гладкая простран- ственноподобная гиперповерхность S, такая, что для направленной в прошлое нормальной геодезической конгруэнции из S имеем К < О всюду на S. Пусть С обозначает максимальное значение К, так что К < С < О всюду на S. Тогда по крайней мере одна непродолжаемая направленная в прошлое времениподобная геодезическая из S имеет длину большую 3/|С|. Доказательство. Предположим, что все направленные в прошлое не- продолжаемые времениподобные геодезические из 5 имели длины большие 3/|С|. Поскольку пространство-время (int[D(S)],ga6) удовлетворяет предположениям теоремы 9.5.1, все направленные в прошлое непро- должаемые геодезические из 5 должны покинуть int[D(5)]. Поскольку H(S) является границей D(S) (см. утверждение 8.3.6), все такие геодезические должны пересекать H~(S) до того, как их длина станет больше, чем 3/|С|. В частности, это предполагает, что H~(S) Ф 0. Докажем, что H~(S) должно быть компактно, и затем покажем, что это ведет к противоречию. Ключевым шагом в доказательстве компактности H~(S) является доказательство того, что для каждой точки р Е H~(S) существует максимум длины ортогональной геодезической от 5 до р. Во-первых, длина любой причинной кривой от S до р € H~(S) ограничена сверху величиной 3/|С|, так, что наименьшая верхняя граница то длин всех причинных кривых от S до р существует. Нам необходимо найти ортогональную геодезическую от 5 до р с длиной то. Пусть {А„} является последовательностью времениподобных кривых от S до р, таких, что lim т[Ап] = т0. п—+оо Выберем точку qn G An и qn Ф р такую, что последовательность {Яп} сходится к р (см. рис. 9.6). Поскольку qn G /+(р), то имеем Яп € intD~(S). Следовательно, по теореме 9.4.5 существует нормальная геодезическая 7п от S до qn, которая максимизирует длину всех причинных кривых от S до qn. Ясно, что lim r[7n] = то- Хокингом (Hawking 1967) было показано, что предположение о сильной причинности можно опустить (см. задачу 3).
340 Глава 9. Сингулярности Пусть гп является точкой пересечения 7п с 5. Поскольку S компактно, то существует точка сгущения г последовательности {гп}. Пусть 7 является геодезической нормальной к 5, начинающейся в г. Тогда, ввиду непрерывной зависимости геодезических от их начальных точек и касательных векторов, кривая 7 должна пересекать H~(S) в р, и т[Ц = lim r[7n] = r0. n—»oo Таким образом, мы нашли требуемую времениподобную геодезическую, ортогональную к 5, которая максимизирует длину от 5 до р. Для доказательства компактности H~(S) покажем, что каждая последовательность {рп} в H~(S) имеет точку сгущения р G H~(S). Пусть {7п} является последовательностью ортогональных геодезических максимальной длины от S до рп. Далее мы по существу повторим аргумент, данный в конце предыдущего абзаца. Пусть гп является точкой пересечения {7п} с 5, и г - точка сгущения последовательности {гп}. Пусть 7 является геодезической, начинающейся в г и ортогональной 5, и р - точка пересечения 7 с H~(S). Тогда р является точкой сгущения {рп}- Таким образом, H~(S) компактно. Однако, поскольку edge(5) = 0, тогда по теореме 8.3.5 H~(S) содержит непродолжаемую в будущее нулевую геодезическую. Поскольку (M,gab) является сильно причинным, то по лемме 8.2.1 это невозможно, если H~(S) компактно. Таким образом, наше предположение о том, что все направленные в прошлое непродолжаемые временипо- добные геодезические от 5 имеют длины больше 3/|С|, приводит к противоречию. □ Предыдущие две теоремы устанавливают непродолжаемость вре- мениподобных геодезических в космологическом контексте. Следующая теорема доказывает непродолжаемость нулевых геодезических в контексте гравитационного коллапса. Компактное, двухмерное, гладкое, пространственноподобное подмногообразие Т, обладающее свойством, что расширение в обоих множеств (т.е. "входящих" и "выходящих") направленных в будущее нулевых геодезических, ортогональных Т, всюду отрицательно, называется ловушечной поверхностью- 8 расширенном решении Шварцшильда все сферы внутри черной дыры (область II на рис. 6.9) являются ловушечными поверхностями. В гл. 12 будет показано, что из этого факта следует, что ловушечные поверхности должны формироваться в любом гравитационном коллапсе, когда начальные условия достаточно близки к начальным условиям для сферического коллапса. Следующая теорема, которая исторически была первой доказанной общей теоремой о сингулярности*
Q.5. Теоремы о сингулярностях 341 H"(S) Рис. 9.6. Пространственно-временная диаграмма, показывающая конструкцию, использованную в доказательстве теоремы 9.5.2 (Penrose 1965a), показывает, что при некоторых дальнейших предположениях сингулярность должна появиться после появления ловушеч- ной поверхности. Теорема 9.5.3. Пусть (M,gofc) является связным, глобально гиперболическим пространством-временем с некомпактной поверхностью Коти Е. Предположим, что Rabkakb ^ 0 для любого нулевого ка, что было бы так при выполнении уравнений Эйнштейна для (^> 8ab) u слабого или сильного энергетического условия для материи. Предположим далее, что М содержит ловушечную поверхность Т. Пусть во < О обозначает максимальную величину в для обоих наборов ортогональных к Т геодезических. Тогда по крайней мере одна Оправленная в будущее непродолжаемая ортогональная нулевая гео- оезическая от Т имеет аффинную длину, не превосходящую 2/|0о|- Цоказательство. Предположим, что все направленные в будущее нулевые геодезические из Т имеют аффинную длину ^ 2/|#о|. Тогда **°Жно определить отображение /+:Гх [0,2/|#о|] —► М, полагая, что J w>a) равна точке из М, лежащей на нулевой "выходящей" геодезиче- °й, нормальной к Т и начинающейся в q, с аффинным параметром а. нелогично определим /_ для "входящих" геодезических. Поскольку a6s £ ^ 0 для любого времени подобного £°, что было бы так при вы-
342 Глава 9. Сингулярносц полнении уравнений Эйнштейна и сильного энергетического условия для материи, Т х [0,2/|0о|] является компактным множеством, и /+ и /_ непрерывны, а образы /+ и /_ и, следовательно, их объединение A = f+{Tx [О,2/|0о|]}и/_{Гх [0,2/|в„|]} также должно быть компактным (см. прилож. А). Однако, по утверждению 9.3.9 и теореме 9.3.11 1+{Т) - подмножество Л, и поскольку /+(Т) является замкнутым, то мы заключаем, что 1+(Т) компактно. Покажем далее, что компактность /+(Г) противоречит существованию некомпактной поверхности Коши Е. Используя лемму 8.1.1, выбираем гладкое времениподобное векторное поле ta на М. Поскольку /+(Т) является ахрональным, то каждая интегральная кривая ta может пересечь /+(Г) самое большее один раз, и каждая интегральная кривая ta пересекает £ в точности один раз. Таким образом, можно определить отображение ф : /+(Т) —► Е посредством интегральной кривой ta от /+(Т) до Е. Пусть 5 С Е обозначает образ ф[1~*~(Т)] от 1+(Т) при отображении ф и пусть S имеет топологию, индуцированную Е. Тогда ф : /+(Т) —► S является гомеоморфизмом. Поскольку 1+(Т) компактно, то S тоже, и, следовательно, как подмножество Е, 5 должно быть замкнуто. С другой стороны, поскольку /+(Т) является С°-многообразием (см. теорему 8.1.3), то каждая точка /+(Т) имеет окрестность, гомеоморфную открытому шару в R3. Поскольку ф - гомеоморфизм, то же самое свойство выполняется и для 5, и, следовательно, как подмножество Е, S должно быть открыто. Но поскольку М является связным, то Е также должно быть связным (см. теорему 8.3.14). Таким образом, поскольку /+(Г) ф 0, то мы должны иметь S = Е. Это, однако, невозможно, поскольку S компактно, а Е - нет. О И снова теорема 9.5.3 содержит нежелательное допущение, что (M,ga6) является глобально гиперболичным. Однако с некоторыми дополнительными предположениями это допущение можно опустить с помощью аргументов, аналогичных использованным в доказательстве теоремы 9.5.2. Мы не будем приводить эти аргументы здесь, а просто сошлемся на теорему Хокинга и Пенроуза (Hawking and Penrose 1970), в которой устранены большинство нежелательных предположений, отсылая читателя к книге Хокинга и Эллиса (Hawking and Ellis 1973) для доказательства. Теорема 9.5.4. Предположим, что пространство-время (M.gab> удовлетворяет следующим четырем условиям. (1) RabVavb ^ 0 для
9.5- Теоремы о сингулярностях 343 любого времениподобного или нулевого va, что было бы так при выполнении уравнений Эйнштейна и сильного энергетического условия для материи. (2) Выполняются времениподобное и нулевое общее условия (см. разд. 9.3). (3) Не существует замкнутых времениподоб- ных кривых. (4) Выполняется по крайней мере одно из следующих трех свойств: (a) (M,go6) обладает компактным ахрональным множеством без края (т.е. (M,gab) является замкнутой Вселенной), (Ь) (M,gab) обладает ловушечной поверхностью, или (с) существует точка р € М, такая, что расширение направленных в будущее (или прошлое) нулевых геодезических из р становится отрицательным вдоль каждой геодезической в этой конгруэнции. Тогда (M,gab) должно содержать по крайней мере одну времениподобную или нулевую геодезическую. Эта теорема, по сравнению с теоремой 9.5.2, добавляет только одно предположение о том, что выполняются общие условия. Совершенно опускается предположение, что Вселенная всюду расширяется. Аналогично, по сравнению с теоремой 9.5.3, вышеприведенная теорема добавляет только общее условие плюс условие, что Rab£a£b ^ 0 для любых времениподобных векторов. Полностью опускается предположение, что (M,ga6) глобально гиперболично. Таким образом, теорема 9.5.4 имеет более широкую применимость, чем три доказанные ранее теоремы. С другой стороны, выводы теоремы 9.5.4 немного слабее в том смысле, что не имеется информации, касающейся того, какая геодезическая - времениподобная или нулевая - является неполной. Ганнон (Gannon 1975) усилил теорему 9.5.4, добавляя четвертую альтернативу к условию 4, а именно, что (M,gab) обладает замкнутым, ахрональным, неодносвязным9 множеством S без края и является "регулярным на бесконечности". Здесь "регулярное на бесконечности" означает, что S можно выразить как объединение вложенного семейства множеств Wi (т.е. каждое Wi удовлетворяет соотношению Щ С Wi+i), таких, что (i) каждое Wi компактно, (ii) его граница Wi в S гомеоморфна 2-сфере, (Ш) 5 - int(H^) гомеоморфно 52 х R+, где ** = [0, оо), и (iv) расширение в входящих нулевых геодезических, ортогональных каждому Wi, отрицательно всюду на Wi. За исключени- ем компактности10 Wi четыре предположения, определяющие асимптотическую регулярность, удовлетворяются во всех асимптотически плоских гиперповерхностях в асимптотически плоских пространствах 1см. гл. 11). Поэтому, в сущности, теорема Ганнона показывает, что См. гл. 13 для определения односвязного множества. Теорема о сингулярностях, справедливая для случая, когда W{ некомпактно, Сказывается Ганноном (Gannon 1976).
344 Глава 9. Сингулярное^ асимптотически плоское пространство-время, удовлетворяющее условиям (1)-(3) теоремы 9.5.4, и которое "изначально" имеет соответствующую нетривиальную топологию, должно образовывать сингу. лярность. Мы отсылаем читателя к работам Ганнона (Gannon 1975, 1976) для дальнейших деталей и результатов. Теорема 9.5.4 дает нам вескую причину верить, что наша Вселенная сингулярна. Как уже обсуждалось в гл. 5, наблюдательные данные определенно свидетельствуют о том, что наша Вселенная - или по крайней мере часть нашей Вселенной внутри нашего причинного прошлого - хорошо описывается моделью Робертсона - Уокера (не сильно отличаясь от модели к = 0) по крайней мере до момента отделения излучения от материи. Однако в этих моделях расширение направленных в прошлое нулевых геодезических, исходящих из события, представляющего настоящее время, становится отрицательным в момент более близкий, чем момент отделения. Таким образом, существуют достаточные основания верить, что условие 4(c) теоремы 9.5.4 выполняется в нашей Вселенной11. Поскольку мы ожидаем, что условия (1)-(3) также выполняются, то выходит, что наша Вселенная должна быть сингулярной. Поэтому мы должны быть готовы к ожидаемому нарушению классической общей теории относительности вблизи сингулярности, если мы хотим понять происхождение нашей Вселенной. Задачи 1. Пусть (M,ga6) является пространством-временем со всюду вре- мениподобным полем Киллинга £а. Пусть /л является произвольной времениподобной кривой, параметризованной собственным временем т, и иа обозначает единичный касательный к /х вектор. Определим Е = — иа£а. a) Показать, что \dE/dr\ < аЕ, где а обозначает величину ускорения на \i. • b) Используйте результат части (а) и покажите, что для времениподобной кривой с ограниченным интегральным ускорением, т.е. при J adr < оо, Е может измениться только на конечную величину. Используйте этот результат и докажите, что |£a£a| ограничено 11 Этот вывод также можно получить из гораздо более слабого предположения; см. гл. 10 в книге Хокинга и Эллиса (Hawking and Ellis 1973).
о 5. Теоремы о сингулярностях 345 на каждой времениподобной кривой с ограниченным интегральным ускорением. Условие J adr < 00 выполняется для всех мировых линий, чье ускорение физически реализуется ракетным кораблем. Таким образом, часть (6) показывает, что даже если наблюдатели обеспечены ракетными кораблями, они не смогут достигнуть сингуляр- ностей пространства-времени, где норма времениподобного поля Киллинга стремится к — оо, как это имеет место, например, в решении Шварцшильда с отрицательной массой (Chakrabarti, Geroch and Liang 1983). 2. Пусть M является тором (51 х 51). Определим лоренцеву метрику gab соотношением (Misner 1963) ds2 = cos x(dy2 — dx2) + +2 sin xdxdy, где угловые координаты х, у изменяются в следующих пределах: 0 < х < 2п, 0 < у < 2п. Показать, что замкнутые кривые х = 7г/2 и х = 37г/2 являются нулевыми геодезическими с аффинным параметром Л, связанным с координатой у соотношением \\dy/d\ = 1. Другими словами, показать, что, если пересекать эти кривые бесконечно много раз в отрицательном направлении у, то используется только конечная величина аффинного параметра. Заметим, что когда мы параллельно переносим касательный вектор к геодезической (один оборот) в отрицательном направлении у, то касательная увеличивается на множитель е*. Таким образом, это компактное многообразие с гладкой метрикой является неполным по нулевым геодезическим. Аналогично, времениподобные и пространственноподобные геодезические наматываются на тор бесконечно много раз в направлении у, затрачивая только конечное значение аффинного параметра, когда они достигают х = 7г/2 и х = 37г/2, и поэтому (M,ga6) является неполным также и по времениподобным и по пространственно- подобным геодезическим. 3. Устраните допущение сильной причинности в теореме 9.5.2 следующим образом. В предположении, что все направленные в прошлое времениподобные геодезические имеют длины большие 3/|С|, было показано, что (а) для р € H~(S) существует геодезическая 7Р максимальной длины из р к S и (6) H~(S) компактно. Определите Т: H~(S) —> R соотношением Т(р) = т[^р]. (i) Показать, что Т является непрерывным отображением и, следовательно, достигает минимального значения на H~(S).
346 Глава 9. Сингулярносп (ii) Показать, что Т строго уменьшается вдоль каждой направ- ленной в будущее нулевой геодезической, порожденной Я~(5). Таким образом, получаем противоречие с (i).
Глава 10 формулировка начальных данных Как обсуждалось в гл. 4, общая относительность утверждает, что структура пространства-времени и гравитация описываются пространством-временем (M,gofe), где М является четырехмерным многообразием и gab является лоренцевой метрикой, удовлетворяющей уравнениям Эйнштейна. В гл. 5 и 6 мы получили точные решения уравнений Эйнштейна, с помощью которых сделали успешные физические предсказания, касающиеся космологии, а также структуры гравитационных полей сферических тел. Однако требуется гораздо больше для того, чтобы общая теория относительности стала физически более жизнеспособной теорией. Мы видим широкое разнообразие физических явлений, для которых общая теория относительности должна иметь большое значение. Существенно, что имеется соответствующий широкий класс решений уравнений Эйнштейна. Например, из физических соображений мы знаем, что существует множество возможных гравитационных полей изолированных тел. Если бы не существовал соответствующий широкий класс решений уравнений Эйнштейна, то мы должны были бы убрать общую относительность из числа корректных теорий природы. Близкая проблема состоит в том, что в классической физике мы часто имеем дело с физическим контролем начальных условий в системе. Если система свободно развивается, то ее поведение полностью определяется начальными условиями. Например, в обычной механике частицы мы имеем возможность контролировать начальные положения и скорости частиц. Если система развивается без внешних влияний, то для заданных начальных условий динамическая эволюция частиц определена. Аналогично, как обсуждалось в разд. 10.2, в электромагнетизме мы имеем возможность подготовить начальные значения электрического поля Е и магнитного поля J5, удовлетворяющих связям V • Е = 47Г/9 и V • В = 0. И снова для этих начальных условий последующая эволюция системы определяется. Хотя на- ш& практическая возможность контроля начальных условий в гравитационных проблемах более ограничена, естественно верить, что (по кРайней мере в областях много меньших космологических масштабов)
348 Глава 10. Формулировка начальных данных мы должны были бы в принципе быть в состоянии контролировать начальные условия гравитационного поля и распределения материи, которые возможно удовлетворяют некоторым связям, как в электромагнетизме. Таким образом, если только общая теория относительности не отличается кардинально от других теорий классической физики, то она должна допускать физически разумную детализацию начальных данных. Более того, эти начальные данные для уравнений Эйнштейна (с возможными дополнительными уравнениями для материи) должны определять последующую эволюцию. Если теорию можно сформулировать таким образом, что "подходящие начальные данные" можно задать (с возможными связями) так, чтобы последующая динамическая эволюция системы определялась однозначно, то мы говорим, что теория обладает формулировкой начальных значений. Однако, даже если такая формулировка существует, остаются другие условия, которым физически разумная теория обязана удовлетворять. Во-первых, в некотором смысле "малые изменения" начальных данных должны давать только соответственно "малые изменения" решения в некоторой фиксированной компактной области пространства-времени. Если это свойство не выполняется, то теория существенно теряет всю свою предсказательную мощность, поскольку начальные условия могут быть измерены только с конечной точностью. Предполагается, что патологическое поведение, происходящее из нарушения этого свойства, не появляется в физике. Во-вторых, изменения начальных условий в области S на поверхности начальных данных не должны приводить к каким-либо изменениям в решении вне причинного будущего, J+(5), этой области. Если бы такие изменения появились, то мы имели бы возможность использовать их для распространения сигналов "быстрее скорости света". Это могло бы сломать целостность общей теории относительности. Если теория обладает формулировкой начальных значений, удовлетворяющей обоим этим свойствам, то мы говорим, что формулировка начальных значений хорошо поставлена. Подчеркнем, однако, что мы здесь не пытаемся дать математически строгое определение "хорошо поставленной формулировки начальных значений", поскольку точные критерии зависят от типа рассматриваемой теории. Целью данной главы является установление того факта, что общая теория относительности допускает хорошо поставленную формулировку начальных значений. Таким образом, общая теория относительности выдерживает этот строгий тест на физическую жизнеспособность теории. Раздел 10.1 мы начинаем с обсуждения формулировки начальных значений в механике частицы и теории поля Клейна - Гордона ь*
1 Начальные данные для частиц и полей 349 оостранстве-времени Минковского. В разд. 10.2 анализируем фор- улировку начальных значений уравнений Максвелла в пространстве- оемени Минковского, которая имеет много аналогий с общей теорией относительности в отношении начальных связей и калибровочной свободы. Затем дается формулировка начальных значений в общей теории относительности. Наш анализ уравнений Эйнштейна и других полевых уравнений основан на представлении их в виде системы гиперболических уравнений второго порядка. Здесь не будет обсуждаться анализ уравнений Эйнштейна, сформулированных в виде системы гиперболических уравнений первого порядка (Fisher, Marsden 1972). Кроме того, мы рассмотрим только формулировку начальных значений на простран- ственноподобной поверхности Коши. Также будет дана формулировка начальных значений для общей теории относительности на начальной поверхности, полученной пересечением двух нулевых поверхностей (Sachs 1962a; Muller zum Hagen, Seifert 1977). 10.1 Начальные данные для частиц и полей Основной особенностью второго закона Ньютона F = ma (10.1.1) в обычной нерелятивистской механике является то, что он устанавливает связь второй производной по времени а от пространственного положения частицы с силой F, которая (в обычных ситуациях) является известной функцией положения и скоростей частиц в системе. Таким образом, для системы частиц, взаимодействующих между собой и/или с внешними силами, возможно, зависящими от положения и скоростей частиц, но не от высших производных по времени от положения частицы, законы механики имеют форму d*2 *-/>(«.....«$.....&). (юл,, где г = 1,...,п, и число п неизвестных положений называется числом степеней свободы системы. Уравнение (10.1.2) является системой п °быкновенных дифференциальных уравнений второго порядка для п величин <7i(t), ..., qn(t). Из теории таких обыкновенных дифференциальных уравнений хорошо известно (см., например, (Coddington, Vinson 1955))1, что для данных произвольных начальных положений lQ ^м- также Гантмахер Ф.Р. Лекции по аналитической механике. М.: Наука, 1966-Яртш. ред.
350 Глава 10. Формулировка начальных данщ>1х <7нь .», Япо и скоростей (dqi/dt)0, ..., (dqi/dt)n частиц при t — t0 всегда существует единственное решение уравнения (10.1.2) в конечном временном интервале относительно to с такими начальными значениями. Поэтому обычная механика частицы обладает формулировкой начальных значений. Более того, в фиксированный момент времени t положения q\(£), ..., qn(t) являются непрерывными функциями начальных положений и скоростей частиц. Поскольку причинное распространение изменений начальных данных не является спорным вопросом в нерелятивистской механике, мы заключаем, что формулировка начальных значений в нерелятивистской механике частиц хорошо поставлена. Этот пример из механики частицы содержит существенные особенности формулировки начальных значений, которые имеются во всех физически разумных теориях поля. Рассмотрим, например, массивное поле Клейна - Гордона 0, распространяющееся в пространстве- времени Минковского, дадаф - т2ф2 = 0. (10.1.3) Выбирая глобально инерциальные координаты £, ж, t/, z, мы можем записать это уравнение в форме д2ф д2ф д2ф д2ф о Математическая структура уравнения (10.1.4) заметно отличается от уравнения (10.1.2): уравнение (10.1.2) является системой обыкновенных дифференциальных уравнений, а уравнение (10.1.4) является одним дифференциальным уравнением в частных производных. Тем не менее основное содержание этих уравнений одинаково. Оба уравнения показывают, как можно вычислить вторую производную по времени от неизвестной величины (или величин) в какой-либо момент времени при известных значениях самой величины (или величин) и первой ее производной по времени в этом момент. (Фактически для уравнения (10.1.4) не нужно знать дф/dt для того, чтобы вычислить д2ф/& » но в случае более общего вида уравнения или в случае неинерциаль- ной системы координат величина дф/dt и первые пространственные производные могут появиться в правой стороне уравнения, соответствующего уравнению (10.1.4).) Действительно, мы можем понимать уравнение (10.1.4) как уравнение, появляющееся в пределе N —» оо системы N частиц, связанных с ближайшими соседями взаимодействием вида гармонического осциллятора (Goldstein 1980). В этом пр^Д^ ле дискретный индекс г становится непрерывной величиной х, и ко* нечный набор переменных <&(£), удовлетворяющих уравнению (10.1.2;»
ipi Начальные данные для частиц и полей 351 становится полевой переменной ф(х^), удовлетворяющей уравнению (10.1.4). физическая и математическая аналогия между уравнениями (10.1-2) и (10.1.4) предполагает, что теория Клейна - Гордона долж- на иметь следующую формулировку начальных значений. Мы произвольным образом задаем величины ф и дф/dt на пространственной поверхности Ео постоянного значения инерциального времени t = to. Тогда должно существовать единственное решение уравнения (10.1.4) с этими начальными данными. Действительно, нетрудно показать, что теория Клейна - Гордона допускает такую формулировку, если рассматривать только аналитические начальные данные, т.е. когда ф и дф/dt являются аналитическими функциями на Ео. Для этого заметим, что из таких начальных данных мы можем вычислить все пространственные производные ф и дф/dt при t = to. Уравнение (10.1.4) тогда дает д2ф/д11 в момент t = to, и, вычислив пространственные производные этого уравнения, мы можем получить все пространственные производные д2ф/дЬ2 в момент t = to через вычисленные ранее величины. Затем можно продифференцировать уравнение (10.1.4) по f и получить д3ф/д^ и все пространственные производные этой величины при t = to. Продолжая таким образом, мы получаем все производные поля ф в момент t = to. Это дает нам возможность выписать формальный степенной ряд для решения ф. Как было показано Коши и затем обобщено Ковалевской для широкого класса дифференциальных уравнений в частных производных и даже для системы дифференциальных уравнений в частных производных, этот степенной ряд имеет конечный радиус сходимости. Мы воспроизведем эту теорему для случая дифференциальных уравнений второго порядка (т.е. уравнений, содержащих вторые частные производные неизвестной переменной, но не содержащие производные более высокого порядка). Эта теорема легко обобщается на уравнения произвольного порядка. Доказательство теоремы можно найти в большинстве учебников по дифференциальным уравнениям (Courant, Hilbert 1962). Теорема 10.1.1. (Теорема Коши - Ковалевской). Пусть t, x1, ..., х являются координатами в Rm. Рассмотрим систему п диффе- Унциальных уравнений в частных производных для п неизвестных Функций фг, ..., фп на Rm, имеющую следующий вид: д2ф. -g^1 = Fi {t,xQ;фj',дфj/дxQ',д2фj/дtдxQ•,дt2фj/дxaдx(3), (10.1.5) е каждая функция Fj является аналитической функцией своих пе- ^енных. Пусть fi(xa) и gi(xa) - аналитические функции. Тогда су-
352 Глава 10. Формулировка начальных дапц|4Эс ществует открытая окрестность О на гиперповерхности t = £0 та- кая, что в О существует единственное аналитическое решение уравнения (10.1.5), такое, что ф^о.х01) = fi(xQ) и -§j-{to,xa) = gi(xQ), Теорема Коши - Ковалевской показывает, что теория Клейна - Гор. дона имеет формулировку начальных значений по крайней мере для аналитических начальных данных. Это показывает, что по аналогии с механикой частиц начальное значение поля ф и его первая производная по времени могут быть выбраны произвольно, и что эти начальные значения определяют последующую эволюцию ф. Это также показывает, что существует большой класс решений уравнений Клейна - Гордона, поскольку существует столько аналитических решений уравнения (10.1.4), сколько есть пар произвольных аналитических функций трех пространственных переменных ха. Однако анализ Коши - Ковалевской не достаточен для того, чтобы показать, что формулировка начальных значений теории Клейна - Гордона хорошо поставлена. Во-первых, этот анализ не устанавливает в подходящем смысле непрерывную зависимость решений от начальных данных. Более точно мы можем определить топологию на пространстве начальных данных, по которой две функции являются "близкими", если они сами и конечное число (или все) их производных близки. Например, можно определить "расстояние" между функциями /i и /г при t = £о на поверхности начальных данных Ео посредством суммирования наименьших верхних границ (sup) величины (/i -/2) и всех ее производных вплоть до порядка к: ll/i-ЛЦ = sup\Mx)-f2(x)\ + хбЕо 2^ sup fcl,*2,fc3X€E° &*+k*+k*(fl-f2) dxkldyk2dzk3 (10.1.6) где к\ + k<i + &з < /:. Затем мы можем взять открытые по этой норме шары в качестве базиса топологии (см. прилож. А). (Можно дать также и другой приемлемый выбор топологии.) В компактной области пространства-времени можно определить аналогичную топологию на решениях. Теорема Коши - Ковалевской не гарантирует непрерывности отображения аналитических начальных данных в соответствующие им аналитические решения для любого разумного выбора топологии на пространстве начальных данных и пространстве решений. Более того, анализ Коши - Ковалевской не может даже рассматривать вопрос о причинной эволюции поля. Аналитическая функцн однозначно определяется значениями ее самой и всех ее производнЫ в одной точке и, таким образом, однозначно определяется ее зна4 нием в некоторой произвольно малой открытой окрестности точк
10Х Начальные данные для частиц и полей 353 9то означает, что в аналитическом случае, если мы знаем решение, соответствующее начальным данным в некоторой открытой области U начальной поверхности Ео, то мы фактически должны знать решение, соответствующее всей гиперповерхности Ео. Поэтому для анализа причинной эволюции необходимо рассматривать неаналитические начальные данные. В то же время анализ Коши - Ковалевской не доказывает даже существование решения для С°° неаналитических начальных данных. Таким образом, для того чтобы показать, что формулировка начальных значений теории Клейна - Гордона хорошо поставлена, требуются методы, отличные от анализа Коши - Ковалевской. Сейчас мы дадим набросок доказательства того, что формулировка начальных значений для массивного поля Клейна - Гордона в пространстве- времени Минковского является хорошо поставленной. Затем мы установим некоторые гораздо более общие результаты, полученные этим методом. Пусть ф является гладким решением уравнения (10.1.3). Тогда тензор энергии-импульса поля ф ТаЬ = дафдьф - iffcb {дсфдсф + гп2ф2) (10.1.7) (см. уравнение (4.2.20)), сохраняется даТаЬ = 0. (10.1.8) Следовательно, полагая, что £а = (d/dt)a является полем Киллинга, ортогональным в момент t = to гиперповерхности Ео, имеем да {ТаЬ?) = 0. (10.1.9) (Фактически для любого поля Киллинга и любого сохраняющегося симметричного Таь в искривленном пространстве-времени мы имеем ^а{Таь£ь) = Ta6Va£6 = 0 по уравнению (С.3.1).) Пусть 50 является (трехмерным) замкнутым шаром на начальной гиперповерхности Ео. Пусть Ei обозначает гиперповерхность в момент t = t\ (t\ > to), и # = £>+(S0) П J-(Ei), и пусть Si = D+(S0) П Еь Наконец, пусть 52 °б°значает "нулевую часть" границы К (см. рис. 10.1). Интегрируя Уравнение (10.1.9) по К и применяя закон Гаусса, получаем / TabC? + / Tablaib = [ TabCZb, (10.1.10) JS! JS2 JSo ^е Ja является направленной в будущее нормалью к 5г.
354 Глава 10. Формулировка начальных данных У7< <ь / Рис. 10.1. Пространственно-временная диаграмма, показывающая область К, по которой для получения (10.1.10) интегрируется (10.1.9) (В уравнении (10.1.10) подразумеваются естественные элементы объема на So и S\; элемент объема на нулевой поверхности 5г объясняется в прилож. В.) Нетрудно проверить, используя уравнение (10.1.7), что Таь удовлетворяет условию энергодоминантности, т.е. если va является направленным в будущее времениподобным вектором, тогда —Tabvb является направленным в будущее времениподобным или нулевым вектором. Следовательно, мы имеем Таь1а£ь > 0. Поэтому второй член в левой части уравнения (10.1.10) неотрицателен. Выписывая в явном виде другие члены, получаем х, \т v</> + тп2ф2 <ШУ + - |2 2^2 \/ф\ Л-тГф' (10.1.11) Уравнение (10.1.11) является ключевым для демонстрации существования хорошо поставленной формулировки начальных значений. Во-первых, оно показывает (без обращения к аналитичности), что возможно не более одного решения в D+(Sq) с заданными начальными данными {ф.дф/dt) на So- А именно, если ф\ и 02 являются С2 функциями, удовлетворяющими уравнению (10.1.3) с теми же гладкими (но не обязательно аналитическими) начальными данными, тогда их разница ф = ф\ — фъ должна быть С2 решением уравнения (10.1.3) с нулевыми начальными данными. Тогда для ф правая сторона уравнения (10.1.11) исчезает, что означает (в предположении т ф 0), что ф = 0 на S\ и, следовательно, (поскольку Ei произвольная) ф = 0 всюду в Z}+(So). (Если же т = 0, то мы имеем V^ = 0 и дф/dt = 0 в D+(So) и, поскольку ф = 0 на So, то это снова означает, что ф = 0 всюду на D+(So).) Аналогично, ф также исчезает всюду на D"(So)- Этот результат также показывает, что второе требование хорошо поставленной формулировки начальных значений выполняется: вариа-
10.1- Начальные данные для частиц и полей 355 ция начальных данных вне So не может влиять на решение внутри D(So). Уравнение (10.1.11) также показывает, что решения непрерывно зависят от начальных данных. Для доказательства этой непрерывной зависимости (это также позволит нам доказать существование решений для произвольных гладких начальных данных) мы действуем следующим образом. Для простоты мы ограничимся массивным случаем ffi -ф. 0. Во-первых, дифференцируя уравнение (10.1.4) по координате #м> мы видим, что все частные производные также удовлетворяют уравнению Клейна - Гордона. По этой причине мы получаем неравенства типа (10.1.11), ограничивающие поверхностные интегралы по S\ от более высоких пространственных и временных производных ф соответствующими поверхностными интегралами по So. Используя уравнение (10.1.4), мы можем выразить все слагаемые на So, содержащие более одной производной по времени, через начальные данные </>, дф/dt и их пространственные производные на So. Таким образом, мы получаем неравенства вида: Uhuk < Cllk\\\4>\\\so,k + C2lk\\\04>/m\so,k-u (10.1.12) где нормы |||0|||si,fc и IH^IHso,* определяются соотношениями \\\Ф\\\к* = [ М2 + • • • + Е 1^2Ь (ю-1-13) IIMIllo,* = / {\Ф\2 + '' • + Е |Л*1*12}. (Ю.1.14) JSo i где dkl обозначает fc-ую частную производную по пространственным и временным координатам, a Dkl обозначает fc-ую частную производную только по пространственным координатам. (В уравнениях (10.1.13) и (10.1.14) берется сумма по всем таким частным производным порядка меньше или равным fc. Нормы, определенные уравнениями (10.1.13) и (10.1.14), называются нормами Соболева.) Интегрируя уравнение (10.1.12) по t\ от £о ДО максимальной величины £, для которой D+(So)n ^t ф 0, получаем №lb+(S).* < CUIMIk,* + С'2>к\\\дф/Щ\8о,к-1. (10.1.15) Далее мы применяем следующий ключевой результат. Пусть А является некоторым подмножеством Rn (с естественной евклидовой метрикой), которое удовлетворяет условию однородного конуса, определен- н°го следующим образом. Существует конус фиксированной высоты h
356 Глава 10. Формулировка начальных данных и заданного угла при вершине в такой, что для каждой точки р е А этот конус можно изометрично отобразить в А с вершиной в р. Тогда для к > п/2 норма \\\л,к гладкой функции / (определенная уравнением (10.1.13) с областью интегрирования А) ограничивает численную величину / в Л, т.е. существует постоянная С такая, что sup|/(x)| ^ C||/|U,fc. (10.1.16) хел Набросок доказательства этого результата приведен в задаче 1. Таким образом, положив А = D+(So) и к = 3, мы находим, используя уравнения (10.1.15) и (10.1.16), sup |0| ^ с;'ц|0|||5о;3 + (%\\\дф/щ\м. (ю.1.17) x€D+(S0) Аналогично, численная величина m-ой частной производной ф ограничена выражением, зависящим от начальных данных, sup \дтф\ ^ C;',m||M||s0,3+m + С5/1т|||в0/Л|||5Ь,2+т. (Ю.1.18) xeD+(S0) Такие же ограничения выполняются и для х Е D~(S). Уравнения (10.1.17) и (10.1.18) показывают непрерывную зависимость поля ф и его производных от начальных данных. Более точно, если мы определим топологию на решениях в D(So) через норму, определенную уравнением (10.1.6) с к = га, и определим топологию на начальных данных на So (или на всей Ео) через норму |||... |||s0,3+m или норму (10.1.6) с к = га + 3, тогда уравнение (10.1.18) показывает, что линейное отображение начальных данных в решения ограничено и, следовательно, непрерывно. В более общем виде, отображение начальных данных на Ео в решения в фиксированной компактной области пространства-времени непрерывно в этих топологиях. Наконец, мы используем эту непрерывность для доказательства существования гладкого решения ф для произвольных тладких начальных данных (ф, дф/dt) на Ео. Далее выбираем последовательность {(Ф?1 дф^/дЬ)}, г = 1,2,..., аналитических начальных данных на Ео таких, что функции в этой последовательности и их пространственные производные вплоть до порядка (3 + га) равномерно сходятся к ф,дф/dt на So. По теореме 10.1.1 существует решение ф™ с начальными данными (Ф™,дф™/д1) на Ео. (Фактически теорема 10.1.1 в том виде, в котором она приведена, гарантирует существование решения только в открытой окрестности Ео, но последующий анализ в линейном случае показывает, что решение существует во всем Rn.) Однако
10.1. Начальные данные для частиц и полей 357 в соответствии с уравнением (10.1.18) (и соответствующим неравенством для D~(So)) {ф™} и ее первые т производные должны равномерно сходиться в D(So) к функции фт и ее первым га производным. Выбирая т > 2, легко проверить, что эта предельная функция фт должна удовлетворять уравнению (10.1.4). Таким образом, для всех fti > 2 получаем Ст решение в D(So). Выше мы доказали, что есть по крайней мере одно С2 решение в D(So). Поэтому фт = фт = ф для всех га, га' > 2. Поскольку ф является Ст функцией для всех га > 2, мы доказали существование С°° решения во всей области D(So). Так как So - произвольная поверхность, то это решение существует на всем R4. Таким образом, мы установили, что массивное поле Клейна - Гордона в пространстве-времени Минковского имеет хорошо поставленную формулировку начальных значений. Подчеркнем, что несмотря на анализ Коши - Ковалевской мы провели доказательство, используя детальную структуру уравнения Клейна - Гордона. В частности, в ряде мест была использована линейность уравнения, и его "волновой характер" был существенен для конструирования сохраняющегося Tab с положительной энергией. Если бы мы изменили знак д2ф/д12 в уравнении (10.1.4), превращая таким образом уравнение (10.1.4) в четырехмерное уравнение "лапласовского типа", то мы не имели бы возможности конструирования такого Таь, и метод доказательства был бы неприменим, хотя теорема 10.1.1 все же могла бы выполняться. Действительно, хорошо известно, что уравнения "лапласовского типа" не имеют хорошо поставленной формулировки начальных значений. Полученные выше результаты для поля Клейна - Гордона можно существенно обобщить. В частности, можно заменить уравнение Клейна - Гордона (10.1.3) в R4 уравнением на многообразии М вида ^а^ьФ + Аа Va0 + Вф + С = 0, (10.1.19) где Va - оператор производной, Аа является произвольным гладким векторным полем, В и С - произвольные гладкие функции, и gab является произвольной гладкой лоренцевой метрикой, такой, что пространство-время {M,gab) глобально гиперболическое. (Говорят, что линейное дифференциальное уравнение в частных производных второго порядка является гиперболическим тогда и только тогда, когда оно может быть выражено в форме (10.1.19).) Это уравнение имеет хорошо поставленную формулировку начальных значений для начальных Данных (Ф, па^аф) на гладкой, пространственноподобной поверхности Коцщ Е, где na - вектор единичной нормали к Е. Есть несколько суще- Ственных дополнительных упрощений этого намного более общего ре-
358 Глава 10. Формулировка начальных данць,х зультата. Точнее, для уравнения (10.1.19) в общем случае мы не имеем возможности сконструировать сохраняющийся Таь, удовлетворяющий условию энергодоминантности, но возможна такая конструкция ТаЬ удовлетворяющего условию энергодоминантности, что условие сохранения нарушается, но таким образом, что неравенства вида (10.1.12) (где Ci,fc и С2,к являются функциями времени) все же выполняются. Если коэффициенты g*6, Аа, В и С являются неаналитическими функциями, то в доказательстве существования мы вначале, до применения теоремы 10.1.1, должны аппроксимировать их аналитическими функциями. Эти результаты могут быть далее обобщены на систему уравнений, приводя к следующей теореме, полное доказательство которой можно найти в книге Хокинга и Эллиса (Hawking and Ellis 1973). Теорема 10.1.2. Пусть (M,gab) является глобально гиперболическим пространством-временем (или глобально гиперболической областью произвольного пространства-времени) и пусть Va - оператор производной. Пусть Е является гладкой пространственноподобной поверхностью Коти. Рассмотрим систему п линейных дифференциальных уравнений для неизвестных функций ф\,..., фп вида ёrbVaVьФi + 52(Ач)аЪаФо + Y1 Вч** + Ci = °- (Ю.1.20) 3 3 (Уравнение (10.1.20) называют линейной, диагональной гиперболической системой второго порядка.) Тогда уравнение (10.1.20) имеет хорошо поставленную формулировку начальных значений на Е. Более точно, для произвольных гладких начальных данных {ф1,паУаф1), г = 1,...,п на Е существует единственное решение уравнения (10.1.20) на всем М. Более того, решения непрерывно зависят от начальных данных в смысле, описанном выше для уравнения Клейна - Гордона в плоском пространстве-времени. Наконец, вариация начальных данных вне замкнутого подмножества S в%Е не влияет на решение в D(S). Заметим, что предположения дифференцируемости коэффициентов g, (Aij)a и B{j на Е, также как и начальных данных фг,паЧаф{ на Е, можно существенно ослабить (Hawking and Ellis 1973). Результаты о формулировке начальных значений линейных дифференциальных уравнений диагонального вида в частных производных не второго порядка см., например, в книге (Bers, John and Schechter 1964). Наконец, обсудим обобщения теоремы 10.1.2 для некоторых нелинейных систем уравнений. Совсем немного результатов, отличных от
Начальные данные для частиц и полей 359 еоремы 10.1.1, известно о формулировке начальных значений общей нелинейной системы уравнений. Однако для квазилинейных, т.е. линейных по члену со старшей производной, дифференциальных уравнений второго порядка локально применимы большинство результатов «ля линейных систем. Более точно, мы называем систему п дифференциальных уравнений в частных производных второго порядка для п неизвестных функций ф\,...,фп на многообразии М квазилинейной, диагональной, гиперболической системой второго порядка, если ее можно представить в виде g?b(x; фу, Vc<^)VaV6<k = Я(х; фу, Vc0,), (10.1.21) где Vo является оператором производной, g°6 - гладкая лоренцева метрика, и каждая функция Fi является гладкой функцией своих аргументов. (Уравнение (10.1.21) отличается от уравнения (10.1.20) тем, что Ё*ъ может зависеть от неизвестных величин и их первых производных, и Fi могут нелинейно зависеть от этих производных.) Для уравнений такого типа имеется следующая теорема (Leray 1952). Теорема 10.1.3. Пусть {фо)\,..., (фо)п являются решениями квазилинейной гиперболической системы (10.1.21) на многообразии М и пусть (g0)ab = g*6(x; (фо)у, Vc(0o)j)- Предположим, что (M, {g0)ab) ~ - глобально гиперболическое (или же рассмотрим глобально гиперболическую область этого пространства-времени). Пусть Е является гладкой пространственноподобной поверхностью Коти для (М, (g0)ab)- Тогда формулировка начальных значений уравнения (10.1.21) хорошо поставлена на Е в следующем смысле. Для начальных данных на Е, достаточно близких к начальным данным для (фо)\,- • •, (Фо)п, существует открытая окрестность О на Е такая, что уравнение (Ю.1.21) имеет решение 0i,...,0n в О, и (Р,^ь{х\фу,^сф^)) является глобально гиперболическим. Решение единственно в О и оно Распространяется причинно в том смысле, что, если начальные данные для ф'х,...,ф'п совпадают с начальными данными для ф\,..., фп **в подмножестве S поверхности Е, тогда решения совпадают на °HD+(5). Наконец, решения зависят непрерывно от начальных дан- Нъ*# в смысле, описанным выше для поля Клейна - Гордона. Основная идея доказательства теоремы 10.1.3 состоит в решении линейной системы в форме (10.1.20), получаемой заменой ф^ и ЧаФз На (0o)j и Va(0o)j в g°b и Ff в уравнении (10.1.21). Затем мы нахо- ^м решение по теореме 10.1.2, подставляем это решение в коэффици- Нты 8?Ь и Fj и повторяем процедуру. Получаем последовательность
360 Глава 10. Формулировка начальных данных (Фп)э решений линейных уравнений. Для начальных данных, достаточно близких к начальным данным ((j>o)j, можно показать, что эта последовательность сходится в окрестности Е и то, что предел удовлетворяет уравнению (10.1.21) и имеет требуемые свойства. Доказательство этой сходимости и другие свойства, отмеченные в теореме 10.1.3 имеются в книге Хокинга и Эллиса (Hawking and Ellis 1973). 10.2 Формулировка начальных данных в общей теории относительности В этом параграфе мы покажем, что общая теория относительности имеет хорошо поставленную формулировку начальных значений. Мы докажем это, представляя уравнения Эйнштейна в форме (10.1.21), для которых теорема 10.1.3 выполняется. Как будет показано далее, анализ уравнений Эйнштейна отличается от анализа поля Клейна- Гордона тем, что имеются связи на начальные данные, и необходимо сделать "выбор калибровки", т.е. выбор таких координат, в которых уравнения Эйнштейна приобретают требуемую форму. Чтобы вникнуть глубже в природу этих отличий, мы начнем с анализа простой проблемы формулировки начальных значений уравнений Максвелла для векторного потенциала Аа в пространстве-времени Минковского. Как мы увидим, формулировка начальных значений для уравнений Эйнштейна имеет близкую аналогию к формулировке начальных значений этих уравнений. В разд. 4.2 показано, что вакуумные уравнения Максвелла для векторного потенциала Аа в пространстве-времени Минковского имеют вид да(даАь - дьАа) = 0. (10.2.1) На первый взгляд уравнений (10.2.1) достаточно для определения Аа- Мы имеем четыре уравнения для определения четырех неизвестных компонент Аа. Однако более глубокая проверка уравнений *(10.2.1) показывает возможность появления серьезных трудностей, поскольку уравнение (10.2.1) не имеет форму уравнения (10.1.20), для которого известно, что формулировка начальных значений существует. Действительно, если мы выберем поверхность £о постоянного времени t = to в качестве нашей начальной гиперповерхности, то мы видим? что временная компонента уравнений (10.2.1) вообще не содержит второй производной по времени. В обычных векторных обозначениях эта (временная) компонетна уравнений имеет следующий вид: v2A) - v • (дЛ/dt) = о, (ю.2.2)
10.2- Формулировка начальных данных в ОТО 361 V • Ё = 0, (10.2.3) где электрическое поле Е: Е = УД) - dA/dt (10.2.4) или в индексных обозначениях Еа = (даАь - дьАа)пь = Fabnb, (10.2.5) где па " единичная нормаль к £о- Таким образом, уравнение (10.2.2) (или, эквивалентно, уравнение (10.2.3)) дает условие связи начальных данных (A^dA^/dt). Начальные данные, которые не удовлетворяют (10.2.2), возможно не могут дать решение уравнений Максвелла. Оставшиеся три компоненты уравнений Максвелла содержат вторые производные пространственных компонент Ла, поэтому можно решать уравнения для d2Ap/dt2, /i = 1,2,3 аналогично тому, как это было сделано в теореме 10.1.1 Коши - Ковалевской. (Заметим, что даже эти три уравнения не имеют форму уравнения (10.1.20), для которого известно существование хорошо поставленной формулировки начальных значений.) Можно было бы ожидать, что дифференцированием связи начальных данных (10.2.2) мы получили уравнение для d2All/dt2, которое возможно допускает некоторую формулировку начальных значений по крайней мере в смысле теоремы 10.1.1. Однако это не так. Мы имеем тождество дьда(даАь - дьАа) = 0, (10.2.6) и это показывает, что временная производная исчезает тождественно, если выполняются пространственные компоненты уравнений Максвелла. Следовательно, полные уравнения Максвелла эквивалентны пространственным компонентам уравнений Максвелла и уравнению связи начальных данных (10.2.1). Таким образом, уравнение (10.2.1) являйся недоопределенной системой для Аа. Реально имеются только три Уравнения (плюс связь начальных данных) для неизвестных функций. Действительно, по теореме 10.1.1 нетрудно видеть, что в аналитическом случае мы можем выбрать Ао произвольно во всем пространстве- времени и все же получить решение. Поэтому уравнения Максвелла Не допускают формулировки начальных данных для Аа в математическом смысле, рассмотренном в предыдущем параграфе. Однако эта трудность имеет нефизический характер. Как отмечалось в разд. 4.2, два векторных потенциала, отличающиеся на градиент
362 Глава 10. Формулировка начальных данных даХ функции х, представляют то же самое электромагнитное поле. Таким образом, вследствие этой произвольности калибровки можно ожидать, что уравнения Максвелла не дают возможности определить все компоненты Аа из начальных данных. С другой стороны, мы сейчас покажем, что начальные значения А^ dA^/dt все же определяют решение с точностью до калибровки, и физически уравнения Максвелла допускают хорошо поставленную формулировку начальных значений. Самый прямой путь показать это - выбрать подходящую калибровку для Аа и показать, что уравнения Максвелла для Аа в этой калибровке имеют форму (10.1.20), давая таким образом хорошо поставленную формулировку начальных значений. Мы выбираем калибровку Лоренца даАа = 0 (10.2.7) (см. уравнение (4.2.31)). Уравнения Максвелла в этой калибровке имеют простой вид дадаАь = 0. (10.2.8) Уравнение (10.2.8) вместе с уравнением (10.2.7) физически эквивалентно первоначальной системе (10.2.1) в том смысле, что решения (10.2.1) могут отличаться от решений (10.2.7) и (10.2.8) только калибровочным преобразованием. Для заданных начальных данных {A^^dA^/dt) мы совершаем калибровочное преобразование такое, что даАа на Ео. Теперь уравнение (10.2.8) означает дада{дьАь) = дь(дадаАь) = 0 (10.2.9) и, по теореме 10.1.2, если уравнение (10.2.8) выполняется везде, тогда калибровочное условие (10.2.7) также будет выполняться везде тогда и только тогда, когда дьАь = d(&>Ab)/dt = 0 на Е0. Равенство даАа = 0 на Ео уже гарантированно выполняется, и, используя уравнение (10.2.8), мы видим, что начальное условие d(dbAb)/dt = 0 эквивалентно связям на начальные значения (см. уравнение (10.2.7))- Таким образом, если V • Е = 0 на Ео, тогда для наших калибровоч- но преобразованных начальных данных уравнение (10.2.7) будет выполняться везде в пространстве-времени, если уравнение (10.2.8) выполняется. Поэтому необходимо решить только уравнение (10.2.8) с заданными значениями начальных данных. Мы можем сделать это, поскольку уравнение (10.2.8) определенно имеет форму (10.1.20), Д^я которой уже было установлено существование хорошо поставленной формулировки начальных значений. Таким образом, по теореме 10.1-2
10.2. Формулировка начальных данных в ОТО 363 существует единственное решение уравнения (10.2.8) для новых значений начальных данных. Более того, это решение непрерывно зависит ох начальных данных и имеет требуемое свойство области зависимости. Для того чтобы получить решение с первоначальными значениями (AuidAp/dt) начальных данных, мы просто "уничтожаем" калибровочное преобразование, приводящее к даАа = 0 на So. Чтобы показать, что это решение физически единственно, заметим, что два решения первоначальных уравнений Максвелла (10.2.1) с одинаковыми начальными данными можно перевести калибровочным преобразованием в решения (10.2.8) с идентичными начальными данными. Поскольку решения (10.2.8) с заданными начальными данными единственны, тогда это показывает, что наши два решения могут отличаться самое больше на калибровочное преобразование. Таким образом, уравнения Максвелла в пространстве-времени Минковского обладают хорошо поставленной в этом смысле формулировкой начальных значений. Действительно, можно переформулировать этот результат физически более удовлетворительно. Пусть Е и В являются произвольными гладкими векторными полями на Ео и удовлетворяют только уравнениям связей V-2? = V-i? = 0HaEo. Тогда существует единственное решение Fab уравнений Максвелла с этими начальными данными. Более того, Fab непрерывно зависит от начальных данных (Е, В), и Fab в р € J+(Eo) зависит только от начальных данных на J~(p) П Ео- Этот результат можно доказать введением векторного потенциала Аа, начальные данные которого на Ео удовлетворяют условию даАа = 0 и воспроизводят заданные величины Е и В на Ео. (В простейшем случае выбираем А0 = 0, dA/dt = —Е, а в качестве А какое-либо решение уравнений V х А = В, и полагаем dAo/dt = V • А.) Затем мы просто применяем результаты предыдущего раздела для получения решения с требуемыми свойствами. Наконец, мы доказываем единственность, проверяя, что два различных решения Аа и Аа уравнений Максвелла, которые воспроизводят заданные Ей В на Ео, можно перевести калибровочным преобразованием в решения уравнения (10.2.8) с теми же Самыми начальными данными. Следовательно, вследствие единственности решений уравнения (10.2.8), Аа и Аа отличаются самое большее калибровочным преобразованием. Поэтому они дают тот же самый Таким образом, уравнения Максвелла в пространстве-времени Минковского физически обладают хорошо поставленной формулировкой начальных значений. Этот результат можно обобщить и на искривленное пространство-время (см. задачу 2).
364 Глава 10. Формулировка начальных данных Далее мы остановимся на уравнениях Эйнштейна в вакууме Gab = о Первым вопросом является рассмотрение природы начальных данных этой теории. В других теориях классической физики мы имеем заданное пространство-время, и нашей целью является определение временной эволюции величин на этом фоне с использованием их начальных значений и производных по времени. В общей теории относительности мы решаем уравнения для самого пространства-времени. Какая величина (или величины) рекомендуются в качестве начальных данных в общей теории относительности для определения структуры пространства-времени? Для того, чтобы ответить на этот вопрос, мы должны рассмотреть теорию относительности как теорию, описывающую временную эволюцию некоторой величины. Пусть (M,gafe) является глобально гиперболическим пространством-временем. (Мы рассмотрим только глобально гиперболические пространства, поскольку формулировка начальных условий существенна только в этом случае.) Как было доказано в теореме 8.3.14, мы можем расслоить (M,gab) поверхностями Коши Е^, параметризованными глобальной функцией времени t. Пусть па является единичным, нормальным к гиперповерхности Е* векторным полем. Пространственно-временная метрика gab индуцирует пространственную метрику (т.е. трехмерную риманову метрику) каь на каждой Et по формуле hab = gab + "аЩ. (10.2.10) Пусть ta является векторным полем на М, удовлетворяющим условию taVat = 1. Разложим ta на части, нормальную и касательную к Е*, определяя функцию шага N и вектор сдвига Na поля ta соотношением N = -tana = (naVa*)~\ (10.2.11) Na = habtb (10.2.12) (см. рис. 10.2). Можно интерпретировать векторное поле ta как поле, описывающее "поток времени" во всем пространстве-времени. Как только мы начинаем "движение во времени" посредством параметра времени t, начиная с t = 0 на поверхности Ео, мы переходим к поверхности Е*. Если мы отождествим гиперповерхности Ео и Et диффеоморфизмом, связанным с интегральными кривыми ta, то мы можем понимать "движение во времени" как изменение пространственной меТ" рики на некотором абстрактном многообразии Е от /iab(0) к hab(^r Таким образом, мы можем интерпретировать глобально гиперболиче-
ю 2 формулировка начальных данных в ОТО 365 рис. Ю.2. Пространственно-временная диаграмма, иллюстрирующая определение функции шага N и вектор сдвига Na ское пространство-время (M,gab) как эволюцию во времени римановой метрики на фиксированном трехмерном многообразии. Это наводит на мысль понимать пространственную метрику на трехмерной гиперповерхности как динамическую переменную в общей теории относительности. (Функция шага N и вектор сдвига Na не рассматриваются динамически, поскольку они просто предписывают как "двигаться во времени". Дальнейшая мотивация того, чтобы рассматривать пространственную метрику как динамическую переменную в общей теории относительности появляется из гамильтоновой формулировки, приведенной в прилож. Е.) Следовательно, мы могли бы ожидать, что подходящие начальные данные составляют риманову метрику hab и ее "временную производную" на трехмерном многообразии Е. В разд. 9.3 мы ввели понятие внешней кривизны, представляющее собой хорошо определенное понятие "производная по времени" пространственной метрики на гиперповерхности Е, вложенной в пространство-время. В уравнении (9.3.19) величина £а была единичной касательной к конгруэнции времениподобных геодезических, ортогональных к Е. Если па является каким-либо другим единичным времени- подобным векторным полем, нормальным к Е, тогда его производная вДоль направления, касательного к Е, должна быть связана на Е с производной вдоль поля £а, т.е. Каь = Va& = hac\7c£b = = hacVcrib = = 7Т n a&> (10.2.13) читателю предлагается проверить последнее равенство в качестве Мачи 3. Это обобщает формулу для внешней кривизны на негеоде- 3ИчеС] кое нормальное расслоение пространства-времени. Связь между
366 Глава 10. Формулировка начальных данных Рис. 10.3. Пространственно-временная диаграмма, иллюстрирующая понятие внешней кривизны гиперповерхности Е. Пунктирная стрелка в точке р изображает параллельный перенос нормального вектора па в q вдоль геодезической, соединяющей q с р. Несовпадение этого вектора с па в р интуитивно соответствует изгибанию Е в пространстве-времени, в которое оно вложено. Формула Каь — hacVc£b показывает, что Каь непосредственно измеряет это несовпадение Каь и производной по координатному времени £thab дается уравнением (Е.2.30) в прилож. Е. Рис. 10.3 иллюстрирует интерпретацию КаЬ через "изгибание" Е в пространстве-времени. Вышеприведенное рассмотрение наводит на мысль, что в общей теории относительности подходящие начальные данные должны составлять тройку (E,/ia&, Каь), где Е является трехмерным многообразием, hab - римановой метрикой на Е и Каь представляет собой симметричное тензорное поле на Е. Ниже мы покажем, что для заданных таких начальных данных, удовлетворяющих некоторым начальным связям, существует глобально гиперболическое пространство-время (M,ga6), удовлетворяющее уравнениям Эйнштейна, которые имеют поверхность Коши, диффеоморфную Е, на которой индуцированной метрикой, задаваемой уравнением (10.2.10), является hab, а индуцированной внешней кривизной, определяемой уравнением (10.2.13), является Каь- Более того, это решение непрерывно зависит от начальных данных, удовлетворяет требуемому свойству области зависимости и является единственным в смысле, описанном ниже. Вначале мы установим некоторые полезные соотношения между метрикой пространства-времени, оператором производной, кривизной и соответствующими величинами, которые они индуцируют на про- странственноподобной гиперповерхности Е, вложенной в М. Мы у#е отмечали, что метрика пространства-времени gab индуцирует римано- ву метрику hab на Е с помощью уравнения (10.2.10). Однако по теорем6 3.1.1, hab единственным способом определяет естественный оператор производной на Е, который мы обозначим через Da. Более того, опе" ратор производной Da на Е приводит к появлению тензора кривизн ^Rabc1 на Е. Получим теперь формулы, связывающие Da и ^'Rabc четырехмерными величинами.
10.2. Формулировка начальных данных в ОТО 367 Пусть va является пространственноподобным вектором в точке Р £ Е. Можно единственным способом разложить va на компоненты: касательную и перпендикулярную к Е: va = v±na + v^ (10.2.14) где па является единичной нормалью к Е и vffпа = 0. Если v± = 0, то ^в = V?, и тогда вектор va лежит в касательном к Е пространстве в точке р. Условие v± = 0 эквивалентно другому va = habvb, (10.2.15) где hab задается уравнением (10.2.10) и первый индекс у hab поднимается с помощью g*b. В более общем виде, мы можем считать, что тензор Tei"'efcbi...6i в р G Е является тензором над касательным пространством к Е в точке р, если Г*1 -eV..b, =Ла1С1 '--hakCkhbld* •••hb*tTc*~c*dl...dr (10.2.16) Наоборот, любой тензор, определенный в точке р на многообразии Е, единственным образом приводит к пространственно-временному тензору в р (т.е. тензор на касательном к М пространстве в р), который удовлетворяет уравнению (10.2.16). Заметим, что h% играет роль оператора проектирования из касательного к М пространства в р на касательное к Е пространство в р. Пусть Tai'"akbl...bt ~ тензорное поле на многообразии Е. Если понимать тензор Tai'akbl.„bt как тензор пространства-времени, удовлетворяющий уравнению (10.2.16), то мы не можем определить VcTai"akbl...bn поскольку для того, что бы вычислить эту величину, нам необходимо знать, каким образом Tai"'akbli..bl изменяется, когда мы отходим от Е. Однако величина hdcVcTai'akbl...bl хорошо определена* поскольку для ее вычисления нет нужды вычислять производные в направлении от поверхности Е. Этот тензор не обязательно должен Удовлетворять уравнению (10.2.16), но мы можем спроектировать его индексы, используя /i/, и получить тензорное поле на Е. Тогда мы п°лучаем следующий результат: Лемма 10.2.1. Пусть (M,ga6) - пространство-время и Е - глад- ^ гиперповерхность в М. Пусть hab обозначает индуцированную МеЩику на Е (уравнение (10.2.10)) и Da - оператор производной, винный с hab (см. теорему 3.1.1). Тогда Da дается формулой DcT**—*bl...bi = ha*dr..hbleihcfVfTa*"'abbl-..bi, (Ю.2.17) а является оператором производной, ассоциированной с gab.
368 Глава 10. Формулировка начальных данць,х Доказательство. Непосредственным вычислением проверяется, чТо оператор Z)a, определенный уравнением (10.2.17), удовлетворяет свой, ствам (1)-(5) оператора производной, которые рассмотрены в разд. Зд Более того, имеем Dahbc = hadhbehcfS7d(gef + nenf) = 0, (Ю.2.18) поскольку Vdgef = 0 и Наьпь = 0. Таким образом, Da является един- ственным оператором, ассоциированным с hab. Q Из уравнения (10.2.17) можно вывести соотношения между кривизной ^Rabcd на Е и пространственно-временной кривизной Rabd- Если иа является дуальным векторным полем на Е, тогда имеем соотношение {3)RabcdUd = DaDbujc - DbDau;c. (10.2.19) Далее получаем DaDbuc = Da(hbdhceVdue) = = hJhb9hckVf{hgdhkeVdue) = = hafhbdhceVfS/duje + hceKabndS/duje + + hbdKacneVdujei (10.2.20) где мы использовали следующий факт: habhcdS7bhde = habhcdVb(gde + ndne) = Kacne. (10.2.21) Среднее слагаемое в правой стороне уравнения (10.2.20) исчезает после антисимметризации по а и 6. Более того, имеем hbdneVduje = hbdVd(neu>e) - hbdueVdne = -Kbeue. (10.2.22) Собирая все вместе, получаем {3)Rabcd = hJhfhcWjRfgk' - KacKbd + KbcKad. (10.2.23) Аналогичные вычисления (задача 4) дают DaK% - DbKaa = Rcdndhcb. (10.2.24) Уравнения (10.2.23) и (10.2.24) известны как соотношения Гаусса " Кодацци. Вернемся теперь к анализу вакуумных уравнений Эйнштейна. М задаем начальные данные (hab,Kab) на трехмерном многообразии Ь
10. 2. Формулировка начальных данных в ОТО 369 опьггаемся сконструировать глобально гиперболическое пространст- о^время (M,gab), для которого £ является поверхностью Коши, на которой индуцируются начальные условия. Наша стратегия состоит в выписывании уравнений Эйнштейна для метрических компонент g^u локальной координатной системе {ум}, в которой временная координата t выбирается так, что при t = 0 поверхность соответствует £ (или по крайней мере той части Е, которая покрывается координатной системой). Представляя уравнения в форме (10.1.21), мы используем теорему 10.1.3 для доказательства локального существования решения с требуемыми свойствами. Затем мы кратко опишем, как "глобализо- вать" наши локальные результаты, чтобы получить конечный вывод, выписанный как теорема 10.2.2. Компоненты тензора Эйнштейна G^u могут быть выражены через координатные производные компонент метрического тензора g^ с помощью методов разд. 3.4.1. Вакуумные уравнения Эйнштейна GMI/ = 0 дают десять уравнений второго порядка в частных производных для десяти неизвестных метрических коэффициентов. Более того, эти уравнения имеют квазилинейную форму, т.е. они линейны по вторым производным метрики. В явном виде из уравнений (3.4.5) и (3.1.30) имеем R»» = -\ E«a/Jb2^a(l/gM)Q + dad0g^ + а„0„&/,} + F^ig, дё), (10.2.25) и, таким образом, G>„ = Rllu-\gilvR= (10.2.26) 1 c.,0 + |E g^ftri-OfidegrB+dcdffg^ + F^fadg), 2 a a,p,p,o гДе F и F являются нелинейными функциями метрических компо- Нент 8а(з и их первых производных. Однако, правая сторона уравнения (10.2.26) не имеет форму уравнения (10.1.21). Действительно, из Уравнения (10.2.26) можно показать (задача 5), что уравнения $^„71" = 0, (10.2.27) V ^е fta является единичной нормалью к поверхностям t = const, не СоДерЖат вторых производных по времени от любого метрического
370 Глава 10. Формулировка начальных данных коэффициента, т.е. эти коэффициенты в уравнениях Gab = 0 при t = q зависят только от начальных данных. Таким образом, эти уравнения представляют собой связи на начальные данные, в близкой аналогии с уравнением (10.2.2) в случае электромагнетизма. Можно выразить эти уравнения в координатно инвариантной форме, используя уравнения Гаусса- Кодацци (10.2.23) и (10.2.24). Из уравнения (10.2.24) получаем уравнение связи на начальные данные 0 = hbaGbcnc = hbaRbcnc = DbKba - DaK\. (10.2.28) Дополнительно имеем RabcdhaChbd = Rabcd(^C + nanC)(^d-hTlbnd) = = R + 2Racnanc = = 2Gocn°nc. (10.2.29) Таким образом, из уравнения (10.2.23) получаем дополнительную связь 0 = Gabnanb = = 1 {(3) Я + (Kaa)2 - KabKab} . (10.2.30) Поэтому уравнения (10.2.28) и (10.2.30) представляют собой уравнения связи на начальные данные в общей теории относительности, которые представлены в форме, аналогичной уравнению (10.2.3). В конце этого раздела мы кратко вернемся к обсуждению некоторых свойств этих уравнений. В электромагнитном случае тождество (10.2.6) означает, что, если связь (10.2.3) выполняется в начальный момент, и пространственные компоненты уравнений Максвелла выполняются всюду, тогда связь также выполняется везде. Аналогичный результат выполняется и в общей теории относительности. Следствием тождеств Бианкн VaGab = 0 (10.2.31) является выполнение уравнений связи везде при условии, что связи (10.2.28) и (10.2.30) выполняются в начальный момент, и пространственные компоненты уравнений Эйнштейна выполняются повсюду- Для того, чтобы это показать, заметим, что уравнение (10.2.31) связывает временную производную компонент Е G^vny с невременными производными компонент G^v и их пространственными производными. Решив чисто пространственные компоненты уравнений Эйнштейна
л 2. Формулировка начальных данных в ОТО 371 получив решение для g^, можно положить пространственные компоненты GpV равными нулю в уравнении (10.2.31), а метрические компоненты g/д/ рассматривать как известные функции. Тогда уравнение (10.2.31) становится линейной однородной системой четырех уравнений первого порядка для неизвестных компонент Е G^unu'. Из теории дифференциальных уравнений первого порядка следует (см., например, (Courant and Hilbert 1962)), что если эти компоненты исчезают в начальный момент, то они исчезают повсюду. Таким образом, уравнения Эйнштейна G^u = 0 являются неопределенной системой уравнений для метрических компонент #д|/. Мы имеем только шесть уравнений эволюции (чисто пространственные компоненты Guv = 0) для десяти неизвестных метрических компонент. Однако, как и в случае уравнений Максвелла, эта неопределенность является нефизической. Она является следствием избыточного описания геометрии пространства-времени с помощью метрических компонент g и. В прилож. С обсуждалось, если ф : М —> М является диффеоморфизмом, то (M,gab) и (М, ф*gaь) представляют собой одно и то же физическое пространство-время. Поскольку компоненты gab и ф*ga^) в координатном базисе связаны координатными преобразованиями, ассоциированными с 0, то любые два решения уравнений Эйнштейна, чьи метрические компоненты в координатном базисе связаны тензорным законом преобразования (2.3.8), представляют собой одно и то же физическое решение. Так как в законе преобразования появляются четыре произвольные функции, то, строго говоря, должно быть только шесть "некалибровочных" функций среди десяти метрических компонент gpV. Таким образом, выглядит вполне правдоподобным, что уравнения Эйнштейна содержат корректное число уравнений эволюции, и существует хорошо поставленная формулировка начальных значений. Мы докажем, что это так, выбирая в близкой аналогии с нашей трактовкой уравнений Максвелла подходящим образом "калибровку" (т.е. координаты), для которой уравнения Эйнштейна имеют форму уравнений (10.1.21). Мы будем использовать гармонические координаты х**, т.е. координаты, удовлетворяющие равенству Я" = VaW = 0. (10.2.32) Я данном пространстве-времени (M,ga6) мы можем следующим обрезом сконструировать гармонические координаты в окрестности той части Е, которая покрывается нашими первоначальными координата- Ми {у**}- Для \х = 0,1,2,3 мы имеем координаты {у*1} и их нормаль- нЫе производные на Е в качестве начальных данных для уравнения
372 Глава 10. Формулировка начальных данных (10.2.32) (которое имеет форму (10.1.20) и поэтому обладает хорощ0 определенной формулировкой начальных данных). Поскольку дуальные вектора {Va2/M} линейно независимы на Е, то решения {х^} будут иметь величины {Уах^}, линейно независимые в окрестности Е в Л/ так что {х^} локально дают координатную систему. Таким образом, нет потери общности в предположении локального существования гармонических координат. Выписывая уравнение (10.2.32) в координатном базисе и используя формулы разд. 3.4.1, мы находим, что условие гармонических координат принимает следующий вид: 0 = #" = У — да[у/=8/Г%^] = Е^М^]- = Е во^ + ^Е^^*/- р,о (10.2.33) Используя уравнение (10.2.33), мы видим, что большинство вторых производных в уравнении (10.2.25) можно выразить через Н^ и производные низкого порядка, и, таким образом, в гармонических координатах вакуумные уравнения Эйнштейна принимают вид a где индекс Н в R^u обозначает, что это выражение для тензора Рич- чи справедливо только в гармонических координатах. Таким образом, уравнения Эйнштейна эквивалентны системе (10.2.34) вместе с условием гармонических координат (10.2.32) или (10.2.33) (Choquet- Bruhat 1962). Уравнение (10.2.34) известно как "приведенное уравнение Эйнштейна". Ключевой момент состоит в том, что оно имеет форму (10.2.21), для которой теорема 10.1.3 выполняется. Теперь мы в состоянии доказать локальное существование решения уравнений Эйнштейна для начальных данных, достаточно близких к плоскому пространству-времени. Пусть риманова метрика Нпь и симметричное тензорное поле Каь заданы на Е и удовлетворяют уравнениям связи (10.2.28) и (10.2.30). Выберем координатную систему на (части) Е, и пусть h^y и К^у обозначают компоненты Наь и
10.2- Формулировка начальных данных в ОТО 373 КаЬ в координатном базисе. Мы ограничиваем на Е начальные данные (g vi®eiAv/<H) таким образом, что g^u = h^ для //,*/ = 1,2,3, и внешней кривизной, вычисленной на этих начальных данных с использованием (10.2.13), является Каь. Особенно простой выбор состоит в выборе goo = -1>£од = 0 для /х = 1,2,3, и dgfil//dt = K^u для /z,i/= 1,2,3. Поскольку dg0fx/dt для \х = 0,1,2,3 не определяются этими требованиями, мы можем задавать %0д/с?£так, чтобы #м = 0 на Е (см. уравнение (10.2.33)). Если этот набор начальных данных достаточно близок к тем, что есть в плоском пространстве-времени, тогда, в соответствии с теоремой 10.1.3, мы можем решить уравнение (10.2.34) в окрестности части Е, покрытой нашими первоначальными координатами, создавая таким образом глобально гиперболическое пространство-время с этой частью Е, играющей роль поверхности Коши. Это решение уравнения (10.2.34) будет решением уравнений Эйнштейна, если #м = 0 в этой окрестности. Для того, чтобы это показать, заметим, что тензор Эйнштейна G^v в произвольных координатах можно выразить через тензор Rjju (определенный уравнением (10.2.34)) и величину #м (определенную уравнением (10.2.33)) GV = R". - \rH8^ ~ 5>а(Л)Я° " \s^Ha). (10.2.35) Q Поскольку ^2U G^vnu = 0 на Е и #м = 0 на Е, то уравнение (10.2.35) означает, что dH^/dt = 0 на Е, если уравнение (10.2.34) выполняется. Более того, когда уравнение (10.2.34) выполняется, тождества Бианки дают 0 = £V"G«" = --Ei!"% = -Y,\*°»f*w»Ha + (10-2-36) + {слагаемые более низкого порядка, линейные поЯа}. Таким образом, уравнение (10.2.36) (после умножения на gXl/ и суммирования по v) принимает форму (10.1.20), для которой существу- ^ единственное решение в соответствии с теоремой 10.1.2. Поскольку вначале #м = dH^/dt = 0, то это доказывает, что #м = 0 всю- АУ в области, где решение уравнений (10.2.34) существует. Таким образом, мы установили локальное существование решения уравнения Эйнштейна для начальных данных, достаточно близких к плоскому пРостранству-времени. Более того, теорема 10.1.3 показывает, что ре-
374 Глава 10. Формулировка начальных данных шение непрерывно зависит от начальных данных и имеет требуемое свойство области зависимости. Требование, что начальные данные "достаточно близки" к плоскому пространству-времени, можно удалить следующим трюком, в котором используется идея, что любая искривленная геометрия "почти плоская" в достаточно малой области. Предположим, что заданы начальные данные (g^idg^/dt), которые не являются "достаточно малыми". С помощью координатных преобразований на Е мы можем привести метрику к виду g^u = diag(—1,1,1,1) в точке р £ Е, а точку р поместить в начало координат х^ = 0. Пусть Л Е R. Предположим, что мы масштабируем начальные данные (g^ydg^/dt) —» —► (А~2£М1/, X~2dgtll//dt) и затем совершаем координатное преобразование хм —> х'** = A~1x/i для /1 = 0,1,2,3. Из закона преобразования тензора (2.3.8) мы видим, что при таких преобразованиях начальные данные принимают вид 4Л*')=МАх'), %^') = А%ЧАх'), где х' обозначает новые пространственные координаты на Е. При Л —► 0 мы видим, что новые начальные данные и их производные становятся близкими к начальным данным в плоском пространстве- времени. Таким образом, существует (достаточно малое) Ао такое, что мы можем получить решение ^„(х') уравнений Эйнштейна в окрестности р для новых начальных данных с А = Ао- Тогда метрика ^(А^гг) является решением уравнений Эйнштейна в окрестности р с произвольными начальными данными. Локальная единственность решений с заданными начальными данными (habl КаЬ) может быть доказана следующим образом. Пусть пространство-время (0я, g^), построенное с помощью гармонических координат с начальными данными (gjj^^dgjj^/dt) описанным выше способом, является решением уравнений Эйнштейна. Пусть (О, ga$) - другое решение уравнений Эйнштейна (не обязательно в гармонических координатах), которое покрывает на Е ту же самую область (0H,g%b) и индуцирует на Е те же начальные данные (hab,Kab). Нам необходимо найти диффеоморфизм ip из окрестности на Е в О в окрестность на Е в Он такой, что ф переводит gab в g$>, т.е. ip*gab = g£b. Сконструируем ф следующим способом. Поскольку gab и g%b индуцируют одинаковые начальные данные на Е, то можно проверить, что существует диффеоморфизм ф такой, что координатные компоненты <j)*gab и его производные по времени на Е соответствуют начальным данным (gjjl/^dgjlt//dt) решения g£b. (Фактически существует множество таких диффеомор-
10 2- Формулировка начальных данных в ОТО 375 физмов, поскольку ф может быть произвольно далеко от Е.) Тогда мы можем использовать ф~1 для того, чтобы перенести координаты Он в О- Используем начальные значения и временные производные этих координат на Е в качестве начальных данных для решения уравнения (10.2.32) в О, получая таким образом гармонические координаты в О. Используя эти гармонические координаты, мы определяем ф как отображение, которое переводит точки О в точки Он с одинаковым значением гармонических координат. (В общем случае ф будет определено только в окрестности Е в О, и оно будет отображать на окрестность Е в Ои-) Тогда в этой окрестности в Он компоненты в гармонической системе координат ip*gab будут удовлетворять уравнению (10.2.34) и будут иметь те же начальные данные на Е, как и g%b. Следовательно, по теореме 10.1.3, мы должны получить i/>*gab = g%b в окрестности Е, что и является требуемым результатом локальной единственности. Теперь мы кратко обрисуем, как "глобализовать" эти результаты локального существования и единственности. Выше мы доказали, что для р G Е существует решение (0,gab) уравнений Эйнштейна, в которых окрестность Е, содержащая р, может быть вложена таким образом, что множество заданных начальных данных индуцируется на этой части Е. Для того, чтобы показать, что имеется решение уравнений Эйнштейна, содержащее всю Е, покроем Е окрестностями, для которых локальные решения существуют. Используя паракомпактность Е (см. прилож. А), мы можем утверждать, что эти окрестности имеют только конечное число перекрытий в каждой точке. Из доказанной выше локальной единственности следует, что для каждой точки р €^Е мы можем найти глобально гиперболическое пространство-время (0^аЬ), содержащее р (с частью Е, играющей роль поверхности Коши), которое можно изометрически отобразить в каждое локальное решение в описанном выше семействе, содержащем р. Используя вложения пространств (0,£аь) в локальные решения, мы можем последовательно "склеить вместе" (0,£а&), чтобы сконструировать пространство-время (M,go6), которое является решением уравнений Эйнштейна, собирает все Е и индуцирует на Е заданные начальные данные. Более того, это пространство-время будет глобально гиперболичным с поверхностью Коши Е. Ясно, что сконструированное выше пространство-время (M,gab) не еДинственно, поскольку любое открытое подмножество М, содержащее Е, является другим решением уравнений Эйнштейна, индуцирующим те же начальные данные на Е. Однако мы можем рассмотреть множество Q всех глобально гиперболических пространств по МоДулю диффеоморфизмов, которые являются решением уравнений
376 Глава 10. Формулировка начальных данцЬ1 Эйнштейна и в которые Е с заданными начальными данными может быть вложена как поверхность Коши. Для двух пространств (М1,^! \ и (М2,£;6) в Q мы можем сказать, что {M\glab) > (М2,^6), ес*1и (M2,g^b) может быть изометрично отображено в {Ml,glab) с сохрани нием фиксированной поверхности Коши. Это соотношение приводит к "частичному упорядочиванию" на Q. (Частичным упорядочиванием на произвольном множестве S является соотношение между элементами, удовлетворяющее для всех a,b,c G 5 аксиомам: (i) a > a (и) если а > b и b > с, то о > с, и (Ш) если а > b и 6 > а, то а = Ь. Слово "частичное" относится к тому, что ">" определяется не для всех пар элементов.) Говорят, что подмножество Т С S любого частично упорядоченного множества 5 является полностью упорядоченным, если соотношение > определяется для всех пар элементов этого подмножества. Верхней границей Т является некоторый элемент b G S такой, что b > а для всех а € Т. Лемма Цорна (эквивалентная аксиоме выбора) утверждает: если каждое полностью упорядоченное подмножество S имеет верхнюю границу, то 5 имеет максимальный элемент, т.е. некоторый элемент т 6 S такой, что для всех с е S соотношение с ^ т означает с = га. В нашем случае для заданного полностью упорядоченного подмножества Т множества Q мы получаем верхнюю границу объединением всех пространств, появляющихся в Т, и затем идентифицируя точки посредством отображений изометрического вложения. Следовательно, по лемме Цо^на существует максимальный элемент Q, т.е. пространство-время (M,ga6), которое не может быть изометрически отображено в какое-либо пространство- время в Q. В общем случае лемма Цорна означает существование максимального элемента, но не его единственность. Однако в нашем случае, если мы имели пространство-время в Q, которое не может быть изометрически отображено (M,gab), тогда можно показать (Choquet- Bruhat and Geroch 1969), что мы можем "склеить" два пространства- времени вместе, чтобы получить "большее" решение, что нарушает максимальность (M,ga6). Это означает, что (M,ga6) является единственным пространством-временем, обладающим тем свойством, что каждое глобально гиперболическое пространство-время с заданными начальными данными на поверхности Коши Е можно изометрически отобразить в (M,ga6). Таким образом, собирая вместе эти результаты, или доказанные или только кратко отмеченные выше, получаем следующую теорему- Теорема 10.2.2. Пусть Е является трехмерным С°° многообрв' зием, hab - гладкая риманова метрика на Е, а Каь - гладкое симметричное тензорное поле на Е. Предположим, что Наь и Каь удовл^"
о формулировка начальных данных в ОТО 377 воряют уравнениям связи (10.2.28) и (10.2.30). Тогда существует лиственное С°° пространство-время (M,gab), называемое макси- альным Коти расширением {Т,,Ь,аь,Каь), удовлетворяющее следу ю- иМ четырем свойствам: (i) (M,gab) является решением уравнений ofiHuimeuHa, (ii) (M,gab) является глобально гиперболическим с полностью Коши Е, (ш) индуцированной метрикой и внешней кривизной на Е являются соответственно hab и Каь, (iv) любое другое пространство-время, удовлетворяющее (i)-(iii), можно изометрически отобразить в подмножество (M,gab). Более того, (M,ga6) удовлетворяет требуемому свойству области зависимости в следующем смысле. Предположим, что {Y,,hab,Kab) и (Y,',h'ab,K'ab) являются наборами начальных данных с максимальными расширениями (M,gab) и {М',g!ab). Предположим, что существует диффеоморфизм между S С Е и S' С Е', который переносит (Ь,аъ,Каъ) на Е в {Ь'аЬ'К'аь) на £'• Тогда D(S) в пространстве-времени (M,ga6) изо- метрично D(Sf) в пространстве-времени {М',£аЬ). Наконец, решение gab на М непрерывно зависит от начальных данных (hab, Kab) на Е. (Точное определение топологий на начальных данных и решениях, которое делает это отобраэюение непрерывным, имеется в книге (Hawking and Ellis 1973). Заметим, что возможно расширить "максимальное расширение" (M,ga6), т.е. изометрически отобразить его в собственное подмножество другого пространства-времени. Теорема 10.2.2 только утверждает, что любое такое расширение не может иметь Е в качестве поверхности Коши. Необходимо также отметить, что теорема 10.2.2 не дает иной информации о "размере" (M,ga6), кроме той, что оно максимально в смысле свойства (iv). Действительно, теоремы о сингулярностях гл. 9 показывают, что во многих случаях (М, gab) не может быть геодезически полным. В частности, теорема 9.5.1 дает строгое ограничение на то, "как велико" может быть (M,ga6) для начальных данных таких, что Каа > С > 0. С другой стороны, недавно было показано (Christodoulou and O'Murchadha 1981), что для асимптотически плоских начальных данных (см. гл. 11) максимальное расширение являйся "достаточно большим", чтобы включить все гиперповерхности в асимптотической области. Помимо доказательства того, что общая теория относительности меет требуемые физические свойства существования хорошо поставкой формулировки начальных значений, теорема 10.2.2 также ста- т глобально гиперболическое пространство-время (M,gab), удовле- Ряющее уравнениям Эйнштейна, в соответствие с множеством на- ьньгх данных (E,/ia5, Каъ), удовлетворяющих уравнениям связи.
378 Глава 10. Формулировка начальных даниых (Взаимосвязь пространств с множествами начальных данных конечно не является взаимнооднозначным. Различные множества начальных данных приводят к одинаковому пространству-времени (M,ga6), в со- ответствии со свободой выбора пространственноподобной поверхности Коши в М.) Обычно гораздо легче решить уравнения связи на Е, чем уравнения Эйнштейна на М. Поэтому, например, в аргументах, использующих существование определенных типов решений уравнений Эйнштейна, достигается значительное упрощение, если вопрос можно поставить в терминах множества начальных данных. Более того, ряд выводов в общей теории относительности, например, положительность полной энергии изолированной системы, формулируется более естественно через множество начальных данных (см. разд. 11.2). Существует относительно простой метод для генерации решений уравнений связи с К£ = 0 (Lichnerowicz 1944; York 1971). На данной поверхности Е задаем произвольную риманову метрику hab и решаем относительно простые связи (10.2.28) DaKab = 0 (10.2.37) для бесследового (Каа = 0) тензорного поля Каь- Конечно, (Ь,аь,Каь) не будут в общем случае^удовлетворять дополнительным связям (10.2.30). Однако положим Наъ = ф4Иаь1 и пусть Da является оператором производной, ассоциированной с hab. Как показано в при лож. D, если мы определим Каь = ф~2Каь, то уравнение (10.2.37) означает, что DaKab = 0. (10.2.38) Более того, используя уравнение (D.9) прилож. D, уравнение связи (10.2.30) для (/iab, Каь) можно выразить через ф, hab и КаЬ: ВаВаф - \вф + \ф-7КаЬКаЬ = 0, • (10.2.39) о о где индексы поднимаются с помощью /ia6, и R является скалярной кривизной hab. Уравнение (10.2.39) является нелинейным эллиптическим уравнением для ф. Локально (т.е. в достаточно малой области) решения уравнения (10.2.39) существуют всегда, хотя глобальные решения (т.е. решения, определенные на всей Е) могут и не существовать. (Результаты о существовании глобальных решений уравнения (10.2.39), так же как аналогичного уравнения, в котором Каа является ненулевой константой, имеются в обзоре (Choquet-Bruhat and York 1980)- Поэтому в случаях, когда уравнение (10.2.39) можно решить, начальные данные (E,/ia&, АГаь)> удовлетворяющие уравнениям связи (также
ifl 2- Формулировка начальных данных в ОТО 379 &аа = 0), генерируются множеством (E,/iab, Каъ), удовлетворяющим уравнению (10.2.37) с условием Каа = 0. Простым частным выбором Каь, удовлетворяющим уравнению (10.2.37) и условию Каа = 0, является Каь = 0. (Если Каа = 0 на Е, т0 £ называется моментом временной симметрии. Нетрудно видеть, чТо максимальное расширение (M,ga6), сгенерированное начальными данными с Каь = 0, будет обладать изометрией отражения относительно Е.) Тогда уравнение (10.2.39) становится линейным уравнением относительно ф. Если дополнительно мы выберем hab плоской, то уравнение (10.2.39) сводится к уравнению Лапласа в обычном трехмерном пространстве. Монопольное решение 0=1 + М/2г дает начальные данные для решения Шварцшильда. Решение уравнения Лапласа, полученное наложением двух монопольных с различными положениями, можно интерпретировать в качестве начальных данных для двух шварцшильдовых черных дыр (Hahn and Lindquist 1964). Поэтому максимально расширенное (M,go6), появляющееся от этих начальных данных, является пространством-временем, в котором две черные дыры первоначально находятся в покое, затем скорее всего падают друг на друга и "соударяются". Часть этого пространства- времени было получено Смарром (Smarr 1979) численным решением уравнений Эйнштейна. Интересной проблемой, которая может быть исследована (по крайней мере приближенно) для теории, обладающей формулировкой начальных значений, является следующая: как много "степеней свободы" имеет теория, т.е. "как много" различных решений уравнений существует. В механике частицы мы определили число степеней свободы равным размерности п конфигурационного пространства. Как обсуждалось в начале разд. 10.1, набор собственных начальных данных для такой системы состоит из 2п начальных положений и скоростей. Поэтому эквивалентной характеристикой числа степеней свободы в обычной механике частицы является деленное на два число величин, которые должны быть заданы как начальные данные. Для ноля Клейна- Гордона набор собственных начальных данных состоит из величины поля и величины его нормальной производной на поверхности Коши Е, т-е. две произвольные функции на Е. По аналогии с механикой частицы мы можем сказать, что поле Клейна-Гордона имеет "одну степень свободы в каждой точке пространства". Как много степеней свободы имеет гравитационное поле в общей Теории относительности? Набор собственных начальных данных для Уравнений Эйнштейна состоит в задании 12 функций на Е: шесть незаменимых компонент Наъ плюс шесть независимых компонент Каь. Од-
380 Глава 10. Формулировка начальных данных нако уравнения связи (10.2.28) и (10.2.30) налагают четыре соотношу ния на эти 12 величин, эффективно сокращая число "свободно задаваемых функций" на Е до восьми. Более того, многие пространства полученные с помощью начальных данных - этих восьми "свободно задаваемых" функций, являются физически эквивалентными. В частности, если ф : Е —> Е является диффеоморфизмом, тогда данные ф*каь и ф*Каь на Е генерируют такое же пространство-время, как hQb и Каъ. Поэтому три из восьми свободно задаваемых функций соответствуют диффеоморфизмам на Е и физически не существенны. Более того, как отмечалось выше, наборы начальных данных, которые не могут быть приведены друг к другу диффеоморфизмами, не могут соответствовать различным выборам поверхности Коши в том же пространстве-времени и поэтому физически эквивалентны. Поскольку, строго говоря, одна произвольная функция необходима для выбора поверхности Коши в пространстве-времени, то число некалибровочных свободно задаваемых функций на Е сводится к четырем. Деля на два, мы заключаем, что гравитационное поле имеет две степени свободы на каждую точку пространства. Это число совпадает с числом степеней свободы линейного поля со спином 2, распространяющегося в плоском пространстве-времени, к которому общая теория относительности сводится в пределе слабого поля (см. разд. 4.4.2). Заметим, что вышеизложенный грубый аргумент "счета функций" точно выделяет, какие функции (т.е. какие из 12 компонент метрики или внешней кривизны или функций от них) могут быть свободно заданы, какие функции определяются связями и какие функции соответствуют калибровочным преобразованиям. Действительно, одним из главных препятствий при развития квантовой теории гравитации (см. гл. 14) является невозможность выделения физических степеней свободы теории. Наконец, мы кратко прокомментируем формулировку начальных данных уравнений Эйнштейна с источниками материи Таь. Во-первых, связи на начальные данные для гравитационного поля принимают вид Gabnb = 8тгТаЬпь. (10.2.40) Из уравнений (10.2.28) и (10.2.30) получаем Da(Kab - Kcchab) = -8тгЛ, (10.2.41) (3)R + (Каа)2 - КаЬКаЬ = 16тгр, (10.2.42) где р = ТаЬпапь YiJb = -hbcTcana. Существование хорошо поставленной формулировки начальных значений для уравнений Эйнштейна с материей критически зависит как
10.2- Формулировка начальных данных в ОТО 381 ^ выполнения динамических уравнений для материи, так и от формулировки тензора натяжений через материю и метрику пространства- времени. Если материя состоит из полей ф\,... ,0П, удовлетворяющих уравнениям в форме (10.1.21) (с пространственно-временной метрикой а), и если Таь зависит только от полей, метрики и первых производных полей и метрики, то система уравнений Эйнштейна и полей материи в гармонических координатах будет иметь форму (10.1.21), так что существует хорошо поставленная формулировка начальных значений. Таким образом, уравнения Эйнштейна - Клейна - Гордона и уравнения Эйнштейна - Максвелла имеют хорошо поставленную формулировку начальных значений. Также установлено существование хорошо поставленной формулировки начальных значений для некоторых систем, не удовлетворяющих уравнениям в форме (10.1.21). В частности, известно, что система уравнений Эйнштейна с идеальной жидкостью с подходящим уравнением состояния Р = Р{р) обладает хорошо поставленной формулировкой начальных значений (Hawking and Ellis 1973). Существование хорошо поставленной формулировки начальных значений не выделяет уравнения Эйнштейна из уравнений, появляющихся в некоторых альтернативных теориях гравитации. В частности, уравнения Бранса - Дикке эквивалентны уравнениям Эйнштейна - Клейна - Гордона (Dicke 1962) и следовательно обладают хорошо поставленной формулировкой начальных значений. Показано, что некоторые теории гравитации с "высшими производными" также имеют хорошо поставленную формулировку начальных данных (Noakes 1983). Необходимо все же подчеркнуть, что существование хорошо поставленной формулировки начальных значений является далеко не автоматическим для многих теорий. В частности, естественное обобщение на искривленное пространство-время уравнений для линейных полей спина больше единицы (см. гл. 13) не имеет хорошо поставленной формулировки начальных значений. Зад; ачи 1- Показать, что неравенство (10.1.16) выполняется для любого подмножества А пространства Rn, удовлетворяющего условию однородного конуса, с помощью следующего аргумента (Cantor 1973; Adams 1975). Пусть Q обозначает замкнутый конус в Rn высоты Н и пространственным углом П с вершиной в начале. Пусть i> : R —> R является С°° функцией с ip(r) = 1 для г < Я/3, и V>(r) = 0 для г > 2Я/3.
382 Глава 10. Формулировка начальных данных a) Для любой С°° функции / : Q —> R показать, что для всех целых к > 1 имеем где г является обычной сферической радиальной координатой в Rn, во обозначает какой-либо фиксированной угол внутри конуса, и R(0q) - наибольшая величина г в конусе с углом 0о, т.е. интеграл берется по части луча, выходящего из начала и лежащего внутри конуса. b) Интегрируя результат пункта а) по всем углам внутри конуса, показать, что где С\ является константой, и в интеграле подразумевается элемент собственного объема Q. c) Используя неравенство Шварца, показать, что для к > п/2 мы имеем |/(0)| < СЦ/Цд^, и, следовательно, уравнение (10.1.16) выполняется в области А. 2. Пусть (M,gab) является глобально гиперболическим пространством-временем с пространственноподобной поверхностью Коши Е. Рассмотрите уравнения Максвелла (4.3.12) и (4.3.13) в (M,gab) и определите Еа и Ва на Е уравнениями (4.2.21) и (4.2.22) с вектором va в качестве нормали па к Е. Заметим, что Еапа = Вапа = 0. a) Показать, что уравнения Максвелла означают, что DaEa = = 47гр и DbBb = 0 на Е, где р = — jana, и Da - оператЬр производной на Е. Заметим, что первое соотношение означает выполнение закона Гаусса на Е. b) Показать, что уравнения Максвелла без источников (ja = 0) имеют хорошо поставленную формулировку начальных значений в том смысле, что для данных Еа и Ва на Е, удовлетворяющих связям DaEa = DaBa = 0, существует единственное решение Fab уравнений Максвелла на всем М с этими начальными данными, и, более того, это решение непрерывно и имеет свойство области зависимости. Для того, чтобы обойти аргументы "склейки > можно предположить глобальное существование векторного потенциала Аа.
Ю-2. Формулировка начальных данных в ОТО 383 3. Пусть па - единичное (т.е. папа = — 1), ортогональное гиперповерхности векторное поле. Определите hab уравнением (10.2.10). Покажите, что /iacVcri6 = ^£nhab- 4. Выведите уравнения Гаусса - Кодацци (10.2.24). (Указание: вычислите левую сторону уравнения (10.2.24), используя формулы для Каь и Da.) 5. Покажите в явном виде из уравнения (10.2.26), что компоненты G^u'ny не содержат вторых производных по времени от метрических компонент. 6. Используйте аргументы "подсчета функций" подобно тем, что даны в конце этой главы, чтобы доказать, что электромагнитное поле имеет "две степени свободы в каждой точке пространства".
Глава 11 Асимптотически плоские пространства В общей теории относительности часто интересуются изучением свойств изолированных систем. Хотя не существует физических систем, изолированных от остальной части Вселенной, все же кажется разумным, если мы хотим изучить, скажем, структуру звезды, то мы в состоянии игнорировать влияние удаленной материи и космологической кривизны на звезду, и можно изучать проблему таким образом, что звезда располагается в пространстве-времени, которое становится плоским (т.е. гравитационное поле исчезает) на больших расстояниях от нее. Таким образом, асимптотически плоские пространства в общей теории относительности представляют собой идеально изолированные системы. Предметом данной главы является введение в анализ таких пространств. Аналогично в электромагнетизме изучают изолированные распределения заряда. В этом случае легко дать точное определение "изолированной системы", точно определяя асимптотическую скорость падения компонент плотности заряда-тока ja и тензора электромагнитного поля Fab. Например, можно требовать, чтобы 4-вектор плотности тока.;41 исчезал вне "мировой трубки" с компактным пространственным носителем, в то время как F^u = 0(1/г2) при г —► оо и фиксированном t, а также F^v = 0(1 /г) при г —► оо вдоль нулевой геодезической. Уравнения Максвелла тогда дают детальную структуру и свойства электромагнитного поля на больших расстояниях. В частности, получается мультипольное разложение электромагнитного поля, которое в стационарном случае определяет точную асимптотическую Ф°рму электромагнитного поля через бесконечный набор мультиполь- Hbix коэффициентов, связанных простым способом с распределением 3аРяда-тока. В динамическом случае также имеем мультипольное разложение, которое дает простые формулы для энергии, излученной на Оконечность, через мультипольные коэффициенты. Снова, если нет Ходящего излучения, то имеем простое соотношение между мульти- п°льными коэффициентами и распределением заряда-тока. Мы хотели бы получить аналогичные результаты для изолирован- Ь1* систем в общей теории относительности. Однако мы сразу ветре-
386 Глава 11. Асимптотически плоские пространен^ чаем серьезное препятствие даже на первом шаге такого анализа. Нет непосредственной точной формулировки понятия "изолированная система". Проблема в том, что больше нет фоновой плоской метрики ЧаЪ, через которую можно выразить скорость падения кривизны пространственно-временной метрики gab. Поэтому, в частности, мы не имеем естественной глобально инерциальной координатной системы, чтобы определить предпочтительную радиальную координату г для определения скорости падения. Одним из способов преодоления этой проблемы является следующее определение асимптотически плоского пространства: если существует какая-либо система координат х°, х1, х2, х35 такая, что метрические компоненты в этих координатах ведут себя соответствующим образом при больших значениях координат, т.е. g^v = = Цци + 0(1/г) при г —> оо как вдоль пространственного, так и вдоль нулевого направлений, где г = [(х1)2 + (х2)2 + (х3)2]1/2. Хотя это определение во многих отношениях является правильным, его все же очень трудно использовать, поскольку координатная инвариантность всех шагов должна быть тщательно проверена. Более того, во многих ситуациях (таких как вычисление потока энергии из системы) интересуются пределом больших расстояний "г —> оо", но с таким определением асимптотической плоскостности очень трудно точно определить, как такой предел берется координатно независимым способом. В частности, много проблем возникает при изменении порядка взятия пределов и производных. Эти трудности решаются формулировкой понятия асимптотической плоскостности, в которой пространство-время является асимптотически плоским, если соответствующая граница, представляющая "точки на бесконечности", может быть подходящим способом "добавлена" в пространство-время. Такое определение является явно координатно независимым, и при условии определения точек границы, представляющих бесконечность, исчезает большинство трудностей, связанных с взятием пределов при уходе на бесконечность. Мы сформулируем это понятие асимптотической плоскостности в разд. 11.1. В рамках анализа изолированной системы, полученного таким определением асимптотической плоскостности, хотелось бы получить результаты, аналогичные мультипольным разложениям в электромагнетизме. В стационарном случае удовлетворительное определение муль- типольных моментов было дано Хансеном (Hansen 1974), и гравитационное поле вне источника единственным способом определяется этими мультипольными моментами (Beig and Simon 1980; Kundu 1981). Однако в нестационарном случае не было дано полезных общих определений мультипольных моментов. Более того, в обоих случаях невозмож-
ll.l. Конформная бесконечность 387 но получить простое соотношение между далеким гравитационным полем и распределением материи вследствие того, что нелинейность уравнений Эйнштейна позволяет гравитации эффективно действовать как ее собственный источник. Все же были даны полностью удовлетворительные определения полной энергии изолированной системы и энергии, уносимой из системы гравитационным полем. Как уже отмечалось в гл 4, в общей теории относительности не существует понятия локальной плотности энергии гравитационного поля. Однако для изолированных систем поведение гравитационного поля на больших расстояниях от системы приводит к понятию "полной гравитационной массы", и это может быть использовано для определения полной и излученной энергий. Эта проблема обсуждается в разд. 11.2. Впервые тщательный анализ потока энергии гравитационного излучения был сделан Бонди, ван дер Бургом и Метцнером (Bondi, van der Burg and Metzner 1962), а также Саксом (Sachs 1962b), который определил требования асимптотического спада через условия на координатные компоненты метрики. Затем Пенроуз (Penrose 1963, 1965b) ввел понятие асимптотической плоскостности на "нулевой бесконечности" (т.е. когда мы уходим на большие расстояния вдоль нулевых геодезических) с помощью конструирования границы, описанной ниже. Позднее (Geroch 1972b) на основе более ранних работ Арновитта, Дезера и Мизнера (Arnowitt, Deser and Misner 1962) было введено ко- ординатно независимое определение асимптотической плоскостности на "пространственной бесконечности" через поведение на "большом расстоянии" начальных данных на поверхности Коши. Эти два определения асимптотической плоскостности были скомбинированы в единое понятие Аштекаром и Хансеном (Ashtekar and Hansen 1978), а также Аштекаром (Ashtekar 1980). В этой главе мы будем следовать подходу Аштекара. 11.1 Конформная бесконечность Как уже отмечалось выше, нам необходимо преодолеть трудности, чтобы иметь формализм для анализа гравитационного излуче- ния и других аспектов гравитационного поля изолированных систем. V1) Необходимо точное определение понятия асимптотической плоскостности, (ii) Необходимо содержательное понятие того, как взять пРеделы к бесконечности" и каковы точные рамки для описания математических объектов, которые эти пределы представляют. Далее МЫ предложим решение проблемы (ii) для негравитационных полей
388 Глава 11. Асимптотически плоские пространстца в пространстве-времени Минковского. Это решение затем будет ис- пользовано для мотивации решений проблем (i) и (ii) в искривленных пространствах. В сферических координатах метрика пространства-времени Минковского имеет вид ds2 = -dt2 + dr2 + r2(d02 + sin2 вdф2). (П.1.1) Предположим, что интересуемся описанием свойств излучения, переносимого на бесконечность безмассовым полем, таким как скалярное поле Клейна - Гордона ф. Поскольку для этого требуется взятие пределов к бесконечности вдоль нулевых направлений, то удобно ввести опережающую и запаздывающую нулевые координаты, определенные соотношениями v = t + r, (11.1.2) u = t-r. (11.1.3) В координатах и, v, 0, ф компоненты метрики Минковского суть ds2 = -dudv + -(v - u)2{d02 + sin2 вdф2). (11.1.4) Предположим, что мы анализируем, скажем, выходящее излучение. При фиксированном и мы хотим взять пределы v —» оо для нашего физического поля ф и выделить информацию об излучении из того, как это поле стремится к нулю. В частности, энергия, переносимая полем на бесконечность, определяется "1/г> частью" поля ф в этом пределе. Однако взятие такого предела является громоздкой процедурой, которая не обобщается легко на искривленное пространство-время. Анализ стал бы намного проще, если бесконечность была бы "определенным местом", и мы могли бы просто вычислять поля и/или их производные в этом "месте". Наивным подходом для достижения этой цели было бы введение новой координаты V = l/v такой, что "бесконечность" вдоль выходящих нулевых геодезических соответствует конечной величине V = 0 в новой координате пространства-времени. Однако компоненты метрики пространства-времени в новых координатах г/, V, в, ф имеют вид ds2 = ^dudV + ^ (^ - и\ {dO2+ sm2вdф2). (11.1.5) Компоненты сингулярны при V = 0 так, что мы не можем продо^' жить в это место метрику пространства-времени. Следовательно, *IbI
ill- Конформная бесконечность 389 можем анализировать тензоры при V = О так, как будто бы это был0 обычным "местом". Конечно, все, что мы сделали, заключается т0м, что мы ввели плохую координату, поведение которой во многом х0ясе с разобранным в разд. 6.4 примере. Предположим, что мы рассматриваем новую нефизическую метрику ЪаЬч полученную умножением метрики Минковского r)ab на V2 = s= l/v2, т.е. gab связана с г]аь конформным преобразованием с конформным фактором О, = V (см. прилож. D). Тогда в координатах и,У,0,ф компоненты gab имеют вид ds2 = dudV + j(l - uV)2{d02 + sin2 6d<t>2), (11.1.6) а эти компоненты уже хорошо ведут себя при V = 0. Поэтому расширим многообразие Минковского, "добавляя" точки, соответствующие V = 0. Как было видно выше, начальная плоская метрика г]аь не может быть гладко продолжена до V = 0 - пространство-время Минковского (К4,77аь), конечно же является нерасширяемым пространством- временем - но новая, нефизическая метрика gab может быть гладко продолжена до V = 0. Следовательно, мы можем использовать обычный тензорный анализ на "бесконечности" (или, более точно, в части "бесконечности", описываемой пределом v —► оо при постоянном и) как в некотором "месте". По сути мы перенесли бесконечность на конечное расстояние конформным преобразованием. Мы можем просто вычислять поля и их ковариантные производные по отношению к gab на бесконечности и обойти взятие пределов в обычном физическом пространстве-времени. Фактически данный частный выбор gab не является идеальным, поскольку наш конформный фактор V = l/v расходится в событии v = 0 первоначального пространства-времени. Более того, хотя мы уже расширили gab на "нулевую бесконечность будущего" (предел v —> оо при фиксированном и), мы не можем аналогично расширить gab на нулевую бесконечность прошлого" (г* —► оо при фиксированном v) или "пространственную бесконечность" (г —► оо при фиксированном *)• Однако все эти препятствия можно преодолеть более подходящим вьгбором конформного фактора. Пусть 8аЬ = П2»Ьь, (И.1.7) Па = 4(1 + «а)-1(1 + «2)-1. (11.1.8) 0гДа ga6 является гладкой метрикой на первоначальном многообра- Ии Минковского и (R4,go6) может быть гладко расширено до "боль-
390 Глава 11. Асимптотически плоские пространства Рис. 11.1. Пространственно-временная диаграмма статической Вселенной Эйнштейна. Как описано в тексте, пространство-время Минковского конформно изометрично области О = /+(г~) П/~(г+) этого пространства-времени. Граница О, состоящая из точек г", г+, и г° и нулевых гиперповерхностей J~ и J+, определяет точное понятие "бесконечности" пространства-времени Минковского шего" пространства-времени, такого, что граница области Минковского в этом большем пространстве-времени дает точное представление "бесконечности". Для того, чтобы это показать, определим новые координаты Т, R пространства-времени Минковского соотношениями Т = arctg v + arctg и, (11.1.9) R = arctg v — arctg и. (11.1.10) Тогда области изменения Т и R ограничены неравенствами: -7Г<Т+Я<7Г, (11.1.П) -7Г<Т-Д<7Г, (11.1.12) 0 ^ Л. (11.1.13) Компоненты ga6 в координатах Т, Д, 0, ф имеют вид ds2 = -dT2 + dR2 + sin2 R{d02 + sin2 Odcf). (11.1.14)
ll.l. Конформная бесконечность 391 Замечательно, что это в точности естественная лоренцева метрика на пространстве 53 х R, известном как статическая Вселенная Эйнштейна (см. уравнение (5.1.1) и задачу 3 в гл. 5), за исключением того, что область изменения координат ограничена уравнениями (11.1.11) и (11.1.12). Таким образом, мы получили следующий результат. Существует конформная изометрия1 пространства-времени Минковского CR4,Vab) в открытую область О статической Вселенной Эйнштейна (S3 х R,ga6) с ограничениями на область изменения координат, задаваемых уравнениями (11.1.11) и (11.1.12). Этот результат позволяет дать точное определение бесконечности для пространства-времени Минковского. Определим конформную бесконечность пространства-времени Минковского как границу О области О в статической Вселенной Эйнштейна. Как показано на рис. 11.1, эта граница естественным образом делится на пять частей: (1) "нижняя вершина" г~, называемая времениподобной бесконечностью прошлого с координатами R = О, Т = —7г; (2) трехмерная нулевая поверхность 3~, называемая нулевой бесконечностью прошлого, с координатами Г = -7г + R для 0 < R < 7г; (3) точка г° с R = 7Г, Т = О, называемая пространственной бесконечностью; (4) трехмерная нулевая поверхность J+, называемая нулевой бесконечностью будущего, с координатами Т = п — R для 0 < R < 7г; (5) "верхняя вершина" г+, называемая времениподобной бесконечностью будущего, с координатами R = 0,Т = 7Г. Заметим, что все времениподобные геодезические пространства-времени Минковского начинаются вГи заканчиваются в г+, все пространственноподобные геодезические начинаются и заканчиваются в г°, а все нулевые геодезические начинаются в J~ и заканчиваются в J+. Поскольку трудно на рис. 11.1 нарисовать сложную пространственно-временную диаграмму О, и два пространственных измерения удалены из этой диаграммы (т.е S3 представляется как S1), то часто представляют О в виде двух нулевых конусов, соединенных основаниями, как показано на рис. 11.2. Однако необходимо подчеркнуть, что диаграмма неправильно изображает бесконечность * как сферу вместо точки. Это определение конформной бесконечности пространства-времени Минковского позволяет следующим образом точно сформулировать асимптотические условия на физические поля, представляющие собой внешнее поле и/или излучение изолированной системы. В зависимости °т физического поля и строгости тех асимптотических условий, которые мы хотим наложить, мы требуем, чтобы хорошо определенным *В прилож. С объясняется, что конформной изометрией (M,gab) в (Л/',£^6) является диффеоморфизм ф : М —* М' такой, что {^*g)ab = ^2£^ь*
392 Глава 11. Асимптотически плоские пространств Рис. 11.2. Область О статической Вселенной Эйнштейна представляется в виде двух нулевых конусов, соединенных основаниями. Это представление О обманчиво, поскольку г° изображается 2-сферой вместо точки, но часто гораздо более удобно использовать такую диаграмму, чем рис. 11.1 способом можно было бы продолжить на конформную бесконечность О подходящую степень П-1, умноженную на поле. При таких условиях величины, которые в пространстве-времени Минковского применяются в пределе г —► оо или v —* оо, представляются обычными тензорными полями на О. Это дает удовлетворительное решение проблемы (ii) для пространства-времени Минковского. Мы проиллюстрируем силу и полезность конструкции конформной бесконечности для пространства-времени Минковского на примере очень простого доказательства следующего результата. Утверждение 11.1.1. Пусть ф является решением безмассового уравнения Клейна - Гордона (4-2.19) в пространстве-времени Минковского с гладкими данными фо,Фо «« компактном носителе в момент t = 0. Тогда ф = 0(1/А) при А —► оо вдоль каждой нулевой геодезической иф — 0(1 /т2) при г —> оо вдоль каждой времениподоб- ной геодезической, где А и т обозначают соответственно аффинный параметр вдоль нулевой геодезической и собственное время вдоль ере- мениподобной геодезической. Доказательство. В соответствии с прилож. D, если ф удовлетворяет уравнению Клейна - Гордона в пространстве-времени Минковского, то ф = И~1ф удовлетворяет уравнению 5a6VoV60-i/J0 = O (11.1.15) о
Конформная бесконечность 393 области О статической Вселенной Эйнштейна, где Va и R являются оператором производной и скалярной кривизной метрики ga6. Далее рассмотрим начальные данные для уравнения (11.1.15) на поверхно- ^и Коши Т = 0 в статической Вселенной Эйнштейна, полученные расширением фо,Фо на "пространственную бесконечность", полагая, что эти величины равны нулю в точке г°. Поскольку уравнение (11.1.15) имеет форму, для^ которой применима теорема 10.1.2, то существует гладкое решение ф уравнений (11.1.15) во всей статической Вселенной Эйнштейна с заданными начальными данными. Вследствие единствен^ ности и свойства области^зависимости теоремы 10.1.2 это решение ф должно соответствовать фъО. Таким образом, мы доказали, ф может быть гладко расширено на О. Переводя этот результат в утверждения о асимптотических пределах в пространстве-времени Минковского, получаем выводы утверждения 11.1.1. В действительности предположения теоремы можно существенно ослабить и оставить только то, что данные, индуцированные ф при Т = 0, можно гладко продолжить в г°, а выводы теоремы можно усилить, используя то, что ф можно гладко продолжить в О. □ Перейдем далее к проблеме определения понятия асимптотически плоского пространства-времени. Как будет видно далее, ключевой идеей является то, что наша возможность сделать вышеописанную конструкцию отображения пространства-времени Минковского с помощью конформной изометрии в ограниченную область статической Вселенной Эйнштейна критически зависит от структуры пространства- времени Минковского "на бесконечности". Это наводит на мысль определить асимптотически плоское пространство-время таким образом, чтобы аналогичная конструкция могла быть осуществлена, т.е. если физическое пространство-время можно отобразить в новое, "нефизическое" пространство-время с помощью конформной изометрии со свойствами, аналогичными тем, что были в случае пространства-времени Минковского. На этом пути мы решаем обе отмеченные в начале этого раздела проблемы (i) и (ii), поскольку мы имеем форму- лировку понятия асимптотической плоскостности, явно не зависящую °ъ координат, и, как и в случае пространства Минковского, граница в нефизическом пространстве-времени, изображающем физическое пРостранство-время при конформной изометрии, дает точные рамки ^я описания бесконечности. Но все же есть два важных свойства конформной бесконечности пРостранстве-времени Минковского, которые не переносятся в ис- Ривленное пространство-время. Во-первых, мы хотели бы рассмот-
394 Глава 11. Асимптотически плоские пространства реть пространства, которые становятся плоскими при движении на "большие расстояния в пространственноподобных или нулевых напрНв^ лениях". Однако мы не требуем, чтобы пространство-время станови. лось плоским "в фиксированной точке в более раннее или более позд. нее время", поскольку мы хотели бы описать пространства, представ* ляющие изолированные тела, которые могут присутствовать как на более ранних, так и на более поздних временах. Таким образом, мы не ожидаем, что конформная бесконечность искривленного пространства- времени аналогична такой же в пространстве-времени Минковского в прошлой или будущей времениподобной бесконечности г~ и г+. По этой причине для искривленных пространств мы не налагаем требований на структуру конформной бесконечности, соответствующей присутствию этих двух точек. Во-вторых, хотя и требуется, чтобы метрика становилась плоской на пространственной бесконечности по причинам, описанным ниже, гладкость или даже дифференцируемость метрики ga. на пространственной бесконечности является слишком сильным требованием. Поэтому, хотя и требуется, чтобы конформная бесконечность искривленного пространства-времени содержала точку г°, представляющую пространственную бесконечность, свойства гладкости, которые выполняются в пространстве-времени Минковского, должны быть существенно ослаблены. Нашей целью теперь является определение асимптотической плоскостности с помощью выделения особенностей конформной бесконечности пространства-времени Минковского (по модулю отмеченных выше модификаций), которые достаточно сильны, чтобы они могли бы реализоваться только для пространств, представляющих изолированные системы, но не излишне строги, чтобы исключить физически разумные примеры. Мотивация частного выбора особенностей, данных ниже, происходит из изучения некоторых примеров свойств стабильности при линейных возмущениях (Geroch and Xanthopoulos 1978) и из того, что эти особенности дают подходящие рамки для определения полной энергии и излученной энергии (см. разд. 11.2). Дальнейшее обсуждение мотивации дается в работе (Geroch 1977). Мы же перейдем к более техническим условиям, данным Аштекаром (Ashtekar 1980) ДлЯ определения асимптотической плоскостности, и затем обсудим смысл этих условий. Вакуумное пространство-время (M,gab) называется асимптпотпиче ски плоским на нулевой или пространственной бесконечности, есл существует пространство-время (M,ga6), где ga6 является С°° всюДУ' за исключением, возможно, точки г°, в которой метрика С> (оПР деляется ниже), а конформная изометрия ф : М —» ф[М] С М с к°
конформная бесконечность 395 кормным фактором ft (так, что gab = n2tp*gab в ф[М]) удовлетворяет ^дующим условиям: ^ П) 7+(i°) U ^~(*°) — М — М. (Здесь J+(z°) является замыкани- причинного будущего «/+(г°) для г° (см. гл. 8), а для упрощения обозначений здесь и далее мы будем писать М вместо ф[М].) Поэто- jO пространственноподобным способом связана со всеми точками д/ и граница М состоит из объединения г°, 3+ = J~*~(i°) — г° и *r = j-(i?)-iO. (2) Существует открытая окрестность V в М = г° Uj""1" Uj' такая, что пространство-время (V,ga6) сильно причинно. (3) ft можно расширить до функции на всем М, и этот конформный множитель является С2 в г° и С°° в остальном. (4) (а) На J+ и J~ имеем ft = 0 и Vaft Ф 0. (Здесь Va является дифференциальным оператором, ассоциированным с gab, хотя и так ясно, что это условие не зависит от выбора оператора производной.) (Ь) Имеем 0(г°) = 0, limi0 Vaft = 0 и limi0 VaV6ft = 2§(г°). (Мы берем пределы в г°, поскольку нет необходимости, чтобы здесь gafe была бы С1, и поэтому нет необходимости, чтобы оператор Va был определен вг°.) (5) (а) Отображение нулевых направлений в г° в пространство интегральных кривых поля па = ga Vaft на 3+ и J" является диффеоморфизмом. (Ь) Для гладкой функции и; на М - г° с и > 0 на М U J+ U 3~ -, которая удовлетворяет Va(<^4n0) = 0 на 3+ U 3~, векторное поле и~1па является полным на 3+ U 3~ - Начнем обсуждение этого определения с объяснения смысла условия С>0, наложенного на ga6 в г°. Основной проблемой, связанной с конформной бесконечностью, является то, что все пространственные бесконечности представляются одной точкой. При движении вдоль кривых в физическом пространстве-времени, уходящих на пространственную бесконечность в различных угловых направлениях (или в Управлениях, различающихся бустом), различные кривые расходятся се дальше и дальше. Однако в нефизическом пространстве-времени Се Различные кривые заканчиваются в одной и той же точке. Таким Разом, вполне разумно требовать, чтобы физические тензорные поля °множенные на подходящие степени ft) имели хорошо определенные РЗДелы вдоль подходящих кривых, уходящих на пространственную конечность, но нельзя требовать, чтобы эти пределы вдоль кри- > Уходящих на бесконечность в различных направлениях, давали ъковый предельный тензор в точке г°. Вследствие однородности и Р°пии пространства-времени Минковского возможно определить
396 Глава 11. Асимптотически плоские пространств конформное расширение таким образом, что нефизическая метрика и конформный фактор были бы гладкими в г°. При рассмотрении физических полей в пространстве-времени Минковского мы сразу сталкиваемся с явлением зависимости от направления в г°. Например, легко можно проверить, что для кулоновского решения уравнений Максвелла тензор ilFab принимает хорошо определенное, конечное значение в пределе, когда мы достигаем г° вдоль пространственноподобной геодезической, но получающийся в г° тензор зависит от выбора пространственноподобной геодезической. (Строго говоря, "электрические линии силы" Fab радиально входят в г°.) Поведение пространственно- временной метрики на "больших расстояниях" в искривленных пространствах, таких как решение Шварцшильда, аналогично такому поведению кулоновского решения в плоском пространстве-времени. Таким образом, нельзя требовать, чтобы нефизическая метрика gob была гладкой в г°. Получается, что подходящим условием на ga6 является то, что она С>0 в г°. Под этим мы понимаем, что ga6 непрерывна (С0) в г°, и, дополнительно, ее первые производные имеют зависящие от направления пределы в г°, гладкие по их угловым переменным. Последнее можно выразить более точно. Пусть х^ является гладкой координатной системой с началом в г°. Определим "радиальную функцию" р соотношением р2 = £(*м)2 и угловые функции ва (а = 1,2,3) через хд по формулам сферических координат в четырехмерном евклидовом пространстве. Мы можем использовать координаты ва для того, чтобы характеризовать каждое касательное направление в г°. Говорят, что функция / имеет регулярный, зависящий от направления предел в г°, если выполняются следующие три свойства, (i) Для каждой С1 кривой 7> заканчивающейся в г°, предел / вдоль 7 существует в г°. Более того, величина этого предела зависит только от касательного направления к 7 в г°. Определяем F(6Q) = lim^o /, где предел берется вдоль кривой, касательное направление к которой характеризуется ва. (ii) F является гладкой функцией на 3-сфере. (ш) Вдоль каждой С1 кривой, заканчивающейся в г°, имеем для всех п > 1: .. dnf dnF ndnf lim —- = -—- и \impn-^- = 0. i° двп двп i° дрп (Здесь дп/двп обозначает n-ую частную производную по ва и оДи' наковая производная появляется в обоих сторонах равенства.) Таки
j_l.l. Конформная бесконечность 397 образом, точное определение того, что ga6 является С>0 в г° содержит в себе следующее. Кроме того, что gab является непрерывной, все первые частные производные компонент ga6 в гладкой карте, покрывающей г°, имеют регулярные, зависящие от направления пределы в i°. Отсюда следует, что в карте с ортонормальными в г° величинами {Va^} компоненты gab имеют вид gab = r}^Ll/-\-pltJLU{9a)-\-o{p) при р -> 0. Дальнейшее обсуждение условия С>0 имеется в работах (Ashtekar and Hansen 1978; Ashtekar 1980). Поскольку метрика только С>0 в г°, то естественно также ослабить пpeдпoлJOжeния, касающиеся дифференциальной структуры многообразия М в г° до тех условий, которые Аштекар и Хансен (Ashtekar and Hansen 1978) назвали C>1 дифференциальной структурой. (Иначе можно было бы определить множество неэквивалентных дифференциальных структур на М в г°, совместимых со всеми описанными выше условиями.) Мы отсылаем читателя к этим работам для определения этого понятия. Заметим, что мы определили асимптотическую плоскостность только для случая вакуумных пространств Rab = 0. Однако, поскольку только свойства пространства-времени "вблизи бесконечности" будут играть роль в нашем анализе, нам необходимо требовать Яаь = 0 "вблизи бесконечности", т.е. в пересечении М и окрестности V в условии (2). Действительно, можно и дальше ослабить это требование и допустить существование ТаЬ в V, стремящегося к нулю достаточно быстро на бесконечности или, более точно, П~2ТаЬ является гладким на J+ и J~ и имеет подходящее предельное поведение в г°. В соответствии с уравнением (D.8) прилож. D (где gab и gab меняются местами) физический тензор Риччи Rab связан с нефизическим тензором Риччи Rab соотношением Rab = Rab + 2П"1 VaVbfi + gabgcd{^-1 VcVdfi - 3fr2Vc£2Vdfi). (11.1.16) Поэтому исчезновение правой стороны уравнения (11.1.16) ведет к вакуумному уравнению Эйнштейна, которое выражено чере:^ нефизические переменные. Мы специально записали, например, gc VcVdft вместо VCVCQ для того, чтобы обойти неопределенность в том, какая метрика - физическая или нефизическая - используется для поднятия и °пУскания индексов. Необходимо подчеркнуть, что существует значительный произвол в вязи нефизического пространства-времени (M,ga6) с асимптотически ^°ским физическим пространством-временем (M,ga6). Если (M,ga6) ляется нефизическим пространством-временем, удовлетворяющим СвоЙствам определения с конформным фактором П, тогда то же са-
398 Глава 11. Асимптотически плоские пространства мое можно сказать и о пространстве-времени (M,u;2gob) с конформ, ным фактором uQ при условии, что функция ш строго положительна является везде гладкой, за исключением, возможно, г°, удовлетворяет условию С>0 в г° и uj(i°) = 1. Поэтому существует значительный калибровочный произвол в выборе нефизической метрики. Обсудим теперь смысл пяти условий, появляющихся в определении асимптотической плоскостности. Первые три условия непосредственно требуют, чтобы (M,gafe) обладало некоторыми основными особенностями конформного пополнения пространства-времени Минковского. Первое, в сущности, устанавливает, что г° представляет собой пространственную бесконечность; второе означает, что вблизи бесконечности не появляется причинных патологий; третье требует, чтобы конформный множитель ft хорошо себя вел на бесконечности. Ключевым условием в определении является четвертое. Требование, чтобы множитель ft исчезал на J+, J~ и г° означает, что эти места "бесконечной величины растяжения" участвуют в переходе от нефизической метрики gab к физической gab. Это показывает, что J4", J~ и г° истинно описывают "бесконечность" физического пространства-времени. Более того, требования на производные ft в У"1", J~ и г° в условиях 4(а) и 4(b) означают, что физическая метрика gab становится плоской (и приближается к плоской с подходящей скоростью) при удалении на бесконечность. Чтобы увидеть это более детально, выведем координатную форму условия на асимптотическое поведение физической метрики при приближении к нулевой бесконечности будущего J+. (Аналогичный анализ применим конечно и к J~.) Умножив вакуумные уравнения Эйнштейна (уравнение (11.1.16) с Rab = 0) на П и взяв предел к J4", мы находим (поскольку ^ab/Rab и ft являются там гладкими), что ft_1gc VcftVdft является гладкой функцией на J+, т.е. более точно (поскольку ft = 0 на *7+, и поэтому ft-1 не определена), что эта величина может быть гладко продолжена на J74*. В частности, это означает, что па = g° V&ft является нулевым на J4", что следует также из того, что вектор п° должен быть нормальным к J+ (поскольку ft является постоянной величиной на i7+), и J+ = [J+(i°) — г°) является нулевой поверхностью. Теперь покажем, что, используя отмеченную выше "калибровочную свободу" в конформном множителе, мы можем сделать ft_1gc VcftVrfft исчезающей в 17+ величиной. Точнее, при преобразованиях ft —* ft' = a>ft, gab —► u;2gafe имеем (ft,)-1(^)cdV;ft,V^ft/ = uj-3gcd[nVcuVd(j + 2uVcnVdu; + + u^ft^VcftVdft]. (11.1.17)
j 1.1. Конформная бесконечность 399 Выбирая о;, удовлетворяющее уравнению n°V0 lnw = ifi-^VcQVdfi (11.1.18) на *7+> мы находим новые нефизическую метрику и конформный фактор, удовлетворяющие требуемым условиям. (Поскольку уравнение (11.1.18) является простым обыкновенным дифференциальным уравнением вдоль каждой интегральной кривой поля па, то решения этого уравнения можно получить всегда2.) Таким образом, без потери общности можно предположить, что мы выбрали конформный фактор и нефизическую метрику так, что f2_1gc Vcf2Vdfi = 0 на 3+. Тогда вакуумные уравнения Эйнштейна дают 2VGfiV6fi + &6gcdVcVdfi = 0 на J+, (11.1.19) что приводит к соотношению VcVdfi = 0 на J+. (11.1.20) Из уравнения (11.1.20) тривиально следует, что нулевой касательный вектор па = ga Vfcfi к J+ удовлетворяет уравнению геодезической на *7+, параметризованному аффинным параметром, и по отношению к нефизической метрике naVanb = 0. (11.1.21) Более того, поскольку Въа = Vanb = 0 на J+, то мы видим, что в калибровке (11.1.20) расширение, сдвиг и тензор вращения нулевой геодезической, порождающей J'4", исчезают (см. разд. 9.2). Выбор калибровки а;, ведущий к калибровочному условию (11.1.20), Допускает еще дополнительную свободу выбора ш на любом сечении *7+, т.е. на двумерной поверхности Q в 17+, которая пересекает каждую нулевую геодезическую, порождающую J+ точно в одной точке. Из условия 5(а) следует, что нефизическая метрика ga6 индуцирует топологию 52 х К, и поэтому топологически поверхность Q должна оыть 2-сферой. Нефизическая метрика go6 индуцирует риманову метрику hab на Q. Однако, используя аргументы задачи 2 гл. 3, можно показать, что каждая риманова метрика на двумерной сфере равна Заметим, что решения и уравнения (11.1.18) на J+ не могут иметь корректно- пРедельного поведения на г°. Поэтому в действительности уравнение (11.1.18) *но использовать только вне (произвольно малой) окрестности г°. Однако это 30 не касается, поскольку мы имеем дело только с асимптотической формой фи- Ической метрики на J+.
400 Глава 11. Асимптотически плоские пространства конформному фактору, умноженному на естественную метрику сферы, т.е. Яаь имеет форму Наь = f2hab, и {G, hab) изометрично единичной сфере в R3. Следовательно, мы используем оставшуюся свободу в выборе а;, чтобы сделать Q сферой единичного радиуса. Поскольку в калибровке (11.1.20) расширение и сдвиг нулевой геодезической, порождающей J+, исчезают, тогда в этой калибровке индуцированная метрика каждого сечения в J+ является метрикой единичной сферы. Сделав вышеописанные выборы калибровки, мы вводим следующим образом координаты в окрестности J+ в нефизическом пространстве-времени. Поскольку Vafi ф 0 на У"1", то можно использовать сам фактор П в качестве одной из координат. Мы вводим естественные сферические координаты (0, ф) на сферическом сечении Q и "переносим" эти координаты в другую точку J+ вдоль нулевой геодезической, порождающей J+'. Определяем координату и на J+ в качестве аффинного параметра (отмеренного от Q+) вдоль нулевой геодезической, порождающей 17+, с условием naVau = 1. Наконец, мы продолжаем (и,в,ф) вне J4", сохраняя фиксированными их величины вдоль каждой нулевой геодезической семейства (отличного от того, что порождает J4"), ортогонального 2-сфере постоянного и на J+. Из вышеизложенного следует, что в этих координатах нефизическая метрика ga6 принимает на J+ вид d^\J+ = 2dQdu + d62 + sin2 Овф2. (11.1.22) Более того, калибровочное условие (11.1.20) на Q означает, что *guu,guo и ]*иф являются 0(Q2) при П —» 0 (см. задачу 1). Поэтому в окрестности J+ компоненты физической метрики gab = П~2#а6 принимают вид ds2 = 2 n~2dSldu + £Г 2(d02 + sin2 Мф2) + -h члены 0(1) в du2, dudO, dudф + (11.1.23) + члены 0(fi-1) в d62,dвdф, dф21 dQdu, dfi2, сШ0, dШф. Далее совершаем координатное преобразование v = 2/П. В координатах и, v, 0, ф физическая метрика в пределе v —> со принимает вид ds2 = - dvdu + jv2(d62 + sin2 Мф2) + 4- члены 0(1) в du2, dudQ, dudф + 4- члены 0{v) в d62!, dвdф, dф2 + + члены 0(l/v) в dvdu, dvdO, dvdф + + 0(l/v3)dv2. (11.1.24)
ll.l. Конформная бесконечность 401 Дальнейшим преобразованием v —► v + f(u,0,<f>) члены O(l) в du2 можно убрать, но только ценою введения членов O(l) в dvdO и dvd(/>. Сделав это, мы переходим к "асимптотически плоским декартовым координатам", определенным соотношениями t = ^(w + v),i= \{v — ^и) sin в cos ф, у = \{v — гх) sin 0 sin </>, г = ^(г> — г/) cos в. Тогда легко проверить, что компоненты физической метрики в этих координатах отличаются от diag(—1,1,1,1) только на слагаемые порядка l/v при v —> оо. Поэтому условие 4(a) вместе с уравнениями Эйнштейна (11.1.16) действительно требует, чтобы физическое пространство- время становилось асимптотически пространством-временем Минков- ского при стремлении к нулевой бесконечности. Дальнейшими координатными условиями (Tamburino and Winicour 1966) можно еще упростить асимптотическую формулу для метрики до выражения, первоначально постулированному в осесимметричном случае Бонди, ван дер Бургом и Метцнером (Bondi, van der Burg and Metzner 1962). Аналогично, условие 4(b) вместе с требованиями дифференциру- емости на ft и go6 в г° подразумевает, что метрика является асимптотически метрикой Минковского на пространственной бесконечности. Точная координатная форма этого положения дается в работе (Ashtekar and Hansen 1978)(см. уравнение (С21) в этой статье). Аш- текар и Хансен также доказали, что трехмерное пространственнопо- добное подмногообразие нефизического пространства-времени, которое проходит через г°, ведет себя достаточно хорошо (точнее С>х, т.е. его внутренняя метрика Каь и единичная нормаль являются С>0) в г°, является всюду гладким и дает асимптотически плоскую поверхность начальных данных в следующем смысле (Geroch 1972b). Говорят, что набор начальных данных (Е, hab, ^аб)> состоящий из трехмерного многообразия Е, римановой метрики Наь и симметричного тензора Каь, является асимптотически плоским^сли существует многообразие Е такое, что (i) существует точка Л £ Е (называемая "точкой на бесконечности") такая, что существует конформная изометрия ф : Е —> [Е — Л] £ hab = Q,2ip*hab на Е — Л; (ii) Q является С2 в Л и С°° всюду на Е, а "аь является С>0 в Л и С°° всюду на Е; (Ш) О, удовлетворяет условию в Л аналогичному условию 4(b), точнее, $7(Л) = 0 и Итл АД = 0, а \DaDbil—2hab) достигает конечного, независящего от направления Сдельного значения в Л, где Da - оператор производной, ассоцииро- ^ный с каь; и (iv) нефизический тензор Риччи ^Rab и ф*Каь имеют °Дходящее предельное поведение в Л, а именно, О,1/2 ^Rab и £1ф*Каь Мигают конечного, независящего от направления предельного зна- Ния в Л. Для асимптотически плоских начальных данных можно
402 Глава 11. Асимптотически плоские пространства сконструировать асимптотически евклидову систему координат на п^ верхности физических начальных данных Е такую, что компоненты физической метрики отличаются от diag(l, 1,1) только на слагаемые 0(1/г) при г —* оо, и первые производные этих компонент являют- ся 0(1/г2) (см. задачу 2). Более того, компоненты внешней кривизны Каь и физического тензора кривизны Риччи ^Rab являются соответственно 0(1/г2) и 0(1/г3). Условия асимптотической плоскостности на поверхности начальных данных, сформулированные в этих коорди. натных компонентах, были даны в работе (Arnowitt, Deser and Misner 1962). Наконец, условие (5) нашего определения асимптотической плоскостности является техническим условием, которое, строго говоря, означает, что J+ и J~ имеют правильный размер. Во-первых, условие 5(a) устанавливает, что все нулевые геодезические, генерирующие J"+ и J~, исходят из г° соответствующим образом. В частности, это означает, что J+ и J~ имеют топологию S2 xR. Если ga6 была гладкой в г°, нулевая касательная в г° автоматически могла бы быть диффеоморф- на нулевой геодезической, генерирующей J+ и J~, если бы все они имели конечную точку в г°, но, поскольку *gab является только С>0 в г°, это свойство необходимо требовать отдельно. Условие 5(b) требует, чтобы "все J+ и J" были представлены" в конформно продолженном пространстве-времени. Это эквивалентно положению, что в калибровке (11.1.20) нулевые геодезические, генерирующие 3* и J~, полны. (Соотношение Va(u;4na) = 0 эквивалентно уравнению (11.1.18).) Полнота нулевых геодезических, генерирующих 17+, эквивалентна в свою очередь положению, что в нашей координатной системе (м, и, 0, ф) запаздывающее время и изменяется от — оо до -foo. Герок и Горовиц (Geroch and Horowitz 1978) показали, что без условия 5(b) асимптотическая плоскостность исчезнет за конечное запаздывающее время. Подчеркнем, что наши условия (1)-(5) определяют асимптотическую плоскостность и в пространственной и в нулевой бесконечности. Однако, по многим причинам требуется понятие асимптотической плоскостности только на пространственной бесконечности или только на нулевой бесконечности, поэтому полезно определить эти понятия отдельно. Это можно сделать, опуская несущественные части нашего определения. Более точно, говорят, что пространство-время (не обязательно удовлетворяющее вакуумным полевым уравнениям; является асимптотически плоским на пространственной бесконеч* ности, если существует пространство-время (M,ga6) и ga6 являете всюду С°°, за исключением возможно точки г°, где она С>0, и сУ* ществует конформная изометрия М на М с конформным фактор0
- 1. Конформная бесконечность 403 п удовлетворяющим условиям 1, 2 и 4(b). Говорят, что вакуумное пространство-время (M,gab) является асимптотически плоским на нулевой бесконечности, если существует многообразие с границей (см. рИлож. В) М с гладкой метрикой gab и конформной изометрией М во нухреннюю область М с конформным фактором £1 таким, что выполняется подходящий вариант условий 1, 2, 3,4(a) и 5. Более точно, определим границу J многообразия М, и в условии 1 мы требуем, чтобы J можно было бы записать в виде непересекающегося объединения двух частей J+ и J" таких, что J+flJ-[int(M)] = 0 и J~ П J+[int(M)] = 0. Мы снова требуем, чтобы нефизическое пространство-время было сильно причинным в окрестности J (условие 2), Q имеет С°° продолжение на все М (условие 3), и условия 4(a) и 5(b) выполняются на J. Наконец, мы заменяем 5(a) требованием, чтобы J+ и J~ имели топологию S2xR. Рассмотренное выше определение асимптотической плоскостности на нулевой бесконечности отличается от оригинальной формулировки, данной Пенроузом (Penrose 1963, 1965b). Пенроуз определил, что пространство-время является асимптотически простым, если вместо использованных версий условий 1, 2, 3, 4(a) и 5 потребовать, чтобы функция П имела С°° расширение на все М, выполнялось условие 4(a), и каждая максимально продолженная (в обоих направлениях) нулевая геодезическая, проходящая через какую-либо точку int(M), имела конечные точки в прошлом и будущем на J. Это последнее условие является очень сильным глобальным условием на физическом пространстве-времени, гораздо более сильным, чем асимптотическое условие на бесконечности. Однако его можно изменить до некоторого асимптотического условия, определяя понятие слабо асимптотически простого пространства-времени, требуя, чтобы окрестность на J в (M,gab) заданного пространства-времени (M,gab) была изометричной окрестности J некоторого асимптотически простого пространства-времени. Тогда слабая асимптотическая простота берется в качестве критерия асимптотической плоскостности на нулевой Оконечности. Хотя такая формулировка является косвенной и существенно отличается от данной выше, слабо асимптотически простое пРостранство-время удовлетворяет всем условиям нашего определения кРоме 5(b); см. (Geroch and Horowitz 1978), где показано, что нет нуж- ^ в выполнении условия 5(b) и (Hawking and Ellis 1973), где приветны теоремы, в которых показано выполнение остальных условий. В заключение мы рассмотрим два важных свойства асимптотиче- Ки плоских пространств. Первое имеет дело с понятием асимптотиче- и* симметрии. Пространство-время Минковского (К4,77аь) имеет де-
404 Глава 11. Асимптотически плоские пространства сятипараметрическую группу изометрий - группу Пуанкаре. Эта труп, па изометрий играет важную роль в анализе поведения физических полей в пространстве-времени Минковского, в частности, в доказательстве законов сохранения. В общем случае искривленное пространство- время может и не иметь точных изометрий. Однако в асимптотически плоском пространстве-времени мы можем определить понятие асимптотической симметрии, поскольку метрика становится плоской на бесконечности. Оказывается, что естественное понятие асимптотической симметрии действительно существует для асимптотически плоских пространств, но группа асимптотических симметрии не является группой Пуанкаре. Скорее она является гораздо более широкой группой, содержащей бесконечномерную подгруппу "трансляций, зависящих от угла", называемых супертрансляциями. Обсудим кратко природу асимптотических симметрии на нулевой бесконечности, отсылая читателя к работам (Sachs 1962c) и (Geroch 1977) для дальнейших деталей. По существу мы предполагаем существование некоторой асимптотической симметрии, скажем, на нулевой бесконечности будущего, представленной векторным полем £°, или, более точно, классом эквивалентности векторных полей в физическом пространстве-времени, таким, что уравнения Киллинга £^gab = 0 выполняются "по возможности с лучшим приближением" при приближении к 17+. Соответствующие требования для скорости приближения £$gab к нулю можно определить, рассматривая общую форму метрики асимптотически плоского пространства-времени и налагая сильное условие, допускающее общие решения. Можно сформулировать конечное требование следующим образом. Во-первых, мы требуем, чтобы £а, рассматриваемое как векторное поле в нефизическом пространстве- времени (т.е. ip*£a), имело гладкое расширение на J+. Затем дополнительно мы требуем, чтобы тензорное поле Q,2£^gab также имело гладкое расширение на *7+, исчезающее в J+. Более того, два векторных поля £а и £'а в физическом пространстве-времени, удовлетворяющие этим условиям, генерировали ту же инфинитезимальную асимптотическую симметрию, если их расширения на J+ совпадают. Таким образом, определенная группа асимптотической симметрии является универсальной в том смысле, что мы имеем ту же самую абстрактную группу симметрии для всех асимптотически плоских пр°" странств. Удивительно, что эта группа не является десятипараметрИ' ческой группой Пуанкаре, а некоторой бесконечномерной группой, известной как группа Бонди - Метцнера - Сакса (BMS). Происхождение этих "сверх" асимптотических симметрии можно понять с помошь проверки того, что в пространстве-времени Минковского в коорДиН
j 1.1. Конформная бесконечность 405 тах, определяемых уравнением (11.1.4), для произвольной функции / = /(0, ф) угловых переменных векторное поле С = Нд/0иГ + £%weer + ^4^S(W)° (11Л-25) не исчезает в J4*, но П2«£$77аб исчезает J4". В неплоском, но асимптотически плоском пространстве-времени в общем случае невозможно найти векторное поле, удовлетворяющее уравнениям Киллинга вблизи бесконечности с лучшей точностью. Следовательно, в искривленном пространстве-времени появляется бесконечномерное семейство "трансляций, зависящих от угла" просто как семейство трансляций, наиболее точно удовлетворяющих уравнениям Киллинга, чем какие-либо другие преобразования. Мы уже ввели группу BMS через приближенные симметрии в физическом пространстве-времени при приближении к J+. Однако преобразования асимптотической симметрии физического пространства- времени расширяются до 17+ в нефизическом пространстве-времени, и можно дать эквивалентное определение BMS группы через отображения J+ в себя. В нефизическом пространстве-времени нефизическая метрика gab индуцирует вырожденную метрику каь на нулевой гиперповерхности 17+. Более того, поскольку векторное поле па = ga6Vaf2 является касательным к 17+, можно понимать п° как векторное поле на J+. При изменении конформной калибровки Г2_—> шО, величины каь и па преобразуются следующим образом: hab -» h'ab = ш2Наъ, па —► -»• (п')° = ш~1па. Многообразие J+ вместе с каь и па являются универсальными по модулю конформной калибровки, т.е. они "те же самые" Для всех асимптотически плоских пространств в следующем смысле. Пусть (J*, (hi)ab,(ni)a) являются нулевой бесконечностью будущего, индуцированной вырожденной метрикой и индуцированным векторным полем, связанным с асимптотически плоским (физическим) пространством-временем (Mi,^)^), и пусть (j£,(Ь,2)аъЛп2)а) являйся соответствующей структурой для (М2, (feW)- Тогда существуют вЬ1боры конформной калибровки в двух нефизических пространствах, т&кие, что существует диффеоморфизм ф : J* —> J$, удовлетворяющий условиям ф*0^г)аь = (hf2)ab^*(^i)a = Ю°- (Доказательство. Выше было показано, что для любого J+ существует конформ- ^ калибровка и координаты (и,0,ф) такие, что Наь = ((1в)а(йв)ь + s*u 0(а1ф)а(а1ф)ь и па = (д/ди)а. Пусть ф является отображением, ^орое сопоставляет каждой точке на J* точку на j£ с теми же комбинатами .) Группа BMS является группой диффеоморфизмов У"1", ^°Рая сохраняет универсальную структуру, т.е. группа BMS состоит
406 Глава 11. Асимптотически плоские пространств из диффеоморфизмов гр : J+ —> J+ таких, что гр*1гаь и ф*па отлича- ются от hab и па по большей части на масштабирование, связанное с изменением конформной калибровки. В этом смысле группы BMS инфинитезимальные супертранслл* ции определяются как векторные поля на J+ вида £aj= ста, где Q является константой на каждом генераторе J+ (т.е. naVaa = 0), но в остальном является произвольной функцией. Таким образом, рассмотренные выше "зависящие от угла трансляции" пространства-времени Минковского приводят к BMS супертрансляциям. Супертрансляции составляют бесконечномерную абелеву нормальную подгруппу группы BMS, и фактор группа, полученная факторизацией группы BMS супертрансляциями, является изоморфной группе Лоренца. Хотя по обсужденным выше причинам группа BMS составляет труп- пу асимптотической симметрии асимптотически плоского пространства-времени, можно все же спросить, существует ли естественная процедура "восстановления" группы Пуанкаре с помощью наложения дополнительных условий на асимптотические симметрии. Оказывается, что можно частично продвинуться в этом направлении следующим образом. Существует единственная четырехмерная подгруппа супертрансляций, которая является нормальной подгруппой группы BMS. В случае пространства-времени Минковского эта четырехмерная подгруппа группы BMS в точности состоит из асимптотических симметрии, связанных с точными трансляционными симметриями пространства-времени Минковского. Таким образом, мы можем определить асимптотические трансляции асимптотически плоского пространства-времени как элементы BMS, принадлежащие этой подгруппе. (На J+ в калибровке (11.1.20) со сферически симметричными сечениями инфинитезимальные трансляции являются в точности супертрансляциями вида £а = апа, где а является линейной комбинацией / = О и I = 1 сферических гармоник.) Однако такая процедура нарушается для вращений и бустов. Не существует нормальной подгруппы группы BMS, которая изоморфна группе Пуанкаре. Поэтому до тех пор, пока мы не используем что-либо большее, чем поведение асимптотических симметрии на J+ (как, например, поведение асимптотических симметрии на г°) или пока не наложим более строгие условия на пространство-время, чем использованные в нашем определении асимптотической плоскостности, не существует естественного пути выбора предпочтительной подгруппы Пуанкаре асимптотических симметрии- Понятие "чистой трансляции" имеет смысл для асимптотически пло ^ ких пространств, но понятия "чистого вращения" или "чистого буста (как противоположного "вращение плюс супертрансляция" или ' бу плюс супертрансляция") нет.
Конформная бесконечность 407 Группа асимптотических симметрии на пространственной беско- ечности - известная как Спай группа - может быть определена спо- обом, близким к определению группы BMS. Структура этой группы чень близка к структуре группы BMS. Мы отсылаем читателя к работам (Ashtekar and Hansen 1978) и (Ashtekar 1980) для обсуждения этих свойств. Интересно, что ограничивая рассмотрение пространствами, удовлетворяющими более сильному условию асимптотического спада тензора Вейля на пространственной бесконечности, чем использованному в нашем определении асимптотической плоскостности, возможно выбрать предпочтительную подгруппу Пуанкаре Спай группы (см. Ashtekar 1980). Математически аналогичное условие на тензор Вейля на нулевой бесконечности также позволяет получить предпочтительную группу Пуанкаре группы BMS. Однако, хотя это дополнительное условие на пространственной бесконечности является физически разумным, аналогичное условие на нулевой бесконечности исключает возможность гравитационного излучения и поэтому является намного более строгим условием, чтобы его можно было бы наложить на произвольные изолированные системы. Наконец, мы отметим важное следствие нашего определения асимптотической плоскостности, касающееся асимптотического поведения кривизны на нулевой бесконечности. Физический тензор Риччи исчезает около бесконечности так, что физический тензор Вейля Саьс содержит всю информацию о физической кривизне. Поскольку тензор Вейля является конформно инвариантным (см. прилож. D), то мы имеем СаЪс — Саьс на М, где Саъс является нефизическим тензором Вейля. Однако можно показать (см. теорему 11 в работе (Geroch 1977)), что СаЬс1 должен исчезать^а 3*'. Далее, пусть 7 является какой-либо нулевой геодезической в М от точки р в физическом пространстве- времени до точки q на J+. Пусть Л является (нефизическим) аффинным параметром на 7 (так, что q представляется пределом, когда Л стремится к бесконечности) и пусть ка обозначает касательную к 7 в этой параметризации. Нефизическая кривизна Вейля на 7 не должна Удовлетворять какому-либо специальному условию, кроме того, что °на должна исчезать в q. Однако при переходе от нефизического к физическому пространству-времени имеется бесконечное "растягивание" ^ направлении ка. Оказывается, что это заставляет физический тензор **бйля удовлетворять следующему условию. При Л —> оо имеем Г(1) Г(2) ^(3) г(4) / 1 v ^abcd - -Д— + -д2~- + "да- + -дГ" + U l Д5 ) > (П.1.26)
408 Глава 11. Асимптотически плоские пространств где каждое выражение Ca^cd имеет ограниченные компоненты в неко, тором асимптотически Минковском базисе, и в алгебраической классу фикации разд. 7.3 тензор CaHd имеет тип IV, Cafcd тип III, СаЦ(1 тИп II (или тип П-И) с повторяющимся главным нулевым вектором ка тензор Cabcd имеет тип I с ка также в одном из его главных нулевых направлений. Для дальнейшего обсуждения и доказательства этого условия, мы отсылаем читателя к работам (Penrose 1965b) и (Geroch 1977). 11.2 Энергия Понятие энергии и закона сохранения энергии играет ключевую роль во всех физических теориях. Уже в ньютоновской теории движения частицы имеется понятие энергии частицы. В физически более изощренных теориях с более широкой областью действия рамки физических законов заметно отличаются от ньютоновской механики частицы, но понятие энергии всегда остается. Поэтому, как, например, обсуждалось в гл. 4, в теории классического поля в пространстве- времени специальной теории относительности тензор энергии-импульса Таь связывается с полем. Полная энергия поля, связанная с киллингов- ским полем временных трансляций ta на пространствен нопо- добной поверхности Коши £ определяется таким образом Е = = $^ТаъпЧъ, где па обозначает единичную нормаль к £. Условие даТаь = 0 тогда гарантирует сохранение полной энергии, т.е. независимость от выбора Е. В общей теории относительности свойства энергии материи снова представляются тензором энергий-натяжений Таь. Поэтому локальная плотность энергии материи, измеренная данным наблюдателем, остается хорошо определенной. Однако, хотя условие VaTab = 0 можно интерпретировать как выражение локального закона сохранения энергии-импульса материи (см. гл. 4), это условие не ведет, вообще говоря, к глобальному закону сохранения3, т.е. закону, устанавливающему, что полная энергия (выраженная как интеграл от Таь п0 ПР°~ странственноподобной гиперповерхности) сохраняется. Физически это неудивительно, поскольку Таь описывает только энергию материи, ъ то время как "энергия гравитационного поля" должна давать вклад в полную энергию и поэтому она должна появиться в законе сохра' 3Имеется исключение в том случае, если в пространстве-времени имеется в а торное поле Киллинга £а. Тогда Va(Ta6£6) = (V°Ta6)€6+Ta6Va£6 = 0 и /s Tab*. n сохраняется, т.е. не зависит от выбора поверхности Коши Е.
х\% Энергия 409 ения. Однако, как подчеркивалось в гл. 4, не существует содержа- gjibHoro понятия плотности энергии гравитационного поля в общей еории относительности. В ньютоновской гравитации плотность энергий гравитационного поля4 имеет вид — (87г)_1| V<£|2. Поскольку в ньютоновском пределе величина ф соответствует метрической компонен- ^ (см. разд. 4.4.1), то наилучшим кандидатом для плотности энергии гравитационного поля в общей теории относительности могло бы быть выражение, квадратичное по первым производным от метрики, go поскольку не существует другого тензора кроме самой метрики g сконструированного только из компонент gab в координатном базисе и их первых производных, то содержательное выражение, квадратичное по первым производным метрики, можно получить только, если имеется дополнительная структура на пространстве-времени такая, как привилегированная система координат, или имеется разложение пространственно-временной метрики на "фоновую часть" и "динамическую часть" (так, что можно было бы взять производные, скажем, "динамической части" метрики с помощью оператора производной, ассоциированной с фоновой частью). Такая дополнительная структура совершенно противоречит духу общей теории относительности, в рамках которой пространственно-временная метрика полностью описывает все аспекты структуры пространства-времени и гравитационного поля. Хотя остается возможным конструирование необходимой нелокальной дополнительной структуры кроме пространственно- временной метрики, кажется маловероятным, что существует применимое в общем случае описание для получения физически содержательного локального выражения для плотности гравитационной энергии, аналогичного ньютоновской формуле. Не найдено других приемлемых кандидатов для локального выражения гравитационной плотности энергии. В частности, локальный тензор, использующий кривизну пространства-времени выше линейного порядка, такой как тензор Бела - Робинсона (задача 6 гл. 4), даже не имеет размерности плотно- сти энергии (т.е. (длина)"2 в единицах G = с = 1), так, что необходимо ввести в такое выражение константу другой природы, чем Сие, чтобы °но представляло собой энергию гравитационного поля. Впрочем, несмотря на отсутствие понятия плотности энергии гра- витационного поля, все же существует полезное и содержательное по- Ньютоновскую гравитацию можно сформулировать так, чтобы отсутствовали РЧвилегированные галилеевские системы отсчета (Trautman 1965). В этом случае Ф становится калибровочно зависящей величиной и ньютоновская формула для тности гравитационной энергии страдает от тех же трудностей, как и в общей Рии относительности.
410 Глава 11. Асимптотически плоские пространств нятие полной энергии изолированной системы, т.е., более точно, n0jb ный 4-вектор энергии импульса в асимптотически плоском пространств ве-времени. Первым шагом является рассмотрение изолированной си* стемы в общей теории относительности по аналогии с частицей в специальной теории относительности. В специальной теории относительности частице присваивается 4-вектор энергии-импульса Ра. Энергией частицы является временная компонента этого вектора, т.е. по отношению к полю Киллинга временных трансляций £а имеем Е = — Ра£а. Более того, масса частицы имеет вид М = (—РаРа)1/2, поэтому, если частица находится "в покое" по отношению к £а, то Е = М. Таким образом, знание "системы покоя" поля Киллинга £а вместе с массой М частицы определяет ее 4-импульс Ра. Нашей стратегией в определении 4-импульса изолированной системы в общей теории относительности является рассмотрение статических пространств, где имеется естественная "система покоя" поля Киллинга. Затем мы определим полную массу статического асимптотически плоского пространства- времени, изучая влияние гравитационного поля на удаленные пробные тела. Действительно, мы уже сделали это для пространства-времени Шварцшильда в гл. 6. Из результатов разд. 6.3 следует, что пробные тела в пространстве-времени Шварцшильда на орбитах с г ^> М ведут себя подобно пробным телам в гравитационном поле тела массой М в ньютоновской гравитации. Поэтому в гл. 6 мы идентифицировали параметр М метрики Шварцшильда как полную массу пространства- времени. Теперь мы обобщим этот результат. Напомним вначале, что в ньютоновской теории гравитации ньютоновский потенциал ф удовлетворяет уравнению Лапласа во внешней, вакуумной области V2<£ = 0. (11.2.1) Таким образом, имеется мультипольное разложение для </>, и массу М изолированной системы можно определить как взятый со знаком минус коэффициент лидирующего порядка (т.е. монопольное 1/г слагаемое) этого мультипольного разложения. Эквивалентная, но более физическая характеристика полной массы, которая также использует асимптотические свойства гравитационного поля, дается формулой "закона Гаусса" М=^- [ Чф-Шл. (11.2.2) 4тгУ5 Здесь интеграл берется по некоторой топологической 2-сфере 5, которая включает в себя все источники, и N является единичной внешне* нормалью к 5. Интеграл не зависит от выбора S вследствие уравнения (11.2.1), и легко видеть, что это определение находится в согласии
< 1.2» Энергия 411 пределением через мультипольное разложение М. Поскольку V0 является силой, которая должна быть приложена к единичной пробной массе для того, чтобы "удержать ее на месте", мы видим из уравнения п 1.2.2), что 4пМ является просто полной силой, которая должна быть лриложена к пробной материи с единичной поверхностной плотностью массы, распределенной на S. Рассмотрим статическое асимптотически плоское пространство-время, вакуумное в окрестности бесконечности и имеющее времениподоб- ное векторное поле Киллинга £а, нормированное таким образом, что "фактор красного смещения" V = (—£а£а)1/Г2 достигает единицы на бесконечности. В статическом пространстве-времени понятие "стояния на месте" хорошо определено и означает следование вдоль орбит векторного поля Киллинга £°. Ускорение такой орбиты есть а» = (e/V)Va(Zb/V) = ^rVaS". (П.2.3) Таким образом, локальная сила, которую необходимо применить к единичной пробной массе, чтобы удержать ее на месте, дается уравнением (11.2.3). Однако, если мы вычислим силу, которую необходимо применить удаленному наблюдателю на бесконечности (например, с помощью длинной струны), мы найдем, что эта сила отличается от локальной силы на множитель V (см. задачу 4 гл. 6). Рассмотрим топологическую 2-сферу 5, лежащую на гиперповерхности, ортогональной £а. Величину F = J Nb(S/V)VaSbdA (11.2.4) можно интерпретировать как направленную наружу полную силу, необходимую для удержания на месте удаленным наблюдателем единичной поверхностной массы, распределенной на 5. Здесь мы используем естественный элемент объема на 5, индуцированный метрикой пространства-времени, и Na является единичной "направленной наружу" нормалью к 5, ортогональной £а. Используя уравнения Киллинга "a& = V[a£bj, мы можем переписать уравнение (11.2.4) как F = l- j NabVaSbdA = -i J 6a6cdVc^, (11.2.5) где ЛГаЬ = 2V~l^aNbl является нормальным к 5 "бивектором", eabcd- элемент объема пространства-времени, ассоциированный с метрикой пространства-времени, и подынтегральное выражение является 2-фор- М°Й а, проинтегрированной по двумерному подмногообразию 5 (см. Рилож. В). (Ориентация eabcd выбирается так, чтобы eabcd = -67V[a6£cd],
412 Глава 11. Асимптотически плоские пространства где ecd является элементом объема на 5.) Это подынтегральное выра^ жение удовлетворяет tefabVf[tabcdV4d] = leIabtabcdVfVc(;d = = -4VfVleZf] = = 4V/V^e = = -4ЯеДЛ (П.2.6) где были использованы уравнение (В.2.13) во второй строке и уравнение (С.3.9) в последней. Следовательно, умножая уравнение (11.2.6) на eeimn и сворачивая по е, находим выражение V[,{emn]cdVc£d} = ^Ref^feelmn, (11.2.7) которое исчезает в вакуумной области Rab = 0. Таким образом, в вакуумной области дифференциальная форма ааь = €a&cdVc£d удовлетворяет соотношению da = 0. (11.2.8) Следовательно, применяя теорему Стокса (теорема В.2.1) к объему, ограниченному двумя сферами S и S" во внешней вакуумной области, мы видим, что интеграл в правой стороне уравнения (11.2.5) не зависит от выбора 5, также как и интеграл в уравнении (11.2.2) не зависит от S в ньютоновском случае. Поскольку оба интеграла представляют собой одинаковые физические величины, то естественно идентифицировать также и правые стороны этих уравнений. Таким образом, мы приходим к следующему определению полной массы статического асимптотически плоского пространства-времени, вакуумного во внешней области M = -±J eabcdVcZd. (11.2.9) Независимость правой стороны уравнения (11.2.9) от выбора S определяется только тем, что £а является полем Киллинга. Таким образом, мы можем принять уравнение (11.2.9) за определение полной массы во всех стационарных асимптотически плоских пространствах, вакуум* ных вблизи бесконечности. (Если ТаЬ Ф 0 на бесконечности, но достигает нуля достаточно быстро с тем, как пространство-время становится асимптотически плоским, то уравнение (11.2.9) можно все же использовать для определения М при условии, что 2-сфера "устремлена к бесконечности".) Определение (11.2.9), впервые данное в работе Комара (Котаг 1959), дает полностью удовлетворительное понятие полной
t1 2. Энергия 413 массы стационарных асимптотически плоских пространств. Заметим аКясе, что это определение имеет требуемое свойство и выражает М стационарных пространствах в виде сохраняющейся величины, связанной с симметрией трансляции по времени. Если 2-сфера S является границей пространственноподобной гиперповерхности Е такой, что Е U S представляет собой компактное многообразие с границей (см. прилож. В), тогда мы можем применить теорему Стокса для того, чтобы конвертировать уравнение (11.2.9) в объемный интеграл по Е: М = — ;г- / ос = — — / da = 8тг Js 8тг УЕ ЪЬПЧЬЛУ = = 2^(таЬ-\тёЛпа?М. (11.2.10) 4тгУЕ Здесь в третьем равенстве было использовано (11.2.7), в четвертом равенстве па является единичной направленной в будущее нормалью к Е (так, что еаьс = nd£dabc является естественным элементом объема на Е, записанным как dV), и в последнем соотношении были использованы уравнения Эйнштейна. Для сравнения этой формулы с формулами, использованными в линеаризованной гравитации и в статическом сферически симметричном случае, см. задачи 4 и 5. Мы переходим теперь к определению энергии-импульса в общем, нестационарном асимптотически плоском случае. Поскольку теперь нет понятия "поддержки пробной массы на месте", и поэтому нет понятия "гравитационной силы", то не очевидно, что существует хорошо Определенное понятие массы или энергии-импульса. Более того, дале- ко не ясно, какому векторному пространству должен принадлежать вектор энергии-импульса" пространства-времени. Однако будет вид- Но, что свойства асимптотически плоских пространств дают достаточ- нУю структуру для определения вектора энергии-импульса Ра через ^имптотический предел "ухода на бесконечность", и свойства беско- Нечности дают подходящую векторную структуру для Ра. С общей т°чки зрения мы ожидаем, что два типа пределов к бесконечности ин- еРесны для определения энергии-импульса: (1) можно попытаться по-
414 Глава 11. Асимптотически плоские пространства лучить понятие полной энергии-импульса в данный "момент" на про- странственной бесконечности, рассматривая асимптотически плоскую пространственноподобную гиперповерхность Е, т.е. пространственН(ь подобную гиперповерхность, которая С>1 в г°, и определить полную энергию Е и полный импульс ра на Е способом, аналогичным определению в стационарном пространстве-времени. По этому определению, чтобы получить содержательное понятие энергии-импульса на пространственной бесконечности Е и ра должны зависеть только от асимптотического поведения Е, должны сохраняться (т.е. они должны быть неизменными, если Е подвергается "временным трансляциям" на бесконечности) и должны преобразовываться как 4-вектор, если £ подвергается "бусту Лоренца" на бесконечности. Если эти свойства выполняются, то можно определить вектор полной энергии-импульса Ра на пространственной бесконечности как вектор в касательном в г° пространстве такой, что полная энергия, связанная с пространствен- ноподобной гиперповерхностью Е, которая С>1 в г° дается соотношением Е = —Рапа, где п° - единичная нормаль к Е в г°, а проекция Ра на Е дает полный импульс ра в "момент времени", задаваемый Е. (2) Можно попытаться получить понятие энергии-импульса в фиксированный "запаздывающий момент времени", рассматривая поведение пространственно-временной геометрии на нулевой бесконечности на асимптотически нулевой поверхности Е, такой как Ei или Е2 на рис. 4.3 гл. 4. Это позволит нам изучать энергию и импульс, переносимый гравитационным излучением. И снова, полная энергия и импульс, связанные с Е, должны зависеть только от асимптотических свойств Е. Однако, в отличие от ситуации в г°, нулевая или асимптотически нулевая гиперповерхность не связана естественным образом с каким-либо привилегированным "направлением времени", и поэтому мы должны дополнительно указывать "асимптотические трансляции по времени" для того, чтобы получить величину полной энергии Е. К счастью, как отмечалось в конце предыдущего раздела, группа асимптотической симметрии нулевой бесконечности имеет привилегированную четырех- параметрическую подгруппу трансляций так, что понятие "асимптотических трансляций по времени" хорошо определено. Снова величина Е должна преобразовываться как временная компонента вектора при изменении выбора асимптотической временной трансляции. Таким образом, мы ищем такое определение энергии-импульса, чтобы существовало связанное с каждым сечением J множества J* (нЛЙ J~) линейное отображение четырехмерного векторного пространств BMS трансляций в R. Другими словами, энергия-импульс каждого сечения J на нулевой бесконечности должно быть вектором Ра в W
11.2. Энергия 415 альном векторном пространстве BMS трансляций. Тогда величина Р0, использованная для данной временной трансляции, могла бы интерпретироваться как полная энергия, связанная с этим временным направлением в "запаздывающее время", определяемое 3, а ее значение для пространственных трансляций можно было бы интерпретировать как компоненту импульса в этом пространственном направлении. Как отмечалось выше, оба этих понятия энергии-импульса существуют для асимптотически плоских пространств. Мы дадим определение энергии-импульса на нулевой бесконечности, обсудим некоторые ее свойства и затем просто выпишем формулы для энергии-импульса на пространственной бесконечности. Основная идея на нулевой бесконечности следующая. Как обсуждалось выше, в случае пространства- времени с точной симметрией относительно временной трансляции уравнение (11.2.9) дает удовлетворительное понятие массы, и интеграл в формулах не зависит от выбора 2-сферы S. Таким образом, в общем нестационарном случае можно попытаться использовать формулу, подобную уравнению (11.2.9) для определения энергии, где £а теперь является генератором симметрии относительно асимптотических временных трансляций или, более точно, векторным полем в физическом пространстве-времени, которое принадлежит классу эквивалентности, связанному с BMS временными трансляциями. Конечно, интеграл будет теперь зависеть от выбора топологически сферической поверхности 5. Однако, поскольку уравнения Киллинга для £а выполняются все лучше и лучше при приближении к бесконечности, то можно ожидать, что зависимость от S будет существенно ослабевать в пределе, когда S "уходит на бесконечность". Более точно, пусть {Sa} является однопараметрическим семейством сфер, которые в нефизическом пространстве-времени достигают сечения J множества J+. Мы предлагаем следующее определение энергии Е, связанное с асимптотической трансляцией по времени £а: — lim — / sa-*j 8тг JSa tabcdVT. (11.2.11) ^казалось, что предел в правой стороне уравнения (11.2.11) существу- ^ всегда и не зависит от деталей того, как 50 достигает J. Действи- ^ьно, этот предел существует, даже когда £° является произволь- °и асимптотической симметрией, см. (Geroch and Winicour 1981) для ^°казательства этого результата. Более того, Е имеет требуемую личную зависимость от £°. Однако оказывается, что Е не является вариантом при изменении выбора представителя £а в классе эквива- нтности, связанном с заданной BMS временной трансляцией. Таким
416 Глава 11. Асимптотически плоские пространства образом, Е не является в этом смысле "калибровочно инвариантной", и уравнение (11.2.11) в том виде, как оно выписано, не дает удовлетворительного понятия энергии на нулевой бесконечности. Однако этот недостаток можно исправить, накладывая дополнительное условие на представителя векторного поля £а. Как было показано Героком и Виникуром (Geroch and Winicour 1981), можно всегда найти £°, удовлетворяющее условию, что функция Q~l Va£a достигает нуля на 17+: limf2-1Var = 0. (П.2.12) С этим дополнительным калибровочным условием, наложенным на £а, которое автоматически выполняется, если £а является полем Кил- линга, поскольку тогда всюду Va£a = 0, формула для Е становится хорошо определенной, т.е. независящей от выбора £а в классе эквивалентности, удовлетворяющим условию (11.2.12). Мы принимаем это за определение энергии на нулевой бесконечности. 4-импульс Ра определяется действием линейного отображения, определенному правой стороной уравнения (11.2.11) (с калибровочным условием (11.2.12)), на произвольную BMS трансляцию. Определение (11.2.11) энергии на нулевой бесконечности находится в согласии с определением, данным Бонди, ван дер Бургом и Метц- нером (Bondi, van der Burg and Metzner 1962) еще до геометрической формулировки понятия асимптотической плоскостности, и называется энергией Бонди. Она была сформулирована через поведение на 3* кривизны Вейля и сдвига "уходящей" конгруэнции нулевых геодезических, ортогональной J в калибровке (11.1.20) со сферическим сечением метрики (Penrose 1963). Тип формулировки "связи", данный выше, был введен в работах (Tamburino and Winicour 1966) и (Winicour 1968), а демонстрация эквивалентности с формулировкой Пенроуза была дана Виникуром (Winicour 1968). Интересно проверить, как энергия Е изменяется со временем, т.е. как величина Е, ассоциированная с данной асимптотической временной трансляцией на сечении J7i, отличается от величины Е, ассоциированной с той же асимптотической временной трансляцией на "позднем" сечении J^, Оказывается, что можно выразить разницу между Е\3<^ и E[J\] в виде интеграла от функции / по области V поверхности J+ между J\ и &: ЕШ-Е[Л] = - f f. (H.2.13) Следовательно мы можем интерпретировать / как поток энергии, переносимой на бесконечность гравитационным излучением. Замечательно, что, как первоначально было найдено в работе (Bondi, van de
<j 2. Энергия 417 purg and Metzner 1962) и переформулировано для конформной бесконечности многими авторами (например (Penrose 1965b, Winicour 1968, Geroch 1977, Geroch and Winicour 1981)), функция / явно неотрицательна, / > 0. Таким образом, мы получаем, что Е уменьшается со временем, т.е. гравитационное излучение всегда переносит положительную энергию от излучающей системы. В нашей дискуссии линеаризованной гравитации в разд. 4.4.2 мы вычислили энергию, переносимую гравитационным излучением в низшем неисчезающем приближении, используя второго порядка тензор Эйнштейна в качестве эффективного тензора энергий-натяжений tab для линеаризованного гравитационного поля. Как это понятие потока энергии в приближении разд. 4.4.2 соотносится с низшим неисчезаю- щим вкладом в поток энергии, вычисленный в точной теории, описанной выше? Во-первых, вектор потока энергии —1%, использованный в линеаризованной гравитации, как не является калибровочно инвариантным, так и не дает явно положительного потока энергии на 17+, и поэтому он не находится в согласии с /. Однако полный поток энергии между стационарными периодами, вычисленный с помощью — £ао, является калибровочно инвариантным, и можно следующим образом показать согласие с низшим неисчезающим приближением к полной излученной энергии, вычисленной с помощью /. Было показано (Persides and Papadopoulos 1979), что в точной теории поток энергии / соответствует потоку энергии, вычисленному с помощью псевдотензора Ландау и Лифшица (Landau and Lifshitz 1962) с соответствующим выбором фоновой метрики. (Здесь псевдотензорным полем является тензорное поле, которое требуется для определения дополнительной структуры пространства-времени, такой как привилегированная система координат или привилегированная фоновая метрика.) Однако, мы уже отмечали в разд. 4.4.2, что наш tab отличается в низшем неисчезающем (т.е. квадратичном по 7об) приближении псевдотензора Ландау - Лифшица только на члены, не дающие вклада в полный поток энергии между периодами стационарности. Таким образом, наше вычисление полной излученной на бесконечность энергии в линеаризованном приближении системами, излучающими только за конечный период времени, находится в согласии с общим понятием потока энергии гравитационного излучения. Учитывая определение энергии-импульса на пространственной бесконечности, понятие полной энергии и импульса на гиперповерхности ^ в координатной форме было дано Арновиттом, Дезером и Мизне- Р°м (Arnowitt, Deser and Misner 1962), мотивированное гамильтоновой Формулировкой общей теории относительности. Оно было перефор-
418 Глава 11. Асимптотически плоские пространства мулировано более геометрически в терминах пространственной бесконечности в работах (Geroch 1972b, 1977, Ashtekar and Hansen 1978) и (Ashtekar 1980). Мы отсылаем читателя к этим работам за более полной информацией, а здесь мы просто представим формулы для энергии и импульса в первоначальной форме, данной Арновиттом, Дезером и Мизнером (ADM). Дальнейшее обсуждение мотивации этих фор. мул дается в конце прилож. Е. Пусть (M,ga6) является асимптотически плоским пространством-временем, и Е - пространственноподобная гиперповерхность, которая С1 в г° так, что множество (Е, /ia&, КаЬ) является асимптотически плоскими начальными данными, как было определено в разд. 11.1. Пусть х1,х2,х3 являются асимптотически евклидовыми координатами на Е, в смысле, определенном в задаче 2. Определим полную энергию Е и координатные компоненты полного пространственного импульса р^, связанного с поверхностью Е, соотношениями Е = 4- lim E [(Р*- %*) JVU4, (11.2.14) 167Г г-оо ^ I V дх» дхи J V ' 1 3 Г ри = — Дпт^ J2 I (К^ - К№) dA (П.2.15) Здесь г = [(х1)2 + (х2)2 + (х3)2]1/2, интегралы берутся по сфере постоянного г, а Na является единичной нормалью к этой сфере, направленной наружу. Заметим, что Е не зависит явным образом от Каь, но необходимо помнить, что /ia& и Каь связаны уравнениями связи (10.2.41) и (10.2.42). Уравнения (11.2.14) и (11.2.15) можно интерпретировать как уравнения, дающие число Е и вектор ра, касательный к Е в г°, причем можно показать, что обе эти величины не зависят от выбора асимптотически евклидовых координат на Е. Хотя из формулы (11.2.14) не очевидно, что, если в стационарном случае мы выберем Е асимптотически ортогональной времениподобному полю Киллинга, то это определение согласуется с уравнением (11.2.9) (см. Ashtekar and Magnon-Ashtekar 1979a). Более того, уравнения Эйнштейна предполагают, что (Е,ра) "преобразуются" должным образом при изменении Е, т.е. что 4-вектор Ра в г°, определенный соотношением Ра = -Епа+ра, (11.2.16) не зависит от Е, где п° - направленная в будущее единичная нормаль к Е в г°. Таким образом, мы получаем понятие энергии-импульса на пространственной бесконечности, известное как ADM энергия-импульс, которое удовлетворяет всем требуемым свойствам, отмеченным выше-
tj 2. Энергия 419 В связи с данными выше двумя понятиями энергии-импульса появляется ряд интересных проблем. Одна касается связи между энергиями Бонди и ADM. Из вышеприведенных определений естественно интерпретировать ADM энергию как полную энергию, доступную в пространстве-времени, а энергию Бонди как энергию, остающуюся в пространстве-времени в "запаздывающее время", получаемое сечением J•> после испускания гравитационного излучения. Если это так, то энергия Бонди должна отличаться от ADM энергии на интеграл потока энергии /, по части J+ причинного прошлого J. Однако это далеко не очевидно из определений этих энергий. Действительно, векторы энергии-импульса Бонди и ADM определяются в различных векторных пространствах так, что даже не очевидно, что такое сравнение может быть сделано. Однако оказывается, что каждая BMS трансляция в J+ (или J~) может быть естественно связана с касательным вектором в г° так, что сравнение возможно. Аштекар и Магнон- Аштекар (Ashtekar and Magnon-Ashtekar 1979b) показали, если проинтегрированный поток энергии в прошлое J конечен, то энергии Бонди и ADM отличаются в точности на эту величину. Таким образом, ожидаемое соотношение между энергиями Бонди и ADM действительно выполняется. Более фундаментальный вопрос касается положительности энергии Бонди и ADM. Как отмечалось выше, поток энергии Бонди всегда положителен, т.е. энергия Бонди всегда уменьшается с течением времени. Однако мы не требовали, чтобы величина самой энергии Бонди была бы положительна, т.е. даже если энергия стала положительной, то она не пересечет нуля и не станет отрицательной. Также мы не утверждали, что полная ADM энергия никогда не станет отрицательной. Это поднимает следующие два важных физических вопроса: (i) Может ли изолированная система всегда иметь отрицательную полную энергию? (ii) Даже если полная энергия всегда положительна, ограничена ли полная излученная системой энергия ее полной энергией? Другими словами: (i) Всегда ли положительна ADM энергия? (ii) Всегда ли положительна энергия Бонди? При формулировании этих вопросов необходимо помнить, что мож- Но ожидать положительности энергии только, если пространство-вре- мя несингулярно и при выполнении дополнительных условий, наложенных на распределение материи. Например, решение Шварцшиль- ^а с отрицательной величиной М является асимптотически плоским Решением уравнений Эйнштейна с отрицательными энергиями ADM и Бонди. Однако пространство-время Шварцшильда с отрицательной Массой имеет сингулярность при г = 0, и в отличии от решения Шварц-
420 Глава 11. Асимптотически плоские пространств шильда с положительной величиной М оно перестает быть гипербол^ ческим. Более того, не существует очевидного пути "закрыть" эту син~ гулярность физической материей и сделать несингулярное внутреннее решение, которое сшивается с внешней областью, представляющей со- бой решение Шварцшильда с отрицательной массой. Действительно уравнение (6.2.10) устанавливает, что любое статическое, сферически- симметричное внутреннее решение в форме жидкости для решения Шварцшильда с отрицательной массой должно иметь отрицательную плотность энергии материи. Таким образом, пример решения Шварц, шильда с отрицательной массой показывает появление требования или наличия сингулярности или отрицательной энергии материи, чтобы сделать отрицательными энергии ADM или Бонди. Поскольку физическая значимость этих возможностей сильно сомнительна, то остается вопрос: в несингулярном, асимптотически плоском пространстве- времени с локально неотрицательной плотностью энергии материи, т.е., более точно, с Таь, удовлетворяющим условию энергодоминантности (см. гл. 9), могут ли энергии ADM или Бонди стать отрицательными? Этот вопрос является очень важным, поскольку, если энергия изолированной системы не является положительной (или по крайней мере ограниченной снизу5), то маловероятно, что какая-либо изолированная система может быть абсолютно стабильной, т.е. каждая изолированная система внезапно должна распадаться на конфигурации с более и более низкой энергий. Крайне трудно установить положительность энергий ADM и Бонди в общей теории относительности. Большое число авторов получили доказательство положительности ADM энергии в специальных случаях или дали общие аргументы в пользу этого, но не было достигнуто удовлетворительного и полного доказательства. Наконец, Шоен и Яу (Schoen and Yau 1981) дали полное доказательство положительности ADM энергии. Немного позже простое доказательство было дано Вит- теном (Witten 1981, см. также Astekar and Horowitz 1982, Taubes and Parker 1982, Reula 1982). Он использовал спинорное поле, чтобы выразить Е в виде интеграла по £ от явно неотрицательной величины. Это доказательство положительности ADM энергии было расширено для доказательства положительности энергии Бонди (Horowitz and Perry 1982, Schoen and Yau 1982, Lundvigsen and Vichers 1982, Reula and Tod 1984). Таким образом, в общей теории относительности полная энергия изолированной системы является неотрицательной величиной, и 5При масштабных преобразованиях gab —* A2ga6 с постоянной А энергия i няется Е —► ХЕ. Поэтому, если Е может быть отрицательной, то не сущее нижней границы Е.
Энергия 421 а энергия ограничивает энергию, которая может распространиться форме гравитационного излучения. Задачи 1. Выпишите координатные компоненты калибровочного условия VaVfefi = 0 на J+ в координатах (П,и,0,</>), введенных в тексте. Показать, что эти соотношения означают, что guu,gu0 и ]>иф порядка 0(Q2) при О, —► 0. 2. Пусть (Е,/iab, #аь) являются асимптотически плоскими начальными данными. Введем координаты X, У, Z в окрестности Л такие, что градиенты этих функций ортогональны в Л. Показать, что если hab является С>0 в Л, то в этих координатах компонентами нефизической метрики являются diag(l, 1,1) + 0(Я) при R —► 0, где R = (X2 + Y2 + Z2)1/2, и что первые производные метрических компонент - порядка O(l) при R —* 0. Показать далее, что условие (ш) в определении асимптотически плоских начальных данных означает, что О. = R2[l + O(R)]. Введите координаты х — X/R2,y = Y/R2,z = Z/R2 в физическом пространстве-времени и покажите, что физические компоненты метрики принимают форму diag(l, 1,1) + 0(1/г) при г —> со, где г = (ж2 + у2 + г2)1/2. Показать далее, что первые координатные производные этих компонент 0(1/г2) при R —► со. Наконец, покажите, что условие (iv) означает, что компоненты АГаб и физический тензор Риччи ^Rab в такой асимптотически евклидовой координатной системе являются соответственно 0(1 /г2) и 0(1/г3). 3. а) Показать, что решение Шварцшильда является асимптотически плоским на нулевой бесконечности будущего. Ь) Показать, что каждая гиперповерхность t = const в решении Шварцшильда является асимптотически плоским набором начальных данных. (Фактически пространство-время Шварцшильда удовлетворяет всем условиям нашего определения асимптотической плоскостности на пространственной и нулевой бесконечностях, а не только выделенным выше свойствам. Доказательство (см. (Ashtekar and Hansen 1978).)
422 Глава 11. Асимптотически плоские пространств^ 4. Рассмотрите стационарное решение с тензором энергии-натяже- ний Таь в контексте линеаризованной гравитации (см. разд. 4.4). Выберите глобально инерциальную систему координат для плоской метрики rjab таким образом, чтобы "направление времени" (d/dt)a этой координатной системы согласовывалось со стационарным полем Киллинга до нулевого порядка. a) Покажите, что уравнение сохранения даТаь = 0 означает, что JT^vcPx = 0, где интеграл берется по срезу t = const, a /i и v принимают все значения, кроме /х = v — 0 (где х° = t) . b) Покажите, что в первом порядке отклонения от плоскостности общая формула (11.2.10) для М в стационарных пространствах сводится к М = /Tood3£, т.е. мы получаем обычную формулу специальной теории относительности. Заметим, однако, что интеграл Комара (11.2.9) взятый по конечной сфере, лежащей внутри распределения материи, не равен в общем случае массе, содержащейся в такой сфере. 5. а) Вычислите правую сторону уравнения (11.2.9) для решения Шварцшильда и покажите, что мы получим шваршильдовский параметр массы М. Таким образом, для статических сферически- симметричных жидких звезд мы имеем две формулы для М, а именно уравнения (6.2.10) и (11.2.10). b) Покажите, что приравнивание двух формул (6.2.10) и (11.2.10) для М дает соотношение где интеграл берется по гиперповерхности Е, ортогональной статическому полю Киллинга £а, dV означает естественный элемент объема на Е, а ф = \ 1п(—£а£а) является общерелятивистским аналогом ньютоновского гравитационного потенциала (см. разд. 6.2). c) Восстановите константы G и с в формуле части (Ь) и проверьте ньютоновский предел с —> оо. В данном пределе обе части этого уравнения сводятся к массе покоя жидкости. Покажите, что в следующем неисчезающем приближении по 1/с уравнение в части (Ь) дает Eg = -2ДГ, где Eg дается обычной ньютоновской формулой для гравитацИ" онной потенциальной энергии, а К = |/ЕPdV так, что в случае
}1 2:Энергия 423 одноатомного идеального газа К есть просто полная тепловая энергия. Поэтому уравнение части (Ь) является общерелятивистской версией ньютоновской теоремы вириала. б. В осесимметричном асимптотически плоском пространстве-времени с аксиальным полем Киллинга фа мы можем определить полный угловой момент J соотношением где интеграл берется по сфере 5 в асимптотической области, в которой предполагается исчезновение Таь. (Заметим наличие множителя -2 в отличие от формулы (11.2.9) для М.) a) Используя аргументы, данные в разд. 11.2, для М, покажите, что J не зависит от 5 и дается соотношением J = - f TabnaiPbdV, где гиперповерхность Е выбирается так, чтобы фа был касательным вектором к Е. То, что J не зависит от Е, можно интерпретировать так, что в осесимметричном пространстве-времени угловой момент не может излучаться через гравитационное излучение. b) Покажите, что J = 0 в любом статическом осесимметричном пространстве-времени, т.е. пространстве-времени, обладающем гиперповерхностью, ортогональной времениподобному полю Киллинга £а с условием £а^а = 0. c) Вычислите J для заряженной метрики Керра (уравнение (12.3.1) гл. 12) и покажите, что J = Ma. (Обсуждение определения углового момента в неосесимметриче- ских асимптотически плоских пространствах см. в работах Ash- tekar 1980, Ashtekar and Streubel 1981, Geroch and Winicour 1981, и Ashtekar and Winicour 1982.)
Глава 12 Черные дыры В гл. 6 мы нашли, что достаточно массивное, холодное, сферическое тело не может существовать в гидростатическом равновесии и, следовательно, должно подвергаться гравитационному коллапсу. Результирующая структура пространства-времени показана на рис. 6.11. Наиболее поразительной особенностью этого пространства-времени является то, что появляется черная дыра - "область невылетания". Какой-либо наблюдатель или луч света, входящий в область II на рис. 6.11, никогда не сможет покинуть эту область и закончит свое существование в пространственно-временной сингулярности, отмеченной координатой г = 0. Более того, эта пространственно-временная сингулярность в г = 0, полученная в результате сферического коллапса, находится внутри черной дыры и, таким образом, ее не "увидит" наблюдатель, остающийся вне черной дыры. Предметом данной главы является обобщение этих идей на несферический случай. Наш анализ сферического гравитационного коллапса был основан на том, что сферически симметричным вакуумным решением уравнений Эйнштейна является только решение Шварц- шильда, и поэтому метрика Шварцшильда должна описывать геометрию внешнего к сферически коллапсирующему телу пространства- времени. Однако в несферическом случае нет такого упрощения, и детали несферического коллапса были изучены только для линейных возмущений сферического коллапса (Price 1972a, b) и только численным анализом. Тем не менее есть причины полагать, что основная картина коллапса останется такой же, как и в сферическом случае, а именно будет формироваться черная дыра, и сингулярность пространства- вРемени, получающаяся из гравитационного коллапса, будет спрятана в черной дыре. Этот вопрос обсуждается в разд. 12.1. Там же дается точное определение черной дыры. Некоторые основные свойства черных дыр, включающие закон увеличения площади, доказываются в Р^А. 12.2. Стационарные черные дыры представляют значительный интерес, Кольку можно ожидать, что черная дыра, сформированная в ре- Ультате гравитационного коллапса, "успокоится" до стационарного ночного состояния. Можно показать, что двухпараметрическое се- ство решений, характеризующееся полной массой М и полным 0вым моментом J, найденное Керром (Kerr 1963), является един-
426 Глава 12. Черные дыры ственным вакуумным решением уравнений Эйнштейна, описывающим стационарные черные дыры. Метрика Керра и ее обобщение на случай присутствия заряда обсуждаются в разд. 12.3, и результаты, касающиеся единственности стационарной черной дыры, суммированы в конце этого раздела. Замечательным развитием теории черных дыр было открытие того, что энергию можно извлекать из "вращающейся" черной дыры, т.е. черной дыры Керра с J Ф 0. Хотя ничто не может покинуть черную дыру, можно заставить черную дыру "проглатывать" частицу или волну с отрицательной полной энергией. Мы описываем, как это можно сделать, в разд. 12.4. и также обсуждаем ограничения, накладываемые законом увеличения площади, на выделенную энергию. Наконец, наиболее интригующим аспектом теории черных дыр является аналогия между законами физики черных дыр и обычными законами термодинамики. На первый взгляд кажется, что природа этих законов сильно отличается. Законы физики черных дыр являются строгими теоремами в дифференциальной геометрии, а законы термодинамики являются только макроскопической аппроксимацией сложных, точных, микроскопических законов физики. Тем не менее существует замечательно близкая аналогия между этими законами, главное место в которой занимает аналогия между законом увеличения площади черных дыр и законом увеличения энтропии термодинамических систем. Эта аналогия развивается в разд. 12.5. Дальнейшие достижения, связанные с исследованием квантовых эффектов около черных дыр, обсуждаются в гл. 14. 12.1 Черные дыры и гипотеза космической цензуры Нашей первой задачей в исследовании несферического коллапса является формулировка точного понятия черной дыры. По существу мы хотим определить черную дыру как "область невылетания" подобно области II на рис. 6.11, т.е. в физических терминах область пространства-времени, где гравитация настолько сильна, что частица или световой луч, попадая в эту область, никогда не сможет покинуть ее. Однако это физическое свойство должным образом не учитывается, если, например, определить черную дыру в пространстве-времени (M,gfl6/ просто как подмножество А С М такое, что для каждой точки р € А выполняется <7*(р) С А. При таком определении причинное будушее любого множества в любом пространстве-времени можно было бы на-
-о 1. Черные дыры и гипотеза космической цензуры 427 Рис. 12.1. Конформная диаграмма такого же пространства-времени, как показано на рис. 6.11 и 6.12. Из этой конформной диаграммы ясно, что область II физического пространства-времени лежит вне J~(J+). Напротив, на рис. 11.1 J~(J+) включает в себя все физическое пространство-время звать черной дырой. Таким образом, мы должны быть осторожны в определении того, какую часть пространства-времени с невозможностью "убегания" можно рассматривать в качестве черной дыры. Для асимптотически плоских пространств невозможность убегания на нулевую бесконечность будущего J+ дает подходящую характеристику черной дыры. Основным свойством области II на рис. 6.11, которое отличает ее от, скажем, причинного будущего точки в пространстве-времени Минковского, является то, что область II ограничивается малыми г", т.е. область II не расширяется "на бесконечность". Это иллюстрируется конформной диаграммой сферического коллапса прост- Ранства-времени (M,gab) на рис. 6.11, т.е. пространственно-временной Диаграммой нефизического пространства-времени (M,ga6), связанного с (M,gab) (см. гл. 11). Это показано на рис. 12.1. Другое представле- ние М дается на рис. 12.2. Как показано на этих диаграммах, причин- н°е прошлое нулевой бесконечности будущего J~(J+) является несин- гУлярным, но оно не включает все физическое пространство-время, область II не содержится в J~(J+). Напротив, в пространстве-времени
428 Глава 12. Черные дырь, Рис. 12.2. Другое представление замыкания М физического пространства-времени, изображенного на рис. 12.1. Как и на рис. 12.1, на этой диаграмме угловые измерения, сжатые в каждой точке этой диаграммы (кроме тех, где г = о и точки г°), представляют собой 2-сферы Минковского J~{J+) включает в себя все физическое пространство- время. Идея, что J~(J+) "хорошо себя ведет" , но не включает все пространство-время, приводит к следующему определению черной дыры. Пусть (M,gab) является асимптотически плоским пространством-временем с ассоциированным нефизическим пространством-временем (M,gafe). Мы говорим, что (M,gab) является сильно асимптотически предсказуемым , еслиjj нефизическом пространстве-времени суще- ствует открытая область V С М и М П J~(J+) С V такая, что (1Л#аь) является глобально гиперболическим. (Здесь замыкание М П J~(J*) берется в ^ефизическом пространстве-времени М так, что, в частности, г° € V. Наше определение сильной асимптотической предсказуемости слегка отличается от данного Хокингом и Эллисом (Hawking and Ellis 1973) в том, что мы, в частности, используем различные формулировки понятия асимптотической плоскостности.) Говорят, что сильно асимптотически предсказуемое пространство-время содержит черную дыру, если М не содержится в J~(J+). Область черной дыры1 В такого пространства-времени определяется так В = [М — J~(J*)]i й граница В в М, Н = J~(J+) П М называется горизонтом событий. Необходимо подчеркнуть, что требование, чтобы (V\ga&) было глобально гиперболической областью нефизического пространства-време' 1 Область белой дыры сильно асимптотически "предсказуемого в прошло пространства-времени определяется просто заменой J~(17+) на J+(*7_).
л \я Черные дыры и гипотеза космической цензуры 429 и означает, что (МПУ,|аЬ) является глобально гиперболической областью физического пространства-времени. А именно, в соответствии со свойством (1) определения асимптотической плоскостности, данного в гл. 11, имеем М = М — [J+(z°)U J~(i0)]. Следовательно, поверхность Коши для (^>&ь)> проходящая через г°, будет поверхностью Коши й для (М П V,gab). Однако, поскольку gab и gab = Q?gab имеют ту же причинную структуру, то это означает, что (М П V,ga6) является глобально гиперболическим. По теореме 8.3.14 мы можем расслоить М C\V поверхностями Коши £*• Для всех q G М П V и всех £* с g G «/"^St) каждая направленная в прошлое причинная кривая из q пересекает Е*. Это можно интерпретировать таким образом, что (среди возможных "начальных сингулярностей" таких, как сингулярность белой дыры на рис. 6.9) нет сингулярностей, "видимых" любому наблюдателю в [М П V"] D 3 [MC\J~(J+)]. Другими словами, в сильно асимптотически предсказуемом пространстве-времени все наблюдатели вне черной дыры или на горизонте событий не могут "видеть" сингулярности, образуемые за конечное "время". И наоборот, говорят, что асимптотически плоское пространство-время, не являющееся сильно асимптотически предсказуемым, обладает голой сингулярностью. Отметим, что в сильно асимптотически предсказуемом пространстве-времени все же возможно, чтобы горизонт событий являлся сингулярным в том смысле, что могут существовать неполные причинные геодезические (по отношению к физической метрике gab) вМП «/"(J4-), которые непродолжа- емы в М. В частности, сильная асимптотическая предсказуемость не исключает возможности того, что нулевая геодезическая горизонта событий может быть неполна в будущем. При обсуждении черных дыр обычно предполагается, что горизонт событий является несингулярным, и поскольку для доказательства последующих теорем нам будут не нужны никакие условия, кроме сильной асимптотической предсказуемости, мы не будем накладывать никаких других условий. Подчеркнем, что мы определили понятие черной дыры только для сильно асимптотически предсказуемых пространств. Вышеприведен- °ъ определение можно дать без изменений и для асимптотически л°ских пространств, которые не являются сильно асимптотически РЗДсказуемыми, но мы не делаем этого по той причине, что этот Учай не является физически важным (см. ниже), и фактически все иства черных дыр, выведенные ниже, требуют сильной асимптоти- к°й предсказуемости. Понятие черной дыры также можно опреде- ь Для некоторых асимптотически неплоских пространств, где мож- Вести подходящее понятие "бесконечности", таких как простран-
430 Глава 12. Черные дЫр ства, которые асимптотически достигают "открытой" (А; = 0,-1) вСе^ ленной Робертсона - Уокера. С другой стороны, нет естественного ц^ нятия черной дыры в "замкнутой" (к = 4-1) Вселенной Робертсона ^ Уокера, которая бы снова коллапсировала в конечную сингулярность поскольку нет естественной области, для которой можно применить понятие "убегание". Конечно, все же существует некоторое приблизь тельное понятие черной дыры для любой области замкнутой Вселен- ной Робертсона - Уокера, которую можно трактовать как изолированную систему. Теперь с данным точным определением черной дыры в сильно асимптотически предсказуемом пространстве-времени мы можем спросить о физической важности этого определения. В сферическом случае, рассмотренном в разд. 6.4, мы видели, что гравитационный коллапс приводит в сильно асимптотически предсказуемом пространстве к сингулярности, содержащейся в черной дыре. Какой тип пространства- времени получается из несферического коллапса? Во-первых, мы можем использовать теоремы о сингулярностях для того, чтобы сделать заключение по крайней мере для достаточно малых отклонений от сферической симметрии, что пространственно-временные сингулярности должны появляться в гравитационном коллапсе, т.е. появление сингулярности не является простым артефактом предположения о точной сферической симметрии. Чтобы это увидеть, мы будем рассуждать следующим образом. Начиная с начальных данных (£, hab, Каь) для сферического коллапса, мы находим, что ловушечные поверхности формируются в Z)+(£), поскольку все сферы с г < 2М во внешней шварцшильдовой области являются ловушечными поверхностями, содержащимися в £И*(Е). Затем из теоремы 10.2.2 следует, что для всех начальных данных, достаточно близких к (Е,каь,Каь), ловушечные поверхности также должны появляться в максимальном расширении Коши этих данных. (Даже если отклонение от сферической симметрии велико, Шоен и Яу (Schoen and Yau 1983) доказали, что ловушечные поверхности всегда должны появляться, когда достаточное количество материи конденсируется в малой области.) Затем мы можем обратиться к теореме 9.5.3 или теореме 9.5.4 для того, чтобы установить появление пространственно-временной сингулярности. Однако существование пространственно-временной сингулярности не устанавливает существование черной дыры, поскольку сингулярность может быть голой, т.е. пространство-время может нарушить сильную асимптотическую предсказуемость. Наиболее сильное пр#' мое проявление того, что голые сингулярности не появляются, виД' но из изучения линейных возмущений пространства-времени ШварИ'
1 Черные дыры и гипотеза космической цензуры 431 льда. Поскольку уравнения для возмущений метрики (см. разд. 7.5) мекэт форму, для которой применима теорема 10.1.2, то мы знаем, первоначально хорошие возмущения на поверхности Коши для лобально-гиперболической области (V П M,gab) будут переходить к ^сингулярному решению вУПМ. Однако, если существует решение оавнений для линейных возмущений, которые "сильно растут", т.е. неограничены в V П М, то это показывает, что полныенелинейные уравнения должны приводить к голой сингулярности в (V П М) даже лля данных, произвольно близких к шварцшильдовым. С другой стороны, если все решения линейных уравнений для возмущений ограничены в VHM по подходящей норме начальных данных, то это означает, что решение полных нелинейных уравнений может быть несингулярным в V П М для начальных данных, достаточно близких к шварцшильдовым. Изучение поведения решений уравнений на возмущения показало, что решения ограничены в VDM (см. Wald 1979a). Это означает, что гравитационный коллапс с достаточно малыми отклонениями от сферической симметрии приведет скорее к образованию черной дыры, чем голой сингулярности. Дополнительно, численное изучение линейных возмущений черной дыры Керра (см. разд. 12.3) показывает, что она также стабильна (Press and Teukolsky 1973). Дальнейшая поддержка того, что гравитационный коллапс всегда производит черную дыру, а не голую сингулярность, связана с тем, что ряд теоретических попыток сконструировать "контрпримеры" не имел успеха, и следует предполагать, что природа избегает производства голых сингулярностей (см. Wald 1974a, Jang and Wald 1977, Gibbons et a/. 1983). Хотя аргументы, основанные на эстетической привлекательности, всегда необходимо рассматривать с подозрением, как мы попытаемся проиллюстрировать в этой главе и главе 14, изучение свойств черных дыр ведет к множеству замечательных теоретических выводов, и очень тяжело верить, что черные дыры физически не реализуемы. Таким образом, вышеприведенное рассмотрение ведет к гипотезе, Что природа "подвергает цензуре" голые сингулярности. Мы можем следующим образом установить эту гипотезу в физических терминах. Гипотеза космической цензуры (версия 1, физическая форму- иРовка). Гравитационный коллапс тела всегда приводит к черной ды- Р6» а, не к голой сингулярности, т.е. все сингулярности гравитационно- 0 коллапса "скрыты" внутри черных дыр, и их не могут "увидеть" валенные наблюдатели. ^та формулировка гипотезы космической цензуры является неточ- »поскольку среди других причин мы не оговорили, каким условиям
432 Глава 12. Черные дЫр поля материи должны удовлетворять. Ясно, что гипотеза неверна бе-ч условий, наложенных на материальные поля, поскольку можно bbn писать метрику пространства-времени с голой сингулярностью и на* звать ее решением уравнений Эйнштейна, определяя тензор энергии- натяжений Таь равным (1/87г)Саь. Двумя естественными условиями наложенными на материальные источники, являются (1) Таь удовле^ творяет энергетическим условиям (например, условию энергодоминантности), и (2) связанные уравнения Эйнштейна и материальных полей допускают хорошо поставленную формулировку начальных значений. Однако идеальная жидкость удовлетворяет обоим этим условиям, но все же можно добиться нарушения гипотезы космической цензуры с материей, отвечающей идеальной жидкости. Это можно понять из того, что даже в пространстве-времени Минковского динамическая эволюция идеальной жидкости может привести к сингулярностям, таким как "скрещивающиеся оболочки" или формирование разрывов. В связанной системе уравнений Эйнштейна и идеальной жидкости такого типа сингулярности все же могут появиться, поскольку при выполнении уравнений Эйнштейна сингулярности в Таъ приводят к сингулярностям кривизны пространства-времени. Поэтому голые сингулярности могут появиться в гравитационном коллапсе идеальной жидкости (Yodzis, Seifert and Miiller zum Hagen 1973,1974). Однако в действительности идеальная жидкость является скорее макроскопической аппроксимацией структуры материи, чем фундаментальным описанием ее. Поэтому появление сингулярностей в динамической эволюции жидкости (сравнительно "мягкие" типы сингулярностей производятся скрещивающейся оболочкой и разрывами) можно рассматривать скорее как простое нарушение нашей макроскопической аппроксимации, чем появление истинной физической сингулярности гравитационного коллапса подобно сингулярности г = 0 в решении Шварцшильда. Это означает, что для точной формулировки гипотезы космической цензуры мы должны требовать, чтобы поля материи были "фундаментальными". Мы берем это требование для того, чтобы связанные уравнения Эйнштейна и материальных полей можно было бы представить в форме квазилинейной, второго порядка, диагональной, гиперболической системы (см. разд. 10.1), поскольку фундаментальные классические поля, необходимые для правильного описания природы, а именно гравитация и электромагнетизм, имеют такую форму. Поэтому мы приходим к следующей версии математически точной формулировки гипотезы космической цензуры. Гипотеза космической цензуры (версия 1, точная формуле ровка). Пусть (Е, hab, Каъ) является набором асимптотически плоски*
. Черные дыры и гипотеза космической цензуры 433 чаЛьных данных (см. гл. 11) для уравнений Эйнштейна с полным имановым многообразием (Е, каь). Пусть источники материи тако- j что Таь удовлетворяет условию энергодоминантности, и связанные оавнения Эйнштейна и материальных полей имеют форму (10.1.21). Дополнительно пусть начальные данные для материальных полей на £ удовлетворяют подходящему условию спадания на пространственной бесконечности. Тогда максимальная Коши эволюция этих начальных данных (см. разд. 10.2) приводит к асимптотически предсказуемому пространству-времени. Является ли гипотеза космической цензуры корректной, остается ключевой нерешенной проблемой в теории гравитационного коллапса, физическая значимость черных дыр зависит в значительной степени от выполнения этой гипотезы. Если изложенная выше гипотеза космической цензуры является правильной, то интересно узнать, проистекает ли ее выполнимость из более общих фундаментальных свойств уравнений Эйнштейна. Пенро- уз (Penrose 1979) предположил, что это так. Он предложил по существу более строгую версию гипотезы космической цензуры, которую в физических терминах можно сформулировать следующим образом. Гипотеза космической цензуры (версия 2, физическая формулировка). Все физически приемлемые пространства являются глобально гиперболическими, т.е. среди возможных начальных сингуляр- ностей (таких как сингулярность "большого взрыва") не существует сингулярности, когда-либо "видимой" наблюдателю. Эта версия космической цензуры является более строгой, чем версия 1, в том, что она применяется к любому наблюдателю в любом пространстве-времени, а не только для удаленного наблюдателя в асимптотически плоском пространстве-времени. Однако версия 2 не заключает в себе версию 1, поскольку, если начиная с асимптотически плоских начальных данных формируется сингулярность, которая распространяется к нулевой бесконечности и нарушает асимптотическую плоскостность, сохраняя глобальную гиперболичность, то это может нарушать версию 1, но не версию 2. Смысл второй версии гипотезы космической цензуры можно переформулировать более точно следующим образом. Во-первых, определенно неверно, что каждое непродолжаемое решение уравнений Эйнштейна является глобально гиперболичным. Вырезая дырки в прост- Ранстве-времени Минковского и затем совершая топологическое отождествление, мы легко получаем непродолжаемое, глобально негипер- оолическое пространство-время. Чтобы обойти возможность получения "ненужных" и "искусственных" сингулярностей такого вида, мы
434 Глава 12. Черные дыр, можем дать точное понятие того, что все разумные пространства яв~ ляются глобально гиперболическими, максимальное расширение Коши несингулярных начальных данных, удовлетворяющих подходящИм асимптотическим условиям, всегда приводит к непродолжаемым про, странствам. Однако известно, что это свойство решений уравнений Эйнштейна не выполняется. В частности известно, что максимальные Коши расширения начальных данных Вселенной Тауба (Misner 1967, Hawking and Ellis 1973) и решения Керра (см. разд. 12.3) являются непродолжаемыми. В случае Вселенной Тауба расширение нарушает сильную причинность на горизонте Коши, и есть основания верить, что, если подходящим способом слегка возмутить начальные данные для Вселенной Тауба, то можно преобразовать горизонт Коши в сингулярность. Таким образом, получаем, что максимальное Коши расширение является непродолжаемым. В случае решения Керра, как обсуждается ниже, наблюдатель на горизонте Коши расширенного пространства-времени может "видеть" целиком некомпактную поверхность начальных данных. Можно ожидать, что подходящим образом выбранные малые возмущения начальных данных, которые продолжаются на бесконечность (но не нарушают асимптотической плоскостности) должны приводить к сингулярности с "бесконечным голубым смещением" на горизонте Коши. Действительно, было показано в явном виде, что такое поведение имеет место в пространстве-времени Райс- снера - Нордстрема (Chandrasekhar and Hartle 1982), свойства которого близки к свойствам решения Керра. Таким образом, хотя и известно, что имеются некоторые нарушения глобальной гиперболичности, но все же ясно, что в этих случаях малые возмущения могут нарушить продолжаемость максимального Коши расширения так, что возможно нет "общих" нарушений. Поскольку трудно дать точное определение понятия "общее", то мы следующим образом точно формулируем вторую версию гипотезы космической цензуры (Geroch and Horowitz 1979, Penrose 1979). Гипотеза космической цензуры (версия 2, точная формула ровка). Пусть (Е, hab, Каь) - набор начальных данных для уравнений Эйнштейна с полным римановым многообразием (Е, hab) и уравнениями Эйнштейна с материей в форме (10.1.21), в которых Таъ уДОвле" творяет условию энергодоминантности. Тогда, если максимальное Коши расширение этих начальных данных является продолжаемым Д^я каждой точки р £ Я+(Е) в расширении, то либо нарушается сильная причинность в р, либо 1~(р) П Е является некомпактным. Кроме отсутствия известных контрпримеров в сущности нет дР30' дов за или против справедливости этой второй версии гипотезы косм1*'
1 туерные дыры и гипотеза космической цензуры 435 кОЙ цензуры. Действительно, кроме теорем о сингулярностях (см. 9) известно очень немного об общих, глобальных свойствах реше- ий уравнений Эйнштейна. Вернемся теперь к гравитационному коллапсу и черным дырам. Яудем предполагать справедливость первой версии космической цензуры и коротко обсудим три процесса, в которых гравитационный коллапс к черной дыре вероятно может иметь место в природе. Первый процесс - гравитационный коллапс звезды. История эволюции звезды была кратко описана в разд. 6.2, где было показано, если сферическая звезда имеет массу больше, чем две солнечных массы, то в конце концов она подвергается гравитационному коллапсу, если только она не сбросит достаточно массы в течение ее эволюции, чтобы попасть в область ниже этого верхнего предела. Вращение звезды может повысить верхний предел массы, но поскольку наблюдался только один пульсар (т.е. нейтронная звезда), вращающийся достаточно быстро, чтобы существенно повлиять на его равновесную структуру (Backer et al 1982), разумно взять верхний предел массы для сферической звезды в качестве общего случая. Поскольку множество звезд в нашей Галактике имеет массу более чем в два раза превышающую солнечную, и поскольку время жизни массивных звезд намного меньше возраста нашей Галактики, то очень трудно обойти вывод, что множество черных дыр производится в нашей Галактике посредством такого процесса. Однако, поскольку существует большая неопределенность в потерях звездами массы, появляющейся или в постепенной потере в процессе эволюции (в частности в фазе красного гиганта), или внезапной в случае взрыва сверхновой в конце эволюции, то нет достоверных оценок того, как много таких черных дыр должно появиться. Наилучшее предположение можно получить из наблюдательной оценки, что в нашей Галактике появляются несколько сверхновых за столетие. Поэтому по крайней мере 108 сверхновых должны появиться в течение времени жизни нашей Галактики так, что могут сформироваться ~ Ю8 черных дыр. Конечно, эта оценка может быть слишком вЬ1сокой, поскольку много сверхновых могут стать скорее нейтронными звездами, чем черными дырами, или же слишком низкой по той пРичине, что гравитационный коллапс в черную дыру без интенсивно- 1,0 сбрасывания внешних слоев звезды может иметь место более часто, ем взрыв сверхновой. Необходимо подчеркнуть, что черные дыры, Формированные звездным коллапсом, должны лежать в относитель- о узкой массовой области 2М0 < М < 1ООМ0, поскольку звезды с - 2А/0 не будут коллапсировать, а обычные звезды с М > 100Мо сУЩествуют вследствие нестабильности относительно пульсаций.
436 Глава 12. Черные дырь, Второй процесс, который может привести к формированию черных дыр в природе, связан с гравитационным коллапсом всего центрально- го ядра плотного кластера звезд. В процессе динамической эволюции звездного кластера гравитационные столкновения приведут к большому переносу энергии к одной звезде, которая затем "испарится" из кластера. В связи с этим остающиеся звезды теряют энергию и становятся более гравитационно сжатыми. Поэтому центральная часть звездного кластера стремится стать более и более плотной с эволюцией кластера. В конечном счете наступит стадия, где ядро становится таким плотным, что появятся приливные разрывы звезд. Трудно точно предсказать, что случится после этого, но многие сценарии ведут к формированию массивной черной дыры (Rees 1978). (Массивные черные дыры в центре звездных кластеров также могут получиться прямым коллапсом части газового облака, вне которого звездный кластер первоначально сформировался, или посредством коалесценции и роста черных дыр, полученных звездным коллапсом.) Ядра галактик являются наилучшими местами для формирования массивных черных дыр в таком процессе. Однако снова нет разумных оценок того, как много галактических ядер или ядер звездных кластеров в других областях галактики могли бы содержать массивную черную дыру. Масса черных дыр, сформированных в таком процессе, может изменяться до ощутимой доли массы звездного кластера, т.е. до ~ 1О1ОМ0 для черной дыры в ядре большой галактики. Третий, намного более умозрительный процесс, приводящий к формированию черных дыр, является гравитационный коллапс областей с увеличенной плотностью в ранней Вселенной. Как обсуждалось в гл. 5, Вселенная появилась с высокой точностью однородной и изотропной на больших масштабах расстояний. Однако распределение материи, которое мы наблюдаем во Вселенной, определенно не является точно однородным так, что некоторые неоднородности должны быть в ранней Вселенной. Некоторую информацию о начальном спектре неодно- родностей плотности на масштабах галактической массы можно получить статистическими исследованиями поведения имеющихся кластеров галактик (Peebles 1980), но очень немного известно о начальных неоднородностях на малых масштабах. Однако, если были достаточно большие неоднородности плотности в ранней Вселенной, то области повышенной плотности могли бы коллапсировать непосредственно в черную дыру, а не расширяться с остальной частью Вселенной. Таким образом, большое число "первичных черных дыр" может появиться на таком пути. Снова нет надежных предсказаний того, как много первичных черных дыр существует в нашей Вселенной. Действитель-
о 1 Черные дыры и гипотеза космической цензуры 437 \1^ 0 лучшее ограничение на плотность неоднородностей на масштабе малых масс происходит из требования, чтобы эти неоднородности не производили слишком много малых черных дыр. Важной особенностью первичных черных дыр является то, что они могут получаться с любой массой, включая массы много меньшие солнечной. Не существует процессов в современной Вселенной, которые м0ГЛи бы произвести такие малые черные дыры. Например, шварц- шильдова черная дыра с массой равной массе Земли Me = 6 х 1027г имеет r3 = 2GMe/c2 ~ 1 см. Поэтому, чтобы превратить Землю в черную дыру, мы должны были бы сжать ее негравитационными силами до радиуса порядка rs (и до плотности ~ 1027г/см3) до того, как собственное гравитационное поле приведет к коллапсу в черную дыру. С другой стороны, в момент т ~ Ю-11 сек после большого взрыва плотность р Вселенной была ~ 1027г/см3. Флуктуация плотности с 6р ~ р на масштабе 1 см в этот момент времени могла бы приводить к формированию первичных черных дыр с массой Мб. Таким образом, очень скоро после большого взрыва могут появиться черные дыры малой массы. Как можно было бы детектировать черные дыры, появившиеся в этих трех процессах? Важно осознать, что черные дыры являются очень малыми объектами. Черная дыра солнечной массы имеет радиус Шварцшильда всего 3 км. Даже черная дыра с массой 1О1ОМ0 в ядре большой галактики имеет rs ~ 3 х 1010км ~ 3 х 10~3св.лет. Если учесть еще, что черные дыры являются "черными" (см. задачу 1), то ясно, что прямое детектирование черной дыры является очень трудным. Наиболее обещающая возможность непрямого детектирования черной дыры связана с тем, что аккрецирующая в нее материя будет нагреваться и испускать электромагнитное излучение до попадания в черную ды- Ру. Для черных дыр, полученных в результате звездного коллапса, лУчшая возможность для такой аккреции появляется в случае, если черная дыра находится в тесной двойной системе, и материя может перетекать от звезды в черную дыру. В этом случае можно ожидать, что материя будет медленно падать по спирали в черную дыру, формируя аккреционный диск вокруг черной дыры. Вязкое нагревание в ак- кРеционном диске может привести к производству рентгеновского изучения. Был открыт ряд рентгеновских источников от обычной (т.е. **есколлапсировавшей) звезды в тесной двойной системе с невидимым vH& оптических частотах) компаньоном, но аккреция на нейтронную Звезду (и может даже белого карлика) также производит такое рент- Новское излучение так, что мы не можем сделать заключение, что Ти системы должны содержать черную дыру. Однако в случае звезды
438 Глава 12. Черные дьщк Лебедь Х-1 свойства орбиты двойной системы дают строгий нижний предел массы невидимого компаньона ~ 9М0 (Paczynski 1974). Это гораздо выше верхнего предела масс для нейтронной звезды или белого карлика. Поэтому есть очень сильное основание верить, что невиди. мый компаньон двойной системы Лебедь Х-1 является черной дырой Совсем недавно было показано, что рентгеновский источник LMC Х-з является двойной системой с массой невидимого компаньона гораздо выше пределов масс белых карликов и нейтронных звезд (Cowley e£ а/. 1983, Paczynski 1983). Массивная черная дыра в центре звездного кластера или галактического ядра могла бы дать наблюдаемый эффект, изменяя равновесное распределение звезд в центральной области кластера и заставляя больше звезд "падать" в центр. Поэтому, если имеется массивная черная дыра в звездном кластере, то можно ожидать усиления яркости очень близко к центру кластера. Дополнительно можно ожидать увеличения средней скорости звезд вблизи центра. В точности такое усиление яркости и увеличение "дисперсии скоростей" наблюдается в центре галактики М87 (Young et al. 1978, Sargent et al. 1987). Это дает веский довод в пользу наличия черной дыры массой ~ 5 х 1О9М0. Более того, хорошо известно, что в галактике М87 существуют пучки высокоэнергетических частиц, испущенные из центра галактики. Таким образом, имеется сильный намек на то, что массивная черная дыра играет роль в производстве этих пучков, хотя сейчас нет полностью удовлетворительной теории, объясняющей как черная дыра (или какой-либо другой объект) может их производить. Поскольку похожие пучки имеются в других активных галактиках или в квазарах, то массивные черные дыры также могут быть в этих объектах. Действительно, как уже подчеркивалось в начале этой книги, открытие квазаров в начале 1960-х и невозможность объяснить энергию их источников без привлечения сильных гравитационных полей дали сильный стимул к развитию теории гравитационного коллапса и черных дыр. Наконец, мы отметим возможные пути детектирования первичных черных дьф очень малой массы. Классически такие черные дыры не могут дать наблюдательные эффекты, если только они не были Д°- статочно многочисленны, чтобы дать существенный космологический вклад в плотность массы Вселенной, или если одна из них не столкнется с Землей. Однако, как мы увидим в гл. 14, имеется рождени частиц около черных дыр, существенное для черных дыр очень мало массы. Многочисленные первичные черные дыры с М < 1015г могут дать значительный вклад в рентгеновский фон (Page and Hawking 1976). Однако, поскольку такой фон не наблюдается, то мы моЖ дать верхнюю границу на количество таких малых черных дыр-
2 Общие свойства черных дыр 439 12.2 Общие свойства черных дыр В этом разделе мы используем глобальные методы, развитые в гл. 8 9 для того, чтобы установить некоторые общие результаты в тео- ий черных дыр. Большинство этих результатов принадлежат Хокин- Наше обсуждение будет слегка отличаться от обсуждения в книге Хокинга и Эллиса (Hawking and Ellis 1973) в том, что мы не налагаем топологических ограничений на поверхности Коши для MflV", и некоторые наши определения (такие как внешняя ловушечная поверхность) отличаются от данных в этой книге. Во-первых, мы заметим, что для любого асимптотически плоского пространства-времени (M,gab) с ассоциированным пространством- временем (M,gab), если q € J+ и р е М П J~(q), то любая точка г е ^+, лежащая вне q на направленной в будущее нулевой геодезической <5/+, проходящая через д, удовлетворяет р € 1~(г). (Это следует из следствия теоремы 8.1.2, поскольку риг можно соединить причинной кривой, которая не является некоторой непрерывной нулевой геодезической.) Следовательно, мы имеем М П J~(^+) = М П /~(^+), и поэтому «/~(^"1") является открытым в М. Поэтому область черной дыры В = М — J~(^+) замкнуто в М. В частности это означает, что горизонт событий Н содержится в В. Мы определяем теперь понятие черной дыры в данный момент времени. Пусть (M,gab) является сильно асимптотически предсказуемым ^пюстранством-временем с глобально гиперболической областью V э М П */"(^"1") в нефизическом пространстве-времени. Пусть В = = М—«/~(^+) является областью черной дыры пространства-времени. Если Е является поверхностью Коши для V, то мы будем называть 2 П В полной областью черной дыры в момент Е. Каждую связную компоненту 36 множества Е П В будем называть черной дырой в момент Е. Число черных дыр в (M,gofe) может изменяться со "временем" (т.е. с выбором поверхности Коши Е), поскольку новые черные Дыры могут сформироваться и имеющиеся черные дыры могут позже поглотить друг друга. Однако нашу первую теорему можно интерпретировать так, что черная дыра не может никогда ни исчезнуть, ни подвергнуться "бифуркации", т.е. разделиться на более чем одну дыру в позднее время. Теорема 12.2.1. Пусть (M,gab) - сильно асимптотически пред- ъъзуемое^ пространство-время и пусть Ei и Ег - поверхности Ко- и для V с Ег С /+(Ei). Пусть 8В\ является непустой связной Ко*понентой В П Ei, т.е. 3&\ является черной дырой в момент Ei.
440 Глава 12. Черные дырь Тогда J+ (38\) П Е2 ф 0 г* содержится внутри односвязной компонец^ ты J5flE2. Доказательство. То, что J+(«^i) ПЕг^Й сразу следует из того, что Е2 является поверхностью Коши, лежащей в будущем Еь Ясно, что J+(«^i) С Б и J+(«^i) ПЕ2 содержится вБПЕ2. Поэтому для завер. шения доказательства теоремы достаточно показать, что J+{£8\) n £2 является связным. Предположим, что это не так. Тогда мы можем найти непересекающиеся открытые множества О, О' С Е2 такие, что О П J+(<^i) ^ 0, (У П J+(^i) ф 0 и О U О' D J+{&i) П Е2. Тогда мы получаем Яг П 1~{0) ф 0, #i П Г* (О') ^9и^ С /"(О) U /~(0'). Однако не существует точки р из &й\% лежащей и в 1~(0) и /"(О'), и такой, что мы могли бы поделить направленные в будущее времени- подобные геодезические из р в соответствии с тем, пересекают ли они Е2 в О или О', и поделить времениподобные векторы в р на непустые, непересекающиеся открытые множества. (Это противоречит тому, что внутренняя часть светового конуса будущего Vp является связной.) Поэтому 1~(0) П Ei и 1~{0') П Ei должны быть непересекающимися открытыми подмножествами Ei, каждое из которых пересекает 38\, и их объединение содержит 38\. Однако, это противоречит предположению, что ЗВ\ является связным. D Одной из трудностей, с которой сталкиваются в определении черной дыры, является то, что необходимо знать всю будущую эволюцию пространства-времени для того, чтобы определить наличие черной дыры в данный момент. Однако может случиться, что для пространства- времени даны только начальные данные (Е, /гаь, Каь), и невозможно в явном виде решить уравнения эволюции. В таком случае общее определение черной дыры мало используется для непосредственного нахождения области В ф ill в пространстве-времени, полученном из этих данных, и если В ф 0 нахождения того, где на Е может лежать область черной дыры 88 — В П Е. Таким образом, полезно развивать критерии существования и локализации черной дыры без требования знания глобальной временной эволюции пространства-времени. Последующие три результата дают нам такие критерии. В гл. 9 мы доказали, что если в пространстве-времени имеется лову- шечная поверхность, выполняются подходящие энергетические уело- вия на материю и выполняется ряд дальнейших предположений, тогда должна появиться сингулярность (см. теоремы 9.5.3 и 9.5.4). Та' ким образом, ловушечные поверхности связываются с сингулярностя- ми пространства-времени. Наш первый результат, дающий критерий существования черной дыры, утверждает, что в сильно асимптотик
0 q Общие свойства черных дыр 441 \1^ й предсказуемом пространстве-времени является неверным утверждение, что с бесконечности "не видно" сингулярностей, но также ерно, что с нулевой бесконечности ловушечные поверхности не вид- ь Другими словами, все ловушечные поверхности должны целиком соДержаться внутри черных дыр. Утверждение 12.2.2. Пусть (M,ga6) является сильно асимптотически предсказуемым пространством-временем, для которого Л bkakb > 0 при всех ненулевых ка, как было бы в случае выполнения уравнений Эйнштейна и слабого или сильного энергетических условий на материю. Предположим, что М содержит ловушечную поверхность Т. Тогда Т С В, где В обозначает область черной дыры пространства-времени. Доказательство. Предположим, что Т содержится не полностью в В. Затем в нефизическом пространстве-времени мы хотели бы иметь J+(T) П ^+ Ф 0. Однако пространственная бесконечность г° не является причинным будущим какой-либо^точки в М, и ясно, что г° £ £ J+(T). Более того, поскольку область V нефизического пространства- времени является глобально гиперболической и Т компактно, то из теоремы 8.3.11 следует, что J~*~(T) замкнуто в V. Таким образом, нет открытой окрестности г°, которая бы не пересекала J~*~(T), и поэтому открытая область ^+ не пересекает J~*~(T). Поскольку ^+ является связным, то это предполагает, что существует точка q £ ^+ такая, что q £ J~*~(T). Следовательно, в соответствии с теоремой 9.3.1 в нефизическом пространстве-времени существует нулевая геодезическая 7 от р € Т до q, которая ортогональна к Т и не имеет сопряженной точки между Т и q. По отношению к физической метрике gab кривая 7 также является нулевой геодезической (см. прилож. D), ортогональной к Т без сопряженной точки, но теперь 7 является неполной в будущем. Однако это невозможно, поскольку в соответствии с теоремой 9.3.6 в физическом пространстве-времени 7 должна иметь сопряженную точку с аффинным параметром 2/|#о| от р, где во < 0 является Расширением в р ортогональной нулевой геодезической конгруэнции ^ Г, которой принадлежит 7- D Фактически, используя различные аргументы, мы можем слегка °^°бщить утверждение 12.2.2 для того, чтобы применить его к марги- НаАъной ловушечной поверхности, т.е. компактному, пространствен- «оподобному двумерному подмногообразию, для которого требуется °лько неположительность расширения обоих семейств ортогональ- bI* геодезических в < О, а не строгая отрицательность в < 0. В результате получаем
442 Глава 12. Черные дЬ1 Утверждение 12.2.3. Пусть Т является маргинальной ловуц1е ной поверхностью в сильно асимптотически предсказуемом прост ранстве-времени, для которого Rabkakb > 0 при всех ненулевых ka Тогда Т С В. Доказательство. Как и в доказательстве предыдущего утверждения мы знаем из теоремы 9.3.11, что J+(T) генерируется нулевыми геод^! зическими, ортогональными к Т. Расширение в этих нулевых геодезических в физическом пространстве-времени первоначально неположительно. Таким образом, мы имеем в < О везде на «7+(Т), поскольку dO/dX < 0 в соответствии с уравнением (9.2.32) и в не может стать положительным на J+(T), проходя через —оо, поскольку тогда можно было бы предположить существование сопряженной точки. Предположим теперь, что TnJ~(af+) Ф 0. Тогда, как и в доказательстве предыдущего утверждения, в нефизическом пространстве-времени могла бы существовать точка дб/+ид€ J^{^T). Более того, все точки, лежащие в причинном будущем q вдоль генератора нулевой геодезической ^+, проходящей через q, должны лежать в /+(Т), поскольку их можно соединить с Т причинной кривой, которая не является непрерывной нулевой геодезической. Поскольку /+(Т) является открытым, то все генераторы ^+, достаточно близкие к одной, проходящей через q, должны входить в /+(Т) = int(J+(T)). С другой стороны, все генераторы ^+ имеют конечную точку в прошлом г° и поэтому покидают J~*~(T) = J+(T). Таким образом, не только </, но также все локальное поперечное сечение ^ множества ^^ должно лежать в J+(T). Более того, нулевая геодезическая, генерирующая J+(T), должна ортогонально пересечь ^ для того, чтобы не существовало времениподоб- ных кривых от Т до ^. Однако, в физическом пространстве-времени расширение конгруэнции нулевых геодезических, ортогональных поперечному сечению ^+, положительно вблизи ^+. Это противоречит предыдущему результату, что генераторы J+ (T) всюду имеют неположительное расширение. О Заметим, что единственным свойством Т, необходимым для доказательства утверждений 12.2.2 и 12.2.3, является то, что ^+(Т) замкнуто, г° 0 J+(T), а также то, что расширение нулевых геодезических, генерирующих J~*~(T), является изначально неположительным. ДрУ" гим важным примером множества, имеющего эти свойства, является следующий^Пусть Е является асимптотически плоской поверхностью Коши для V так, что Е проходит через г° и является там простри' ственноподобной. Пусть С С Е П М является замкнутым подмножеством Е, которое образует трехмерное многообразие с границей (сМ*
Общие свойства черных дыр 443 \%*^.— илож- В), и предположим, что двухмерная граница S = С подмно- П рства С имеет свойство, что расширение 9 выходящего семейства левых геодезических, ортогональных 5, является всюду неположи- ным q < о. (Здесь выходящее семейство определяется как се- рйство нулевых геодезических, ортогональных S и удовлетворяющих ловию kaNa > 0, где ка обозначает касательную к геодезической, и лга является вектором, нормальным к S в Е и указывающим наружу С.) Поверхность 5, удовлетворяющая этим свойствам, называет- внешней маргинальной ловушечной поверхностью, и С называется ловуилечной областью. (Заметим, что С не обязательно должно быть связным или компактным. Заметим также, что ловушечная поверхность не обязательно должна быть внешней ловушечной, поскольку не требуется, чтобы она была границей трехмерного объема.) Тогда можно следующим образом увидеть, что С удовлетворяет требуемым выше свойствам. Из задачи 8 гл. 8 следует, что J+{C) замкнуто. Ясно, что г° & J+(C). Наконец, каждый из нулевых геодезических генераторов J(C) С J+(C) должен иметь конечную точку в прошлом на С, но не может встретить С в int(C), не может пересечь S = С неортогонально и не может быть входящей геодезической в 5, поскольку в любом из этих случаев он может войти в /+(С). Таким образом, в < 0 первоначально для нулевых геодезических, генерирующих J+(C). Следовательно, повторение доказательства утверждения 12.2.3 дает следующий результат. Утверждение 12.2.4. Пусть (M,ga6) является сильно асимптотически предсказуемым пространством-временем, для которого Rabkakb > 0 при всех ненулевых ка. Пусть Е является асимптотически плоской поверхностью Коти для V, и С С Е - ловушечная область. Тогда С С В П Е. Мы определим полную ловушечную область ^ поверхности Ко- щи Е как замыкание объединения всех ловушечных областей С на Е. Назовем границу А — ^ области ^ кажущимся горизонтом на Е. Из утверждения 12.2.4 сразу следует, что в сильно асимптотически предсказуемом пространстве-времени с Rabkakb > 0 для всех нулевых имеем ^ с В П Е, и поэтому кажущийся горизонт всегда лежит ВнУтри (или совпадает) истинного горизонта Н П Е на Е. Кажущийся °Ризонт я/ удовлетворяет следующему свойству. Теорема 12.2.5. Если полная ловушечная область ^ на поверх- "°<*пи Коши Е имеет структуру многообразия с границей, то ка- ^УЩийся горизонт А является внешней маргинальной ловушечной веРхностью с исчезающим расширением в = 0.
444 Глава 12. Черные ДыD Доказательство. Ясно, что ^ является замкнутым и также имеем2 г° £ ^/, и ^ удовлетворяет первым двум требованиям, чтобы бытк ловушечной областью. Для того, чтобы показать, что в = 0 на srf 3£u метим, что если в > О в р G я/, то можно было бы найти окрестность (/ точки р такую, что каждая поверхность 5, проходящая через U с в < q везде на 5 должна покинуть ^. Следовательно, мы не можем иметь внешние ловушечные поверхности, проходящие произвольно близко к р, но находящиеся в ^, как требуется тем, что р находится на гра. нице ^. С другой стороны, при заданном в < О всюду на srf, если мы имели в < О в q G л^, то мы могли бы деформировать ^ наружу в окрестности q, сохраняя всюду в < 0. Таким путем мы могли бы сделать ловушечную область С больше ^, что невозможно. q Последний результат, который мы докажем в этом разделе касается эволюции горизонта событий . Поскольку горизонт Н является границей прошлого ^+, то по теореме 8.1.3 он является ахрональ- ным, трехмерным, вложенным в С0 (фактически С1-) подмногообразием. Более того, по теореме 8.1.6 Н генерируется непродолжаемыми в будущее нулевыми геодезическими, поскольку не существует нулевой геодезической, генерирующей Н, которая может иметь будущую конечную точку на ^+. Поэтому, если пересечение Ж — i/ПЕ горизонта с пространственноподобной поверхностью Коши Е для V является непустым, то оно составляет двухмерное подмногообразие Е. Следующая теорема утверждает, что площадь Ж никогда не увеличивается со временем. Как мы увидим в разд. 12.5 и 14.4, этот результат лежит в основе глубокой связи между черными дырами, термодинамикой и квантовой физикой. Теорема 12.2.6. (Теорема площади черной дыры (Hawking 1971)) Пусть (M,gab) является сильно асимптотически предсказуемым пространством-временем, удовлетворяющим условию Rabkakb ^ 0 для всех нулевых ка. Пусть Ei и Ег - пространственноподобные поверхности Коши для глобально гиперболической области V такие, что Е2 С /+(Ei), и пусть Жх = #ПЕЬ Ж2 = ЯПЕ2, где Н обозначает горизонт событий, т.е. границу области черной дыры в (M,gab)' Тогда площадь Ж2 не меньше площади Ж\. 2 Чтобы это увидеть, заметим что в асимптотически евклидовой системе координат на Е (см. задачу 2 гл. 11) существует радиус R такой, что все координатные сферы с г > R имеют всюду положительное расширение выходящих нулевых геодезических. Следовательно нет внешней ловушечной поверхности 5, входящей в область г > Я, поскольку расширение выходящих нулевых геодезических из могло бы быть велико по крайней мере как координатная сфера в точке, где принимает максимальное значение на S. Поэтому ^ не может входить в облает г > Я.
12 3. Заряженные черные дыры Керра 445 Доказательство. Во-первых, мы установим, что расширение в нулевой геодезической, генерирующей Я, всюду неотрицательно в > 0. Предположим, что 9 < 0 в р £ Н. Пусть Е является пространствен- ноподобной поверхностью Коши для V, проходящей через р, и рассмотрим 2-поверхность Ж — Н П Е. Поскольку в < 0 в р, мы можем деформировать Ж наружу в окрестности р для того, чтобы получить поверхность Ж' на Е, которая входит в J~(^+) и имеет в < 0 всюду в J~(c/*)- Однако, по таким же аргументам как и в утверждении 12.2.2, это ведет к противоречию. Пусть К С Е является замкнутой областью, лежащей между Ж\ Ж' nq e ^+ nq e J+(K). Тогда нулевая геодезическая, генерирующая J+(K), на которой лежит q, должна пересечь Ж' ортогонально. Однако это невозможно, поскольку в < 0 на Ж', и поэтому этот генератор будет иметь сопряженную точку до достижения q. Таким образом, в > 0 всюду на Н. Далее, как отмечалось выше, каждая точка р € Ж\ лежит на непро- должаемой в будущее нулевой геодезической 7, содержащейся в Я. Поскольку Ег является поверхностью Коши, то 7 должна пересекать Ег в точке q Е ^2. Таким образом, мы получаем естественное отображение из Ж\ в (часть) Ж^. Поскольку в > 0, то площадь части с^2, являющейся образом Ж\ при этом отображении, должна быть по крайней мере больше, чем площадь Ж\. Поскольку также не требуется, чтобы отображение было отображением на, например, новые черные дыры могут сформироваться между Ei и Ег, то площадь Жь может быть гораздо больше. Поэтому площадь Жч не может быть меньше, чем площадь Ж\. □ 12.3 Заряженные черные дыры Керра Рассмотрим тело, которое совершает полный гравитационный коллапс и, в соответствии с первой гипотезой космической цензуры Разд. 12.1, формируется черная дыра. В сферически симметричном случае пространство-время вне тела всегда описывается решением Шварцшильда, и конечным состоянием гравитационного коллапса является шварцшильдова черная дыра. Однако в несферическом случае Ге°метрия пространства-времени вне коллапсирующего тела должна ^меняться со временем и сильно зависит от деталей коллапса. В частота, гравитационное излучение не может появиться в сферически сИмметричном пространстве-времени, но большое количество энергии м°Жет излучаться в несферическом коллапсе. Тем не менее из фи- Зических соображений можно ожидать, что в гораздо более "позднее Ремя" геометрия пространства-времени должна "стабилизироваться"
446 Глава 12. Черные li^Pb, до стационарного конечного состояния. Более того, можно ожидаТк что вся имеющаяся материя быстро "поглотится" черной дырой, и ко! нечное состояние будет вакуумом, исключая возможное электромаг нитное поле, связанное с черной дырой. (Даже в таких случаях, как бинарные рентгеновские источники, где имеется стационарный поток материи в черную дыру, эта материя производит только малое возму- щение структуры черной дыры.) Поэтому ожидается, что конечным состоянием гравитационного коллапса будет стационарная электровакуумная (т.е. вакуум, за исключением электромагнитных полей) чер. ная дыра. Таким образом, интересно найти все решения уравнений Эйнштейна - Максвелла, которые описывают стационарные черные дыры. Мы уже детально обсуждали сферически симметричную, статическую черную дыру, решение открытое Шварцшильдом (Schwarzschild 1916а). Вскоре после этого заряженное обобщение решения Шварц- шильда было независимо открыто Райсснером (Reissner 1916) и Норд- стремом (Nordstrom 1918) (см. задачу 3 гл. 6). Однако только в 1963 году Керром было открыто другое семейство решений для стационарных, вакуумных черных дыр. Заряженное обобщение семейства Кер- ра было получено несколько позднее Ньюманом (Newman et al. 1965). Эти заряженные керровские решения образуют трехпараметрическое семейство. Метрика пространства-времени и электромагнитный векторный потенциал имеют вид J о /A-a2sin20\ j2 2asin20(r2 + a2-AV ^ dsz = - [ dr *— -dtd(j)+ = _^A-aW^2_ (r2 + a2)2-Aa2 sin2 0"1 sin2 Odxt)2 + ^-dr2 + Ed02, (12.3.1) Aa = -^[(dt)a - asin2 e(d</>)a), (12.3.2) где E = r2 + a2cos20, (12.3.3) Д = r2 + a2+e2-2Mr (12.3.4) и е, а и M - три параметра семейства. Когда е = 0, мы имеем Аа = "' и метрика пространства-времени сводится к семейству вакуумных р^ шений Керра. Когда а = 0, мы получаем решения Райсснера - НорД' стрема, и когда е = а = 0, уравнение (12.3.1) сводится к решенШ0 Шварцшильда. Таким образом, все известные решения для стаи1*0' нарных черных дыр описываются трехпараметрическим семейством
Заряженные черные дыры Керра 447 пЪ 3.1) и (12.3.2). Как будет показано в конце этого раздела, не суще- ует других стационарных черных дыр. Все заряженные метрики Керра стационарны и осесимметричны м- Р33^ 7Л)' с полями Киллинга £° = (d/<9*)° и фа = (д/дф)а. Они ймптотически плоские, это видно из того, что метрические компоты (12.3.1) достигают величин метрики Минковского в сфериче- ких координатах при г —> оо, и это детально было показано в работе (Ashtekar and Hansen 1978). В алгебраической классификации разд. 7.3 они являются решениями типа П-П со следующими главными нулевы- мй векторами: 1а = ^—^-Уд/д1Г^^{д1дфГ^{д/дт)\ (12.3.5) п° = Г^^(дта + ^(д/дф)а-^(д/дгГ. (12.3.6) (Здесь 1а и па нормируются обычным способом (Kinnersley 1969), и 1*Па = "I-) Все три параметра е, а и М, появляющиеся в решениях, имеют прямую физическую интерпретацию. Для любой 2-сферы в асимптотической области имеем \ [ eabcdFcd = 4тге, (12.3.7) и поэтому по задаче 2 гл. 4 мы можем интерпретировать е как полный электрический заряд пространства-времени. Более того, имеем SnJs e„6cdVcr = M, (12.3.8) s и поэтому, в соответствии с уравнением (11.2.9), М является полной массой. Наконец, имеем 167ГУ5 €a6cdVcVd = Ma, (12.3.9) .и поэтому, в соответствии с задачей 6 гл. 11, получим а = J/M, где J является полным угловым моментом пространства-времени. Необходимо подчеркнуть, что в геометрических единицах отноше- Ние заряда к массе протона q/m ~ 1018, а для электрона имеем q/m ~ ^ Ю . Поскольку отношение электромагнитной и гравитационной Ил5 действующих на тело заряда q и массой га со стороны тела за- ряАа е и массой М, порядка ~ ge/гаМ, то очень трудно для любого тРофизического тела достигнуть и/или удерживать отношение заря- ^ к массе больше чем ~ 10"18, поскольку тело с большим отношением
448 Глава 12. Черные дырь, заряда к массе будет избирательно притягивать частицы противоположного знака3. Следовательно, в астрофизических ситуациях имеем е > М, и мы можем пренебречь воздействием электромагнитного поля на геометрию пространства-времени и рассматривать только семейство керровских черных дыр. Метрические компоненты в координатном базисе заряженной кер- ровской черной дыры (12.3.1) являются несингулярными, и метрика является невырожденной всюду, кроме случаев Е = 0 и Л = 0. Вычисление инвариантов кривизны, таких как RabcdRabcd, показывает, что сингулярность Е = г2 + a2 cos2 в = 0 (12.3.10) является истинной сингулярностью кривизны при М^О. Если интерпретировать г, в и ф как сферические координаты, то кажется загадочным, что сингулярность в начале г = 0 появляется только при в = 7г/2. В частности, если мы интерпретируем сингулярность таким образом, т.е. если мы определяем метрику керровской черной дыры на многообразии R4 с удаленным началом г = 0, тогда мы получаем неполные геодезические (как на оси sin0 = 0), которые обрываются при г = 0, но вдоль которых кривизна остается конечной. Фактически такое пространство-время будет продолжаемым. Это дает хорошую иллюстрацию неправильности выбора структуры многообразия на основе наивной интерпретации координатной системы, в которой задана метрика. Некоторое понимание природы сингулярности * заряженной керровской метрики при Е = 0 можно получить, рассматривая случай е = М = 0, а Ф 0. В этом случае керровская метрика( 12.3.1) фактически является ни чем иным, как метрикой пространства-времени Минковского, выраженной в сфероидальных координатах. Здесь сингулярность при Е = 0 является просто координатной сингулярностью, и она локализована на кольце радиуса а в плоскости z = 0. Это подсказывает, что когда М ф 0 и а ф 0, то мы интерпретируем истинную сингулярность при Е = 0 как кольцевую сингулярность, т.е. мы определяем заряженную керровскую метрику на многообразии, чья структура в окрестности этой сингулярности имеет топологию R4, с удаленным множеством 51 х R (кольцо 51 на "время" R). Это можно реализовать явно, преобразуя к квазидекартовым координатам Керра и Шильда (Kerr and Schild 1965), где Е = 0 принимает форму кольца- 3Одним из механизмов получения чистого заряда на астрофизическом теле, который, в принципе, мог бы превысить этот предел, является вращающееся тело в магнитном поле. Однако для керровской черной дыры этот механизм также при" водит к накоплению незначительного заряда в астрофизических ситуациях (Wa* 1974b).
12 3. Заряженные черные дыры Керра 449 Однако проблема все же остается в том, что, когда М ф О, метриче- кйе компоненты перестают быть гладкими на координатном диске, круженном кольцевой сингулярностью в плоскости z = 0. Это проблема может быть исправлена определением заряженной керровской метрики на многообразии со следующей относительно сложной топологией в окрестности сингулярности Е = 0. Мы берем две копии М\ и Ыг пространства R4 с удаленным "кольцом" z = 0, х2 + у2 = а2. Затем мы приклеиваем М\ и Мг, идентифицируя "верхнюю часть" диска z = 0, х2 + у2 < а2 в Mi с "нижней частью" соответствующего диска в Мг и аналогично идентифицируя "нижнюю часть" диска в Mi с "верхней частью" диска в Мг. Тогда заряженную керровскую метрику сМ/0, а ф 0 можно гладко определить на этом многообразии таким образом, что скаляр кривизны RabcdRabcd расходится вдоль каждой неполной геодезической, гарантируя этим непродолжаемость пространства-времени. Детали этой конструкции можно найти в книге (Hawking and Ellis 1973). Необходимо подчеркнуть, что когда мы проходим "через кольцо" при движении от Mi к Мг в этом пространстве-времени, то это соответствует в первоначальных координатах прохождению через г = 0 к отрицательным значениям г. Однако для отрицательных значений г достаточно малой величины и в достаточно близких к 7г/2, мы имеем фафа = gu < 0 (см. (12.3.1)). Таким образом, фа = {д/дф)а становятся времениподобными вблизи кольцевой сингулярности. Однако орбиты фа должны быть замкнуты (т.е. координата ф должна быть периодической с периодом 27г) для того, чтобы пространство-время заряженной керровской черной дыры было асимптотически плоским при г —у оо. Таким образом, существуют замкнутые времениподобные кривые в окрестности кольцевой сингулярности. При е2 + а2 > М2 не существует решений уравнения Л = 0, и поэтому истинная сингулярность Е = 0 является только сингулярностью координатных компонент (12.3.1). В этом случае кольцевая сингулярность является "голой", т.е. метрика заряженной керровской черной дыры теряет свойство сильной асимптотической предсказуе- мости, и поэтому она we описывает черную дыру. Более того, можно использовать нарушение причинности, появляющееся возле кольцевой сингулярности, для того, чтобы двигаться "назад по времени" на про- Изв°льно большую величину координаты t в (12.3.1), и можно сделать а-мкнутые времениподобные кривые, проходящие через любую точку пРостранства-времени. ^ случае е2 + а2 ^М2 (12.3.11)
450 Глава 12. Черные дЬ1ь Л исчезает при следующих значениях координаты г: г± = М±(М2-а2-е2)1/2. (12.3.12) Как было показано в работах (Воуег and Lindquist 1967) и (Carter 1968а), сингулярности в метрических компонентах при г = г+ и (д^ а Ф 0 или е Ф 0) при г = г_ являются координатными сингулярна стями такой же природы, как сингулярность г = 2М в пространстве- времени Шварцшильда. Таким образом, мы можем продолжить это пространство-время через эти координатные сингулярности как и в случае пространства-времени Шварцшильда. Когда эти расширения соединятся вместе, получается замечательная глобальная структура расширенного заряженного пространства-времени Керра. Конформная диаграмма расширенного пространства-времени показана на рис. 12.3, и конформная диаграмма расширенного заряженного пространства-времени Керра са/0 показана на рис. 12.4 для "неэкстремального случая" а2 + е2 < М2. Область I на рис. 12.4 является асимптотически плоской областью, покрытой несингулярным образом первоначальными координатами (12.3.1) с г > г+. Продолжая через координатную сингулярность в г = г+, мы получаем область II, представляющую собой черную дыру, область III, описывающую белую дыру, и область IV, представляющую собой другую асимптотически плоскую область, как и в случае решения Шварцшильда на рис. 6.9 и 12.3. Однако, в отличие от случая Шварцшильда, вместо встречи истинной сингулярности на "верхней границе" области II и на "нижней границе" области III мы просто сталкиваемся с другой координатной сингулярностью при г = г-. Таким образом, мы можем продолжить область II через г = г_ в области V и VI. Эти области содержат кольцевую сингулярность в Е = 0 и, как описывалось выше, можно пройти через кольцевую сингулярность и получить другу*0 асимптотически плоскую область при г —* — оо. (В этой асимптотически плоской области кольцевая сингулярность является голой сингулярностью с отрицательной массой. По отношению к первоначальной асимптотически плоской области I кольцевая сингулярность конечно лежит внутри черной дыры.) Затем можно продолжить и расширить керровское заряженное пространство-время "вверх" до бесконечности и получить область VII, идентичную по структуре области III, и облЗ' сти VIII и IX, идентичные по структуре областям IV и I, и т.д. Анал^ гично можно расширить заряженные керровские решения "вниз" Д бесконечности. Структура расширенного пространства-времени Р3^ снера - Нордстрема (а = 0, е Ф 0) полностью аналогична, за искл^ чением того, что сингулярность Е = 0 не является больше кольце0
а Заряженные черные дыры Керра 451 рис 1^.3. Конформная диаграмма расширенного пространства-времени |Мварцшильда (см. рис. 6.9), представленная таким же способом, как и на оис 12.2. Заметим, что поскольку расширенное пространство-время имеет две асимптотически различимые плоские области, то показаны две различные конформные границы и мы не можем продолжить на отрицательные значения г. Глобальная структура "экстремальной" заряженной керровской черной дыры е2 + а2 = м2 (где r+ = r_ = м) отличается от рис. 12.4, но имеет аналогичную структуру, состоящую из "блоков" с г > М и г < М, соединенных вместе в бесконечную цепочку. Таким образом, наблюдатель в области I расширенного заряженного пространства-времени Керра на рис. 12.4 может пересечь горизонт событий при г = г+ и войти в область II черной дыры. Однако вместо неизбежного падения в сингулярность за конечное собственное время, как было в пространстве-времени Шварцшильда, наблюдатель может пройти через "внутренний горизонт" г = г- (который является горизонтом Коши для гиперповерхности 5, показанной на рис. 12.4), попадая таким образом в области V и VI. Начиная с этого момента, он может закончить свое существование в кольцевой сингулярности, но также он может пересечь кольцевую сингулярность и попасть в новую асимптотически плоскую область, или же он может войти в "область белой дыры" VII и оттуда попасть в новую асимптотически плоскую область VII или IX. Оттуда он может попасть в новую черную дыру, связанную с этими асимптотическими °бластями, и продолжить свое путешествие. Насколько серьезно рассматривать такое расширенное заряженное пРостранство-время Керра? Какая часть этого пространства-времени °Жет быть получена в физически реалистичном гравитационном колесе, начиная с "неэкзотических" начальных данных, т.е. с асимпто- ически плоской поверхности 5 начальных данных с топологией R3? отличие от случая Шварцшильда мы не имеем причины не верить, ° внешнее гравитационное поле какого-либо коллапсирующего тела УДет описываться метрикой Керра, поскольку, как подчеркивалось
452 Глава 12. Черные дырь. Рис. 12.4. Конформная диаграмма расширенного заряженного пространства- времени Керра в случае а ф О, а2 + е2 < М2 выше, в несферическом случае мы могли бы в общем случае ожидать сложную динамическую эволюцию, которая "стабилизируется" к стационарной геометрии на поздних временах в J~(J+). Поэтому мы не в состоянии следовать динамической эволюции гравитационного коллапса тела, которое образует керровскую черную дыру и определяет детальную геометрию пространства-времени внутри черной дыры. Однако в случае сферического коллапса заряженного тела (е Ф 0) геометрия внешнего к материи пространства-времени описывается решением Райсснера - Нордстрема, поскольку теорема Биргоффа может быть обобщена до утверждения, что пространство-время Райсснера - Нордстрема является единственным сферическим симметричным решением. Динамическая эволюция простой системы, подобной заряженной пылевидной сферической оболочке, может быть получена явно. В этом случае пространство-время является плоским внутри оболочки, и плоская внутренняя область оболочки полностью "закрывает области III и IV на рис. 12.4. Часть или все области II и V (включая во всех случаях сингулярность в г = 0 в области V) также закрываются. Поведение оболочки для различных выборов полной массы М,полного заряда е и полной массы покоя М детально описаны Бульваром (Boulware 1973). На рис. 12.5 показано результирующее пространство-время для случая М > М > |е|. Видно, что оболочка пересекает поверхность г = **-> которая является горизонтом Коши для области I. Пространство-вреМя
3. Заряженные черные дыры Керра 453 -— г = 0 (Сингулярность) г«0 (Начало координат) рис. 12.5. Конформная диаграмма пространства-времени, в котором заряженная сферическая оболочка с М > М > \е\ подвергается гравитационному коллапсу. Пунктирные линии отмечают расширенное пространство-время Рай- сснера - Нордстрема является продолжаемым через г_, но расширение не определяется уравнениями Эйнштейна, поскольку оно находится вне области зависимости поверхности начальных данных. Однако, если предположить, что расширение является сферически симметричным, то расширение дается геометрией Райсснера - Нордстрема, и мы находим, что оболочка врезается в сингулярность г = О (которая формируется вне оболочки) в области VI, как показано на рис. 12.5. Для других значений параметров М, М и е оболочка может снова расшириться в область VII геометрии Райсснера - Нордстрема (Boulware 1973). Поэтому мы можем получить в результате коллапса заряженного тела пространства, которые имеют особенности, сильно отличающиеся от изображенной на рис. 6.11. Однако, как уже подчеркивалось в нашем обсуждении космической цензуры в разд. 12.1, горизонт Коши на рис. 12.5 является нестабильным (Chandrasekhar and Hartle 1982). Линейные возмущения начальных данных для уравнений Эйнштейна - Максвелла на поверхности Коши для области I на рис. 12.5 становятся сингулярными при г = г_. Основная причина этого в том, что наблюдатель, пересекающий г = г_ на рис. 12.5, "видит" всю область I. Осцилляции гравитационного и электромагнитного полей, которые появляются На конечной частоте в области I "видны" наблюдателю, пересекающе- МУ г~, на бесконечной частоте, т.е имеется "бесконечное голубое смещение", которое делает эти возмущения сингулярными. Поэтому есть еские основания верить, что в физически реалистичной ситуации, ко- •*& оболочка не является точно сферической, горизонт Коши г = г- а Рис. 12.5 станет истинной, физической сингулярностью, и появится
454 Глава 12. Черные £*Фы "всеобщая" сингулярность внутри черной дыры, образованная в ре^ зультате коллапса оболочки. Верится, что аналогичные явления будут иметь место в любом реалистическом коллапсе заряженной керровской черной дыры. Таким образом, ожидается, что пространство-время, полученное в результате реалистического коллапса, качественно аналогично скорее сферическому случаю, изображенному на рис. 6.11, чем расширенному решению Керра, изображенному на рис. 12.4. Другой достойной упоминания особенностью заряженного керр0в. ского пространства-времени является то, что норма времениподобного поля Киллинга a2sin20-A CU = gtt = g (12.3.13) становится положительной в области г2 + a2 cos2 в + е2 - 2Мг < О, (12.3.14) часть которой лежит вне черной дыры, если а ф 0. Таким образом, в области г+<г<М + (М2 -е2-а2 cos2 0)1/2, (12.3.15) называемой эргосферой и изображенной на рис. 12.6, вектор Киллинга асимптотических временных трансляций £° = (d/dt)a становится пространственноподобным. Следовательно наблюдатель в эргосфере должен "двигаться быстрее света", двигаясь по орбитам £°, т.е. он не может оставаться стационарным даже вне черной дыры. Природу этой нестационарности можно увидеть из уравнения $>М1У^<0 (12.3.16) на компоненты касательного вектора иа какой-либо времениподобной кривой. Внутри эргосферы все слагаемые в левой стороне уравнения (12.3.16) явно положительны, за исключением члена 2g^utu(i> ~ — 2gt<f>(dt/dr)(d<l>/dT), где г обозначает собственное время вдоль кривой. Поскольку вектор Vat является времениподобным, направленным в прошлое в эргосфере, то мы имеем dt/dr = uaVat > 0. Поэтому, п0" скольку gt0 < 0 в эргосфере, то мы должны иметь дф/dr > 0 (12.3.17) для всех времениподобных кривых в эргосфере. Другими словам » все наблюдатели в эргосфере принуждаются к вращению в напр33 лении вращения черной дыры. В этом можно увидеть экстремальнь
Заряженные черные дыры Керра 455 t СЖ . Черная дыра Эргосфера' («) (Ь) Рис. 12.6. Набросок, показывающий (а) "вид сбоку" и (Ь) "вид сверху" на эргосферу черной дыры Керра случай эффекта "увлечения инерциальной системы", получал яркий пример того, как некоторые аспекты принципа Маха включаются в общую теорию относительности. Близким аналогом семейства статических наблюдателей вне черной дыры в геометрии заряженной кер- ровской черной дыры являются "локально невращающиеся наблюдатели" (см. задачу 3 гл. 7), чьи 4-скорости даются соотношением иа = -Va<[—VbV6^]1/2. Эти наблюдатели вращаются с координатной угловой скоростью 4fr_ ft» _ а(г2 + а2-Д) Я" ёФФ~ (r» + a»)»-Aa»ein2*' (12-6ЛЬ) В пределе, когда мы достигаем горизонт событий черной дыры г —> г+, координатная угловая скорость принимает вид: «я = -з4т2 • (12.3.19) v\ -ha2* Это тесно связано с тем, что поле Киллинга х« = (d/dt)a + Пн{д/дф)а (12.3.20) vHe {d/dt)a) является касательным к нулевой геодезической, генерирующей горизонт заряженной керровской черной дыры. Уравнение v 12.3.20) можно интерпретировать так, что горизонт событий заряженной черной дыры вращается с угловой скоростью fi#. Перейдем далее к краткому обсуждению геодезического движения. ^я простоты мы рассмотрим только геометрию Керра е = 0 (см. за- ^ачУ 2 для случая е ф 0.) Как и в случае Шварцшильда времениподоб- °* поле Киллинга £° и аксиальное поле Киллинга фа удовлетворяют, утверждения С.3.1, сохранению энергии Е и момента им-
456 Глава 12. Черные дыры пульса L на единицу массы покоя на геодезических / 2Мг\. 2Marsin20. Е = -иа$а = ( 1 - — J * + 0, (12.3.21) 2Marsin20. (г2 + а2)2-Да2 sin2 0 . 2 • . L = tiVe = 1 + i i-g sin2 00, (12.3.22) где x^ = dx^/dr. Дополнительно мы имеем gabuaub = -к, (12.3.23) где к = 1 для времениподобных геодезических и к = 0 для нулевых. Можно использовать уравнения (12.3.21) и (12.3.22), чтобы выразить i и ф через Е и L и подставить в уравнение (12.3.23). В случае экваториальных геодезических в = 7г/2 получаем hr)2 + V(E,L,r)=0, (12.3.24) 2 где ^ = -«" + £ + J<« - *) (l + £) - £(* - а^)2. (12-3.25) 2г2 Таким образом, как и в случае Шварцшильда, проблема получения времениподобных и нулевых геодезических в экваториальной плоскости пространства-времени Керра сводится к решению проблемы обычного нерелятивистского одномерного движения в эффективном потенциале с единственным усложнением, что V теперь нетривиально зависит от Е и L. Поэтому мы можем найти поведение свободно падающих пробных тел и световых лучей методами, аналогичными рассмотренным в разд. 6.3. В частности, круговые орбиты получаются одновременным решением уравнений V = 0 и dV/dr = 0. Их свойства обсуждаются в работе (Bardeen, Press, and Teukolsky 1972). Заслуживает внимания, что энергии связи, существенно более высокие, чем в случае Шварцшильда, могут быть достигнуты для круговых орбит вокруг керровской черной дыры. Для керровской черной дыры с а = М на последней устойчивой орбите (с положительным L) имеем Е = 1/\/3. Поэтому, если пробное тело с положительным L движется по спирали в направлении последней стабильной круговой орбиты вследствие потери энергии на гравитационное излучение, то оно изЛ^ чает 1 — 1/\/3 « 42% его первоначальной энергии, в отличие от ~ 6'° в случае Шварцшильда (см. уравнение (6.3.23)).
о Заряженные черные дыры Керра 457 Постоянные движения Е и L, определяемые уравнениями (12.3.21) и 2.3.22), не дают достаточного числа первых интегралов для опре- рления неэкваториального движения. Поэтому в этом случае мы дол- нЫ были бы вернуться к уравнению геодезической uaVaub = 0 и решать набор связанных обыкновенных дифференциальных уравнений 0рого порядка для того, чтобы получить г(т) и 0(т). Оказалось, что этом нет нужды. Метрика Керра обладает тензором Киллинга Kab = 2U{anb)+r2gab (12.3.26) (Walker and Penrose 1970), где la и па даются уравнениями (12.3.5) и (12.3.6). Таким образом, как обсуждалось в конце прилож. С, получаем дополнительную константу движения С = КаЬиаиь. (12.3.27) Это позволяет точно проинтегрировать уравнения геодезической, что было сделано Картером (Carter 1968a). Он использовал разделимость уравнений Гамильтона - Якоби для геодезической, а не существование Каь дая получения этой дополнительной константы движения. Дополнительно, метрика Керра, та кже как и все другие типы П-П вакуумных пространств, обладает "конформным спинором Киллинга"(см. Walker and Penrose 1970), что дает возможность простым способом определить параллельный перенос "вектора поляризации" вдоль нулевых геодезических. Существенные упрощения также имеют место при изучении распространения пробного скалярного поля Клейна - Гордона (4.3.9) в пространстве-времени Керра. Можно использовать стационарное и аксиальное поля Киллинга, чтобы разложить скалярное поле в ряд Фурье по угловой координате ф и Фурье интеграл по временной координате t. Это эффективно сводит уравнение Клейна - Гордона к уравнению в частных производных по двум оставшимся переменным г и в. Однако оказалось, что это уравнение можно решить разделением переменных (Carter 1986b), и проблема определения поведения пробного поля Клейна - Гордона в пространствах Керра сводится к решению обыкновенных дифференциальных уравнений. Гораздо более существенные упрощения имеют место при изучении уравнений Максвелла и линеаризованных уравнений Эйнштейна На фоне пространства Керра. После использования симметрии по ф и * можно было бы ожидать, что мы останемся со сложной системой Вязанных уравнений в частных производных по г и в для, соответ- Твенно, векторного потенциала А^ и компонент метрических возму- Щвний 7/л/. Действительно это будет так, когда мы выпишем уравнения
458 Глава 12. Черные дырЬ1 для Ац и 7дю даже используя упрощающие калибровки, такие как калибровка Лоренца для А^ или поперечно бесследовая калибровка для "Уfiu (см. разд. 7.5). Однако можно выписать уравнения в формализме Ньюмена - Пенроуза (Newmann and Penrose 1962) (см. разд. 3.4.2), используя повторяющиеся главные нулевые векторы метрики Керра /а и п°, даваемые уравнениями (12.3.5) и (12.3.6), в качестве реальных нулевых векторов и вектор ™°= ¥WTi^f)[iasine{d/dt)a + {д,дв)а + Ш™»™ (12.3.28) в качестве комплексного нулевого вектора в базисе Ньюмена - Пенроуза. Тогда, как было открыто в работе (Teukolsky 1972), можно разделить уравнение для величины Ф0 = Fablamb в уравнениях Максвелла и для Фо = -Cabcdlamblcmd (12.3.30) в линеаризованных уравнениях Эйнштейна. (Аналогичное разделение уравнений можно получить для Ф2 = Fabfnanb и Ф4 = —СаЪс<1Пагпъпс х xrnd.) Более того, Тьюколски показал, что эти уравнения также можно решить разделением переменных. Дополнительно, знание Фо (или Фг) определяет возмущения уравнений Максвелла пО модулю тривиальных решений "изменений заряда", полученных линеаризацией уравнения (12.3.2) на фоне пространства Керра, а знание Фо (или Ф4) определяет гравитационные возмущения по модулю тривиальных возмущений, полученных вариацией керровских параметров М,а (Wald 1973). Наконец, полные векторный потенциал Аа и метрические возмущения 7аЬ> связанные соответственно с Фо и Фо» можно получить в явном виде (Cohen and Kegeles 1974, Wald 1978a, Chandrasekhar 1983). Таким образом, проблема определения поведения электромагнитного и гравитационного возмущений керровской черной дыры также сводится к решению обыкновенных дифференциальных уравнений, что позволяет решать многие интересные проблемы. Аналогичные упрощения связанной линеаризованной системы Эйнштейна - Максвелла имеют место и в случае Райсснера - Нордстрема а = 0, е Ф 0 (Moncrief 1975, Chandrasekhar 1979). Однако нет таких упрощений в общем заряженном керровском случае а Ф 0, е ф 0. Для подробного обсуждения электромагнитных и гравитационных возмущений керровской черной дыры мы отсылаем читателя к работе Чандрасекара (Chandrasekhar 1983). (12.3.29)
Заряженные черные дыры Керра 459 Таким образом, суммируя вышеизложенное, много известно о свойствах керровских черных дыр. Это единственное известное решение раВнений Эйнштейна для стационарных вакуумных черных дыр. Однако, поскольку они образуют только двухпараметрическое семейство, 0 можно ожидать, что должны существовать другие стационарные решения, описывающие черные дыры. Из гл. 11 ясно, что внешнее гравитационное поле стационарного тела характеризуется бесконечным набором мультипольных коэффициентов. Почему все высшие мульти- польные моменты стационарной черной дыры должны быть связаны единственным способом с ее массой и угловым моментом? Замечательным результатом теоремы Израэля, Картера и Робинсона, фактически полное доказательство которой было получено между 1965 и 1975 годами, служит то, что керровские черные дыры являются единственно возможными стационарными вакуумными черными дырами. Поэтому, если гипотеза космической цензуры правильна, и если пространство-время, получающееся в процессе гравитационного коллапса, всегда "стабилизируется" до стационарного конечного состояния, конечным продуктом коллапса всегда должна быть керровская черная дыра. Полный гравитационный коллапс двух тел, сильно отличающихся друг от друга по составу, форме и структуре, приведет к неразличимым конечным состояниям при условии, что их конечный продукт будет иметь одинаковые полную массу и полный угловой момент. Поскольку мы далеки от того, чтобы получить в явном виде общее решение стационарных вакуумных уравнений Эйнштейна4, то доказательство единственности керровских черных дыр использует довольно длинную цепочку аргументов. Последовательно первым шагом в этой цепочке, хотя исторически это было последним шагом, было доказательство Хокингом того, что двумерная поверхность, полученная пересечением горизонта стационарной черной дыры с поверхностью Коши, Должна иметь топологию S2. Это доказывается тем, что если она име- ла Другую топологию, то можно было бы деформировать ее в J~(J*) таким образом, что расширение в выходящих нулевых геодезических всюду удовлетворяет условию в < 0. Это противоречит утверждению 12.2.4. Детали доказательства можно найти в книге (Hawking and Ellis 1973)(см. также работу (Gannon 1976) для некоторых результатов в нестационарном случае.) Действительно, до начала 1970-х решения Керра были единственно извест- Ыми стационарными, нестатическими асимптотически плоскими вакуумными ре- униями. Как обсуждалось в разд. 7.1 и 7.4, большой прогресс был в получении °"Щих стационарных, осесимметричных вакуумных решений, но все равно мы давки от получения решений в явном виде, чтобы определить, представляют ли они с°бой черные дыры.
460 Глава 12. Черные дырь Следующий шаг в доказательстве единственности, также припал, лежащий Хокингу, состоит в демонстрации того, что стационарна^ вакуумная черная дыра должна быть статической или осесимметрич- ной. Во-первых, заметим, что в стационарном пространстве-времени содержащем черную дыру, изометрия временных трансляций должна оставлять горизонт инвариантным. Следовательно, поле Киллинга £а должно быть касательным к горизонту и, следовательно, всегда должно быть пространственноподобным или нулевым на горизонте. Далее должна выполняться одна из следующих возможностей: (i) g пространстве-времени нет эргосферы, т.е. стационарное поле Киллинга £а всюду времениподобное или нулевое вне черной дыры. В этом случае £° должно быть нулевым на горизонте, (ii) Имеется эргосфера но не пересекается с горизонтом и £а является нулевым на горизонте. (Ш) Присутствует эргосфера и пересекает горизонт, как в случае керровской черной дыры. В этом случае £а является пространственно- подобным на (части) горизонте. В случае (i) обобщение теоремы Лих- неровица (Lichnerowicz 1955) устанавливает, что пространство-время должно быть статическим (Hawking and Ellis 1973). При некоторых дополнительных предположениях результаты, полученные Хайчеком (Hajicek 1973), показывают, что внешняя граница эргосферы в стационарном пространстве-времени всегда должна пересекать горизонт. Поэтому возможность (ii) не реализуется. Убедительные аргументы против случая (ii) также даны Хокингом и Эллисом (Hawking and Ellis 1973). Наконец, в случае (in) Хокинг показал существование однопа- раметрической группы изометрий, которая коммутирует со стационарными изометриями, и чьи орбиты на горизонте совпадают с нулевыми геодезическими, генерирующими горизонт. Для этого были использованы свойства горизонта в статическом пространстве-времени и аналитичность стационарных вакуумных решений (Muller zum Hagen 1970). Таким образом, получаем поле Киллинга ха> отличное от ^а> с за" мкнутыми орбитами, т.е. аксиальное поле Киллинга5. Детали этого доказательства имеются в книге (Hawking and Ellis 1973). 5Доказательство того, что стационарная нестатическая черная дыра должна быть осесимметричной, справедливо в случае, когда некоторое распределение материи помещается вне вращающейся черной дыры. Это приводит к кажущемуся парадоксу, поскольку можно было бы ожидать, что "удержание на месте" неосе- симметричного распределения материи далеко от черной дыры приведет к стационарному неосесимметричному пространству-времени. Разрешение этого парадокса состоит в том, что распределение материи производит эффективное "приливное трение", заставляя черную дыру "уменьшить вращение" и стать нестационарно до тех пор, пока она не достигнет конечного статического состояния. Обсужден*1 этого процесса имеется в работе (Hawking and Hartle 1972).
j 2 3. Заряженные черные дыры Керра 461 Случай статической, вакуумной, топологически сферической черной дыры был проанализирован Израэлем (Israel 1967). Он доказал, т0 единственными такими черными дырами являются решения Шва- шиильда. В доказательстве были сделаны некоторые дополнительные предположения, но наиболее значительное из них о том, что все поверхности постоянного значения £°£а топологически являются сферами, было исключено в работах (Muller zum Hagen, Robinson and Seifert 1973) и (Robinson 1977). Наконец, случай стационарной, осесимметричной, вакуумной топологически сферической черной дыры был проанализирован Картером (Carter 1971) и Робинсоном (Robinson 1975) с использованием методов, описанных в разд. 7.1, для приведения уравнений Эйнштейна и граничных условий для черной дыры к относительно простой форме. Они доказали, что все стационарные, осесимметричные черные дыры однозначно характеризуются двумя параметрами, которые появляются из граничных условий. Поскольку решения Керра исчерпывают все возможные величины этих параметров, то они являются единственно возможными стационарными осесимметричными черными дырами. Вышеизложенные результаты были обобщены на случай электровакуума. Теорема Хокинга для сферической топологии стационарной черной дыры остается применимой, поскольку она требует только выполнения условия энергодоминантности для материи. Доказательство того, что стационарная черная дыра без эргосферы должна быть статическим обобщением на электровакуумный случай (Carter 1973) и того, что аксиальное поле Киллинга существует, если £а является про- странственноподобным на горизонте, зависит только от общего вида уравнений (10.1.21) и поэтому также применимо для электровакуумного случая. Теорема Израэля была обобщена, и было показано, что единственно возможными статическими, электровакуумными черными дырами являются решения Райсснера - Нордстрема (Israel 1968). Наконец, Мазур (Mazur 1982) и Бантинг (Bunting, неопубликовано) °бобщили доказательство Картера и Робинсона о единственности решения Керра и показали, что заряженные керровские решения (вме- Сте с их обобщениями, обладающими магнитным зарядом, которые получаются применением дуального вращения к электромагнитно заряженному керровскому решению) являются единственными, осесим- Метричными электровакуумными решениями. Дальнейшие обобщения На случай присутствия других типов классических полей вокруг чер- ^°Й дыры рассматривались в работах (Bekenstein 1972, Hartle 1972, eitelboim 1972). Кроме этого было дано множество примеров (см., ^пример, (Wald 1972a)) для иллюстрации того, как в конечном со-
462 Глава 12. Черные Дыры стоянии черной дыры, получающейся в результате гравитационного коллапса, теряется вся информация о коллапсирующем теле, за ис~ ключением его массы, углового момента и заряда. 12.4 Извлечение энергии из черных дыр По определению черная дыра является "областью неубегания". ц3 черной дыры невозможно извлечь материальное тело или световой луч. Поэтому было большой неожиданностью, когда Пенроуз (Penrose 1969) заметил, что можно извлекать энергию из черной дыры, имеющей эргосферу. Механизм, предложенный Пенроузом, можно понять следующим образом. Поле Киллинга £°, которое асимптотически становится временной трансляцией на бесконечности, является простран- ственноподобным на эргосфере. Поэтому для покоящейся частицы с 4-импульсом ра = тиа энергия Е = -ра£а (12.4.1) не обязана быть положительной на эргосфере. Таким образом, заставляя черную дыру поглощать частицу с отрицательной полной энергией, мы можем извлекать энергию из черной дыры! Чтобы это увидеть в деталях, предположим, что мы в нашей лаборатории дадеко от черной дыры бросаем частицу в черную дыру. Если мы обозначим 4-импульс этой частицы через р%, то ее полная энергия, измеренная в лаборатории, Е0 = -Р^а. (12.4.2) При свободном падении в черную дыру Ео будет оставаться постоянной. Предположим, что когда частица входит в эргосферу, мы договариваемся с помощью, например, взрывчатки и таймера разбить ее на две части, как показано на рис. 12.7. По закону сохранения энергии- импульса имеем pa0=Pl+P2, (12-43) где Pi и р% являются 4-импульсами двух кусков. Сворачивая уравнени (12.4.3) с £а, получаем Е0 = Ег + Е2. (12-4-4) Однако внутри эргосферы мы можем сделать разбиение так, чтоо один из фрагментов имел бы отрицательную полную энергию Ег<0. (12-45)
Извлечение энергии из черных дыр 463 Эргосфера Рис 12.7. Диаграмма, иллюстрирующая процесс Пенроуза извлечения энергии и3 керровской черной дыры Таким образом, если другая часть возвратится в лабораторию свободным движением (т.е. по геодезической), то мы получим энергию Еч большую, чем первоначальная энергия Е$. В случае керровской черной дыры массой М с а ф 0 можно явно проверить, что процесс разрушения может быть сделан так, что второй фрагмент действительно улетел на бесконечность. Также можно проверить, что часть с отрицательной энергией всегда падает в черную дыру. Таким образом, в конце процесса имеем в лаборатории энергию Ео 4- \Е\\, и масса черной дыры должна быть уменьшена М — \Е\\. Поэтому энергия \Е\\ была извлечена из черной дыры! Как много энергии можно извлечь таким образом из керровской черной дыры? Как мы кратко покажем ниже, процесс извлечения энергии является ограниченным, поскольку частицы с отрицательной энергией, которые попадают в черную дыру, также приносят отрицательный угловой момент, т.е. момент противоположный моменту черной дыры. В конце концов угловой момент J = Ma черной дыры уменьшится до нуля, хотя масса останется конечной. Однако, когда «7 = 0, эргосфера исчезает, и нет возможности для дальнейшего извлечения энергии. Чтобы увидеть в деталях этот предел извлечения энергии, мы используем то, что поле Киллинга ха-> определенное уравнением (12.3.20), является направленным в будущее на горизонте. Следовательно, для Любой частицы, входящей в черную дыру (это включает всю отрица- ельную энергию частицы), имеем ^е £ — paipa и Пя определяется уравнением (12.3.19). Таким образом, 0 > раХа = Ра(£а + ПНфа) = -Е + ПНЬ, (12.4.6) ы Случаем L < E/QH. (12.4.7) подтверждает вышеприведенное утверждение о том, что части- 0тРицательной энергией, попадающая в черную дыру, приносит
464 Глава 12. Черные дырЬ1 отрицательный угловой момент. После того как черная дыра "проглотит" частицу, она перейдет в керровское решение с измененными параметрами SM = E,SJ = L. Поэтому из уравнения (12.4.7) изменение параметров черной дыры ограничено соотношением SJ < 6М/ПН1 (12.4.8) что можно переписать таким образом (Christoulou 1970): SMirr > 0, (12.4.9) где неприводимая масса М{ГГ определяется равенством М^ = \\М2 + (М4 - J2)1/2]. (12.4.10) Обращая уравнение (12.4.10), получаем > М?г. (12.4.11) Таким образом, масса черной дыры не может стать ниже начальной величины Mirr, вследствие процесса Пенроуза. Если мы начинаем с кер- ровской черной дыры с массой Mq и угловым моментом Jo, то, предполагая даже выполнение равенства в уравнении (12.4.7), можно извлечь энергию Mo — Mjrr(Mo, Jo), и угловой момент черной дыры станет нулевым. Поскольку мы можем подойти произвольно близко к равенству в уравнении (12.4.7), то, используя процесс Пенроуза, мы можем извлечь из черной дыры энергию, бесконечно близкую к Mq - Mirr- Можно интерпретировать величину Mo—Mirr как вращательную энергию черной дыры. Для черной дыры, вращающейся с максимальной скоростью Jo = Mq, эта величина составляет (1 — 1/\/2) « 29% от массы-энергии черной дыры. Универсальную природу предела извлеченной энергии, описываемую уравнением (12.4.11) и полученную выше только для специфического процесса, предложенного Пенроузом, можно увидеть из теоремы площадей (12.2.6). Площадь горизонта керровской черной дыры имеет вид - j = f{r\ + о?) sin 0ded<t> =
9 4. Извлечение энергии из черных дыр 465 = 4тг(г£ + а2) = = 16тгМ?гг. (12.4.12) Таким образом, из теоремы площадей мы получаем совершенно общий пезультат, что М{ГГ не может быть уменьшена, и отсюда следует, что приведенный выше предел извлеченной энергии справедлив для всех процессов. Согласованность теоремы площадей, доказанной из общих, абстрактных аргументов, с результатом (12.4.11), полученным расчетом специального процесса для керровской черной дыры, дает дополнительную эстетическую поддержку в пользу выполнимости первой гипотезы космической цензуры, которая используется в приведенных выше аргументах, когда мы предполагаем, что падающие частицы просто изменяют параметры черной дыры, а не преобразуют черную дыру в голую сингулярность. Необходимо подчеркнуть, что теорему площадей также можно использовать для получения интересного верхнего предела энергии, излученной в форме гравитационных волн, при столкновении двух черных дыр (Hawking 1971). Рассмотрим, например, начальные данные, представляющие две далеко разнесенные черные дыры Шварцшиль- да, находящиеся первоначально в "покое" с массами М\ и M2. (Для краткого обсуждения того, как в явном виде сконструировать такие данные, см. абзац после уравнения (10.2.39) разд. 10.2.) По-видимому, динамическая эволюция этих данных даст пространство-время, в котором две черные дыры падают друг на друга, сливаются, и "стабилизируются" в виде одной черной дыры массой М. Полная энергия, излученная в этом процессе, #rad = Mi + М2 - М. (12.4.13) Верхний предел для ЕГйд можно получить, замечая, что площадь начальной черной дыры Ai = Ai+A2 = Ш(М? + Ml). (12.4.14) Конечная площадь Af = 16тгМ2, (12.4.15) и по теореме площадей имеем Af > Ai. (12.4.16) используя уравнения (12.4.13)-( 12.4.16), получаем Erad <MX+M2- {Ml + Ml)1/2. (12.4.17)
466 Глава 12. Черные дыры В случае М\ — М2 это означает, что по крайней мере (1 - 1/\/2) ^ « 29% от первоначальной массы может излучиться. Численные pa(N четы (Smarr 1979) показывают, что гораздо меньше энергии, чем этот верхний предел, может реально излучиться в таком процессе. Хотя процесс Пенроуза очень важен для демонстрации того, какое, в принципе, максимальное количество энергии, разрешенное теоремой площадей, может быть извлечено из вращающейся черной ды, ры, процесс требует точного синхронизированного разрушения падающей частицы при релятивистских скоростях, и этот метод не является практически реализуемым (Bardeen, Press and Teukolsky 1972, Wald 1974c). Интересно, что существует волновой аналог процесса Пенроуза, известный как суперрадиационное рассеяние (Misner, неопубли- ковано, Zel'dovich 1972, Starobinskii 1973), который позволяет извлекать энергию из черной дыры относительно более простым способом. Если скалярная, электромагнитная и гравитационная волны падают на черную дыру, то часть волны ("проходящая волна") будет поглощаться черной дырой, а часть волны ("отраженная волна") будет уходить на бесконечность. Обычно проходящая волна будет переносить положительную энергию в черную дыру, а отраженная волна будет иметь энергию меньшую, чем падающая волна. Однако для волны вида ф = Кс[ф0{г,в)е-{»1е{т% где О < ш < тПн, • (12.4.18) проходящая волна будет переносить отрицательную энергию в черную дыру (аналогично отрицательной энергии части частицы в процессе Пенроуза), и отраженная волна возвратится на бесконечность с большей амплитудой и энергией, чем первоначальная волна. Наиболее легко это показать для случая скалярных волн. Сворачивая тензор натяжений (4.3.10) скалярного поля Клейна - Гордона ф с времениподоб- ным полем Киллинга fa на фоне Керра, мы получаем "ток энергии" За = -ТаьС (12.4.19) который сохраняется, поскольку VaJa = -(V°Ta6)f6 - Таь¥а£ь = 0- Следовательно, если мы интегрируем Va Ja по области К пространства-времени, изображенной на рис. 12.8, то мы находим, используя закон Гаусса, что разность между входящей и выходящей энергиями (т-е* проинтегрированный поток J° по "большой сфере") равна проинтегрированному по горизонту потоку Ja. Однако на горизонте среднее по времени от потока дается выражением
Извлечение энергии из черных дыр 467 Горизонт рис. 12.8. Пространственно-временная диаграмма, показывающая область К, по которой интегрируется VaJa = 0 для того, чтобы получить вывод, касающийся суперрадиационного излучения. Здесь пространственноподобная гиперповерхность Ег получается "трансляцией по времени" поверхности Ei на время Д£, и времен и подобная гиперповерхность S представляет собой "большую сферу" на бесконечности. Интеграл от Jana no S представляет собой поток энергии вне К на бесконечность (т.е. выходящая минус входящая энергии) в течение времени Д£, в то время, как интеграл от Jana по горизонту представляет собой поток энергии в черную дыру. (Показаны подходящие направления тга на каждой части границы.) Однако для волны с временной зависимостью е-*"' интегралы по Ei и Ег сокращаются вследствие трансляционной симметрии по времени. Следовательно, интеграл от Jana no S равен минус интеграл от Jana по горизонту (jana) = -(jaX°> = (таЬХЧь) = ((хаъаФ№ьЪьФ)) = = hs)(u - тПн)\ф0\2, (12.4.20) где п° = — ха (ха дается уравнением (12.3.20)) является подходяще направленной нормалью к горизонту. (Слагаемое в Таь, пропорциональное ga6, не дает вклада, поскольку ха€а = 0 на горизонте.) Поэтому в области частот (12.4.18) поток энергии через горизонт отрицателен, ^следовательно, получается явление суперрадиации. Этот вывод также можно получить, рассматривая "поток числа частиц" f = -% (фЧаф - фЧаф) (12.4.21) ^я комплексного поля фое~гш1егтпф. Этот поток сохраняется вследствие выполнения уравнений Клейна - Гордона. И снова, -jaXa являйся отрицательной величиной в области (12.4.18), и появляется явление суперрадиации. Существование суперрадиации электромагнитных волн в области ^•4.18) можно доказать аналогичным способом, рассматривая ток
468 Глава 12. Черные дырЬ1 энергии — Таь£а или (калибровочно неинвариантный) "поток числа чн~ стиц", аналогичный (12.4.21), хотя доказательство отрицательности проинтегрированного потока тока энергии через горизонт менее прямолинейно (см. задачу 5). В гравитационном случае мы также можем образовать "эффективный ток энергии" (l/87r)G^;£b, где G^ - тец. зор Эйнштейна второго порядка (см. разд. 4.4Ь для формулы G^ для возмущений на фоне плоского пространства-времени) и сохраняющийся "ток числа частиц". Формула для тока энергии сложна и ни тот ни другой объект не являются калибровочно инвариантными. Однако можно обойти эти проблемы, работая вместо этого с уравнением полученным Тьюколски для переменных Фо или Ф4 и рассмотренным в разд. 12.3. Следуя таким путем, можно установить суперрадиацию в области (12.4.18) для гравитационных волн прямыми вычислениями (Teukolsky and Press 1974). Суперрадиация электромагнитных волн также доказывается с использованием уравнения Тьюколски для Ф0 и Фг. Численные вычисления (Teukolsky and Press 1974) показали, что наибольший эффект суперрадиации для гравитационных волн имеет место с коэффициентом усиления до 1,38 для керровской черной дыры при а = М. Возникновение суперрадиации в режиме (12.4.18) также можно увидеть непосредственно из теоремы площадей (Bekenstein 1973a). Для волны с частотой ш и азимутальным числом га на стационарном осе- симметричном фоне отношение углового момента потока к потоку энергии на бесконечности: С/£ = т/и. (12.4.22) Поэтому вследствие сохранения энергии и углового момента при падении такой волны на черную дыру изменение энергии 6М и углового момента 8 J черной дыры должны быть связаны соотношением SJ/SM = т/и. (12.4.23) Однако в области (12.4.18) имеем SJ/SM > 1/Пя. (12.4.24) Если SM > О, то это может нарушить уравнение (12.4.8), которое вследствие уравнений (12.4.9) и (12.4.12) может нарушить теоремУ площадей. Следовательно, мы должны получить SM < О, т.е. должна появиться суперрадиация, когда О < ш < гаПя- Интересно, что фермионные поля не обнаруживают суперрадиа~ ции (Unruh 1973, Guven 1977). "Ток числа частиц" ja, связанный с
12 5- Черные дыры и термодинамика 469 нейтрино или полями Дирака (см. гл. 13), является явно временипо- яобным или нулевым вектором, и, следовательно, jana является явно неотрицательной величиной на горизонте для всех волн, включая находящиеся в области (12.4.18). Поэтому отраженная волна никогда не имеет большую амплитуду, чем падающая. В этом случае аргументы предыдущего абзаца неприменимы, поскольку тензор натяжений этих полей перестает удовлетворять слабому энергетическому условию, и теорема площадей не выполняется. Поведение бозонных и фермионных полей, падающих на керров- скую черную дыру с а ф 0, находится в очень близкой математической аналогии с хорошо изученным эффектом в негравитационной физике, известным как "парадокс" Клейна. Если поле Клейна - Гордона заряда Q и массой М в одном пространственном измерении является падающим на электростатический потенциал V такой, что V —► О при х -♦ -оо, но V —> Vo > 2M/Q для х —> +оо, тогда при и + М < QV0 отраженная волна имеет большую амплитуду и энергию, чем падающая волна. Для поля Дирака отраженная волна будет меньше, чем падающая волна ("ток числа частиц" Дирака всегда времениподобный), но проходящая волна все же имеет отрицательную кинетическую энергию (Klein 1929). В квантовой теории поля интерпретация парадокса Клейна такая, что и в бозонном и фермионном случаях спонтанно рождаются пары частица - античастица в сильном электромагнитном поле, связанном с потенциалом V. Когда присутствуют входящие частицы, появляется индуцированное излучение в бозонном случае, и в классическом пределе это ведет к большей "отраженной волны", чем полученной в классическом анализе. Близкая аналогия между парадоксом Клейна и рассеянием волн на керровской черной дыре наводит на мысль, что спонтанное рождение частиц должно появляться около керровской черной дыры. Действительно это имеет место, но мы оставим наше обсуждение этого явления до гл. 14. 12.5 Черные дыры и термодинамика Теорема площадей 12.2.6 утверждает, что в любом физически разрешенном процессе полная площадь черных дыр во Вселенной не мо- *&* уменьшаться, SА > 0. Этот закон имеет сильное сходство со вто- РЬ1м законом термодинамики, который утверждает, что в любом фи- Их*ески разрешенном процессе полная энтропия всей материи во Веерной не может уменьшаться, SS > 0. Может показаться, что эта ^алогия выглядит очень поверхностной. Теорема площадей является ^тематически строгим следствием общей теории относительности в
470 Глава 12. Черные дыр^ то время, как второй закон термодинамики не является строгим след, ствием законов природы, а скорее законом, который выполняется с вы, сокой вероятностью для систем с большим числом степеней свободы. Тем не менее мы покажем в этом разделе, что эта формальная аналогия второго закона термодинамики для черных дыр также распространяется и на другие законы термодинамики. Мы вернемся к данной проблеме в гл. 14, где будут представлены дальнейшие аргументы, показывающие, что соотношение между законами физики черных дыр и законами термодинамики имеет более фундаментальную природу. Нашей первой задачей является введение величины к, определенной на горизонте произвольной стационарной черной дыры (не обязательно вакуумной или электровакуумной во внешней области) и определение ряда ее свойств. Как подчеркивалось в конце разд. 12.3, для стационарной черной дыры существует поле Киллинга ха, которое является нормальным к горизонту черной дыры. Если х° не совпадает со стационарным полем Киллинга £а, то мы получаем в пространстве- времени аксиальное поле Киллинга фа, используя линейную комбинацию ха и £а- Поэтому в общем случае можно записать ха в виде Xa = £° + <W, (12.5.1) где (как и в случае керровской черной дыры (12.3.20)) постоянная ft# называется угловой скоростью горизонта. Поскольку горизонт является нулевой поверхностью, и ха ~ нормаль к горизонту, мы имеем ХаХа = 0 на горизонте, в частности, хаХа является постоянной на горизонте. Следовательно вектор Va(x6X6) также нормален к горизонту, и поэтому на горизонте существует функция к такая, что Va(x6X&) = -2к*а. (12.5.2) Вычислив производную Ли от уравнения (12.5.2) вдоль поля Киллинга £хк = 0, (12.5.3) т.е. к является постоянной на орбитах х°- Фактически, ниже мы Д°" кажем, что к является постоянной на горизонте, т.е. ее величина не изменяется от орбиты к орбите. Для заряженной керровской черной дыры величина к имеет вид Х°, мы находим, что {М2 - а2 - е2)1'2 к = (12.5.4) 2М[М + (М2 - а2 - е2)1/2] - е2' Мы можем переписать уравнение (12.5.2) в форме X6VaX6 = -ХЬЧъХа = "«Ха, ^^
л 5. Черные дыры и термодинамика 47^ 0 представляет собой просто уравнение геодезической в неаффинной параметризации. Поэтому к измеряет отклонение параметра Киллинга определенного соотношением XaVat; = 1, (12.5.6) от афФинного параметра Л вдоль нулевой геодезической, генерирующей горизонт. Если мы определим ка на горизонте соотношением ка = е-^х", (12.5.7) то получаем kbVbka = e-2"VVbX° - xVVbM] = 0, (12.5.8) т.е. вектор ка является параметризованной аффинным параметром вектором, касательным к нулевой геодезической, создающей горизонт. Это показывает, что на горизонте соотношение между аффинным параметром А и киллинговым параметром v имеет вид ^ ос tKV (12.5.9) QV и поэтому, если к ф О, то А ос eKV. (12.5.10) Поскольку вектор х° ортогонален горизонту, то по теореме Фробе- ниуса (см. прилож. В) получаем на горизонте XlaVbXc] = 0. (12.5.11) Используя уравнение Киллинга V^Xc = —Vcx&, имеем ХсУаХЬ = -2X[aVb]Xc (12.5.12) на горизонте. Сворачивая с Vax6, находим Xc(V°x6)(V0Xb) = -2(XaVV)(VbXc) = = -2KXbVbXc = = -2к2\с- (12.5.13) аким образом, мы получаем в явном виде простую формулу для к: к2 = -\(VaXb)(VaXb), (12.5.14) ^е все величины вычисляются на горизонте.
472 Глава 12. Черные дыры Уравнение (12.5.14) дает нам следующую физическую интерпретацию для к. Имеем всюду (т.е. не только на горизонте) 2(x[aVV1)(X[aVbXc]) = XaXa(VV)(VbXc) - 2(xeVV)(XaVbXc). (12.5.15) Поскольку Х[а^ьХс] = 0 на горизонте, то градиент левой стороны исчезает на горизонте. С другой стороны, из уравнения (12.5.2) следует Vb(xaXo) Ф 0 на горизонте при условии, что к ф 0. Следовательно по правилу Лопиталя левая сторона уравнения (12.5.15), деленная на XaXa> должна достигать нуля на горизонте. Поэтому, используя уравнение (12.5.14), получаем к2 = lim{-(x6V6xc)(xaVaXc)/xdXd}. (12.5.16) где "lim" означает предел приближения к горизонту. Далее ас = (x6V6xc)/(-X°Xa) (12.5.17) есть просто ускорение орбиты ха- Таким образом, имеем к = Ит(Уа), (12.5.18) где а = (асас)1^2 и V = (-Х°Ха)1^2- В случае статической черной дыры получаем \а = £°- Тогда V есть просто фактор красного смещения, и по задаче 4 гл. 6 Va есть просто сила, которая необходима для поддержания единичной массы в покое. Таким образом, к является предельной величиной этой силы на горизонте, т.е. это поверхностная гравитация черной дыры. (Конечно, локальная приложенная сила а становится бесконечной на горизонте.) Для вращающейся черной дыры $1н ф 0 пробная масса не может поддерживаться стационарно по отношению к бесконечности около черной дыры, но мы все же будем называть к поверхностной гравитацией. Используя уравнения (12.5.7) и (12.5.11), находим на горизонте fc[aV6]A:c = -e -2kv ^VaX6 + X[aV6](/™) (12.5.19) Сворачивая уравнение (12.5.19) с двумя векторами ть,пс, касательными к горизонту (т.е. x°ma = X°no = 0), получаем mbncVbkc = 0, (12.5.20) т.е. в обозначениях разд. 9.2 имеем Vlkb = 0. (12.5.2D
12 5. Черные дыры и термодинамика 473 Поэтому расхождение 0, тензор вращения и)аь и сдвиг даъ нулевой геодезической, генерирующей горизонт, исчезают. Из уравнений (9.2.32) и (9.2.33) мы видим также, что на горизонте Rabkakb = 0 (12.5.22) C^J?kd = 0. (12.5.23) Последнее уравнение утверждает, что ка является главным нулевым вектором тензора Вейля (см. разд. 7.3). Фактически, мы увидим ниже, что ка должен быть двойным главным нулевым вектором. Необходимо заметить, что большинство выписанных выше уравнений, в частности соотношение (12.5.2), определяющее к, выполняются только на горизонте. Поэтому мы не можем просто применить Va к, скажем, уравнению (12.5.2), поскольку мы можем дифференцировать уравнение (12.5.2) только в направлениях, касательных к горизонту. Если бы горизонт был пространственноподобной поверхностью, то мы могли бы применять /ia6Va ко всем уравнениям, где оператор проектирования Наь был определен уравнением (10.2.10). Однако горизонт является нулевой поверхностью, и нет естественного оператора проектирования, связанного с ним. Тем не менее тензор eabcdXd, где eabcd— пространственно-временной элемент объема (см. прилож. В), является касательным к горизонту, поскольку (eabcdXd)Xc = 0. Таким образом, мы можем применить X[d^c] K любому такому уравнению. Далее мы докажем, что поверхностная гравитация к является постоянной на горизонте событий. Применяя Xld^c] к уравнению (12.5.5), получаем XaX[c*Vc]/C + nX[d^c)Xa = X[dVc](x6V6Xa) = = (X[dVc]x6)(V6Xa) + X6X[dVc] VbXa = = (X[dVc)X6)(VbXa) - XbRba[ceXd)Xe, (12.5.24) гДе на последнем шаге было использовано уравнение (С.3.6) из при- л°ж. С. Однако, используя уравнения (12.5.12) и (12.5.5), первое сла- гаемое в правой стороне последнего равенства уравнения (12.5.25) (X[dVc)x6)(V6Xa) = "2(x6VdXc)V6Xa = 1 = ~2^XaVdXc = = *X[dVc]Xa (12.5.25)
474 Глава 12. Черные дырь сокращает второе слагаемое в левой стороне уравнения (12.5.24). т^ ким образом, получаем XaX[dVc]K = XbRab[cXd\Xe. (12.5.26) С другой стороны, если мы применим X[d^e) K уравнению (12.5.12) получаем (X[dVe]Xc)VaX6 + XcX[dVe] VaX6 = = -2(x[dVe]X[a)V6]Xc _ 2(x[dVelV[bX|c|)Xe]. (12.5.27) Применяя повторно уравнение (12.5.12), мы находим, что первое слагаемое в левой стороне уравнения (12.5.27) сокращает первое слагаемое в правой стороне. Таким образом, используя уравнение (С.3.6), получаем -XcRab[eXd\Xf = 2X[aRb]c[efXd)Xf' (12.5.28) Если мы умножим на g°e и свернем по с и е, то левая часть исчезает, и мы находим -X[aRb]fXfXd = X[aRb\JxcXf. (12.5.29) Слагаемое в правой стороне этого уравнения имеет такую же форму, как и в правой стороне уравнения (12.5.26). Поэтому сравнение этих уравнений дает X[<fVc]/c = -X[dRcfxf- (12.5.30) Вплоть до этого момента мы нигде не использовали уравнения Эйнштейна. Теперь мы покажем, что уравнения Эйнштейна вместе с условием энергодоминантности (определенном в разд. 9.2) приводят к тому, что правая сторона уравнения (12.5.30) исчезает. А именно, условие энергодоминантности утверждает, что — Т%хЬ должен быть направленным в будущее времениподобным или нулевым вектором. Но уравнения Эйнштейна с уравнением (12.5.22) предполагают, что ТаъХЪХа = 0. Это означает, что — Т%хЬ должен указывать в направлении х°> т.е. Х[сТа)ъХЬ — 0- Следовательно, используя снова уравнения Эйнштейна, мы находим, что правая сторона уравнения (12.5.30) также должна исчезать, и мы заключаем, что X[dVc]K = 0, (12.5.31) и это означает, что к является постоянной на горизонте. Заметим в этой связи, что исчезновение обеих частей уравнения (12.5.29) означа' ет, вследствие уравнения (3.2.28), что X[aCb]cdfXcX* = 0? т-е- Xя явлЯ' ется повторяющимся нулевым вектором тензора Вейля на горизонте-
Черные дыры и термодинамика 475 Теперь можно получить простую формулу для массы стационар- г0 осесимметричного пространства-времени, содержащего черную !РУ (Bardeen, Carter and Hawking 1973). Пусть E является асимпто- чески ПЛоской пространственно-плоской гиперповерхностью, кото- ая пересекает горизонт Н на 2-сфере W, которая образует границу Е. Вычисления, которые привели к уравнению (11.2.10) предыдущей гла- -I изменяются только присутствием граничного слагаемого, вслед- ствиеЯ М = 21^{таЬ - \тёа^ naZbdV -^l tabcdVcZd- (12.5.32) Мы можем вычислить этот граничный член, используя уравнение (12.5.1) / €a6cdVc£d = / eabcdVcXd - «я / eabcdVc^d = Jn Jn Jn = I eabcdVcXd ~ ltonHJH, (12.5.33) Jn где мы можем интерпретировать J# = (1/1б7г)$neabcd4ci)d как угловой момент черной дыры (см. задачу 6 гл. 11). С другой стороны, мы можем выразить элемент объема еаь на Н следующим образом: баб = eabcdNcXd, (12.5.34) где Na является "входящей" направленной в будущее нормалью к Н, нормированной так, что Na\a = — 1. Таким образом, мы имеем Seabed VV = NeXfeabefeabcdVcxd = -*NcXdVcXd = -4к, (12.5.35) и, следовательно, / eabcdVcXd =\f (eefeefcdVcxd)eab = -2кА, (12.5.36) Jn l Jn где А = Jn eab является площадью горизонта событий. Поэтому мы получаем следующую формулу для М: М = 2 J (таЬ - \твЛ па?вУ + ^кА + 2flHJH. (12.5.37) Большой интерес для развития аналогии между законами физики ^Рных дыр и законами термодинамики представляет вывод дифференциальной формулы для М, т.е. формулы, описывающей как из- еняется М при малых, стационарных, осесимметричных изменени- х в решении. Мы можем использовать свободу в применении диффеоморфизмов к решениям, чтобы обеспечить неизменность £° и гра
476 Глава 12. Черные дь, и локализацию на горизонте многообразия при изменении метриКи пространства-времени. Для простоты мы рассмотрим только вакуум ный случай6 Таь = 0- Обобщение дифференциальной формулы для массы на случай жидкой материи вне черной дыры было дано в ори^ гинальной статье (Bardeen, Carter and Hawking 1973), и дальнейшие обобщения были сделаны Картером (Carter 1973). Формулу для 6М в вакуумном случае можно получить вариацией (12.5.37) SM = ^{Лбк + к5А) + 2{JHSnH + VhSJh). (12.5.38) Однако это не является требуемой формулой. Другое выражение для SM можно получить следующим образом. Во-первых, заметим, что в любом пространстве-времени, если va и wa коммутируют и удовлетворяют условию Vav° = Vawa = 0, то Va(v[<VI) = 0 (12.5.39) и, следовательно, V[a(€bc]<feV<V) = 0. (12.5.40) Таким образом, применяя теорему Стокса к трехмерному объему, ограниченному двумя сферами S и S', мы найдем, что fscabcdvcwd = = Is' €abcdvcwd • Используем этот общий результат, выбирая в качестве S "сферу на бесконечности", а в качестве S' сферу Н на горизонте, wa = f°, и </> = Уь(7а6-£°Ь7), (12.5.41) где 7аЬ - возмущенная метрика и 7 = 5afe7a6- Вышеприведенные требования удовлетворяются векторами £а и va, поскольку для любого стационарного возмущения имеем £$va = 0 (т.е. va и £° коммутируют), Va£a = 0 по уравнениям Киллинга, и Vava = 0 есть просто след возмущенных вакуумных уравнений Эйнштейна R = 0 (см. (7.5.15))- Таким образом, мы находим / €abcd£dVe(7ce - gcei) = [ €a6cd^Vc(7ce - gfe-y). (12.5.42) Js Jn Если использовать АДМ формулу или выражение Комара для полной массы (уравнения (11.2.14) и (11.2.9)), то левая сторона вычисляется и равна SttSM. Гораздо более долгие вычисления показывают, чт° 6Фактически, как обсуждалось в конце разд. 12.3, в вакуумном случае еди ственно возможной черной дырой является метрика Керра, и поэтому наша Ф0^ мула (12.5.44) может быть выведена простой проверкой того, что она выполняв для керровской метрики. Однако, как отмечается в тексте, вывод, который даем, обобщается на случай присутствия материи вне черной дыры.
Черные дыры и термодинамика 477 Начало "рулевой Таблица 12.1. Черные дыры и термодинамика Контекст Термодинамика В тепловом равновесии Т постоянна Черные дыры Вне горизонта стационарной черной дыры к постоянна dM= ±KdA + QHdJ dE = TdS+ (члены, связанные с работой) Во многих процессах 6S ^ О Во многих процессах ЗА ^ О Третье В физических процессах невозможно достижение Т = О В физических процессах невозможно достижение /с = О правая сторона равна — 2А6к — 16itJhSQh (cm. Bardeen, Carter, and Hawking 1973). Таким образом, мы получаем SM = -—AS к - 2JHSQH. 47Г (12.5.43) Складывая уравнения (12.5.38) и (12.5.43), получаем требуемую формулу (12.5.44) SM = —K,6A + nH6JH. 07Г Близкая математическая аналогия между законами физики черных дыр, полученными выше, и обычными законами термодинамики показана в табл. 12.1. В начале этого раздела мы подчеркивали, что теорема площадей черных дыр аналогична второму закону термодинамики. Теперь мы получили формулу (12.5.44) для SM, которая находится в близкой аналогии с первым законом термодинамики. В частности, слагаемое аналогично "слагаемому, связанному с работой" PSV в первом законе. Действительно, для обычного вращающегося тела слагаемое в Форме QSJ может присутствовать в термодинамической формуле. Слагаемое 8А появляется в уравнении (12.5.44) таким же способом, . к &S появляется в первом законе термодинамики, за исключени- м того, что оно умножается на (1/87г)к, а не на Г, и к играет роль емпературы в законах черных дыр. Но мы уже доказали, что к удо- 8летворяет важному свойству, аналогичному свойству температуры в УЛев°м законе термодинамики: она однородна в "равновесной" (т.е. СтаЦионарной) черной дыре. Наконец, мы видим из уравнения (12.5.4), 0 Для заряженной керровской черной дыры к исчезает только в "экс- мальном" случае М2 = а2 + е2. Явные вычисления (см., например,
478 Глава 12. Черные дырь. (Wald 1974a)) показывают, что чем ближе мы находимся к "экстра мальной" черной дыре, тем тяжелее приблизиться еще, по аналогии с третьим законом термодинамики. (Однако аналог альтернативной вер, сии третьего закона термодинамики, который гласит, что 5 —► О при Т —► 0, не выполняется в физике черных дыр, поскольку А остается конечной при к —* 0.) Отметим, что соответственными величинами в табл. 12.1 являются Е *-► М, Т «-* а/си S «-+ (1/87га)Л, где а - постоянная. Намек на то, что соотношение между законами черных дыр и законами термодинамики должно быть более, чем простая аналогия, происходит из факта, что Е и М не являются просто аналогичными в формулах, а представляют одинаковую физическую величину - полную энергию. Однако термодинамическая температура черной дыры в классической общей теории относительности является абсолютным нулем, поскольку черная дыра является абсолютным поглотителем и ничего не испускает. Поэтому понятно, что к не может физически представлять температуру. Тем не менее в 1974 году Хокинг открыл, что эффект квантового рождения частиц приводит к эффективному "излучению" частиц из черной дыры с чернотельным спектром и температурой Т = Нк/2ж. Поэтому к физически представляет термодинамическую температуру черной дыры! Это наводит на мысль, что соотношение .между законами черных дыр и термодинамикой могут быть более, чем аналогия. Законы черных дыр, выписанные в табл. 12.1, могут быть в точности обычными законами термодинамики, примененными к черным дырам. Этот вопрос мы будем обсуждать дальше, в последнем разделе гл. 14. Задачи 1. Поскольку наблюдатель вне черной дыры не лежит внутри причинного будущего черной дыры, то такой наблюдатель буквально не может "видеть" черную дыру. Как следует из рис. 6.11» наблюдатель, заглядывающий в область, где имеется гравитационный коллапс, видит, в принципе, коллапсирующую материю на стадии, когда она находится вне черной дыры. Рассмотрим частицу на поверхности коллапсирующего тела, которая падает в черную дыру Шварцшильда. Покажите, что для любой гладкой времениподобной кривой dU/dr должно иметь конечное, нену-ле* вое значение на горизонте, где U обозначает координату КрУс' кала (6.4.26), и г - собственное время вдоль кривой. Покажите»
5 Черные дыры и термодинамика 479 таким образом, что, если частица радиально испускает наружу фотоны с постоянной скоростью (по отношению к ее собственному времени), то скорость, с которой фотоны будут получены удаленным статическим наблюдателем, изменяется как е~*/4М на поздних временах, где t шварцшильдовое координатное время (« собственное время наблюдателя). Частота каждого фотона также будет иметь красное смещение на этот фактор. Поскольку 4М «2х 10~5 (М/М0), то это означает, что в области, где имеется коллапс, очень быстро появляется черная дыра (Ames and Thorne 1968). 2. а) Пусть (M,gab) является пространством-временем с вектором Киллинга wa и предположим, что Аа является векторным потенциалом, согласованным с этой симметрией, т.е. £wAa = 0. Показать, что для частицы заряда q, движущейся под действием силы Лоренца (4.3.2), wa(mua + qAa) является постоянной вдоль мировой линии частицы. Ь) Получите постоянные движения Е и L для движения заряженной частицы в заряженном керровском пространстве-времени. Используйте этот результат для вывода эффективного потенциала для радиального движения в экваториальной плоскости, обобщая тем самым уравнение (12.3.25) на заряженный случай. 3. Покажите, что энергия (определенная выше в задаче 2) частицы массой т и зарядом </, поддерживаемая в покое на радиусе г вне черной дыры Райсснера - Нордстрема массой М и зарядом е, есть Е = т(1 — 2M/r + e2/r2)1/2 + qe/r. Следовательно, если q имеет противоположный к е знак, то мы будем иметь Е < 0 для г, достаточно близких к г+. Поэтому мы можем извлекать энергию из черной дыры Райсснера - Нордстрема, опуская заряженную частицу к горизонту и затем бросая ее в черную дыру. Двигаясь так же, как и при выводе уравнения (12.4.9) в керровском случае, получите верхний предел для количества энергии, которая может быть извлечена в этом процессе (Christodoulou and Ruffini 1971). Покажите, что этот верхний предел находится в согласии с полученным из теоремы площадей. 4. Предположим, что далеко разнесенные керровские черные дыры с параметрами (Mi, Ji) и (М2, J2) первоначально были в покое в осесимметричной конфигурации, т.е их оси вращения были выстроены вдоль направления между ними. Предположите, что эти черные дыры падали друг на друга и объединялись в одну
480 Глава 12. ЧерныедЬ| черную дыру. Поскольку угловой момент не может излучиться & осесимметричном пространстве-времени (см. задачу 6 гл. 11), То конечная черная дыра будет иметь угловой момент J = Jx -f j Выведите верхний предел для энергии, излученной в этом про^ цессе. Заметьте, что этот верхний предел выше, когда J\ и J2 ан. типараллельны, чем когда они параллельны. Это означает сущ^ ствование гравитационной "спин-спин" силы, которая является притягивающей для антипараллельных спинов. (Существование силы корректной величины и знака можно непосредственно по, казать из уравнений движения для вращающегося пробного тела (Wald 1972b).) 5. а) Пусть Fab является решением уравнений Максвелла (4.3.12), (4.3.13) в пространстве-времени с полем Киллинга wa. Покажите что £wFab = -2V[a(Fb]cti;c). b) Покажите, что усредненный по времени поток максвелловско- го тока энергии Ja = — Т°ь£6, пересекающий горизонт керровской черной дыры, является отрицательным, и поэтому в данном случае имеет место суперрадиация электромагнитных волн. (Подсказка: используйте часть (а) для того, чтобы связать Fab£b и
рдава 13 Спиноры В гл. 4 мы кратко ответили на вопрос о том, какие типы величин возникают в физических законах. Мы отметили, что тензорные поля, те. мультилинейные отображения, связанные с каждой пространственно-временной точкой и переводящие векторы и дуальные векторы в числа, представляют собой довольно общий класс математических объектов, и это позволяет объяснить, почему большинство физических величин в пространстве-времени представлены тензорными полями. В первом разделе этой главы мы более систематически вновь исследуем этот вопрос, используя "ковариантность" физических законов в специальной теории относительности. Это послужит побудительной причиной к определению и изучению свойств более общих объектов, называемых спинорными полями. В сущности спинор в пространственно-временной точке х представляет собой упорядоченную пару комплексных чисел, привязанных к ортонормированному базису касательного пространства Vx, которая преобразуется специальным образом при всевозможных изменениях базиса. Самой необычной чертой этого закона преобразования, резко отличающегося от аналогичных законов преобразования обычных тензоров, является то, что спинор изменяет знак, когда базис совершает поворот на угол 27Г вокруг фиксированной оси и тем самым возвращается к своей начальной конфигурации. Таким образом, численные значения спинора в данном ортонормированном базисе не могут быть непосредственно измерены, поскольку в этом базисе спинор всегда имеет два различных значения. Однако вещественные билинейные произведения двух комплексно сопряженных спиноров могут быть отождествлены с обычными векторами и поэтому имеют непосредственную физическую трактовку. Оказывается, что произвольный Изотропный вектор может быть представлен тензорным произведени- ем спинора на его комплексное сопряжение. В этом смысле спинор м<>Жно рассматривать как "квадратный корень" из изотропного вектора. Наиболее естественно спиноры возникают в контексте квантовой ^ории. В квантовой механике численное значение волновой функции ^ не является физически измеряемой величиной, поскольку ф и ега,ф РЗДставляют одно и то же физическое состояние. Следовательно, не
482 Глава 13. Спинор] возникает противоречий при трактовке волновой функции как спино- ра. Действительно, как мы увидим, спинорные поля возникают есте- ственным образом при общем анализе возможных типов полей, которые могут встретиться в квантовой теории поля. Следует, однако, подчеркнуть, что понятие спинора оказывается чрезвычайно мощным инструментом при анализе чисто классических задач. Возможно наиболее впечатляющим примером этого является спинорное доказательство (Witten 1981) предположения о положительности массы в общей теории относительности. В разд. 13.2 будут приведены дополнительные примеры применения спиноров, как то: вывод полезного спинорного разложения тензора кривизны, доказательство существования и вывод свойств главных изотропных направлений тензора Вейля значительно более простым способом, чем это может быть сделано тензорными методами. Наше рассмотрение начинается в разд. 13.1 с доказательства из общих соображений того, что группа изометрий пространства-времени действует естественным образом на состояния физической теории, сформулированной на этом пространстве-времени. Для квантовой теории, определенной на пространстве-времени Минковского, это приводит нас к изучению унитарных представлений группы Пуанкаре в гильбертовом пространстве. Однако, поскольку векторы, состояния, отличающиеся фазовым множителем, описывают одно и то же физическое состояние, также допустимы и представления "с точностью до фазы" группы Пуанкаре. Эти представления находятся во взаимно однозначном соответствии с точными представлениями группы, накрывающей группу Пуанкаре, ISL(2,C), которая состоит из всевозможных трансляций и линейных отображений с единичным детерминантом, действующих в двумерном комплексном векторном пространстве1 . Обычные тензорные поля на пространстве-времени Минковского возникают как реализации точных представлений группы Пуанкаре. Спиноры и спин-тензорные поля возникают как реализации представлений ISL(2,C). Связь между спинорами и векторами, а также другие основные свойства спиноров и спин-тензоров устанавливаются в разд. 13.1. В заключение разд. 13.1 вводится понятие производной спинорных полей в пространстве-времени Минковского и приводятся линейные уравнения для полей с массой т и спином s в пространстве- времени Минковского, ассоциированных с неприводимыми представлениями ISL(2,C). 1 Группа SL(2,C) состоит из "специальных" (т.е. с единичным детерминанте линейных отображений на С2. Группа ISL(2,C) содержит дополнительно (неодн родные) трансляции.
483 В разд. 13.2 мы рассматриваем обобщение понятия спинора на слу- ой искривленного пространства-времени. Поскольку представления спинорах в разд. 13.1 существенно основывались на группе Пуанкаре» мы должны заново переформулировать понятие спинора, чтобы определить его в искривленном пространстве-времени. Это достигается с помощью построений, включающих расслоенные пространства. Как показано в разд. 13.2, пространство-время должно обладать некоторыми топологическими свойствами, чтобы допускать введение спинорных полей, и если пространство-время не является односвязным, то в нем могут существовать несколько неэквивалентных спинорных структур. Действие оператора дифференцирования на обычные тензорные поля, ассоциированные с метрикой ga6, может быть обобщено на случай спин-тензорных полей. Это позволяет получить спинорное разложение тензора кривизны Римана. В качестве приложений спинорных методов мы выводим в конце разд. 13.2 алгебраическую классификацию тензора Вейля, а также демонстрируем противоречивость естественного обобщения на случай искривленного пространства-времени уравнений для безмассого поля со спином больше 1, которые справедливы в пространстве-времени Минковского. Пользуясь случаем, мы обращаем внимание читателя на два момента, касающиеся терминологии и принятых соглашений. Во-первых, термин "спинор" в этой главе относится к двухкомпонентным спинорам, ассоциированным с группой SL(2,C). Как отмечено в конце разд. 13.1, дираковский четырехкомпонентный спинор представляет собой просто объединение спинора и комплексно сопряженного спинора, каждый из которых представляет SL(2,C). В этом смысле спиноры SL(2,C) могут рассматриваться как объекты более фундаментальные, чем биспиноры Дирака, поэтому для нас более естественно работать с ними. Однако мы подчеркиваем, что в квантовой теории поля термин спинор" понимается как "дираковский спинор". Во-вторых, по причине, которая объясняется ниже и связана с уравнением (13.1.18), в этой главе мы используем метрику с сигнатурой ~*"~—. Таким образом, для согласования с формулами из других глав Этой книги в формулах данной главы, включающих пространственно- вРеменную метрику, необходимо во всех случаях появления метрики Изменить знаки сигнатуры. Дополнительные замечания об этом изме- ении знаков приведены в начале этой книги в разделе, посвященном ^°значениям и принятым соглашениям.
484 Глава 13. Спиноры 13.1 Спиноры в пространстве-времени Минковского Основная цель этого раздела - мотивировать определение спинор, ных полей на пространстве-времени Минковского и установить их основные свойства. Мы осуществим это, исследуя общий вопрос о том, какие математические объекты могут представлять физические поля в пространстве-времени Минковского. По существу наш подход будет теоретико-групповым. Сначала мы докажем, что при наличии "специальной ковариантности" физических законов, группа изомет- рий пространства-времени действует естественным образом на состояния физической системы. Тем самым в случае квантовой теории в пространстве-времени Минковского мы получаем унитарное представление группы Пуанкаре с точностью до фазы. Изучение таких представлений приводит к рассмотрению группы SL(2,C) линейных отображений с единичным детерминантом, действующих в 2-мерном комплексном векторном пространстве W. В таком случае понятие спи- норных полей в пространстве-времени Минковского получается путем сопоставления надлежащим образом мировых точек векторам из W. Сначала приведем общие доводы в пользу того, что группа изомет- рий пространства-времени (M,gab) должна действовать на совокупность состояний J физической теории, определенной на этом пространстве-времени. Предположим, что физические свойства любого состояния из J могут быть охарактеризованы локальными измерениями, выполненными в каждой пространственно-временной точке семейством наблюдателей. Удачным примером J с таким свойством является совокупность состояний физической системы, которую можно описать тензорными полями на М определенного типа (компоненты полей должны быть локально измеримыми физическими величинами); но поскольку наша цель - исследовать все возможности, из чего может состоять 3, то мы оставляем J неопределенным. Рассмотрим семейство наблюдателей О, оснащенных измерительными приборами на М. Предположим, что этих наблюдателей можно охарактеризовать ортонормированным базисом (ea)a касательного пространства в каждой точке М, где a = О,1,2,3. Пусть первый вектор базиса (ео) в каждой точке пространства-времени выбран касательным к мировой линии наблюдателя в этой точке, а остальные базисные векторы (eQ)° указывают на то, как измерительные приборы ориентированы наблюдателем. Поскольку при проведении всех экспериментов в Фи~ зике измеряются числа, относящиеся к каждому s € 3, должна в°3' никнуть совокупность чисел, соответствующих исходу полного наоо-
1*? 1- Спиноры в пространстве-времени Минковского 485 а измерений состояния s, выполненных этими наблюдателями. Для простоты предположим, что в каждой точке х 6 М нужно выполнить конечное число к измерений. Тогда для данного пространства-времени (Mieab) и Данного семейства наблюдателей О мы получаем отображение fo'-MxJ^>№k, которое единственным образом характеризует каждое состояние s G J на основе измерений, выполненных этими наблюдателями. Другое семейство наблюдателей О должно получить, вообще говоря, другое отображение /^, т.е. численные результаты измерений состояния s могут зависеть от того, как наблюдатели движутся и как ориентированы их измерительные приборы. Теперь рассмотрим диффеоморфизм ф : М —► М и допустим отображение ф базисных полей (еа)° в ф*(еа)а способом, описанным в прилож. С. В общем случае базис ф*(еа)а не окажется ортонормированным в каждой точке и, таким образом, не будет соответствовать физически реализуемому семейству наблюдателей. Однако в том (и только в том) случае, когда ф является изометрией, ф*{еа)а будет ортонормированным, и мы можем использовать ф для отображения рассматриваемого семейства физических наблюдателей О, ассоциированного с базисом (eQ)a, в новое семейство физических наблюдателей О, ассоциированное с ф*(еа)а. Если законы физики обладают "специальной ковариантностью" относительно изометрий пространства-времени (M,gab) (см. гл. 4), то любой физически возможный результат набора измерений, выполненных семейством наблюдателей О, должен быть физически возможным результатом набора и тех измерений, которые выполнены семейством О. Другими словами, для любого данного состояния s G J должно существовать s £ J такое, что результаты измерений s семейством О совпадают с результатами измерений s семейством О, т.е. для каждой точки х € М справедливо fo{x,s) = 1д(Ф(х)^- Таким образом, мы получаем отображение ф : J —► *7, связанное с каждой изометрией Ф и определенное из условия, что ф(в) "выглядит" для наблюдателей семейства О точно так же, как "выглядит" s для семейства О. В том случае, когда J состоит из тензорных полей, это отображение есть просто отображение ф*, определенное в прилож.С. Изометрий на пространстве-времени (M,gab) образуют группу Ли Фазд. 7.2). Абстрактную группу, изоморфную группе изометрий, обозначим G, а изометрию, отвечающую g € G, обозначим фё. Как отменно выше, для каждого g E G мы получаем отображение фё: J —> J. Роме того, при учете физических критериев, определяющих отобрание ф^ ясно, что для всевозможных g\,g2^G справедливо Ф$1 °Ф82 =Кё2' (13.1.1)
486 Глава 13. Спинор Теперь рассмотрим случай пространства-времени Минковского (R4,7/ab). Группой изометрий пространства-времени Минковского яв~ ляется расширенная группа Пуанкаре, но, поскольку, как отмечено в разд. 4.2, законы физики в пространстве-времени Минковского полагаются "специально ковариантными" только относительно преобразований собственной группы Пуанкаре, в качестве G возьмем последнюю. Приступая к дальнейшему, мы должны более детально описать характер физической теории. Будем полагать, что находимся в рамках квантовой тории. Как мы увидим ниже, спиноры возникнут в качестве кандидатов для физических полей в квантовой теории. В квантовой теории состояния системы представлены векторами с единичной нормой из гильбертова пространства2 W. Однако два вектора, которые отличаются полным фазовым множителем, т.е. комплексным числом с таким, что \с\ = 1, представляют одно и то же физическое состояние. Таким образом, физические состояния из J представляют собой единичные лучи в гильбертовом пространстве, т.е. классы эквивалентности единичных векторов, отличающихся только фазовым множителем. Пусть фё : J —> J обозначает отображение J в себя, соответствующее изометрий фё. Мы можем поставить в соответствие 4>g отображение Ug : Н —► W, при котором фаза Ug(ip) для всевозможных ф е Н может быть выбрана произвольно*. Требование, чтобы фё переводило состояния из J, описываемые наблюдателем из О, в состояния, которые" выглядят точно так же" для наблюдателя из О, подразумевает, что фё должно сохранять вероятности всевозможных переходов. Это означает, что каждое Ug должно удовлетворять \(Ug%l)\,Ugi)2)\ = |(^ъ^2)| для произвольных ^ь^2 € W. Как показал Вигнер (Wigner 1959), это означает, что выбором фазового множителя отображение Ug может быть сделано унитарным либо антиунитарным. Поскольку произвольное преобразование собственной группы Пуанкаре непрерывной деформацией может^быть приведено к единичному элементу, непрерывная зависимость фё от g требует унитарности Ug- Из условия (13.1.1) для фё вытекает, что Ug должно удовлетворять UglUg2=u(gl,g2)Uglg2, (13.1.2) где ш - фазовый множитель, Mgi,&)l = 1. В связи с этим введем некоторые термины. Пусть G и G - грУп' пы. Отображение h : G —> G называется гомоморфизмом, если ДлЯ 2Определение гильбертова пространства и вводное описание его основнЫ свойств даны в начале разд. 14.2, но их знание не является необходимым при 1,3У чении данной главы.
Спиноры в пространстве-времени Минковского 487 произвольных gx,g2 € G справедливо h(gxg2) = h(gl)h(g2). Совокупить GL(V) взаимнооднозначных линейных отображений (не обязательно конечномерного) векторного пространства V в себя обладает естественной структурой группы. Гомоморфизм h : G —> GL(V) называется представлением группы G, а V - пространством представления. Отображение G в GL(V), удовлетворяющее соотношению вида м3.1.2), называется проективным представлением или "представлением с точностью до фазы". Теперь мы можем объяснить нашу стратегию получения физических полей на пространстве-времени. Как мы увидели выше, гильбертово пространство квантовых состояний является пространством унитарного представления с точностью до фазы собственной группы Пуанкаре. Следовательно, можно поставить математическую задачу: найти всевозможные унитарные представления с точностью до фазы группы Пуанкаре в гильбертовом пространстве с непрерывной зависимостью от элементов группы Пуанкаре (Wigner 1939). Далее мы можем обратиться к определению физических полей на пространстве-времени в соответствии со сформулированными требованиями. Задача нахождения непрерывных унитарных представлений с точностью до фазы группы Пуанкаре была систематически исследована Вигнером (Wigner 1939). Первый основной результат исследования Вигнера состоит в том, что унитарные отображения Ug можно переопределить домножением на фазовые множители таким образом, чтобы выполнялось u)(gx,g2) = ±1. Поэтому Ug можно выбрать так, чтобы возникало "представление с точностью до знака". (Доказательство этого результата нетривиально и заключает в себе значительную долю анализа Вигнера.) Следующий основной результат (Bargmann 1954) заключается в том, что представления с точностью до знака группы Пуанкаре находятся во взаимнооднозначном соответствии с точными представлениями ее универсальной накрывающей группы. Обратимся к определению термина "универсальная накрывающая группа". Пусть М - связное многообразие ир,д€ М. Пусть 7 • [0,1] —» М и У : [0,1] —► М - непрерывные кривые такие, что 7(0) = *у'(0) =ри 7(1) = у(1) = я. Кривые 7 и У будем называть гомотопными, если °ни могут быть непрерывно деформированы друг в друга при неподвижных концевых точках, т.е. если существует непрерывная функция F:[0,l]x[0,l]-+M такая, что F(0,t) = i(t) и F(l,t) = ^'(t) для всех ^ [0> 1], и F(s,0) = p, F(s, 1) = q для всех s € [0,1]. Легко убедиться, Что гомотопия является отношением эквивалентности для кривых с к°нцевыми точками р и q. M называется линейно связным, если продольная замкнутая кривая в М (т.е. произвольная кривая такая,
488 Глава 13. Спинору что 7(0) = 7(1)) гомотопна тривиальной кривой (точке): i(t) = 7(0) V£ G [1,0]. Эквивалентное определение односвязности таково: М начы~ вается односвязным, если всевозможные кривые, соединяющие произ- вольные точки р, q G М, гомотопны. Заметим, что число классов эк- вивалентности гомотопных кривых, соединяющих р и д, не зависит от выбора pnq. Отметим также, что множество классов эквивалентности гомотопных замкнутых кривых, проходящих через точку р, приобретает естественную групповую структуру следующим образом. Пусть Гх обозначает класс эквивалентности кривой 7ь и Гг - класс эквивалентности кривой 72- Примем за определение произведения Г1Г2 класс эквивалентности Г кривой 7? введенной следующим образом: 7W \ 72(1 - 2t) (1/2 < t ^ 1) ' KU-Щ т.е. при прохождении по кривой 7 сначала проходится 7i и затем 72. Легко убедиться, что Г не зависит от выбора кривых 7i и 72? представляющих Г\ и Гг, и что принятое произведение определяет групповую структуру с единичным элементом - классом эквивалентности тривиальной замкнутой кривой. Эта группа называется фундаментальной группой многообразия М и обозначается ni(M). Таким образом, М - односвязно в том и только в том случае, когда тг\(М) представляет собой тривиальную группу, состоящую только из единичного элемента. Теперь фиксируем точку р € М и определим М как множество классов эквивалентности кривых с концевыми точками р и q, причем q проходит все многообразие М. Существует естественное отображение / : М н-> М, которое переводит каждый JgMb концевую точку q G М кривых класса эквивалентности q. Это отображение является взаимно однозначным в том и только в том случае, когда М одно- связно. Однако, даже если М не является односвязным, мы всегда можем найти односвязную окрестность U точки q G М и рассмотреть классы эквивалентности кривых из q с концевыми точками р и Qi которые целиком принадлежат U. Таким способом мы получаем взаимно однозначное отображение области U С М в U. Требуя, чтобы все такие отображения были диффеоморфизмами, мы определяем стрУ£1 туру многообразия на М. Полученное таким образом многообразие А» называется универсальным накрывающим многообразием многооор зия М. (Заметим, что М не зависит от выбора точки р G М, испол зованной при этом построении, т.е. универсальные накрывающие м гообразия для различных точек р диффеоморфны). Непосредстве ^ из построения М следует, что мы имеем "накрывающее отображен / : М I—> М такое, что для каждого односвязного открытого мн°
л*\. Спиноры в пространстве-времени Минковского 489 ства U С М отображение/ является диффеоморфизмом между каждой связной компонентой f~l[U] и U. Кроме того, М является одно- связным, как можно видеть из того, что^/ отображает произвольную замкнутую кривую, принадлежащую М, в замкнутую кривую в М, которая гомотопна тривиальной. Два^предыдущих свойства по сути служат отличительными признаками М. Поскольку группа Ли G является в то же время и многообразием (см. разд. 7.2), приведенное выше построение может быть выполнено для G с целью получения универсального накрывающего многообразия G. Более того, на G можно определить структуру группы следующим образом. При построении G в качестве фиксированной точки р выбираем единичный элемент е группы G. Пусть gx, g2 € G и пусть 7i и /у2 - кривые в G, принадлежащие, соответственно, классам эквивалентности Jx и g2 кривых, проведенных из е к точкам в G. Определим gxg2 как класс эквивалентности кривой 7(0 = 7i (072(0, где 7i (072(0 определено групповой операцией умножения в G. Класс эквивалентности кривой 7 не зависит от выбора кривых 7i(0 и 72 (0> представляющих соответствующие классы эквивалентности, таким образом, определение £х£2 корректно. Это произведение превращает G в группу Ли, а накрывающее отображение / : G »—► G - в групповой гомоморфизм. G называется универсальной накрывающей группой группы G с теми отличительными условиями, что G - универсальное накрывающее многообразие многообразия G, и его накрывающее отображение / - гомоморфизм. Группа Пуанкаре не является односвязной. Вращение на угол 2п нельзя превратить непрерывной деформацией в тождественное преобразование. Точнее говоря, кривая 7 в групповом многообразии, определенная соотношением: 7 = вращение вокруг фиксированной оси на угол (27г£), - начинается и заканчивается в единичном элементе е, но не гомотопна тривиальной кривой 7ЧО = е> ^. Возможно более неожиданным является то, что класс гомотопии 27г-вращения представляет с°бой класс гомотопии замкнутых кривых в группе Пуанкаре, про- ХоДящих через единичный элемент е, т.е. любая кривая, проходящая ЧеРез единичный элемент, гомотопна либо кривой 7 27г-вращения, либо Ривиальной кривой У, как показано на рис. 13.1. Таким образом, универсальная накрывающая группа G группы Пушкаре G дважды накрывает G. В дальнейшем мы увидим, что G изо- °Рфна группе ISL(2,C), состоящей из трансляций и линейных отобра- ений с единичным детерминантом в двумерном комплексном вектор- м пространстве. Поэтому нашей следующей главной задачей будет тановить некоторые свойства групп SL(2,C) и ISL(2,C), а также век-
490 Глава 13. Спиноры 6 («) «6 (с) ф (е) б (Ь) Ф (<*) О Рис. 13.1. Диаграмма, иллюстрирующая, каким образом вращение сферы на угол 47г вокруг данной оси можно привести непрерывной деформацией к вращению на нулевой угол. 47г-вращение мы представляем в виде двух последовательных 27г-вращений. Непрерывно изменяем ось второго из них до совпадения с осью, противоположной оси первого вращения так, как это изображено в последовательности (a)-(d). Затем непрерывно уменьшаем угол обоих вращений до нуля, как показано на последовательности (d)-(f) торного пространства, в котором они действуют естественным образом. Эти свойства являются основными в представлениях о спинорах, и чтобы изучить их, мы отступим на некоторое время от основной темы. Пусть W - двумерное векторное пространство над полем комплексных чисел. Следуя индексным обозначениям гл. 2, мы будем использовать верхние латинские индексы для обозначения векторов из ИЛ а верхние греческие индексы - для обозначения компонент векторов из W в базисе. Однако, чтобы все же отличать векторы из W от касательных векторов в пространстве-времени, будем использовать больше буквы для верхних индексов. Таким образом, £А, например, обозначает элемент из VK, a £s обозначает компоненту вектора fл. Так же, как и в случае вещественного векторного пространства, из исходного W можно построить дуальное пространство W* линейных отображении из W в С. В этом случае W* представляет собой двумерное векторн^ пространство над С, и мы будем обозначать его элементы с нижним*1
13.1- Спиноры в пространстве-времени Минковского 491 индексами. Итак, Ал, например, обозначает элемент из W*. Однако пдя векторного пространства W над С мы можем также образовать комплексно сопряженное дуальное пространство W , состоящее из антилинейных отображений из W в С. (Мы будем называть отображение /:^hC антилинейным, если f(tf + f£) = /(#*) + /(f£) и /(<£*) = ^/(£Л) ЛЛЯ произвольных €*,€2i€A € W и произвольного с € W.) Тогда и W представляет собой двумерное векторное пространство над С, и мы будем обозначать его элементы со штрихованным нижним индексом, например, фл' € W . И наконец, определим комплексно сопряженное пространство W как дуальное по отношению к W , и обозначим его элементы со штрихованным верхним индексом, например, фА € W. Заметим, что существует естественное антилинейное взаимно однозначное соответствие между элементами £ € W и ф € W, определенное условием ф(£) = Ф{*Ф) для произвольного ф £ W . (Во избежании путаницы здесь мы опустили индексы.) Назовем это отображение W на W (а также обратное отображение W на W) комплексным сопряжением. Образ вектора £А £ W при комплекс- __л; ном сопряжении обозначим £ € W, и подобно этому, образ вектора 0А € W обозначим 0 € W. Тензор Т типа (г, l,k',V) над W определяется как мультилинейное отображение T.W* x-xW* xW x-xWxW* x-xW* xWx-xW^C. k l h' V Индексные обозначения для тензоров над вещественным векторным пространством мы естественным образом обобщим для тензо- ров над W. Так, например, ТАВс обозначает тензор типа (2,1;1,0). Взаимное расположение штрихованных и нештрихованных индексов значения не имеет, например, TAD Bc обозначает тот же самый тензор ТАвс . Однако расположение нештрихованных индексов относительно нештрихованных и расположение штрихованных относительно Штрихованных имеет значение, так же, как и для тензоров над вещественным векторным пространством. Отображение комплексного со- пРяжения распространяется на тензоды и отображает тензор Т ти- 2? (М; &',/') в тензор, обозначаемый Т типа (k',l';kj). Заметим, что ^ Т. И наконец, теперь нам известны два различных вида свертки: свертка по нештрихованным индексам, преобразующая тензоры типа ^>sfc',/') в тензоры типа (к — 1,/ — 1;А/,/'), и свертка по штрихован- Ым индексам, преобразующая тензоры типа (A;, Z; fc', /') в тензоры типа vfc, /; к' — 1J' — 1). Однако свертка по штрихованному и нештрихованно-
492 Глава 13. Спинору му индексу не определена. Как и прежде, мы принимаем соглашение о свертке по повторяющемуся индексу. Для двумерного векторного пространства W над полем С вектор, ное пространство антисимметричных тензоров типа (0,2;0,0) одномерно. Если задан особый тензор елв = —евл, то пара (W, елв) называется спинорным пространством. Элементы из W называются спинорами, и тензоры над W называются спин-тензорами. Можно использовать елв Для отображения спиноров в дуальные спиноры с помощью £А ь-> €ав£Л- Поскольку тензор €ав невырожден (т.е. €ав£а ф 0 за исключением только случая, когда £А = 0), мы получаем с его помощью изоморфизм пространств W и W*, который во многом схож с изоморфизмом, возникающим за счет метрики на W. Мы воспользуемся этим сходством и примем для €ав те же самые соглашения об обозначениях, что и в гл. 2 для метрики. Во-первых, дуальный вектор €ав£а будем обозначать просто £в> и вообще будем применять €ав для опускания нештрихованных индексов всех спинорных тензоров. Заметим, однако, что поскольку €ав является антисимметричным по отношению к Л и В, результат опускания индекса зависит от того, по какому из индексов тензора cab производится свертка с £с. При операции опускания индекса мы следуем общепринятому соглашению о свертке по первому индексу тензора cab- Таким образом, справедливо £в = елв£А = -еВл£А. (13.1.4) Следуя общепринятым соглашениям, еАВ определим как обратный к £ав, взятый со знаком минус, т.е. еАВ представляет собой антисимметричный тензор типа (2,0;0,0), удовлетворяющий еАВевс = -6А, (13.1.5) где Sq обозначает тождественное отображение в W. Чтобы скомпенсировать знак минус в уравнении (13.1.5), для поднятия индексов будем использовать свертку по второму индексу тензора еАВ; например, для \ха € W* справедливо !iA = еАВ»в = -eBAiiB. (13.1.6) Поэтому, чтобы не допустить ошибок в знаках, необходимо внимательно следить за положением индексов. Отметим соотношения иФА = (евА£В)ФА = = -еАВеФА = = -еФв. азЛ-7)
о 1 Спиноры в пространстве-времени Минковского 493 п частности, для произвольного спинора £А справедливо £а€а = 0. £ледует также отметить, что может возникнуть путаница с символом 5Ас> который можно было бы понимать либо как (а) тождественный оператор в W, либо как (Ь) тождественный оператор 5в° в W* с поднятым первым индексом и опущенным вторым. (Тензоры в (а) и (Ь) отличаются знаком.) Таким образом, для обозначения тождественных операторов в W и в W* предпочтительнее использовать есА, поскольку в понимании этого символа путаницы не возникает. И наконец, тензоры, полученные комплексным сопряжением тензоров еав и еАВ, обозначим ёА'В' и еА в и будем использовать их для поднятия и опускания штрихованных индексов с тем же самым соглашением свертки по первому индексу тензора ёл'В' и второму индексу тензора ёА в . Линейное отображение L : W ■-► W представляет тензором ЬАв- Его детерминант определяется посредством det(L) = ^eABeCDLAcLBD. (13.1.8) Как известно, отображение на ЬАв является взаимно однозначным, а значит, обратимым, в том и только в том случае, когда его детерминант отличен от нуля. Определим SL(2,C) как группу линейных отображений W в себя, имеющих детерминант равный единице. В этом случае групповая операция умножения определяется посредством композиции, т.е. (LM)AB = LAcMcв, и обратный элемент группы задается обратным линейным отображением. Поскольку условие, накладываемое на детерминант, представляет собой одно комплексное уравнение для четырех комплексных компонент ЬАв, элемент группы SL(2,C) определяется шестью вещественными параметрами. Действительно, используя теорему полярного разложения, которая утверждает, что по отношению к любому внутреннему произведению на W произвольный элемент группы SL(2,C) может быть единственным образом выражен ^к композиция унитарного отображения с единичным детерминантом (т.е. элемента группы SU(2)) и положительного самосопряженно- г° отображения, можно показать, что SL(2,C) обладает естественной СтРуктурой многообразия 53 х R3. Таким образом, поскольку груп- 0fibie операции являются гладкими по отношению к этой структуре многообразия, SL(2,C) представляет собой б-мерную группу Ли. Из го, что §г и д£3 являются односвязными, вытекает односвязность и v2,C). Заметим, что условие единичности детерминанта ЬАв экви- ^ентно соотношению LAcLBDeAB = eCD, (13.1.9) °Рое означает, что еАв сохраняется при действии ЬАв-
,,AA' zAA' 494 Глава 13. Спинор, Теперь можно установить соотношение между SL(2,C) и группой Лоренца. Тензоры типа (1,0; 1,0) составляют 4-мерное (комплексное) векторное пространство Y. Можно определить удобный базис в Y сл^ дующим образом. Пусть оА, гА - базис в W, удовлетворяющий уело, виям оЛгА = еАВоАгв = 1. (13.1.10) Тогда тензоры tAA' = -L(oAoA'+iAiA'), (13.1.Ц) хАА' = -^(oV+tV), (13.1.12) = ±=(oAlA'-iAoA'), (13.1.13) = ±(оАоА'-гАгА') (13.1.14) составляют базис пространства У. Комплексное сопряжение отображает Y в себя; элементы фАА из У, которые переходят в самих себя —АА' ±AAi при комплексном сопряжении, т.е. ф = ф , называются вещественными. Непосредственной проверкой можно убедиться, что приведенные выше базисные элементы из Y вещественные и, кроме того, вещественными элементами пространства Y являются именно те элементы, которые могут быть записаны как суммы этих базисных элементов с вещественными коэффициентами. Таким образом, вещественные элементы пространства Y составляют четырехмерное векторное пространство над полем R, которое мы обозначим V. Тензор ёАА'ВВ' = *АВёА>В' (13.1.15) представляет мультилинейное отображение V х V »—► R, поскольку, как легко проверить, ^аа,вв,(^АА ^ВВ является вещественным для произвольных фАА ,t\)bb € V. Кроме того, gAA'BB' является невырожденным с сигнатурой Н и поэтому определяет метрику ЛоренДа на V. (Это можно прямо проверить, убедившись, что базисные ве ТОрЫ (13.1.11)—(13.1.14) ОрТОГОНаЛЬНЫ ПО ОТНОШеНИЮ К gAA'BB"1 *А1 8аа>вв'1АА tBB = 1 и аналогично записанные нормы векторов $ уАА' и ZAA' равны (_1) Итак, с произвольным отображением Lab € SL(2,C) ассоциир0 но отображение Л : V »-► V, определенное согласно ХАА'вв' = LABLA'B, (13-Il6)
Цз Спиноры в пространстве-времени Минковского 495 того, что Lab, согласно уравнению (13.1.9), сохраняет вдв, следует, хЛА' чТ0 Лл вв' сохраняет gAA>BB^ T-e- справедливо А СС'АБВ DD'gAA'BB' =eCC'DD" (13.1.17) Wo согласно определению, расширенная группа Лоренца, обозначаемая 0(3,1), состоит как раз из тех линейных отображений четырехмерного вещественного векторного пространства с метрикой лоренцевой сигнатуры, которые сохраняют эту метрику. Таким образом, \АА вв' представляет собой лоренцево преобразование пространства VI В самом деле, лоренцевы преобразования, возникающие таким путем, содержат собственную группу Лоренца, обозначаемую Л, что можно явно проверить при помощи компонентной формы этого соответствия, которое мы получим ниже - (13.1.31) и (13.1.32). Следовательно, мы обнаружили, что с каждым элементом Lab € SL(2,C) ассоциировано преобразование вв' собственной группы Лоренца, определяемое (13.1.16). Более того, ЬАв и МАв порождают один и тот же элемент группы Лоренца в том и только в том случае, когда ЬАв = ±Млв- Действительно, отображение / : SL(2,C н-> Л, полученное из (13.1.16), удовлетворяет всем требованиям, предъявляемым к универсальному накрывающему отображению; а именно: оно является гомоморфизмом односвязной группы Ли SL(2,C) на Л, и для произвольного односвяз- ного открытого множества U С Л оно является диффеоморфизмом между произвольной связной компонентой f~l[U] и U. Таким образом, мы приходим к заключению, что SL(2,C) представляет собой универсальную накрывающую группу группы Лоренца. Подобным образом, группа ISL(2,C), составленная естественным путем из элементов группы SL(2,C) и элементов группы трансляций комплексной размерности 2 пространства W, может рассматриваться как универсальная накрывающая группа собственной группы Пуанкаре. Поскольку g^A'BB1 представляет собой метрику на V, мы можем 0пРеделить обратную метрику gAA'BB[ Из уравнений (13.1.5) и (13.1.15) бедует, что gAA'BB' =€АВ-еА'В' (13.1.18) Усть Т - тензор типа (А;,/) над V. Тогда, если рассматривать его к тензор над W, Т имеет тип (А:,/; А;,/), т.е. Т имеет к верхних пар Дексов штрихованный-нештрихованный и I нижних пар индексов н ^Их°ванный-нештрихованный. Если рассматривать Т как тензор По То было бы естественным использовать g^A'BB1 и £^А ВВ Для и ятия и опускания "К-индексов", т.е. пар индексов штрихованный- Рихованный. С другой стороны, для случая, когда мы рассмат-
496 Глава 13. Спинора риваем Т как тензор над W, мы уже определили поднятие и опускание индексов при помощи елв, еЛБ, ёл'В' и ёА Б . К счастью, легко проверить, что эти различные способы поднятия и опускания индексов для тензоров над V всегда приводят к эквивалентному результату. По этой причине мы выбрали в данной главе сигнатуру метрики Н . Можно было бы сохранить нашу прежнюю сигнатуру определяя Sambb1 как ~еАв£А'В', но тогда результаты поднятия и опускания индексов этими двумя различными способами отличались бы знаком, и при каждом вычислении пришлось бы указывать какой из способов применяется. Некоторые из приведенных далее выражений удобно представить в координатной форме. Нетрудно убедиться, что для базиса ол, гд, удовлетворяющего (13.1.10), справедливо елв = оАгв - ъаов, (13.1.19) поскольку обе стороны этого уравнения дают одинаковые результаты при свертке с ол или гА. Таким образом, координаты бцп тензора €дВ можно представить матрицей е™=(-1 J)' (13л-2°) Имеет место соотношение еАВ = оАгв-гАов, (13.1.21) которое в компонентной записи можно представить так бЕП=(-°1 о)- (13122) В компонентах преобразование Lab € SL(2,C) имеет вид -(:!)• <1з1я) где а, 6, с, d - комплексные числа, удовлетворяющие условию ad-bc=h (13.1.24) Компоненты базисных элементов (13.1.11)—(13.1.14) пространства У таковы v/2V> l)' (
13.1. Спиноры в пространстве-времени Минковского 497 *Е2' = 4г(! J)' (131-26) V2 V2 «^ - -5*(! ?)' (13-1.27) *ЕЕ' - ^(i -О- <шлв> Заметим, что правые стороны (13.1.25)—(13.1.28) без множителя 1/\/2 и знака минус в (13.1.27) в точности совпадают со спиновыми матрицами Паули. Произвольный вектор vAA e V может быть записан как vAA' = t • tAA' + х • хАЛ' + у • УАА' + ^ • zAA\ (13.1.29) поэтому его координаты в базисе пространства V, ассоциированном с оА игА, могут быть представлены матрицей Преобразование компонент вектора vAA , индуцированное SL(2,C) преобразованием ЬАв посредством формулы (13.1.16), записывается так где правая часть понимается как обычное матричное умножение. Переписывая уравнение (13.1.31) в виде х = ^AV, (13.1.32) где xv — (t,x,y,z), получаем явную компонентную форму отображения /, переводящего элементы из SL(2,C) (представленные как 2x2 комплексные матрицы LEn) в элементы из Л (представленные как 4x4 вещественные матрицы А^). Для данного спинора фА Е W можно покроить вектор кАА 6 V посредством кАА'=фАфА'. (13.1.33) Справедливо ёАА-вв'кАА'квв' = (еАв1рАфв) {еА,в,фА'фВ') = 0, (13.1.34)
498 Глава 13. Спиноры таким образом, кАА является изотропным вектором по отношению к лоренцевой метрике на V. Поэтому можно рассматривать фА как "квадратный корень" из изотропного вектора кАЛ . Заметим, что для любых двух спиноров фА и фА получается 8ЛЛ'ВВ^ЛФА'ФЛФА' = &вФВ) ^В'ФВ') = \ФвФБ\2 • (13.1.35) Таким образом, изотропный вектор, ассоциированный с произвольными спинорами фА и фА, имеет, очевидно, неотрицательный скалярный квадрат, что означает (при нашей новой сигнатуре метрики Н -) что такие изотропные векторы находятся в одной и той же половине светового конуса. Мы условимся называть ее световым конусом будущего. Таким образом, векторное пространство V имеет естественную временную ориентацию. Кроме того, вещественный спин-тензор CAA'BB'CC'DD' = i {tABtCDCA'C'tB'D' ~ ^A'B'^C'D'^AC^Bd) (13.1.36) представляет собой полностью антисимметричный тензор типа (0,4) над V и, таким образом, создает ориентацию пространства V. Если фА отличается от фА фазовым множителем, т.е. фА = сфА при \с\ = 1, то фА и фА определяют один и тот же изотропный вектор клл , так что один и тот же кАА ассоциирован с однопараметрическим семейством спиноров. Тем не менее мы можем определить вещественный тензор FAABB' посредством FAA>BB> = фАфВ1А>В' + фА'фВ'еАВ (13.1.37) Рассматриваемый как тензор типа (2,0) над V, FAA BB является антисимметричным, т.е. FAA вв = -FBB АА'. Кроме того, он удовлетворяет условиям FAA'BB'FAA,BB, = 0 (13.1.38) FAA'BB'kBB, =0, (13.1.39) где, как и ранее, кАА = фАф . Таким образом, рассматриваемый как тензор над V, FAA BB представляет собой изотропный бивектор с изотропным вектором кАА , т.е. FAA BB имеет вид рАА'ВВ' = кАА'тВВ' _ кВВ'тАА'^ (13Л.40) где кАА' - изотропный вектор, и тАА ортогонален кАА . Мы назовем рАА'вв' изот>рОПНЫМ флагом, ассоциированным со спинором фА- Два
-од. Спиноры в пространстве-времени Минковского 499 спинора фл и фА порождают один и тот же изотропный флаг в том и «только в том случае, когда они отличаются самое большее знаком, т.е. фЛ = ±грА. Из спинора фА невозможно построить различные тензоры над V для фА и -фА. Теперь мы возвращаемся к общему вопросу получения возможных полей на пространстве-времени, которые могут возникнуть в квантовой теории. Нашим руководящим соображением, которое обсуждалось выше, является поиск унитарных представлений группы ISL(2,C) в гильбертовом пространстве. Здесь мы определим спинорные поля и спин-тензорные поля на пространстве-времени, которые обладают корректными "законами преобразования" относительно ISL(2,C). Построив гильбертовы пространства из этих полей (что будет сделано ниже), с помощью этих законов преобразования мы получим искомые представления группы ISL(2,C). Определим спинорное поле на пространстве-времени Минковского (К4>*7аЬ) просто как отображение пространства-времени в спинорное пространство W. Подобным образом спин-тензорное поле некоторого типа определяется как отображение пространства-времени в тензорное пространство над W этого типа. Действие ISL(2,C) на спинорные поля зададим следующим образом. С каждым g G ISL(2,C) ассоциировано преобразование фА(х)»-» LabiI)b[P~1(x)\, где ЬАв € SL(2,C)- "однородная часть" g, и Р - элемент группы Пуанкаре, связанный с g. Таким способом грубой силы мы получаем представление ISL(2,C) в векторном пространстве спинорных полей. Однако это представление не соответствует точному представлению группы Пуанкаре. Поскольку для каждого элемента Р группы Пуанкаре существуют два элемента группы ISL(2,C), при попытке определить преобразование Р*, ассоциированное с элементом Р, мы получаем неопределенность в знаке (Р»л (х) = ±ЬАв1>в[Р-\х)]. (13.1.41) Эта неопределенность устраняется, если взять не только Р, но и непрерывную кривую в группе Пуанкаре с концевыми точками е и Р, поскольку такая кривая однозначно связана с элементом из ISL(2,C). Таким образом, в определенном смысле, спинор в точке х изменяет знак при поворте на угол 2п вокруг фиксированной оси, проходящей через точку х. Однако, имея только точку Р (и не имея указанной кри- в°й), неопределенность знака в (13.1.41) неразрешима обычным путем, "^возможно выбрать знак так, чтобы получить точное представление гРуппы Пуанкаре. Заметим, что хотя мы определили действие группы Пуанкаре на спинорные поля с точностью до знака, мы не определили
500 Глава 13. Спиноры действие произвольного диффеоморфизма на спинорные поля. Так, в частности, не определена производная Ли спинорного поля по отношению к векторному полю, не являющемуся киллинговым. Теперь можно установить связь спинорных полей и обычных векторных полей. Как было указано выше, вещественные тензоры типа (1,0; 1,0) над W образуют четырехмерное вещественное векторное пространство V, на котором определена метрика Лоренца (13.1.15). Пусть £°, ха, уа, za - ортонормированный базис в пространстве-времени Мин- ковского, связанный с глобальным семейством инерциальных наблюдателей О. Пусть оА, гА - базис для W, удовлетворяющий (13.1.10). Определим в каждой точке х пространства-времени Минковского линейное отображение <т, которое переводит векторы из У в векторы касательного пространства Vx в точке х путем отождествления £°, ха, уа, za с базисом (13.1.11)—(13.1.14) пространства V. Другими словами, определим гибридное векторно-спинорное тензорное поле аАА, посредством °АА> = *atAA> + ХаХАА> + уаУАА, + ZaZAA>. (13.1.42) В этом случае в каждой точке х введенное аАА, представляет собой изоморфизм между векторными пространствами V и Vx, который сохраняет метрику Лоренца, определенную на этих пространствах, т.е. мы получаем Vab = °£А'°ъВ'ёАА.Вв» (13.1.43) (Здесь все строчные индексы подняты и опущены с помощью rjab и rjab, тогда как прописные индексы подняты и опущены с помощью еАВ, еАв и их комплексных сопряжений.) Используя crAAt, мы можем отображать вещественные спин-тензорные поля типа (1,0; 1,0) из пространства-времени Минковского в векторные поля. Далее обнаруживается, что действие группы Пуанкаре сохраняет эту связь, а именно, действие (13.1.41) элемента Р группы Пуанкаре на спинорные поля индуцирует на спинорном тензоре vAA типа (1,0; 1,0) преобразование (P*v)AA' (х) = LABLA'B,VBB'[P-I{x)) = \aa'bb-vbb'[P-\x)], (13.1.44) где ХАА вв' - преобразование Лоренца, соответствующее "однородной части" элемента Р. Отсюда получаем <7аАА> {P*V)AA> (X) = <ТаАА>\АА'вВ>УВВ'[Р-1(х)} = = (<ГаАА'\АА'вВ'<ТЬВВ') ObCC'VCC'\P-l{*)\ = = \\уь[Р-1{х)} = = (P*u)°(x), (13.1-45)
13.1- Спиноры в пространстве-времени Минковского 501 гяе в последней строке Р* представляет собой естественное действие ^ n n. a. FF' элемента Р на векторное поле гг = gAAiV » как определено в припас. С для диффеоморфизма общего вида. Следовательно, выбирая раз и навсегда отображение аАА, вида (13.1.42), мы можем согласованно отождествлять спин-тензорные поля типа (1,0;1,0) с векторными полями. Общепринято проводить это отождествление3 в нашей записи, опуская отображение &АА, в наших выражениях и обозначая, АА' АА' например, векторное поле, ассоциированное с v " просто как v вместо <7aa,vAA • Здесь мы будем следовать этой практике. Ввиду нашего нового соглашения о сигнатуре метрики, никакой путаницы относительно того, подняты и индексы или опущены с помощью метрики или с помощью еАВ и б^в, не возникает. Теперь мы можем дать нашу физическую трактовку спинорного поля фа. Как описано выше, с каждым спинором ассоциирован изотропный флаг FAA вв , определенный уравнением (13.1.37). Используя отображение аАА,, мы можем рассматривать FAA BB как тензорное поле типа (2,0) на пространстве-времени. Тензорные поля, однако, являются объектами, трактовка и измеримость которых вполне понятны. В качестве физически измеримых свойств i\)a возьмем величины, определяемые из FAA вв . Заметим, что это означает физическую неразличимость i\)a и — i\)a. Может показаться странным, что мы идем на большие затруднения в определении спинорных полей только для того, чтобы дать им трактовку с помощью ассоциированных с ними тензорных полей. Однако динамическая эволюция физических полей, представленных спинорами, задается дифференциальными уравнениями, включающими спинорные поля, а не только их изотропные флаги. Если область, где спинорное поле гра изначально ненулевое, не является связной, знания начального значения его изотропного флага рАА в в' ^так же как производных по времени от FAABB') не будет достаточно для определения последующей эволюции гра или FAA вв , поскольку будет существовать неопределенность в знаке гра в каждой из начальных областей, где фа ненулевое, и относительные различия в знаке в этих областях будут влиять на последующую эволюцию. Таким образом, в этом смысле спинорное поле содержит физически более значимую информацию, чем предоставляется его изотропным флагом. Ьолее того, даже в случае, когда множество, где гра Ф 0 связно и, еле- Также общепринято и удобно отождествлять а = АА', Ь = В В' и т.д. в обеднениях индексов (Penrose, Rindler 1984), так что, например, допустима запись оЬ = ^ab^a'B1- Тем не менее здесь мы не будем следовать этой практике, потому ^° хотим сохранить спинорные индексы так, чтобы уравнения в этой главе (где гнатура метрики Н ) можно было бы легко отличить от уравнений из других Лав (где сигнатура -+ + +).
502 Глава 13. Спиноры довательно, поле фа может быть восстановлено (с точностью до знака) по его изотропному флагу, формулировка законов динамики в терминах изотропных флагов была бы чрезвычайно громоздкой. С другой стороны, эти законы принимают простую и естественную форму, если сформулированы в терминах спинорных полей. Пользуясь случаем, приведем несколько тождеств, которые очень полезны при вычислениях со спинорами. Пусть Таь - (вещественный) тензор типа (0,2), и пусть Таа'вв' - соответствующий спин-тензор. Непосредственной проверкой можно убедиться, что 2 {ТАА'ВВ' ~ ТвВ'АА') = Т(АВ)[А'В'] + Т[АВ)(А'В'), (13.1.46) где, как и в случае обычных тензоров, круглые и квадратные скобки обозначают, соответственно, симметризацию и антисимметризацию, и мы напоминаем читателю, что относительное расположение штрихованных и нештрихованных индексов не имеет значения. Однако, поскольку tA'B' формирует одномерное векторное пространство антисимметричных спин-тензоров типа (0,0;0,2), должно выполняться равенство Т(АВ)[А'В'\ = ФАВ^А'ВЧ (13.1.47) где Фав симметричен. Свертывая уравнение (13.1.47) с еА в , получаем Фав = \т{АВ)А.А'. (13.1.48) Подобным образом находим Т[Ав]ЦА'В') = савФа'В'- (13.1.49) Однако вещественность Таа'ВВ' предполагает, что фАв = Фав- Таким образом, справедливо 2 {ТаА'ВВ' - ТвВ'АА') = ФаВ^А'В' + ФА'В'*АВг (13.1.50) где фАв задается уравнением (13.1.48). В частности, произвольный антисимметричный тензор Таь = Т[а5] может быть записан в виде правой части (13.1.50). Аналогично 2 (TAAtBB> + ТвВ'АА') = Т(АВ)(А'В') + Т[АВ]1А'В'] = = Т(АВЦА'В') + jeABCA'B'T, (13.1.51)
13.1. Спиноры в пространстве-времени Минковского 503 где Т = Та а' = ^оа- В частности, произвольный симметричный тензор Таь = Т(аь) может быть записан в виде правой части (13.1.51). Свертывая (13.1.51) с ёА в , получаем Т[ав)А'А' = \елвТ. (13.1.52) Если Tab симметричен, скобки в левой части уравнения (13.1.52) можно опустить. Производные спинорных полей на пространстве-времени Минковского можно определить следующим образом. Поскольку спинорное поле является отображением точек пространства-времени в W, мы можем брать обычные частные производные от фА по отношению к глобальным инерциальным координатам пространства-времени Минковского. Обозначим через дввг,ФА спин-тензорное поле типа (1,1;0,1), имеющее в базисе ол, гА следующие координаты дАА'ФГ = E^^'^T- (13.1.53) Для данного фиксированного выбора оааа1 спин-тензорное поле dBB'ipA, определенное таким способом, не зависит от выбора глобальных инерциальных координат жм и от спинорного базиса оА, гА, поэтому 8bb'^A определено корректно. Производная спин-тензорного поля произвольного ранга определяется аналогично путем нахождения частных производных от его координат по отношению к глобальным инерциальным координатам и применения <тааа1- Легко проверить, что операция Эаа' линейная, подчиняется правилу Лейбница, коммутирует со сверткой и также удовлетворяет условию дАА>евс = 0. (13.1.54) К тому же для векторного поля vBB имеем длл'Увв' = °аАА'°ъВВ'даУЬ. (13.1.55) Вообще для обычного тензорного поля произвольного ранга действие ®аа' согласуется с действием оператора дифференцирования да. Таким образом, Эаа' можно рассматривать как обобщение на случай спин-тензорных полей обычного оператора дифференцирования да на пространстве-времени Минковского. Заметим, что операторы дифференцирования коммутируют при Действии на произвольное спин-тензорное поле на пространстве-времени Минковского Эаа'Эвв' = двв'дАА'- (13.1.56)
504 Глава 13. Спинор] Следовательно, те же самые выкладки, которые привели к (13.1.52) теперь дают дАА'двВ' = \*лвО, (13.1.57) где □ = дАА>дАА . (13.1.58) Наша мотивация для введения спинорных полей возникла при изучении унитарных представлений с точностью до фазы группы Пуанкаре в гильбертовом пространстве. Итак, наконец, мы готовы вернуться к этой проблеме и показать, как гильбертовы пространства могут быть построены из спин-тензорных полей, удовлетворяющих некоторым уравнениям, так что закон преобразования (13.1.41) приводит к искомым унитарным представлениям. Напомним, что представление называется приводимым, если все линейные отображения, встречающиеся в представлении, переводят фиксированное собственное подпространство векторного пространства в себя. Легко показать, что в конечномерном векторном пространстве V любое унитарное представление можно разложить в прямую сумму неприводимых представлений, т.е. V может быть записано как прямая сумма подпространств, каждое из которых инвариантно, но не имеет инвариантных подпространств. Для бесконечномерного гильбертова пространства этот результат не всегда справедлив, но Вигнер показал, что унитарные представления ISL(2,C) могут быть разложены на неприводимые представления (Wigner 1939). Таким образом, достаточно рассмотреть только неприводимые представления, так как все представления могут быть построены из них. Это значительно упрощает анализ. Неприводимые представления удобно нумеровать значениями операторов Казимира4 га2 и S2 алгебры Ли группы ISL(2,C) (изоморфной алгебре Ли группы Пуанкаре), которые могут быть интерпре- 4 Универсальная обертывающая алгебра U алгебры Ли L получается с помощью нахождения прямой суммы ф^оТ(к,0) всех "верхнеиндексных" тензоров над L и следующего определения: два элемента называются эквивалентными, если могут быть сведены друг к другу любым формальным вычислением, в котором для произвольных va,wa G L заменяем vawb — vbwa на [и,ги]а. Элемент XgW, который коммутирует со всеми v6L, называется элементом Казимира. Согласно теореме Стоуна, любое унитарное представление группы Ли G порождает самосопряженное представление ее алгебры Ли L. (Reed, Simon 1972; Garding 1947). Представители элементов Казимира, называемые операторами Казимира, коммутируют со всеми представителями элементов из L, и следовательно со всеми представителями элементов из G. Следовательно, согласно лемме Шура, в неприводимом представлении любой оператор Казимира должен быть кратен тождественному оператору. Степени кратности представляют собой удобные метки для неприводимых представлений. Универсальная обертывающая алгебра группы Пуанкаре допускает два независимых элемента Казимира. Их трактовка в терминах мае-
j3.1. Спиноры в пространстве-времени Минковского 505 тированы как представляющие, соответственно, квадрат 4-импульса (т.е. квадрат массы) и квадрат углового момента относительно центра масс. В соответствии со значением га2 мы можем классифицировать эти представления, рассматривая следующие 4 случая: (а) га2 > 0; ф) т2 = 0, но не все трансляции представлены тождественным опера- хором /; (с) га2 = 0, и все трансляции представлены тождественным оператором /; (d) m2 < 0. В представлениях (с) все состояния трансляционно инвариантны. По-видимому, эти представления не имеют физического смысла. Физический смысл "тахионных" представлений (d) также неясен, хотя некоторые тахионные теории поля предложены (Feinberg 1967). Представления из этих классов (с) и (d) были получены (Bargmann 1947), но систематического построения полей на пространстве-времени Минковского, которые реализуют эти представления, по-видимому, не было сделано. Представления классов (а) и (Ь) были получены Вигне- ром и систематически реализованы как поля на пространстве-времени (Bargmann, Wigner 1948). Представления класса (а) характеризуются значениями га2 и 52 с 52 = s(s + 1), где спин s принимает значения s = 0, ^, 1, — Представления класса (Ь) могут быть разделены на два подкласса: (Ы) характеризуемые спиральностью (ее величина также называется спином), равной 5 = 0, ±^,±1,...; (Ь2) представления так называемого "непрерывного спина". Поля на пространстве-времени, ассоциированные с (Ь2), по-видимому, не имеют какого-либо физического смысла или математической пользы. В настоящее время классы (а) и (Ы) описывают все физические поля квантовой теории. Уравнения для выделенных подпространств спин-тензорных полей, реализующих представления классов (а) и (Ы), могут быть представлены во многих эквивалентных формах. Для представлений класса (а) массы т и спина s общепринятым является уравнение (П + т2)фА1~А"=0, (13.1.59) где фА1—Ап полностью симметричен, фА*—Ап = ф(М—Ап) с количеством индексов п = 2«. Для s > 0 уравнение (13.1.59) также может быть выражено в следующей форме. Определим вспомогательную переменную аА[Л2"'Ап посредством dA'MAl'An = Нк°КМ-Ап- (13Л-6°) сы и спина возникает из отождествления алгебры Ли группы Пуанкаре с полями Шиллинга пространства-времени Минковского.
506 Глава 13. Спиноры Из уравнений (13.1.59) и (13.1.57) получаем дА^аА[А2-Лп = —^ф*1" Лп. (13.1.61) Более того, применяя (13.1.57) еще раз, можно убедиться, что из пары уравнений (13.1.60) и (13.1.61) следует уравнение (13.1.59), так что система уравнений 1-го порядка (13.1.60) и (13.1.61) эквивалентна уравнению (13.1.59). Действительно, повторным дифференцированием фАх "Ап и сверткой по нештрихованным индексам может быть определена целая иерархия вспомогательных переменных, каждая из которых связана с предыдущей переменной уравнениями вида (13.1.60) и (13.1.61). Внутреннее произведение, которое снабжает множество решений уравнения (13.1.59) структурой гильбертова пространства, также можно представить во многих эквивалентных формах. Общепринятое выражение получается следующим образом5. Для двух решений фАх ~Ап и грА1'"Ап уравнения (13.1.59) со вспомогательными переменными аА^А2...Ап и рл^А2...Ап^ соответственно, определим вектор потока частиц jAA (0, гр) согласно jAA> = (_-Г-1 {фЛ'4>"'<дАьля..-дл'яЛпфАЛ'~Л* + + Т^-^дльл,... дА,пАпрА'А*-А» } . (13.1.62) Из уравнений (13.1.60) и (13.1.61) следует, что jAA сохраняется, 9aa'Jaa = 0. Определим внутреннее произведение ф и гр с помощью интеграла от нормальной составляющей jAA по поверхности Коши (Ф,Ф) = J jAA'nAA>dV. (13.1.63) Несмотря на то, что это с очевидностью не вытекает из данного выражения, внутреннее произведение (13.1.63) положительно определено, когда п нечетно (т.е. s полуцелое) и положительно определено для положительно частотных решений, когда п четно (т.е. 5 целое). (Данный результат может быть доказан, если выразить это внутреннее произведение как интеграл в пространстве преобразования Фурье, где он может быть записан в явной положительно определенной форме (Bargmann, Wigner 1948).) Таким образом, во всех случаях положительно частотные решения уравнения (13.1.59) с конечной нормой 5 Автор признателен P. Yip за сообщение этой формы внутреннего произведения-
13.1» Спиноры в пространстве-времени Минковского 507 относительно внутреннего произведения (13.1.63) образуют гильбертово пространство. Естественное действие ISL(2,C) на фА1—л* порождает неприводимые представления класса (а), характеризуемого посредством га2 и s = п/2. Для целых s эти представления являются точными представлениями группы Пуанкаре, и приведенное выше построение могло бы быть переформулировано с использованием только обычных тензорных полей. Однако для полу целых s эти представления ISL(2,C) являются всего лишь представлениями с точностью до знака группы Пуанкаре, и использование спин-тензорных полей существенно. Когда т = 0 представление, выделенное уравнением (13.1.59), становится приводимым, за исключением случая 5 = 0. Неприводимые представления в классе (Ы) с s > 0 получаются из уравнения (Penrose 1965b) дЛ'1А1ФА1"'Лп=0, (13.1.64) где фА1—А* полностью антисимметричен и п = 2s. (Представления с отрицательными s получаются с помощью комплексного сопряжения уравнения (13.1.59).) Для s = \ ток ]АА\ф,ф) = фА'фА (13.1.65) может быть использован, как и ранее, для определения внутреннего произведения. Для s > | необходимо ввести потенциалы (Penrose 1965b), и невозможно записать калибровочно инвариантное выражение для вектора тока. Однако может быть получено простое выражение для внутреннего произведения в импульсном пространстве (Barg- mann, Wigner 1948). И снова, полученные таким образом унитарные представления являются точными представлениями группы Пуанкаре в том и только в том случае, когда s целое. Заметим, что в случае s = \ уравнение (13.1.59), записанное в форме (13.1.60) и (13.1.61), известно как уравнение Дирака, и пара спиноров (фА,&А') называется дираковским спинором. Выбором базиса в спинорном пространстве и обозначением четырех компонент (фл,&А') как гр0, ^!, ^2» Фз соответственно, координатная запись уравнений (13.1.60) и (13.1.61) приводит к обычной форме уравнения Дирака (задача 2). Подобным образом, уравнение (13.1.64) в случае s = \ известно как уравнение для нейтрино (Вейля). Заметим, что, как утверждалось в разд. 12.4, дираковский вектор тока (13.1.62) с фА = фА представляет собой сумму двух направленных в будущее изотропных векторов и значит, является направленным в будущее времениподоб- иьщ вектором, в то время как вектор тока нейтрино (13.1.65) направлен в будущее и изотропный. И наконец, мы обращаем внимание на
508 Глава 13. Спиноры то, что уравнение (13.1.64) в случае s = 1 эквивалентно уравнениям Максвелла (задача 3), а в случае 5 = 2- лианеризованному уравнению Эйнштейна (задача 6). В итоге мы обнаружили, что спин-тензорные поля порождают все унитарные с точностью до фазы представления группы Пуанкаре, которые, как предполагается, обладают физическим смыслом. Это говорит о том, что поля наиболее общего типа в пространстве-времени Минковского, которые могут возникнуть в "специально ковариантной" квантовой теории, являются спин-тензорными. Как бы то ни было, мы завершили предварительное рассмотрение, касающееся общей мотивации введения спинорных полей. 13.2 Спиноры в искривленном пространстве-времени В предыдущем разделе мы определили понятие спинорного поля на пространстве-времени Минковского. Наше определение было мотивировано тем, что естественное действие группы Пуанкаре на спинорные поля и спин-тензорные поля приводило к искомым представлениям с точностью до фазы группы Пуанкаре. Таким образом, "трансформационное свойство" (13.1.64) относительно Пуанкаре-изометрий было неотъемлемой составной частью нашего определения спинорных полей на пространстве-времени Минковского и использовалось для отождествления вещественных спин-тензорных полей типа (1,0; 1,0) с векторными полями. Однако группа Пуанкаре не обладает естественным действием на искривленном пространстве-времени, поэтому очевидно, это характерное свойство спинорных полей не может быть непосредственно перенесено в искривленное пространство-время. Таким образом, нашей целью будет переформулировать понятие спинорного поля так, чтобы оно было применимо в искривленном пространстве-времени и, разумеется, сводилось в пространстве-времени Минковского к понятию спинорного поля, введенному в предыдущем разделе. Поскольку искривленное пространство-время общего вида не обладает изометриями или любыми другими предпочтительными классами диффеоморфизмов, и поскольку даже в пространстве-времени Минковского не существует естественного действия полной группы диффеоморфизмов на спинорные поля, мы не можем рассчитывать на определение "закона преобразования" типа (2.2.10) относительно диффеоморфизмов для спинорных полей в искривленном пространстве- времени. Однако, так же как в пространстве-времени Минковского, мы
13.2. Спиноры в искривленном пространстве-времени 509 может представить наблюдателя вместе с его измерительными приборами в точке (событии) х искривленного пространства-времени (/W,ga6) ортонормированной тетрадой в х. Следовательно, с двумя различными наблюдателями 0\ и Ог в х связано преобразование Лоренца, которое вращением превращает тетраду 0\ в тетраду Ог. Заметим, что это преобразование Лоренца действует на касательном пространстве Vx, а не на пространственно-временном многообразии М. Мы попытаемся определить спиноры в х так, чтобы существовало связанное с каждым преобразованием Лоренца спинорное преобразование фА(х) •-> ±ЬАвфв(х) (13.2.1) такое, что результаты всех измерений спинора ±Lab^b{x) в х, выполненных Ог, были идентичны результатам всех измерений фА, выполненных 0\. (Опять же, неопределенность знака в (13.2.1) преодолевается, если выбрана непрерывная кривая, соединяющая преобразование Лоренца с единичным элементом.) Таким образом, формулируя понятие спинора в искривленном пространстве-времени, мы заменим действие (13.1.41) группы Пуанкаре изометрий на пространстве-времени Минковского действием (13.2.1) группы Лоренца на касательном пространстве в каждой точке. Строгую математическую основу для определения спинорных полей на искривленном пространстве-времени предоставляет теория расслоенных пространств. Поэтому мы приступаем к определению общего понятия главного расслоенного пространства и ассоциированных с ним расслоений. Затем будет описано построение спинорного расслоения. Пусть G - группа Ли, и В - многообразие, рассмотрим С°° отображение ф : G х В ь-> В. Будем записывать ф^,р) как 0g(p). Отображение ф называется левым действием G на В, если (i) для каждого фиксированного g E G отображение фя : В ь-► В является диффеоморфизмом, и (ii) для всех gx,g2 € G справедливо фё1 о фё2 = </>glg2. Примером левого действия G на многообразии В = G является левая трансляция, рассмотренная в разд. 7.2. Из (ii) следует, что для произвольного левого действия ф справедливо соотношение фе ° Фе = Фе, где е - единичный элемент, которое (при композиции с ф~1) означает, что фе - это просто тождественное отображение на В. Кроме того, это Значит, что ф%-\ = ф~1 для всех g £ G. Левое действие ф называется свободным, если для произвольного g ф е отображение ф% не имеет неподвижных точек в В, т.е. если для всех р Е В и g ф е справедливо фё(р) Ф р. (С другой стороны, поскольку фе есть тождественное °тображение, мы получаем фе(р) = Р для всех р G В.) Так, например, левая трансляция является свободным действием G на многообразии
510 Глава 13. Спиноры G. Для всякой точки р Е В множество О = {0g(p)|g € G} называется орбитой этой точки при относительно G. Легко видеть, что условие принадлежности двух точек в В одной и той же орбите элемента g определяет отношение эквивалентности точек, так что В можно представить как объединение орбит без пересечений. В сущности главное расслоение представляет собой многообразие, которое локально (но не обязательно глобально) "выглядит подобно" произведению Gx М группы Ли G и многообразия М. Точнее говоря, главное расслоение (В, G, М, ф) состоит из многообразия В (называемого пространством расслоения), группы Ли G (называемой структурной группой), многообразия М (называемого базой расслоения) и свободного левого действия ф : G х В •—► В, удовлетворяющих следующим двум свойствам: (i) орбиты G находятся во взаимно однозначном соответствии с точками М, и проекция 7г : В ■—> М, которая присваивает каждой р £ В точку М, ассоциированную с орбитой точки р, принадлежит классу С°°. (ii) Любая точка х € М имеет открытую окрестность U такую, что существует диффеоморфизм 'ф, переводящий тг"1^] € В в G х U так, что действие G на я""1^] соответствует умножению слева на GxU; т.е. если ф(р) = (g,x),TO V>[</y(p)] = (gfg,x). Рис. 13.2 иллюстрирует сущность главного расслоения. Заметим, что всегда справедливо: dim(B) = dim(G) -f dim(M). 1 ! \ ! *-1м i i \ iii i iii в r1[U] it Рис. 13.2. Диаграмма, иллюстрирующая структуру главного расслоения (см. текст) Таким образом, простой частный случай главного расслоения получается, если взять произведение В = G х М группы Ли G и многообразия М с левым действием G на В, определенным с помощью левого умножения, т.е. ф#^,х) = (gfg,x). Такое расслоение называют тривиальным. Один из простейших примеров нетривиального главного расслоения возникает, если в качестве В взять окружность 51, и в качестве G - группу Zi, состоящую из двух элементов е и а, таких, что
13.2- Спиноры в искривленном пространстве-времени 511 а2 -s е. (Так что G - нульмерная, несвязная группа Ли). Определим левое действие ф : Z2 x В *-+ В группы Z2 на окружности следующим образом: фе(в) = в и фа{в) = 0 + п. Значит, орбитами Z2 являются противоположные точки на окружности В, и совокупности орбит М можно придать структуру многообразия 51 так, что проекция 7г: В ь-> М является гладкой. Затем можно проверить, что (51,^2,51,0) является главным расслоением. Это расслоение не является тривиальным, поскольку В не диффеоморфно произведению многообразий G х М, состоящему из двух несвязанных окружностей. Расслоения В и G х М проиллюстрированы на рис. 13.3. G=z< ^ M=S1 (Ь) Рис. 13.3. (а) Тривиальное главное расслоение Zi x 51. (Ь) Главное расслоение (S1,^,^1,^), построенное в тексте Важным частным примером главного расслоения является расслоение реперов, определенное следующим образом. Пусть М - п-мерное многообразие, рассмотрим совокупность В пар (х, (vM)a), где х е М и (vM)° (/х = 1,...,п) - базис касательного пространства Vx. Можно определить структуру многообразия на В следующим образом. Если ф : U н-> Rn - карта на области U С М, мы получаем координатный базис (д/дх^У, связанный с ф. В любой точке х G U можно разложить каждый вектор (vM)a по этому базису, (v^)a = J2l/cttll/(d/dxu)a. Пусть U состоит из всех точек (х, (vM)a) £ В при х £ £/. Определим t:U*-> Rn+n2 посредством ^(x,(^)a) = (^,a/). (13.2.2) Используем совокупность всевозможных отображений такого вида для определения семейства карт на В. Легко проверить, что эти карты совместимы и, таким образом, В превращается в многообразие размерности п + п2. Общая линейная группа в п измерениях, GL(n) состоит из °братимых линейных отображений, переводящих Rn в себя, а операция группового умножения определяется как композиция и действует G=Z, о о M=S1 («)
512 Глава 13. Спинора слева на В следующим образом. Рассмотрим матрицу А^и произвол^ ного A GGL(n) в каноническом базисе Rn. Определим Фа '- В »-* в в виде Ф (х, Ыв) = U £ (Л-'Г^ыА , (13.2.3) т.е. используем обратное отображение А~1 для преобразования базиса касательного пространства в х. Далее легко видеть, что ф является левым свободным действием GL(n) на J5, и что указанные свойства (i) и (ii) справедливы. Таким образом, (5,GL(n),M,0) представляет собой главное расслоение. Для некоторых многообразий М, например, для Rn, пространство расслоения имеет структуру GL(n)xM, т.е. расслоение реперов тривиально. С другой стороны, расслоение реперов других многообразий, таких как двумерная сфера 52, нетривиально. Подобным образом для многообразия М, на котором определена метрика gab с сигнатурой (р, q), можно построить расслоение ортпо- нормированных реперов. Изменения в рассмотренном выше построении заключаются только в том, что В состоит из пар (х, (ем)а), где х е М и (ем)а теперь представляет собой ортонормированный базис в Vx, и группа, которая действует на В, теперь является ортогональной группой 0(р,#), а не GL(n). В частности, для пространства-времени (M,gab) расслоение ортонормированных реперов имеет структурную группу 0(3,1) - несобственную группу Лоренца. Так же для ориентируемого, ориентируемого по времени пространства-времени мы можем построить расслоение ориентируемых по времени реперов с собственной группой Лоренца Л в качестве структурной группы. Для данных главного расслоения (£?, G, М, ф) другого многообразия F и (не обязательно свободного) левого действия х : G x F н-> F группы G на F существует общая процедура построения из В нового многообразия Е, в котором, в действительности, структурная группа G заменяется многообразием F. Чтобы сделать это, возьмем произведение многообразий В х F и определим левое действие гр группы G на В х F следующим образом: Ф[Ь,/\ = 1Ф,(ЪШ/)]- (13-2-4) Определим Е как множество орбит группы G на В х F. Существует естественная проекция р : Е i—► М, заданная формулой р(у) = тг(&)> где Ь € В такая, что (Ь, /) € В х F лежит на орбите у€Еи7г:В*-*М является проекцией на главном расслоении. Для произвольной окрестности U С М, удовлетворяющей свойству (ii) определения главного расслоения, р-1[£/] С Е гомеоморфно F х С/. Определим структу ру многообразия на Е требованием, чтобы эти гомеоморфизмы был и
j 3.2. Спиноры в искривленном пространстве-времени 513 диффеоморфизмами. Таким образом, Е локально "выглядит подобно" f х М в том же самом смысле, в котором В локально "выглядит подобно" GxM. Многообразие Е вместе с большим числом структур на /J, определенных с помощью В, G, М, 0, F и х> называется расслоением или, более точно, расслоением, ассоциированным с (£,G, M, ф) со слоем F и групповым действием \. Для каждой точки х G М подмножество р~1(х) С £, называемое a/ioeAi над х, диффеоморфно F. Может показаться, что приведенные построения и определения чересчур сложны, и расслоения представляют собой чрезвычайно специфический класс многообразий. Однако на самом деле целый ряд многообразий может быть выражен естественным и очень удобным способом как расслоения. Взгляд с позиций расслоенных пространств оказался полезен при доказательстве теорем по топологии многообразий (Steenrod 1951). Для данного главного расслоения (В, G, М, ф) можно взять F = G, а в качестве Xg левую трансляцию. Результирующее ассоциированное расслоение Е диффеоморфно В, поэтому всякое главное расслоение также может быть рассмотрено как ассоциированное расслоение. Другой очень простой пример расслоения, ассоцированного с главным расслоением (jB,G, M, 0), получается, если F - произвольное многообразие, и х ~ тривиальное действие Xg(f) = / Для всех g € G и f e F. Результирующее расслоение Е диффеоморфно произведению F х М слоя F и базы М. Расслоение, которое диффеоморфно FxM, называется тривиальным. Простой пример нетривиального расслоения, ассоциированного с главным расслоением (S^^S1,^), рассмотренным выше, со слоем F = R получается при следующем действии Z^ = {e, а} на R. Положим по определению Хе(х) = я, Ха{х) = — х для всех х £ R. Результирующее расслоение Е "локально выглядит подобно" цилиндру R х 51, но обладает тем свойством, что R-слои "переворачиваются с ног на голову" при прохождении один раз по кривой, проекцией которой в базе М = sl является окружность. Многообразие Е называется листом Мёбиуса и может быть построено также путем отождествления точек плоскости R2 посредством (х,у) = (х + 1, —у). Важный пример расслоения, ассоциированного с расслоением реперов n-мерного многообразия М получается следующим образом. Возьмем F = Rn, и пусть GL(n) действует на Rn естественным образом, т.е. для а = (а1,..., ап) е Rn и A G GL(n) по определению п (Хл(а))" = Е^а". (13.2.5) /х=1 Каждой точке (x,(v^)a;au) многообразия В xRn можно поставить в
514 Глава 13. Спиноры соответствие вектор в точке х е М. Для заданных действий (13.2.3) и (13.2.5) группы G на В и на Rn легко видеть, что две точки из В х Rn соответствуют одному и тому же вектору va ъхъ том и только в том случае, когда они лежат на одной орбите (13.2.4). Таким образом, точки ассоциированного расслоения Е находятся во взаимно однозначном соответствии с парами (х, va), где х € М и va £ Vx. Мы назовем Е касательным расслоением к М и обозначим его через Т(М). Если Т(М) тривиально, назовем М параллелизуемым. Расслоение Tkj(M) тензоров типа (&,/) над М может быть построено аналогично, если в качестве F взять тензорное произведение Fk,i из к экземпляров Rn и / экземпляров его дуального пространства (Rn)*, в качестве \ ~ естественное действие GL(n) на Fk,u заданное согласно = J2 ^^...^^Л^-1)^^...^-1^^^1^^..^. (13.2.6) Если на М задана метрика gab с сигнатурой (р,д), мы также можем построить Tkyi(M), ограничиваясь ортонормированными базисами, т.е. взяв в начале главное расслоение ортонормированных реперов и определив действие 0(p,g) на Fk,i с помощью (13.2). Таким образом, рассмотренные построения предоставляют нам новый взгляд на касательные векторы: касательный вектор в точке х на многообразии М представляет собой точку касательного расслоения Т(М), лежащую в слое над х, т.е. точку у € Т(М) такую, что р(у) = х- В более общем смысле, тензор типа (А:, /) в х е М представляет собой точку в слое над х расслоения Tkj(M) тензоров типа (А;,/). Гладкое тензорное поле на М является поперечным сечением Tkj(M), т.е. С°° отображением E:Mi-> Tk,i(M) таким, что р о Е есть тождественное отображение на М. Заметим, что такая точка зрения на тензоры довольно близка по духу к описанию в гл. 2 в терминах тензорного закона преобразования (2.3.8). Там было отмечено, что то, как изменяются компоненты тензора в координатном базисе при преобразовании координат, могло быть использовано для характеристики этого тензора- Здесь точка в В х Fk,i представляет собой совокупность пк+1 чисел, связанных с точкой х € М и (не обязательно координатным) базисом касательного пространства точки х. Действие группы (13.2) может
13.2- Спиноры в искривленном пространстве-времени 515 быть рассмотрено как указание того, как эта совокупность чисел изменяется при замене базиса. Класс эквивалентности совокупности чисел при изменениях базиса в х является точкой в Tkj(M), т.е. тензором в #. И тензорный закон преобразования, и описание тензоров с точки зрения расслоений имеют небольшое преимущество перед данным в гЛ. 2 непосредственным определением тензоров как мультилинейных отображений. Однако, поскольку аналогичного прямого определения спиноров не существует, мы должны стремиться определить спиноры некоторым опосредованным образом через указание их поведения при преобразованиях SL(2,C), связанных с изменениями ортонормирован- ного базиса. Обратимся теперь к этой задаче. Основная идея построения спинорных полей в искривленном пространстве-времени (M,ga6) состоит в том, чтобы начать его с главного расслоения ориентированных, ориентированных по времени ортонор- мированных реперов так, что каждый слой диффеоморфен собственной группе Лоренца. Затем мы "разворачиваем" каждый слой, чтобы создать главное SL(2,C) расслоение над М. Таким образом, спинорное расслоение строится как расслоение, ассоциированное с этим главным расслоением со слоем F = С2, а в качестве \ взято естественное действие SL(2,C) на С2. В таком случае спинор в х может быть определен как точка в слое над х £ М спинорного расслоения. Однако, если пространство-время М обладает нетривиальной топологией, в этом построении могут возникнуть сложности. Сначала рассмотрим случай, когда М является односвязным. Тогда М ориентируемо и ориентируемо по времени, поэтому трудности в построении главного расслоения (£, Л, М, ф) ориентированных, ориентированных по времени базисов не возникает. Теперь рассмотрим замкнутую кривую 7 в В, Поскольку М односвязно, кривая 7Г07, полученная проецированием кривой 7 на М, непрерывным деформированием может быть превращена в тривиальную кривую, проходящую через х, т.е. кривую е(£) = х для всех t. Это означает, что в В кривая 7 может быть непрерывно деформирована в кривую, целиком лежащую в слое 7г_1[а;] над я. Однако этот слой диффеоморфен собственной группе Лоренца Л, и 7rx(A) = Z2. Таким образом, в общем случае можно было бы ожидать, что существуют именно два различных класса эквивалентности гомотопных замкнутых кривых в В. Однако в нем возможно существование только одного класса эквивалентности гомотопных замкнутых кривых, т.е. В односвязно. Хотя кривая в слое над я, соответствующая вращению базиса пространства Vx на угол 27г, не может быть Деформирована в тривиальную кривую и при этом остаться в слое НЗД х, для некоторых многообразий эта кривая может быть непрерывно деформирована в тривиальную кривую в В смещением ее из
516 Глава 13. Спиноры слоя над х. Другими словами, может оказаться, что вращение тетрады на 27Г может быть "расцеплено" перемещением тетрады вдоль од- нопараметрического семейства замкнутых кривых, проходящих через х в М. Если В односвязно, понятие спинора на М не мооюет быть определено^. Причина заключается в том, что невозможно непротиворечиво предписать изменение знака спинора при вращении базиса на 27г, если это вращение может быть непрерывно деформировано к тождественному преобразованию. Известны примеры многообразий, для которых В односвязно (Geroch 1968a). Известно также (Milnor 1963; Clarke 1971), что В оказывается не односвязным, т.е. п\(В) = Z<i, и спиноры могут быть определены в том и только в том случае, когда второй класс Штифеля-Уитни (Steenrod 1951) обращается в нуль. Доказано, что если М некомпактно, тогда к\{В) = Zi в том, и только в том случае, когда М параллелизуемо (Geroch 1968)7. Найдены другие эквивалентные критерии (Geroch 1968a, 1970a; Clarke 1971). Если tti(B) = Z2, определим спиноры на М следующим образом. Универсальное накрывающее многообразие В для В имеет естественную структуру главного расслоения со структурной группой SL(2,C). Спинорным расслоением S(M) назовем расслоение, ассоциированное с (B,SL(2,C),M,0) со слоем С2, с действием \ь элемента L e SL(2,C) на С € С2, определенным естественным образом: МС)]Е = £>Vr. (13.2.7) Г=1 Спинор в х G М определяется как точка из S(M), лежащая в слое над х. Аналогично определяется расслоение ST^T>^(M) спин-тензоров типа (&,/;&',/'), если в качестве F взять тензорное произведение к экземпляров С2, I экземпляров его дуального пространства С2*, к1 экземпляров его комплексно сопряженного пространства Си/' экземпляров его комплексно сопряженного дуального пространства С • Действие \ на с ль..л, л;...л;, е * 6Тем не менее можно определить "обобщенные спиновые структуры" (Avis, Isham 1980). 7Поскольку О(п) и О(пД) имеют фундаментальную группу Zi для всех п > ^ можно определить аналогичные понятия спиноров для риманова и лоренцева нр°" странств размерности больше 2 и 3. Задача 1 для риманова случая п = 3. Оиреде" лены спиноры в двумерных пространственно-временных многообразиях, где 0(1»*/ односвязно (Yip 1983). Критерий параллелизуемости применим только к четыреХ" мерным пространственно-временным многообразиям.
j3.2. Спиноры в искривленном пространстве-времени 517 задается так: Мс)]Е1-...л;/ = £ L^r1.-.(I"1)AJ'Aj/cr--...Aj,. (13.2.8) Г1...л;; Аналогично, после того, как введено понятие спинора, могут быть определены спин-тензоры в терминах линейных (или антилинейных) отображений на спинорном пространстве способом, аналогичным построению обычных тензоров из векторов в гл. 2. Как и в предыдущем разделе мы будем использовать прописные латинские буквы для обозначения индексов спин-тензоров. Данное определение спиноров довольно трудно для понимания, так что могут быть полезны некоторые разъяснения. Сначала напомним, что точка в В состоит из точки х £ М вместе с ориентированным, ориентированным по времени ортонормированным базисом в х. Если мы фиксируем некоторый базис {(ем)а} в х, точка в В может быть рассмотрена как состоящая из точки х £ М вместе с непрерывным, одно- параметрическим семейством ориентированных, ориентированных по времени базисов в rr с отправным {(ем)°}, в тех случаях, когда два таких семейства полагаются эквивалентными, если имеют одну и ту же начальную точку и гомотопны. Другими словами, слой в В над х может рассматриваться как состоящий из всех ориентированных, ориентированных по времени ортонормированных базисов в х вместе с их вращениями на 27г. Точка в5хС2 представляет собой пару комплексных чисел, связанных с х и базисом или базисом в х, повернутым на 27г. Действие группы Xgi заданное уравнением (13.2.7), описывает то, как эти числа "преобразуются" при смене базиса. Каждый класс эквивалентности преобразованных чисел и базисов в х, т.е. каждая орбита действия Xgi задаваемая уравнением (13.2.4), определяет спинор в х. Таким образом, конструкция расслоения представляет собой именно тот способ, который позволяет реализовать понимание спинора как упорядоченной пары комплексных чисел, преобразующихся согласно естественному представлению SL(2,C) при смене базиса". Заметим, что С2 обладает более богатой структурой, чем структура комплексного двумерного векторного пространства; например, оно имеет естественное внутреннее произведение и понятие вещественной и мнимой части векторов. Однако для формирования структуры сло- ев спинорного расслоения S(M) остаются только те свойства С2, ко- т°Рые сохраняются при действии SL(2,C). Так, например, поскольку сУЩествуют элементы SL(2,C), которые переводят вещественные век- °Ры из С2 в комплексные векторы, естественного понятия веществен- °й и мнимой частей спинора в а; не существует. Однако, поскольку
518 Глава 13. Спиноры отображения SL(2,C) линейны, они сохраняют сложение и скалярное произведение, поэтому спиноры в х обладают естественной структу, рой двумерного комплексного векторного пространства. Кроме того только элемент e^r G С2* ® С2* (а также объекты, построенные из него), заданный матрицей (13.1.20), сохраняется при действии SL(2,C) поэтому единственной дополнительной структурой спиноров является структура тензора елв типа (0,2;0,0). Таким образом, каждый слой расслоения S(M) имеет в точности естественную структуру спинорно- го пространства (W, елв)- Заметим, что не существует естественного способа отождествить различные слои расслоения S(M), т.е. нельзя сказать, что спинор в х £ М "тот же самый", что спинор в у Е М, как невозможно сказать, что два касательных вектора в различных точках "одинаковые". Однако известно, что означает для спинора гладкое изменение от точки к точке: гладкое спинорное поле есть просто (гладкое) поперечное сечение расслоения S(M). Связь между спин-тензорными полями типа (1,0; 1,0)'и векторными полями можно увидеть следующим образом. Фиксируем изоморфизм а между вещественными элементами С2 (8) С и R4, как приведено в формуле (13.1.30), для которого лоренцева метрика е^л^'Л' на Re(C2 ® С ) переводится в лоренцеву метрику diag(l,—1, —1,-1) на R4. Тогда естественное 2 в 1 отображение В на, В создает 2 в 1 отоб- ражение а' из В х Re(C2 <8>С ) на В х R4. Кроме того, о' коммутирует с естественными действиями групп ip и ф на этих пространствах, т.е. справедливо а' о фь = фА о о, где Л - элемент группы Лоренца, ассоциированный с L € SL(2,C). Следовательно мы получаем (взаимно однозначное) соответствие а между орбитами SL(2,C) в JBxRe(C2(g>C ) и орбитами группы Лоренца в В х R4. Таким образом, мы получаем в свою очередь отождествление вещественного подмножества множества Si,o;i,o(M) с Т(М); т.е. вещественные спин-тензоры типа (1,0; 1,0) отождествлены с векторами. Как и в предыдущем разделе, мы включим это отождествление в наши обозначения, допуская вместо точной записи baAA,vAA запись vAA для обозначения вектора. При этом пространственно-временная метрика связана с елв соотношением ёАА'ВВ' = еАвёА'В'- (13.2.9) В том случае, когда пространственно-временное многообразие М не односвязно, анализ возможности определения спиноров довольно сложен. Во-первых, М может не быть ориентируемым или ориентируй мым по времени. В этом случае расслоение В ориентированных, opw ентированных по времени реперов не существует, и понятие спипоу*
t3#2. Спиноры в искривленном пространстве-времени 519 не может быть определено8. Если М ориентируемо и ориентируемо по времени, мы можем построить В, но не можем построить Б, взяв универсальное многообразие, накрывающее В, поскольку это означало бы "развернуть" М а также слои в В. Чтобы идея развртки только слои В имела смысл, необходимо, чтобы фундаментальная группа расслоения В имела вид прямого произведения *i(B)=g1xg2, (13.2.10) где G\ - фундаментальная группа 7Ti(A) = Z2 группы Лоренца, и G2 - фундаментальная группа тт\{М) многообразия М. (Здесь прямое произведение G = Gi х G2 групп G\ и G2 определяется как группа, состоящая из упорядоченных пар (gi,g2), где gx e Gi, g2 € G2, с законом композиции (gi,g2)(ei>£2) = (Si&n 821^2)-) кР°ме того, из уравнения (13.2.10) понятно, что каждый элемент подгруппы ъ\(В) вида (ft^), где е2 - единичный элемент из G2, гомотопен замкнутой кривой g1? лежащей в пределах одного слоя группы Лоренца, тогда как каждый элемент (ei,g2) подгруппы дает в проекции замкнутую кривую g2 € 7Ti(M) в М. Заметим, что в этом случае, когда М односвяз- но, уравнение (13.2.10) сводится к нашему предыдущему критерию 7Г(В) = 7Ti(A) = Z2. Если 7п(В) не допускает представления (13.2.10), понятие спинора не может быть определено на М. С другой стороны, если ж\(В) имеет вид (13.2.10), мы можем построить (неуниверсальное) накрывающее многообразие В многообразия В, определяя эквивалентность двух замкнутых кривых, проходящих через точку b G В, условием: их композиция гомотопна замкнутой кривой вида (ei»&)« Тогда В имеет естественную структуру главного SL(2,C) расслоения над М, и возможно перейти к определению спиноров на М тем же способом, как и в том случае, когда М односвязно. И опять-таки, Следует еще раз подчеркнуть, что термин "спиноры" здесь означает SL(2,C) спиноры. Подобными построениями можно определить другие типы спиноров, ес- ли начинать с других расслоений реперов. В частности, пусть В в ориентируе- мым по времени, но необязательно ориентируемом пространстве-времени обозначает расслоение ориентированных по времени ортонормированных реперов. Тогда СтРуктурная группа представляет собой несвязную группу, полученную композицией преобразований группы Лоренца с преобразованием "четности". Действие ** накрывающей группы на четырехмерном комплексном векторном простран- Стве может быть задано с помощью обычных формул преобразования дираков- Ских спиноров. Таким образом, понятие (4-компонентного) дираковского спинора может быть определено на неориентируемых пространственно-временных много- ^Разиях. В случае ориентрируемого пространственно-временного многообразия, краковские спиноры естественно изоморфны парам (^*,<7д'), состоящим из 2- °Мпонентного спинора фА и комплексно сопряженного дуального спинора <тд/, ^к отмечено в конце разд. 13.1.
520 Глава 13. Спинорь, при предположении, что М ориентируемо и ориентируемо по времени спиноры могут быть определены (т.е. ni(B) имеет вид (13.2.10)) в том и только в том случае, когда второй класс Штифеля - Уитни для А/ обращается в нуль. Более того, если вдобавок М некомпактно, спиноры определены в том и только в том случае, когда М параллелизуемо (Geroch 1968a; Clarke 1971). Стоит отметить еще одну особенность того случая, когда М не односвязно. Разложение к\(В) в прямое произведение подгрупп вида (13.2.10) может не быть единственным, и каждое отдельное разложение приводит к отдельному понятию спинора на М. Причина этого заключается в следующем. Каждый элемент из tti(B) соответствует классу эквивалентности переносов тетрад вдоль замкнутых кривых в М. Представив тт\{В) в виде (13.2.10), мы, в действительности, утверждаем, что переносы тетрад вида (ei,g2) не приводят к вращению тетрады, тогда как переносы вида (a\,g2), гДе ai не совпадает с единичным элементом группы 7Гх(Л) = Z2, соответствуют вращению тетрады на 2я\ Предположим теперь, что т*\ (М) имеет нормальную подгруппу9 Н с факторгруппой10, изоморфной Z2. Тогда мы можем определить G2 как подмножество в 7Ti(B), состоящее из всех элементов либо вида (е, h), либо вида (a,6/i), где h е Н и Ь £ Н. Далее легко проверить, ЧТО G'2 ЯВЛЯеТСЯ ПОДГРУППОЙ ГруППЫ TTi(B), ИЗОМОрфнОЙ 7Ti(M), И ЧТО 7Ti(B) имеет вид gx x G2. Мы можем использовать это разложение, чтобы определить накрывающее пространство В', и использовать В' для определения спиноров. При таком новом разложении тг\(В) замкнутые кривые в В вида (a,bh) теперь соответствуют отсутствию вращения тетрады в М, тогда как кривые вида (е, bh) теперь соот- ветствуют^вращению на 27г. Спиноры на М, определенные по отношению к В, не изменяют знак при таком переносе вдоль замкнутой кривой bh e 7Ti(M) в М, при котором компоненты его изотропного флага (13.1.37) по отношению к базису, связанному с (е,ЬЛ) Е 7Ti(S), остаются постоянными. А спиноры, определенные по отношению к В , изменяют знак при таком же переносе. Таким образом, в зависимости от структуры группы 7Ti (M) могут существовать несколько различных 9 Подгруппа Н группы G называется нормальной, если ghg 1 € Н для всех g € " и ЛЕЯ. 10Если подгруппа Н нормальная, для орбит, полученных естественным левым действием Н на G и называемых правыми смежными классами, может быть определена структура группы с законом композиции ciC2 = с, где с - смежный класс подгруппы Я, содержащий gxik» £1 € ci, g1 G c\. (Подгруппа Я с необходим0" стью должна быть нормальной, чтобы этот закон композиции не зависел от выбора представляющих элементов gx, g2.) Эта группа смежных классов называется факторгруппой подгруппы Я и обозначается G/H.
13.2. Спиноры в искривленном пространстве-времени 521 способов11 определить спиноры в том смысле, что может существовать свобода выбора: изменяют или не изменяют свои знаки спиноры при переносе вдоль некоторых замкнутых кривых в М. Например, если 7Г1(М) = ^2, то, если спиноры вообще могут быть определены, существуют два неэквивалентных определения. С другой стороны, если 7Г1(М) = ^з (циклическая группа из трех элементов), то определение спиноров единственное. Теперь обратимся к определению дифференцирования спиноров в искривленном пространстве-времени. Как уже отмечено выше, в искривленном пространстве-времени не существует естественного отождествления спинорных пространств, отвечающих различным точкам, так же, как естественным образом невозможно отождествить касательные пространства различных точек. Тем не менее в гл. 3 мы ввели понятие оператора дифференцирования обычных тензорных полей и обнаружили, что существует единственный оператор Va, ассоциированный с метрикой gab согласно условию Vagbc = 0. К тому же при заданном операторе дифференцирования мы получаем понятие параллельного переноса, т.е. отождествления касательных пространств в различных точках в зависимости от кривой. Это понятие параллельного переноса тензорных полей, полученное из Va, порождает единственное понятие параллельного переноса спиноров12, а именно, мы назовем спинор параллельно перенесенным вдоль кривой, если его изотропный флаг (13.1.37) параллельно перенесен, и кроме того, сам спинор скачком не меняет знак (напомним, что непрерывность спинорного поля - строго определенное понятие.) Это понятие параллельного переноса далее может быть использовано для нахождения производных спиноров вдоль кривой 7» поскольку спинор в 7(£) теперь можно сравнить со спинором в 7(^ + Й) с помощью параллельного переноса, и это в свою очередь приводит к возникновению единственного понятия спинорного оператора дифференцирования V^as переводящего спин-тензорные поля типа (k,l\k',V) в спин-тензорные поля типа (кJ + 1;А/,Г + 1). Этот оператор дифференцирования будет удовлетворять свойствам, аналогичным (1) — (3) разд. 3.1 для оператора дифференцирования Количество различных способов определения спиноров совпадает с количеством нормальных подгрупп 7ri(M) с факторгруппой Z?,. Последнее в свою очередь совпадает с количеством генераторов группы когомологий HX(M\Z^) (Isham 1978). 2Более последовательно это можно продемонстрировать, переформулировав понятие параллельного переноса на языке связностей на главном расслоении и ассоциированных с ним расслоениях (Bishop, Crittengen 1964). Связность на В приводит к возникновению связности на В, которая в свою очередь порождает связность на S{M).
522 Глава 13. Спиноры обычных тензорных полей, при этом в (3) свертка производится по спинорным индексам. Кроме того, оказывается, что применение V^A, к обычным тензорным полям согласовано с оператором дифференцирования Va, ассоциированным с метрикой gab, а значит, в частности, и свойства (4) - (5) удовлетворяются для Vaa'- В дополнение к этому ^ АА' удовлетворяет двум дополнительным условиям: (1)_для произвольного спин-тензорного поля ф справедливо (V^) = VV>, т.е. VAA, является "вещественным"; (ii) Vaa'^bc = 0 = Vaa'£BC- Заметим, хотя оператор дифференцирования Va, удовлетворяющий Vag6c = О, является всего лишь одним из широкого класса операторов дифференцирования тензорных полей, большая часть других операторов дифференцирования не может быть обобщена для применения к спинорным полям, потому что для них параллельный перенос изотропного флага не будет, вообще говоря, сохранять вид изотропного флага. Если оператор спинорного дифференцирования применить дважды к дуальному спинорному полю ас и антисимметризовать по индексам производной, тот же самый довод, который был использован в гл. 3 при определении тензора Римана, доказывает, что полученное в результате спин-тензорное поле в точке х Е М зависит только от значения а<? в х. Поэтому существует спин-тензорное поле Xaa'BB'CD такое, что для произвольного дуального спинорного поля ас справедливо (Vaa'Vbb' - Чвв'Чаа')<*с = Xaa*bb'CDold. (13.2.11) Применим этот коммутатор к спин-тензору асас1-, содержащему дуальный вектор, используя правило Лейбница и свойство вещественности (i) оператора Vaa*- Записывая формулу (3.2.3) для произвольного асасч устанавливаем: Raa'dd'CC =XAA'BBfcDec/D +Xaa'bb'CD ecD, (13.2.12) где Raa'dd'CC ~ спинорный эквивалент тензора Римана. Доводы, подобные тем, что привели к (3.2.12), показывают, что для произ вольного спин-тензорного поля ас1...с1С ...с, с "нижними индексами справедливо i (VaA'^bB' ~ VbB'V^aO^Ci-.C;, = /JXAA'BB'CiD^Cl...D...C't,Jr г=1 + Ехдл<вв<с,'°'«с1.../>'...с,</. (132ЛЗ) г=1
13.2. Спиноры в искривленном пространстве-времени 523 Нетрудно получить обобщение уравнения (13.2.13) для спин-тензорных полей с "верхними индексами", поднимая индексы в обеих частях уравнения (13.2.13) с помощью еЕС> и 1Е'с'к Антисимметрия Rabcd по отношению к двум последним индексам с учетом уравнений (13.2.12) и (13.1.46) означает, что Xaa'bb'CD является симметричным по отношению к С и D. Поскольку Rabcd антисимметричен по отношению к двум первым индексам, доводы, которые привели к уравнению (13.1.50), ведут к тому, что Xaa'bb'CD можно представить в виде XAA'BB'CD = f^ABCD^A'B' + ^A'B'CD^AB, (13.2.14) где &ABCD = &(AB)(CD) (13.2.15) и $A'B'CD = $(A'B'){CD)- (13.2.16) Подставляя эти результаты в (13.2.12), обнаруживаем, что симметрия тензора Римана Rabcd = Rcdab означает вещественность $a'B'Cd- &ABCD' = $C'D'AB (13.2.17) и f^ABCD удовлетворяет соотношению AaBCD = &CDAB- (13.2.18) Вследствие уравнения (13.2.18) величина еАС Aabcd обладает антисимметрией по индексам В и D и, следовательно, должна быть кратной eBD. Определим Wabcd формулой Vabcd = &ABCD - Л {еАсево + eBCeAD), (13.2.19) где Л = ±eACeBDAABCD. (13.2.20) Тогда по построению спин-тензор Vabcd удовлетворяет условию eAC*ABCD = 0. (13.2.21) ^ учетом остальных симметрии Aabcd это означает, что Ф abcd полностью симметричен *ABCD = *(ABCD). U3.2.22)
524 Глава 13. Спиноры И наконец, вычисления с использованием (13.1.36) показывают, что симметрия тензора Римана Ra[bcd\ = О означает вещественность Л, Л = Л. (13.2.23) Таким образом, мы обнаружили, что XAA'BB'CD = ^ABCDtA'B1 +&A'B'CD€AB+A(€ac£BD + tBCtAD)eA'B', (13.2.24) и отсюда мы получаем следующее спинорное разложение тензора Римана: RaA'DD'CC = ^АВС tA'B'tC + $А'В'С САВёс + +Л (caccbd + cbccad) £a'B'£cD + к.с, (13.2.25) где к.с. обозначает комплексное сопряжение предыдущих слагаемых. Для получения тензора Риччи свертываем по индексам БиДа также по В' и D'. В результате получаем Raa'CC = -2Фа>сас + 6ЛбЛ'В'<ис. (13.2.26) Это показывает, что — 2Фагсас есть просто спинорный эквивалент бесследового тензора Риччи Rab + \Rab, где теперь мы определяем R = —RabRabi чтобы учесть совершенное изменение сигнатуры метрики, и в связи с этим достичь согласования с определением гл. 3. (Изменение сигнатуры метрики в этой главе не влияет на определения Rabc и Rab-) Более того, уравнение (13.2.26) показывает, что Л = -Д/24. Используя эти результаты и сравнивая разложение (13.2.25) с (3.2.28), мы находим, что спинорный эквивалент Caa'BB'CCDD' тензора Вейля Cabcd есть просто CaA'BB'CC'DD' = VABCDtA'B'ec'D' + ФA'B'C'D'^AB^CD- (13.2.27) Мы будем называть Wabcd спинором Вейля. Разложение (13.2.24) для Xaa'BB'CD позволяет переписать уравнение (13.2.11) таким образом, чтобы разделить влияние кривизны Риччи и Вейля на спиноры. Сверткой уравнения (13.2.1) с еАВ получаем Va(A'Vb*)A<*c = bA'B'CDctD, (13.2.28) где мы использовали тождество (13.1.46) для получения левой части этого уравнения и формулу (13.2.24) для получения правой части. С другой стороны, при свертке уравнения (13.2.11) с еА в , получаем VA'(aVB)A'olc = *abcD(*d - 2ЛбС(даБ). (13.2.29)
13.2. Спиноры в искривленном пространстве-времени 525 Два уравнения (13.2.28) и (13.2.29) эквивалентны уравнению (13.2.11). Для последующих ссылок отметим, что обобщение уравнения (13.2.29) на случай n-индексного спинора Фах...ап имеет вид п Vл'(лVв)Л 0Ci...Cn = /, {^АВС^ФСх...Р...Сп - i=l - 2AeCi{A<l>\c1...ci-1\B)ci+1...cn} .(13.2.30) Заметим также, что общее тождество (13.1.52) означает выполнение соотношения Va>[aVb]A' = слвЦ (13.2.31) где D = V^VAA\ Теперь мы имеем возможность объяснить спинорную мотивацию формализма Ньюмена-Пенроуза разд. 3.4. Вместо ортонормированно- го базиса касательного пространства в каждой точке выберем базис £о = °А-> £\ — %А спинорного пространства в каждой точке, нормированный так, что оАгА = 1. (13.2.32) Вместо нахождения 24 вещественных коэффициентов вращения Рич- чи с помощью уравнения (3.4.14) найдем 12 комплексных спиновых коэффициентов 7гд'ЕЛ = (£г)А(£ь.)А\&)вЧАА'(и)В. (13.2.33) Здесь Г, Д', Е, Л принимают значения 0,1. Используя правило Лейбница и уравнение (13.2.32), можно показать, что 7гд;ел симметричны по индексам Е и Л, поэтому уравнение (13.2.33) действительно определяет 12 независимых комплексных величин. Разработаны особые обозначения для каждого спинового коэффициента (Newman, Penrose 1962). Окончательно вместо выражения (3.4.17) тетрадных базисных компонент тензора Римана через коэффициенты вращения Риччи, выразим спинорные базисные компоненты 4?abcd, Фа'В'СО и Л через спиновые коэффициенты, используя (13.2.11) — (13.2.24). Действуя таким образом, мы должны получить уравнения, эквивалентные (3.4.21) гл. 3. Но только явный вид этих уравнений, записанных покомпонентно, был бы намного проще по виду, чем (3.4.21), если бы для каждого коэффициента вращения Риччи и каждой компоненты кривизны использовалась ^Дельная буква (как в уравнении (4.2) упомянутой работы Ньюмена- Пенроуза).
526 Глава 13. Спиноры Как можно найти значения спиновых коэффициентов, определенных (13.2.33)? Или, в более общем смысле, как рассчитать производные Vа А' произвольных спин-тензоров? Напомним, что оператор спи- норного дифференцирования V а А' > соответствующий тензорному оператору дифференцирования Va, удовлетворяющему Vagab = 0, является единственным разумным оператором для спиноров, так что аналога оператора "обычной производной" Эаа' не существует. Поэтому для спиноров не существует аналога методов координатного базиса, используемых для тензоров. Тем не менее мы можем найти значения спиновых коэффициентов (13.2.33), используя формулу (Дж.Фридман, не опубликовано) 7дд'ел = {&)в¥аа'(£а)В = = \ £ *Т'*\Ъг)в>ЫвЧаа' [(Ы*(1дОВ'1 , (13.2.34) которую можно проверить по правилу Лейбница для производной выражения в квадратных скобках и по формуле (13.2.32). Однако выражение в квадратных скобках является векторной величиной, т.е. {аа' = %ача' (13.2.35) и пАА' = оАоА' (13.2.36) являются изотропными векторами, тогда как ^АА' _ аА-=А' тАА =%АЪА (13.2.37) ЩАА =0А-А (13.2.38) представляют собой комплексные линейные комбинации пространст- венноподобных единичных векторов хаа' = 1 (jA'oA+tAoA'), (13.2.39) уЛА' = 1(-гА'0А_гАъА-у (13.2.40) Таким образом, спиновые коэффициенты могут быть выражены через Va/b, Van6, Vax6 и Vayb, которые вычисляются стандартными методами. В самом деле, спинорное исчисление целиком может быть пере*
13.2. Спиноры в искривленном пространстве-времени 527 формулировано как тетрадное исчисление, использующее комплексную изотропную тетраду /а, па, гаа и гаа. Как только найдены спиновые коэффициенты, может быть вычислена производная произвольного спин-тензорного поля ip. Сперва следует разложить ф по базису, состоящему из гл, оА и их комплексных сопряжений, а затем по правилу Лейбница, можно выразить VV> через производные (скалярных) базисных компонент и спиновых коэффициентов. Для иллюстрации спинорных методов мы получим сейчас алгебраическую классификацию тензора Вейля (Penrose I960). В разд. 7.3 утверждается, что в пространственно-временных многообразиях алгебраически общего вида тензор Вейля допускает четыре различных главных изотропных направления, удовлетворяющих уравнению (7.3.1), тогда как в пространственно-временных многообразиях алгебраически специального вида некоторые из этих изотропных направлений совпадают и удовлетворяют более сильным условиям, приведенным в табл. 7.1. Мы не пытались доказать эти утверждения в гл. 7, потому что непосредственное доказательство тензорными методами достаточно сложное. Однако алгебраическая классификация тензора Вейля спинорными методами удивительно проста. Рассмотрим спинор Вейля Vabcd и фиксируем базис гА, оА спинорного пространства со свойством oaia = 1. И при этом гА выбран так, что *ABCDiAiBiCtD = 1. (13.2.41) Пусть z Е С, положим аА = ггА + оА (13.2.42) и рассмотрим величину f(z) = *ABCD<*AaBacaD. (13.2.43) Поскольку / - полином четвертой степени относительно 2, и коэффициент при z4 согласно (13.2.41) равен 1, мы можем представить / в виде следующего разложения на сомножители f(z) = (z- Cl)(z - c2)(z - c3)(z - c4). (13.2.44) Пусть (Ki)A = 0A + сцА, i = 1,2,3,4. (13.2.45) Тогда справедливо z - a = (щ)лаА (13.2.46)
528 Глава 13. Спино, Ры и, следовательно, мы установили, что существуют четыре спинопа («г)даЛ, называемых главными спинорами, такие, что уравнение ^abcdolaolbolcoP = {кх)А{к2)в^ъ)с{к^0аАовоссоР (13.2.47) выполняется для всех аА вида (13.2.42) и следовательно для всех спиноров аА. Однако, поскольку спинор Вейля полностью антисимметричен (см. уравнение (13.2.22)), это может быть справедливо в том и только в том случае, когда Vabcd = («1)(л(«2)в(«з)с(«4Ь)- (13.2.48) Таким образом, мы получаем общее разложение спинора Вейля как симметризованное произведение четырех главных спиноров. Заметим, что кА является главным спинором в том и только в том случае, когда VabcdkAkBkCkD = 0. (13.2.49) Кроме того, кА повторяется 2, 3 или 4 раза, т.е. возникает 2, 3 или 4 раза в разложении (13.2.48) тогда и только тогда, когда справедливо, соответственно, VabcdkAkBkC = 0 (2 раза), (13.2.50) Vabcd*AkB = 0 (Зраза), (13.2.51) *abcdkA = 0 (4раза). (13.2.52) Если кл является главным спинором, изотропный вектор кАА' = кАкА' (13.2.53) называется главным изотропным вектором. Условия (13.2.49)-(13.2.52) для кА теперь могут быть преобразованы в условия для ка табл. 7.1 (задача 5). Таким образом, мы вывели алгебраическую классификацию разд. 7.3. Мы завершаем этот раздел поиском обобщения на случай искривленного пространства-времени уравнений для полей массы т и спина 5, справедливых в пространстве-времени Минковского. Наиболее естественное обобщение этих уравнений получается "минимальной подстановкой": заменой Эаа' всюду на Vaa1- Однако для т > 0 эта подстановка дает неэквивалентные результаты при применении к уравнению (13.1.59) или к уравнениям (13.1.60) - (13.1.61). Вариант с уравнением (13.1.59) в случае искривленного пространства-времени имеет кор-
j3.2. Спиноры в искривленном пространстве-времени 529 рентную постановку начальной задачи, но ток (13.1.62) более не сохраняется. С другой стороны, для s = ^ уравнения VAA«/>A = ^аАЧ (13.2.54) ЧАА'аА,= ™фА (13.2.55) имеют корректную постановку начальной задачи (задача 8), и ток (13.1.62), обобщенный на случай искривленного пространства-времени, сохраняется. Следовательно, мы принимаем уравнения (13.2.54) и (13.2.55) в качестве обобщения уравнения Дирака для искривленного пространства-времени. Подобный результат имеет место для 5=1. Однако, когда s > 1, вариант с уравнениями (13.1.60) — (13.1.61) в случае искривленного пространства-времени не имеет корректной постановки начальной задачи (Buchdal 1962). Подобным образом, в искривленном пространстве-времени уравнение для спина s и га = 0 ^л1А'1ФА1"'Ап=0 (13.2.56) имеет корректную постановку начальной задачи для s = \ и для s = 1 (в последнем случае оно эквивалентно уравнениям Максвелла в искривленном пространстве-времени), но, как мы увидим ниже, не имеет для s > 1. Таким образом, естественное обобщение уравнений для s > 1 с плоского на искривленный случай не дает физически жизнеспособных полевых моделей в искривленном пространстве-времени. Чтобы доказать, что уравнение (13.2.56) не допускает корректной постановки начальной задачи, когда s > 1, сначала отметим, что уравнения (13.2.56) и (13.2.31) предполагают, что фА1—Ап должно удовлетворять волновому уравнению ПфА1~'А* = 0. (13.2.57) Однако, в отличии от ситуации в плоском пространстве-времени, если уравнение (13.2.57) выполняется всюду в пространстве-времени, и уравнение (13.2.56) выполняется на начальной поверхности, это не означает, что уравнение (13.2.56) выполняется всюду. Действительно, сворачивая уравнение (13.2.56) с VA*iA2 и используя фА1—А** = = </>(л1-л"), получаем = VA[{A2VAl)A'^A^-A" =
530 Глава 13. Спиноры = (п - 2)ФЛ1л2сс(Лз^И1Л2С|Л4-Лп), (13.2.58) где в последней строке было использовано уравнение (13.2.30). Уравнение (13.2.58) представляет собой чисто алгебраическое условие, которому фЛ1'"Ап должно удовлетворять всюду в пространстве-времени. Заметим, что оно не сохраняется при эволюции, задаваемой уравнением (13.2.57), т.е. даже если уравнение (13.2.58) и его производные по времени выполняются для фА1—Ап на начальной поверхности, то нет причины утверждать, что уравнение (13.2.58) будет выполняться для решения уравнения (13.2.57), возникающего при таких начальных условиях. Значит в искривленном пространстве-времени общего вида будет существовать очень мало решений уравнения (13.2.56), если таковые вообще найдутся. Таким образом, для s > 1 не существует естественного обобщения на случай искривленного пространства-времени понятия "чисто" безмассового поля со спином s. Задачи 1. SU(2) спиноры. Как отмечено в сноске к тексту, сходные понятия спиноров возникают для всех римановых и лоренцевых пространств достаточно высокой размерности. В частности, мы можем определить спиноры в обычном трехмерном пространстве Евклида следующим образом. Пусть W - двумерное комплексное векторное пространство, на котором задана эрмитова метрика, т.е. для которого имеется вещественный тензор Gaa1 > удовлетворяющий Gaa'^J Фа > 0 для всех фА ф 0. Определим GAA посредством GAA' /or A и снабдим cab масштабным множителем, если это необходимо, таким, чтобы удовлетворялось 6 GaA'GbB' =ёА'В'- Как и ранее, мы используем еАВ и cab для поднятия и опускания индексов. Теперь мы можем использовать Gaa' и Gaa , чтобы преобразовать штрихованные индексы в нештрихованные. Определим оператор \ следующим образом (ФиА-\..в = сА,А...св'вфА'-\„в,.
13.2. Спиноры в искривленном пространстве-времени 531 Группа SU(2) определяется как группа унитарных отображений в W с единичным детерминантом, т.е. как подгруппа SL(2,C), состоящая из отображений Uab, удовлетворяющих условию (U\)AB = (U~X)AB. Следуя аналогии с рассуждениями разд. 13.1, показать, что (a) двухиндексные симметричные спиноры фАВ = фВА, являющиеся самосопряженными (ф\)АВ = ФВА, образуют трехмерное вещественное векторное пространство, на котором ^AiA2eBiB2 представляет собой отрицательно определенную метрику; (b) SU(2) является универсальной накрывающей группой группы вращений SO(3). Следует отметить, что, если задана пространственноподоб- ная гиперповерхность в пространстве-времени, можно использовать нормальный вектор паа1 в каждой точке для определения эрмитовой метрики Gaa' = у/2паа'- Следовательно, на этой гиперповерхности можно ассоциировать спинорное пространство SL(2,C) пространства-времени со спинорным пространством SU(2) гиперповерхности. Это дает возможность получить "3+1 расщепление" спиноров (Sen 1982). 2. Выбрав спинорный базис оА, гА, удовлетворяющий одгл = 1, выписать компоненты уравнения Дирака (уравнения (13.1.60) — (13.1.61) при п = 1). Показать, что наш вариант уравнения Дирака эквивалентен его стандартной форме, приведенной в большинстве книг. 3. В соответствии с уравнением (13.1.50) вещественный антисимметричный тензор Fab может быть записан в виде FaA'BB' = ФаВ^А'В' + Фа'В'€АВ1 где Фав = Ф{ав)- Показать, что Fab удовлетворяет уравнениям Максвелла (4.2.23) и (4.2.24) без источников в том и только в том случае, когда фАВ удовлетворяет уравнению (13.1.64). 4. Показать, что уравнение (13.1.64) обладает корректной постановкой начальной задачи в пространстве-времени Минковского, действуя следующим образом:
532 Глава 13. Спиноры (a) Показать, что уравнение (13.1.64)) предполагает, что справедливо ПфА1-Ап — 0. (b) Используя теорему 10.1.2, показать, что если всюду в пространстве-времени справедливо ПфА1'"Ап = 0, а уравнение (13.1.64) и его нормальная производная пвв двв^длгЛ^ * хфА1'-Ап) = 0 удовлетворяются на начальной гиперповерхности, тогда выполняется уравнение (13.1.64). (c) Показать, что если ПфА1,,,Ап = 0 и уравнение (13.1.64)) выполняется в начальный момент времени, тогда двв'дл^^ х хфАх...ап = о в начальный момент времени выполняется автоматически. (Указание: гцьдс] можно применить к уравнению (13.1.64) в начальный момент времени. Используйте это для доказательства того, что в начальный момент времени двв'длгА'^1 "Лп имеет вид пвв'&а'^2'"^- Покажите, что выражение такого вида может быть ненулевым для време- ниподобного пвв тогда и только тогда, когда оно остается ненулевым при свертке с ев Al). В результате уравнение (13.1.64) эквивалентно уравнению ПфА1~-л" = 0 (которое имеет корректную постановку начальной задачи) вместе с уравнением (13.1.64), которое выполняется только в качестве начального условия. 5. Показать, что условия (13.2.49) — (13.2.52) для главных спиноров можно переписать в условия для соответствующих главных изотропных направлений в согласии с табл. 7.1. 6. Показать, что в пустом пространстве-времени (Даь = 0) тождество Бианки V[aRbc]da = 0 принимает вид Vaa'^abcd = 0. В частности, это означает, что линеаризованное относительно плоской метрики Минковского уравнение Эйнштейна имеет следствием, что линеаризованный спинор Вейля удовлетворяет уравнению для безмассового поля со спином 2. (Фактически для заданного решения уравнения (13.1.64) в случае 5 = 2 найдется возмущение метрики 7оЬ (единственное с точностью до калибровочного преобразования), удовлетворяющее линеаризованному уравнению Эйнштейна без источников (4.4.11) и (4.4.12), таким, что соответствующий спинор Вейля совпадает с заданным решением. Таким образом, уравнение (13.1.64) для s = 2 эквивалентно уравнениям (4.4.11) и (4.4.12)). 7. Решить задачу 6 гл. 4 с использованием спинорного разложения тензора Вейля, включая доказательство того, что Tabcd = T(abcd)-
13.2. Спиноры в искривленном пространстве-времени 533 8. Показать, что уравнения (13.2.54) и (13.2.55) эквивалентны (□ + т2 - ЩфА = 0. Это уравнение общего вида, к которому применима теорема 10.1.2. Отсюда, в частности, следует, что уравнение Дирака в искривленном пространстве-времени имеет корректную постановку начальной задачи.
Глава 14 Квантовые эффекты в сильных гравитационных полях В гл. 4 показано, что общая теория относительности выдвинула революционно новый взгляд на структуру пространства-времени и гравитационное взаимодействие. Однако в одном важном отношении эта теория недостаточно революционна. Хорошо установлено, что все известные физические поля должны быть описаны на фундаментальном уровне принципами квантовой теории. В квантовой теории состояния системы представляются векторами гильбертова пространства W, а наблюдаемые величины представляются самосопряженными линейными отображениями, действующими в Н. Если состояние системы не является собственным вектором наблюдаемой, эта наблюдаемая не принимает в данном состоянии определенное значение, можно предсказать только вероятности результатов измерений такой наблюдаемой в данном состоянии. Однако общая теория относительности представляет собой чисто классическую теорию, поскольку в рамках общей теории относительности наблюдаемые величины (в частности, метрика пространства-времени) всегда имеют определенные значения. Таким образом, если принципы квантовой теории применять к гравитационному полю, общая теория относительности должна быть в лучшем случае лишь приближением к истинно фундаментальной теории гравитации, возможно, подобно тому, как теория электромагнетизма Максвелла есть только приближение к квантовой электродинамике. Классическое описание обычной материи является в целом превосходным приближением для описания явлений, происходящих в макроскопических масштабах, хотя для надлежащим образом приготовленных состояний квантовые эффекты могут быть важны даже в этих масштабах. Однако классическое описание материи становится полностью неадекватным в атомных и меньших масштабах. В этом случае масштаб, на котором классическое описание теряет справедливость, определяется массами и зарядами фундаментальных частиц, а также двумя фундаментальными физическими постоянными, входящими в теорию, а именно, постоянной Планка h и скоростью света с. Подобным образом в квантовой теории гравитации, основанной на общей теории относительности, можно было бы ожидать, что фунда-
536 Глава 14. Квантовые эффекты в сильных гравитационных полях ментальный масштаб, на котором классическое описание становится полностью неадекватным, должен был бы определяться постоянными /1,си гравитационной постоянной G. Существует единственная комбинация этих постоянных с размерностью длины, а именно, величина lp = (G^/c3)1/2, называемая длиной Планка. Как можно было бы ожидать, планковская длина должна возникать естественным образом при попытке сформулировать квантовую теорию гравитации. Таким образом, соображения размерности наводят на мысль, что классическое описание структуры пространства-времени теряет справедливость в масштабах порядка длины Планка и меньших. В системе единиц СГС значение длины Планка составляет всего лишь ~ 10~33см. (Соответствующие планковские масштабы других величин, таких как время и энергия, даны в прилож. F.) Малость 1р по сравнению с типичными масштабами длин, возникающими в физике атомов, ядер и элементарных частиц, напрямую связана со слабостью гравитационного взаимодействия двух элементарных частиц по сравнению с другими фундаментальными силами, а именно, сильным, слабым и электромагнитным взаимодействиями. Планковские масштабы лежат на много порядков ниже тех, которые в настоящее время достижимы на ускорителях высоких энергий. Поэтому может оказаться, что развитие квантовой теории гравитации (цель, несомненно достойная усилий) едва ли будет иметь существенное отношение к каким-либо наблюдаемым в настоящее время явлениям. Тем не менее существуют по меньшей мере две серьезные причины полагать, что предсказания квантовой теории гравитации могут прямо относиться к явлениям, имеющим масштаб, доступный в настоящее время. Первое соображение возникает в теории элементарных частиц. Широко распространено убеждение, что истинная фундаментальная физическая теория достигнет объединения взаимодействий, описав их просто как различные проявления единой сущности. Объединение классических теорий электричества и магнетизма было достигнуто более века назад Максвеллом. Не так давно теория Вайнберга - Салама дала успешное единое описание слабого и электромагнитного взаимодействий. В настоящее время существует уверенность, что "модели великого объединения" могут успешно объединить сильное и электрослабое взаимодействия. Объединение же гравитации и сильно- электрослабого взаимодействий было бы следующим логическим шагом в этой программе. Интересно, что естественный масштаб длины, возникающий в теориях великого объединения, всего на несколько порядков величины превышает 1р. Таким образом, вполне возможно, что квантовая теория гравитации может играть существенную роль даже в
537 объединении сильного и электрослабого взаимодействий. Единая теория всех сил без сомнений могла бы привести к предсказанию новых явлений на современных масштабах наблюдений1. Второе соображение возникает непосредственно в самой общей теории относительности. Как обсуждается в гл. 9, пространственно-временные сингулярности возникают в решениях классической общей теории относительности, имеющих отношение к гравитационному коллапсу и космологии. Поэтому в этих ситуациях классическое описание структуры пространства-времени теряет справедливость. В частности, нельзя ожидать, что однородные изотропные модели гл. 5 адекватно описывают нашу Вселенную в режиме, когда они предсказывают кривизну величиной 1\ или выше, т.е. для t < tp = (Gh/c5)1/2 ~ 10~43 секунд. Таким образом, представляется, что развитие квантовой теории гравитации будет существенным требованием для нашего понимания начального состояния Вселенной. Нельзя исключить возможность, что явления, возникающие в очень ранней Вселенной, которые могут быть поняты только в рамках квантовой теории гравитации, могут стать основой для предсказаний (проверяемых наблюдениями) о структуре современной Вселенной. Однако, даже если квантовая гравитация не приведет к предсказаниям явлений, которые можно наблюдать при современном уровне экспериментальной техники, формулировка квантовой теории гравитации несомненно имела бы огромное значение для теоретической физики. Действительно, классическая общая теория относительности обеспе- *3а время, прошедшее после выхода данной книги, убежденность научного сообщества в возможности построения объединенной теории всех фундаментальных взаимодействий только усилилась. Суперсимметрия (см., например, книгу [I.L. Buchbinder, S.M. Kuzenko, Ideas and Methods of Supersymmetry and Supergravity Or a Walk Through Superspace, IOP Publishing, Bristol and Philadelphia, 1998, 656 pages] и приведенную там библиографию) обеспечила естественный механизм объединения бозонов и фермионов. Сформулированы суперсимметричная стандартная модель электрослабых взаимодействий и суперсимметричные модели великого объединения (см., например, [М. Drees, R.M. Godbole, P. Roy, Theory and Phenomenology of Sparticles: An account of four-dimensional N=1 supersymmetry in high energy physics, World Scientific, 2004, 555 pages]; [P. Binetruy, Supersymmetry: theory, experiment and cosmology, Oxford University Press, 2006, 520 pages]). Построена супергравитация (см., например, книгу [I.L. Buchbinder, S.M. Kuzenko, Ideas and Methods of Supersymmetry and Supergravity Or a Walk Through Superspace, IOP Publishing, Bristol and Philadelphia, 1998, 656 pages] и приведенную там библиографию), представляющая собой суперсимметричную теорию гравитации, объединяющую на классическом уровне гравитационное поле с другими физическими полями. Дальнейшее развитие идей объединения связано с теорией суперструн (см., например, [М.В. Green, J.H. Schwarz, E. Witten, Superstring Theory, Cambridge University Press, 1987, русский перевод М. Грин, Дж. Шварц, Э. Виттен, Теория суперструн, в 2-х томах, М.: Мир, 1990 ]).- Прим.ред.
538 Глава 14. Квгштовые эффекты в сильных гравитационных полях чила нас главными новыми взглядами на устройство природы, несмотря на то, что сделанные ею новые предсказания, поддающиеся проверке наблюдениями, относительно скромны. Новые фундаментальные взгляды, выработанные квантовой теорией гравитации, конечно, будут не менее значительными, чем те, что выработала общая теория относительности. Как будет показано в разд. 14.1, все известные процедуры для формулировки квантовой теории поля, связанные с квантованием классической теории, упираются в трудности при применении к общей теории относительности. Таким образом, формулировка жизнеспособной квантовой теории гравитации остается целью на будущее. Тем не менее существует вполне удовлетворительная теория свободного (т.е. линейного) квантованного поля материи, распространяющегося на фиксированном пространственно-временном фоне. Хотя такая теория является в лучшем случае только приближением к полной квантовой теории гравитации с квантовой материей, предсказанные ею эффекты по крайней мере могли бы служить хорошим указанием на возможные типы квантовых явлений, ожидаемых в сильных гравитационных полях. В частности, в разд. 14.2 описано, как эта теория предсказывает рождение частиц сильным гравитационным полем. При применении такого эффекта к гравитационному полю черной дыры (разд. 14.3) обнаруживается, что за счет рождения частиц черная дыра ведет к тепловому излучению при температуре кТ = Нк/2тг, где к - поверхностная гравитация черной дыры. Что означает этот результат для взаимосвязи черных дыр и термодинамики, исследовано в разд. 14.4. 14.1 Квантовая гравитация Распространено убеждение, что верное фундаментальное описание всех физических полей дается в рамках общей квантовой теории поля. В квантовой теории поля состояния системы описываются векторами гильбертова пространства Ж, а физическое поле - оператором (т.е. линейным отображением) в Ж, определенным в каждой пространственно-временной точке. Однако, если в обычной нерелятивистской квантовой механики Шредингера, где при заданном гамильтониане системы всегда можно сделать предсказания, хорошо определенные, хотя и вероятностные, то при попытке сформулировать квантовую теорию поля возникают серьезные затруднения. Многие из этих затруднений отслеживаются до той точки, в которой оказывается, что даже для свободного поля выражение, полученное для полевого оператора, не имеет математического смысла, поскольку оператор опре-
14.1. Квантовая гравитация 539 делен в каждой точке пространства-времени, но должен интерпретироваться как распределение на пространстве-времени (см. разд. 14.2 далее). Это соответствует тому физическому факту, что поле нельзя измерить в одной точке; физически определенными являются только усредненные по пространственно-временным областям значения поля. В случае свободного поля это не вызывает серьезных проблем, и можно построить полностью определенную квантовую теорию поля. Однако в более интересном случае теории с взаимодействием (т.е. в случае, когда поле или поля удовлетворяют нелинейным уравнениям) с неизбежностью приходится рассматривать произведения полевых операторов в одной и той же точке пространства-времени. Такие величины не имеют естественного математического смысла, и как следствие, за исключением некоторых простых моделей в пространственно-временных многообразиях низших размерностей, в настоящее время не известны примеры квантовых теорий поля, где взаимодействие полей приемлемо с физической точки зрения и корректно определено математически. Однако, хотя строгая формулировка теории взаимодействующего квантового поля неизвестна, можно формально трактовать взаимодействия как возмущения полностью определенной теории свободного поля. Таким образом, можно получить формальные разложения физических величин в степенные ряды по "константе взаимодействия" (т.е. коэффициенту при нелинейном члене взаимодействия в уравнении). Однако в общем случае формальные выражения для отдельных членов степенных рядов при попытке их вычисления дают расходящийся результат, как и следовало ожидать, поскольку строгая теория, служащая основой для этой теории возмущений, плохо определена. Тем не менее можно ввести обрезание расходящихся выражений, чтобы получить конечные ответы. Это, разумеется, оставляет теорию в неудовлетворительном состоянии, поскольку предсказанные значения всех физических величин зависят от выбранных параметров обрезания. Однако может оказаться, что в пределе больших параметров обрезания зависимость всех физических величин от параметров обрезания будет идентичной их зависимости от так называемых голых параметров (таких как массы, заряды и константы взаимодействия), которые изначально присутствуют в теории. Если это имеет место, можно перейти к пределу, когда параметры обрезания стремятся к бесконечности, одновременно переопределив голые параметры так, чтобы получить желаемые конечные ответы для определенных физических величин. Подобным образом получаются конечные выражения для каждого члена степенного ряда теории возмущений для всех физических величин, но только с тем же самым числом свободных параметров в
540 Глава 14. Квантовые эффекты в сильных гравитационных полях теории, которое изначально присутствовало в классическом варианте. Если это имеет место, теория называется перенормируемой, и широко распространено убеждение, что физически жизнеспособные квантовые теории поля должны быть перенормируемыми (или по меньшей мере удовлетворять свойствам, близким к перенормируемости; (Weinberg 1979)). Квантовая электродинамика (т.е. квантовая теория поля Дирака, взаимодействующего с электромагнитным полем) перенормируема, а высокая точность ее предсказаний относительно нескольких первых членов ряда теории возмущений в согласии с экспериментами служит наилучшим количественным свидетельством в пользу убеждения, что квантовая теория поля дает правильное описание природы. Теория электрослабого взаимодействия Вайнберга-Салама и "квантовая хро- модинамика" (т.е. теория кварков, взаимодействующих с глюонами) - это тоже перенормируемые квантовые теории поля, и считается, что они точно описывают природу. Однако состояние дел, Относящихся к проблеме точной формулировки даже перенормируемых теорий поля, неудовлетворительное. Только отдельные члены ряда теории возмущений хорошо определены, и имеются веские основания считать, что весь ряд теории возмущений является расходящимся 2. Существует несколько подходов к формулировке квантовой теории поля для данной классической полевой модели, заданной в терминах лагранжиана или гамильтониана. Однако общая теория относительности достаточно сильно отличается от других классических теорий поля, и как мы обсудим более подробно ниже, подходы, которые были испытаны для формулировки квантовой общей теории относительности, все сталкиваются с бесчисленными принципиальными затруднениями. Существенное отличие между общей теорией относительности и другими классическими теориями поля заключается в той двойственной роли, которую играет поле даь, будучи величиной, описывающей как динамические аспекты гравитации, так и фоновую пространственно-временную структуру. Поэтому для того, чтобы проквантовать динамические степени свободы гравитационного поля, необходимо также дать квантово-механическое описание структуры пространства-времени. Последняя проблема не имеет аналогов в других квантовых теориях поля, которые сформулированы на фоне фиксированного пространства-времени, трактуемого классически. 2Детали процедуры перенормировки в квантовой теории поля, о которой говорит автор, обсуждаются, например, в книгах [Н.Н. Боголюбов, Д.В. Ширков, Введение в квантовую теорию квантованных полей, Наука. М.:, 1976], [С. Itzykson, J.-B. Zuber, Quantum Field Theory, McGraw-Hill, 1980; русский перевод К. Ициксон, Ж.-Б. Зюбер, Квантовая теория поля, в 2-х томах, Мир, М.: 1984].- Прим. ред.
14.1. Квантовая гравитация 541 Существо затруднений, вызванных двойственной ролью даь, пожалуй лучше всего иллюстрирует следующий простой пример. Квантовая теория поля в пространстве-времени Минковского начинается с фундаментального положения о том, что полевой оператор V>, соответствующий классическому полю ф с целочисленным спином, заданный в пространственно-временных точках, разделенных пространственно- подобным интервалом, должен коммутировать сам с собой. То есть для х и х\ связанных пространственно-подобным интервалом3, справедливо [#(*), #(я')] = ${x)${x') - ф(х')ф(х) = 0. (14.1.1) (Это уравнение выражает тот факт, что измерение ip в х' не может влиять на значение гр в х.) Далее, как отмечено в разд. 4.4 и задаче 6 гл. 13, линеаризованная теория гравитации является просто теорией безмассового поля со спином 2 в пространстве-времени Минковского. Таким образом, мы можем рассматривать общую теорию относительности как теорию самодействующего поля со спином 2. По аналогии с квантовыми теориями поля в плоском пространстве-времени было бы естественно ожидать, что оператор поля метрики ga6 должен удовлетворять коммутационному соотношению &а(*)>Ы*)] = 0 (14-1.2) для х и х', разделенных пространственно-подобным интервалом. Однако в этом уравнении нет смысла, так как мы не знаем, разделены ли а; и а;' пространственноподобно до тех пор, пока не узнаем метрику, и уравнение (14.1.2) является операторным уравнением, которое, если оно справедливо, должно выполняться независимо от состояния гравитационного поля, т.е. независимо от величины (или вероятности распределения) метрики. Выражаясь обобщенно, понятие причинности в целом становится плохо определенным, если отбросить понятие классической метрики пространства-времени. Таким образом, некоторые фундаментальные результаты, которые полагаются справедливыми для всех других квантовых теорий поля, оказываются неприменимыми к общей теории относительности. Различия между общей теорией относительности и другими теориями поля, а также трудности с причинностью, которые возника- 3Как отмечено выше, на самом деле мы должны трактовать гр как распределение. Строго говоря, уравнение (14.1.1) следует заменить на [V>(/),^(s)l = 0, когда носители пробных функций / и g разделены пространственно-подобным интервалом.
542 Глава 14. Квантовые эффекты в сильных гравитационных полях ют, когда метрика пространства-времени не имеет определенного значения, указывают на то, что возможно принципы квантовой теории не применимы к гравитации - что классическая общая теория относительности является точной теорией на фундаментальном уровне. Однако эта точка зрения представляется несостоятельной, поскольку пространственно-временная метрика связана с материальными источниками. Допустим, что пространственно-временная структура описана классическим пространством-временем (M,go6), и что квантовая теория применима к полям материи. Какова кривизна пространства- времени, связанная с данным квантовым состоянием материи? Если классическое уравнение Эйнштейна справедливо в пределе, когда распределение материи может быть описано классически, то наиболее естественным кандидатом для квантового варианта уравнений Эйнштейна (с классически трактуемой гравитацией) будет4 Gab = 8тг(Та6>, (14.1.3) где (Таь) обозначает среднее значение оператора энергии-импулься Таъ в данном квантовом состоянии. Теперь рассмотрим состояние материи такое, что с вероятностью 1/2 вся материя находится в некоторой пространственно-временной области Oi, и с вероятностью 1/2 материя помещается в области Ог, которая не пересекается с 0\. В соответствии с уравнением (14.1.3) гравитационное поле будет вести себя так, как будто половина материи находится в Oi, и оставшаяся половина -вОг. Предположим теперь, что мы производим измерение по определению положения материи. Тогда мы обнаружим материю либо целиком в области Oi, либо целиком в области Ог. Если уравнение (14.1.3) продолжает выполняться после того, как квантовое состояние материи определено в результате этого измерения, тогда гравитационное поле должно изменяться с разрывами и нарушением причинности. Таким образом, попытка трактовать гравитацию классически приводит к серьезным затруднениям. По-видимому этих затруднений можно избежать только при вероятностной трактовке пространственно- временной метрики, т.е. квантованием гравитационного поля так, чтобы в начальном состоянии метрика имела вероятность 1/2, соответствующую гравитационному полю материи в Oi, и вероятность 1/2, соответствующую гравитационному полю материи в Ог. 43аметим, что при постулировании полуклассического уравнения, подобного (14.1.3), утрачивается принцип суперпозиции для состояний материи, поскольку различные состояния материи связаны с различными пространственно- временными многообразиями.
14.1. Квантовая гравитация 543 Проблема формулировки квантовой теории гравитации является в настоящее время объектом активной деятельности многих исследователей. Мы ограничим наше обсуждение здесь очень кратким упоминанием основных подходов, которые были испробованы. Более подробное обсуждение этих подходов, как и намного более полное описание того круга задач, который связан с квантовой гравитацией и исследуется в настоящее время, можно найти в специальной литературе (Isham, Penrose, Sciama 1975, 1981; Hawking, Israel 1979). Ковариантный метод возмущений является, пожалуй, наиболее прямым подходом к формулировке квантовой теории гравитации. Запишем пространственно-временную метрику gab следующим образом: &Ь = г/а6 + 7а6, (14.1.4) где Т)аь - плоская метрика, и мы примем М = R4, чтобы (М,т]аь) было пространством-временем Минковского. (В более общем случае можно заменить (Е4,г/аь) любым решением (М, °gab) уравнения Эйнштейна.) В первом порядке малости по 7аб классическое уравнение Эйнштейна представляет собой уравнение для свободного поля со спином 2. Следовательно, как уже отмечено выше, мы можем рассматривать полное уравнение Эйнштейна (не предполагая, что 7а& "мало") как сумму этой "свободной" части и нелинейного члена самодействия; т.е. мы можем рассматривать уравнение Эйнштейна как уравнение для самодействующего поля 7аб со спином 2 в пространстве-времени Минковского (R4,^). Ковариантный метод трактует гравитацию, рассматривая ее как обычную "ковариантную в смысле Пуанкаре" теорию поля. Динамическая переменная 7аб обладает значительной калибровочной свободой, но известно, как получить разложение в ряд теории возмущений для квантовой теории "неабелевых" калибровочных полей этого типа (Фаддеев, Попов 1967; DeWitt 1967a,b). Таким образом, в этом подходе нет принципиальных препятствий, чтобы получить формальный ряд теории возмущений для того типа физических величин, которые обычно вычисляются в теориях поля в пространстве-времени Минковского. Заметим, что плоская фоновая метрика 7/аЬ, введенная в уравнении (14.1.4), трактуется этим подходом целиком классическим образом. Основная трудность, возникающая при ковариантном методе возмущений, заключается в том, что полученная для 7об теория возмущений неперенормируема. Действительно, неперенормируемость квантовой гравитации в ко- вариантной теории возмущений можно просто усмотреть в соображе- нях размерности. Параметром разложения в ряд теории возмущений
544 Глава 14. Квантовые эффекты в сильных гравитационных полях получается квадрат длины Планка5 /р. Поэтому члены ряда теории возмущений все более высоких порядков по 12Р должны иметь размерности соответствующих степеней и индекс условной расходимости (см., например,Со1етап 1973), отвечающий этим членам возрастает. Следовательно, не существует возможности взаимного уничтожения расходящихся выражений с соответствующими выражениями, присутствующими в классическом лагранжиане6. Таким образом, существует единственная надежда получить корректно определенный ряд теории возмущений без введения новых параметров: ряд теории возмущений конечен в каждом порядке, т.е. расходимости сократят друг друга, когда все вклады порядка /рп будут сложены вместе. На самом деле это происходит в низшем ("однопет- левом") порядке. Однако конечность не возникает в низшем порядке для гравитации, взаимодействующей с полями материи, и не ожидается в высших порядках квантовой теории свободной гравитации (Deser, van Nieuwenhuizen, Boulware 1975). Таким образом, представляется, что формулировка квантовой гравитации в рамках ковариантной теории возмущений не может привести ни к каким физически значимым предсказаниям. К тому же этот подход имеет несколько иных непривлекательных черт. Разбие- 5Классическое вакуумное уравнение Эйнштейна Gab = 0 не включает ньютоновскую гравитационную постоянную G. Однако G входит в квантовую теорию через нормировку 7аб> которая объясняет присутствие G (через 1р) в квантовой теории. 6Автор подразумевает применение квантово-полевой теории перенормировок к эйнштейновской теории гравитации. Поскольку в этой теории константа взаимодействия G имеет размерность обратной массы (в системе единиц, где скорость света и постоянная Планка равны единице), то стандартные рассуждения , основанные на понятии индекса условной расходимости, показывают, что данная теория не является (мультипликативно) перенормируемой, т.е. расходимости фейнмановских диаграмм не могут быть устранены переопределением (перенормировкой) гравитационного поля jab и гравитационной постоянной G в классическом лагранжиане теории. Можно показать, что индекс расходимости L- петлевой фейнмановской диаграммы в данной теории имеет вид ш = 2 -f 2L (L = 1,2,3,...), т.е. растет с ростом числа петель. Поэтому для устранения расходимостей в L- петлевых диаграммах требуются контрчлены, содержащие 2 + 2L пространственно-временных производных. С учетом общей ковариантности это означает, что к классическому лагранжиану эйнштейновской гравитации надо добавить бесконечное количество геометрических инвариантов все более высокого порядка по производным. Чтобы зафиксировать произвол в записи контрчленов, надо использовать бесконечное количество условий нормировки, для чего требуется зафиксировать результаты бесконечного числа экспериментов. Более подробное обсуждение проблемы расходимостей в квантовой теории гравитации дано,например, в статье Вайнберга [S. Weinberg, Ultraviolet divergences in quantum gravity theories, in "General Relativity", ed. by S.W. Howking and W. Israel, Cambridge University Press, 1979; русский перевод "Общая теория относительности", М.:, Мир, 1983 ].- Прим. ред..
14.1. Квантовая гравитация 545 ние метрики на фоновую метрику, трактуемую классически, и динамическое поле 7аб, которое квантуется, не вполне естественно с точки зрения классической общей теории относительности. Более того, теория возмущений, получаемая при таком подходе, будет в каждом порядке удовлетворять условиям причинности по отношению к фоновой метрике т]аь, а не истинной метрике gab. Хотя сумма ряда (если он сходится) все же могла бы удовлетворять приемлемым условиям причинности, ковариантная теория возмущений является не самым удобным способом прояснения роли пространственно-временной метрики в причинной структуре. И наконец, при этом подходе очень сложно даже сформулировать вопросы о таких явлениях, как квантовые эффекты вблизи начальной сингулярности Вселенной, поскольку обычные процедуры формулировки квантовых теорий поля в пространстве- времени Минковского эффективно предполагают, что взаимодействия "выключены" в отдаленном прошлом. С другой стороны, ковариант- ный подход имеет то преимущество, что можно получить конкретные выражения для физических величин в теории возмущений без необходимости развития совершенно новых концептуальных рамок7. Важный подход, который не прибегает к разрушению метрики пространства-времени, подобно (14.1.4), - метод канонического квантования. Этот подход к формулировке квантовой теории применим, если классическая теория приведена к гамильтоновой форме. Основная идея здесь заключается в следующем: (i) принять, что состояния системы описываются волновыми функциями Ф(д) конфигурационных переменных, (И) заменить каждую импульсную переменную дифференцированием по сопряженной конфигурационной переменной, (ш) определить временную эволюцию Ф с помощью уравнения Шре- дингера ihd^/dt = ЯФ, где Н - оператор, соответствующий классическому гамильтониану H(pyq). Точную формулировку этих правил для простых квантово-механических систем можно найти в учебниках (Ashtekar, Geroch 1974). В прилож. Е показано, что общая теория относительности формулируется в гамильтоновой форме, поэтому можно попытаться прило- 7Автор обсуждает возможность того, что 5-матрица, описывающая процессы рассеяния квантов гравитационного поля - гравитонов, является конечной без перенормировки. Это действительно имеет место в теории гравитации без материи в однопстлевом приближении и в N = 1 супергравитации в одно- и двухпетле- вом приближениях, (см., например, [S. Weinberg, Ultraviolet divergences in quantum gravity theories, in "General Relativity", ed. by S.W. Howking and W. Israel, Cambridge University Press, 1979; русский перевод "Общая теория относительности", М.:, Мир, 1983 ]).- Прим. ред..
546 Глава 14. Квантовые эффекты в сильных гравитационных полях жить к общей теории относительности правила канонического квантования. Однако наличие связи (Е.2.33) ведет к серьезным трудностям. Попытки разрешить эту связь (чтобы можно было получить конфигурационные переменные, представляющие только "истиные динамические степени свободы") или оставить ее в качестве дополнительного условия на вектор состояния не превели к существенному успеху. Таким образом, наличие условия связи (Е.2.33) в гамильтоновой формулировке общей теории относительности создает серьезное препятствие для вывода квантовой теории гравитации с помощью канонического подхода (Ashtekar, Geroch 1974; Kuchaf 1981)8. Другой важный подход к формулировке квантовой теории гравитации - метод интегралов по траекториям. Здесь точка зрения заключается в том, чтобы рассматривать амплитуды вероятности физических процессов (а не векторы состояний или операторы). Рассмотрим квантовую теорию поля ip на пространстве-времени Минковского, характеризуемую действием 5[^] (см. прилож.Е). Амплитуда вероятности перехода от полевой конфигурации ф\(х) на гиперповерхности t = t\ к полевой конфигурации ^г(^) на гиперповерхности t = £2 дается интегралом по траекториям: <lMihM2> = /ei5Md//[# (14.1.5) Здесь интеграл должен быть взят по всем конфигурациям поля г/> (не только по тем, которые удовлетворяют классическим уравнениям поля) в пространственно-временной области между t\ и £г, которые "вложены" между гр\ и ^2- йр[Ф) обозначает меру на пространстве конфигураций поля. Основная трудность, возникающая в подходе интегралов по траекториям, это определение меры d/x[^]. В общем случае неизвестно как придать смысл d/z[^>], кроме как в контексте теории возмущений на фоне свободного поля. (В этом контексте можно определить интеграл (14.1.5) так, чтобы получить стандартный ряд теории возмущений, и действительно, подход с помощью интегралов по траекториям позволяет достаточно просто вывести формальный ряд теории возмущений, что особенно полезно в случае калибровочных теорий (Abers, Lee 1973).) Однако, несмотря на неспособность определить (14.1.5) строго, формальные манипуляции методом интегралов 8Общая теория относительности относится к классу теорий со связями первого рода в фазовом пространстве. Построение гамильтоновой формулировки таких теорий и их квантование обсуждаются, например, в книге [Д.М. Гитман, И.В. Тютин, Каноническое квантование полей со связями, М.:, Наука, 1986.]. Там же рассмотрена каноническая формулировка общей теории относительности.- Прим. ред.
14.1. Квантовая гравитация 547 по траекториям принесли ценное понимание1' и полезные аппроксима- ционные схемы. Общая теория относительности может быть выведена из принципа наименьшего действия (см. прилож. Е), поэтому можно попытаться сформулировать квантовую теорию гравитации с помощью интегралов по траекториям. Было бы естественно записать интеграл вида Z = J ciS^b)dfl[gab] (14.1.6) с действием S заданным уравнением (ЕЛ. 13) или уравнением (Е.1.42), чтобы представить амплитуду вероятности перехода ((/ii)ab>£i|(/i2)aft> £2) от пространственной метрики (hi)ab в момент времени t\ к (/1г)аб в момент времени ^. Однако в общей теории относительности "времена" t\ и ^2 представляют собой просто координатные метки и не имеют инвариантного физического смысла. Поэтому амплитуда вероятности ((/ii)a6>*i|(/12)06,^2) не является физически значимой величиной. Причина, лежащая в основе этого препятствия, тесно связана с трудностью подхода канонического квантования: "истиные динамические степени свободы" гравитационного поля не были выделены. Как отмечено в заключительной части прилож. Е, общая теория относительности является во многом подобной "параметризованной теории", где время трактуется как динамическая переменная. Таким образом, введение "временных меток" t\ и ti в амплитуды вероятности является избыточным, поскольку эффективно "собственное время" уже присутствует в канонических переменных Каъ и 7га6, описывающих гравитационное поле. Однако, поскольку отсутствует хорошо определенное разложение этих переменных на "истиные динамические степени свободы" и "собственные временные переменные", далеко не ясно, что именно должна представлять физическая амплитуда вероятности Z. Далее возникает еще одно фундаментальное затруднение, это обычная проблема интегралов по траекториям - придание точного смысла d/x[ga6], чтобы правая часть уравнения (14.1.6) обрела математическую строгость. С другой стороны, в подходе с интегралами по траекториям можно представить себе анализ таких проблем, как вероятность изменения топологии пространства путем включения в интеграл (14.1.6) таких пространственно-временных метрик, при которых происходит 9В частности, с точки зрения интегралов по траекториям нетрудно объясненить классический предел. А именно, при соответствующих обстоятельствах преобладающие вклады в интеграл (14.1.5) возникают за счет полевых конфигураций, приводящих фазовый множитель S[ij>] к экстремуму, поскольку в этом случае близкие конфигурации суммируются когерентно. Однако эти полевые конфигурации являются как раз решениями классических уравнений (см. прилож. Е).
548 Глава 14. Квантовые эффекты в сильных гравитационных полях такое изменение пространственной топологии. Трудно представить, как эта проблема могла бы быть сформулирована в рамках канонического подхода (поскольку само обращение к гамильтониану подразумевает по существу глобальную гиперболичность, и следовательно, отказ от изменения пространственной топологии) или ковариантного подхода. Важным вариантом рассмотренного подхода интегралов по траекториям является подход с евклидовыми интегралами по траекториям. В теориях поля в пространстве-времени Минковского некоторые величины, в частности значения вакуумных средних произведения полевых операторов, являются голоморфными (аналитическими) функциями глобальных инерциальных координат £, х, г/, z в области, которая включает отрицательные мнимые значения временной координаты, т.е. t = — гт, где т - вещественное положительное (Streater, Wightman 1964). Полезно рассмотреть аналитическое продолжение такого типа следующим способом. Определим комплексифицированное пространство-время Минковского как 4-мерное комплексное многообразие С4 (которое можно рассматривать как 8-мерное вещественное многообразие) с комплексной метрикой Т7аб, определенной через комплексные декартовы координаты £, х, у, z многообразия С4 следующим образом: ds2 = -d*2 + dx2 + dy2 + d*2. (14.1.7) Таким образом, ограничиваясь вещественными значениями £, х, г/, г, мы покрываем пространство-время Минковского как 4-мерное вещественное подмногообразие многообразия (С4,77а&). Однако, полагая х, у, z вещественными, a t чисто мнимым, мы получаем другое 4-мерное подмногообразие на этот раз с вещественной евклидовой метрикой ds2 = +dr2 + dx2 + dy2 + d*2, (14.1.8) где t = гт. Это подмногообразие называется евклидовым сечением многообразия (С4,?7аь). Таким образом, мы можем рассматривать аналитическое продолжение функций в область отрицательных мнимых значений t как определение этих функций в области положительных значений т евклидова сечения комплексифицированного пространства- времени Минковского. Можно выполнить наш анализ теории поля в этом евклидовом сечении и затем аналитически продолжить функции обратно в сечение Минковского, чтобы получить физические предсказания. Для подхода с интегралами по траекториям такие операции обладают существенным потенциальным преимуществом, поскольку во многих теориях евклидово действие Se[iP] = -iS[ip]\t=-iT положительно определено, и аналитически продолженный интеграл действия
14.1. Квантовая гравитация 549 при "больших Ф" оказывается экспоненциально подавленным, а не осциллирующим. Таким образом, возможность придать математический смысл интегралу в уравнении (14.1.5) в эвклидовом сечении выглядит более обнадеживающей. При попытке применить подход с евклидовыми интегралами по траекториям к квантовой гравитации возникают многочисленные затруднения. В общей теории относительности нет естественного фонового плоского пространства-времени (R4,^), которое можно "ком- плексифицировать" для выполнения аналитического продолжения. Тем не менее можно пытаться аналитически продолжить метрику с лоренцевой сигнатурой в риманову метрику и вычислять интеграл по траекториям с римановой метрикой. Однако, за исключением частных случаев, таких как статическое пространство-время, вообще невозможно представить аналитическое пространство-время (M,go6) как "ло- ренцево сечение" 4-мерного комплексного многообразия с комплексной метрикой, которое (многообразие) обладает еще и "евклидовым сечением", т.е. 4-мерным вещественным подмногообразием с вещественной римановой метрикой. Таким образом, не имеется общего рецепта для аналитического продолжения метрики с лоренцевой сигнатурой на риманову метрику. (Более того, если бы даже оно имелось, не существует каких-либо теорем, гарантирующих аналитичность любых величин, возникающих в квантовой гравитации.) Тем не менее можно отложить решение проблем интерпретации и изучать свойства интеграла по траекториям (14.1.6) с римановыми метриками и заменой iS[go6] на — Sjs[ga&b где Se задается уравнением, аналогичным (Е.1.42) для римановой метрики10. Довольно большое количество результатов было получено таким методом (Hawking 1979). Возможно, наиболее впечатляющий успех евклидового подхода состоит в том, что как объясняется в разд. 14.3, рождение частиц черной дырой Шварцшильда можно непосредственным и простым способом соотнести со свойствами решения Шварцшильда с евклидовой метрикой. Значительно менее общепринятым подходом к формулировке квантовой теории гравитации является твисторный подход. Твистор в пространстве-времени Минковского может быть определен как пара Z = (u>A,*A.), (14.1.9) 10Действие Se не является положительно определенным. Однако оно является положительно определенным для асимптотически евклидовых метрик с R = О (Schoen, Yau 1979). Предложено добавочное аналитическое продолжение "конформной степени свободы" метрики, которое в результате делает Se положительно определенным (Hawking 1979).
550 Глава 14. Квантовые эффекты в сильныхгравитационных полях которая состоит из спинорного поля lja и комплексно сопряженного спинорного поля 7Гл>, удовлетворяющих твисторному уравнению дЛА>иВ = -ieAB7rA>. (14.1.10) За обсуждением мотивации введения твисторов и их свойств мы отсылаем читателя к списку литературы (Penrose 1967; Penrose, MacCallum 1972; Penrose 1975; Penrose, Ward 1980). Совокупность твисторов на пространстве-времени Минковского образует комплексное векторное пространство размерности 4, а проективные твисторы (т.е. классы эквивалентности твисторов, отличающихся ненулевым комплексным множителем) образуют комплексное многообразие СР3 размерности 3. Существует множество естественных соответствий между пространством- временем Минковского и твисторным пространством. Например, нулевая геодезическая в пространстве-времени Минковского соответствует точке изотропного проективного твисторного пространства (т.е. пространства проективных твисторов, удовлетворяющих Z • Z = uja If a + +ил па' = 0), тогда как точка в пространстве-времени Минковского соответствует 2-сфере проективных твисторов. Можно найти и другие соответствия между компактифицированным комплексифициро- ванным пространством-временем Минковского и твисторным пространством. Более того, некоторые дифференциальные уравнения в пространстве-времени Минковского могут быть переформулированы как условия аналитичности в твисторном пространстве (Ward 1981). Основной отправной точкой твисторного подхода к квантованию является использование твисторного пространства вместо пространства-времени в качестве базовой классической структуры многообразия, на котором определяются квантованные поля. Принимая во внимание соответствия между пространством-временем и твисторным пространством, результатом этого должна стать квантовая теория, в которой, грубо говоря, некоторые соотношения причинности в пространстве- времени сохраняют свои классические свойства, но понятие пространственно-временных точек становится "расплывчатым". (По существу во всех остальных подходах понятие пространственно-временных точек определено четко, но, как обсуждено выше, поскольку метрика пространства-времени описана вероятностно, понятие причинности становится "расплывчатым".) Следовательно, в твисторном подходе можно представить себе включение причинности в квантовую теорию естественным образом. К настоящему времени продемонстрирована полезность твисторов как математического инструмента (Atiyah, Ward 1977). Однако до сих пор в рамках твисторного подхода достигнут лишь незначительный прогресс в построении квантовой теории гравитации.
14.1. Квантовая гравитация 551 В отсутствие успеха рассмотренных походов к построению квантового варианта общей теории относительности, естественно обратиться к модификациям классической общей теории относительности, которые могут привести к лучшему поведению квантовой теории. В частности, можно пытаться модифицировать уравнение поля Эйнштейна, чтобы квантовая теория стала перенормируемой в рамках кова- риантного метода возмущений. Возможно простейшая попытка в этом направлении представляет собой модификацию эйнштейновского лагранжиана (ЕЛ. 12) путем добавления квадратичных по кривизне слагаемых. В этом случае полевые уравнения в координатной форме содержат производные метрики четвертого порядка, поэтому такую теорию часто называют теорией гравитации "с высшими производными". Показано (Stelle 1977), что квантовый вариант такой теории формально перенормируем. Однако в этой теории возникают другие серьезные трудности, так что она представляется физически не жизнеспособной. Значительно более амбициозные попытки модифицировать общую теорию относительности предпринимаются в теориях супергравитации. Теории супергравитации представляют собой класс моделей, включающих поля спинов 0, 1/2, 1, 3/2 и 2. (Приставка "супер" указывает на то, что эти модели обладают определенным типом симметрии, названным "суперсимметрия", между бозонными (т.е. с целым спином) и фермионными (т.е. с полуцелым спином) степенями свободы.) Основные цели теорий супергравитации таковы, (i) Улучшить свойства перенормируемости (или конечности) квантовой гравитации, (ii) Объединить гравитацию с другими фундаментальными взаимодействиями. Что касается первой цели, то было показано, что супергравитация конечна по крайней мере в "однопетлевом" приближении теории возмущений. В настоящее время неизвестно, насколько далеко эта конечность распространяется в теории возмущений, и представляется возможным, что супергравитация может быть конечной во всех порядках. Вторая цель является особенно амбициозной, поскольку требует от супергравитации объяснения всех взаимодействий, известных в физике элементарных частиц. В настоящее время появились серьезные трудности в достижении этой цели. Введение и обзор современных результатов по супергравитации и суперсимметрии можно найти в работах (van Nieuwenhuizen 1981; Hawking, Ro6ek 1981)11. 1 * Обсуждение, приведенное автором, относится только к квантовой N=1 супергравитации в ковариантном подходе на плоском фоне. Эта теория, хотя и непе- ренормируема с точки зрения стандартной квантовой теории поля (фейнманов- ские диаграммы для функций Грина не могут быть сделаны конечными за счет добавления к классическому действию конечного числа типов контрчленов), однако соответствующая 5-матрица конечна в одно- и двухпетлевом приближении.
552 Глава 14. Квантовые эффекты в сильных гравитационных полях В заключение: хотя были испробованы многочисленные подходы, в настоящее время не существует обоснованно жизнеспособной квантовой теории гравитации. Возможно, трудности носят в основном технический характер и, например, более успешная процедура обращения с условием связи (Е.2.33) приведет к удовлетворительной формулировке квантовой гравитации в рамках канонического подхода, или будет показано, что супергравитация представляет собой вполне удовлетворительную теорию. Возможна и альтернатива: трудности могут иметь истино фундаментальный характер, и квантовая теория гравитации просто не вписывается в рамки, установленные для других квантовых теорий12. Однако отсутствие удовлетворительной квантовой теории гравитации не означает, что мы не можем выполнить какие-либо достоверные расчеты квантовых эффектов, возникающих в сильных гравитационных полях. В атомной физике при соответствующих допущениях можно достоверно вычислить темп индуцированных электромагнитным полем переходов электронов в атоме, используя классическую трактовку электромагнитного поля. Подобным образом в квантовой теории поля, используя классическую трактовку электромагнитного поля, можно при соответствующих допущениях достоверно рассчитать спонтанное рождение электрон-позитронных пар в сильном электрическом поле. Таким образом, можно ожидать, что при трактовке Существуют так называемые N-расширенные модели супергравитации с более широким мультиплетным составом полей по сравнению с тем, что рассматривает автор. Все такие модели также неперенормируемы в ковариантном подходе, но 5- матрица конечна в низших петлях. Наибольший интерес с точки зрения устранения расходимостей представляет максимально расширенная N=8 супергравитация (если число суперсимметрий N>8, то супермультиплет обязательно содержит частицы со спином больше 2 и мы сталкиваемся с нерешенной проблемой взаимодействия полей высших спинов). Окончательный ответ на вопрос, будет ли S- матрица в этой теории конечной в любом порядке петлевого разложения, до настоящего времени не получен. См. обсуждение проблемы расходимостей в расширенной супергравитации в статье Даффа [М. Duff, Ultraviolet divergences in extended supergravity theories, in Proceedings of 1st School on Supergravity "Supergravity 81", ed. By S. Ferrara and J.G. Taylor, Cambridge University Press, 1982; перевод на русский язык в сборнике Введение в супергравитацию, М.:, Мир, 1985]. Систематическое исследование всех таких вопросов не проводилось, начиная с середины 80-х годов, поскольку основное внимание было переключено на развитие теории суперструн. Вычисление струнных амплитуд с участием гравитонов показывает, что во всех известных случаях результаты конечны. Приведены аргументы в пользу того, что струнные амплитуды будут конечными во всех порядках теории возмущений. Однако не ясно, имеют ли эти результаты какое-либо отношение к квантовым аспектам космологии и физики черных дыр.- Прим. ред. 12В теории суперструн четырехмерная общая теория относительности трактуется как эффективная низкоэнергетическая теория, не требующая квантования.- Прим. ред.
14.2. Квантованные поля в искривленном пространстве-времени 553 гравитации в рамках классической общей теории относительности все же возможно достоверно рассчитать некоторые из квантовых эффектов, которые оказывает гравитация на другие поля, как, например, рождение пар частица-античастица. Теперь мы обратимся к изучению именно таких эффектов. 14.2 Квантованные поля в искривленном пространстве-времени Как указано в конце предыдущего раздела, по аналогии с теорией квантованного поля во внешнем потенциале (Wightman 1971), мы ищем формулировку теории квантованного поля, которое распространяется в классическом пространстве-времени (M,ga6). Для простоты ограничимся случаем вещественного скалярного поля Клейна - Гордона ф. Анализ других линейных полей спина s ^ 1 весьма схож (Wald 1979b), хотя хорошо известны серьезные трудности, которые возникают в случае фермионов (s = 1/2). Как отмечено в конце гл. 13, поля спина s > 1 не имеют естественного обобщения в искривленном пространстве-времени. Мы не будем рассматривать нелинейные (т.е. самодействующие) поля13 Многое из обсуждаемого ниже основано на книге автора (Wald 1975, 1979b). Имеется дальнейшее обсуждение многих эффектов, предсказанных теорией квантованных полей в искривленном пространстве-времени (Birrel, Davies 1982)14. Как отмечено несколько раз выше, гильбертово пространство играет фундаментальную роль в квантовой теории. Для читателя, не знакомого с гильбертовыми пространствами, но изучившего гл. 2 и обсуждение спинорного пространства в гл. 13, мы дадим здесь очень 13Даже в пространстве-времени Минковского квантовая теория нелинейных полей корректно определена только в контексте теории возмущений. Возникает интересная проблема, остается ли теория, перенормируемая в пространстве- времени Минковского, перенормируемой в искривленном пространстве-времени (Birrell 1981). 14 Цитируемая автором книга Биррела и Дэвиса посвящена в основном невзаимодействующим полям. В частности, вопросы перенормировки взаимодействующих полей в искривленном пространстве-времени там вообще не затрагиваются. К настоящему времени эти вопросы полностью прояснены. Показано, что если теория мультипликативно перенормируема в пространстве-времени Минковского, то после того как в классический лагранжиан добавлено неминимальное взаимодействие скалярных полей с гравитационным полем вида Я<£2, теория будет мультипликативно перенормируема в искривленном пространстве-времени (см. обсуждение перенормировки квантовой теории поля в искривленном пространстве-времени в книге [I.L. Buchbinder, S.D. Odintsov, I.L. Shapiro, Effective Action in Quantum Gravity, IOP Publishing, Bristol and Philadelphia, 1992]).- Прим. ред.
554 Глава 14. Квантовые эффекты в сильных гравитационных полях краткое введение в гильбертовы пространства, подчеркивая некоторые различия между рассмотренным ранее конечномерным случаем и необходимым здесь бесконечномерным случаем. Для более полного систематического рассмотрения мы отсылаем читателя к учебникам по функциональному анализу (Riesz, Sz-Nagy 1955; Reed, Simon 1972). Пусть V - (не обязательно конечномерное) векторное пространство над полем комплексных чисел С. Внутреннее произведение на V представляет собой отображение г : V х V »-* С, где мы обозначили комплексное число i(v\,V2) просто как (vi,V2). Оно удовлетворяет следующим трем свойствам: (а) г линейно по второй переменной, (b) (v\,V2) = (v2,vi), где черта сверху обозначает комплексное сопряжение, (с) (v,t>) ^ 0, где равенство имеет место в том и только в том случае, когда v = 0. Заметим, что из свойств (а) и (Ь) следует антилинейность i по первой переменной. Векторное пространство, оснащенное внутренним произведением, называется пространством с внутренним произведением. Если V является пространством с внутренним произведением, определим норму произвольного v Е V посредством ||v|| = y/(v,v). На V возникает естественная топология (называемая сильной топологией), если открытыми подмножествами множества V называть такие и только такие подмножества, которые представляют собой объединение "открытых шаров", т.е. множеств вида Br,Vo = {vG V\\\v — vo\\ < R}. Выбор этой топологии станет понятен ниже при рассмотрении сходимости и непрерывности. Последовательность {vn} векторов из V называется последовательностью Коти, если для данного е > 0 существует номер N такой, что для всех га,п > N справедливо \\vn — vm|| < е. Из данного определения непосредственно вытекает, что любая сходящаяся последовательность является последовательностью Коши. Справедливо обратное утверждение: для конечномерных пространств с внутренним произведением любая последовательность Коши сходится. Однако в бесконечномерном случае легко построить примеры пространств с внутренним произведением, в которых существуют расходящиеся последовательности Коши (см. задачу 1). Пространство, в котором любая последовательность Коши сходится, называется полным, и полное пространство с внутренним произведением называется гильбертовым пространством- Таким образом, в частности, все конечномерные пространства с внутренним произведением являются гильбертовыми. Если бесконечномерное пространство с внутренним произведением V не является полным, существует стандартная процедура построения единственного гильбертова пространства Jff, называемого гильбертовым пополнением V,
14.2. Квантованные поля в искривленном пространстве-времени 555 так,_что V изоморфно подпространству W С Ж со свойством W = Ж, где W обозначает замыкание W. Важное различие между конечномерными и бесконечномерными гильбертовыми пространствами заключается в том, что в бесконечномерном случае линейные отображения не обязательно непрерывны. Действительно, легко показать, что линейное отображение А : Ж\ \-+ н-> Жч, между двумя гильбертовыми пространствами непрерывно тогда и только тогда, когда оно ограничено, т.е. существует С € R такое, что \Av\ < C\\v\\ для всех v £ Ж\. Легко построить примеры неограниченных линейных отображений, когда Ж\ бесконечномерно. Чтобы получить аналог пространства, дуального конечномерному векторному пространству, определим дуальное гильбертово пространство Ж* как векторное пространство непрерывных линейных отображений из Ж в С. Подобным образом комплексно сопряженное дуальное пространство Ж и комплексно сопряженное пространство Ж определяются так же, как в нашем рассмотрении спинорного пространства в гл.13, при дополнительном условии, что привлекаемые антилинейные и линейные отображения непрерывны. Для общего топологического векторного пространства V (т.е. векторного пространства с топологией, определенной на нем так, что операции сложения и скалярного умножения непрерывны) аргументы, доказывающие в случае конечной размерности, что V естественным образом изоморфно всему V**, теперь показывают только то, что V естественным образом изоморфно подпространству V**, т.е. V С V**. Аналогично в общем случае комлексное отображение отображает V всего лишь в подпространство пространства V. (Заметим, однако, что естественное антилинейное соответствие между V* и V , которое связывает a G V* с /3 е V посредством a(v) = /?(v), есть всегда взаимнооднозначное отображение на.) Однако для гильбертова пространства Ж (хотя простое доказательство, использованное в конечномерном случае, здесь не применимо) оказывается, что внутреннее произведение, которое по существу представляет собой невырожденный тензор типа (0,1;0,1) над Ж, обеспечивает взаимно однозначное линейное отображение на, устанавливающее соответствие между Ж и Ж . Этот результат известен как лемма Рисса. Таким образом, для гильбертова пространства Ж оказывается, что Ж* естественным образом изоморфно Ж, что Ж и Ж** естественно изоморфны, и что антилинейное соответствие между Ж и Ж является взаимно однозначным отображением на. Линейная оболочка совокупности векторов Ж из гильбертова пространства Ж определяется как подпространство векторов, которые
556 Глава 14. Квантовые эффекты в сильных гравитационных полях могут быть выражены линейными комбинациями бесконечного числа векторов {va}. Совокупность {vQ} называется базисом в Ж, если замыкание линейной оболочки векторов {vQ} совпадает с Ж, но замыкание линейной оболочки любого истинного (собственного) подмножества векторов из {vQ} не совпадает с Ж. Можно показать, что любое гильбертово пространство допускает существование ортонормирован- ного базиса {еа}. В общем случае {еа} может состоять из несчетного множества элементов, но для сепарабельного гильбертова пространства (т.е. обладающего таким счетным подмножеством векторов, замыкание которого совпадает с Ж) множество {eQ} должно быть счетным. Обычно предполагается, что гильбертовы пространства, возникающие в квантовой теории, являются сепарабельными, и ниже мы ограничимся сепарабельными гильбертовыми пространствами. Еще одно отличие бесконечномерного случая имеется в определении тензорных произведений. Как и в конечномерном случае Ж <8> Ж состоит из билинейных отображений Т : Ж* хЖ* н-+ С. Однако, чтобы получить на Ж 0 Ж естественную структуру гильбертова пространства, мы наложим на Т дополнительное условие оо ]Г|Г(е*,е*)|2<оо, (14.2.1) где {е*} - ортонормированный базис в Ж*. Другие пространства тензорных произведений определяются аналогично. Отметим, что не для всех непрерывных линейных отображений А : Ж н-* Ж имеет место аналог уравнения (14.2.1) и, следовательно, не все непрерывные линейные отображения могут рассматриваться как элементы Ж <8>Ж*. (Которые называются отображениями Гильберта-Шмидта.) Для тензоров над Ж можно было бы использовать индексные обозначения, аналогичные тем, что использовались в конечномерном случае, но во избежании путаницы с пространственно-временными тензорами мы не будем здесь использовать эти обозначения. Линейное отображение L : Ж »—► Ж называется оператором. Если L является ограниченным, мы определяем его сопряженный оператор, обозначаемый L\ как ограниченный оператор, удовлетворяющий (tfw,v) = (w,Lv) (14.2.2) для всех vyw € Ж. (Существование оператора 1Д, удовлетворяющего (14.2.2), гарантирует лемма Рисса). Мы назовем L самосопряженным, если и мы будем называть L унитарным, если L^L = LlJ = 7, где I - тождественное отображение в Ж. В том случае, когда L неограниченный, определить L* не столь просто. Во-первых, в общем случае
14.2. Квантованные поля в искривленном пространстве-времени 557 определить L можно только на плотной области @(L), т.е. подпространстве векторов, замыкание которого совпадает с Ж. Рассмотрим уравнение (u,v) = {w,Lv). (14.2.3) Для каждой фиксированной пары векторов и, w, такой, что уравнение (14.2.2) выполняется для всех v € @(L), мы будем говорить, что w € $(!}) и положим по определению L^w = и. (Если область &(&) не плотная, т.е. ее замыкание не есть все Ж, тогда L* не определен.) Мы назовем неограниченный оператор L самосопряженным15, если ®(р) = @(L) и L*v = Lv для всех v e 9{L). Теперь мы опишем некоторые основные элементы теории свободного (т.е. линейного) вещественного скалярного поля Клейна - Гордона ф в пространстве-времени Минковского. Сформулируем эту теорию в "представлении" Гейзенберга, т.е. операторы, представляющие наблюдаемые, будут эволюционировать с течением времени, но состояния не будут. В классической теории ф удовлетворяет уравнению VaV°</> - т2ф = 0. (14.2.4) Наша первая главная задача заключается в том, чтобы задать гильбертово пространство состояний квантовой теории. Естественно построить пространство состояний одиночной скалярной частицы на основе векторного пространства решений уравнения (14.2.4). Сохраняющийся ток (12.4.21) представляется подходящим кандидатом для внутреннего произведения на этом пространстве. Если а и (3 - решения уравнения (14.2.4), мы определяем их "внутреннее произведение" Клейна - Гор- дана согласно (<*. £)ко = - / Ja[a, P]nadV = i I (aVe/? - /JV«a) nW, (14.2.5) где интеграл берется по поверхности Коши £, и мы взяли "внутреннее произведение" в кавычки (которые далее опустим), поскольку (, )KG не является положительно определенным. Однако, если мы ограничимся подпространством положительно частотных решений, т.е. таких, чье преобразование Фурье по времени ф(и>, х) = (2тг)-1/2 / eiu;V(*, x)dt (14.2.6) J — оо 15Точное совпадение областей определения операторов L* и L является важным элементом определения, поскольку играет существенную роль в доказательстве спектральной теоремы. Если L*v = Lv для всех v 6 @(L), но @(Ь*) D @(L), тогда L называется эрмитовым.
558 Глава 14. Квантовые эффекты в сильных гравитационных полях обращается в ноль при и < О, тогда (, )KG становится положительно определенным. Определим одночастичное гильбертово пространство Ж как векторное пространство, составленное из положительно частотных решений уравнения (14.2.4) с конечной нормой Клейна - Гордана и внутренним произведением, на Ж, заданным согласно (14.2.5). (Более точно, мы должны определить векторное пространство V состоящим из гладких положительно частотных решений, быстро убывающих на пространственной бесконечности, с внутренним произведением, заданным (14.2.5). Ж определяется как гильбертово пополнение пространства V.) С помощью преобразования Фурье можно показать, что Ж изоморфно гильбертову пространству L2(M+) функций, интегрируемых с квадратом на пространстве Фурье-образов с положительными частотами. Заметим, что для отрицательно частотных решений можно установить естественное линейное соответствие с векторами из Ж = Ж*. В общем случае, если Ж\ представляет собой гильбертово пространство состояний одной квантовой системы и Жъ - второй системы, тогда тензорное произведение Ж\®Ж2 представляет состояния полной (объединенной) системы. В случае скалярного поля Клейна - Гордана симметричное тензорное произведение Ж S>s Ж, состоящее из симметричных линейных отображений из Ж* х Ж* в С, которые удовлетворяют уравнению (14.2.1), представляет возможные состояния двух скалярных частиц. Использование только этого подпространства (вместо всего Ж® Ж) для описания возможных двухчастичных состояний отражает неразличимость элементарных частиц; взаимная замена частиц дает то же самое физическое состояние. Выбор симметричного тензорного произведения (используемого для всех бозонов, т.е. полей с целым спином), а не антисимметричного тензорного произведения (используемого для всех фермионов, т.е. полей с полу целым спином) тесно связан со свойствами этих полей, которых требует теорема о связи спина и статистики. Подобным образом в качестве гильбертова пространства п свободных скалярных частиц берется n-кратное сим метризованное тензорное произведение ф^Ж. Пространство состояний в случае, когда нет ни одной частцы, предполагается одномерным, следовательно, в качестве него можно взять С. В качестве гильбертова пространства всех возможных состояний скалярного поля Клейна - Гордана берется симметричное пространство Фока JSfs(<^)> построенное из Ж. Здесь ^{Ж) определяется как прямая сумма комплексных чисел С со всевозможными симмет- ризованными тензорными произведениями пространства Ж\ ^(Ж) = С 0 [e~=i (®п8Ж)}. (14.2.7)
14.2. Квантованные поля в искривленном пространстве-времени 559 Здесь прямая сумма совокупности {<Щ} гильбертовых пространств определена как гильбертово пространство, полученное из совокупности последовательностей вида (vi, v2,...) с каждым V{ € <Щ и f>||2<<x>, г=1 а также скалярным произведением и внутренним произведением, определенными очевидным образом. Таким образом, любой Ф £ J£s(<%?) может быть записан как « = (a0,ai,a2l...). (14.2.8) где ао € С, ct\ £ «^, а2 £ ^ <8>s «^ и т.д. Состояние |0) = (1,0,0,...) (14.2.9) представляет вакуумное состояние поля, т.е. состояние без частиц. Следовательно, для состояния (14.2.8) общего вида пространства Фока ао дает амплитуду вероятности обнаружить поле в вакуумном состоянии, c*i представляет собой "одночастичную амплитуду вероятности" (т.е. вероятность обнаружить присутствие только одной частицы в состоянии /3 £ Ж* равна |(/3, ai)|2), а2 является двухчастичной амплитудой вероятности и т.д. Таким образом, каждое состояние из 3fs(Jf) имеет ясную интерпретацию на языке вероятностей нахождения различного числа частиц в различных возможных состояниях. Важнейшей наблюдаемой в теории скалярного поля является значение самого скалярного поля. Поскольку наблюдаемые в квантовой теории^представлены самосопряженными операторами, мы ищем оператор ф(х), который определен в каждой пространственно-временной точке х и описывает скалярное поле. В классической теории поле ф может быть разложено посредством преобразования Фурье по модам пространственного волнового вектора к, так что амплитуда каждой моды удовлетворяет тому же самому уравнению, что и классический гармонический осциллятор. Тогда аналогия с квантованием обычного гармонического осциллятора подсказывает следующее определение ф. Сначала для каждого одночастичного состояния а £ Ж определим оператор уничтожения а(а) : JSfs(J^) i-* 3fs(Jf?) следующим образом. Для Ф £ -Sfs(c#*), заданного уравнением (14.2.8), мы полагаем а(ог)Ф = (а . аь \р1о • а2, y/Sa • а3,...) . (14.2.10)
560 Глава 14. Квантовые эффекты в сильных гравитационных полях Здесь а представляет собой вектор из Ж, связанный с а с помощью отображения комплексного сопряжения, и а • ап является элементом <8>1£~1Ж, полученным путем вставки а в одну из "щелей" отображения ап. Заметим, что вакуумное состояние однозначно описывается (с точностью до фазы) условием а(а)|0) = 0 (14.2.11) для всех а € Ж. Сопряженным оператора а (а) является оператор рождения аЦа), определенный согласно аЦа)Ф = (о, а0а, V2ai ®5 *, >/За2 <8><? °,...) . (14.2.12) С помощью а и о) оператор поля ф(х) определяется в соответствии с оо Ф(*) = Y1 Ы*)"(Ъ) + Ъ(ФЧ°г)} , (14.2.13) г=1 где суммирование производится по ортонормированному базису {ai} в Ж. Таким образом, ф удовлетворяет уравнению Клейна^ Гордона (14.2.4) в х, и операторные коэффициенты в разложении ф по базису положительно частотных решений и их комплексных сопряжений как раз являются операторами уничтожения и рождения. В действительности сумма в уравнении (14.2.13) не сходится и должна быть истолкована в смысле обобщенной функции, т.е. ф может быть определен только как операторно-значная обобщенная функция на пространстве- времени. (Обобщенную функцию можно определить уравнением типа (14.2.13) (Wald 1979b, уравнение (2.7).) Для вычислений, включающих только линейные по ф операторы, это представляет лишь незначительные технические неудобства, но для нелинейных операторов возникает серьезное препятствие в придании математического смысла результирующим выражениям, поскольку произведение двух обобщенных функций, взятых в одной и той же точке пространства-времени, не имеет в общем случае какой-либо естественной математической трактовки. Это завершает наше короткое введение в теорию квантованного поля Клейна - Гордана в пространстве-времени Минковского. Теперь рассмотрим теорию квантованного поля Клейна - Гордона в искривленном пространственно-временном фоне (M,ga6). Состояния поля по-прежнему описываются векторами из гильбертова пространства j£f, но, вообще говоря, может не быть однозначной физической интерпретации этих состояний на языке частиц. Поле ф опять описывается оператором ф, определенным на пространстве-времени (или,
14.2. Квантованные поля в искривленном пространстве-времени 561 Искривленное 9аЬ = ПаЬ Рис. 14.1. Пространственно-временная диаграмма пространства-времени (R4,gob), которое изометрично пространству-времени Минковского (R4,r/ab) вне компактной области К точнее говоря, операторно-значной обобщенной функцией), который удовлетворяет уравнению Клейна - Гордона (14.2.4) в искривленном пространстве-времени. Возможно простейшим для рассмотрения является случай глобально гиперболического пространства-времени, которое почти изометрично пространству-времени Минковского, за исключением ограниченной области пространства в течение ограниченного промежутка времени. Такое пространство-время можно создать, если собрать материю (или гравитационное излучение) в малую область пространства и затем позволить материи распространяться на бесконечность. Чтобы избежать обсуждения асимптотических условий убывания гравитационного поля, рассмотрим весьма идеализированный случай пространства- времени, которое является плоским вне компактной пространственно- временной области, как изображено на рис. 14.1. Всюду вне будущего области К на рис. 14.1 наблюдатель (или семейство наблюдателей) мог бы не подозревать, что он находится не в пространстве-времени Минковского. Следовательно, он связал бы с каждым состоянием поля Ф € -£? вектор из пространства Фока -%(«^?п)> построенный из одночастичного гильбертова пространства Л?т положительно частотных решений свободного поля Клейна-Гордона в пространстве-времени Минковского. Пусть U : JS? »—► 3fs(J%n) обозначает изоморфизм JS? с пространством Фока, полученным при описании каждого состояния в j£f так, как оно "выглядит" для такого наблюдателя в прошлом. Для такого наблюдателя полевой оператор ф должен быть физически неотличим от полевого оператора на
562 Глава 14. Квантовые эффекты в сильных гравитационных полях пространстве-времени Минковского, поэтому для точки х, находящейся за пределами будущего области К, получаем оо иф{х)и~1 = Y, [*«(*Kifa) + *t(*Wnfo)] ,при х $ J+(K), i=l (14.2.14) где {а»} - ортонормированный базис в М{п. Однако тот факт, что ф удовлетворяет уравнению (14.2.4) всюду в пространстве-времени, означает, что для всех х Е М справедливо оо иф{х)и~1 = J2 [*'г(х)а1п(а{) + ^(*)а/п(*)] . (14.2.15) t=l где а\ - решение уравнения (14.2.4) в искривленном пространстве- времени, которое совпадает с сг^ вне будущего области К, Подобным образом мы получаем изоморфизм W : -Sf н-> -S?s(*^£ut), который связывает с каждым состоянием из JSf то состояние пространства-времени Минковского, каким оно будет "выглядеть" в будущем16. Далее мы получаем оо W$(x)W~1 = £ [//«(aOaoutfa) + 7i(*)aJ»t(ft)] , (14.2.16) t=l где {pi} - ортонормированный базис в ЖОУХи и р\ - решение уравнения (14.2.4), совпадающее с pi вне прошлого области К. Один из наиболее важных вопросов, подлежащих рассмотрению, заключается в том, чтобы охарактеризовать "входные (in)" состояния поля по отношению к "выходным (out)" состояниям. Это делается с помощью S-матрицы S = WU"1. Задавая любое входное состояние Ф Е -S?s(*#in), описывающее как состояние "выглядит"на ранних временах, выходное состояние 5Ф £ &s(J%>ut) описывает как состояние "выглядят" на поздних временах. В частности, если Ф = |0in), то Фо = 5|0in) сообщает о спонтанном рождении частицы гравитационным полем. Уравнения (14.2.15) и (14.2.16) позволяют найти Фо. Сначала до- множим уравнение (14.2.15) слева на 5 и справа на 5"1 и приравняем правую часть полученного уравнения правой части уравнения 163десь J%>ut снова представляет собой одночастичное гильбертово пространство, соответствующее пространству-времени Минковского, и следовательно, изоморфное с Ж1П, но полезно увидеть, что Я?т и ЖОУХх. являются различными пространствами. В более общих пространственно-временных многообразиях может не существовать естественного способа идентификации 3^xri и Жоиь-
14.2. Квантованные поля в искривленном пространстве-времени 563 (14.2.16). Пусть a G Щ.^, и а' - решение уравнения Клейна-Гордона в искривленном пространстве-времени, которое совпадает с а вне будущего области К. Находя внутреннее произведение Клейна - Гордона с сг', обнаруживаем, что ат и aout связаны соотношением Sa[n(a)S-1 = аоиЬ(Щ - а^Ш) (14.2.17) для всех a £ Л%п. Здесь отображения С : <Щп »-» Ж0чх и D : <Щп •—► Жохзх определены следующим образом. За пределами области К в ее прошлом решение о'{х) должно опять совпадать с некоторым решением f(x) уравнения Клейна - Гордона в пространстве-времени Минковско- го. Пусть /л представляет собой положительно частотную часть решения / в пространстве-времени Минковского, а Л - отрицательно частотную часть /. Мы можем рассматривать /х как элемент из J%>ut, а Л - как элемент из «^out- Положим по определению С а = /х и Da = Л. Необходимые для совместности уравнения (14.2.17) соотношения, которым удовлетворяют С и D, получены в задаче 3. Соотношение вида (14.2.17) для Си Д удовлетворяющих условиям задачи 3, называется преобразованием Боголюбова. Теперь мы можем найти Фо = S\0in) € «^sG^out)» применяя обе части уравнения (14.2.17) к Фо- Поскольку ain(<f)|0in) = 0 для всех а е <Щп, мы находим {aout(C^) - aL(^)} *o = 0 (14.2.18) для всех a Е Щ^. Записывая Ф = (ао,аьа2,...) (14.2.19) и используя определения (14.2.10) и (14.2.12) для aout и ajut, мы можем индуктивно решить уравнение (14.2.18) для an. В результате (Wald 1979b) {0 (п нечетное) * ("01/2 *W2 / \ (14.2.20) const2,ya(w/2)! ®s e (счетное) Здесь постоянная определена с точностью до фазы условием ||Фо|| = 1> и € представляет собой элемент из ^ut®s^out> вводимый следующим образом. Отображение DC'1 переводит векторы из Жоиг в векторы из ^out и, следовательно, может быть рассмотрено как отображение из <^£ut x ^out в С. Таким образом, отображение Е = DC , полученное из DC~l комплексным сопряжением, может рассматриваться как
564 Глава 14. Квантовые эффекты в сильныхгравитационных полях отображение из J££ut х <^tit B С. Как следует из задачи 3, это отображение является симметричным. Более того, доказано (Wald 1979b; Dimock 1979), что это отображение удовлетворяет уравнению (14.2.1) в случае пространства-времени, плоского вне компактной области. Таким образом, оно определяет элемент из ЖопХ. 0 <^ut5 который мы обозначили е. Для заданного решения Фо можно определить действие оператора 5 на все другие состояния из -2s(«^?n), используя сопряжение уравнения (14.2.17), чтобы выразить действие оператора S на произвольное произведение входных (in) операторов рождения, примененных к |0in), через произведения выходных (out) операторов рождения и уничтожения, примененных к Фо- Поскольку все элементы из -Sfs(c#?n) могут быть выражены как пределы сумм векторов такого вида, этого достаточно для определения 5. Следует подчеркнуть две особенности полученного для Фо решения. Во-первых, согласно уравнению (14.2.20) амплитуда вероятности рождения из вакуума нечетного числа частиц равна нулю. Это можно трактовать высказыванием: частицы всегда рождаются парами. В теории вещественного скалярного поля, рассмотренной здесь, античастицами являются те же самые частицы. Однако для комплексного скалярного поля, античастицы которого отличаются от частиц, оказывается, что рождается равное количество частиц и античастиц, т.е. происходит спонтанное рождение пар частица-античастица17. Во-вторых, из уравнения (14.2.20) и определения е ясно, что необходимым и достаточным условием того, что не происходит спонтанного рождения частиц, является обращение в ноль оператора D. Другими словами, в квантовой теории поля не происходит рождения частиц тогда и только тогда, когда при (классическом) рассеянии положительно частотной волны на кривизне никогда не приобретаются отрицательно частотные части. Таким образом, за исключением небольшого числа особых ситуаций (таких, как в задаче 4), в общем случае рождение частиц происходит в любом переменном во времени гравитационном поле. Разумеется, количество родившихся частиц и/или их физическое значение обычно пренебрежимо малы, пока речь не идет о режиме сильного поля. При обсуждении рождения частиц мы ограничились пространственно-временными многообразиями типа того, что изображенно на рис. 14.1. Гильбертовы пространства Л?т и Jf?out, а также "классиче- 17 Исключение из этого утверждения может возникнуть при некоторых обстоятельствах для фермионных полей (Christ 1980; Gibbons 1979; Wald 1979b). Можно найти выражение для Фо, которое более явно демонстрирует "спаривание" частиц и античастиц (Wald 1979b).
14.2. Квантованные поля в искривленном пространстве-времени 565 ское рассеяние", заданное операторами СиД корректно определенны при более слабых условиях, чем требование равенства нулю кривизны за пределами компактной области (Кау 1982), но до сих еще не доказано, что е удовлетворяет уравнению (14.2.1) при этих более слабых условиях. Обобщая можно спросить: можно ли распространить полученные результаты о рождении частиц на глобально гиперболические пространственно-временные многообразия, которые не становятся плоскими в прошлом или будущем. Однако в общем случае такие пространственно-временные многообразия не обладают асимптотическими режимами "in" и "out", в которых имеет физический смысл понятие "частицы". В связи с этом следует подчеркнуть, что в стандартной физике элементарных частиц понятие частицы является неопределенным в течение взаимодействия. Тем не менее, в стандартной физике частиц взаимодействия обычно происходят на таких микроскопически малых масштабах времени, что описание событий частицами вполне адекватно практически для всех целей. В случае гравитации, однако, взаимодействие квантованного поля с гравитационным полем может иметь место в макроскопических пространственно-временных областях. Таким образом, даже в том простом случае, когда пространство- время имеет вид, изображенный на рис. 14.1, понятие "частица" не является корректно определенным в области с ненулевой кривизной. В случае, когда пространство-время не становится плоским в прошлом или будущем, взаимодействия происходят в течение всего времени и, вообще говоря, возможно не имеет смысла говорить о входящих или выходящих состояниях частиц. Мы вернемся к вопросу о физическом понимании частиц в искривленном пространстве-времени в конце следующего раздела18. Входя в математические подробности, можно понять, где возникает трудность при определении состояний частиц в искривленном пространстве-времени общего вида, следующим образом. В пространстве-времени Минковского при построении гильбертова пространства состояний частиц Ж из векторного пространства V решений уравнения Клейна - Гордона использованы два ключевых элемента. Во- первых, ток (12.4.21) дал нам естественное невырожденное (но не положительно определенное) отображение из V х V в множество чисел, а именно, внутреннее произведение Клейна - Гордона, определенное уравнением (14.2.5). Во-вторых, разложение решений на по- 18Аналогичные проблемы возникают при определении понятия частицы в переменном электромагнитном поле, не исчезающем в отдаленном прошлом и отдаленном будущем (см. например [А.А. Гриб, С.Г. Мамаев, В.М. Мостепаненко, Квантовые эффекты в интенсивных внешних полях, Москва, Атомиздат, 1980]).- Прим. ред.
566 Глава 14. Квантовые эффекты в сильных гравитационных полях ложительно и отрицательно частотные части дало нам дополнительную структуру, нужную для выделения предпочтительного подпространства пространства V, на котором внутреннее произведение Клейна - Гордона положительно определенно, так что оно действительно определяет внутреннее (скалярное) произведение. В искривленном пространстве-времени общего вида ток (12.4.21) по-прежнему сохраняется, поэтому аналог внутреннего произведения Клейна - Гордона (14.2.5) существует. Однако, не существует естественного аналога положительно и отрицательно частотного разложения, так что отсутствует естественный выбор подходящего подпространства, на котором внутреннее произведение Клейна - Гордона положительно определенно. Проблема заключается не в отсутствии таких подпространств, а скорее в том, что их много, и, вообще говоря, ни одно не является предпочтительным. Разумеется, существует хорошее приближенное понятие положительно частотных и отрицательно частотных частей решения, если пространственно-временные масштабы вариации решения много меньше масштабов, определяемых кривизной пространства- времени. Так, например, в современной Вселенной имеет смысл говорить о частице только при условиях, что рассматриваемая частица имеет длину волны, много меньшую радиуса пространственной кривизны Вселенной, и частоту, обратная величина которой много меньше параметра Хаббла. Важный случай, когда существует естественное положительно и отрицательно частотное разложение, это стационарное пространство- время, поскольку для него параметр Киллинга представляет собой выделенную временную координату, по отношению к которой может быть выполнено преобразование Фурье. Показано, что для поля Клейна - Гордана с т > О в произвольном глобально гиперболическом стационарном пространстве-времени (с нормой времениподобного поля Киллинга, отделенной от нуля) можно определить стандартное пространство Фока состояний частиц, а также полевой оператор ф на этом гильбертовом пространстве, аналогичный (14.2.13) (Ashekar, Magnon 1975; Kay 1978). Таким образом, в стационарных пространственно- временных многообразиях понятие частиц математически (и физически) корректно определено 19. Рассмотрение на основе 5-матрицы с результатами о рождении частиц можно повторить для пространственно- временных многообразий, которые становятся стационарными (а не плоскими) в прошлом и будущем, при этом не требуется, чтобы "двухчастичная амплитуда" е удовлетворяла условию (14.2.1)20. 19Однако, см. обсуждение в конце разд. 14.3 и далее. 20Известно, что в случае замкнутой Вселенной со стационарными начальным и
14.2. Квантованные поля в искривленном пространстве-времени 567 Как уже подчеркнуто, в пространстве-времени, которое не может быть асимптотически стационарным в прошлом и/или будущем, попытка описывать состояния поля как входящие и/или выходящие состояния частиц может не иметь смысла. Однако, отметим один важный общий подход, позволяющий сделать это. Рассмотрим пространство-время (M,gafe), которое является асимптотически стационарным в прошлом и в будущем, и для которого двухчастичная амплитуда е удовлетворяет условию (14.2.1). Тогда пространство Фока входящих частиц -S?s(<^?n) и пространство Фока выходящих частиц &s(J%>ut) определены корректно, вместе с 5-матрицей, связывающей эти два пространства. Определим фейнмановский пропагатор А(х,у) скалярного поля в пространстве-времени (M,ga6) согласно iA{x,y) = _ (0Оиг\т{ф(х)ф(у)}\0т) (Oout|0in> (14.2.21) Мы используем здесь обозначения Дирака для внутреннего произведения, а также "упорядоченное по времен операторов, определенное в соответствии с дения, а также "упорядоченное по времени произведение" полевых = (ф(х)ф(у), \Ф(у)Ф(у), Т{Ф(х)ф(у)} = <£-\T? 6СЛИ У^/г++{А (14-2-22) (Если хит/ пространственноподобно разделены, то ф(х) и ф(у) коммутируют, поэтому оба выражения в правой части (14.2.22) согласованы.) Можно показать, что А(х,у) представляет собой функцию Грина для уравнения Клейна - Гордона, т.е. по одной из переменных, х или г/, оно является обобщенным решением уравнения Клейна - Гордона с источником в виде (J-функции от разности переменных. Кроме того, непосредственно из общих соотношений (14.2.15) — (14.2.16) для полевого оператора и определения (14.2.11) вакуумного состояния следует, что Д(#,з/) "распространяет" в будущее только положительные конечным режимами с удовлетворяет условию (14.2.1) (Fulling, Narcowich, Wald 1982). Если с не удовлетворяет условию (14.2.1), то 5-матрица не существует, т.е. нельзя считать, что пространства Фока входящих и выходящих частиц представляют одно и то же гильбертово пространство квантовых состояний. Однако в таких случаях, подобно разрешению "инфракрасной катастрофы" квантовой электродинамикой, еще можно сделать поддающиеся интерпретации физические предсказания. Алгебраический подход в квантовой теории поля (Haag, Kastler 1964) дает основу для преодоления этой трудности путем обобщения понятия состояния, заменяя векторы из фиксированного гильбертова пространства на положительные линейные функционалы на алгебре наблюдаемых.
568 Глава 14. Квантовые эффекты в сильныхгравитационных полях частоты, т.е. для функции /, обращающейся в нуль вне компактного множества, / A(x,y)f(y)y/:igd4y суть строго положительно частотное решение в будущем. Также точно Д(х,2/) "распространяет" только отрицательные частоты в прошлое. Таким образом, если понятие асимптотических состояний в квантовой теории поля дано, то можно определить функцию Грина уравнения Клейна - Гордона согласно (14.2.21), с помощью которой можно восстановить асимптотические понятия положительно и отрицательно частотных разложений. Обратно, если дана функция Грина G(x,y), которая удовлетворяет соответствующим свойствам, в частности, "распространяет" в будущее только функции с положительной нормой Клейна - Гордона и "распространяет" в прошлое только функции с отрицательной нормой Клейна - Гордона, то можно использовать G для определения понятия "положительная частота" в прошлом и будущем. Эти определения затем могут быть использованы, чтобы определить понятие асимптотических состояний частиц квантовой теории поля так, чтобы (по меньшей мере формально) G становилась фейнмановским пропагатором теории. Итак, проблема определения асимптотических состояний эквивалентна проблеме выбора функции Грина для уравнения Клейна - Гордона, подходящей на роль фейнмановского пропагатора. Следовательно, в случаях, когда естественный кандидат на роль фейнмановского пропагатора существует, понятие асимптотических состояний частиц может быть определено (Hartle, Hawking 1976; Rumpf 1976). Один важный режим, когда гравитация должна быть достаточно сильной и зависящей от времени, чтобы вызвать значительное рождение частиц, это ранняя Вселенная. Однако, поскольку нет оснований считать, что Вселенная являлась асимптотически стационарной в прошлом и поскольку нет однозначного предписания для определения фейнмановского пропагатора, мы не имеем естественного и однозначного определения начальных состояний частиц в ранней Вселенной. Более того, поскольку нельзя ожидать, что описание пространственно- временной метрики в классическом приближении вблизи сингулярности большого взрыва адекватно, то применимость понятия состояний частицы, определенного в модели классического пространства- времени, является проблематичным. Несмотря на все эти трудности, квантовые эффекты в ранней Вселенной исследованы многими авторами; эти работы вполне оперились в 1960-ых, начиная с работы Паркера (Parker 1969) и других авторов21. На самом деле квантовая тео- 21 Эффект рождения частиц в переменном гравитационном поле и его космологические приложения обсуждаются в книге [А.А. Гриб, С.Г. Мамаев, В.М. Мостепа- ненко, Квантовые эффекты в интенсивных внешних полях, М.: Атомиздат, 1980].- Прим. ред.
14.3. Рождение частиц вблизи черных дыр 569 рия поля в искривленном пространстве-времени в основном развита как раз в связи с этими исследованиями. Мы не будем пытаться обсуждать здесь эту деятельность и отсылаем читателя к литературе (Birrell, Davies 1982)22. Вместо этого, мы обратимся к рассмотрению рождения частиц вблизи черных дыр. 14.3 Рождение частиц вблизи черных дыр Важный режим, в котором можно ожидать спонтанное рождение частиц, возникает в окрестности черной дыры. Действительно, как мы уже отметили в гл. 12, сверхизлучающее рассеяние во многом аналогично вынужденному излучению. Это убеждает, что из черной дыры Керра должно исходить спонтанное "излучение". Оказывается, что такое спонтанное рождение частиц вблизи черной дыры Керра действительно имеет место, и сверхизлучающее рассеяние действительно представляет собой классический предел вынужденного излучения, связанного с этим рождением частиц (Старобинский 1973; Unruh 1974; Wald 1976). Однако куда более впечатляющим результатом исследования рождения частиц вблизи черных дыр стало открытие Хоукингом рождения частиц вблизи черной дыры Шварцшильда - "эмиссии"с характерным тепловым спектром. Обратимся теперь к выводу и обсуждению этого результата (Hawking 1975; Wald 1975). Сначала рассмотрим расширенное пространственно-временное многообразие Шварцшильда (рис. 6.9 или 12.3). Допустим, что мы интересуемся распространением классической волны скалярного поля Клейна - Гордона в области I этого пространства-времени. Интуитивно можно ожидать, что любое решение уравнения Клейна-Гордона без источников в области I должно либо "стартовать с бесконечности", либо войти в область I из области белой дыры III. Подобным образом на "поздних временах" можно ожидать, что каждое решение будет распространяться в область II черной дыры и /или начинать эволюцию из бесконечности. Чтобы выяснить, верно ли это, разложим ф по сферическим 22Проблеме задания состояний частиц и определения фейнмановского пропага- тора в искривленном пространстве-времени и переменном электромагнитном поле посвящена обширная литература. Для читателя физика, помимо отмеченной автором книги (Birrel and Davies (1982)), можно рекомендовать блестящую статью ДеВитта [B.S. DeWitt, Quantum Field Theory in Curved Space-Time, Phys.Repts, 19C, 295, 1975, русский перевод в сборнике "Черные дыры", М.:, Мир, 1978] и книги [А.А. Гриб, С.Г. Мамаев, В.М. Мостепаненко, Квантовые эффекты в интенсивных внешних полях, Москва, Атомиздат, 1980], [Д.М. Гитман, Е.С. Фрадкин, Ш.М. Шварцман, Квантовая электродинамика с нестабильным вакуумом, М.: Наука, 1991].- Прим. ред.
570 Глава 14. Квантовые эффекты в сильных гравитационных полях гармоникам и запишем волновое уравнение (14.2.4) для каждой моды вида r~lf(r,t)Yim(0, ф). Мы получим d2f d2f / 2М\Г/(/ + 1) 2М 21 Л /,,«,ч где координата г определена согласно (6.4.20), М - масса черной дыры, т - масса скалярного поля Клейна - Гордона. Но уравнение (14.3.1) имеет в точности вид волнового уравнения для бесмассового скалярного поля в двумерном плоском пространстве-времени (с декартовыми координатами fur*) в скалярном потенциале ¥„ ч / 2М\Г/(/ + 1) 2М 21 ,,.«лч (Подобные результаты получаются для электромагнитного, гравитационного, нейтринного и дираковского возмущений пространства-времени Шварцшильда, они также обобщаются на случай черной дыры Керра (Chandrasekhar 1983).) При г* —> —оо (т.е. г —> 2М) потенциал ведет себя как (1 — 2M/r) ~ ехр(г*/2М), т.е. убывает экспоненциально с г*. При г* —> +оо (т.е. г —> +оо) в случае поля ненулевой массы V(r*) ведет себя как ~ (т2 — 2Мт2/г*), тогда как при m = 0 мы получаем V(r+) ~ 1(1 + 1)/г2. Поэтому будут выполняться следующие выводы теории рассеяния на потенциалах в плоском пространстве-времени (Reed, Simon 1979) (в подтверждение высказанных выше интуитивных ожиданий, хотя завершенное доказательство пока не дано): если т ф 0, то каждый волновой пакет должен в асимптотическом прошлом вести себя как свободное (V = 0) безмассовое решение в пространстве (£,г*), распространяясь внутрь из г* —► — оо (т.е. из-за горизонта белой дыры), в суперпозиции с решением для поля с массой (искаженным потенциалом типа 1/г*), распространяющимся внутрь из г* —► +оо. Подобным образом, в асимптотическом будущем каждый волновой пакет должен вести себя как свободная безмассовая волна, распространяющаяся к г* —► — оо в суперпозиции с (искаженным) решением для поля с массой, распространяющимся к г* —► +оо. Если т = 0, то каждый волновой пакет должен быть близок к свободному безмассовому решению, как в бесконечном прошлом, так и в бесконечном будущем, и, следовательно, должен иметь вид f+(u) + g+{v) при t -> +оо и f-(u) + g_(v) при t —► -оо, где и = t — г* и v = t + г*. Это должно означать, что безмассовое поле Клейна - Гордона в пространстве-времени Шварцшильда определено своим значением на горизонте белой дыры и в области ^~ (в которых фиксируются f-(u) и g_(v) соответственно) или, эквивалентным
14.3. Рождение частиц вблизи черных дыр 571 образом, значением на горизонте черной дыры и в области <3/+ (в которых фиксируются g+(v) и /+(и)). Мы примем эти заключения теории рассеяния без доказательства. В случае поля ненулевой массы значение поля на горизонте белой дыры должно давать соответствующее описание части волны, приходящей из белой дыры, но чтобы описать часть волны, приходящую из бесконечности, нужна какая-то характеристика, отличная от значения поля в области ^~. Подобным образом, характеристика, иная чем значение поля в ^+, должна использоваться для описания части волны, которая распространяется на бесконечность на поздних временах. Чтобы использовать преимущество точного описания входящих и выходящих частей безмассового поля на бесконечности пространства-времени Шварцшильда23, т.е. возможность задать поле ^~ и ^+, ниже мы разберем подробно безмассовое поле Клейна - Гордона. Однако все результаты могут быть применены к случаю поля с массой, а также к другим полям, распространяющимся на фоне метрики Шварцшильда. Изменения, нужные в случае черной дыры Керра, будут рассмотрены ниже. Мы пришли к заключению, что решениям уравнения поля Клейна - Гордона без массы в асимптотическом прошлом можно сопоставить функции на горизонте белой дыры вместе с функциями на ^~. Следовательно, мы ожидаем, что одночастичное гильбертово пространство <Щп входящих состаявляет прямую сумму гильбертовых пространств частиц, приходящих из бесконечности и идущих от белой дыры *^out ==: *^out,oo © «^out,wh« Мы располагаем корректно определенным, естественным понятием "положительно частотных" решений в ^~, а именно, таких решений, для которых образы Фурье в ^~ по отношению к параметру BMS трансляций по времени, такому как опережающая временная координата Шварцшильда v в уравнении (6.4.22), содержат только положительные частоты. Это позволяет определить гильбертово пространство с^?п,оо состояний частиц, приходящих из бесконечности. Однако значительно менее очевидно, как определить понятие "положительной частотности" для решений, исходящих от белой дыры. Действительно, два разных естественных кандидата подходят для такого определения. Именно: "приходящее от белой дыры решение" может быть определено как "положительно частотное", если его образ Фурье на горизонте белой дыры имеет только положительные частоты, причем 23В других асимптотически плоских пространственно-временных многообразиях нет надобности в том, чтобы с/~ и й/+ были подходящими "поверхностями начальных данных" (Geroch 1978b).
572 Глава 14. Квантовые эффекты в сильных гравитационных полях образ Фурье берется либо по отношению к (i) запаздывающей временной координате Шварцшильда и из уравнения (6.4.21) (т.е. параметру Киллинга вдоль генераторов горизонта), либо по отношению к (ii) запаздывающему времени Крускала U из уравнения (6.4.26) (т.е. аффинному параметру вдоль генераторов горизонта). Посколько параметр Киллинга и аффинный параметр разные - почти всегда они связаны уравнением (12.5.10) - эти два определения приводят к различным понятиям "положительной частотности" и следовательно, к различным конструкциям одночастичного гильбертова пространства состояний белой дыры ^?n,wh- Таким образом, мы имеем важную неоднозначность в определении J#\n, а значит, и гильбертова пространства -&s(J%n) всех входящих состояний. Изменение определения "положительной частотности" на горизонте белой дыры соответствует изменению выбора входящего состояния, представляющего вакуум. Таким образом, неоднозначность в расчетах рождения частиц, которая будет результатом неоднозначности в определении «#?n,wh> может рассматриваться как результат неоднозначности в определении условия того, что от белой дыры не исходят "частицы". Подобным образом существует неоднозначность в определении гильбертова пространства J%>ut,hh частиц, распространяющихся внутрь черной дыры и следовательно, в отношении <s£o\it = *^out,oo © «^out,bh и ^fs(^out)- Ввиду этих неоднозначностей может показаться, что можно сделать физически бессмысленные предсказания о рождении частиц вблизи черных дыр. Однако неоднозначности в определениях обоих, и входящих и выходящих, состояний можно толковать таким образом, чтобы выделить однозначные физические предсказания, следующим образом. Во-первых, неоднозначности в определении ^?n,wh можно устранить (Hawking 1975) заменой расширенного пространства-времени Шварцшильда на пространство-время коллапсирующего сферического тела (рис. 6.11 или 12.2). Это устраняет горизонт белой дыры и тем самым превращает Щп просто в с#?п,оо, т.е. определяет его однозначно. Далее, пространственно-временные многообразия, представляющие гравитационный коллапс, в противоположность расширенному решению Шварцшильда, как полагают, описывают черные дыры, встречающиеся в природе, поэтому в любом случае расчет рождения частиц в пространстве-времени рис. 6.11 или 12.2 физически более правомерен, чем расчет для расширенного решения Шварцшильда.
14.3. Рождение частиц вблизи черных дыр 573 Черная дыра, разумеется, представляет собой существенную часть задачи, которую мы хотим решить, поэтому неоднозначность в определении i#£ut,bh остается. Однако мы все еще можем сделать важные физические предсказания, которые обходят эту неоднозначность следующим образом. Гильбертово пространство выходящих частиц -S?s(<^out,oo Ф ^out,bh)> что, естественно, изоморфно тензорному произведению -25("#out,oo) ® -S?s(^out,bh)> и поэтому может рассматриваться как "совместное состояние" двух систем: (i) частиц, распространяющихся на бесконечность, и (ii) частиц, распространяющихся в черную дыру. Но как только в квантовой механике появляется Ф, принадлежащее тензорному произведению Ж\ 0 Жч двух гильбертовых пространств Ж\, о#2, мы можем, используя данное состояние Ф, построить матрицу плотности р £ Ж\ 0 Ж\, вычисляя след выра- жения Ф0Ф е {Жг ® Ж2) ® (Жг ® Ж2) = (Жх ® Жх) ® (Ж2 ® Ж2) по отношению к базису в Ж2. Точнее говоря, определим р, рассматриваемое теперь как линейное отображение из Ж\ в Ж\, формулой оо (117, pv) = ]^(ti; ® ^, Ф)(Ф, V 0 вг) (14.3.3) г=1 для всех v,w 6 Ж\, где {е*} - ортонормированный базис Ж2. Внутреннее произведение в левой части (14.3.3)) вычисляется в Ж\, тогда как внутреннее произведение в правой части - в Ж\ 0 Ж}.. Отсюда немедленно вытекает, что для любой наблюдаемой О, относящейся к первой системе, получим (Ф,ОФ) = п*(рО), (14.3.4) где tr обозначает след линейного отображения. Поскольку вероятности возможных исходов любого измерения можно выразить через средние значения проекционных операторов, вся информация о первой системе может быть восстановленна из р. В нашем случае мы можем исключить операцией следа те степени свободы, которые отвечают частицам, входящим в черную дыру, и тем самым получить матрицу плотности для частиц, которые распространяются на бесконечность. Эта матрица плотности не зависит от выбора определения "положительной частотности", используемого при построении <#£ut,bh> по следующей причине. Изменение в определении положительной частотности на горизонте черной дыры будет индуцировать преобразование Боголюбова операторов уничтожения и рождения [представляющих состояния] частиц, которые входят в черную дыру, но оставит неизменными операторы уничтожения и рождения [представляющих состояния] частиц, распространяющих на бесконечность. Это приведет к замене вектора выходного состояния Ф е -Sfout = &s{<Kut,oo) 0^s(^ut,bh) на Ф' = сУФ
574 Глава 14. Квантовые эффекты в сильныхгравитационных полях с оператором 5? вида S? = I\ x 5г, где 1\ - тождественный оператор на -^5(^out,oo)> и 5г - унитарный оператор преобразования Боголюбова на -£s(^ut,bh)« Следовательно, в соответствии с уравнением (14.3.3) матрица плотности р', основанная на Ф', совпадет с матрицей плотности р, основанной на Ф. Значит для рождения частиц, которое видит удаленный наблюдатель на поздних временах, получаются однозначные физические предсказания. Таким образом, матрица плотности р, которая описывает спонтанно рожденные частицы, ушедшие на бесконечность, может быть определена единственным образом, а именно так. Сначала мы выбираем любое подходящее определение "положительной частотности" на горизонте черной дыры и строим <^ut,bh- Затем находим операторы С и D, решая классическую задачу рассеяния волн Клейна - Гордона в пространстве-времени рис. 12.2. Затем находим Фо = S\0\n) из уравнения (14.2.20). И наконец, вычисляем р из Фо» как описано выше. Можно было бы ожидать, что частицы рождаются в течение динамической фазы коллапса (поэтому детали рождения частиц будут зависеть от деталей коллапса), но после того, как черная дыра Шварц- шильда "установится" в своем конечном статическом состоянии, рождение частиц прекратится. Однако это не то, что обнаруживает расчет (Hawking 1975). Бесконечно удаленный наблюдатель всегда "видит" динамические аспекты коллапса, и классическое рассеяние положительно частотных волн в отрицательные частоты продолжается в сколь угодно позднее время. Мы начнем наш анализ эффекта рождения частиц24 с того, что отметим у решений уравнения Клейна - Гордона в расширенном пространстве-времени Шварцшильда рис.6.9 или 12.3, зависящих от времени как e"lwt в области I, следующее поведение. Из уравнения (14.3.1) следует, что вблизи горизонта (г* —> — оо) каждое такое решение ведет себя как "свободная волна" аехр(—гши) + 6ехр(—iujv) в пространстве (£,г*), где и = t - г* и v = t + r*. Решения с Ь = 0 относятся к "уходящим" на горизонте волнам. Суперпозицией решений с Ь = 0 и разными частотами можно построить несингулярные волновые пакеты, которые равны нулю на горизонте черной дыры (и —* +оо). Однако каждая отдельная выходящая мода с частотой а; обладает "бесконечно осциллирующей" сингулярностью на горизонте черной дыры. В самом деле, при замене переменной на координату Крускала U = -с"ки (где к = 1/(4М) - поверхностная гравитация черной дыры) поведение этих решений описывается формулой аехр^ык-11п(—£/)]. Пусть 7 - любая геодезическая, входящая в черную дыру из области I, и Эмиссии или излучения Хокинга.- Прим. ред.
14.3. Рождение частиц вблизи черных дыр 575 Рис. 14.2. Конформная диаграмма расширенного пространства-времени Швар- цшильда (см. рис. 12.3), демонстрирующая осцилляции волны частоты и, т.е. £$ф = —гиф. Видимое увеличение частоты осцилляции, показанное на ^+ на поздних запаздывающих временах (которое также происходит на <5/+ на ранних запаздывающих временах, а также на f на поздних и ранних опережающих временах) искусственным образом возникает на конформной диаграмме и вызвано в данном случае поведением конформного фактора. Однако увеличение частоты, показанное на горизонте белой дыры вблизи точки его пересечения с горизонтом черной дыры, представляет физическую сингулярность "бесконечного фиолетового смещения" волны пусть ее аффинный параметр Л выбран так, что А = 0 на пересечении геодезической с горизонтом. Из того, что Л гладко зависит от U и удовлетворяет dU/dX ф О на горизонте (где U = 0), следует, что в окрестности Л = 0 каждая выходящая мода осциллирует как функция Л вида ехр^иж"11п(-аА)], где а = dU/dX\\=Q. Следовательно, частота каждой моды, локально определяемая свободно падающим в черную дыру наблюдателем, расходится на горизонте указанным выше специальным образом. Эта расходимость связана с тем, что даже для статических наблюдателей эффект гравитационного красного смещения (рассчитанный в разд. 6.3) становится бесконечным на горизонте. Природу классического рассеяния, связанного с квантовым эффектом рождения частиц, лучше всего анализировать, рассматривая распространение волн обратно во времени. В частности, рассмотрим решения фШ1т в расширенном пространстве-времени Шварцшильда, которые имеют зависимость от времени вида е~гы*, зависимость от углов вида У1т(0,Ф) и являются чисто уходящими на горизонт. Мы можем рассматривать такое решение как "стартующее" из ^+. По мере распространения этой волны в прошлое, одна ее часть будет рассеиваться обратно в ^~, а другая ее часть будет рассеиваться в черную дыру, как изображено на рис. 14.2. Теперь рассмотрим ту же самую "начальную" волну в <3^+, которая распространяется в пространстве- времени, представленном на рис. 12.2, где произошел коллапс чер-
576 Глава 14. Квантовые эффекты в сильныхгравитационных полях ной дыры Шварцшильда, а не в расширенном пространстве-времени Шварцшильда. Вновь часть волны будет рассеиваться обратно в ^~, но нас главным образом интересует та составляющая волны, которая идет в белую дыру в расширенном пространстве-времени Шварцшильда. Теперь эта часть волны будет распространяться сквозь коллапси- рующую материю и заканчиваться в ^~, как изображено на рис. 14.3. Мы можем найти приближенный вид этой волны в ^~ следующим образом. Пусть нулевая геодезическая /i - генератор горизонта, для удобства положим равным нулю опережающее время vo, при котором ее продолжение в прошлое пересекает ^~, т.е. vq = 0. Поскольку локально измеряемая частота волны становится бесконечной на [i в "части Шварцшильда" пространства-времени, то вблизи ц для распространения волны от горизонта черной дыры назад до efl~ будет справедливо приближение геометрической оптики (см. гл. 4). Значит в точках все более близких к \х волна будет со все большей точностью принимать вид <foet5, где фо - постоянная, и поверхности постоянной фазы S становятся нулевыми. Следовательно, волна вблизи v = 0 в ^~ может быть получера продолжением нулевых геодезических, генерирующих поверхности постоянной фазы 5, назад в ^~. Однако поведение этих геодезических достаточно близко к /х будет аккуратно описано вектором rf девиации геодезической, т.е. отклонение от ц соседних геодезических линейно изменяется вдоль fx. Следовательно, выбирая направление вектора rf на ^~ вдоль направления генератора изотропной геодезической на ^~, мы видим, что вблизи v = 0 решение ф - функция опережающего времени г;на/" - ведет себя точно так же, как ф - функция аффинного параметра Л вдоль геодезической - ведет себя на касательной к rja в любой другой точке //. Однако это последнее поведение уже определено выше на горизонте "части Шварцшильда" пространства-времени. Следовательно, мы заключаем, что вблизи v = 0 на ^~ временная зависимость решения имеет вид ф(у) = ( °' [{ш w о jV J ?J (14.3.5) ^v ' \ ф0ехр [^\n(-av)\ , (v < 0) v Самое важное тут, что, хотя мы начали с чисто положительно частотной моды q-%uju на <3/+, решение на/" не является чисто положительно частотным. Действительно, нетрудно показать, что образ Фурье </>, полученный из ф преобразованием по v, при а > 0 имеет свойство ф(-а) = -е-™'кф(+а) (14.3.6) (Wald 1975, appendix А), так что амплитуда отрицательно частотной части ф на с/~ в q-™/* раза отличается от амплитуды положительно
14.3. Рождение частиц вблизи черных дыр 577 частотной части ф. Заметим, что вывод (14.3.5) не зависит от особенностей коллапса. Заметим также, что разложение ф на положительно и отрицательно частотные части в ^~, полученное в случае коллапса черной дыры, эквивалентно разложению, которое получилось бы в расширенном пространстве-времени Шварцшильда при использовании аффинного параметра (вместо параметра Киллинга или любого другого) для определения понятия положительной частотности на горизонте белой дыры. Рис. 14.3. Конформная диаграмма сферически-симметричного пространства- времени, в котором происходит гравитационный коллапс к шварцшильдовской черной дыре. Диаграмма изображает осцилляции волны, которая ведет себя как e"tu;t на б/+. При распространении этой волны назад в прошлое от ^f+ часть волны, которая распространяется сквозь коллапсирующую материю, будет создавать сингулярность "бесконечного фиолетового смещения" (по существу точно так же, как показано на горизонте белой дыры рис. 14.2) при значении опережающего времени vo на ^~ Чтобы получить операторы рассеяния на одночастичном гильбертовом пространстве, следует работать с нормированными волновыми пакетами. Рассмотрим положительно частотный волновой пакет на ^+, состоящий в основном из частот близких к о;, и центрированный при запаздывающем времени и. Для больших и (т.е. после того, как черная дыра видна бесконечно удаленному наблюдателю "установившейся" в своем конечном статическом состоянии) проведенный выше анализ может быть применен к этому волновому пакету, и уравнение
578 Глава 14. Квантовые эффекты в сильныхгравитационных полях (14.3.6) будет по-прежнему справедливо25. Непосредственно из общих свойств, установленных в задачах 2 — 3 и 5, следует, что среднее значение числа частиц, спонтанно рожденных в состоянии, представленном этим пакетом, равно (Hawking 1975) е—2пш/к W = l*lai-,-w <14-3-7) Здесь \t\2 - квадрат нормы Клейна - Гордона той части волнового пакета, которая пройдет в белую дыру в расширенном решении Шварц- шильда. Но это выражение совпадает с поперечным сечением поглощения черной дыры для этой моды. Таким образом, формула (14.3.7) такая же в точности как для абсолютно черного излучателя при температуре kT=^L = J^- (14.3.8) 2тгс SnGM v } или Т « 6 х 1(Г8 Ц%- Кельвин, (14.3.9) М где к - постоянная Больцмана, и мы восстановили все постоянные G и с. Сходство "эмиссии" частиц черной дырой с излучением черного тела идет значительно дальше, чем совпадение (14.3.7) для среднего числа частиц [и фотонов]. Полный анализ матрицы плотности, описывающей состояние частиц, ушедших на бесконечность, показывает ее идентичность во всех аспектах матрице плотности теплового излучения при температуре (14.3.8) (Wald 1975; Parker 1975; Hawking 1976). Более того, при наличии входящих частиц черная дыра продолжает вести себя точно как черное тело (Panangaden, Wald 1977). Исследование значения того, что черные дыры ведут себя подобно абсолютно черному телу, будет продолжено в следующем разделе. Заметим, что температура частиц, "эмиттированных" черной дырой, обратно пропорциональна массе черной дыры. Значит, если в черную дыру добавить энергию, температура уменьшится, т.е. черная дыра имеет отрицательную теплоемкость. Отрицательные теплоемкости типичны для самогравитирующих систем. Например, в ньютоновской 25 Следует указать на одну довольно тревожную черту этого анализа. Средняя частота волнового пакета на J ~ возрастает с ростом опережающего времени v как neKV (Wald 1976), и быстро становится очень большой, в частности, много больше частоты Планка. Эти ультравысокие частоты входят только в промежуточные этапы вычислений, они не появляются в каких-либо окончательных физических предсказаниях, но даже и при этом можно испытывать неудобство от того, что в вычислениях принимают участие столь экстремальные условия, при которых оправдать классическое распространение волн представляется очень трудным.
14.3. Рождение частиц вблизи черных дыр 579 теории гравитации самогравитирующая звезда, состоящая из идеального газа, имеет отрицательную теплоемкость. Основная модификация представленного выше анализа, которая нужна для рассмотрения черной дыры Керра, обусловлена тем, что в этом случае вместо стационарного поля Киллинга (d/dt)a нужно использовать киллингово поле х° = {d/dt)a -f П(д/дф)а (12.3.20), являющееся в данном случае нормалью к горизонту. Следовательно, для начальной волны на ^+ с временной зависимостью t~XUJU и угловой зависимостью егф зависимость решения от аффинного параметра вдоль геодезической, которая входит в черную дыру, имеет вид ехр[г(о> — rafi#)/c_1 ln(—aA)]. Для несверхизлучающих мод единственным изменением в конечном выражении для матрицы плотности будет замена и на ш—гаП#. Для сверхизлучающих мод вид матрицы плотности изменяется (Wald 1975), но уравнение (14.3.7) остается справедливым при и —> и—т£1н, с условием, что \t\2 полагается отрицательным. Из-за сдвига частоты и —► ш — тПн в (14.3.7) черная дыра Керра теряет в основном угловой момент (см. подробности вычислений (Page 1976b)). Стоит заметить, что тепловой характер эмиссии черной дыры можно связать непосредственным образом со свойствами евклидова решения Шварцшильда. Как кратко описано в разд. 14.1, евклидов подход в квантовой теории поля состоит в поиске "евклидова сечения" для вычисления необходимых величин, которые затем аналитически продолжаются в физическое пространство-время. В частности, и фейнманов- ский пропагатор поля на пространстве-времени получается аналитическим продолжением функции Грина на евклидовом сечении. (Поскольку уравнение для свободного поля на евклидовом сечении имеет эллиптический, а не гиперболический тип, то на евклидовом сечении часто будет единственная функция Грина, удовлетворяющая стандартным граничным условиям.) В нашем случае мы приходим естественным образом к исследованию свойств евклидова решения Шварцшгмъда, полученного аналитическим продолжением t в область вещественных значений г = it в уравнении (6.1) d4 = + (l - ^f) dr2 + (l - Ш _1 dr2 + r2dfi2. (14.3.10) В евклидовом пространстве Шварцшильда мы опять сталкиваемся с сингулярностью координатных компонент метрики при г = 2М. Как мы увидим ниже, это опять просто координатная сингулярность,
580 Глава 14. Квантовые эффекты в сильныхгравитационных полях но ее характер совершенно другой, чем в лоренцевом случае. Чтобы его проанализировать, мы определяем новую координату R согласно R = 4М(1 - 2М/г)1/2. (14.3.11) Тогда мы получаем ds* - R2d (шУ+(шУ**2+rW> (14312) где г теперь понимается как функция Д, определенная согласно (14.3.11). Из (14.3.12) ясно, что координатная сингулярность вй = 0 (т.е. г = 2М) представляет по существу ту же самую координатную сингулярность, которая возникает в центре плоской полярной системы координат, где R играет роль радиальной координаты, а т/4М - роль угловой координаты. Следовательно, естественный выбор структуры многообразия для евклидова решения Шварцшильда состоит в том, чтобы сделать т/АМ периодической с периодом 27г в области г > 2М и затем "ввести внутрь" одну точку26 в "плоскость R — г", чтобы расширить пространство на область R = 0. Таким способом получают полное риманово многообразие (M,gfb) с топологией М = R2 x S2. Заметим, что евклидово многообразие Шварцшильда не содержит области, соответствующей области г < 2М пространства-времени Лоренца. Ясно, что при изложенной интерпретации евклидова решения Шварцшильда любая непрерывная на М функция периодична по г с периодом 87гМ. В частности, любая функция Грина будет удовлетворять этому свойству по каждой своей переменной. Следовательно, если фейнмановский пропагатор в случае лоренцева решения Шварцшильда определяется аналитическим продолжением евклидовой функции Грина, он автоматически будет периодичным по "мнимому времени" г = it. Однако это свойство периодичности по мнимому времени характерно для теплового усреднения, как мы теперь объясним. Предположим, что имеется обычная квантово-механическая система с независящим от времени оператором Гамильтона Я. Состояние теплового равновесия системы при температуре кТ = /?-1 описывается матрицей плотности р = e-^/Z, (14.3.13) где Z = ^(е"^). (14.3.14) 26Поскольку многообразие Шварцшильда образовано сечением "плоскости R — т 2-сферой в — ф", то когда речь идет о введении точки в плоскость R — г, на самом деле в многообразие "вводится внутрь" 2-сфера.
14.3. Рождение частиц вблизи черных дыр 581 Далее, в представлении Гейзенберга всякая наблюдаемая О изменяется с течением времени согласно O(to + t) = e+iHt/hO(t0)e-iHt/h. (14.3.15) В квантовой теории поля вообще нельзя строго определить оператор Гамильтона Я, и в любом случае е-/ЗЯ не может определить нормируемую матрицу плотности. Однако, по крайней мере формально, уравнение (14.3.13) по-прежнему будет описывать состояние теплового равновесия, и полевой оператор ф будет изменяться со временем согласно (14.3.15)). Определим температурный фейнмановский пропагатор при температуре кТ = /3~х в соответствии с iAT(xux2) = tr [prj^X!)^!)}] = Z-hr [е-^Т^хгЩхг)}] , (14.3.16) где в правой части этого уравнения Т27 обозначает упорядоченное по времени произведение (14.2.22). Теперь предположим, что можно аналитически продолжить t в область мнимых значений t = -it так, что (14.3.15)-(14.3.1б) остаются справедливыми. Рассмотрим случай, когда Т2 — /3h < т\ < Т2, и пусть х[ получается переносом мнимой временной координаты точки х\ посредством /?Л, т.е. х\ имеет те же самые пространственные координаты, что и х\, но мнимую временную координату Ti -Ь /?/1. Тогда мы получаем iAT(x'1,x2) = = = = = = Z-1tr[c->3HT{$(x'1)$(x2)}] = Z-Xtr [e-"tf£(x;Mx2)] = Z-'tx [е-"" {^нф{х{)^н) ф{х2)] = Z~l\x Щх^е-^фг)] = Z~x\x \^,-0нф{х2)ф{х1)^ = Z~ltt [e-^TJ^xxMxa)}] = iAT(Xl,x2), где в пятой строке использовано циклическое свойство следа. Если обобщить, Ат(х\,Х2) обладает свойством периодичности по каждой из временных переменных с периодом Р = (3h в пределах полосы \ri-r2\<Ph. 27 Автор обозначает температуру и оператор хронологического упорядочения одной и той же буквой Т.- Прим. ред.
582 Глава 14. Квантовые эффекты в сильныхгравитационных полях Таким образом, фейнмановский пропагатор на пространстве-времени Шварцшильда, полученный исходя из евклидова решения Шварц- шильда, наиболее естественным образом интерпретируется как температурный фейнмановский пропагатор поля при температуре кТ = /Г1 = П/Р = ЦЪтгМ)-1. (14.3.18) Это означает, что квантованное поле в пространстве-времени Шварцшильда находится в состоянии теплового равновесия при температуре (14.3.18). Такое состояние, или, точнее говоря, его матрица плотности, известное как вакуум Хартпла-Хокинга (Hartle, Hawking 1976; Israel 1976), соответствует тому, что будет наблюдаться на поздних временах, если состояние теплового распределения при температуре (14.3.18) (вместо состояния |0in)) распространялось бы из с/~. Однако состояние теплового равновесия в пространстве-времени Шварцшильда было бы не возможно, если бы поведение черной дыры Шварцшильда отличалось от абсолютно черного тела. Таким образом, тепловой характер рождения частиц черной дырой Шварцшильда решительно диктуется свойствами евклидова решения Шварцшильда. Заметим, что указанный аргумент в пользу тепловых свойств черной дыры Шварцшильда применим и в случае нелинейного (т.е. самодействующего) поля (Gibbons, Perry 1976; Sewell 1982). Рождение частиц с тепловым спектром имеет своим очевидным следствием отбор квантовым полем энергии из черной дыры Шварцшильда. Все свойства энергии-импульса квантового поля в пространстве-времени Шварцшильда можно получить с помощью оператора энергии-импульса Таь. ПОСКОЛЬКУ задача нахождения Т^ и его использования для расчета эффектов "обратной реакции" квантового поля на пространство-время представляет интерес для многих приложений (в частности, в космологии), сначала мы рассмотрим эти вопросы в общем контексте квантовой теории поля в искривленном пространстве- времени, а затем вернемся к частному случаю черной дыры. Вполне естественно постулировать, что оператор энергии-импульса квантового поля в искривленном пространстве-времени выражается через полевые операторы той же самой формулой, что применяется в классической теории, т.е. для квантованного поля Клейна - Гордона ТаЬ = ЧафЧъФ - \gab [т2ф> + Vc0Vc£] . (14.3.19) К сожалению, эта формула требует композиции двух полевых операторов в одной и ^гой же точке пространства-времени. Поскольку, как отмечено ранее, ф корректно определено только как обобщенная функция на пространстве-времени, такое произведение плохо определено.
14.3. Рождение частиц вблизи черных дыр 583 В самом деле, если формально подставить сумму мод (14.2.15) для ф в (14.3.19), то для Таь получится расходящееся выражение. Такая расходимость в выражении для Таь возникает и в пространстве-времени Минковского. В этом случае она интерпретируется как результат суммирования "энергий в нуле "бесконечного числа мод осцилляции поля. Расходимость преодолевается путем вычитания энергии в нуле из формального выражения для Таь так, что среднее значение оператора тензора энергии-импульса в вакуумном состоянии обращается в нуль, т.е. (0|Тоь|0) = 0. Это эквивалентно нормальному упорядочению выражения для Таь, т.е. расположению всех операторов уничтожения справа от операторов рождения в формальной сумме мод, полученной из (14.3.19). Таким способом получают корректно определенные конечные выражения для матричных элементов оператора Таь между физически разумными состояниями. В искривленном пространстве-времени не существует в общем случае осмысленного понятия "мгновенного вакуумного состояния", по отношению к которому можно "нормально упорядочить" выражение для Tab- Тем не менее существует несколько процедур "регуляризации" Таь, т.е. его разделения естественным образом на сумму двух частей, расходящейся и сходящейся. Многие из этих процедур, такие как размерная регуляризация (Brown 1977), регуляризация с помощью дзета-функции (Hawking 1977), строго определены только на римано- вом многообразии (Wald 1970c), но по крайней мере одна из них, а именно регуляризация методом "разделения точек" корректно определена также и на пространствах-временах Лоренца (Fulling 1983). К сожалению, "расходящаяся часть" Таь не может быть "поглощена" путем переопределения параметров в действии исходной теории; т.е. формулирование Tab испытывает ту же трудность "неперенормируемости", что и квантовая гравитация в ее нынешнем состоянии (разд. 14.1). Обнаружено, что необходимо ввести два новых неклассических параметра в выражение для Таь, в соответствие со свободой добавить к искомому выражению слагаемого, равного произведению тождественного оператора, умноженного на два локально сохраняющихся выражения размерности (длина)-4, построенных из тензора кривизны28. Таким образом, существует двухпараметрическая неоднозначность выражения для Таь. Однако Таь удовлетворяет ряду физически оправ- 28Эти выражения получаются при варьировании компонент действия J R2 и / RabRab по метрике (см. прилож. Е). Большинство рецептов регуляризации позволяют получить точное значение для одной комбинации этих параметров, но поскольку различные рецепты иногда приводят к различным значениям, пожалуй, наиболее благоразумно считать оба параметра неопределенными.
584 Глава 14. Квантовые эффекты в сильныхгравитационных полях данных свойств, которые определяют его с точностью до этой двух- параметрической неоднозначности (Wald 1977b, 1978b), так что, пред- ставляется, что это единственная существующая неоднозначность. Важной особенностью величины среднего значения (Ф|Таь|Ф) квантового оператора энергии-импульса Таь в состоянии Ф является то, что она не должна удовлетворять какому-либо из энергетических условий, которым обязан удовлетворять классический тензор энергии-импульса. В самом деле, даже в плоском пространстве-времени можно найти состояния, в которых среднее значение нормально упорядоченного оператора энергии-импульса Клейна - Гордона имеет отрицательную плотность энергии в некоторой области пространства-времени, даже несмотря на то, что плотность энергии классического тензора энергии- импульса поля Клейна - Гордона очевидно положительна всюду для всех конфигураций поля (см. задачу 6). Таким образом, свойства, которые справедливы в классической общей теории относительности благодаря энергетическим условиям для полей материи, не обязательно справедливы для квантованных полей. Это имеет важные последствия для теоремы о площади поверхности черной дыры, которая будет рассмотрена в следующем разделе. В контексте квантовой теории поля в искривленном пространстве- времени естественно постулировать, что эффекты обратного действия квантового поля на гравитационное поле будут управляться полуклассическим уравнением Эйнштейна СаЬ = 8тг(Ф|Та6|Ф), (14.3.20) т.е. физически возможно, что пространство-время имеет форму (M,ga6), а квантовое поле находится в состоянии Ф на (M,ga6) тогда и только тогда, когда удовлетворяется уравнение (14.3.20). На самом деле уравнение (14.3.20) это не то, что мы могли бы ожидать в качестве низшего приближения к квантово-полевой теории гравитации, связанной с материей. Это обусловлено тем, что точное уравнение в полной теории должно иметь вид (Gab) = 87г(Таь), где Gab ~ оператор Эйнштейна, а состояние, входящее в средние значения, включает теперь (квантовые) степени свободы гравитационного поля. Более того, можно бы было ожидать [по принципу соответствия], что Gab будет выражаться через оператор метрики^гой же самой формулой, которая справедлива в классической теории, Gab = Gab{gcd\- Однако, поскольку 29Общая схема перенормировки квантовой теории поля в искривленном пространстве-времени и соответствующие уравнения ренормализационной группы описаны в книге [I.L. Buchbinder, S.D. Odintsov, I.L. Shapiro, Effective Action in Quantum Gravity, IOP Publishing, Bristol and Philadelphia, 1992]).- Прим. ред.
14.3. Рождение частиц вблизи черных дыр 585 Gab представляет собой нелинейную функцию gcd, мы должны иметь (Gab) Ф Gab[(gcd)]. Действительно, если мы запишем g^b = g£6/ + 7ab, где g^b - классическое решение уравнений Эйнштейна, / - тождественный оператор, и удержим в формуле для Gab только квадратичные по %ь члены, тогда (Gab) и Gab[(gcd)] будут отличаться на -87г(?0ь), где (tab) выражается через %ь по формуле, очень похожей на ту, по которой Таь выражается через ф. (См. явные выражения (4.4.54) и (4.4.51) для tab в случае g%b = Vab-) Следовательно, в низшем приближении к полной квантово-полевой теории гравитации, связанной с материей, ожидается появление дополнительного члена вида 8тг(tab) в правой части уравнения (14.3.20), и вклад этого члена будет сравним с вкладом от (Tab)- Этот факт можно интерпретировать так, что квантовые эффекты обратной реакции, обусловленные гравитонами (т.е. квантованными степенями свободы линеаризованного гравитационного поля) существенны в той же мере, что и эффекты других квантованных полей, и поэтому ими не следует пренебрегать в уравнении (14.3.20). Тем не менее можно обосновать уравнение (14.3.20) как систематическое приближение к полной квантовой теории поля, включающей гравитацию, следующим образом. Если присутствуют N полей материи, то грубо говоря, эффект от этих полей будет приблизительно в N раз значительнее, чем от гравитонов. Следовательно, в пределе большого N пренебрежение гравитонами будет оправдано, и получится уравнение (14.3.20) (с коэффициентом N в правой части) как приближения низшего порядка в "разложении по степеням 1/iV" полной квантовой теории гравитации, связанной с материей. В любом случае уравнение (14.3.20) должно по меньшей мере давать качественное понимание эффектов обратной реакции, создаваемых квантовыми полями на гравитационное поле. К сожалению, динамика, предсказываемая уравнением (14.3.20), радикально отличается от классической общей теории относительности. Существует множество нефизических решений уравнения (14.3.20), для которых первоначально малая кривизна пространства-времени с ростом времени экспоненциально растет на временных масштабах порядка времени Планка. Действительно, показано, что для любого безмассового квантованного поля уравнение (14.3.20) предсказывает такого типа неустойчивость пространства-времени Минковского (Horowitz 1980). Таким образом, ситуация очень похожа на ту, что возникает в классической электродинамике точечного заряда при учете реакции излучения (Jackson 1962). Там "малая" поправка к уравнениям движения, вызванная реакцией излучения, приводит к появлению новых "убегающих" решений. В случае электродинамики еще возможно еде-
586 Глава 14. Квантовые эффекты в сильныхгравитационных полях лать разумные предсказания, если просто игнорировать убегающие решения. Хотя чтобы сделать это, требуется наложить ограничения на начальные условия точечного заряда, которые обусловлены тем, какие внешние силы должны быть приложены в будущем. Но кажется, развить процедуру выделения физически приемлемых решений уравнения (14.3.20) будет намного труднее. В случае черной дыры Шварцшильда (или в более общем случае произвольного вакуумного пространства-времени Rab = 0) две локальные функции, зависящие от кривизны, которые входят в формулу для Таь с неопределенными коэффициентами, обращаются тождественно в нуль. Следовательно, в пространстве-времени Шварцшильда Таь полностью корректно определен. Значение (Таь) для "вакуума Хартла- Хокинга" вычислено аналитически на горизонте (Candelas 1980) и численными методами вблизи черной дыры (Fawcett 1983). Было обнаружено, что в координатах Крускала (Таь) вблизи черной дыры имеют порядок 1/М4 в планковских единицах G = с = h = 1, как и ожидалось по соображениям размерности. Поскольку фоновая кривизна имеет порядок 1/М2 для М » 1 (т.е. в системе единиц СГС М ^ 10""5г), квантованное поле должно вносить лишь малую поправку в структуру черной дыры. Было обнаружено, что поток энергии в черную дыру отрицательный, как и должно быть, поскольку "вакуум Хартла-Хокинга" не зависит от времени, и поток энергии на нулевой бесконечности будущего положителен. Такой отрицательный поток энергии возможен, поскольку, как уже отмечено, (Таь) не обязан удовлетворять какому-либо из классических энергетических условий. Как уже сказано, при попытке использовать уравнение (14.3.20) для расчета эффектов обратного действия возникают серьезные затруднения. Однако по физическим соображениям ожидается, что эффект обратной реакции будет обусловлен потерей черной дырой массы с той же скоростью, с какой энергия излучается на бесконечность за счет рождения частиц. Эту потерю можно найти умножением (N) из (14.3.7) на а; и суммированием по всем модам. Поскольку эмиссия имеет спектр черного тела, то если бы сечение поглощения \t\2 для каждой моды было таким же, как для черной сферы радиуса R в пространстве-времени Минковского, и если кТ > йсй-1, то поток энергии поля нулевой массы с двумя степенями свободы давался бы законом Стефана dE/dt = аТ4А = aT4nR2, где а = тг2к4/Ш3с2 - постоянная Стефана-Больцмана. В приближении геометрической оптики черная дыра поглощает точно так же, как черная сфера радиуса R = 33/2М (см. гл. 6). Однако, поскольку при рождении частиц черной дырой частоты значимых мод имеют порядок М-1 (т.е. на самом деле
14.3. Рождение частиц вблизи черных дыр 587 кТ ~ hcR~x), необходимо применить волновую оптику30 (т.е. корректный учет распространения волн вне рамок геометрической оптики), чтобы аккуратно найти \t\2. Тем не менее закон Стефана дает правильную оценку порядка величины потока энергии из черной дыры. Значит игнорируя числовые множители, мы находим приблизительно темп потери массы черной дырой в единицах Планка: ^ - -AT4 ~ -М2(1/М)4 = --^. (14.3.21) Таким образом, по мере потери черной дырой массы, рост температуры более чем компенсирует уменьшение площади поверхности, и потеря энергии на рождение частиц идет с еще большим темпом. Интегрируя (14.3.21), мы получаем поразительное заключение, что черная дыра должна излучить всю свою массу за конечное время т, которое в единицах Планка оценивается как г - М3. (14.3.22) В системе единиц СГС М3 ~ 1071 (М/М0)3 секунд, таким образом время жизни до полного испарения черной дыры с массой порядка массы Солнца или больше, оказывается значительно превосходящим возраст Вселенной. Однако, если какие-либо первичные черные дыры массой ~5х 1014 г были образованы в ранней Вселенной, в настоящее время они находились бы в конечной стадии испарения (Page 1976a), а любая первичная черная дыра меньшей массы уже испарилась бы. Поскольку температура черной дыры возрастает в процессе испарения, появилось бы значительное количество 7-излучения, если бы много черных дыр массой ^ 5х 1014 г образовалось в ранней Вселенной. Как уже отмечено в конце разд. 12.1, такого вклада в фоновое 7-излучение не наблюдается (Page, Hawking 1976), что позволяет заключить, что во Вселенной нет достаточного числа первичных черных дыр малой массы, чтобы иметь возможность наблюдать эффекты испарения черных дыр. Когда масса черной дыры падает при испарении до массы Планка, нельзя ожидать от классического подхода правильного приближения для гравитации, и описания того, что происходит на этой стадии, надо отложить до завершения квантовой теории гравитации. Однако кажется естественным ожидать, что черная дыра полностью исчезнет в 30 Неспособность геометрической оптики точно описать распространение волн далеко за пределами горизонта (где в основном и происходит рассеяние) следует отличать от ее применимости к описанию распространения волн значительно ближе горизонта, как это использовано уже при расчете рождения частиц.
588 Глава 14. Квантовые эффекты в сильных гравитационных полях Рис. 14.4. Конформная диаграмма пространства-времени, в котором черная дыра образовалась благодаря коллапсу материи и "испаряется" в результате процесса рождения частиц конце этого процесса, а не оставит после себя, скажем, остаточную черную дыру планковских размеров. Причинная структура пространства- времени, в котором образовалась и затем полностью испарилась черная дыра, изображена на рис. 14.4. Полагая, что происходит полное испарение, отметим два важных следствия. Во-первых, оказывается, что в процессе коллапса в черную дыру с последующим испарением может существенно нарушаться закон сохранения барионов (и/или лептонов), даже если барионное число (и/или лептонное число) локально сохраняется; а именно, можно образовать черную дыру из материи с чисто барионным числом (например, только из нейтронов без антинейтронов). Теоремы о единственности черной дыры, собранные в конце разд. 12.3, строго применимы только в случае тех полей, которые имеют классическое описание, но из них явно следует, что черная дыра, образованная при коллапсе барионов, будет неотличима от черной дыры, образованной в результате коллапса антибарионов. Значит в процессе рождения частиц не должно быть предпочтительного рождения барионов по сравнению с антибариона- ми, и действительно, в любом случае большая часть массы черной дыры должна быть унесена излучением безмассовых частиц, не несущих барионного числа. Таким образом, в конце процесса испарения среднее барионное число должно быть близко к нулю, и должно произойти большое изменение барионного числа. Во-вторых, как уже сказано, частицы, достигающие бесконечности в процессе испарения, описываются матрицей плотности. Матрица плотности применяется здесь исключительно ради удобства, поскольку общее состояние частиц, входящих в черную дыру, и тех, которые
14.3. Рождение частиц вблизи черных дыр 589 достигают бесконечности, не является смешанным при условии, разумеется, что и входящее состояние не является смешанным. Однако, если черная дыра полностью испаряется, как изображено на рис. 14.4, тогда совокупное состояние системы должно описываться матрицей плотности. Корреляции с частицами, достигающими бесконечности, должны, грубо говоря, распространяться в сингулярность черной дыры и теряться полностью, когда черная дыра исчезает. Значит оказывается, что в процессе образования и испарения черной дыры начальное чистое состояние может развиться в конечную матрицу плотности [для смешанного состояния] (Hawking 1976; Wald 1980; Page 1980). Это показывает, что должна существовать какая-то асимметрия обращения времени, поскольку начальная матрица плотности [смешанного состояния] никогда не может развиться в конечное чистое состояние, хотя физически приемлемая форма симметрии обращения времени еще может иметь место (Wald 1980). Есть и другие соображения в пользу асимметрии обращения времени в законах квантовой теории гравитации (Penrose 1979). Более того, эволюцию чистого состояния в матрицу плотности в процессе образования и испарения черной дыры можно тесно связать с положениями квантовой теории измерений (Penrose 1981). В заключение мы кратко опишем результат, который показывает, что есть связь между рождением частиц вблизи черной дыры и свойствами обычного вакуумного состояния квантованного поля в пространстве-времени Минковского. Этот результат также позволяет понять физический смысл как "частиц" в искривленном пространстве- времени, так и причины математической неоднозначности их определения. Тесная математическая аналогия между "клином Риндлера" пространства-времени Минковского и областью г > 2М пространства-времени Шварцшильда уже выявлены в конце гл. 6. Действительно, там мы использовали расширение пространства-времени Риндлера до пространства-времени Минковского, чтобы мотивировать расширение Крускала пространства-времени Шварцшильда. Можно построить квантовую теорию поля в пространстве-времени Риндлера, используя временную координату Риндлера £я вместо трансляционной временной координаты Минковского Ьм для определения "положительной частотности". Другими словами, мы можем "проквантовать" поле в (клине) пространстве-времени Минковского, используя "буст" вместо обычной трансляции по времени в качестве времениподобного векторного поля Киллинга. Эти два понятия "положительной частотности" различаются, поэтому необходимо отличать понятия "частицы"
590 Глава 14. Квантовые эффекты в сильныхгравитационных полях по Риндлеру и по Минковскому (Fulling 1973). Связь между характеристиками состояний квантованного поля частицами по Риндлеру и по Минковскому можно найти, получив преобразование Боголюбова для операторов уничтожения и рождения от первого ко второму представлению, т.е. используя ту же самую процедуру, что в случае рождения истинных частиц, как в предыдущем разделе. Поскольку связь между временем Риндлера и временем Минковского по сути та же самая, что имеет место вблизи горизонта между временем Шварцшильда и временем Крускала, то не удивительно, что части решения, положительно и отрицательно частотные для частиц по Минковскому, для частиц по Риндлеру осциллируют как c~lu;tR и связаны формулой (14.3.6). В тесной аналогии с расчетом рождения истинных частиц в пространстве- времени Шварцшильда здесь обнаруживается, что обычный вакуум частиц по Минковскому |0) представлен тепловой матрицей плотности частиц по Риндлеру того же вида, что излучение черного тела. Для физической интерпретации этого результата (Unruh 1976) показано, что детектор частиц, движущийся с постоянным ускорением, т.е. вдоль траектории поля Киллинга буста, воспринимает частицы по Риндлеру, связянные с этим полем Киллинга. Это проще всего понять, если рассмотреть простую модель детектора частиц, состоящего из обычной нерелятивистской квантово-механической системы (например, частицы в ящике), линейно связанной с квантованным полем. Говорят, что произошла регистрация частицы, если квантово- механическая система перешла на более высокий уровень энергии. Из обычной нестационарной теории возмущений, когда квантованное поле находится в обычном вакуумном состоянии частиц по Минковскому |0), находим темп переходов (т.е. вероятность в единицу времени) вверх по энергии на Е для ускоряющегося точечного детектора (Unruh 1976; DeWitt 1979): R(E)<x lim U J e-«*<'"-«Wofe^^ l-*+ool J_T J_rp \ I I / (14.3.23) где подразумевается, что для времени tn масштаб выбран так, чтобы совпасть с собственным временем вдоль мировой линии x(tn) ускоряющегося детектора частиц. Таким образом, вероятность перехода прямо связана с Фурье-образом вакуумного среднего значения произведения полевых операторов, причем этот Фурье-образ выделяет положительно частотную компоненту по отношению к t'R и отрицательно частотную по отношению к £д. Однако для ускоряющегося детектора эти "положительно и отрицательно частотные части" измеряются по отношению к времени Риндлера, а не времени Минковского. Хо-
14.3. Рождение частиц вблизи черных дыр 591 тя согласно (14.2.13) состояние ф\0) не имеет положительно частотной части по отношению к времени Минковского, а состояние (О|0 не имеет отрицательно частотной части (поэтому инерциальный детектор не регистрирует частицы), эти состояния имеют такие положительно и отрицательно частотные части по отношению к времени Риндлера. Это в точности согласуется с указанным уже представлением вакуума частиц по Минковскому как теплового состояния частиц по Риндлеру. В итоге находим, что ускоряющийся детектор частиц в пространстве- времени Минковского будет вести себя так, как если бы он был помещен в термостат "реальных" частиц с температурой (Unruh 1976) кт=£с> <14-з-24> где а - собственное ускорение детектора (12.5.18). Таким образом, обычное вакуумное состояние в пространстве-времени Минковского воспринимается ускоряющимся наблюдателем, как обладающее свойствами теплового распределения, что формально очень похоже на тепловые эффекты от рождения истинных частиц черной дырой. К сожалению, в системе СГС температура (14.3.24) Г«4х 1(Г23а Кельвин, (14.3.25) так что ясно, что этот эффект слишком слаб для регистрации обычным лабораторным детектором. Однако влияние такого термостата на спин ускоренного электрона может быть измерено (Bell, Leinaas 1983). Этот эффект рассмотрен и с точки зрения инерциального наблюдателя (Unruh, Wald 1984). Итак, определение частиц по Риндлеру с использованием нестандартного понятия положительной частотности в пространстве-времени Минковского, как видно, связано с настоящими физическими эффектами. Частицы по Риндлеру - самые настоящие для ускоренных наблюдателей! Это показывает, что различные понятия "частицы" пригодны для различных целей. Поэтому неудивительно, что в искривленном пространстве-времени общего вида, не имеющего времениподобно- го поля Киллинга, не существует естественной универсально применимой процедуры определения частиц, и что в заданном пространственно-временном многообразии разные конструкции (такие, как конструкции с использованием аффинного параметра или параметра Киллинга на горизонте черной дыры) будут определять понятие частиц различно. Хотя понятие частиц очень удобно для многих целей, оно не является существенной частью квантовой теории. Физические предсказания всегда можно выразить на языке матричных элементов (Ф|0|Ф)
592 Глава 14. Квантовые эффекты в сильныхгравитационных полях оператора О между состояниями ФиФ, как в (14.3.23) или (14.3.20). Эти предсказания не будут зависеть от того, как ФиФ выражаются через состояния частиц. Сходный анализ поведения детектора частиц в пространстве-времени Шварцшильда показывает, что когда поле находится в состоянии вакуума Хартла - Хокинга, стационарный детектор на любом радиусе г > 2М будет вести себя, как если бы он был помещен в термостат при температуре *Т=2^' <14А26> где множитель V = (—f^a)1^2 соответствует коэффициенту красного смещения на этом радиусе. Вдали от черной дыры (г —* оо) получаем V —► 1, и эффект можно интерпретировать как реакцию детектора на "истинные" частицы, рожденные черной дырой (как и на частицы, пришедшие из ^~). Вблизи черной дыры (г —► 2М) мы получаем n/V —> а, где а - собственное ускорение детектора (12.5.18), и эффект (который становится расходящимся на горизонте) можно интерпретировать как целиком обусловленный ускорением детектора. Свободно падающий детектор не регистрирует по существу ни одной частицы вблизи черной дыры (Unruh 1977), в согласии с тем, что тензор энергии-импульса квантованного поля {Таь) пренебрежимо мал вблизи горизонта черной дыры. 14.4 Термодинамика черных дыр В разд. 12.5 мы получили замечательную математическую аналогию обычных законов термодинамики с законами общей теории относительности черных дыр. Как можно увидеть с помощью табл. 12.1, при формальных заменах Е —► М, Т —> ак и S —► Л/87га в законах термодинамики, получаются законы, применимые к черным дырам. Намек на то, что это соотношение возможно значит нечто большее, чем формальная аналогия, заключается в том, что Е и М фактически представляют одну физическую величину, а именно, полную энергию. Однако, поскольку в классической общей теории относительности черная дыра не имеет никакой термодинамической температуры, то физическая аналогия, казалось, на этом и закончена. Однако теперь мы увидели, что когда принимаются в расчет квантовые эффекты, тогда в совершенно реальном смысле можно ввести ненулевую термодинамическую температуру (14.3.8) черной дыры, равную /с/27г в системе единиц, где k = h = G = c=l. Черная дыра поглощает и "эмиттирует"частицы точно так же, как абсолютно черное тело
14.4. Термодинамика черных дыр 593 [фотоны] при такой температуре. Таким образом, Т и к/27г являются не просто аналогичными величинами, но в этом случае вновь представляют одну физическую величину. Полагая а = (27г)-1, мы видим, что остальные аналогичные величины - это S и А/А. Представляет ли физически величина А/4 энтропию черной дыры? Мы теперь представим аргументы, что ответ на этот вопрос: "Да". Обычное второе начало термодинамики утверждает, что полная энтропия материи во Вселенной никогда не уменьшается. Однако, если есть черная дыра, то хотелось бы ограничить внимание материей снаружи черной дыры, поскольку материя, падающая в дыру, "проглатывается" сингулярностью внутри черной дыры, и в любом случае внешний наблюдатель не может ее воспринимать. Однако полную энтропию S материи вне черной дыры можно легко заставить уменьшаться, так как материя уходит в черную дыру. С другой стороны, согласно теореме о площади классической общей теории относительности площадь поверхности А черной дыры никогда не уменьшается. Однако, вследствие процесса квантового рождения частиц этот закон может нарушаться, поскольку (Таь) не удовлетворяет энергетическому условию, которое принято в доказательстве теоремы о площади. Действительно, как сказано в предыдущем разделе, изолированная черная дыра со временем "испарится" полностью, тем самым сводя площадь своей поверхности к нулю. Таким образом, если черная дыра есть и приняты в расчет квантовые эффекты, то обычное второе начало термодинамики и теорема о площади могут нарушаться. Однако в процессах, когда SS < О вследствие потери материи в черной дыре, увеличивается площадь поверхности черной дыры: 6А > 0. Подобным образом в процессе испарения, когда 6А < 0, энтропия материи вне черной дыры увеличивается: SS > 0 в результате испускания теплового излучения. Поэтому определим обобщенную энтропию 5' (Bekenstein 1973b, 1974) согласно А г31с где восстановлены постоянные k, S, G и с. То, что уменьшение 5, по-видимому, всегда компенсируется увеличением А и, аналогично, уменьшение Л, по-видимому, всегда компенсируется увеличением 5, дает возможнось предположить, что для любого процесса может быть справедливо обобщенное второе начало SS' ^ 0. (14.4.2) Фактически впервые закон (14.4.2) был предложен (с неопределенным числовым множителем при А в (14.4.1)) до окрытия эффектов
594 Глава 14. Квантовые эффекты в сильныхгравитационных полях квантового рождения частиц. Однако в контексте чисто классической общей теории относительности (14.4.2) могло бы нарушаться, если поместить черную дыру в термостат при температуре ниже той, что формально приписана черной дыре, и тем самым создать поток тепла от более холодного тела (термостата) к более горячему (черной дыре). Наоборот, можно поместить материю в ящик и медленно опускать его на горизонт черной дыры прежде, чем отпустить. При такой процедуре энтропия материи внутри ящика все равно будет потеряна, но в результате уменьшения энергии в ящике за счет "красного смещения", увеличение же площади поверхности черной дыры можно удержать сколь угодно малой. Однако при учете квантовых эффектов эти способы нарушить обобщенное второе начало не работают. В первом примере черная дыра будет излучать больше, чем поглощать, поэтому на самом деле поток тепла потечет от черной дыры к термостату. Во втором примере сработают рассмотренные в конце предыдущего раздела эффекты воздействия эмиттированных частиц на любое стационарное тело вблизи черной дыры, что обращает передачу энергии в черную дыру как раз так, чтобы обеспечить увеличение площади поверхности черной дыры, достаточное для выполнения (14.4.2) (Unruh, Wald 1982). Таким образом, обобщенное второе начало справедливо, по крайней мере насколько это можно увидеть в проверочных мысленных экспериментах. Однако обобщенное второе начало имеет естественную и простую интерпретацию. Его можно рассматривать как не более чем обычное второе начало термодинамики применительно к системе, содержащей черную дыру. Чтобы сохранить такую точку зрения, необходимо совершить заключительный шаг - приписать величине Л/4 смысл физической энтропии черной дыры. Если этот заключительный шаг сделан, аналогия между законами термодинамики и физики черных дыр вовсе перестанет быть аналогией. Законы термодинамики черных дыр (включая обобщенное второе начало) будут представляться не более, чем обычные законы термодинамики в применении к самогравитиру- ющей квантовой системе, содержащей черную дыру. Таким образом, очевидная справедливость обобщенного второго начала решительно диктует, что А/А представляет собой термодинамическую энтропию черной дыры. Однако физические основания, по которым А/4 является энтропией черной дыры, остаются неясными. Поскольку энтропия обычной физической системы является по сути логарифмом числа микроскопических состояний, заполняющих наблюдаемый макроскопический интервал, приписывать величине А/4А смысл энтропии черной дыры означает, по-видимому, что в полной квантовой
14.4. Термодинамика черных дыр 595 теории гравитации число "внутренних состояний" черной дыры будет N rsj eA/4. Однако общие доводы в пользу второго начала термодинамики для обычных систем базируются на понятии "доли времени", проводимого системой в данном макроскопическом состоянии [теорема Лиувилля]. Поскольку природа времени в общей теории относительности радикально отличается от той, что имеет в виду негравитационная физика, то не ясно, как в точности вывести обобщенное второе начало, даже если А/4 представляет собой меру числа внутренних состояний черной дыры. Итак, в отношении термодинамики черных дыр мы, видимо, находимся в ситуации, очень похожей на ту, в которой была обычная термодинамика до открытия основополагающего фундамента этих законов - статистической механики. Мы открыли законы термодинамики черных дыр (в нашей ситуации - с помощью вычислений и мысленных, а не лабораторных, экспериментов), но лежащий в основе этих законов фундамент неизвестен и вероятно не будет полностью понят до тех пор, пока мы не имеем квантовой теории гравитации. Тем не менее, существование законов термодинамики черных дыр указывает скорее всего на глубокую связь теориии гравитации с квантовой и статистической механиками. Дальнейшее изучение этой связи остается задачей будущих исследований31. Задачи 1. Пусть V - совокупность бесконечных последовательностей комплексных чисел {di} = (ai,a2,...) таких, что только конечное число й{ не равно нулю. Чтобы сделать V векторным пространством над С, определим сумму и умножение на число в V согласно {ai} + {bi} = {a,i + Ь{} и c{di} = {са,{}. Определим скалярное произведение: оо ({аг}ЛЬг}) = ^2а~гЬ{. г=1 31 Многие вопросы, связанные с излучением черных дыр и термодинамикой черных дыр, рассмотренные в разд. 14.3, 14.4, обсуждаются также в книге [И.Д. Новиков, В.П. Фролов, Физика черных дыр, М.:, Наука, 1986]. Новый подход к микроскопической интерпретации энтропии черных дыр развит в контексте теории струн (см. [В. Zwiebach, A First Course in String Theory, Cambridge University Press, 2004] и ссылки там).- Прим. ред.
596 Глава 14. Квантовые эффекты в сильных гравитационных полях (a) Показать, что (...,...) является внутренним произведением, тем самым превращая V в пространство с внутренним произведением. (b) Показать, что V неполное и поэтому не является гильбертовым пространством. (c) Пусть V - совокупность последовательностей, удовлетво- оо ряющих условию JZ 1аг|2 < оо. Определим на V структуру г=1 векторного пространства и внутреннее произведение тем же способом, что и на V. Показать, что V является полным и, таким образом, представляет собой гильбертово пространство, обозначаемое обычно fe. (При доказательстве можно использовать тот факт, что С является полным.) 2. (а) Показать, что операторы рождения и уничтожения, определенные уравнениями (14.2.10) и (14.2.12), удовлетворяют коммутационным соотношениям [а(а),а(р)] = 0, [at (а), at (р)] = 0, [а(а),а!(р)\ = (а,р)1 для всех j,pG Ж, где коммутатор двух операторов определен согласно [А, В] = А В — В А, и I - тождественный оператор на -Sfs(c^). (b) Показать, что оператор Щ<т) = а*(<г)а(а) может быть интерпретирован как оператор числа частиц в (нормированном) состоянии а € Ж, т.е. собственными векторами оператора N(a) являются состояния а с определенным числом частиц, а его собственным значением, отвечающим данному собственному вектору, является число этих частиц. 3. Определим операторы А : ЖОХ1\, •—► J£?n, В : ЖОУ1\ н-> Жш путем "обращения времени" в определениях С и D, приведенных в тексте, т.е. для т е J%>ut состояние Ат, содержащееся в Jff\n, будет получаться распространением в прошлое решения ?, которое согласуется с г в будущем и имеет его положительно частотную часть в прошлом, тогда как Вт - состояние в Ж1П, будет связано с его отрицательно частотной частью в прошлом. Используйте
14.4. Термодинамика черных дыр 597 независимость внутреннего произведения Клейна - Гордона, заданного уравнением (14.2.5), от выбора поверхности Коши. Учитывайте также, что оно равно нулю в асимптотическом будущем или прошлом между любым положительно частотным решением и любым отрицательно частотным решением, чтобы доказать следующие соотношения: ЛМ - В*В = /, £tл = АЩ А* = С^ CiC-DiD = I, DiC = &D, B* = -D. Заметьте, что соотношение D^C = C^D приводит к тому, что Е = DC симметричен, т.е. Е* = Е. 4. Рассмотреть конформно инвариантное поле (см. прилож. D) в пространстве-времени вида, изображенного на рис. 14.1, которое кроме того является конформно плоским, т.е. всюду справедливо Sab = ®>2г1аЬ- Показать, что не может произойти рождение частиц. 5. Пусть А и В определяются так же, как в задаче 3. Из соображений "симметрии относительно обращения времени" ясно, что уравнение (14.2.17) должно остаться справедливым, если поменять местами "in" и "out", заменить CuD на, АиВи заменить S HaS-1. (a) Используя эту модификацию уравнения (14.2.17) и результат задачи 2(b), показать, что среднее число частиц в состоянии a Е ЗСочх, которые спонтанно возникли из входящего (in) вакуумного состояния, дается согласно <ВД> = ||Ва||2. (b) Используя уравнение (14.3.6), результат (а) и соотношения задачи 3, вывести уравнение (14.3.7) для рождения частиц черными дырами. 6. Классический тензор энергии-импульса Клейна - Гордона (4.3.10) всюду имеет очевидно положительную плотность энергии; т.е. для любого времениподобного вектора ta мы получаем в любой точке Tabtatb ^ 0. Показать, что это свойство не переносится на теорию квантованного поля, найдя такое состояние Ф свободного поля Клейна - Гордона ,в пространстве-времени Минковско- го, для которого нормально^упорядоченный оператор энергии- импульса удовлетворяет (Ф|Таь|Ф)£а£6 < 0 в некоторой области
598 Глава 14. Кваитовыеэффектывсильныхгравитационныхиолях пространства-времен и. (Указание: рассмотрите состояние Ф, полученное суперпозицией вакуумного состояния и небольшой примеси двухчастичного состояния.) Заметим, однако, что полная энергия Е = fj:(Tab)€anb всегда неотрицательна для свободного поля Клейна - Гордона в пространстве-времени Минковского. Здесь £° - поле Киллинга временного сдвига. 7. Рассмотрим ящик объема V, заполненный излучением черного тела и, возможно, также содержащий черную дыру. Пренебрежем воздействием черной дыры на распределение излучения в ящике. Предположим, что полная энергия, содержащаяся в ящике (т.е. масса черной дыры плюс энергия излучения) равна Е. (a) Записать формулу для полной обобщенной энтропии S' ящика в виде функции массы-энергии М, отнесенной к черной дыре. (b) Исследуя S' на экстремум по отношению к М, определить условия, которым должны удовлетворять Е hV, чтобы было возможно равновесие между черной дырой и излучением (Gibbons, Perry 1978). Для V = 1 м3 оценить минимальное значение Е, требующееся для равновесия. В случае, когда равновесие возможно, определить, какой из экстремумов S' является локально устойчивым путем вычисления второй производной от 5'. (c) Найти условия для Е и V, при которых конфигурация (глобального) максимума обобщенной энтропии будет содержать черную дыру, а не чистое излучение.
Прилолсения
ПРИЛОЖЕНИЕ А Топологические пространства Множество различных доказательств и рассуждений в математике базируется на одинаковых или схожих идеях. Важная цель математики состоит в том, чтобы выделить ключевые идеи в форме как можно более общей, так как если можно вывести главные результаты относительно этих абстрактных идей, тогда можно применить их к исследуемым случаям без повторных усилий. Понятие топологического пространства представляет собой прекрасную иллюстрацию такой программы. Начинают с очень простых абстрактных определений и заканчивают доказательством многих сильных результатов, которые имееют широкую область применения. Глубокий интерес к топологическим пространствам возникает у нас здесь потому, что в общей теории относительности пространство-время имеет структуру топологического пространства. Действительно, многие аспекты пространства- времени в значительной степени связаны с его структурой, но мы обошли упоминание о топологических пространствах в гл. 2, непосредственно определив понятие многообразия. Однако чисто топологические рассуждения и результаты, представленные в данном разделе, играют важную роль во многих построениях и доказательствах гл. 8-9. Поэтому мы собрали в этом приложении многие ключевые определения и теоремы, касающиеся топологических пространств. Топологическое пространство (X, 2Г) состоит из множества X вместе с семейством 3" подмножеств X, удовлетворяющих следующим трем свойствам: (1) Объединение произвольного семейства подмножеств, каждое из которых принадлежит ^", также принадлежит 2?\ если Оа € & для любых а, тогда а (2) Пересечение конечного числа подмножеств из & принадлежит &\ если Oi,...One &, то п 1=1 (3) Все множество X и пустое множество 0 принадлежат 2Г.
602 Приложения Семейство 3 называется топологией на Л", а подмножества X, которые составляют семейство 3, называются открытыми подмножествами. Любое множество X легко превратить в топологическое пространство, выбирая в качестве & все подмножества X (дискретная то- пология), или полагая 3 = {Х,Щ (тривиальная топология). Гораздо более интересный пример топологического пространства получаем, выбирая X = R, где R - множество вещественных чисел, и определяя в качестве 2Г семейство, состоящее из всех подмножеств R, которые могут быть выражены как объединения открытых интервалов (а, 6). (Таким образом, при таком выборе З' на R открытые интервалы представляют собой открытые множества. Исторически именно этот пример является причиной, почему термин "открытое множество" используется при обсуждении абстрактных топологических пространств.) В более общем случае, для любого метрического пространства семейство всех подмножеств, которые могут быть выражены как объединения открытых шаров, приводит к топологии. Если (X, 3) - топологическое пространство, и А - любое подмножество X, то можно превратить А само по себе в топологическое пространство, определяя топологию У на А так, чтобы она состояла из всех подмножеств А, которые могут быть выражены как пересечения элементов «^ с А: У = {U\U = АГ\0,0 £ 3). У называется индуцированной (или наследственной) топологией. Если (Х\,ЗГ\) и (А^,^) - топологические пространства, то можно преобразовать произведение пространств Х\ х Хг = {(х\,Х2)\х\ € € Х\,Х2 € Х2) ъ топологическое пространство (Х\ х Хъ,!?), определяя 3 как состоящее из всех подмножеств Х\ хХг, которые могут быть выражены как объединение множеств вида 0\ х 0<i с 0\ € £?\ и Оч Е $2- & называется топологией произведения и, используя данное выше определение топологии на R, мы можем использовать конструкцию топологии произведения, чтобы определить топологию на Rn. Топология, которую мы получаем, та же самая, что получится непосредственным определением ^, состоящим из всех подмножеств Rn, которые можно выразить объединениями открытых шаров. Если (X, £f) и (У, У) - топологические пространства, то говорят, что отображение (карта) / : X —► Y будет непрерывным, если прообраз f~l[0] = {х € X\f(x) e О} каждого открытого множества О в Y является открытым множеством в X. Для функций, представляющих собой отображение из R в R, легко проверить, что вместе с определением топологии на R, данное определение непрерывности эквивалентно обычному на языке е — 5. Если / - непрерывное взаимно
А. Топологические пространства 603 однозначное отображение на, и его обратное отображение - непрерывно, то / называется гомеоморфизмом, а про (X, &) и (У,<У) говорят, что они гомеоморфны. Гомеоморфные топологические пространства имееют тождественные топологические свойства. Если (X, &) - топологическое пространство, то говорят, что подмножество С множества X замкнутое, если его дополнение X — С = = {х € Х\х & С} - открыто. Так, например, отрезок [а, Ь] из R (со стандартной топологией на R) - замкнутое множество. Из аксиом топологического пространства немедленно следует, что пересечение любой совокупности замкнутых множеств - замкнуто, и объединение конечного числа замкнутых множеств - замкнуто. Отметим, что подмножество может быть и не открытым и не замкнутым (например, полуинтервал [а, Ь) в 1R), или может быть одновременно и открытым и замкнутым (как все подмножества в дискретной топологии). Действительно, возможность иметь подмножества, которые обладают обоими свойствами, как открытостью, так и замкнутостью, приводит к топологическому определению связности: топологическое пространство (X, 3?) называется связным, если единственными его подмножествами, которые и открыты и замкнуты, являются само пространство X и пустое множество 0. Связным является Rn со стандартной топологией, определенной выше. Если (X, ST) - топологическое пространство, и А - произвольное подмножество X, то замыкание Л подмножества А определяется как пересечение всех замкнутых множеств, содержащих А. Ясно, что А замкнуто, содержит А и равно А тогда и только тогда, когда А замкнуто. Внутренность А определяется как объединение всех открытых множеств, содержащихся в А. Ясно, что внутренность А открыта, содержится в А и равна А тогда и только тогда, когда А открыто. Граница А, обозначаемая А, состоит из всех точек, которые лежат в Л, но не во внутренности А. Говорят, что топологическое пространство (X, ЗГ) хаусдорфово (или сепарабельно), если для каждой пары различных точек p,q€ X,p^ q, можно найти открытые множества Op,Oq G 3', такие что р G Ор, Я £ Oq, и притом OpC\Oq = 0. Легко проверить, что lRn со стандартной топологией хаусдорфово. Одним из наиболее мощных понятий в топологии является компактность, которая определяется следующим образом. Если (X, &) - топологическое пространство, и А - подмножество X, то семейство {0Q} открытых множеств называется открытым покрытием А, если объединение этих множеств содержит А. Подсемейство семейства {Оа}, которое также покрывает А, называется подпокрытием. Гово-
604 Приложения рят, что множество А компактно, если всякое открытое покрытие А имеет конечное подпокрытие (т.е. подпокрытие, состоящее только из конечного числа множеств). Так, например, в любом топологическом пространстве множество, состоящее из одной точки, компактно. С другой стороны, открытый интервал (0,1) в R (со стандартной топологией) не является компактным, так как множества Оп = (1/п, 1) с п = 2,3,... образуют такое открытое покрытие (0,1), которое не допускает конечного подпокрытия. Следующие теоремы описывают следствия компактности и показывают полезность этого понятия. Доказательства теорем можно найти практически в любом учебнике по топологии (Hocking, Young 1961; Kelley 1955). Пожалуй, наиболее важная теорема о компактных подмножествах Rn - это теорема Гейне-Бореля. Теорема АЛ. (Гейне-Борель). Отрезок [а, Ь] вещественных чисел является компактным (со стандартной топологией на Rn). Общее отношение между компактными и замкнутыми множествами описывается следующими двумя теоремами, доказательство которых прямолинейно. Теорема А.2. Пусть (X, &) хаусдорфово, и пусть А с X ком- пактно. Тогда А замкнуто. Теорема А.З. Пусть (X, &) компактна, и пусть А с X замкнуто. Тогда А компактно. Объединяя данные три теоремы, мы приходим к следующему усиленному утверждению о компактности подмножеств R. Теорема А.4. Подмножество вещественных чисел А компактно тогда и только тогда, когда оно замкнуто и ограничено. Легко доказать, что свойство компактности сохраняется при непрерывных отображениях. Теорема А.5. Пусть (X, &) и (У,У) - топологические пространства. Предположим, что (X, &) компактно, и f : X —►У непрерывно. Тогда f[X] = {у е Y\y = f(x)} компактно. В силу свойств компактных подмножеств R, сформулированных в теореме А.4, как следствие мы имеем: Теорема А.6. Непрерывная функция на компактном топологическом пространстве ограничена и достигает своих максимального и минимального значений.
А. Топологические пространства 605 Следующая теорема дает прямое расширение свойства компактности с R на Rn. Теорема А.7. (Тихонов). Пусть (Хи^[) и (Х2,&2) - компактные топологические пространства. Тогда пространство, образованное прямым произведением Х\хХ2у компактно относительно топологии произведения. Теорему А.7 можно обобщить для применения к произведению бесконечного множества топологических пространств, но для такого обобщения требуется аксиома выбора. Вместе с теоремой А.4 она приводит к следствию: Теорема А.8. Подмножество А из Rn компактно тогда и только тогда, когда оно замкнуто и ограничено. Так, например, гс-мерная сфера 5П (определенная как совокупность точек в Rn+1, удовлетворяющая соотношению х\ + ••• -I- х„+1 = 1) компактна относительно индуцированной топологии, поскольку легко видеть, что она представляет собой замкнутое и ограниченное подмножество из Rn+1. Следующим понятием, которое нам понадобится, будет сходимость последовательностей. Последовательность {хп} точек топологического пространства (X, &) называется сходящейся к точке х, если для любой заданной открытой окрестности О точки х (т.е. для открытого множества О, содержащего х) найдется N такое, что хп G О для всех п > N. Точка х называется пределом этой последовательности. Легко проверить, что для R (со стандартной топологией) это определение согласуется с обычным определением сходимости. Точка у € X называется точкой накопления (или предельной точкой) {жп}, если любая открытая окрестность у содержит бесконечно много точек последовательности. Если {хп} сходится к х, то ясно, что х является также и точкой накопления последовательности. Однако в топологическом пространстве самого общего вида, если у - точка накопления {хп}, может быть невозможно даже найти подпоследовательность {уп} точек последовательности {хп} такую, что {уп} сходятся к у. Однако выделение подпоследовательности, сходящейся к у, будет всегда возможно, если (X, &) является топологическим пространством первого класса счетности, т.е. если для каждой точки р G X имеется счетное семейство открытых множеств Оп, таких, что каждая открытая окрестность О точки р содержит по крайней мере одно из множеств этого семейства. R со стандартной топологией имеет первый класс счетно- сти. В действительности оно удовлетворяет более строгому требова-
606 Приложения нию второго класса счетности: имеется счетное семейство открытых множеств, такое, что любое открытое множество может быть выражено как объединение множеств этого семейства. Открытые шары в Rn, радиусы и координаты которых суть рациональные числа, образуют такое счетное семейство открытых множеств. Важное соотношение между компактностью и сходимостью последовательностей содержится в теореме Больцано-Вейерштрасса. Теорема А.9. (Больцано-Вейерштрасс). Пусть (Х,&) - топологическое пространство, и пусть А С X. Если А компактно, то всякая последовательность {хп} точек А имеет точку накопления, принадлежащую А. Обратно, если (X, 3) имеет второй класс счетности, и всякая последовательность из А имеет точку накопления в А, то А компактно. Так, в частности, если (X, 3) имеет второй класс счетности, то А компактно тогда и только тогда, когда всякая последовательность из А имеет сходящуюся подпоследовательность, предел которой принадлежит А. Наконец, мы определяем понятие паракомпактности, свойства, которым желательно наделить многообразия, чтобы не дать им стать "слишком большими"1. Пусть для топологического пространства (X, &) дано открытое покрытие Оа. Открытое покрытие {Vp} называется утончением {0Q}, если для каждого Vp существует Оа такое, что Vp С Оа. Покрытие {Vp} называется локально конечным, если каждая точка х £ X имеет открытую окрестность W такую, что только для конечного числа Vp выполняется W U Vp ^ 0. Топологическое пространство (X, 3) называется паракомпактным, если каждое открытое покрытие {Оа) имеет локально конечное утончение {Vp}. Несложно показать (Hocking, Young 1961), что любое хаусдорфово топологическое пространство, которое локально компактно (т.е. такое, что всякая точка имеет открытую окрестность с компактным замыканием) и может быть представлено как счетное объединение компактных подмножеств, является паракомпактным. Так, легко проверить, что Rn, 5m и их произведения паракомпактны. В действительности непросто построить примеры топологических пространств, которые удовлетворяют всем свойствам многообразия, но не являются параком- пактными. Возможно, самый простой пример - это "длинная линия" (Hocking, Young 1961), хотя для ее определения требуется аксиома выбора. Для многообразия М паракомпактность имеет ряд важных следствий. Можно показать (Kobayashi, Nomizu 1963), что паракомпакт- В смысле мощности покрытия.- Прим. ред.
А. Топологические пространства 607 ность означает следующее: (1) М допускает риманову метрику, (2) М принадлежит второму классу счетности. Этот последний результат означает, кстати, что мы можем покрыть М локально конечным, счетным семейством карт (ipi,Oi), где каждое О* компактно. Обратно, если М удовлетворяет всем свойствам многообразия (см. гл. 2), то любое из свойств (1) или (2) приводит к тому, что М паракомпактно. Пожалуй, наиболее важное следствие из паракомпактности многообразий - это разбиение единицы. Если дано локально конечное открытое покрытие {Ом} многообразия М, то разбиением единицы, подчиненным {Ом}, называется семейство гладких функций {/д} таких, что: (i) носитель /^ (т.е. замыкание множества, на котором /м не обращается в нуль) содержится в 0М; (И) 0 < U ^ 1; ("О £„//* = !• (Так как только конечное число функций /м не обращается в нуль в любой выбранной точке, то сумма в свойстве (Ш) обязательно конечная в каждой точке.) Можно показать (Kobayashi, Nomizu 1963), что любое локально конечное открытое покрытие О^ из М, такое что каждое О^ компактно, допускает подчиненное разбиение единицы. Существование разбиения единицы позволяет нам глобализовать многие локальные результаты. Например, мы можем доказать упомянутый выше результат, что паракомпактное многообразие допускает риманову метрику. Для этого покрываем многообразие локально конечным семейством карт {фц,Оц) с компактными О^, определяем риманову метрику (gp)ab в каждой локальной координатной окрестности, затем полагаем gab = ]Г^ f^g^ab, где /м - разбиение единицы, подчиненное Ом. Подобным образом существование разбиения единицы позволяет нам в прилож. В определить интегрирование на паракомпактном многообразии.
ПРИЛОЖЕНИЕ В Дифференциальные формы. Интегрирование. Теорема Фробениуса В этом приложении мы соберем некоторые результаты, относящиеся к дифференциальным формам и интегрированию. Большинство этих результатов требуют лишь задания структуры многообразия, в частности, не требуется наличия метрики или предпочтительного оператора производной. Таким образом, это основные результаты широкого применения в дифференциальной геометрии. В.1 Дифференциальные формы Пусть М - n-мерное многообразие. Дифференциальная р-форма (форма степени р) - это полностью антисимметричный тензор типа (0,р), т.е. u;ai...ap называется р-формой, если Ь>аг...ар =^[а1...ор]. (В.1.1) Мы обозначим векторное пространство р-форм в точке х посредством Л£, а множество полей р-форм - посредством Лр. Заметим, что Л£ = 0 при р > п, и что dimAJ = п\/р\(п — р)! при 0 ^ р ^ п. Если мы образуем внешнее произведение р-формы ujai...ap и g-формы /i6i...64> то мы получим тензор типа (0,р + q), но поскольку этот тензор не будет в общем случае полностью антисимметричным, он не является (рН-д)-формой. Однако мы можем полностью антисимметризовать этот тензор, сделав таким образом карту Л : Л£ х Л J —► Л£+9, посредством H/i)a,...apb,...b, = , , Ц[а|...арА*Ь1...6,]- (ВЛ'2) (Если р + q > n, этот тензор, конечно, обращается в нуль.) Мы определяем векторное пространство всех дифференциальных форм в х как прямую сумму всех Л£, п Л* = 0Л£. (В.1.3) Р=о Карта Л : Лх х кх —> Ах придает множеству Лх структуру алгебры Грассмана на векторном пространстве 1-форм1. *В этом разделе определение алгебры Грассмана (Bishop, Crittenden 1961) не понадобится.
В.1. Дифференциальные формы 609 Если дан какой-либо оператор дифференцирования VG, мы могли бы определить карту из поля гладких р-форм на поле гладких (р + 1)- форм посредством иах...ар -> (р + l)V[6o;ai...ap]. (В.1.4) Иначе, если бы дан был другой оператор дифференцирования Va, мы бы получили карту wai...ep - (Р + l)V[bwei...epl. (B.1.5) Как бы то ни было, согласно (3.1.9) мы имеем _ р V[6a;ai...ap] - V[6a;ai...ap] = ^ Cd[baja;ai...|d|...ap] = 0, (В.1.6) 3 = 1 поскольку Cdba симметричен по а и Ь. Значит карта, определенная в (В.1.4), не зависит от оператора дифференцирования, т.е. она вполне определена в отсутствие предпочтительного оператора дифференцирования на М. Мы обозначаем эту карту d 2. В частности, чтобы найти d, мы можем использовать оператор обычной производной да, связанный с любой координатной системой. Так как индексная структура дифференциальных форм тривиальна, при их записи принято опускать индексы, например, мы пишем и) вместо a;ai...ap, с^Л/х вместо (^A/x)ai...ap61#..59- (Единственный недостаток этого сокращения - надо помнить размерности форм, с которыми мы работаем.) Мы будем использовать жирные буквы для форм, чтобы избежать путаницы с функциями, (р + 1)-форму, получаемую действием карты d : Лр —> Лр+1 на р-форму а;, мы обозначаем da;. Основное свойство карты d - это d2 = dod = 0- результат, известный как лемма Пуанкаре. Он следует из того, что мы можем высчис- лить d с использованием оператора обычной производной. В самом деле, для произвольной гладкой р-формы и> мы находим (сохраняя индексную запись) (d2u;)0l...ap = (р + 2)(р + Щьдсиа^ар] = 0 (В.1.7) из-за независимости от порядка дифференцирования в Rn. Наоборот, можно доказать (Flanders 1963), что если имеется замкнутая р-форма а, т.е. удовлетворяющая da = 0, то локально, т.е. в любой открытой области диффеоморфной Rn, эта форма является 2Внешний дифференциал.- Прим. ред.
610 Приложения точной, т.е. существует такая (р— 1)-форма /3, что а = d/З. Однако этот результат, вообще говоря, не является справедливым глобально. Действительно, важная теорема алгебраической топологии, предложенная де Рамом, устанавливает, что размерность векторного пространства замкнутых р-форм по модулю точных р-форм равна топологической величине, называемой р-числом Бетти на многообразии3. В. 2 Интегрирование Пусть М - многообразие размерности п. В каждой точке х € М векторное пространство n-форм будет одномерным. Если возможно найти непрерывное нигде не обращающееся в нуль поле n-форм е = = £[<ц...ап] на М, то М называют ориентированным, а о форме е говорят, что она производит ориентацию.4. Две ориентации в и е' считаются эквивалентными, если е = f в', где / - неотрицательная функция, так что всякое ориентируемое многообразие имеет две неэквивалентных ориентации, которые обычно называют "правая" и "левая". Легко проверить, что многообразия Rn и Sm ориентируемы. В самом деле, нетрудно показать, что всякое линейно связное многобразие ориентируемо. (Как разъясняется в гл. 13, топологическое пространство называется линейно связным, если всякую замкнутую кривую можно непрерывно деформировать в точку. Rn и Sm при т ^ 2 линейно связны.) Более того, прямое произведение любых двух ориентируемых многообразий ориентируемо. Так мы получаем широкий класс примеров ориентируемых многообразий. Напротив, лента Мёбиуса дает простой пример неориентируемого многообразия (ее можно задать на Rn в неявной форме (х, у) = (х + 1, -у)). Мы определим интеграл непрерывного (или в более общем случае измеримого5) поля n-форм а на n-мерном ориентируемом многообра- 3Грубо говоря, р-число Бетти на М представляет собой число независимых р- мерных поверхностей без краев в М, которые сами по себе не являются краями (р + 1)-мерных областей. За подробным изложением, включающим полную формулировку и доказательство теоремы де Рама, отсылаем читателя к списку литературы (Warner 1971). 4 В случае, когда М представляет собой n-мерную поверхность в евклидовом пространстве Rn+1, это определение ориентируемости эквивалентно более интуитивному представлению о существовании согласованного (т.е. непрерывного) выбора векторного поля tia, нормального к М. Если непрерывное и необращающееся в нуль иа существует, тогда = ?a...an+i иа производит ориентацию М, где ~ - ориентация Rn+1. И наоборот, если М ориентируемо, то е*1 ,anacai...on производит непрерывный вектор нормали. 5Форма называется измеримой, если для всех карт компоненты ее координатного базиса являются функциями Rn, измеримыми по Лебегу.
В.2. Интегрирование 611 зии при заданной ориентации е следующим образом. Мы начинаем с рассмотрения открытой области U Е М, покрытой единой координатной системой ф. Если мы разложим е по координатному базису ф, то получим e = hdxl A---Adxn, (B.2.1) т.е. €0l...an = n!/i(da:1)[ai ... (dxn)anj. Если h > О, то координатная система ф называется "правосторонней" по отношению к €, если h < О, то ф называется "левосторонней". Мы также можем разложить а по координатному базису, получив тем самым a = а(х\..., хп) dx1 Л • • • Л dxn. (B.2.2) Если ф правая, мы определяем интеграл от а на области U как Ju Jti>[ a(x\...,xn)dx1...dxn, (B.2.3) где правая часть представляет собой стандартный кратный интеграл по Риману (по Лебегу) в Rn. Если ф левая, то в определении (В.2.3) надо изменить знак правой части. Первое, что мы замечаем, это независимость $иос от выбора координатной системы ф, покрывающей £/, а именно: если бы мы использовали другую координатную систему ф', чтобы покрыть [/, то разложение а по новому координатному базису было бы a = a'dxfl Л'-Лйх'п. (B.2.4) Но по закону преобразования тензоров (2.3.8) a'=adet(i^)' (В,2Л) Теперь стандартная формула замены переменных для кратного интеграла в Rn показывает, что наше определение (В.2.3) координатно независимо. Чтобы определить интеграл от а на всем многообразии М, мы используем свойство паракомпактности М. Как указано в конце при- лож. А, паракомпактное многообразие можно покрыть счетным набором локально ограниченных координатных окрестностей {О*}, таких, что каждая б»} компактна. Более того, для этого покрытия существует разбиение единицы {/г}. Если $^ /до»] fi\a№xl • • d#n < оо, то мы говорим, что а интегрируема, и определяем JM i JOi ha. (B.2.6)
612 Приложения Можно показать, что данное определение не зависит от выбора покрытия {Oi} и разбиения единицы {/i}, поэтому оно верно определяет Мы можем использовать данное определение интегрирования на многообразиях, чтобы определить интеграл от р-форм, заданных на М, по ориентируемым р-мерным поверхностям в М, которые имеют хорошее поведение. Во-первых, мы должны уточнить понятие "хорошего поведения". Пусть 5 - многообразие размерности р < п. Если функция ф : S —> М относится к С°° и является локально однозначной, т.е. всякая точка q Е S имеет такую окрестность О, что на О функция ф однозначна, и ф~г : ф[0] —* S относится к С°°, то говорят, что ф[в] является погружением в М. Если вдобавок ф является глобально однозначной, т.е. ф[в] не имеет "самопересечений", то говорят, что ф[Б] является вложением в М. (Иногда на вложение накладывают дополнительное условие, что ф : S —> ф[в] должно быть гомеоморфизмом с топологией на ф[в], индуцируемой из М. Грубо говоря, это дополнительное условие гарантирует, что 0[5] не будет сколь угодно близка к самопересечению.) Мы используем понятие вложения как точное определение поверхности с "хорошим поведением". Вложение размерности (п — 1) называется гиперповерхностью. Естественную структуру многообразия переносит с М на вложение ф[Б] функция ф. Так, при каждом q £ ф[в] определено касательное пространство Wq. Это касательное пространство естественным образом сопоставляется р-мерному подпространству касательного пространства Vq точки q относительно М. Таким образом, р-форма /3 на М в точке q естественным образом порождает р-форму /3 на ф[8\ путем ограничения множества значений, получаемого действием /3, векторами, принадлежащими Wq. Интеграл от /3 по поверхности ф[Б] можно теперь определить как просто интеграл от р-формы /3 по р-мерному многообразию 0[5]. Важный специальный случай вложенного многообразия возникает, когда </>[5] является (п — 1)-мерным краем N замкнутой области N С М, так что N - "многообразие с краем". В данный момент понятие n-мерного многообразия с краем N можно определить кратко тем же способом, что многообразие (см. гл.2), за исключением того, что Rn надо поменять на "половину"Rn, т.е. часть Rn с х1 < 0 (полупространство). Край N многообразия N образован множеством точек N, изображения которых попадают в множество х1 = 0 на картах многообразия N. Заметим, что эти карты N при гг1, положенным равным нулю, придают N структуру (п — 1)-мерного многообразия без края. Заметим еще, что 'mt(N) = N — N - это n-мерное многообразие без края.
В.2. Интегрирование 613 Если N - ориентируемое многообразие с краем, то задание ориентации ЛГ индуцирует естественную ориентацию его края следующим образом. Мы рассматриваем такие координатные системы на ЛГ, которые возникают при удалении первой координаты х1 из (любой) правосторонней координатной системы на ЛГ, принадлежащей семейству карт, которое превращает ЛГ в многообразие с краем. Мы хотим определить ориентацию на ЛГ, чтобы она делала так введенные координатные системы "правосторонними". Для этого мы убеждаемся сперва, что якобиан det(dx'^/dxu) положителен в области перекрывания двух любых таких координатных систем. Затем мы выбираем разбиение единицы (Fi,Ui) многообразия ЛГ, где каждое Щ суть координатная окрестность указанного типа. Наконец, мы определяем дифференциальную (п— 1)-форму € на ЛГ как е = ]Г\ Fidx^f • • • dx". Тогда € - непрерывная и не обращающаяся в нуль, а значит определяет желаемую ориентацию ЛГ. Получив определение ориентации ЛГ, мы можем теперь установить один из самых важных результатов интегрирования на многообразиях, доказательство которого можно найти во многих учебниках (Flanders 1963). Теорема В.2.1. (Теорема Стокса). Пусть N является п-мерным компактным ориентируемым многообразием с краем, и пусть а суть (п - \)-форма на М, относящаяся к С1. Тогда [ da = [ а. (В.2.7) Jint(N) JN Интегрирование функций, заданных на ориентируемом многообразии М, можно выполнить, если задан элемент объема, т.е. непрерывная не обращающаяся в нуль n-форма е. (Элемент объема отличается от ориентации тем, что ориентации считаются эквивалентными, если отличаются положительным множителем, для элементов объема это не так.) Интеграл от функции / по многообразию М определен согласно //=//€, (В.2.8) JM JM где интеграл от n-формы fe определен выше6. Если дана только топологическая структура многообразия М, то не существует какого-либо предпочтительного выбора элемента объема. 6Интегрирование функций на неориентированном многообразии может определяться выбором непрерывного "знака модуля n-формы" и выполнением интегрирования / по каждой из локальной координат окресностей, выбирая знак так, что координатная система становится ориентирована по правилу "правой руки" по отношению к ней.
614 Приложения Однако, если на М задана метрика gab, то естественный выбор в будет с точностью до знака (т.е. с точностью до ориентации) определяться условием €0l-0ne0l...an = (-l)'n!, (B.2.9) где s - количество минусов в сигнатуре метрики gab. (Так, 5 = 0 для метрики Римана, 5 = 1 для метрики Лоренца.) Заметим, что дифференцирование (В.2.9) с использованием оператора V0, метрически совместимого, означает, что 26ai-"a»V6£ai...an=0, (B.2.10) что в свою очередь означает: V6€ai...an=0, (B.2.11) потому что V6€ai...an полностью антисимметрично по последним п индексам, а £ai—°n не обращается в нуль. Стоит также заметить, что ea,"a"ebl...b„ = (-iyn\6^bl6a% ■ ■ -6a"hn, (B.2.12) где 6аь - тождественная карта на касательное пространство. Формула (В.2.12) следует из того, что тензоры типа (п, га) на n-мерном многообразии, если они полностью антисимметричны по всем нижним и всем верхним индексам, образуют одномерное векторное пространство и поэтому должны быть пропорциональны антисимметричному произведению тензоров 6аь- Константа пропорциональности устанавливается условием нормировки (В.2.9). Свертка (В.2.12) по первым j индексам дает ^.....•^...«n^ ajbj+i bn = {_iy{n_mSlaj+lbj+i...San]bn (В.2.13) Формула (В.2.9) означает, что компоненты е в правостороннем ор- тонормированном базисе равны 6 _ f(-l)P, если все щ различны (В 2 14) Mi-Mn | о? в противном случае ' * где Р - четность перестановки (1,..., га) —► (/ii,..., /хп). В координатном базисе компоненты е удовлетворяют £ S*1"1 • ■■^,/"etll...^1..Mn = (-l)'n! (В.2.15) Ml, ...,«'n Но левая часть этого выражения есть просто га!(б12...п)2, умноженное на определитель матрицы gf"', причем det^") = l/det(g). Значит,
В.2. Интегрирование 615 полагая знак плюс соответствующим правосторонней координатной системе, находим €i2...n = ^/(-l)Met(g/iI/) = л/Шэ (В.2.16) где g = det^"). Таким образом, в любом (правостороннем) координатном базисе естественный элемент объема, определенный формулой (В.2.9), имеет вид € = y/\g\dxl Л • • • Лdxn. (B.2.17) С помощью естественного метрически совместимого элемента объема € мы можем теорему Стокса (В.2.7) записать в частном случае "Гаусса-Остроградского". Пусть N - ориентируемое компактное п- мерное многообразие с краем7. Пусть gab - метрика N с метрически совместимым элементом объема €. Для данного векторного поля va, относящегося к классу С1, мы можем составить (п — 1)-форму а согласно ^...а»-! = 6bai...an_!V6. (B.2.18) Находим дифференциал с использованием (В.2.11) (d<*)Cal...an-i = rcV[c (€Waim,man^]Vb) = n€b[ei...en.1Vc,t;b. (B.2.19) С другой стороны, любой полностью антисимметричный тензор типа (О, п) должен быть пропорционален €, так что €b[ai...an^c)Vb = fcca^-an-!- (B.2.20) Функцию h можно найти, сворачивая данное соотношение с ccai—e»»-i и применяя формулу (В.2.13). Так, получаем V6v6 = nh. (B.2.21) Следовательно, мы нашли, что d€ = (Vbvb) е. (В.2.22) И таким образом теорема Стокса утверждает, что / Vat;a = / €6ai...an_lV6, (B.2.23) J'mt(N) JN 7В данном случае максимальной размерности край - то же самое, что граница области.- Прим.ред.
616 Приложения где интегрирование в левой части подразумевается с естественным элементом объема многообразия с краем (границей) N. Правую часть (В.2.23) можно переписать следующим образом. Метрика gab многообразия N индуцирует тензорное поле hab на краю N ограничивая действие gab векторами, касательными к N. Если hab невырождена, а так будет в случае непустой N, мы можем использовать ее для определения элемента объема е на N. Несложно показать, что ^...оп., = *Ьа1...ап-1ПЬ, (В.2.24) где пъ - единичный вектор нормали к краю N, выбранный в направлении "наружу" для пространственноподобного края, и "внутрь" для времениподобного, так чтобы в принадлежал классу ориентации, используемому в теореме Стокса. Как и в предыдущем случае, у определенного на N тензора ebai„man_lvb должна быть пропорциональность к €, и тот же тип расчета, что привел к (В.2.21), дает в этом случае €Ьа1...ап-1УЬ = (nbVb)€ai...an-i' (B.2.25) Таким образом, если N не пустое, мы можем записать теорему Стокса в форме / Vava = f nava (B.2.26) J'mt(N) JN для векторного поля va, относящегося к классу С1, где подразумеваются интегрирования с естественными элементами объема в на int(iV) и € на N. Конечно, если N пустое, уравнение (В.2.23) все равно справедливо. Более того, в этом случае, если мы выберем любой вектор нормали па и определим в так, чтобы -€ai...en = Щьеа2...ап], (В.2.27) то теорема Стокса вновь примет форму (В.2.26). В.З Теорема Фробениуса Пусть М представляет собой n-мерное многообразие. Часто возникает проблема такого рода. В каждой точке х е М задано подпространство Wx С Vx касательного пространства Vx с размерностью dimV^x = т < п. По условию подпространство Wx гладкое по а: в том смысле, что для каждой х Е М мы можем найти ее открытую окрестность О такую, что для всех точек у внутри О подпространства Wy
В.З. Теорема Фробениуса 617 образуют векторное поле класса С°°. Обозначим через W множество всех Wx, называемое спецификацией. Нас интересует, можно ли найти интегральные подпространства в W, т.е. можно ли через каждую точку х провести вложение 5 такое, что касательное пространство к этому вложению в любой его точке у е S совпадало бы с W. Важный частный случай этой общей проблемы возникает, когда имеется метрика на М и хотят узнать, ортогонально ли векторное поле £° семейству гиперповерхностей (например, см. разд. 6.1), т.е. являются ли интегральными (п — 1)-мерные подпространства W, ортогональные £а. Если подпространства W одномерные, данная проблема сводится к поиску интегральных кривых гладкого векторного поля va. Как выяснено в разд. 2.2, такие интегральные кривые всегда можно найти. Однако при dimW > 1 возможно такое "скручивание" W-поверхностей, что интегральных вложений найти не удастся. Чтобы понять, в чем тут дело, мы замечаем, что если бы можно было найти интегральные вложения, мы могли бы натянуть W в окрестности любой точки на координатное векторное поле X",..., Х^ в М такое, что [Х^у Хи] = 0. Поскольку два любых векторных поля У° и Za, лежащих в W, можно выразить линейными комбинациями в координатном векторном поле, то для всех Ya,Za € W мы имеем [У, Z] = Х>Л, ЬиХи] = Y, \аМЪу) - &ЛЫ] Xv G W. (В.3.1) Если W имеет то свойство, что [Y,Z]a € W для всех Ya,Za £ W, то W называется инволютным. Мы только что показали, что инволютность является необходимым условием для W иметь интегральные вложения. Напротив, можно доказать (Bishop, Crittenden 1964), что это условие является и достаточным. Этот результат известен как теорема Фробениуса. Теорема В.3.1. (Теорема Фробениуса в векторной форме.) Необходимым и достаточным условием существования интегральных вложений гладкой спецификации W, состоящей из т-мерных подпространств касательного пространства в каждой точке х € М, является инволютность W, т.е. для всех Ya,Za G W выполняется [Y,Z]a€W. Теорема Фробениуса имеет также дополняющую формулировку на языке дифференциальных форм. При заданном как и выше Wx С Vx мы можем рассматривать 1-формы ш € V*, которые удовлетворяют иаХа = 0 (В.3.2)
618 Приложения для всех Ха е W. Нетрудно понять, что такие 1-формы натягивают (п — т)-мерное подпространство Т* С V* в дуальном касательном пространстве в точке х. Напротив, (п — т)-мерное подпространство Т* пространства V* определяет посредством уравнения (В.3.2) т-мерное подпространство Wx в Vx. Таким образом, мы можем переформулировать исходную проблему на языке Т* так. Гладкая спецификация (га—т)-мерных подпространств всех форм 1-ой степени, определенных в каждой точке, обозначаемая Т* при каких условиях имеет то свойство, что ассоциированные касательные подпространства W (состоящие при каждом х из всех векторов Ха, удовлетворяющих иаХа = О для всех ша € Т*) допускают интегральные вложения? Согласно теореме Фробениуса интегральные вложения будут существовать тогда и только тогда, когда для всех иа € Т* и для всех Уа, Za eW (так что шаУа = ujaZa = 0) мы имеем ua[Y,Z}a = 0. (В.3.3) Чтобы увидеть, что это означает для ыа, мы выражаем коммутатор через произвольный дифференциальный оператор Va с помощью (3.1.2) и получаем О = <ja(YbVbZa - ZbVbYa = -ZaYbVbua + YaZbVbua = 2YaZbV[bua]. (B.3.4) Однако уравнение (В.3.4) может выполняться для Ya и Za в подпространстве, дающем нуль при действии Т*, тогда и только тогда, когда V[fcu;a] выражается линейной комбинацией п—тп <т=1 где все va - произвольные 1-формы, а все /ха € Г*. Таким образом, мы можем переформулировать теорему Фробениуса на языке дифференциальных форм и дуального касательного пространства. Теорема В.3.2. (Теорема Фробениуса в дуальной форме.) Пусть Т* - гладкая спецификация (п — т)-мерного подпространства форм 1-ой степени. Тогда т-мерное ассоциированное подпространство W касательного пространства допускает существование интегральных вложений тогда и только тогда, когда для всех wGT* выполняется dw = J2a Р° Л V<J> где каждое /х'еГ.
В.З. Теорема Фробениуса 619 Дуальная формулировка теоремы Фробениуса дает полезный критерий ортогональности векторного поля £а к гиперповерхности. Обозначая Т* одномерное подпространство (гиперповерхности (п — 1)- мерны), натянутое на £а = £а&£6, мы видим, что £° будет ортогонально гиперповерхности тогда и только тогда, когда У[а£б] = €[аЩ]- (Мы ввели по условию теоремы /ха = £а, поскольку Т* одномерное.) Исключая неопределенную 1-форму v с помощью тождества €[а€ьУс] = О убеждаемся, что отсюда вытекает необходимое и достаточное условие ортогональности £а к гиперповерхности: £[aVfe£c] = 0. (В.З.б)
ПРИЛОЖЕНИЕ С Отображения многообразий. Производные Ли. Поля Киллинга В этом приложении рассматриваются вопросы, относящиеся к отображениям, индуцированным на тензорных полях со стороны отображений между многообразиями. Как показано в разд. С.1, если мы имеем отображение ф : М —> N между многообразиями М и N, то можно использовать ф, чтобы перенести тензорные поля с верхними индексами из М в N, а тензорные поля с нижними индексами - из N в М. Если ф - диффеоморфизм, то тензорные поля всех типов могут быть перенесены из М в N или из N в М. Этот результат имеет важный частный случай, когда фг:М^>М- однопараметрическое семейство диффеоморфизмов, генерированное векторным полем va. Мы можем сравнить данное тензорное поле с новым тензорным полем, которое возникает при действии </>* при малых t. Как показано в разд. С.2, такое сравнение дает начало понятию производной Ли по отношению к векторному полю va. Наконец, векторное поле, которое генерирует од- нопараметрическую группу изометрий, называется векторным полем Киллинга. Используя общие формулы для производных Ли, легко вывести уравнения для полей Киллинга и некоторые важные их свойства, что представлено в разд. С.З. С.1 Отображения многообразий Пусть М и N - многообразия (не обязательно одинаковой размерности) и пусть ф : М —► N - отображение класса С00. Естественным образом ф "перетягивает обратно" функцию / : N —► R на N в функцию / о ф : М —► R, полученную композицией / и ф. Анологично, естественным образом, ф "переносит вдоль" касательные векторы в точке р € М в касательные векторы в точке ф(р) € N, т.е. определяет отображение ф* : Vp —► Уф(р) следующим образом: для v e Vp мы определяем ф*у € V^(p) как (ф*у)(/) = у(/оф), (С.1.1) для всех гладких f : N —* Ж. Здесь мы опустили векторные индексы для v и ф*у, так как такое обозначение неудобно в данном случае.
С.1. Отображения многообразий 621 Легко проверить, что ф*у удовлетворяет свойствам, которые накладываются на касательный вектор в </>(t), и поэтому уравнение (С. 1.1) по существу определяет отображение ф*. Отметим, что ф* является линейным и может рассматриваться как "производная" ф в точке р. (Матрица, построенная из компонент ф* в двух координатных базисах: базисе координатной системы {хи} в точке р и в базисе координатной системе {у**} в ф(р), - равна матрице Якобиана отображения ф между этими координатами, т.е. (ф*)^и = ду^/дхи.) По теореме о неявной функции ф : М —► N будет взаимно однозначной в окрестности р, если ф* : Vp —> V^(p) взаимно однозначна. Аналогично, мы можем использовать ф, чтобы дуальные векторы в точке ф(р) "перетянуть обратно", превратив их в дуальные векторы в точке р. Мы определяем отображение 0* : V?, ч —» V*, требуя, чтобы для всех va € Vp выполнялось (Фф)аУа = >1а(Ф*У)а. (С.1.2) Можно распространить действие 0* на отображение тензоров типа (О, I) в точке ф(р) на тензоры типа (О, I) в точке р соотношением (Ф.Т)а1...а,Ма1 ■ ■ • М°' = Tai...a,(<rvi)a* ■ ■ ■ (ф^Г. (С.1.3) Подобным же образом мы можем распространить действие ф* типа (А:, 0) в точке р на тензоры типа (&, 0) в точке ф(р) с помошью соотношения: (^Г)ь-ь*Ыб1 • • • Ыь* = Ть^Ь-(фф1)ь1 ■ ■ ■ {ффк)Ьк. (С.1.4) (Согласно (С.1.2), это согласуется с нашим исходным определением ф* на векторах.) Однако, вообще говоря, мы не можем распространить ф* или 0* на смешанные тензоры, так как ф* не знает, как "переносить вдоль" тензоры с нижними индексами, в то время как 0* не знает, как "перетягивать обратно" тензоры с верхними индексами. По определению из гл. 2 отображение ф : М —> N класса С°° называется диффеоморфизмом, если оно взаимно однозначное отображение на, и ему обратное также принадлежит С°°. Если ф - диффеоморфизм (что с необходимостью означает dimM = dimiV), то мы можем использовать ф~г, чтобы распространить определение ф* на тензоры всех типов, используя то, что {ф~1)* переводит V^(p) в Vp. Если Tbl-bkai...ai - тензор типа (&,/) в точке р, мы определяем тензор (ф*Т)Ь1~Ька1 ai в точке ф{р) так: (Ф"Пь*~ь*а1„Л1 Ыьг • • • Ыьк (*i)ai • •. (иг =
622 Приложения = Tb'-bfc01...ai (фф1)Ь1 ■ ■ • (ф.цк)Ьк ([Ф~ 'Yhr ■ ■ ■ ([ф-^иг. И подобным образом мы могли бы распространить отображение ф на все тензоры. Однако несложно показать, что ф* = (0-1)*, так что мы должны принять во внимание только ф и (ф~1)*. Если ф : М —► М - диффеоморфизм и Т - тензорное поле на М, мы можем сравнить Т с ф*Т. Если ф*Т = Т, тогда несмотря на то, что мы "перенесли" Т посредством 0, он "остался тем же самым". Другими словами, ф - это преобразование симметрии тензорного поля Т. В случае метрики gab преобразование симметрии, т.е. диффеоморфизм ф такой, что ф*Ваь = gabi называется изометрией. Мы уже отметили в гл. 2, что если ф : М —► N - диффеоморфизм, то многообразия М и N имеют идентичную структуру. Если теория описывает природу как пространственно-временное многообразие М с определенными на нем тензорными полями Т^г\ то если ф : М —► N - диффеоморфизм, решения (М,Т^) и (М,ф*Т^) имеют тождественные с физической точки зрения свойства. Любое физически осмысленное утверждение о (М,Т^) остается равно справедливым и для (М,ф*Т^). С другой стороны, если (N,T'W) не связано с (M,T^) диффеоморфизмом, и если тензорные поля Т^ представляют измеряемые величины, то (АГ,Т^г^) будет физически отличимо от (М,Т*(г)). Таким образом, в диффеоморфизмах заключена калибровочная свобода любой теории, сформулированной с помощью тензорных полей на пространственно-временном многообразии. В частности, в диффеоморфизмах заключена калибровочная свобода общей теории относительности. Стоит отметить, что можно принятть и альтернативную точку зрения на диффеоморфизмы. Выше мы обсудили диффеоморфизмы без введения координатной системы или ее использования. Мы приняли "активную" точку зрения, связав с ф отображения тензоров в точке р в тензоры в точке ф(р). Однако, если нам дана координатная система {ям}, покрывающая окрестность U точки р и координатная система {2/м}, покрывающая окрестность V точки </>(р), то мы можем принять следующую "пассивную" точку зрения. Мы можем использовать </>, чтобы определить новую координатную систему {х'м} в окрестности О = (^[V] точки р, полагая x'^{q) = у^{ф{а)) для q £ О. Тогда мы можем считать, что действие ф оставляет саму точку р и все тензоры в точке р неизменными, но производит координатное преобразование х** —> x'fi. Эта "пассивная" точка зрения на диффеоморфизмы радикально отличается от развитой выше "активной" точки зрения только с философской позиции, но на практике эти точки зрения по сути эквивалентны, так как компоненты тензора ф*Т в точке ф(р), найденные
С.2. Производные Ли 623 координатной системе активной точки зрения {г/^}, в точности равны компонентам Т в точке р в координатной системе {х**} пассивной точки зрения. С.2 Производные Ли Пусть М - многообразие и пусть фь - однопараметрическая группа диффеоморфизмов. Как обсуждено в разд. 2.2, </>* будет генерироваться векторным полем va. По результатам предыдущего раздела мы можем использовать ф\ для переносов гладкого тензорного поля Tai~akbl...br Сравнение Tai-°fc6l...b/ и ф*_гТа1 -aV..6, при малых t приводит к понятию производной Ли £v по отношению к va. Более точно, мы определяем £v соотношением £vTa> -av..6, =Щ ^-^ }' (С21) где все тензоры в (С.2.1) вычисляются в одной и той же точке р. Отметим, что векторный индекс va не выписывается в символе £v, так как его присутствие могло бы привести к путанице. Из определения (С.2.1) немедленно следует, что £v - линейное отображение из гладкого тензорного поля типа (к,1) в гладкое тензорное поле типа (к,1). Также несложно показать (см. (С.2.4) ниже), что £v удовлетворяет правилу Лейбница для внешнего произведения тензоров. Более того, так как va - касательный вектор к интегральным кривым функции </>*, то для функций / : М —> R мы имеем Mf) = «(/)• (С2.2) Заметим также, что £уТа1"Мкь1...ь1 — О повсюду тогда и только тогда, когда при всех t преобразование фг служит преобразованием симметрии Ta*-a*6l...6,. Чтобы проанализировать действие £v на произвольное тензорное поле, полезно адаптировать координатную систему на М, выбрав в качестве параметра t интегральных кривых фг одну из координат х1, так что va = (д/дх1)а. (Это всегда можно сделать локально в любой области, где va ф 0.) Действие ф-t тогда соответствует координатному преобразованию х1 —* х1 + t с фиксированными ж2,...,хп. Из замечания в скобках после формулы (С.1.1) мы имеем {ф*)^и = 6**пи и, следовательно, 01tT°1-Ofc61...6/ в точке р с координатами х1,... ,хп имеет в координатном базисе компоненты ^ltT^-^Ul.^l(x\...,xn) = T>il-'i\l..Ml(x1+t,x2,...,xn). (С.2.3)
624 Приложения Как следствие, компоненты, производной Ли тензора Т4*1-0*^...^ в координатной системе, адаптированной к v°, это просто a"'-w,,..„ = а/1-"'- (с.2.4) Так, в частности, <f>t будет преобразованием симметрии T°1"°fcb1...6i тогда и только тогда, когда компоненты Т^1 •/ifcI/1...l// в системе координат, адаптированной к va, не зависят от координаты х1 интегральной кривой. Мы можем получить координатно независимое выражение для производной Ли векторного поля wa, замечая, что в адаптированной системе координат по формуле (С.2.4) £.*? = f-т- (С.2.5) С другой стороны, так как va = (д/дх1)а и wa = J2uwli(d/dxl*)a> TO коммутатор v" и гиа дается соотношением [v,w]^J2^—-^—j = —. (С.2.6) Таким образом, мы нашли, что компоненты £vWa и [v,w]a равны в адаптированной системе координат. Однако, так как обе эти величины определены координатно независимым способом, мы получаем £vwa = [v,w)a, (С.2.7) что и представляет собой искомую координатно независимую формулу для производной Ли векторного поля. Действие производной Ли на все другие типы тензорных полей определяется соотношениями (С.2.2), (С.2.7) и правилом Лейбница. Например, для дуального векторного поля /za мы получаем по формуле (С.2.2) £v(^awa) = v{fiawa), (С.2.8) где wa - произвольное поле. С другой стороны, по правилу Лейбница и (С.2.7) имеем £v(»aWa) = Wa£vfJia + fia[v,w]a. (C.2.9) Из равенства правых частей (С.2.8) и (С.2.9) мы получаем формулу, которая определяет £уца- Удобнее всего записать ее с применением
С.2. Производные Ли 625 дифференциального оператора. Если Va - произвольный дифференциальный оператор на М, то в силу свойств (4) и (2) определения дифференциального оператора (см. разд. 3.1), мы имеем v(fiawa) = vbVb(»awa) = vbwaVb»a + vb>aV'bwa. (C.2.10) С другой стороны, ранее (см. (3.1.2)) мы показали, что [v, w]a = vbWbwa - wbVbva. (C.2.11) Таким образом, получаем vbwaVbfj,a + vbnaVbwa = wa£vfia + fJ,avbVbwa - fiawbVbva, (C.2.12) т.е. £v»a = vbVbfia + nbVavb. (C.2.13) В самом общем случае для произвольного тензорного поля Tai-Mkbl.„bl найдем по индукции, что £vTa*'akbl...bl = <A7cTai- ~akbl...bl- к i -^r—^l..ib|Vc/4^r-fl41..,.,JV6jUc. (C.2.14) г=1 j=l Подчеркнем вновь, что (С.2) справедливо для любого оператора дифференцирования Va. Наконец, мы уже заметили в разд.С.1, что если ф : М —► М - диффеоморфизм, то (M,gab) и (М, ф*ЕаЬ) представляют одно и то же физическое пространство-время. Если мы рассмотрим однопараметри- ческое семейство пространств-времен (M,ga6(A)), тогда {М,ф*^аЬ(\)) представляет то же самое физическое однопараметрическое семейство, где ф\ - произвольная однопараметрическая группа диффеоморфизмов. Если, как в разд. 4.4 и 7.5, мы рассмотрим возмущения первого порядка метрики gab\x=o, полученные дифференцированием gab(\) по А при А = 0, то найдем, что 7ab = dgab/dMx=o и 7«б = d(<t>x8ab)/dX\\=o представляют одно и то же физическое возмущение. Но нетрудно заметить, что lab = lab ~ £vgab, (C.2.15) где va - векторное поле, которое генерирует фх и gab(X = 0). Таким образом, калибровочная свобода возмущений 7аб задается при помощи £vgabi гДе v° ~ произвольное векторное поле. Более того, в силу (С.2) мы имеем £vgab = V° Vcgab + 9cb VaVC + 9acVaVC =
626 Приложения = Vavb + Vbva, (C.2.16) где вторая строка (С.2.16) выполняется, когда оператор производной Va метрически совместим с gab. Таким образом, калибровочные преобразования линеаризованной общей теории относительности вблизи решения gab таковы lab — lab = lab ~ VaVb - VbVa. (C.2.17) Они находятся в тесной аналогии с калибровочной свободой электромагнетизма: Аа —> Аа = Аа — VaX- С.З Векторные поля Киллинга Если фг : М —> М однопараметрическая группа изометрий ф^аЬ = = gab, тогда векторное поле £а, которое генерирует фи называется векторным полем Киллинга. Как уже отмечено выше, необходимое и достаточное условие того, чтобы </>* было группой изометрий, - соотношение (С.2.2) дает £$gab = 0. Поэтому, в соответствии с (С.2.16), необходимое и достаточное условие, чтобы £а было полем Киллинга, заключается в уравнении Киллинга Vo& + Vb& = 0, (С.3.1) где Va - оператор производной, метрически совместимый с gab. Одно из наиболее полезных свойств векторного поля Киллинга дается следующим утверждением. Утверждение С.3.1. Пусть £° - векторное поле Киллинга, и пусть 7 - геодезическая линия с касательным вектором иа. Тогда £аиа - постоянно вдоль 7- Доказательство. Имеем UbVb(taUa) = UbUaVb£a + &tl6Vbtle = 0, (С.3.2) поскольку первое слагаемое равно нулю в силу уравнения Киллинга (С.3.1), а второе - в силу уравнения геодезической. D Так как в общей теории относительности времениподобные геодезические представляют движения в пространстве-времени свободно падающих частиц, а нулевые геодезические представляют пути лучей
С.З. Векторные поля Киллинга 627 света, утверждение С.З Л можно интерпретировать следующим образом: всякое однопараметрическое семейство симметрии приводит к сохраняющейся величине для частиц и световых лучей. Эта сохраняющаяся величина дает возможность определить гравитационное красное смещение в стационарных пространствах-временах, а также крайне полезна для интегрирования уравнения геодезической при наличии симметрии (см. разд. 6.3). Другая полезная формула связывает вторую производную поля Киллинга с тензором Римана. По определению тензора Римана имеем V0V6£C - V6V0£C = Rabcd &. (С.3.3) С другой стороны, согласно уравнению Киллинга, можно переписать (С.3.3) так: VaV6£c + VfeVc£a = Rabcd U (C.3.4) Если мы перепишем это уравнение с циклическими перестановками индексов (абс), (bed) и (саб), а затем сложим два первых уравнения и вычтем третье, то получим 2VfeVc£a = (Да6с + Rbca ~ Rcab )£d = — 2i?abc £d> (С.З.5) где в последнем действии использована симметрия (3.2.14) тензора Римана. Таким образом, для любого поля Киллинга £а мы получаем формулу VaV6£c = -Rbcad &. (С.3.6) Важное следствие уравнения (С.3.6) заключается в том, что вектор Киллинга £° полностью определяется значениями £а и Ьаь = Va£b в любой точке р € М; а именно, если нам задано (£а,Ьаь) в точке р, тогда (£°, Ьаь) в любой другой точке q определяется интегрированием системы обыкновенных дифференциальных уравнений vaVaZb = vaLab, (C.3.7) vaVaLbc = -Rbcad Uva (C.3.8) вдоль любой кривой, соединяющей р и я, где va обозначает касательный вектор к кривой. Прямые следствия этих результатов таковы: (i) если поле Киллинга и его производные обращаются в нуль в точке, тогда поле Киллинга равно нулю повсюду; (и) на многообразии размерности п могут существовать самое большее п + п(п — 1)/2 = = п(п + 1)/2 линейно независимых полей Киллинга (и значит самое большее (п(п+ 1)/2)-параметрическая группа изометрий), поскольку такова размерность пространства начальных данных для (fa, Ьаь).
628 Приложения Стоит заметить, что если мы свернем уравнение (С.3.6) по а и 6, то получим V°Va£c = -Rcd &. (С.3.9) Таким образом, в вакуумном пространстве-времени Rc = О поле Кил- линга £а удовлетворяет уравнению Максвелла (4.3.15) без источников для векторного потенциала в калибровке Лоренца. (Имеется разница между уравнениями (4.3.15) и (С.3.9) в знаке слагаемого с тензором Риччи, так что уравнения Максвелла не выполняются, когда Rab ф 0.) Условие калибровки Лоренца Va£a = 0 также выполняется, благодаря уравнению Киллинга, и поэтому все поля Киллинга в вакуумных пространствах-временах приводят к решениям уравнений Максвелла. Можно получить таким методом решения, представляющие физический интерес (Wald 1974b). В случае гиперповерхности, ортогональной векторному полю Киллинга х°, мы можем получить простую формулу для VaX6- По теореме Фробениуса В.3.2 существует векторное поле va такое, что VaXb = V[aX6] = X[aVb\. (C.3.10) Предполагая, что ха отлично от нуля, мы можем выбрать va ортогональным к х°- Сворачивая уравнение (С.3.10) с х6> мы получаем \Va(xbXb) = -\vaXbXb. (С.3.11) Далее решая уравнение (С.3.11) относительно va и подставляя результат в уравнение (С.3.10), мы находим, что произвольная гиперповерхность, ортогональная полю Киллинга х° при хаХа Ф 0, удовлетворяет уравнению VaX6 = -X[aVb]ln|xcXc|. (С.3.12) Наконец, мы обратим внимание на два обобщения понятия векторных полей Киллинга. Во-первых, конформная изометприя ф на многообразии М с метрикой gab определяется как диффеоморфизм ф : М —► —► М, для которого существует функция И такая, что ф*gab — &2ёаь- (Тот факт, что ф диффеоморфизм означает, что П не обращается в нуль. Случаю Q = 1 соответствует, конечно, обычная изометрия.) Ин- финитизимальный генератор фа однопараметрической группы фг конформных изометрий называется конформным векторным полем Киллинга. Ясно, что производная Ли от gab по фа должна быть пропорциональна gab. Таким образом, фа удовлетворяет уравнению ^а'Фь + V6^a = (*gab, (С.3.13)
С.З. Векторные поля Киллинга 629 здесь Va - оператор производной, метрически совместимый с gab. Взяв след уравнения (С.З. 13), мы вычисляем функцию а, получая таким образом Уа'Фь + VWa = l(VCTpc)gab, (С.3.14) где п = dimM. Уравнение (С.3.14) известно как конформное уравнение Киллинга. Утверждением С.3.1 мы доказали, что для любой геодезической линии с касательным вектором иа и для любого поля Киллинга £а внутреннее произведение £ама постоянно вдоль геодезической. Те же самые вычисления для конформного поля Киллинга дают ubVb(i>aua) = -(Vc<tpc)ubub. (С.3.15) п Значит, в общем случае ipaua не является постоянной вдоль геодезической. Однако для нулевой геодезической имеем щиь = 0, так что правая часть уравнения (С.3.15) обращается в нуль. Таким образом, конформное поле Киллинга приводит к интегралам движения для нулевых геодезических. Второе обобщение вектора Киллинга, на которое мы обратим внимание, - тензор Киллинга. Тензорное поле Киллинга порядка т на многообразии М с оператором производной Va определяется как полностью симметричное m-индексное тензорное поле Kai„,am= /f(ai...am)> которое удовлетворяет уравнению V(6*rai...am) = 0. (С.3.16) Хотя уравнение (С.3.16) естественным образом обобщает уравнение Киллинга (С.3.1), следует отметить, что тензорные поля Киллинга (помимо векторов Киллинга или тензоров Киллинга, построенных прямым произведением векторов Киллинга) не возникают естественным образом в связи с группой диффеоморфизмов на М. Однако тензоры Киллинга разделяют с векторами Киллинга способность порождать интегралы движения: доказательство утверждения С.3.1 показывает, что для любой геодезической 7 с касательным вектором иа величина Kai„.arnuai ---uarn постоянна вдоль 7- Метрика Керра (см. гл.12) обладает нетривиальным тензорным полем Киллинга Каь, и порождаемый им интеграл движения (вместе с интегралами, полученными от двух векторов Киллинга) позволяет найти все геодезические явным образом.
ПРИЛОЖЕНИЕ D Конформные преобразования Пусть М - n-мерное многообразие с метрикой gab любой сигнатуры. Если О, - гладкая, строго положительная функция, тогда говорят, что новая метрика ga6 получена из gab при помощи конформного преобразования. Следует подчеркнуть, что конформное преобразование, вообще говоря, не ассоциируется с диффеоморфизмом М. (Как указано в конце прилож. С, диффеоморфизм ф : М —> М, для которого (Ф*ё)аЬ = 0>2ёаЬ1 называется конформной изометрией.) Конформные преобразования часто встречаются в контексте общей теории относительности, в частности при определении асимптотической плоскостности (гл. 11). Оператор производной и кривизна go6 связаны относительно простым образом с теми же величинами из gab. В этом приложении мы выводим эти соотношения, а также обсуждаем поведение решений некоторых уравнений при конформных преобразованиях. Прежде всего мы отметим, что в случае, когда метрика gab лоренце- ва, вектор va будет времениподобным, нулевым или пространственно- подобным по отношению к gab тогда и только тогда, когда он обладает этим свойством по отношению к ga6. Поэтому (M,gab) и (M,ga6) имеют идентичную причинную структуру. И наоборот, если световые конуса двух лоренцевых метрик gab и gab совпадают в точке р € М, тогда в точке р метрика gab должна быть кратной gab, т.е. gab = fi>2gab- Доказательство. Пусть ta, х",..., х„_г будет ортонормированным базисом gab. Тогда ta ± х" - это нулевые геодезические по отношению к gab и, следовательно, по отношению к ga6, откуда следует, что в метрике gab величины ta и х* ортогональны, и их нормы одинаковы по величине. То, что и ta + (х* + х")/у/2 является нулевыми геодезическими при i ф з, показывает, что х" ортогонально х*. Таким образом, ta, Xi,..., Xn-i представляет собой ортонормированный базис gab с точностью до постоянного множителя. □ Следовательно, если два пространства-времени, (M,ga6) и (M,go6), имеют идентичную причинную структуру, то gab должна быть связана с gab конформным преобразованием. Так как в рассматриваемой ситуации присутствуют две метрики gab и 8abi может возникнуть недоразумение: какая метрика используется при поднятии и опускании индексов. Мы столкнемся с этой проблемой при явной записи метрики во всех формулах, в которых поднимаются
D. Конформные преобразования 631 и опускаются индексы. Обозначим обратную метрику к gab как g°6, а обратную метрику к ga6 как g° . Ясно, что имеем ]>аЬ = О-2^06, поскольку при этом g° g6c = ^^с = ^°с- Отметим, что g" не равна ga6, индексы которой подняты при помощи 5а6. Пусть Va означает оператор дифференцирования, метрически совместимый с ga6, а Va - оператор дифференцирования, метрически совместимый с gab. Связь между Va и Va задается соотношениями (3.1.2) и (3.1.23). Меняя ролями Va и Va в этих соотношениях (так что Ссаь теперь определяется из ¥аь>ь = Vau>b — Сс0ьи;с), находим ССаЪ = \fd {VagM + Vbgad ~ Vdga6} . (D.l) Однако, так как VagbC = 0> имеем Vogb, = V„(n2g6c) = 2ng6cV0fi. (D.2) Следовательно, мы получаем ccab = n-1fd{gbdvan+gadvbn-gabvdn} = = 28c{aVb)\nQ-gabgcdVd\nn, (D.3) что и выражает Ссаь через Q и gab. Мы можем применить уравнение (D.3) в задаче сравнения геодезических, заданных в метриках с Va и с Va. Касательный вектор va к аффинно параметризованной геодезической 7> заданной уравнением с Va, удовлетворяет условию vaVavb = 0. (D.4) Следовательно, имеем vaVavb = vaVavb + vaCbacvc = 2vVVclnn - (gacvavc)^dVd\nQ. (D.5) Таким образом, вообще говоря, 7 не будет геодезической по отношению к Va. Однако в случае нулевой геодезической gacvavc = 0 соотношение (D.5) представляет собой как раз уравнение (неаффинно параметризованной) геодезической (3.3.2) с a = 2vcVc In ft. Таким образом, нулевые геодезические конформно инвариантны, т.е. нулевые геодезические по отношению к Va совпадают с таковыми по отношению к Va, причем аффинный параметр Л вторых геодезических связан с аффинным параметром А первых геодезических посредством — = const • ft2. (D.6)
632 Приложения Соотношение между кривизной Rabcd, ассоциированной с Va, и кривизной Rabcd, ассоциированной с Va, задается уравнением (7.5.8). Следовательно, используя нашу формулу (D.3) для Ссаь, находим Rabc = Дабе ~ 2V[aC b]c + 2С€с[аС ь)е = = Rabcd - 2V[o + 2Sd[aV4 Vc In П - 2^egc[aVq Ve In ft + + 2 (V[e In ft) Jrf6] Vc In ft - 2 (V(a In ft) &]св* V/ In ft - - 2&[a(* V' (Ve In ft) V/ In ft. (D.7) Сворачивая по b и d, получаем Дас = Rac ~ (П - 2) Va Vc In ft - &b/e VdV€ In ft + +(n - 2) (Va In ft) Vc In ft - (n - 2)gaJle (Vd In ft) Ve In ft. (D.8) Сворачивал (D.8) с gac = ft"2^00, получаем R = ft"2 {R - 2(n - l^Va Vc In ft - - (n - 2)(n - l)^c (Ve In ft) Vc In ft} , (D.9) где R = ga J?a6 и Я = g?bRab- Наконец, применяя определение конформного тензора Вей л я (3.2.28), мы находим, что Саьс не изменяется при конформных преобразованиях метрики СаЬс = СаЬс • (D.10) (Отметим, однако, что поскольку было бы естественно использовать различные метрики для поднятиями опускания индексов в Cabcd и Cabcdi то равенство между Саьс и Cabcd возможно только при определенном расположении индексов. Например, имеем Cabcd = Ъае&аЬс* = = Q?gdeCabce = ft2Ca6cd-) Уравнения (D.8)-(D.10) представляют собой искомые формулы, выражающие изменение кривизны при конформных преобразованиях. Далее, мы анализируем конформную инвариантность некоторых уравнений, содержащих метрику. Уравнение поля Ф называется конформно инвариантным, если существует вещественное число s (называемое конформным весом поля) такое, что Ф является решением с метрикой gab тогда и только тогда, когда Ф = fts# представляет собой решение с метрикой ga6. Уравнения многих физических полей конформно инвариантны, а кроме того, изучение поведения уравнений при конформных преобразованиях полезно для многих математических целей.
D. Конформные преобразования 633 В качестве первого примера мы покажем, что уравнение скалярного поля &6VeV60 = O (D.11) не является конформно инвариантным при dimM ф 2. (В случае римановой метрики уравнение (D.11) естественно обобщает уравнение Лапласса на искривленное пространство. Для метрики Лоренца (D.11) - это уравнение Клейна - Гордона для поля с нулевой массой, рассмотренное в гл. 4 и 10.) Имеем ЪаЬЪаЪъФ = + + n-YbVa[vb(n^)) = ft-Y6 [va v6 (п*ф) - cca6vc (п*ф)) = fts"YbVaV60 + (25 + n - 2)W- V6VafiV60 + sfis-30gabVaVbft + s(n + s - 3)П8-4ф^аП^ь^ (D.12) Таким образом, если п = 2, то можно выбрать 5 = 0, и тогда уравнение (D.12) означает, что ga VaVb</> = 0 тогда и только тогда, когда gabVaVb0 = 0. Однако, если п Ф 2, никакой выбор s не обеспечит равенство ga VaVb^ нулю тогда и только тогда, когда ^a6VaV60 = 0. Таким образом, уравнение поля (D.1) не является конформно инвариантным, за исключением двумерного случая. Однако при п > 1 можно модифицировать уравнение (D.11) простым образом так, чтобы оно стало конформно инвариантным. Во- первых, если мы выберем s = 1 — п/2, тогда член уравнения (D.12), содержащий УаПУь</>, будет устранен. Используя этот выбор s и поведение скалярной кривизны R при конформных преобразованиях, задаваемое уравнением (D.9), мы находим, что при п ф 1 добавление члена вида о.Кф в (D.11) приведет к сокращению члена ^g^VaVfcft и члена ^g^VaftVfcfi в (D.12), в том случае, если a = -(n - 2)/4(п - 1). Таким образом, уравнение ga6VoV60- п-2 4(п-1) Я0 = О (D.13) является конформно инвариантным, с весом s = 1 — п/2, поскольку мы имеем -об F0vov6 - = ft"1-"/2 ' 4(n-l) J (&-п'2ф) = п-2 4(п - 1) Д (D.14)
634 Приложения Таким образом, уравнение (D.13) конформно инвариантно обобщает уравнения Лапласса и Клейна - Гордона в плоских пространствах на искривленную геометрию. Далее мы демонстрируем, что уравнения Максвелла «^VcFab = О, (D.15) V[oFbc) = О (D.16) являются конформно инвариантными в четырехмерных пространствах. Имеем gocVc (WFab) = Л- Vе {Vc (tTFab) - CdcaWFdb - CdcbWFad} = = ns-2gflCVcFob + (n-4 + s)ns-Vci7'a6Vca (D.17) С другой стороны, мы имеем V(e (Sl°Fbc) = nsV(oFH + stf-1 (V[afi) Fbc]). (D.18) Таким образом, как показывает анализ уравнений (D.17) и (D.18), при пф А уравнения Максвелла не являются конформно инвариантными, но в четырехмерном пространстве-времени, т.е. в физической реальности, конформная инвариантность у этих уравнений есть с весом s = О.1 И наконец, мы отметим свойства конформной инвариантности закона сохранения VaTab = О (D.19) для симметричного тензорного поля ТаЬ = ТЬа. Имеем Va (П8ТаЬ) = Va (П*ТаЬ) + СаасП3ТсЬ - СьасП3Тас = = Q3VaTab + (s + n + 2)fis-1TabVafi - fis" V°^Vafi, (D.20) где Т = gfibTab. Таким образом, мы видим, что уравнение (D.19) не является конформно инвариантным. Однако, если мы наложим дополнительно к уравнению (D.19) и ТаЪ = ТЪа требование Т = О, тогда (D.19) станет конформно инвариантным с s = — п—2. Обратно, предположим, что тензор энергии-импульса конформно инвариантного^ля сам по себе конформно инвариантен в том смысле, что ТаЬ —► ТаЬ = ilwTab Отметим, что для тензорного поля указание конформного веса зависит от положения индексов, т.е. конформный вес Fab был бы s = —4. Инвариантное понятие конформного веса - это s' = s — Ni + Nu, где Ni - число "нижних индексов", а Nu - число "верхних индексов" тензора. Поэтому инвариантный конформный вес поля Максвелла равен -2.
D. Конформные преобразования 635 при конформных преобразованиях метрики и полевых переменных. (Так и будет, если ТаЬ получен функциональным дифференцированием по метрике конформно инвариантного действия (см. прилож. Е). Мы используем здесь обозначение w вместо s потому что не требуется, чтобы конформный вес ТаЬ был равен конформному весу поля.) Тогда закон сохранения должен выполняться как в случае исходного, так и в случае конформно преобразованного пространств. Следовательно, уравнение (D.20) показывает, что мы должны иметь Т = 0 (а также w = — п—2). Поэтому, если тензор энергии-импульса конформно инвариантного поля является конформно инвариантным, то его след должен тождественно обращаться в нуль.
ПРИЛОЖЕНИЕ Е Лагранжева и гамильтонова формулировки уравнений Эйнштейна Динамическое содержание общей теории относительности полностью выражается полевым уравнением Эйнштейна Gab = 87гТаь. Тем не менее даже в чисто классических (т.е. не квантовых) задачах удобно и для многих целей полезно иметь формулировки общей относительности на основе лагранжиана и гамильтониана. Например, как мы увидим ниже, полевое уравнение Эйнштейна можно вывести из простого и естественного лагранжиана, что еще более добавит эстетической привлекательности общей теории относительности. Формулировка с гамильтонианом позволяет углубить понимание динамического механизма общей относительности. В самом деле, хотя мы и анализировали исходные принципы общей относительности в гл. 10, используя лишь уравнение поля, та точка зрения, что уравнение Эйнштейна описывает эволюцию пространственной метрики Наь во "времени", мотивируется, пожалуй, наилучшим образом гамильтоновой формулировкой. Кроме того, гамильтонова формулировка придает дополнительную мотивацию тому определению полной энергии гравитационного поля на пространственной бесконечности в асимптотически плоском пространстве-времени, которое было дано ранее в гл. 11. Однако еще более сильная причина для изучения лагранжевой и гамильтоновой формулировок общей теории относительности возникает в надежде развить квантовую теорию гравитации. Хотя все содержание классической теории поля выражается полевым уравнением, большинство рецептов для построения квантовой теории поля, ассоциированной с данной классической теорией поля, требуют, чтобы классическая теория поля была выражена в лагранжевой и гамильтоновой форме. В частности, для формулировки в виде интеграла по траекториям требуется иметь принцип действия на классическом уровне, т.е. требуется лагранжево описание классической теории. Применение процедуры канонического квантования предполагает, что классическая теория приведена к гамильтоновой форме. Таким образом, лагранжева и гамильтонова формулировки общей относительности могут играть важную роль в построении квантовой теории гравитации (см. гл. 14).
ЕЛ. Лагранжева формулировка 637 ЕЛ Лагранжева формулировка Начнем наше обсуждение с объяснения, что обычно подразумевается, когда говорят о лагранжевой формулировке теории поля. Рассмотрим теорию, описывающую тензорное поле (или несколько тензорных полей), определенное на многообразии М. Мы опустим все индексы и обозначим поле (или поля) ф. Пусть S[ip] - функционал, т.е. S является отображением множества полевых конфигураций на М в множество чисел. Пусть ф\ - гладкое однопараметрическое семейство полевых конфигураций, начинающихся из фо, которое удовлетворяет подходящим граничным условиям. Производную йф\/д\\\=о обозначим 6ф. Предположим, что dS/dA при А = 0 существует для всех таких однопараметрических семейств, имеющих в качестве исходной конфигурацию поля фо. Предположим далее, что существует гладкое тензорное поле х (которое дуально ф в тензорном смысле: типы этих полей равны (fc, Z) и (/,&) соответственно), такое, что для всех таких семейств справедливо dS_ Г <*А~Л Х*1>, (Е.1.1) м где подразумевается свертка по всем тензорным индексам под интегралом. Тогда мы говорим, что S функционально дифференцируем при фо. Тензорное поле х называется функциональной производной1 S и обозначается SS\ Х 6ф (Е.1.2) V>0 Рассмотрим теперь функционал 5, имеющий форму Sty] = [ Х[ф], (Е.1.3) JM где -Sf - локальная функция поля ф и конечного числа его производных, т.е. 2>\х = <£(ф(х),Щ(х),..., VfcV(*)) • (Е.1.4) Предположим, что функционал S функционально дифференцируем, и что полевые конфигурации ф, на которых он экстремален, 6ф = О, (Е.1.5) Обобщая, если существует тензорное распределение х такое, что (15/(1А|л=о = xtW'L TO мы говорим, что S функционально дифференцируем, а х называем функциональной производной S при Vo-
638 Приложения как раз и являются решениями уравнений поля ф. Тогда S называется действием, .£? - лагранжевой плотностью, а конкретное задание .£? есть именно то, что обычно подразумевается под лагранжевой формулировкой данной полевой теории. Таким образом, лагранжева формулировка теории поля аналогична лагранжевой формулировке в механике частиц. В механике частиц действие определяется как функционал от возможных траекторий, заданный в виде интеграла от функции Лагранжа, взятой на возможных траекториях. Вариационная задача, подобная (Е.1.5), формулируется строго как минимизация действия при условиях конечности длины варьируемой траектории и закреплении ее концов. По аналогии, чтобы строго сформулировать вариационную задачу в случае поля, мы выделим в многообразии М компактную область U и будем рассматривать однопараметрические семейства ip\, которые имеют фиксированные значения ф на границе U. В качестве простого примера обсудим лагранжеву формулировку теории скалярного поля Клейна - Гордона ф в пространстве Минков- ского. Мы определяем плотность лагранжиана ^kg = ~\ (даФ • даф + т2ф2), (Е.1.6) (нормировка -SfKG здесь выбрана для дальнейшего (см. след. разд.) удобства в определении сопряженного импульса.) Имеем = - / [даФо • да{6ф) + т2ф0(6ф)] = = I [дадаф0 - т2фо] 6ф, (Е.1.7) где интегрирование подразумевает использование естественного элемента объема пространства-времени Минковского. Поверхностный интеграл, появляющийся при интегрировании по частям, дает тождественный нулю вклад, поскольку мы накладываем на ф\ граничное условие, которое имеет вид 8ф = 0 на границе. Таким образом, действие 5KG функционально дифференцируемо, и мы получаем Щ^=дадаф-т2ф. (Е.1.8) дф В результате (Е.1.5) есть уравнение Клейна - Гордона (4.2.19), как и ожидалось. Лагранжева плотность для уравнений Максвелла в плоском пространстве зависит от переменной Аа и определяется следующим образом: ■^ем = -\FabFab = -д[аАь] ■ а'М61. (Е.1.9) ^кс dA А=0
ЕЛ. Лагранжева формулировка 639 При изучении полей Клейна - Гордона и Максвелла выражения (ЕЛ.6) и (ЕЛ.9) часто принимаются как исходные понятия: записываются простые и естественные скалярные функции j£fKG или j£fEM, затем выводят уравнения поля из принципа действия (ЕЛ.5). В общей теории относительности полевой переменной является метрика пространства-времени gab1 определенная на 4-мерном многообразии М. В этом случае возникает маленькое неудобство из-за того, что элемент объема интегрирования в (ЕЛЛ) и (Е.1.3) - это элемент еаЪс<1, который сам определен через gab согласно (В.2.9). Как следствие, элемент объема сам зависит от переменной поля и поэтому его вариацию необходимо принять во внимание при вычислении функциональных производных. Одной из возможностей обойти это неудобство было определение -S? не как скаляра, а как полностью антисимметричного четырехиндексного тензора, тем самым включив элемент объема в JS?. Но это потребовало бы от нас несколько изменить определение функциональных производных. Мы будем следовать более простой процедуре, вводя элемент объема еаьс<1 — ^[abcd] на Af и определяя все интегралы на М с использованием eabcd, а не eabcd- На первый взгляд сделать так можно было бы (по крайней мере для части М), вводя систему координат и беря в качестве eabcd присоединенный координатный элемент объема, но мы подчеркнем, что вводить систему координат не обязательно. Поскольку любые два элемента объема в любой данной точке отличаются самое большее скалярным множителем, мы имеем Cabcd = / * Cabcd- (ЕЛ. 10) В любом базисе, где ненулевые компоненты eabcd имеют значение ±1, то же самое вычисление, что выше привело к (В.2.16), приводит в случае координатного базиса и его присоединенного элемента объема к / = \/~£> гДе 8 означает определитель матрицы с компонентами gab метрического тензора в том же базисе. Итак, мы будем следовать тому же соглашению, что было принято в разд. 3.4.1, обозначая / как yp^g. Если eabcd ~ выбранный элемент объема М, то мы определяем тензорную плотность Та"bc...d как тензор, который можно выразить в форме Te-bc...d = V=i-Te-bc...d, (ЕЛ .11) где Tc.W'd ~ тензор, чьи свойства не зависят от выбора eabcd- Чтобы в общей теории относительности действие S не зависело от eabcd, необходимо, чтобы плотность лагранжиана -£? была скалярной плотностью. Так же точно, чтобы dS/dA было независимо от eabcd, функциональные производные S должны быть тензорными плотностями.
640 Приложения Теперь мы покажем, что скалярная плотность вида #а = \f4R (E.1.12) является плотностью лагранжиана для уравнения поля Эйнштейна в вакууме, а граничные члены будут введены в конце этого раздела. Соответствующее действие S№b] = J#0e (E.1.13) известно как действие Гильберта. Здесь мы ввели в формулу е (использовав обозначение дифференциальной формы из прилож. В), чтобы подчеркнуть применение именно этого элемента объема. Вдобавок для удобства мы выбрали в качестве переменной поля не gab, а обратную метрику g*b. Определим однопараметрическую вариацию как (Jg06, равную dg^/dA. Однако, чтобы использовать без модификации результаты разд. 7.5, где в качестве независимой переменной выступала gab, мы определим Sgab = dga6/dA. Поэтому мы предупреждаем читателя, что поскольку g*cgcb = Sab, то Sgab = -gacgbd8^d, т.е. в этом разделе мы не будем использовать невозмущенную метрику, чтобы опускать и поднимать индексы у метрических возмущений. Заметьте также, что поскольку g"6, а значит и 8£*ь, должны быть симметричными, всегда можно добавить антисимметричный тензор к любой функциональной производной, взятой по g06, что не повлияет на вариацию действия (Е.1.1). Мы устраняем эту неоднозначность, требуя симметричности для всех таких функциональных производных. Для однопараметрического семейства, имеющего в качестве исходной g°6, мы получаем ^- = V=g(5Rab№b + V4Rab№b) + R(SV4)- (E.1.14) Из (7.5.14) гл. 7 мы имеем gabSRab = Vava, (E.1.15) где «. = V6(teo6) - fdVa(6gcd). (Е.1.16) Кроме того, используя (9.3.11), получаем *(x/=i) = \V=gffb6gab = -\V4eabWb- (E.1.17)
ЕЛ. Лагранжева формулировка 641 Таким образом, вариация действия Ж = 1^е = /Г"-**' + / («- - \RS«) W=*«. (Е.1.18) Первым членом в (Е.1.18) является интеграл от дивергенции V0v0, взятый с естественным элементом объема е = y/—ge. Следовательно, по теореме Стокса этот интеграл превращается в граничный вклад. Фактически этот вклад не исчезает при произвольных вариациях, когда £*** зафиксирована на границе, хотя он строго обращается в нуль, когда первые производные £рь тоже фиксируются на границе. Тем не менее, чтобы упростить обсуждение, мы будем игнорировать этот вклад до поры до времени. (В конце этого раздела мы вычислим этот член и покажем, как модифицировать SG, чтобы исключить его вклад.) Итак, опуская граничный член, мы находим ^. = ^(цаЬ-1цёаЬУ (Е.1.19) и теперь (Е.1.5) очевидно становится эквивалентным уравнению поля Эйнштейна в вакууме, как и ожидалось. Таким образом, в рамках лагранжева формализма уравнение Эйнштейна появляется вполне естественным образом, поскольку плотность лагранжиана вида (ЕЛ. 12) - несомненно одна из простейших скалярных плотностей, какую можно сконструировать из метрики пространства-времени. Интересно отметить, что взгляд на метрику как единственную полевую переменную общей теории относительности не единственный возможный, вместо этого мы могли бы считать независимыми переменными метрику и дифференциальный оператор Va. Существенно то, что если мы используем ту же самую плотность лагранжиана (Е.1.12), но теперь будем считать, что Яаь зависит только от дифференциального оператора (т.е. не зависит от £*ь) и будем варьировать действие Палатини SG [fb, V«] = J y/4Rabe?b e (E.1.20) по отношению к обеим переменным, £*ъ и Va, то мы придем к уравнениям Эйнштейна (Е.1.19) вместе с условием метрической совместимости Vcg?b — 0 для дифференциального оператора. Чтобы доказать это, заметим для начала, что поскольку Va можно выразить через произвольный фиксированный оператор дифференцирования Va и тензорное поле Ссаь (см. разд. 3.1), то варьирование Va эквивалентно варьированию Ссаъ- При рассмотрении однопараметрических вариаций g°6
642 Приложения и Va, образованных на однопараметрическом семействе, будет удобно выбрать Va как дифференциальный оператор, метрически совместимый с £*ь при Л = 0. Ключевое отличие от предшествующих вычислений заключается в том, что мы должны использовать (7.5.10) вместо (7.5.14) для вычисления 8Яаь. Находим при Л = 0: ^ = -2 J>V(a,5Ccc]bv/=Ie + J' (я,* - ^Д&б) W^e = = -2j^bV[a5Ccc]by/^e + + f fb [Cdab SCccd + Cccd SCdab - 2Cdcb SCcad] sf=ge + + J' (Яоь - |я&б) W=ge = = J [cMd Sac + Cddc£b - 2Cbf\ 6Ccaby/=ge + + J (ял-^Я^б^у/Че. (E.1.21) Здесь первый член в правой части^во второй строке исчезает по теореме Стокса, благодаря тому, что Va - метрически совместимый дифференциальный оператор. (В этом случае поверхностный интеграл строго равен нулю, поскольку мы потребовали обращения в нуль на границе величин 6Ссаь-) Чтобы выражение SSG/SCcab обращалось в нуль, требуется, чтобы коэффициент при 8Ссаь в предпоследней строке (Е.1.21) равнялся нулю после симметризации по a, b. После некоторых преобразований получаем Ссаь = 0, т.е. Va = Va. Как и раньше, 6SG/6glb ведет к уравнениям Эйнштейна. Невакуумное уравнение Эйнштейна, содержащее материальные поля, такие как скалярное поле Клейна - Гордона или электромагнитное поле Максвелла, тоже можно получить из лагранжевой формулировки в очень простой и естественной манере. Во-первых, мы должны найти подходящую плотность лагранжиана JS?M для поля материи в искривленном пространстве-времени. В частности, для поля Клейна - Гордона легко проверить, что функциональное дифференцирование по ф действия 5KG, которое получается из плотности лагранжиана, -^кс = -\^Ч(ёГЬУаФ- Ъьф + т2ф2), (Е.1.22) дает уравнение Клейна - Гордона (4.3.9) в искривленном пространстве- времени. Аналогично лагранжиан -^м = -IV^tr^FabFa = -V4erctfdd[aAb] ■ dlcAd] (E.1.23)
ЕЛ. Лагранжева формулировка 643 дает уравнения Максвелла в искривленном пространстве-времени. Для получения связанных уравнений гравитационного поля и полей материи мы строим полную лагранжеву плотность JS?, добавляя к эйнштейновской лагранжевой плотности j£?G лагранжеву плотность полей материи с постоянным множителем: 2> = J?G+aMJ?M. (E.1.24) Поскольку JS?G не зависит от полей материи, варьирование полного действия 5 по полям материи даст то же самое уравнение, что и при варьировании одного действия материи 5М. Варьирование полного действия S по £*ъ ведет к уравнению Gab = Rab - \Rgab = 8тгГа6, (Е.1.25) где тензор Таъ дается формулой 8тг N/=g<5g°' Т°ь = -12—„т±ь- (Е.1.26) Для плотностей лагранжианов (Е.1.22) и (Е.1.23) легко проверить, что при правильном выборе множителя ам тензор Таь согласуется с (4.3.10) и (4.3.14) соответственно. Таким образом плотность лагранжиана (ЕЛ.24) при j£fM = J£?KG и aKG = 1б7г дает связанные уравнения полей Эйнштейна - Клейна - Гордона. Точно так же, при -SfM = J£?EM и aEM = 4, (Е.1.24) дает связанные уравнения полей Эйнштейна - Максвелла. Обобщим: если взять некоторую плотность лагранжиана j£fM за исходный пункт определения теории поля материи, то (Е.1.26) можно считать определением тензора энергии-импульса Таь этого поля. Если плотность лагранжиана материального поля не зависит от выбора дифференциального оператора Va, то связанные уравнения полей Эйнштейна и материи можно вывести также, варьируя сумму действия Палатини и действия для поля материи. Действие для материи 5М должно быть инвариантным относительно диффеоморфизма, т.е. если f\ : М —► М - однопараметрическое семейство диффеоморфизмов, то мы имеем SM[g*b,ip] = ^[/а^^/а^Ь где /д определено в прилож. С. Значит для таких вариаций мы имеем O'lk-J^ + Jl*6*- (E'L27) Напомним, что согласно прилож. С, в этом случае вариация 8^ъ имеет следующий общий вид £w£lb = 2V^awb\ где wa - произвольное векторное поле. Предположим теперь, что ф удовлетворяет уравнениям
644 Приложения поля материи. Тогда 83м/8ф\ф = 0, и второй член в уравнении (Е.1.27) вклада не дает. Таким образом, используя определение (Е.1.26), мы находим, что если ф удовлетворяет уравнениям поля материи, то для всех гладких wa, которые определены в области с компактным носителем U, мы имеем О = /\f=gTabV{awVe = fTabVawbe = - I {VaTab)wbe, (ЕЛ.28) и это означает, что VaTab = 0. (Е.1.29) Следовательно, для действия инвариантного относительно диффеоморфизма Таь всегда сохраняется благодаря уравнениям поля материи. Это еще раз подчеркивает корректность интерпретации Таъ как тензора энергии-импульса полей материи. Заметьте также, что приложение тех же аргументов, что и выше, к SG имеет следствием, что (независимо от каких-либо уравнений поля) V°Gab = 0. (Е.1.30) Итак, в лагранжианной формулировке общей теории относительности свернутое тождество Бианки можно рассматривать как следствие инвариантности действия Гильберта относительно диффеоморфизма. В пространстве-времени Минковского (К4,77аь) есть альтернативная процедура для определения 4-тензора энергии-импульса поля ф, берущая за начальную точку плотность лагранжиана j£?. Рассмотрим для простоты случай, когда -S? суть локальная функция от 77аь> Ф и да'ф, но не от более высоких производных ф. Уравнение движения для ф имеет вид дЗ? 0=s_i = d#_da 8ф дф д(даф) (Е.1.31) Здесь в случае скалярного поля ф производная dJf/d {даф) означает такое векторное поле Va, которое в каждой точке х удовлетворяет — = Va.6(da1>), (Е.1.32) для всех гладких однопараметрических вариаций ф, удерживающих при данном х фиксированными значения всех величин, от которых зависит «Sf, кроме даф- (Контравариантные компонеты Va - это просто частные производные -S? по соответствующим дуальным (кова- риантным) компонентам даф.) Если ф - тензор типа (А:,/), то Va =
Б.1. Лагранжева формулировка 645 = dJf/д (daip) будет тензором типа (/ + 1, к) со сверткой всех подразумеваемых индексов в (ЕЛ.32). Частные производные JS? по другим ее тензорным переменным определяются аналогично. Для произвольного гладкого однопараметрического семейства (ip\, (г)\)аь), состоящего из полей ip\ и плоских метрик (rj\)ab, мы имеем где не подразумевается наложение каких-либо граничных условий на варьируемые величины. Рассмотрим теперь вариации JS?, производимые однопараметрическим семейством диффеоморфизмов, генерируемых векторным полем £°. Тогда (ЕЛ.33) принимает вид д!£ ЗУ? ЗУ? 82> = £& = ?daSf = ^£tf+-£—£tda*+j^£tTlab. (E.1.34) Теперь ограничимся случаем, когда f° - поле Киллинга. Тогда последний член в (ЕЛ.34) зануляется, а во второй член мы подставляем £^даф = да {£$Ф)- Используя уравнение движения (ЕЛ.31) для замены дЛ?/дф, мы получаем да дЗ? д(даф) = 0. (Е.1.35) Этот результат известен как теорема Нётер, если он формулируется по отношению к группам симметрии Пуанкаре. В частности, справедливость (Е.1.35) для всех трансляционных полей Киллинга приводит к закону сохранения daSab = 0 канонического тензора энергии-импульса Для поля Клейна - Гордона мы находим, что Sab согласуется с точностью до численного множителя с Таь, определенным выше (ЕЛ.26), если его вычислить в пространстве-времени Минковского с использованием плотности лагранжиана в искривленном пространстве-времени (ЕЛ.22). Однако это согласие пропадает у полей со спином. Действительно, в случае поля Максвелла Sab даже калибровочно неинвариантен. Более того, в общем случае Sab не только не симметричен, но и не может быть просто обобщен до сохраняющегося тензора в искривленном пространстве-времени (Kuchaf 1976). Поэтому мы принимаем именно Tab в качестве определения тензора энергии-импульса. Это та величина, которая, естественно, возникает в правой части уравнений
646 Приложения поля Эйнштейна (ЕЛ.25) в рамках лагранжевой формулировки уравнений поля материи в общей теории относительности. Мы завершаем этот раздел вычислением граничного члена, появляющегося при варьировании действия Гильберта (ЕЛ. 18), когда от Sg*b требуется равенство нулю на границе, но никаких условий на производные 6g?b не наложено. Мы имеем / Vavae = / vana, (E.1.37) Ju Ju где па - единичная нормаль к границе U (которая считается ненулевой), и подразумевается естественный элемент объема на U (прилож. В). Используя (ЕЛ.16), мы получаем, что на U vana = nagbc[Vc(Sgab)-Va(Sgbc)) = = nahb*lVc(6gab)-Va(6gbc)} = = -n^V, (*&,), (E.1.38) где hab = gab ^ паЩ - индуцированная метрика на U (см. гл. 10), причем hbcVc(Sgab) = 0, поскольку Sgab = 0 на U. Однако правая часть (ЕЛ .38) оказывается связанной с вариацией следа внешней кривизны границы К = Каа = habVan\ (E.1.39) и поэтому SK = hab(SC)bacnc = = \nch*bE!>d [Va (Sgcd) + Vc (Sgad) - Vd (Sgac)} = = \nchadVc(6gad). (E.1.40) Таким образом, при вариациях метрики, для которых Sgab = 0 на Г/, мы получаем из (Е.1.18), (Е.1.38) и (Е.1.40) ^ = -2 j SK + f Gab6srbe. (ЕЛ.41) Фактически (Е.1.41) остается верным, если мы разрешим такие вариации ga6, у которых только индуцированная метрика на границе закреплена Shab = 0. Это можно проверить прямым расчетом или таким рассуждением: если на границе выполняется Shab = 0, то мы можем найти такое калибровочное преобразование V^ak) с h = 0 на границе,
Б.2. Гам и л ьто нова формулировка 647 что ведет к Sgab = 0. Поскольку (Е.1.41) справедливо для всех вариаций Sgab = 0 на [7, и поскольку все члены (Е.1.41) инвариантны при указанных калибровочных преобразованиях, это уравнение должно продолжать выполняться при всех вариациях, которые удовлетворяют всего лишь условию Shab = 0. Таким образом, при нахождении экстремума SG по отношению к вариациям, имеющим на границе Sgab = 0 или Shab = 0, возникает нежелательный дополнительный член. Однако это можно поправить, изменив SG. Введем S'G=SG+2 [ К. (Е.1.42) Тогда нахождение экстремума действия S'G ведет к желаемому результату, потому что вариация поверхностного члена (Е.1.42) сокращается с поверхностным членом в (Е.1.41). Таким образом, в тех случаях, когда необходимо учитывать поверхностные члены, действие S'G является наиболее подходящим действием в общей теории относительности. Е.2 Гамильтонова формулировка Лагранжева формулировка теории поля ковариантна в пространстве-времени. В некоторой области пространства-времени определяется действие поля ф, принцип наименьшего действия приводит к уравнениям поля. Напротив, гамильтонова формулировка теории поля требует разбиения пространства-времени на пространство и время. Действительно, первый шаг к гамильтонианной теории поля состоит в выборе функции времени t и векторного поля ta на пространстве- времени так, чтобы поверхности постоянного времени Е* были про- странственноподобными гиперповерхностями Коши, причем такими, что taVat = 1. Векторное поле ta можно рассматривать как описывающее "поток времени" в пространстве-времени, и использовать для идентификации каждой поверхности Et, включая начальную Ео. В пространстве-времени Минковского обычно выбор t и ta связывают с глобальной инерциальной системой отсчета, но в искривленном пространстве-времени сделать какой-либо предпочтительный выбор координат вообще невозможно. При вычислении интегралов от функций на М было бы естественно в большинстве случаев использовать элемент объема еаьса, связанный с метрикой пространства-времени. Аналогично, при вычислении интегралов по Е* было бы естественно в большинстве случаев использовать элемент объема ^еаьс = £dabcnd, где nd - единичная нормаль к Е*. Однако этот элемент объема будет
648 Приложения в общем случае "зависеть от времени" в том смысле, что £t eabcd Ф О и £t ^abc Ф 0. Использовать зависящий от времени элемент объема Et особенно неудобно, когда в качестве Et мы подставляем Ео, чтобы проследить за динамической эволюцией как изменением полей на заданной поверхности Ео. Поэтому мы введем фиксированный элемент объема ^abcd На М, который удовлетворяет £t^abcd = 0. (Одним из способов сделать так - по крайней мере локально - было бы ввести координаты х1, х2, х3 в дополнение к £, такие что ta = (d/dt)a и в качестве е взять координатный элемент объема dt Л dx1 Л dx2 Л dx3.) На каждой Et мы определяем ^3^eafec = е^аЬс^- Пока не оговорено обратное, все интегрирования на М будут выполняться с использованием элемента объема еаьы, а все интегрирования на Et - с элементом объема ^еабс- Следовательно, в частности, чтобы наши результаты были независимы от выбора eabcd, плотность лагранжиана должна быть скалярной плотностью на М, а импульс 7г (определяемый чуть ниже) должен быть скалярной плотностью на Е*. Как замечено выше при обсуждении эйнштейновского лагранжиана, введение eabcd можно было бы избежать путем внедрения элемента объема в определения JS?, 7г и других величин, но мы предпочитаем избегать этой довольно запутанной процедуры. Следующий шаг к гамильтоновой формулировке - определить конфигурационное пространство для поля, делая выбор такого тензорного поля (или полей) q на Et, которое физически описывает мгновенную конфигурацию поля ф. Пространство возможных импульсов поля V* при данной конфигурации q считается "касательным" по отношению к конфигурационному пространству при данном q. Поскольку набор возможных конфигураций поля бесконечномерный, мы не станем и пробовать дать здесь точное определение V*. Однако в случае, когда разрешенные бесконечно малые вариации Sq, т.е. "касательные векторы" к данному q представляются тензорными полями типа (fc, Z) на Et, мы возьмем пространство импульсов, состоящим из тензорных полей 7Г типа (Z, к) на Et, так что п отображает Sq в R посредством Sq —> /Е irSq, где подразумевается свертка по тензорным индексам. Тогда должен быть дан рецепт, связывающий импульс 7г с полем ф на Et. Последним и наименее тривиальным шагом, требующимся для гамильтоновой формулировки теории поля, является нахождение функционала H[q, 7г] на Et, называемого гамильтонианом, который имеет форму Н= [ Ж, (Е.2.1)
Е.2. Гамильтонова формулировка 649 где плотность гамильтониана Ж - локальная функция от q и 7Г, а также их пространственных производных вплоть до некоторого конечного порядка, такая, чтобы пара уравнений q ее £tq = ^ (Е.2.2) и n = £t7r = -^ (E.2.3) была эквивалентна уравнению поля для ф. При наличии лагранжевой формулировки теории поля можно воспользоваться стандартным предписанием для вывода гамильтоновой формулировки, которое очень похоже на хорошо известную процедуру из обычной механики частиц. Во-первых, в качестве q просто берем само поле ф, определенное на Е*. Теперь можно считать плотность лагранжиана уже функцией q, ее производных по времени и пространственных производных. Предполагая, что JSf не зависит от производных q по времени выше первого порядка, мы определяем импульс 7Г поля ф на Е* по правилу п=—. (Е.2.4) Далее следует разрешить (Е.2.4) относительно q как функции q и 7г. Предположим, что это можно сделать. Введем функцию ^(g,7r) = 7rg-.Sf, (E.2.5) где подразумевается, что q = q(q,n) присутствует как в явной форме, так и в неявной - в виде аргумента -Sf. С таким выбором Ж уравнения (Е.2.2) и (Е.2.3) эквивалентны уравнению (Е.1.5). Чтобы это увидеть, мы определяем J= Hdt= dt Jf = -S+ At l щ. (Е.2.6) Jti Jti JZ, Jti JSt Тогда для гладких однопараметрических вариаций поля ф, удовлетворяющих 6ф = 0 при t = 11 и t = t2, мы имеем dJ_ dA dS ft2 f = "ТГ+ / dt [*6q + q6ir] = dA Jti 7Et
650 Приложения dS ft2 f = -^д + / 6tJ [-*Sg + q6n], (E.2.7) где в последней строке выполнено интегрирование по частям. Сравнивая первую и последнюю строки в соотношении (Е.2.7), мы видим, что 6S/5tp = 0 в том и только в том случае, если выполняются уравнения (Е.2.2) и (Е.2.3). Таким образом, Ж является плотностью гамильтониана поля ф. Описанная процедура выдает вполне прямолинейно гамильтонову формулировку теории поля Клейна - Гордона в пространстве-времени Минковского. Мы выбираем глобальную инерциальную систему координат, чтобы получить t и ta, и берем в качестве еаьса естественный элемент объема eabcd, поскольку £t^abcd = 0. В качестве q на Et мы берем ф, определенное на Et, и переписываем выражение (Е.1.6) для j£fKG в виде ^kg = \ (Ф2 ~ V0 • Щ - т2ф2) , (Е.2.8) где использовано обычное обозначение для трехмерных векторов на Е*. Отсюда находим *=д-^Г = Ф- (Е.2.9) оф И таким образом мы определяем плотность гамильтониана Жко = 7Г0 - JSfKG = 1 (тг2 + Щ-Щ + roV) • (Е.2.10) Теперь можно проверить, что для HKG = /Е Жкс уравнения (Е.2.2) и (Е.2.3) действительно эквивалентны уравнению Клейна - Гордона. Заметим также, что численное значение HKG является просто полной энергией поля Клейна - Гордона. В случае электромагнитного поля в пространстве-времени Минковского для получения гамильтоновой формулировки процедуру следует применять не столь прямолинейно. Как покажет дальнейшее, выбрать в качестве q лучше векторный потенциал Аа, определенный на Et, и разложить его на нормальную и тангенциальную составляющие V = -Аапа, (Е.2.11) <3>Л« = habAb, (E.2.12) где па - единичная нормаль к Ее, а Наь = Т]аь + паЩ - индуцированная пространственная метрика на Е*. В обычных трехмерных векторных
Е.2. Гамильтонова формулировка 651 обозначениях выражение (Е.1.9) для плотности лагранжиана записывается в виде ^ем = \ (A+VV) ■ (Л+ W) - | (V х Л) ■ (V х Л) . (Е.2.13) Следовательно, импульсом, сопряженным с Л, будет 7? = l+W = -i?. (E.2.14) Однако V не появляется в j£?EM, так что импульс nv, сопряженный с V, - тождественный нуль жу = 0. (Е.2.15) Таким образом, мы не получаем обратимого соотношения между 7г и q. Как следствие, если мы определим Ж преобразованием (Е.2.5), то будет невозможно исключить q, чтобы единственными аргументами остались 7г и д, и наш общий рецепт для получения гамильтоновой формулировки окажется непригодным. Эта трудность напрямую связана с тем фактом, что Аа может быть по-разному откалиброван, и следовательно мы не можем надеяться получить для Аа детерминистскую динамику в форме (Е.2.2) и (Е.2.3)2. Однако с этой трудностью можно справиться посредством следующего рассуждения. То, что irv является тождественным нулем, однозначно требует, чтобы мы не рассматривали V как динамическую переменную. А это означает, что мы должны принять конфигурационное поле q просто равным А. Следовательно, мы определяем <%?KM как В - ttW = B-FV-B-V-(V7r), (E.2.16) где В = V х А. Последний член в правой части (Е.2.16) является полной дивергенцией и поэтому дает вклад только в граничную составляющую ЯЕМ = /Е Jf?EM, которая стремится к нулю, когда граница 2Общая формулировка канонического формализма в случае, когда из уравнений (Е.2.4) невозможно выразить все скорости q через обобщенные координаты и сопряженные импульсы, была развита Дираком. О гамильтоновом формализме для электромагнитного и гравитационного полей см. (Д.М.Гитман, И.В.Тютин. Каноническое квантование полей со связями. М.: Наука, 1986).- Прим.ред. с7ГЕМ = = = tf^-^EM 1^ - U -7Г.7Г+-В
652 Приложения отодвигается на бесконечность, благодаря асимптотическим условиям, налагаемым обычно на V и 7? = — Е. Поэтому мы отбросим этот член. Теперь мы рассматриваем ЯЕМ как функционал на А и 7г, причем V играет роль неопределенного множителя Лагранжа, т.е. мы добавляем уравнение Щ?- = О (Е.2.17) 0V к гамильтоновым уравнениям относительно А и 7г, (Е.2.2) и (Е.2.3). Уравнение (Е.2.17) дает V • Ё = О, (Е.2.18) а (Е.2.2) и (Е.2.3) в свою очередь А = ^^=tt-W = -£-W, (E.2.19) jr = -Ё = -^Щ*- = -V х (V х Х\. (Е.2.20) Итак, мы видим, что система уравнений (Е.2.18)-(Е.2.20) эквивалентна уравнениям Максвелла в пустоте. Более того, в этой формулировке мы видим, что уравнения Максвелла естественным образом разбиваются на связь (Е.2.18) и динамические уравнения (Е.2.19) и (Е.2.20). Вновь заметим, что численное значение #ЕМ, найденное на решениях уравнений Максвелла, пропорционально полной энергии электромагнитного поля. Таким образом, мы получили такую гамильтонову формулировку уравнений Максвелла в пространстве-времени Минковского, которая имеет ту особенность, что в плотности гамильтониана Я? появляется нединамическая переменная, играющая роль эффективного множителя Лагранжа, налагающего условие связи (Е.2.17). Такой тип гамильтоновой формулировки называется гамильтоновой формулировкой со связями. Как будет обсуждено ниже, следует ожидать такой формулировки для любой теории поля, если переменные поля имеют калибровочную свободу. Теперь мы обратимся к задаче о гамильтоновой формулировке уравнений Эйнштейна. Как и в предыдущем случае, мы выбираем функцию времени t и векторное поле "потока времени" ta на М, удовлетворяющее taVat = 1. Заметьте, однако, что в этом случае нельзя интерпретировать t и ta в смысле физических измерений с использованием часов до тех пор, пока не известна метрика пространства-времени, которая, конечно, является неизвестной переменной для поля в уравнениях Эйнштейна. Для данной метрики gab удобно разложить ta на
Е.2. Гамильтонова формулировка 653 нормальную и тангенциальную составляющие по отношению к поверхностям Е* постоянного t. Как и в гл. 10, мы вводим функцию шага ЛГ, полагая N = -gabtanb = (naVat)-1, (Е.2.21) а также вектор сдвига Na = habt\ (E.2.22) где вновь па означает единичную нормаль к Sf, a hab = gab + nanb— индуцированная пространственная метрика на Е*. Таким образом, N измеряет скорость потока собственного времени г по отношению к координатному времени t, когда наблюдатель движется по нормали к Е*, при этом Na измеряет величину тангенциального "смещения" к Et, которое содержится в векторном поле потока времени ta (см. рис. 10.2 гл. 10). В переменных N, Na и ta мы имеем па = -j- (*а - Na), (Е.2.23) и, следовательно, обратную метрику пространства-времени можно записать как g*6 = hab - nanb = hab - ЛГ2 (ta - Na) (tb - Nb). (E.2.24) В качестве полевых переменных удобно выбрать не обратную метрику ^6, которая использовалась как полевая переменная в предыдущем разделе, а пространственную метрику habl функцию шага N и кова- риантные компоненты вектора сдвига Na = habNb. Если потребовать, чтобы hachcb был единичным оператором в пространстве, касательном к Е*, а также habVbt = 0, то мы сможем выразить hab через hab и отсюда получить Na = habNb. Следовательно, из уравнения (Е.2.24) мы видим, что информация, содержащаяся в (hab,NyNa), эквивалентна той, что содержится в g°6. Вновь мы используем фиксированный элемент объема eabcd пространства-времени, удовлетворяющий £teabcd = 0, и будем применять элемент объема ^еабс = eabcdtd на Е*. По аналогии с замечаниями, следовавшими за формулой (Е.1.10), мы имеем ^eabc = wh^eabc, где h означает детерминант матрицы, составленной из пространственных компонент hpU метрики hab в базисе, в котором ненулевые компоненты ^^аЬс имеют значения ±1. Это приводит еще и к y/=g=NVh. (E.2.25) Первый шаг к нахождению гамильтониана в общей теории относительности - выразить действие гравитационного поля в переменных
654 Приложения (hab,N,Na) и их временных и пространственных производных. Чтобы облегчить последующее изложение, мы отложим анализ граничных членов до завершающей части этого раздела. Итак, мы начинаем с действия Гильберта (Е.1.13), а не с (Е.1.42), и до поры до времени отбрасываем те члены в выкладках, которые возникли бы при учете границ. Рассмотрим выражение R = 2 (Gabnanb - Rabnanb). (Е.2.26) Из уравнения (10.2.30) находим Gabnanb = i [<3>R - КаЬКаЬ + К2] , (Е.2.27) где Каь - внешняя кривизна Et и К = Каа. С другой стороны, по определению тензора Римана получаем Rabnanb = Racbcnanb = -na(VaVc-VcVa)nc = = (V0na)(Vcnc)-(Vcn°)(Vanc)- - Va {naVcnc) + Vc (naVanc) = = K2- KacKac - Va (naVcnc) + Vc {naVanc) .(E.2.28) Последние два члена в правой части (Е.2.28) - полные дивергенции, и потому будут отброшены. Используя соотношение (ЕЛ.12) совместно с соотношениями (Е.2.25)-(Е.2.28), получим JSfG = VhN [<3> Д + КаЬКаЪ - К2} . (Е.2.29) Внешняя кривизна Каь связана с "временнбй производной" hab = £thab соотношением КаЬ = 2£tflab = О lnC^chab + KCV'ЬПС + hcbV'аПС] = = ^N-1 [NncVcKb + /iacVb (Nnc) + /ic6Va (Nnc)] = -i«- hat - DaNb - DbNa] , (E.2.30) где Da - оператор производной на E*, ассоциированный с hab (см. гл. 10), а переход от второй строки к третьей обеспечен формулой (Е.2.23). Подставляя соотношение (Е.2.30) в соотношение (Е.2.29), мы
Е.2. Гамильтонова формулировка 655 приходим к удобной для наших целей форме гравитационного действия (Arnowitt, Deser, Misner, 1962). Канонический импульс, сопряженный с hab, это тга6 = =± = у/К (КаЬ - Khab). (Е.2.31) dhab Однако J£?G не содержит каких-либо производных по времени от N и Na, так что сопряженные им импульсы равны нулю тождественно. По аналогии со случаем электромагнитного поля мы интерпретируем этот факт, говоря, что N и Na не следует считать динамическими переменными. Поэтому мы переопределяем конфигурационное пространство, ограничивая его римановой метрикой Наь на £*. Плотность гамильтониана определяется следующим образом Ж0 = 7Г° hab — -£fG = = -fti/ajy (3)д + Nh-1'2 [тга6тгаб - \*2] + 2тга6DaNb = = Л1/2 {N [-<3> Я + /^тг'Чб - ifc-V] - - 2Nb [Da (/Г1'2*"6)] + 2Д, (/Г^ЛГбТг06) } , (Е.2.32) где 7г = 7г°а. Здесь последнее слагаемое представляет собой граничный вклад в HG = J Jf?G (3)e, который может быть отброшен. Варьирование HG по отношению к N и Na дает уравнения -(3)R + /Г^Ч* - \h-lir2 = О (Е.2.33) и Da (/i-1/27ra6J = О, (Е.2.34) в которых после подстановки (Е.2.31) можно узнать уравнения связей, наложенных на начальные значения, (10.2.28) и (10.2.30), найденные в гл. 10. Динамические гамильтоновы уравнения (Е.2.2) и (Е.2.3), полученные на основе #G, имеют вид (Arnowitt, Deser, Misner 1962): Кь = ^=2/i-1/2iv(7ra6-|/ia67r)+2D(a7Vb), (E.2.35) = -Nh1!2 ^Rab - \ ™Rhab) + + \Nh-V2h«b (*«,** - ±тг2) - 2NhT1'2 (Лс6 - ±7гтго6) + + /i1/2 (DaDbN - habDcDcN) + hl'2Dc (/Г 1/2ЛГстга6) - - 2тгс(о DcNb\ (E.2.36) •a6 <*#G 7Г =
656 Приложения где опять отброшены граничные члены и использована связь (Е.2.34). Система уравнений (Е.2.33)-(Е.2.36) эквивалентна уравнению Эйнштейна в вакууме Яаь = 0. Таким образом, мы развили гамильтонову формулировку со связями для уравнений Эйнштейна. Наличие связей в гамильтоновых формулировках уравнений Максвелла и уравнений Эйнштейна указывает на то, что в нашем выборе конфигурационного пространства нам не удалось ограничиться "истинными динамическими степенями свободы". Даже при том, что мы уже исключили V, N и Na из числа динамических переменных, само наложение связей свидетельствует, что фазовое пространство все еще "слишком велико". Это в свою очередь прямо связано с калибровочной свободой, имеющейся у переменных А и каь конфигурационного пространства. В случае электромагнитного поля А и А — V\ представляют одну и ту же физическую конфигурацию. Это означает, что нам следует взять в качестве конфигурационного не просто пространство вектор-потенциалов Л, но пространство эквивалентных классов вектор-потенциалов А, в котором два вектор-потенциала эквивалентны, если отличаются только калибровочным преобразованием. Пространством, касательным к конфигурационному в А, тогда будет пространство линейных функций от вариаций А; оно определяется только классами эквивалентности. Таким образом, импульс следовало бы представить векторными полями 7г, имеющими то свойство, что [it.[6A- V(*x)] = fit-6 А. (Е.2.37) Однако это свойство имеет место в том, и только в том случае, если V • тг = 0. (Е.2.38) Итак, при нашем новом выборе конфигурационного пространства, импульсное пространство состоит только из бездивергентных векторных полей на £*. Но это означает, что условие связи (Е.2.18) удовлетворяется автоматически! Мы можем опустить член V IV • 7г) в выражении (Е.2.16) и принять плотность гамильтониана равной просто ЖЕМ = \(тг-7! + В.Ву (Е.2.39) где, как и прежде, В = V х А. (Заметьте, что В зависит только от класса эквивалентности А и, следовательно, является хорошо определенной функцией А.) Гамильтоновы уравнения движения (Е.2.2) и (Е.2.3) дают А= Щ±=1?, (Е.2.40) 07Г
Е.2. Гамильтонова формулировка 657 jf = _^M=_yxj5. (E.2.41) SA Классы эквивалентности, появившиеся в обеих частях уравнения (Е.2.40), можно исключить, применяя операцию rot к этому уравнению. Нетрудно убедиться, что уравнения (Е.2.40) и (Е.2.41), при том, что Е = — 7?, эквивалентны уравнениям Максвелла. Напомним читателю также, что V • В = 0 следует автоматически из определения В, тогда как V - Е = 0 следует автоматически из определения канонического импульса. Таким образом, исключая калибровочные степени свободы из нашего конфигурационного пространства, т.е. работая с А вместо Л, мы смогли дать свободную от связей гамильтонову формулировку уравнений Максвелла3. Аналогично, в случае уравнений Эйнштейна имеется свобода в выборе конфигурационного поля hab- Если ф - произвольный диффеоморфизм на Et, то и hab и ф*каь представляют одну и ту же физическую конфигурацию. Это означает, что в общей теории относительности мы должны рассматривать в качестве конфигурационного пространства множество классов эквивалентности римановых метрик 3Соотношение между связью V • Ё = 0 и калибровочным преобразованием А —* —*■ А — Vx можно получить следующим более систематическим образом. Взяв какую-либо функцию / на фазовом пространстве, мы можем связать с ней векторное поле V на фазовом пространстве, потребовав, чтобы для всякой функции g на фазовом пространстве выполнялось V(g) = {fig}- Скобки Пуассона определены согласно Jzt &q 6n 6q Sn (Поскольку мы не определили бесконечномерные многообразия и векторные поля на них, данная ремарка преследует эвристическую цель.) Можно непосредственно проверить, что векторное поле К, ассоциированное указанным способом с "функцией связи" / = \V • Е, где \ - произвольная функция на Et, является инфинитезимальным генератором однопараметрического семейства преобразований^ фазовом пространстве, ассоциированным с калибровочным преобразованием А —♦ A — V\- Таким образом, можно сказать, что в электромагнетизме связь "генерирует" калибровочные преобразования. Ограничивая поле "подпространством связей" V • Е = 0 и пространством орбит поля V на этом подпространстве, мы и получаем согласованную свободную от связей гамильтонову формулировку на "ограниченном фазовом пространстве". Подобным же образом в случае гравитационного поля векторное поле, ассоциированное с функцией связи , где £а - произвольное векторное поле на Et, генерирует однопараметрическое семейство диффеоморфизмов на Et, ассоциированное с £а- Таким образом, приходим к выбору в качестве нового конфигурационного пространства пространства метрик на Et, определенных с точностью до диффеоморфизмов, которые могут быть непрерывно деформированы в тождественное преобразование (Friedman, Sorkin 1980).
658 Приложения hab на Ег, где две метрики считаются эквивалентными, если они могут быть преобразованы друг в друга диффеоморфизмом. Такое конфигурационное пространство известно как суперпространство (Wheeler 1968)4. Используя суперпространство как конфигурационное пространство, мы находим, что для всякого векторного поля wa на Е* сопряженный импульс 7г°6 теперь должен удовлетворять / тгаЬ (Shot + Diawb)) = f 7rab6hab, (E.2.42) что подразумевает автоматическое подчинение nab уравнению Da (/Г1/2тга6) = 0. (Е.2.43) Таким образом, связь (Е.2.34) устраняется за счет выбора суперпространства в качестве конфигурационного пространства. Однако условие связи (Е.2.33) сохраняется. Эту связь можно считать происходящей от калибровочной свободы выбора способа "расслаивать" пространство-время на пространство и время. Тут имеется тесная аналогия со связью, возникающей, когда мы "параметризуем" некоторую теорию без связей, т.е. когда в лагранжиан вводится функция времени, определяющая выбор гиперповерхностей Е* по отношению к опорной поверхности Е, что позволяет трактовать эту функцию времени как новую динамическую переменную (Kuchaf 1973, 1981). В случае так параметризованных теорий, условие связи типа (Е.2.33) является линейным по импульсу, сопряженному с функцией времени. Это значит, что теорию можно "депараметризовать", разрешив условие связи относительно данного импульса. Однако в случае уравнений Эйнштейна условие связи (Е.2.33) квадратично относительно импульса, и депараметризация не представляется возможной. Таким образом, в общей теории относительности не представляется возможным сделать выбор конфигурационного пространства так, чтобы фазовое пространство свелось только к "истинным динамическим степеням свободы". Наличие условия связи (Е.2.33) является существенным атрибутом общей теории относительности. Это приводит к серьезным затруднениям при построении квантовой теории гравитации на основе канонического квантования (см. гл. 14). Наконец, мы возвращаемся к вопросу о граничных членах в га- мильтоновой формулировке. Рассмотрим, во-первых, случай замкнутой Вселенной, т.е. М = R х Е, где Е - компакт. Рассмотрим область 4Не следует путать используемый здесь термин суперпространство с термином суперпространство, применяемым в суперсимметричной теории поля.- Прим.ред.
Е.2. Гамильтонова формулировка 659 U из М, ограниченную двумя гиперповерхностями постоянного времени Ei и Ег- Тогда модифицированное гравитационное действие S'G (Е.1.42) приобретает граничные вклады от Ei и Ег. Однако эти граничные члены будут скомпенсированы третьим членом из правой части (Е.2.28). Заметим, что соседний четвертый член не участвует в граничном вкладе, потому что naVanc ортогонально нормали пс к Ei и Ег. Кроме того, последний член в (Е.2.32) не дает граничного вклада, поскольку в рассматриваемом случае нет пространственной границы. Таким образом, в случае замкнутой Вселенной наш окончательный результат для HG останется в силе, если учесть все граничные члены. Заметьте, что благодаря связям (Е.2.33) и (Е.2.34) численное значение HG равно нулю для каждого решения. Это значит, что нам следует положить полную энергию замкнутой Вселенной равной нулю. Другими словами, это значит, что нетривиального понятия полной энергии замкнутой Вселенной не существует. Однако этот аргумент не окончателен, поскольку всегда можно "параметризовать" теорию в вышеуказанной манере так, чтобы сделать ее гамильтониан нулевым. Если бы общую теорию относительности можно было "депараметризовать", то понятие полной энергии замкнутой Вселенной могло бы иметь определенный смысл. Рассмотрим теперь асимптотически плоское пространство-время. Пусть снова область М ограничена двумя гиперповерхностями Ei и Ег. Как и раньше мы хотим рассмотреть вариации метрики, для которых hab удерживается постоянной на Ei и Ег, но теперь наиболее естественное граничное условие состоит скорее в том, чтобы вариация сохраняла асимптотическую плоскостность, чем в том, чтобы индуцированная метрика оставалась постоянной на отдаленной пространственной границе. Такое новое граничное условие требует, чтобы к гравитационному действию (Е.1.42) были добавлены специальные граничные члены. Более того, теперь граничные члены5 из (Е.2.28) и (Е.2.32) дадут вклад в HG. Для нахождения граничных членов мы поступим следующим образом. Сначала произведем варьирование #G, a потом модифицируем HG так, чтобы все нежелательные члены в вариации отсутствовали. Введем на Е* асимптотические декартовы координаты, как описано в задаче 2 к гл. 11. Рассмотрим случай, когда асимптотически ta определяет сдвиг по времени на пространственной бесконечности, т.е. считаем N —> 1 и Na —> 0 при г —> оо. Пусть S означает координатную сферу радиуса г. Тогда при варьировании HG 5Во избежание путаницы мы напоминаем читателю, что в соотношении (Е.1.42) К означает след внешней кривизны границы, тогда как в (Е.2.28) Каь является внешней кривизной Е*.
660 Приложения только член —hl^2N^R в соотношении (Е.2.32) порождает ненулевой граничный интеграл на 5 в пределе г —► оо. Но вычисление этого интеграла является трехмерным аналогом вычисления граничного вклада в гравитационное действие, проведенное в конце предыдущего раздела, с той лишь разницей, что мы более не требуем от метрики постоянства на 5. Таким образом, используя (7.5.14) (или, даже лучше, используя трехмерный аналог выражения, приведенного в первой строке (ЕЛ.38)), мы находим (Regge, Teitelboim 1974), что при одно- параметрическом варьировании hab и 7г°6, сохраняющем асимптотическую плоскостность, dA = / [АаЬ6тгаЬ - BabShab] - SC. (E.2.44) JUt Здесь Ааь и ВаЬ даются правыми частями гамильтоновых уравнений (Е.2.35) и (Е.2.36) соответственно, а граничный член SC имеет вид 6С= lim [ rahbc[Dc(6hab)-Da(6hbc)], (E.2.45) г—°° Js где г° - единичная нормаль к 5 и интегрирование подразумевает наличие естественного элемента объема на 5. Мы можем переписать SC в форме с координатными компонентами метрики - iss.tj.ib-b)"}- <■""> где мы отбросили члены, не дающие вклада в пределе г —► оо. Таким образом, чтобы при варьировании гамильтониана не получалось граничных членов на пространственной бесконечности, мы определяем новый гравитационный гамильтониан Н' в виде H'G=HG+a, (E.2.47) где а представляет собой выражение, заключенное в фигурные скобки во второй строке выражения (Е.2.46). Правые части гамильтоновых уравнений (Е.2.35) и (Е.2.36) являются при этом истинными функциональными производными H'G по отношению к Наъ и 7гаЬ для вариаций, сохраняющих асимптотическую плоскостность.
Е.2. Гамильтонова формулировка 661 Численное значение, принимаемое H'G на решениях уравнений Эйнштейна, и есть а. Отсюда следует, что а полагается интерпретировать как величину, пропорциональную полной энергии асимптотически плоского пространства-времени. Это мотивирует определение энергии (11.2.14), данное в гл. 11. (Коэффициент пропорциональности между а и энергией можно найти, вычислив а для решения Шварцшиль- да.) Подобно энергии, определение полного импульса (11.2.15) можно мотивировать, исследуя граничные члены HG, которые возникают, когда мы берем N —► 0, и требуя, чтобы Na переходило в пространственную трансляцию при г —► со. Понятие же углового момента (см. задачу 6 гл. 11) возникает при рассмотрении более общего асимптотического поведения функций шага и сдвига (Regge, Teitelboim 1974).
ПРИЛОЖЕНИЕ F Единицы измерения и размерности Геометризованные единицы В этой книге мы использовали "геометризованные единицы"1, когда гравитационная постоянная G и скорость света с полагаются равными единице. Все величины, которые в обычных единицах измерения имеют размерность, выражающуюся через длину L, время Т и массу М, даются степенями длины в геометризованных единицах. Поскольку G = с = 1, все множители, содержащие G и с, могут быть в формулах опущены, и действительно, именно поэтому удобно использовать геометризованные единицы в общей теории относительности. Тем не менее если вы желаете оценить величины в обычных негеометризован- ных единицах, множители G и с должны занять свое место. Это легко сделать следующим образом. В негеометризованных единицах размерность с - это L/T, а размерность G/c2 - это L/M. Следовательно, переводной множитель для значения величины, имеющей размерность времени, из геометризованных единиц в обычные это - с, а для величины, имеющей размерность массы, - G/c2. Обобщая: величина с размерностью LnTmMp в обычных единицах имеет размерность £n+m+P B геометризованных единицах, а ее переводной множитель равен cm (G/c2)p. Размерности и переводные множители для некоторых широкоупотребительных величин даны в табл. F.I. Чтобы преобразовать выражение, записанное в геометризованных единицах, к негеометризованному виду, надо, во-первых, установить негеометризованные размерности всех величин, содержащихся в выражении. Затем следует выбрать переводной множитель для каждой величины из табл. F.1 или вычислить его по указанной выше формуле. Если теперь умножить каждую величину, содержащуюся в уравнении, на ее переводной множитель, то результирующее уравнение будет справедливо в негеометризованных единицах измерения. 1В переводах на русский язык также используется термин "геометрические единицы".- Прим. ред.
F. Планковские единицы 663 Таблица F.l. Переводные множители для геометризованных единиц Величина Длина Масса Время Скорость Ускорение Плотность массы Сила Давление Угловой момент Энергия Плотность энергии Электрический заряд (СГС) Негеометризованная размерность L М Т LT-1 LT-2 L~3M LT~2M L-iT-2M L2T~lM L2T~2M L-lT~2M L3/2T-iMi/2 Геометризованная размерность L L L 1 L-1 L-3 1 L-2 L2 L L-2 L Переводной множитель 1 G/c2 с с"1 с"2 G/c2 G/c4 G/c4 G/c3 G/c4 G/c4 G^2/c2 Планковские единицы При рассмотрении квантовых эффектов в общей теории относительности естественно использовать планковские единицы, когда h полагается равной 1 в дополнение к G = с = 1. В планковских единицах все величины, чьи размерности в обычных единицах выражаются через L, Т и М, становятся безразмерными. В частности, все длины выражаются безразмерными множителями к планковской длине 11I /р = (Gh/c3) . Чтобы преобразовать выражение из планковских единиц к обычным, надо просто установить негеометризованные размерности всех величин, входящих в выражение. Затем мы умножаем каждую такую величину на ее переводной множитель из геометризованных единиц в негеометризованные и еще разделим на /£, где Vх - геометризованная размерность этой величины. В планковских единицах фундаментальные масштабы длины, времени, массы и других величин (по отношению к которым все физические величины безразмерны) становятся просто обратными к вышеуказанным переводным множителям. Для удобства читателя ниже выписаны некоторые из этих фундаментальных масштабов вместе с их значениями в единицах СГС, вычисленные с использованием значений:
664 Приложения с = 3,00х 1010см- с"1, G = 6,67 х 10"8 см3 • г"1 с"1 и h= 1,05 х ИГ27 эрг- с. Длина: lp = (Gh/c3)1/2 «l,6x 10"33cm, время: tp = /р/с «5,4х 10~44с, масса: тр = lpc2/G «2,2х 10"~5г, энергия: Ер = lpc4/G « 2,0 х 1016эрг« 1.3 х плотность массы: рр = l~2c2/G «5,2х 1093г • см~3, температура: Тр = Ер/к « 1,4 х 1032К. 1019ГэВ,
Литература AbersE.S., LeeB.W. 1973. Gauge Theories. Phys. Rept., 9C, 1-141. 2] Adams R. A. 1975. Sobolev Spaces. (New York: Academic Press). 3] Alley CO. 1979. Relativity and Clocks. In: Proceedings of the 33rd Annual Symposium on Frequency Control. (Washington: Electronic Industries Association) Ames W.L., ThorneK.S. 1968. The Optical Apprearance of a Star That Is Collapsing through Its Gravitational Radius. Astrophys. J., 151, 659-670. ArnettW.D., Bowers R.L. 1977. A Microscopic Interpretation of Neutron Star Structure. Astrophys. J. Suppl., 33, 415-436. ArnowittR., DeserS., MisnerC.W. 1962. The Dynamics of General Relativity. In: Gravitation: An Introduction to Current Research. Ed.: L.Witten (New York: Wiley). AshtekarA., GerochR.P. 1974. Quantum Theory of Gravitation. Rept. Prog. Phys., 37, 1211-1256. AshtekarA., Magnon A. 1975. Quantum Fields in Curved Space-Times. Proc. Roy. Soc. bond. A, 346, 375-394. AshtekarA., Hansen R.O. 1978. A Unified Treatment of Null and Spatial Infinity in General Relativity. I. Universal Structure, Asymptotic Symmetries, and Conserved Quantities at Spatial Infinity. J. Math. Phys., 19, 1542-1566. AshtekarA., Magnon-AshtekarA. 1979a. On Conserved Quantities in General Relativity. J. Math. Phys., 20, 793-800. AshtekarA., Magnon-AshtekarA. 1979b. Energy-Momentum in General Relativity. Phys. Rev. Lett, 43, 181-184. AshtekarA. 1980. Asymptotic Structure of the Gravitational Field at Spatial Infinity. In: General Relativity and Gravitation. Vol. 1-2. Ed.: A.Held (New York: Plenum). AshtekarA., StreubelM. 1981. Symplectic Geometry of Radiative Modes and Conserved Quantities at Null Infinity. Proc. Roy. Soc. bond. A, 376, 585-607. AshtekarA., Horowitz G.T. 1982. Energy-Momentum of Isolated System Cannot be Null. Phys. Lett., 89A, 181-184. AshtekarA., WinicourJ. 1982. Linkages and Hamiltonians at Null Infinity. J. Math. Phys., 23, 2410-2417. AtiyahM.F., WardR.S. 1977. Instantons and Algebraic Geometry. Commun. Math. Phys., 55, 117-124. AvisS.J., IshamC.J. 1980. Generalized Spin Structures on Four Dimensional Spacetimes. Commun. Math. Phys., 72, 103-118. Backer D.C., Kulkarni S.R., HeilesC, Davis M.M., GossW.M. 1982. A Millisecond Pulsar. Nature, 300, 615-618. BardeenJ.M., Press W.H., TeukolskyS.A. 1972. Rotating Black Holes: Locally Nonrotating Frames, Energy Extraction, and Scalar Synchrotron Radiation. Astrophys. J., 178, 347-369.
666 Литература [20] Bardeen J.M., Carter В., Hawking S.W. 1973. The Four Laws of Black Hole Mechanics. Commun. Math. Phys., 31, 161-170. [21] Bargmann V. 1947. Irreducible Unitary Representations of the Lorentz Group. Ann. Math., 48, 568-640. [22] Bargmann V., WignerE.P. 1948. Group-Theoretical Discussion of Relativistic Wave Equations. Proc. Nat. Acad. Sci. U.S., 34, 211-223. [23] Bargmann V. 1954. On Unitary Ray Representations of Continuous Groups. Ann. Math., 59, 1-46. [24] Beig R., Simon W. 1980. Proof of a Multipole Conjecture due to Geroch. Commun. Math. Phys., 78, 75-82. [25] Bekenstein J.D. 1972. Nonexistence of Baryon Number for Static Black Holes. Phys. Rev. D, 5, 1239-1246. [26] Bekenstein J.D. 1973a. Extraction of Energy and Charge from a Black Holes. Phys. Rev. D, 7, 949-953. [27] Bekenstein J.D. 1973b. Black Holes and Entropy. Phys. Rev. D, 7, 2333-2346. [28] Bekenstein J.D. 1974. Generalized Second Law of Thermodynamics in Black-Hole Physics. Phys. Rev. D, 9, 3292-3300. [29] Белинский В.А., ЛифшицЕ.М., Халатников И.М. 1970. УФН, 102,463; Oscillatory Approach to a Singular Point in the Relativistic Cosmology. Advan. in Phys., 19, 525-573; - ЖЭТФ, 62, 1606 (1972). [30] Bell J.S., LeinaasJ.M. 1983. Electrons as Accelerated Thermometers. Nucl. Phys. B, 212, 131-150. [31] BersL., JohnF., SchechterM. 1964. Partial Differential Equations. (Providence RI: American Mathematical Society). [32] BianchiL. 1897. Sugli Spazii a Tre Dimensioni che Ammettono un Gruppo Continuo di Movimenti. Mem. di Math. Soc. Hal. Sci., 11, 267-ff. [33] BirkhoffG.D. 1923. Relativity and Modern Physics. (Cambridge, MA: Harvard University Press). [34] BirrellN.D. 1981. Interacting Quantum Field Theory in Curved Space-Time. In:[159] [35] BirrellN.D., DaviesP.C.W. 1982. Quantum Fields in Curved Space. (Cambridge: Cambridge University Press). [36] Bishop R.L., Crittenden R.J. 1964. Geometry of Manifolds. (New York: Academic Press) — Перев.: Бишоп Р., Криттенден Р. Геометрия многообразий. (М.: Мир, 1967). [37] BondiH., van der Burg M.G.J., Metzner A.W.K. 1962. Gravitational Waves in General Relativity. VII. Waves from Axi-Symmetric Isolated Systems. Proc. Roy. Soc. bond. A, 269, 21-52. [38] BoulwareD. 1973. Naked Singularities, Thin Shells, and the Reissner-Nordstrom Metric. Phys. Rev. D, 8, 2363-2368. [39] BoyerR.H., LindquistR.W. 1967. Maximal Analytic Extension of the Kerr Metric. J. Math. Phys., 8, 265-281.
Литература Brill D., Cohen J.M. 1966. Rotating Masses and Their Effects on Inertial Frames. Phys. Rev., 143, 1011-1015. Brown L.S. 1977. Stress-Tensor Trace Anomaly in a Gravitational Metric: Scalar Fields. Phys. Rev. D, 15, 1469-1483. BuchdahlH.A. 1962. On the Copmatibility of Relativistic Wave Equations in Riemannian Spaces. Nuovo Cim.t 25, 486-496. CandelasP. 1980. Vacuum Polarization in Schwarzschild Spacetime. Phys. Rev. D, 21, 2185-2202. Cantor M. 1973. Global Analysis over Noncompact Spaces. Ph.D Thesis. University of California (Berkeley). Carter B. 1968a. Global Structure of the Kerr Family of Gravitational Fields. Phys. Rev., 174, 1559-1571. Carter B. 1968b. Hamilton-Jakobi and Schrodinger Separable Solutions of Einstein's Equations. Commun. Math. Phys., 10, 280-310. Carter B. 1969. Killing Horizons and Orthogonally Transitive Groups in Space-Time. J. Math. Phys., 10, 70-81. Carter В. 1971. Axisymmetric Black Hole Has Only Two Degrees of Freedom. Phys. Rev. Lett., 26, 331-332. Carter B. 1973. Black Hole Equilibrium States. In: Black Holes. Ed.: C.DeWitt, B.S.DeWitt (New York: Gordon & Breach). ChakrabartiS.K., GerochR.P., Liang C.B. 1983. Timelike Curves of Limited Acceleration in General Relativity. J. Math. Phys., 24, 597-598. ChandrasekharS. 1939. An Introduction to the Study of Stellar Structure. (Chicago: University of Chicago Press). ChandrasekharS. 1964a. The Dynamical Instability of Gaseous Masses Approaching the Schwarzschild limit in General Relativity. Astrophys. J., 140, 417-433. ChandrasekharS., TooperR.F. 1964. The Dynamical Instability of the White-Dwarf Configurations Approaching the Limiting Mass. Astrophys. J., 139, 1396-1398. ChandrasekharS. 1979. On the Equations Governing the Perturbations of the Reissner-Nordstrom Black Hole. Proc. Roy. Soc. bond. A, 365, 453-465. ChandrasekharS., HartleJ.B. 1982. On Crossing the Cauchy Horizon of a Reissner-Nordstrom Black Hole. Proc. Roy. Soc. bond. A, 384, 301-315. ChandrasekharS. 1983. The Mathematical Theory of Black Holes. (Oxford: Clarendon Press). Choquet-Bruhat Y. 1962. The Cauchy Problem. In: Gravitation: An Introduction to Current Research. Ed.: L.Witten (New York: Wiley). Choquet-Bruhat Y., GerochR.P. 1969. Global Aspects of the Cauchy Problem in General Relativity. Commun. Math. Phys., 14, 329-335. Choquet-Bruhat Y., York J.W.,Jr. 1980. The Cauchy Problem. In: [12]. Christ N.H. 1980. Conservation-Law Violation at High Energy by Anomalies. Phys. Rev. D, 21, 1591-1602.
668 Литература [61] ChristodoulouD. 1970. Reversible and Irreversible Transformations in Black Hole Physics. Phys. Rev. Lett., 25, 1596-1597. [62] ChristodoulouD., Ruffini R. 1971. Reversible Transformations of a Charged Black Hole. Phys. Rev. D, 4, 3552-3555. [63] ChristodoulouD., O'MurchadhaN. 1981. The Boost Problem in General Relativity. Commun. Math. Phys., 80, 271-300. [64] Chrzanowski P. 1975. Vector Potential and Metric Perturbations of a Rotating Black Hole. Phys. Rev. D, 11, 2042-2062. [65] Clarke C.J. 1971. Magnetic Charge, Holonomy and Characteristic Classes: Illustrations of the Methods of Topology in General Relativity. Gen. Rel. and Grav., 2, 43-51. [66] CoddingtonE.A., LevinsonN. 1955. Theory of Ordinary Differential Equations. (New York: McGraw-Hill). [67] Cohen J.M., KegelesL.S. 1974. Electromagnetic Fields in Curved Spaces: A Constructive Procedure. Phys. Rev. D, 10, 1070-1084. [68] Coleman S. 1973. Renormalization and Symmetry: A Review for Non-Specialists. In: Properties of the Fundamental Interactions. Ed.: A.Zichichi (Bologna: Editorice Compositori). [69] Collins С.В., Ellis G.F.R. 1979. Singularities in Bianchi Cosmologies. Phys. Rep., 56, 65-105. [70] CourantR., HilbertD. 1962. Methods of Mathematical Physics. Vol.2. Partial Differential Equations. (New York: Interscience). [71] Cowley A.P., CramptonD., Hutchings J.B., RemillardR., PenfoldJ. 1983. Discovery of a Massive Unseen Star in LMC X-3. Astrophys. J., 272, 118-122. [72] DeserS., van NieuwenhuizenP., BoulwareD. 1975. Uniqueness and Nonrenormalizability of Quantum Gravitation. In: General Relativity and Gravitation. Ed.: G.Shaviv, J.Rosen (New York: Wiley). [73] DeWittB.S. 1967. Quantum Theory of Gravity. II. The Manifestly Covariant Theory. III. Applications of the Covariant Theory. Phys. Rev.f 162, 1195-1239; 1239-1256. [74] DeWittB.S. 1979. Quantum Gravity: The New Synthesis. In: [148]. [75] DickeR.H. 1962. Mach's Principle and Invariance under Transformations of Units. Phys. Rev., 125, 2163-2167. [76] Dimock J. 1979. Scalar Quantum Field in an External Gravitational Field. J. Math. Phys., 20, 2549-2555. [77] Dixon W.G. 1974. Dynamics of Extended Bodies in General Relativity. III. Equations of Motion. Phil Trans. Roy. Soc. bond. A, 277, 59-119. [78] Douglass D.H., Braginsky V.B. 1979. Gravitational Radiation Experiments. In: [148]. [79] Dyson F.W., Eddington A,S.E., Davidson C.R. 1920. A Determination of the Deflection of Light by the Sun's Gravitational Field from Observations Made at the Total Eclipse of May 29, 1919. Phil Trans. Roy. Soc. A, 220, 291-333.
Литература Eddington A.S. 1924. A Comparison of Whitehead's and Einstein's Formulas. Nature, 117, 192. — Эддингтон А.С. Теория относительности. (М.: Гостехиздат, 1934) Ehlers J. 1957. Konstrucktionen und Charakterisierung der Einsteinschen Gravitationsfeldgleichungen. Dissertation (Hamburg). Einstein A. 1915a. Zur Allgemeinen Relativitatstheorie. Preuss. Akad. Wiss. Berlin, Sitzber., 778-786. Einstein A. 1915b. Der Feldgleichungen der Gravitation. Preuss. Akad. Wiss. Berlin, Sitzber., 844-847. — ЭйнштейнА. Собр. науч. трудов. Т.1 (М.: Наука, 1965) EisenhartL.P. 1949. Riemannian Geometry. (Princeton: Princeton University Press). Ellis G.F.R., MacCallum/,M.A.H. 1969. A Class of Homogeneous Cosmological Models. Commun. Math. Phys., 12, 108-141. Ernst F.J. 1968. New Formulation of the Axially Symmetric Gravitational Field Problem. Phys. Rev., 167, 1175-1178. Фаддеев Л.Д., Попов В.Н. 1967. Feynman Diagrams for the Yang-Mills Field. Phys. Lett., 25B, 29-30. FawcettM. 1983. The Energy-Momentum Tensor near a Black Hole. Commun. Math. Phys., 89, 103-115. FeinbergG. 1967. Possibility of Faster-than-Light Particles. Phys. Rev., 159, 1089-1105. Fierz M., Pauli W. 1939. Relativistic Wave Equations for Particles of Arbitrary Spin in an Electromagnetic Field. Proc. Roy. Soc. Lond. A, 173, 211-232. Finkelshtein D. 1958. Pass-Future Asymmetry of the Gravitational Field of a Point Particle. Phys. Rev., 110, 965-967. Fischer A.E., Marsden J.E. 1972. The Einstein Evolution Equations as a First-Order Symmetric Hyperbolic Quasilinear System. Commun. Math. Phys., 28, 1-38. Fischer A.E., Marsden J.E. 1979. The Initial Value Problem and the Dynamical Formulation of General Relativity. In: [148]. Flanders H. 1963. Differential Forms with Application to the Physical Sciences. (New York: Academic Press). Фок В. A. 1939. Sur le Mouvement des Masses Finies d'Apres la Theorie de Gravitation Einsteinienne. J. Phys. U.S.S.R., 1, 81-116. — ЖЭТФ, 9, 375-410. FomalontE.B., SramekR.A. 1976. Measurement of the Solar Gravitational Deflection of Radio Waves in Agreement with General Relativity. Phys. Rev. Lett., 36, 1475-1478. Friedman J.L., SorkinR.D. 1980. Spin 1/2 from Gravity. Phys. Rev. Lett., 44, 1100-1103; erratum 45, 148E. Фридман А.А, 1922. Uber die Krummung des Raumes. Z. Phys., 10, 377-386. Fulling S. A. 1973. Nonuniqueness of Canonical Field Quantization in Riemannian Space-Time. Phys. Rev. D, 7, 2850-2862.
670 Литература [100] Fulling S.A., Narcowich F., WaldR.M. 1982. Singularity Structure of the Two-Point Function in Quantum Field Theory in Curved SpaceTime. II. Ann. Phys., 136, 243-272. [101] Fulling S. A. 1983. Two-Point Functions and Renormalized Observables. In: Gauge Theory and Gravitation. Ed: K.Kikkawa, N.Nakanishi, H.Narai (Berlin: Springer-Verlag). [102] Gannon D. 1975. Singularities in Nonsimply Connected Space-Time. J. Math. Phys., 16, 2364-2367. [103] Gannon D. 1976. On The Topology of Spacelike Hypersurfaces, Singularities, and Black Holes. Gen. Rel. and Grav., 7, 219-232. [104] Garding L. 1947. Notes on Continuous Representations of Lie Groups. Proc. Nat. Acad. Sci. U.S., 33, 331-332. [105] Geroch R.P. 1968a. Spinor Structure of Space-Times in General Relativity. I. J. Math. Phys., 9, 1739-1744. [106] Geroch R.P. 1968b. Local Characterization of Singularities in General Relativity. J. Math. Phys., 9, 450-465. [107] Geroch R.P. 1968c. What Is a Singularity in General Relativity? Ann. Phys., 48, 526-540. [108] Geroch R.P. 1970a. Spinor Structure of Space-Time in General Relativity. II. J. Math. Phys., 11, 343-348. [109] Geroch R.P. 1970b. Domain of Dependence. J. Math. Phys., 11, 437-449. [110] Geroch R.P. 1971. A Method for Generating Solutions of Einstein's Equation. J. Math. Phys., 12, 918-924. [Ill] Geroch R.P. 1972a. A Method for Generating New Solutions of Einstein's Equation. II. J. Math. Phys., 13, 394-404. [112] Geroch R.P. 1972b. Structure of the Gravitational Field at Spatial Infinity. J. Math. Phys., 13, 956-968. [113] Geroch R.P., KronheimerE.H., PenroseR. 1972. Ideal Points in Space-Time. Proc. Roy. Soc. bond. A, 327, 545-567. [114] Geroch R.P., Jang P.S. 1975. Motion of a Body in General Relativity. J. Math. Phys., 16, 65-67. [115] Geroch R.P. 1977. Asymptotic Structure of Space-Time. In: Asymptotic Structure of Space-Time. Ed.: F.P.Esposito, L.Witten (New York: Plenum). [116] Geroch R.P. 1978a. General Relativity from A to B. (Chicago: University of Chicago Press). [117] Geroch R.P. 1978b. Null Infinity Is Not a Good Initial Data Surface. J. Math. Phys., 19, 1300-1303. 118] Geroch R.P., Horowitz G.T. 1978. Asymptotically Simple Does Not Imply Asymptotically Minkowskian. Phys. Rev. Lett., 40, 203-206. 119] Geroch R.P., Xanthopoulos B.C. 1978. Asymptotic Simplicity Is Stable. J. Math. Phys., 19, 714-719. 120] Geroch R.P., Horowitz G.T. 1979. Global Structure of Space-Times. In: [148].
Литература 671 [121 [122 [123 [124 [125] [126] [127] [128 [129 [130] [131 [132] [133] [134 [135] [136] [137] [138 [139 [140 [141 GerochR.P., WinicourJ. 1981. Linkages in General Relativity. J. Math. Phys., 22, 803-812. GerochR.P., Liang С.В., WaldR.M. 1982. Singular Boundaries of Space-Times. J. Math. Phys., 23, 432-435. Gibbons G.W., Perry M.J. 1976. Black Holes in Thermal Equilibrium. Phys. Rev. Lett., 36, 985-987. Gibbons G.W., Perry M.J. 1978. Black Holes and Thermal Green's Functions. Proc. Roy. Soc. Lond. A, 358, 467-494. Gibbons G.W. 1979. Cosmological Fermion-Number Non-Conservation. Phys. Lett., 84B, 431-434. Gibbons G.W., Hawking S.W., Horowitz G.Т., Perry M.J. 1983. Positive Mass Theorems for Black Holes. Commun. Math. Phys., 88, 295-308. Gibbons G.W., Hawking S.W., SiklosS. 1983. Ed.: The Very Early Universe (Cambridge: Cambridge University Press). Goldstein H. 1980. Classical Mechanics. (Reading, MA: Addison-Wesley) — Перев.: Гольдстейн Г. Классическая механика. (М.: Наука, 1975). Guth A.H. 1981. Inflationary Universe: A Possible Solution to the Horizon and Flatness Problems. Phys. Rev. D, 23, 347-356. Goven R. 1977. Wave Mechanics of Electrons in Kerr Geometry. Phys. Rev. D, 16, 1706-1711. HaagR., KastlerD. 1964. An Algebraic Approach to Quantum Field Theory. J. Math. Phys., 5, 848-861. HafeleJ.C, Keating R.E. 1972. Around the World Atomic Clocks: Observed Relativistic Time Gains. Science, 177, 168-170. HahnS.G., LindquistR.W. 1964. The Two Body Problem in Geometrodynamics. Ann. Phys., 29, 304-331. Hajicek P. 1973. General Theory of Vacuum Ergospheres. Phys. Rev. D, 7, 2311-2316. Hansen R.O. 1974. Multipole Moments in Stationary Space-Times. J. Math. Phys., 15, 46-52. Hartle J.B. 1972. Can a Schwarzschild Black Hole Exert Long-Range Neutrino Forces? In: Magic withowt Magic. Ed.: J.Klauder (San Francisco: Freeman). Hartle J.В., Hawking S.W. 1976. Path-Integral Derivation of Black Hole Radiance. Phys. Rev. D, 13, 2188-2203. Hartle J.B. 1978. Bounds on the Mass and Momentum of Inertia of Non-Rotating Neutron Stars. Phys. Rept., 46C, 201-247. HauserJ., Ernst F.J. 1981. A Proof of the Geroch Conjecture. J. Math. Phys., 22, 1051-1063. Hawking S.W. 1967. The Occurrence of Singularities in Cosmology. III. Causality and Singularities. Proc. Roy. Soc. Lond. A, 300, 182-201. Hawking S.W., Penrose R. 1970. The Singularities of Gravitational Collapse and Cosmology. Proc. Roy. Soc. Lond. A, 314, 529-548.
672 Литература [142] Hawking S.W. 1971. Gravitational Radiation from Colliding Black Holes. Phys. Rev. Lett., 26, 1344-1346. [143] Hawking S.W., HartleJ.B. 1972. Energy and Angular Momentum Flow into a Black Hole. Commun. Math. Phys., 27, 283-290. [144] Hawking S.W., Ellis G.F.R. 1973. The Large Scale Structure of Space-Time. (Cambridge: Cambridge University Press). — Перев.: ХокингС, Эллис Дж. Крупномасштабная теория пространства-времени. (М.: Мир, 1977). [145] Hawking S.W. 1975. Particle Creation by Black Holes. Commun. Math. Phys., 43, 199-220. [146] Hawking S.W. 1976. Breakdown of Predictability in Gravitational Collapse. Phys. Rev. D, 14, 2460-2473. [147] Hawking S.W. 1977. Zeta Function Regularization of Path Integrals in Curved Spacetime. Commun. Math. Phys., 55, 133-148. [148] Hawking S.W., Israel W. 1979. Ed.: General Relativity, an Einstein Centenary Survey. (Cambridge: Cambridge University Press). — Перев.: Общая теория относительности. (М.: Мир, 1983). [149] Hawking S.W. 1979. The Path Integral Approach to Quantum Gravity. In: [148]. [150] Hawking S.W., RocekM. 1981. Ed.: Super space and Supergravity. (Cambridge: Cambridge University Press). [151] Hicks N.J. 1965. Notes on Differential Geometry. (Princeton: Van Nostrand). [152] Hocking J.G., Young G.S. 1961. Topology. (Reading: Addison-Wesley). [153] HoenselaersC, Kinnersley W., Xanthopoulos B.C. 1979. Symmetries of the Stationary Einstein-Maxwell Equations. VI. Transformations Which Generate Asymptotically Flat Spacetimes with Arbitrary Multipole Moments. J. Math. Phys., 20, 2530-2536. [154] Horowitz G.T. 1980. Semiclassical Relativity: The Weak Field Limit. Phys. Rev. D, 21, 1445-1461. [155] Horowitz G.Т., Perry M.J. 1982. Gravitational Energy Cannot Become Negative. Phys. Rev. Lett., 48, 371-374. [156] HulseR.A., Taylor J.H. 1975. Discovery of a Pulsar in a Binary System. Astrophys. J., 195, L51-L53. [157] Isham C.J. 1978. Spinor Fields in Four Dimensional Spacetime. Proc. Roy. Soc. Lond. A, 364, 591-599. [158] IshamC.J., PenroseR., SciamaD.W. 1975. Ed.: Quantum Gravity (Oxford: Clarendon Press). [159] IshamC.J., PenroseR., SciamaD.W. 1981. Ed.: Quantum Gravity 2 (Oxford: Clarendon Press). [160] Israel W. 1967. Event Horizons in Static Vacuum Space-Times. Phys. Rev., 164, 1776-1779. [161] Israel W. 1968. Event Horizons in Static Electrovac Space-Times. Commun. Math. Phys., 8, 245-260.
Литература 673 [1621 [163 [164 [165; [166J [167] [168] [169] [170] [171 [172] [173 [174 [175 [176 [177 [178 [179 [180 [181 [182 Israel W. 1976. Thermo-Field Dynamics of Black Holes. Phys. Lett., 57A, 107-110. Jackson J.D. 1962. Classical Elecrodynamics. (New York: Wiley). — Перев.: Джексон Дж. Классическая электродинамика. (М.: Мир, 1965). JacobsonN. 1962. Lie Algebras. (New York: Wiley). Jang P.S., WaldR.M. 1977. The Positive Energy Conjecture and the Cosmic Censor Hypothesis. J. Math. Phys., 18, 41-44. Johnson R. A. 1977. The Bundle Boundary in Some Special Cases. J. Math. Phys., 18, 898-902. KasnerE. 1925. Solutions of Einstein Equations Involving Functions of Only One Variable. Trans. Am. Math. Soc, 27, 155-162. KayB.S. 1978. Linear Spin-Zero Quantum Fields in External Gravitational and Scalar Fields. Commin. Math. Phys., 62, 55-70 . KayB.S. 1982. Quantum Fields in Curved Space-Time and Scattering Theory. In: Differential Geometric Methods in Mathematical Physics. Ed.: H.D.Doebner, S.I.Andersson, H.R.Perry (Berlin: Springer-Verlag). Kelley J. 1955. General Topology. (Princeton: Van Nostrand-Reinhold) — Перев.: КеллиДж.Л. Общая топология. (М.: Наука, 1968, 1981). KerrR.P. 1963. Gravitational Field of a Spinning Mass as an Example of Algebraically Special Metrics. Phys. Rev. Lett., 11, 237-238. KerrR.P., Schild A. 1965. A New Class of Vacuum Solutions of the Einstein Field Equations. In: Proc. of the Galileo Galilei Centenary Meeting on General Relativity. Problems of Energy and Gravitational Waves. Ed.: G.Barbera (Florence: Comitato Nazionale per le Manifestazione Celebrative). KinnersleyW. 1969. Type D Vacuum Metrics. J. Math. Phys., 10, 1195-1203. KirshnerR.P., OemlerA., SchechterP.L., SchectmanS.A. 1981. A million Cubic Megaparsec Void in Bootes? Astrophys. J., 248, L57-L60. Klein O. 1929. Die Reflexion von Electronen an einem Potentialsprung nach der relativistischen Dynamic von Dirac. Z. Physik, 53, 157-165. KobayashiS., NomizuK. 1963. Foundations of Differential Geometry. Vol.1. (New York: Interscience). Komar A. 1959. Covariant Conservation Laws In General Relativity. Phys. Rev., 113, 934-936. KramerD., StephaniH., MacCallumM., HertlE. 1980. Exact Solutions of Einstein's Field Equations. (Cambridge: Cambridge University Press). KruskalM.D. 1960. Maximal Extension of Schwarzschild Metric. Phys. Rev., 119, 1743-1745. KucharK. 1973. Canonical Quantization of Gravity. In: Relativity, Astrophysics and Cosmology. Ed.: W.Israel (Dordrecht: Reidel). KucharK. 1976. Dynamics of Tensor Fields in Hyperspace. HI. J. Math. Phys., 17, 801-820. KucharK. 1981. Canonical Methods of Quantization. In: [159].
674 Литература [183] KunduP. 1981. On the Analyticity of Stationary Gravitational Fields at Spatial Infinity. J. Math. Phys., 22, 2006-2011. [184] ЛандауЛ.Д., ЛифшицЕ.М. 1962. Теория поля. Курс теоретической физики. Том II. (Москва: Наука, Физматлит). [185] Leray J. 1952. Hyperbolic Differential Equations. (Princeton Institute for Advanced Studies: unpublished duplicated notes). [186] Lichnerowicz A. 1944. LMntegration des Equations de la Gravitation Relativiste et la Probleme des n Corps. J. Math. Pures Appl., 23, 37-63. [187] Lichnerowicz A. 1955. Theories Relativistes de la Gravitation et de Electromagnetisme. (Paris: Masson). [188] Lovelock D. 1972. The Four-Dimensionality of Space and the Einstein Tensor. J. Math. Phys., 13, 874-876. [189] LudvigsenM., Vickers J.A.G. 1982. A Simple Proof of the Positivity of Bondi Mass. J. Phys. A, 15, L67-L70. [190] MacCallum M.A.H. 1979. Anisotropic and Inhomogeneous Relativistic Cosmologies. In: [148]. [191] MazurP.O. 1982. Proof of Uniqueness of the Kerr-Newman Black Hole Solution. J. Phys. A, 15, 3173-3180. [192] Milnor J.W. 1963. Spin Structures on Manifolds. L'enseignement math., 9, 198-203. [193] MisnerC.W. 1963. The Flatter Regions of Newman, Unti, and Tamburino's Generalized Schwarzchild Space. J. Math. Phys., 4, 924-937. [194] MisnerC.W. 1967. Taub-NUT Space as a Counterexample to Almost Anything. In: Relativity Theory and Astrophysics I: Relativity and Cosmology. Ed.: J.Ehlers. Lectures in Applied Mathematics. Vol.8 (Providence: American Mathematical Society). [195] MisnerC.W. 1969. Mixmaster Universe. Phys. Rev. Lett., 22, 1071-1074. [196] MisnerC.W., ThorneK.S., Wheeler J.A. 1973. Gravitation. (San Francisco: Freeman). — Перев.: МизнерЧ., Торн К., УилерДж. Гравитация. Т.1-3. (М.: Мир, 1977). [197] MoncriefV. 1975. Gauge Invariant Perturbations of Reissner-Nordstrom Black Holes. Phys. Rev. D, 12, 1526-1537. [198] Moller zum HagenH. 1970. On the Analyticity of Stationary Vacuum Solutions of Einstein's Equation. Proc. Camb. Phil. Soc, 68, 199-201. [199] Moller zum HagenH., Robinson D.C, SeifertH.J. 1973. Black Holes in Static Vacuum Space-Times. Gen. Rel. and Grav., 4, 53-78. [200] Moller zum HagenH., SeifertH.J. 1977. On Characteristic Initial-Value and Mixed Problems. Gen. Rel. and Grav., 8, 259-301. [201] Newman E.Т., Соисн Е., ChinnaparedK., ExtonA., PrakashA., TorrenceR. 1965. Metric of a Rotating Charged Mass. J. Math. Phys., 6, 918-919.
Литература 675 [202) [203 1204 [205 [206 [207] [208 [209j [210] [211 [212] [213] [214 [215] [216] [217] [218] [219] [220] [221 [222 [223 Newman E.Т., Penrose R. 1962. An Approach to Gravitational Radiation by a Method of Spin Coefficients. J. Math. Phys., 3, 566-578; erratum 4, 998. NoakesD.R. 1983. The Initial Value Formulation of Higher Derivative Gravity. J. Math. Phys., 24, 1846-1850. Nordstrom G. 1918. On the Energy of the Gravitational Field in Einstein's Theory. Proc. Kon. Ned. Acad. Wet., 20, 1238-1245. PaczynskiB. 1974. Mass of Cygnus X-1. Astron. and Astrophys., 34, 161-162. PaczynskiB. 1983. Mass of LMC X-3. Astrophys. J. Lett., 273, L81-L84. Page D.N. 1976a. Particle Emission Rates from a Black Hole: Massless Particles from an Uncharged, Nonrotating Hole. Phys. Rev. D, 13, 198-206. Page D.N. 1976b. Particle Emission Rates from a Black Hole. II. Massless Particles from a Rotating Hole. Phys. Rev. D, 14, 3260-3273. Page D.N., Hawking S.W. 1976. Gamma Rays from Primordial Black Holes. Astrophys. J., 206, 1-7. Page D.N. 1980. Is Black-Hole Evaporation Predictable? Phys. Rev. Lett., 44, 301-304. PanangadenP., WaldR.M. 1977. Probability Distribution for Radiation from a Black Hole in the Presence of Incoming Radiation. Phys. Rev. D, 16, 929-932. Papapetrou A. 1951. Spinning Test Particles in General Relativity. I. Proc. Roy. Soc. Lond. A, 209, 248-258. Papapetrou A. 1953. Eine Rotationssymetrische Losung in der Allgemeinen Relativitatstheorie. Ann. Physik, 12, 309-315. Papapetrou A. 1966. Champs Gravitationnels Stationnares a Symmetrie Axiale. Ann. Inst. Henri Poincare. A4, 83-105. Parker L. 1969. Quantized Fields and Particle Creation in Expanding Universes. I. Phys. Rev., 183, 1057-1068. Parker L. 1975. Probability Distribution of Particles Created by a Black Hole. Phys. Rev. D, 12, 1519-1525. Peebles P. J.E. 1971. Physical Cosmology. (Princeton: Princeton University Press). Peebles P. J.E. 1980. The Large-Scale Structure of the Universe. (Princeton: Princeton University Press). Penrose R. 1960. A Spinor Approach to General Relativity. Ann. Phys., 10, 171-201. Penrose R. 1963. Asymptotic Properties of Fields and Space-Times. Phys. Rev. Lett., 10, 66-68. Penrose R. 1965a. Gravitational Collapse and Space-Time Singularities. Phys. Rev. Lett., 14, 57-59. Penrose R. 1965b. Zero Rest-Mass Fields Including Gravitation: Asymptotic Behaviour. Proc. Roy. Soc. Lond. A, 284, 159-203. Penrose R. 1967. Twistor Algebra. J. Math. Phys., 8, 345-366.
676 Литература [224 [225 [226 [227 [228 [229] [230] [231 [232] [233 [234 [235] [236] [237] [238] [239] [240] [241 [242 [243 Penrose R. 1968. Structure of Space-Time. In: Batielle Rencontres, 1967. Ed.: C.M.DeWitt, J.A.Wheeler (New York: Benjamin). — Перев.: Пенроуз Р. Структура пространства-времени. (М.: Мир, 1972). Penrose R. 1969. Gravitational Collapse: The Role of General Relativity. Rev. del Nuovo Cimento, 1, 252-276. Penrose R. 1972. Techniques of Differential Topology in Relativity. (Philadelphia: Siam). Penrose R., MacCallum M.A.H. 1972. Twistor Theory: An Approach to the Quantization of Fields and Space-Time. Phys. Rept., 6C, 241-316. Penrose R. 1975. Twistor Theory, the Aims and Achievements. In: [158]. Penrose R. 1979. Singularities and Time Asymmetry. In: [148]. Penrose R., WardR.S. 1980. Twistors for Flat and Curved Space-Time. In: [12]. Penrose R. 1981. Time-Asymmetry and Quantum Gravity. In: [159]. Penrose R., RindlerW. 1984. Spinors and Space-Time. Vol.1. Two-Spinor Calculus and Relativistic Fields. (Cambridge: Cambridge University Press). Penzias A.A., Wilson R.W. 1965. A Measurement of Excess Antenna Temperature at 4080 Mc/s. Astrphys. J., 142, 419-421. PersidesS., PapadopoulosD. 1979. A Covariant Formulation of the Landau-Lifshitz Complex. Gen. Rel. and Grot/., 11, 233-243. Петров A.3. 1954. Труды Казанского Государственного университета, 114, вып.8, 55. Новые методы в общей теории относительности. (М.: Наука, 1966). Петров А.3. 1969. Einstein Spaces. (New York: Pergamon). PiraniF.A.E. 1965. Introduction to Gravitational Radiation Theory. In: Lectures on General Relativity. Ed.: S.Deser, K.W.Ford (Englewood Cliffs, NJ: Prentice-Hall). Pound R.V., RebkaG.A. 1960. Apparent Weight of Photons. Phys. Rev. Lett, 4, 337-341. Press W.H., TeukolskyS.A. 1973. Perturbations of a Rotating Black Hole. II. Dynamical Stability of the Kerr Metric. Astrophys. J., 185, 649-673. Price R.H. 1972. Nonspherical Perturbations of Relativistic Gravitational Collapse. I. Scalar and Gravitational Perturbations. II. Integer-Spin, Zero-Rest-Mass Fields. Phys. Rev. D, 5, 2419-2438; 2439-2454. Reasenberg R.D., Shapiro 1.1., MacNeilP.E. etal. 1979. Viking Relativity Experiment: Verification of Signal Retardation by Solar Gravity. Astrphys. J. Lett., 234, 219-221. ReedM., Simon B. Methods of Modern Mathematical Physics. — 1972. I. Functional Analysis. — 1979. III. Scattering Theory. (New York: Academic Press). ReesM.J. 1978. Emission from the Nuclei of Nearby Galaxies: Evidence for Massive Black Holes? In: Structure and Properties of Nearby Galaxies. Ed.: E.M.Berkhuijsen, R.Wielebinski (International Astronomical Union).
Литература 677 [244] ReggeT., Teitelboim С. 1974. Role of Surface Integrals in the Hamiltonian Formulation of General Relativity. Ann. Phys., 88, 286-318. [245] ReissnerH. 1916. Uber die Eigengravitation des elektrischen Felds nach der Einsteinshen Theorie. Ann. Physik., 59, 106-120. [246] ReulaO. 1982. Existence Theorem for Solutions of Witten's Equation and Nonnegativity of Total Mass. J. Math. Phys., 23, 810-814. [247] ReulaO., Tod P. 1984. Positivity of the Bondi Energy. J. Math. Phys., 25, 1004-1008. [248] RieszF., Sz-NagyB. 1955 Functional Analysys. (New York: Ungar). [249] Robinson D.C. 1975. Uniqueness of the Kerr Black Hole. Phys. Rev. Lett., 34, 905-906. [250] Robinson D.C. 1977. A Simple Proof of the Generalization of Israel's Theorem. Gen. Rel. and Grav., 8, 695-698. [251] RoydenH.L. 1963. Real Analysis. (New York: Macmillan). [252] RumpfH. 1976. Covariant Treatment of Particle Creation in Curved Space-Time. Phys. Lett., 61B, 272-274. [253] Ryan M.M.,Jr., ShepleyL.C. 1975. Homogeneous Relativistic Cosmologies. (Princeton: Princeton University Press). [254] Sachs R. К. 1962а. On the Characteristic Initial Value Problem in Gravitational Theory. J. Math. Phys., 3, 908-914. [255] Sachs R.K. 1962b. Gravitational Waves in General Relativity, VIII. Waves in Asymptotically Flat Space-Time. Proc. Roy. Soc. Lond. A, 270, 103-126. [256] Sachs R.K. 1962c. Asymptotic Symmetries in Gravitational Theory. Phys. Rev., 128, 2851-2864. [257] Sargent W.L.W., Young P. J., Boksenberg A., ShortridgeK., LyndsCR., Hartwick F.D.A. 1978. Dynamical Evidence for a Central Mass Concentration in the Galaxy M87. Astrophys. J., 221, 731-744. [258] Schmidt B.G. 1971. A New Definition of Singular Points in General Relativity. Gen. Rel. and Grav., 1, 269-280. [259] SchoenR., YauS.-T. 1979. Proof of the Positive-Action Conjecture in Quantum Relativity. Phys. Rev. Lett., 42, 547-548. [260] SchoenR., YauS.-T. 1981. Proof of the Positive Mass Theorem. II. Commun. Math. Phys., 79, 231-260. [261] SchoenR., YauS.-T. 1982. Proof That the Bondi Mass is Positive. Phys. Rev. Lett., 48, 369-371. [262] Schoen R., Yau S.-T. 1983. The Existence of a Black Hole due to Condensation of Matter. Commun. Math. Phys., 90, 575-579. [263] SchwarzschildK. 1916a. Uber das Gravitationsfeld eines Massenpunktes nach der Einsteinschen Theorie. Sitzber. Deut. Akad. Wiss. Berlin, Kl. Math.-Phus. Tech., 189-196. [264] SchwarzschildK. 1916b. Uber das Gravitationsfeld einer Kugel aus inkompressibler Flussigkeit nach der Einsteinschen Theorie. Sitzber. Deut. Akad. Wiss. Berlin, Kl. Math.-Phus. Tech., 424-434.
678 Литература [265] [266 [267 [268] [269] [270] [271 [272 [273] [274 [275] [276] [277] [278 [279 [280] [281 [282] [283] Sen A. 1982. Quantum Theory of Spin 3/2 Field in Einstein Spaces. Int. J. Theor. Phys., 21, 1-35. SewellG. 1982. Quantum Fields on Manifolds: PCT and Gravitationally Induced Thermal States. Ann. Phys., 141, 201-224. SmarrL. 1979. Gauge Conditions, Radiation Formulae and the Two Black Hole Collision. In: Sources of Gravitational Radiation. Ed.: L.Smarr (Cambridge: Cambridge University Press). SmootG.F., Gorenstein M.V., MullerR.A. 1977. Detection of Anisotropy in the Cosmic Blackbody Radiation. Phys. Rev. Lett., 39, 898-901. SorkinR.D. 1981. A Criterion on the Onset of Instability. Astrophys. J., 249, 254-257. Старовинский А.А. 1973. Усиление волн при отражении от вращающейся черной дыры. ЖЭТФ, 64, 48-57. SteenrodN. 1951. The Topology of Fibre Bundles. (Princeton: Princeton University Press). — Перев.: СтинродН. Топология косых произведений. (М.: ИЛ, 1953). SteigmanG. 1976. Observational Tets of Antimatter Cosmologies. Annual Review of Astronomy and Astrophysics, 14, 339-372. StelleK.S. 1977. Renormalization of Higher-Derivative Quantum Gravity. Phys. Rev. D, 16, 953-969. StreaterR.F., Wightman A.S. 1964. PCT, Spin and Statistics, and All That. (New York: Benjamin). SzekeresG. 1960. On the Singularities of a Riemannian Manifold. Publ. Mat. Debrecen, 7, 285-301. TamburinoL., WinicourJ. 1966. Gravitational Fields in Finite and Conformal Bondi Frames. Phys. Rev., 150, 1039-1053. Taub A.H. 1951. Empty Space-Times Admitting a Three-Parameter Group of Motions. Ann. Math., 53, 472-490. TaubesC.H., ParkerT. 1982. On Witten's Proof of the Positive Energy Theorem. Commun. Math. Phys., 84, 233-238. Taylor J.F., McCulloch P.M. 1980. Evidence for the Existence of Gravitational Radiation from Measurements of the Binary Pulsar PSR 1913+16. In: Ninth Texas Simposium on Relativistic Astrophysics. Ed.: J.Ehlers, J.J.Perry, M.Walker (New York: New York Academy of Sciences). Teitelboim C. 1972. Nonmeasurability of the Quantum Numbers of a Black Hole. Phys. Rev. D, 5, 2941-2954. TeukolskyS.A. 1972. Rotating Black Holes: Separable Wave Equations for Gravitational and Electromagnetic Perturbations. Phys. Rev. Lett., 29, 1114-1118. TeukolskyS.A., Press W.H. 1974. Perturbations of a Rotating Black Hole. III. Interaction of the Hole with Gravitational and Electromagnetic Radiation. Astrophys. J., 193, 443-461. Thirring H., Lense J. 1918. Uber den Einfluss der Eigenrotation der Zentralkorper auf die Bewegung der Planeten und Monde nach der Einsteinschen Gravitationstheorie. Phys. Z., 19, 156-163.
Литература 679 [284 [285] [286] [287 [288] [289] [290] [291 [292] [293] [294 [295 [296 [297 [298 [299 [300 [301 [302 [303 [304 ThorneK.S. 1978. General-Relativistic Astrophysics. In: Theoretical Principles in Astrophysics and Relativity. Ed.: N.R.Lebovitz, W.H.Reid, P.O.Vandervoort (Chicago: University of Chicago Press). Tomimatsu A., SatoH. 1972. New Exact Solution for the Gravitational Field of a Spinning Mass. Phys. Rev. Lett., 29, 1344-1345. Tomimatsu A., Sato H. 1973. New Series of Exact Solutions for Gravitational Fields of Spinning Masses. Prog. Theor. Phys. (Kyoto), 50, 95-110. Trautman A. 1965. Foundations and Current Problems of General Relativity. In: [237]. UnruhW.G. 1973. Separability of the Neutrino Equations in a Kerr Background. Phys. Rev. Lett., 31, 1265-1267. UnruhW.G. 1974. Second Quantization in the Kerr Metric. Phys. Rev. D, 10, 3194-3205. UnruhW.G. 1976. Notes on Black Hole Evaporation. Phys. Rev. D, 14, 870-892. UnruhW.G. 1977. Origin of the Particles in Black-Hole Evaporation. Phys. Rev. D, 15, 365-369. UnruhW.G., WaldR.M. 1982. Acceleration Radiation and the Generalized Second Law of Thermodynamics. Phys. Rev. D, 25, 942-958. UnruhW.G., WaldR.M. 1984. What Happens When an Accelerating Observer Detects a Rindler Particle. Phys. Rev. D, 29, 1047-1056. van NieuwenhuizenP. 1981. Supergravity. Phys. Rept., 68C, 189-398. VessotR.F.C, LevineM.W. 1979. A Test of the Equivalence Principle Using a Space-borne Clock. Gel. Rel. and Grav., 10, 181-204. VessotR.F.C, LevineM.W., MattisonE.M. et al. 1980. Test of Relativistic Gravitation with a Space-borne Hydrogen Maser. Phys. Rev. Lett., 45, 2081-2084. WaldR.M. 1972a. Electromagnetic Fields and Massive Bodies. Phys. Rev. D, 6, 1476-1479. WaldR.M. 1972b. Gravitational Spin Interaction. Phys. Rev. D, 6, 406-413. WaldR.M. 1973. On Perturbations of a Kerr Black Hole. J. Math. Phys., 14, 1453-1461. WaldR.M. 1974a. Gedanken Experiments to Destroy a Black Hole. Ann. Phys., 82, 548-556. WaldR.M. 1974b. Black Hole in a Uniform Magnetic Field. Phys. Rev. D, 10, 1680-1685. WaldR.M. 1974c. Energy Limits on the Penrose Process. Astrophys. J., 191, 231-233. WaldR.M. 1975. On Particle Creation by Black Holes. Commun. Math. Phys., 45, 9-34. WaldR.M. 1976. Stimulated Emission Effects in Particle Creation near Black Holes. Phys. Rev. D, 13, 3176-3182.
680 Литература [305] Wald R.M. 1977a. Space, Time and Gravity: The Theory of the Big Bang and Black Holes. (Chicago: University of Chicago Press). [306] WaldR.M. 1977b. The Black Reaction Effect in Particle Creation in Curved Spacetime. Commun. Math. Phys., 54, 1-19. [307] WaldR.M. 1978a. Construction of Solutions of Gravitational, Electromagnetic, or Other Perturbation Equations from Solutions of Decoupled Equations. Phys. Rev. Lett., 41, 203-206. [308] Wald R.M. 1978b. Trace Anomaly of a Conformally Invariant Quantum Field in Curved Spacetime. Phys. Rev. D, 17, 1477-1484. [309] WaldR.M. 1979a. Note on the Stability of the Schwarzschild Metric. J. Math. Phys., 20, 1056-1058; erratum, 21, 218 (1980). [310] WaldR.M. 1979b. Existence of the S-Matrix in Quantum Field Theory in Curved Spacetime. Ann. Phys., 118, 490-510. [311] WaldR.M. 1979c. On the Euclidean Approach to Quantum Field Theory in Curved Spacetime. Commun. Math. Phys., 70, 221-242. [312] WaldR.M. 1980. Quantum Gravity and Time Reversibility. Phys. Rev. D, 21, 2742-2755. [313] Walker R.M., Penrose R. 1970. On Quadratic First Integrals of the Geodesic Equations for Type [22] Spacetimes. Commun. Math. Phys., 18, 265-274. [314] WardR.S. 1981. The Twistor Approach to Differential Equations. In: [159]. [315] Warner F.W. 1971. Foundations of Differentiable Manifolds and Lie Groups. (Glenview, IL: Scott, Foresman and Co.). [316] Weinberg S. 1972. Gravitation and Cosmology. (New York: Wiley). — Перев.: ВейнвергС. Гравитация и космология. (М.: Мир, 1975). [317] Weinberg S. 1979. Ultraviolet Divergences in Quantum Theories of Gravitation. In: [148]. [318] WeylH., 1917. Zur Gravitationstheorie. Ann. Physik, 54, 117-145. [319] Wheeler J. A. 1968. Superspace and the Nature of Quantum Geometrodynamics. In: [224]. [320] WightmanA.S. 1971. Ed.: Troubles in the External Field Problem for Invariant Wave Equations (New York: Gordon & Breach). [321] WignerE.P. 1939. On Unitary Representations of the Inhomogeneous Lorentz Group. Ann. Math., 40, 149-204. [322] WignerE.P. 1981. Group Theory and Its Application to the Quantum Mechanics of Atomic Spectra. (New York: Academic Press). — Перев.: Вигнер Е. Теория групп и ее применение в квантовой механике. (М.: ИЛ, 1961). [323] Will СМ. 1981. Theory and Experiment in Gravitational Physics. (Cambridge: Cambridge University Press). — Перев.: Уилл К. Теория и эксперимент в гравитационной физике. (М.: Энергоатом издат, 1985). [324] WinicourJ. 1968. Some Total Invariants of Asymptotically Flat Space-Times. J. Math. Phys., 9, 861-867.
Литература 681 [325] Witten E. 1981. A New Proof of the Positive Energy Theorem. Commun. Math. Phys., 80, 381-402. [326] XanthopoulosB.C. 1981. Exterior Spacetimes for Rotating Stars. J. Math. Phys., 22, 1254-1259. [327] Yip P. 1983. Spinors in Two Dimensions. J. Math. Phys., 24, 1206-1212. [328] YodzisP., SeifertH.-J., Moller zum HagenH. 1973. On the Occurrence of Naked Singularities in General Relativity. Commun. Math. Phys., 34, 135-148. [329] YodzisP., SeifertH.-J., Moller zum HagenH. 1974. On the Occurrence of Naked Singularities in General Relativity. II. Commun. Math. Phys., 37, 29-40. [330] York J.W.,Jr. 1971. Gravitational Degrees of FYeedom and the Initial-Value Problem. Phys. Rev. Lett., 26, 1656-1658. [331] Young P. J., Westphal J.A., KristianJ., Wilson C.P., LandauerF.P. 1978. Evidence for a Supermassive Object in the Nucleus of the Galaxy M87 from SIT and CCD Area Photometry. Astrophys. J., 221, 721-730. [332] Зельдович Я.Б. 1972. Усиление цилиндрических электромагнитных волн, отраженных от вращающегося тела. ЖЭТФ, 62, 2076-2081. [333] ZipoyD. 1966. Topology of Some Spheroidal Metrics. J. Math. Phys., 7, 1137-1143.
Предметный указатель ADM (Arnowitt-Deser-Misner, [б]): определение полных энергии и импульса поля на гиперповерхности, 418 . Алгебраическая классификация пространства-времени, 259, 528 Антисимметризация тензоров, 54 Асимптотическая предсказуемость, 428 Аффинная параметризация, 76 BMS (Bondi-Metzner-Sachs) группа, 404 Барионов: производство в ранней Вселенной, 169 Бела-Робинсона тензор, 143 Белый карлик, 200 Бианки: классификация, 252; тождество, 73; связь тождества с инвариантностью относительно диффеоморфизма, 644 Биркгоффа теорема, 190 Боголюбова преобразование, 563; и обращение времени, 597 Большой взрыв, 156, 167 Вакуумное состояние, 559 Вейля: тензор, 524 Вектор, 38; дуальный, 45; сдвига, 364 Векторное поле, 42; касательное (тангенциальное), 42 Векторный потенциал, 108 Внешнее произведение, 47 Вселенной: возраст, 177; плотность вещества, 167 Гамильтонова формулировка: общей теории относительности, 656; поля Клейна-Гордона, 650; теорий поля, 649; электромагнитного поля, 657; Гаусса-Остроградского теорема, 106, 616 Гаусса-Кодацци соотношения, 368 Гелия синтез: в звездах, 202; в ранней Вселенной, 171; Геодезические: неполные, 308; пространства-времени Керра, 456-457; Гидростатического равновесия уравнение, 193; Толмана- Оппенгеймера-Волкова, 193 Гильберта: действие, 640; пространство, 554 Гиперповерхность, 327, 612 Гипотеза космической цензуры, 431-435 Главные: нулевые направления, 259, спиноры, 528 Гладкость: векторного поля, 42; тензорного поля, 49 Глобально гиперболичное пространство-время, 289 Глобальные инерциальные координаты, 25 Гомоморфизм, 487 Гомотопия, 487 Горизонт: внутренний,451-453; кажущийся, 443; событий, 429, 444; угловая скорость, 455, 470; поверхностная гравитация, 472-473 Гравитационное излучение: предел для столкновения черных дыр, 465 682
Предметный указатель 683 Гравитон, 585 Группа: универсальная накрывающая, 489; фундаментальная, 488 Давление вырожденных электронов, нейтронов, 198 Дейтерия синтез, 177 Дирака уравнение, 507 Диффеоморфизм, 37; и калибровочная свобода, 621 Дифференциальная форма, 54; дуальная, 141; дуального вращения, 141 Дыры черные, 426-480; определение, 426, 439; гипотеза космической цензуры, 431-435; детектирование, 437-438; извлечение энергии, 462-469; 479; горизонт событий, 428, 444; формирование, 435-438; основные свойства, 439-444; семейство Керра, 445-462; поверхностная гравитация, 472-473; термодинамика, 469-478; теоремы единственности, 459-461 Евклидово сечение, 548 Закон преобразования: векторов, 41; тензоров, 48; Замкнутая Вселенная, 150; аргументы за и против, 175 Заряженные керровские черные дыры, 445-462 Идеальная жидкость, 105 Изотропия Вселенной, 147 Индексные обозначения, 51 Интегральная кривая, 42 Интервал пространства-времени, 27 Инфляционный режим ранней вселенной, 169 Искривление светового луча, 215 Испарение черной дыры, 587 Казимира операторы, 505 Казнера решения, 258 Калибровка: лоренцева, 109; поперечная бесследовая, 267; радиационная, 129 Касательное (тангенциальное) векторное поле, 42 Квадрупольного излучения приближение, 138 Квантование: каноническое, 545; в пространстве-времени Риндлера, 590 Киллинга тензор, решения Керра, 457 Клейна-Гордона поле, 107 Клейна парадокс, 469 Ковариантный вектор, 48 Коммутатор, 43 Компоненты тензора, 47 Конгругенция, 311; ее растяжение, сдвиг, вращение, 312 Контравариантный вектор, 48 Конформный: вектор Киллинга, 629; тензор Вейля, 75 Координатные системы, 35; гармоническая, 371; гауссова нормальная (синхронная), 78 Координатный базис, 40 Космологическая постоянная, 155 Коши: горизонт, 291, 434, 453; поверхность, 289 Коши-Ковалевской теорема, 351 Красное смещение: космологическое, 160; гравитационное, 205 Красного смещения фактор, 162 Кривизна: внешняя, 328 Кристоффеля символ, 66 Круговые орбиты: Шварцшильда, 208; Керра, 456 Лагранжева формулировка: общей теории относительности, 641; поля Клейна-Гордона, 638; теорий поля, 638; электромагнитного поля, 639; Лебедь Х-1, 438 Левое действие (отображение), 509 Лензе-Тирринга эффект, 142 Ли: алгебра, 246; группа, 245; производная, 238 Локально невращающиеся наблюдатели, 455 Лоренца: преобразование, 26, 495; сила, 108
684 Предметный указатель Максвелла уравнения, 108, 508 Маргинальная ловушечная поверхность, 441 Масса: формула для черных дыр, 475-476 Матрица плотности, 573 Маха принцип, 455 Метрика, 49; пространства-времени плоского (Минковского), 28, 101; пространства-времени искривленного, 114 Минимальная подстановка, 114, 117 Многообразие: 34; вложенное (вложение), 612; гиперповерхность, 327; ориентируемое, 611; параллелезуемое, 514; погруженное (погружение), 612; с краем, 612; универсальное накрывающее, 488 Момент временной симметрии, 379 Начальные данные: условие связи для них в электродинамике, 361 Нейтронная звезда, 200 Неприводимая масса, 464-465 Несжимаемые жидкие звезды, 194 Несохранение барионного числа, 588 Нётер теорема, 645 Нормальная подгруппа, 520 Нулевая гиперповерхность, 109 Нулевой флаг, 498 Ньюмана-Пенроуза подход, 91, 525 Ньютонов предел, 125 Общая ковариантность, 98, 114 Однородность Вселенной, 147 Оператор: Казимира, 505; уничтожения/рождения, 560; энергии-импульса, 582 Орбита (точки многообразия), 510 Ориентация: времени, 102; многообразия, 611; пространства, 103 Открытая Вселенная, 151; аргументы за и против, 175 Палатини действие, 641 Параллельный перенос, 66 Паули спиновые матрицы, 497 Первичная черная дыра, 587 Перенормируемость квантовой теории поля, 540 Площади теорема: 445; для энтропии черной дыры, 593, предел извлечения энергии, 463-464; термодинамический аналог, 469, 477-478 Поверхность: Коши, 289; ловушечная, 340 Положительно частотное решение, 558 Прецессия эллиптических орбит, 212 Принцип наименьшего действия, 638 Представление, 487 Производная: ковариантная (оператор V), 61; ковариантная метрически совместимая, 68; Ли (оператор £)> 238; обычная (оператор д), 63
Предметный указатель 685 Пространство: комплексно сопряженное, 491; непродолжаемое, 309; постоянной кривизны, 149 Пространство-время: общее времениподобное условие на него, 324; общее нулевое условие на него, 330 Пуанкаре: группа, 486; группы представления, 505; лемма, 609 Пульсары, 202 Радиальная координата: изотропная, 230; Редже-Уилера черепашья, 225; Шварцшильда, 184 Разъединение вещества и излучения, 172 Райсснера-Нордстрёма решение, 231 Расслоение: ассоциированное, 513; главное, 510; касательное, 514; спинорное, 516 Расширение Вселенной, 154 Расширение пространства-времени: Керр, 446-454 Рекомбинация,172 Римана: тензор, 524 Риндлера пространство-время, 220 Рисса лемма, 555 Риччи: коэффициенты вращения, 87; тензор, 74, 524 Робертсона-Уокера модель, 152 S-матрица, 562 Свертка, 46 Сверхизлучающее рассеяние, 569 Сверхновая, 203 Связность: 67; линейная (простая), 488, 610; топологическая, 603 Связности 1-формы, 87 Сечение (для расслоений), 514 Сигнатура метрики, 50 Симметризация тензоров, 54 Соболева нормы, 355 Собственное время, 79 Событие, 23 Сохранение энергии, 106, 116, Специальная ковариантность, 484 Степени свободы: системы частиц, 349 Стокса теорема, 613, 616 Твистор, 550 Тензор, 45; кручения, 62; простой, 47; структурных констант, 246 Тензорное поле, 49 Тетрада, 87; нулевая комплексная, 527 Тетрадный метод: коммутационные соотношения, 89; уравнения структуры, 90 Увлечение инерциальной системы, 455 Угловой момент: частицы, 207 Ускорение: абсолютное, 115; относительное, 131 Уравнение: нейтрино, 507; гиперболическое, 357; система квазилинейных гиперболических уравнений, 359 Фактор-группа, 520 Фейнмана пропагатор, 567; температурный, 581 Функция шага, 364 Хаббла: постоянная, закон, 155 Хартла-Хокинга вакуум, 582 Хокинга излучение (эмиссия частиц), 574, 578 Цорна лемма, 376 Частицы в квантовой теории, 589 4-импульс (четырехвектор энергии-импульса) 104 4-скорость (четыреяскорость) 104 Шварцшильда: радиальная координата, 184; радиус, 189; решение, 189; черная дыра, 227 Эддингтона-Финкельштейна координаты, 225 Эйнштейна тензор, 75 Эйнштейна уравнение, 120; линеаризованное, 123 Эквивалентности принцип, 29 Электромагнитное поле, 107 Энергетические условия: сильные, 313; слабые, 313; энергодоминантности, 314 Энергии-импульса тензор: 105; канонический, 645; оператор, 582 Энергия: частицы, 104; связи
686 Предметный указатель сферической звезды, 192; извлечение из черных дыр, 462-469; 479 Эргосфера, 454; 454; 460-461 Эффект: детектирования при ускорении, 591 Якоби: поле, 320; тождество, 55, 246 LMC Х-3, 438 М87, 438
Список иллюстраций 1.1 Диаграмма показывает причинную структуру пространства-времени в дорелятивистской физике. Для заданного события р все остальные события в пространстве-времени являются либо будущим по отношению к р, либо прошлым р, либо одновременным с р событиями. Одновременные события формируют трехмерную поверхность в пространстве-времени 24 1.2 Диаграмма показывает причинную структуру пространства-времени в специальной теории относительности. Теперь "световой конус" р, а не "поверхность одновременности" с р играет главную роль в определении причинных отношений р с другими событиями 25 1.3 Пространственно-временная диаграмма иллюстрирует тот факт, что в специальной теории относительности определение одновременности с событием р различно для инерциальных наблюдателей О и О' . . . 26 2.1 Иллюстрация отображения tppoipa , возникающего при пересечении двух координатных систем 35 2.2 Касательная плоскость к сфере в точке р в R3 38 2.3 Диаграмма, иллюстрирующая определение производных по направлению Хц в доказательстве теоремы 2.2.1 40 3.1 Параллельный перенос вектора va вдоль замкнутой кривой на плоскости. Вектор va всегда "возвращается", показывая то же самое направление, что и первоначально 59 3.2 Параллельный перенос вектора va вдоль замкнутой кривой на сфере. В данном случае замкнутая кривая состоит из трех взаимно ортогональных сегментов больших кругов. Вектор va при этом возвращается повернутым на 90° 60 3.3 Параллельный перенос вектора va вдоль малой замкнутой петли. Как показано в тексте, изменение va с точностью до второго порядка по At и As определяется тензором Римана в точке р 70 3.4 Построение нормальных гауссовых координат с началом на гиперповерхности S. Геодезические, ортогональные к 5, в конце концов могут пересечься, но до этого пересечения нормальные гауссовы координаты корректно определены, и поверхности St постоянного времени t остаются ортогональными к геодезическим линиям 78 3.5 Однопараметрическое семейство геодезических 7s с касательной Та и вектором девиации Ха 83 4.1 Пространственно-временная диаграмма, показывающая плотность тока массы-энергии Ja в объем V пространства-времени 107 4.2 Пространственно-подобная гиперплоскость Е. Полная энергия, содержащаяся в гравитационном излучении, получена интегрированием too по Е 137 4.3 Асимптотически нулевые гиперповерхности Ei и Ег- Гравитационное излучение "регистрируется" на Ei, но не "регистрируется" на Ег- Энергия АЕ, унесенная на бесконечность гравитационным излучением, определяется интегралом по времениподобной гиперповерхности S 138 5.1 Гиперповерхности пространственной однородности в пространстве- времени. По определению однородности, для каждого t и каждой пары р, q Е Е* существует изометрия пространства-времени, которая переводит р в q 147
688 Список иллюстраций 5.2 Мировые линии изотропных наблюдателей в пространстве-времени. По определению изотропии, для любых двух векторов sj и s£, °Р~ тогональных к иа в точке р, существует изометрия пространства- времени, которая оставляет р и иа в р неизменными, но поворачивает s? в sg 148 5.3 Динамика Вселенной Робертсона-Уокера, заполненной пылью .... 159 5.4 Динамика Вселенной Робертсона-Уокера, заполненной излучением . 159 5.5 Пространственно-временная диаграмма, показывающая испускание светового сигнала как событие Pi и его получение как событие Ръ . 161 5.6 Структура причинности решений Робертсона-Уокера вблизи сингулярности большого взрыва. Горизонт частиц существует, так как наблюдатель не может "видеть" всех остальных изотропных наблюдателей во Вселенной 164 6.1 Равновесные конфигурации холодного вещества. При данном уравнении состояния Р = Р(р) равновесная конфигурация однозначно определяется значением центральной плотности рс. Массы и радиусы таких конфигураций показаны здесь в диапазоне от ~ 105 г-см~3 в точке А до ~ 1017 г-см~3 за точкой D. В режиме белого карлика значения М и R зависят частично от того, какой состав звезды принять. В режиме нейтронной звезды значения М и R сильно зависят от того, какое принять состояние вещества, и каковы взаимодействия между элементарными частицами, составляющими звезду. Для последнего режима рисунок дает лишь грубый набросок качественных свойств, найденных для некоторых уравнений состояния 199 6.2 Пространственно-временная диаграмма посылки светового сигнала статического наблюдателя 0\ статическому наблюдателю Ог .... 205 6.3 Эффективный потенциал V на времениподобных геодезических в случае L2 = 6М2 209 6.4 Эффективный потенциал на времениподобных геодезических в случае L2 = 24М2. Обратите внимание, что масштаб V значительно увеличен по сравнению с рис. 6.3 210 6.5 Эффективный потенциал V для нулевых геодезических 213 6.6 Схема эффекта отклонения светового луча 214 6.7 Схема эффекта временной задержки сигнала локатора 217 6.8 Пространство-время Риндлера, представленное как "клин" I двумерного пространства-времени Минковского 223 6.9 Расширение Крускала пространства-времени Шварцшильда 226 6.10 Пространственная геометрия гиперповерхности t = 0 пространства- времени Шварцшильда, показанная так, как она выглядела бы, если была бы погружена в плоское пространство. (Одно измерение скрыто, т.е. топология гиперповерхности RxS2, а не RxS. Так что каждая окружность, такая какая показана для г = 2М, в действительности представляет собой двумерную сферу.) Часть поверхности, расположенная на рисунке выше "горловины" при г = 2М, соответствует части, расположенной в области I рис. 6.9; часть ниже г = 2М расположена в области IV рис. 6.9 228 6.11 Пространство-время, возникающее при полном гравитационном коллапсе сферического тела. Области III и IV расширенного пространства-времени Шварцшильда полностью "покрыты" коллапсирующим веществом. Однако создается (часть) области II черной дыры .... 229
Список иллюстраций 689 6.12 Другое представление пространства-времени рис. 6.11. Здесь восстановлена одна из двух скрытых размерностей, так что каждая из окружностей на коллапсирующем теле соответствует двумерной поверхности тела в фиксированный момент времени. Однако световые конусы уже не представляются линиями под углом в 45°. Действительно, пространственноподобная природа сингулярности и неотвратимый захват сингулярностью любой частицы или луча света в области г < 2М здесь иллюстрируется "откреплением" светового конуса будущего в области сильного поля 230 8.1 Неориентируемое во времени пространство-время 273 8.2 Пространство Минковского с удаленной точкой на световом конусе будущего точки р. В этом пространстве-времени не существует причинной кривой, соединяющей ри </, и поэтому q 0 »/+(р), но q € J+(p). Таким образом, J+(p) не замкнуто 275 8.3 Пространственно-временная диаграмма, показывающая множество S и его границу в будущем /+(5) в теореме 8.1.3 277 8.4 Пространственно-временная диаграмма, показывающая последовательность точек в /+(С), сходящуюся к р € 1+(С) в теореме 8.1.6 . . 280 8.5 Пространственно-временная диаграмма двумерного плоского пространства-времени с топологией R x 51. Нулевая геодезическая /+(р) имеет будущую конечную точку q 281 8.6 Пространство-время Минковского с отождествленными гиперповерхностями t = 0 и t = 1. Показана замкнутая времениподобная кривая, проходящая через точку р 282 8.7 Пространство-время с топологией R4, в котором световые конусы "опрокидываются" настолько, чтобы могли существовать замкнутые времениподобные кривые 283 8.8 Пространство-время, нарушающее сильную причинность. Световые конусы "опрокидываются" настолько, чтобы кривая, проходящая через р, стала нулевой геодезической (которая, однако, не является замкнутой кривой, поскольку из многообразия удалена одна точка). В этом пространстве-времени не существует замкнутых причинных кривых, но все же существуют причинные кривые, проходящие через р, которые проходят "бесконечно близко" к самим себе 283 8.9 Окрестность V точки р, использованная в доказательстве следствия теоремы 8.2.2 287 8.10 Пространственно-временная диаграмма, иллюстрирующая определение края замкнутого ахронального множества S 288 8.11 Пространственно-временная диаграмма, показывающая область зависимости в будущем D+(S) и горизонт Коши H+(S) замкнутого ахронального множества S в пространстве-времени Минковского с удаленной точкой 288 8.12 Пространственно-временная диаграмма, показывающая D+(S) и #+(5) замкнутого ахронального множества S в пространстве-времени Минковского. Здесь S является "асимптотически нулевым" справа и "точно нулевым" слева. Этот пример показывает, что H+(S) может пересекать 5, даже если edge(S) = 0 289 8.13 Точка р £ H+(S) П I+(S) с последовательностью точек qn € J+(p), сходящейся к р в теореме 8.3.5 293 8.14 Последовательность {Ап} причинных кривых из р в q в случае, когда р, q e £>"(£) в теореме 8.3.9 297
690 Список иллюстраций 9.1 Пространственно-временная диаграмма пространства-времени (R4,ga6), конформного пространству-времени Минковского (К4,»7аб)> т.е. gab = П2т)аь (см. прилож. D). Конформный фактор Q выбираем сферически симметричным и ft = 1 при г > 1. Из сферической симметрии ft следует, что кривая г = 0 является времениподобной геодезической пространства с метрикой gab. Если выбрать ft таким образом, что ft(r = 0, t) —► 0 достаточно быстро при t —► со, то эта времениподобная геодезическая будет неполной. Однако все про- странственноподобные и нулевые геодезические просто "проходят через" мировую трубку ненулевой кривизны и поэтому полны 309 9.2 Пространственно-временная диаграмма, иллюстрирующая понятие сопряженных точек вдоль геодезической 7 320 9.3 Пространственно-временная диаграмма иллюстрирует, что если геодезическая 7» соединяющая точки р и д, имеет точку г, сопряженную к р и лежащую между р и д, то соседняя времениподобная кривая 77> соединяющая р и q, может быть сконструирована так, что она имеет б'ольшее собственное время, чем 7 (см. теорему 9.3.3) 327 9.4 Пространственно-временная диаграмма, показывающая точку р с Е вдоль геодезической 7« (Две изображенные геодезические предполагаются "инфинитезимально близкими") 329 9.5 Гладкая времениподобная кривая ц от р до q. Бесконечно близко к /х в топологии С(р, q) находится гладкая времениподобная кривая \х' с бесконечно малым собственным временем 334 9.6 Пространственно-временная диаграмма, показывающая конструкцию, использованную в доказательстве теоремы 9.5.2 341 10.1 Пространственно-временная диаграмма, показывающая область /f, по которой для получения (10.1.10) интегрируется (10.1.9) 354 10.2 Пространственно-временная диаграмма, иллюстрирующая определение функции шага N и вектор сдвига Na 365 10.3 Пространственно-временная диаграмма, иллюстрирующая понятие внешней кривизны гиперповерхности Е. Пунктирная стрелка в точке р изображает параллельный перенос нормального вектора па в q вдоль геодезической, соединяющей q с р. Несовпадение этого вектора с па в р интуитивно соответствует изгибанию Е в пространстве- времени, в которое оно вложено. Формула Каъ = hacVc^b показывает, что Каъ непосредственно измеряет это несовпадение 366 11.1 Пространственно-временная диаграмма статической Вселенной Эйнштейна. Как описано в тексте, пространство-время Минковского конформно изометрично области О = /+(i~)n/~(i+) этого пространства- времени. Граница О, состоящая из точек г~, г+, и г° и нулевых гиперповерхностей J~ и »7+, определяет точное понятие "бесконечности" пространства-времени Минковского 390 11.2 Область О статической Вселенной Эйнштейна представляется в виде двух нулевых конусов, соединенных основаниями. Это представление О обманчиво, поскольку г° изображается 2-сферой вместо точки, но часто гораздо более удобно использовать такую диаграмму, чем рис. 11.1 392 12.1 Конформная диаграмма такого же пространства-времени, как показано на рис. 6.11 и 6.12. Из этой конформной диаграммы ясно, что область II физического пространства-времени лежит вне J~(J*). Напротив, на рис. 11.1 J~(J*) включает в себя все физическое пространство-время 427
Список иллюстраций 691 12.2 Другое представление замыкания М физического пространства-времени, изображенного на рис. 12.1. Как и на рис. 12.1, на этой диаграмме угловые измерения, сжатые в каждой точке этой диаграммы (кроме тех, где г = 0 и точки г°), представляют собой 2-сферы . . . 428 12.3 Конформная диаграмма расширенного пространства-времени Шварц- шильда (см. рис. 6.9), представленная таким же способом, как и на рис. 12.2. Заметим, что поскольку расширенное пространство-время имеет две асимптотически различимые плоские области, то показаны две различные конформные границы 451 12.4 Конформная диаграмма расширенного заряженного пространства- времени Керра в случае а ф 0, а2 + е2 < М2 452 12.5 Конформная диаграмма пространства-времени, в котором заряженная сферическая оболочка с М > М > \е\ подвергается гравитационному коллапсу. Пунктирные линии отмечают расширенное пространство-время Райсснера - Нордстрема 453 12.6 Набросок, показывающий (а) "вид сбоку" и (Ь) "вид сверху" на эр- госферу черной дыры Керра 455 12.7 Диаграмма, иллюстрирующая процесс Пенроуза извлечения энергии из керровской черной дыры 463 12.8 Пространственно-временная диаграмма, показывающая область /С, по которой интегрируется VaJa = 0 для того, чтобы получить вывод, касающийся суперрадиационного излучения. Здесь пространственно- подобная гиперповерхность Ег получается "трансляцией по времени" поверхности Ei на время At, и времениподобная гиперповерхность S представляет собой "большую сферу" на бесконечности. Интеграл от Jana no S представляет собой поток энергии вне К на бесконечность (т.е. выходящая минус входящая энергии) в течение времени At, в то время, как интеграл от Jana по горизонту представляет собой поток энергии в черную дыру. (Показаны подходящие направления па на каждой части границы.) Однако для волны с временной зависимостью t~tu)t интегралы по Ei и Ег сокращаются вследствие трансляционной симметрии по времени. Следовательно, интеграл от Jana no S равен минус интеграл от Jana по горизонту 467 13.1 Диаграмма, иллюстрирующая, каким образом вращение сферы на угол 47г вокруг данной оси можно привести непрерывной деформацией к вращению на нулевой угол. 47г-вращение мы представляем в виде двух последовательных 27г-вращений. Непрерывно изменяем ось второго из них до совпадения с осью, противоположной оси первого вращения так, как это изображено в последовательности (a)-(d). Затем непрерывно уменьшаем угол обоих вращений до нуля, как показано на последовательности (d)-(f) 490 13.2 Диаграмма, иллюстрирующая структуру главного расслоения (см. текст) 510 13.3 (а) Тривиальное главное расслоение Z<i х S1. (Ь) Главное расслоение (51,Z2,51,</>), построенное в тексте 511 14.1 Пространственно-временная диаграмма пространства-времени (R4,ga6), которое изометрично пространству-времени Минковского (R4,T7ab) вне компактной области К 561
692 Список иллюстраций 14.2 Конформная диаграмма расширенного пространства-времени Швар- цшильда (см. рис. 12.3), демонстрирующая осцилляции волны частоты о>, т.е. £$ф = —иоф. Видимое увеличение частоты осцилляции, показанное на с/""1" на поздних запаздывающих временах (которое также происходит на с/+ на ранних запаздывающих временах, а также на/" на поздних и ранних опережающих временах) искусственным образом возникает на конформной диаграмме и вызвано в данном случае поведением конформного фактора. Однако увеличение частоты, показанное на горизонте белой дыры вблизи точки его пересечения с горизонтом черной дыры, представляет физическую сингулярность "бесконечного фиолетового смещения" волны 575 14.3 Конформная диаграмма сферически-симметричного пространства- времени, в котором происходит гравитационный коллапс к шварц- шильдовской черной дыре. Диаграмма изображает осцилляции волны, которая ведет себя как e~tu,t на ^+. При распространении этой волны назад в прошлое от J+ часть волны, которая распространяется сквозь коллапсирующую материю, будет создавать сингулярность "бесконечного фиолетового смещения" (по существу точно так же, как показано на горизонте белой дыры рис. 14.2) при значении опережающего времени ио на /" 577 14.4 Конформная диаграмма пространства-времени, в котором черная дыра образовалась благодаря коллапсу материи и "испаряется" в результате процесса рождения частиц 588
Список таблиц 5.1 Космологии Робертсона-Уокера при заполнении пылью и излучением 158 7.1 Алгебраическая классификация пространств 260 12.1 Черные дыры и термодинамика 477 F.1 Переводные множители для геометризованных единиц 663
Роберт М. Уолд Общая теория относительности Научный редактор А.П. Ефремов Технический редактор КА. Ясько Корректор Е.А. Постникова Компьютерная верстка Н.Р. Хуснутдинов Дизайн обложки М.В. Шатихина
Подписано в печать 4 J08 D8 г .Формат 60x84 Д6 .Печать офсетная. Уел .печ .л. 40Д6. Тираж 400 экз. Заказ 794 Российский университет дружбы народов 117923, ГСП -1, г. Москва, ул. Орджоникидзе, д. 3 Типография РУДН 117923, ГСП-1, г .Москва,ул .Орджоникидзе, д. 3 ,тел. 952-04-41