Автор: Дирак П.А.М.  

Теги: физика  

ISBN: 5-93972-026-9

Год: 2001

Текст
                    П. А. М. Дирак
ЛЕКЦИИ ПО
ТЕОРЕТИЧЕСКОЙ ФИЗИКЕ
Научно-издательский центр
«Регулярная и хаотическая динамика»
2001


УДК 530 Интернет-магазин http://rcd.ru/shop Интересующие Вас книги, выпускаемые нашим издательством, дешев- ле и быстрее всего приобрести через наш интернет-магазин. Регистрация в магазине позволит вам • подписаться на регулярную рассылку сообщений о книгах; • самое быстрое приобретение новых книг до поступления их в магазин; • индивидуальный подход к каждому заказчику. Внимание! Зарубежных авторов (в т. ч. из стран СНГ) просим направлять свои заказы по адресу subscribe@uni.udm.ru Дирак П. A.M. Лекции по теоретической физике. — Ижевск: НИЦ «Регулярная и хао- тическая динамика», 2001, 240 стр. В первой части книги содержатся лекции Дирака, в которых разрабо- тан вопрос о квантовании систем со связями и обобщением гамильтоновой механики на случай вырожденных гамильтонианов. Во второй части пред- ставлены лекции по теории относительности. Приведено также две работы Дирака по этому вопросу и нобелевская лекция. В приложении содержится современный анализ теории Дирака и ее роли в геометрии и гамильтоновой механике. Лекции рассчитаны на физиков-теоретиков, аспирантов и студентов физико-математических специальностей. ISBN 5-93972-026-9 © НИЦ «Регулярная и хаотическая динамика», 2001 http://rcd.ru
Содержание От редакции 6 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ 7 Глава 1. Метод Гамильтона 7 Глава 2. Проблема квантования 26 Глава 3. Квантование на искривленных поверхностях . . 42 Глава 4. Квантование на плоских поверхностях 59 Обобщенная гамильтонова динамика (Can. J. Math., 1950) 76 1. Введение 76 2. Сильные и слабые уравнения 77 3. Гамильтониан 79 4. Уравнения движения 81 5. Однородность по скоростям 83 6. Условия самосогласованности 85 7. Дополнительные условия 88 8. Преобразования гамильтоновой формы 89 9. Гамильтониан как исходное понятие 92 10. Приложение к релятивистской динамике 97 11. Квантование 98 12. Приложение 101 Обобщенная гамильтонова динамика (Proc. Royal Soc, 1958) 103 1. (^-уравнения 103 2- Х"УРавнения Ю6 3. Условие принадлежности первому роду 108 4. Редукция числа степеней свободы 109
4 Содержание ОБЩАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ 112 Предисловие редактора перевода 112 Предисловие автора 113 1. Специальная теория относительности 114 2. Неортогональные декартовы координаты 116 3. Криволинейные координаты 119 4. Нетензорные величины 121 5. Искривленное пространство 122 6. Параллельный перенос 123 7. Символы Кристоффеля 126 8. Геодезические 128 9. Свойство стационарности геодезических 129 10. Ковариантное дифференцирование 131 11. Тензор кривизны 134 12. Критерии плоского пространства 135 13. Тождества Бианки 137 14. Тензор Риччи 138 15. Эйнштейновский закон гравитации 139 16. Ньютоново приближение 140 17. Гравитационное красное смещение 143 18. Решение Шварцшильда 144 19. Черные дыры 146 20. Тензорные плотности 150 21. Теоремы Гаусса и Стокса 152 22. Гармонические координаты 155 23. Электромагнитное поле 156 24. Модификация уравнений Эйнштейна в присутствии ма- терии 158 25. Тензор энергии-импульса материи 159 26. Вариационный принцип для гравитации 163 27. Действие для непрерывно распределенной материи .... 165 28. Действие для электромагнитного поля 169 29. Действие для заряженной материи 170 30. Вариационный принцип в общем случае 173 31. Псевдотензор энергии-импульса гравитационного поля . 176 32. Явное выражение для псевдотензора 178 33. Гравитационные волны 178
Содержание 5 34. Поляризация гравитационных волн 181 35. Космологический член 182 ТЕОРИЯ ЭЛЕКТРОНОВ И ПОЗИТРОНОВ 184 А.В.Борисов, И. С. Мамаев. СКОБКИ ДИРАКА В ГЕО- МЕТРИИ И МЕХАНИКЕ 191
От редакции Предлагаемая книга одного из самых значительных физиков- теоретиков этого столетия Поля Дирака A902-1984) состоит из двух частей. Первая часть содержит четыре лекции по квантовой механике, прочитанные в Иешивском университете, а также две его работы, по- священные обобщению гамильтонова формализма на случай вырожден- ного по скоростям лагранжиана. Вопросы, разобранные как в лекциях, так и в статьях, обычно остаются за пределами традиционных курсов квантовой механики, переживающей в последнее время новый подъем. Он обусловлен в первую очередь глубоким проникновением в матема- тический аппарат квантовой механики методов теории динамических систем, алгебры и топологии. На этом пути в последнее время возникли новые дисциплины: квантовые группы, теория инвариантов Зейберга- Виттена и др. Всплеск интереса к квантовой механике обусловлен также разра- боткой восходящей к Ричарду Фейнману идеи о квантовых вычисле- ниях и квантовом компьютере. Интенсивные теоретические и экспери- ментальные работы в этом направлении ведутся параллельно физика- ми, математиками и инженерами. Вторая часть содержит компактное изложение классических во- просов общей теории относительности. Можно рассчитывать, что предлагаемая книга Дирака будет полез- на широкому кругу читателей. Многие общие теоретические вопросы в работах Дирака лишь намечены — на них мы остановились в приложе- нии, посвященном развитию идей Дирака в геометрии и механики. Мы надеемся, что приложение способно частично восполнить непонимание, вызванное чрезвычайной сжатостью и насыщенностью оригинального текста великого физика.
ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ* Глава 1 Метод Гамильтона Я чрезвычайно рад тому, что нахожусь здесь, в Иешивском уни- верситете, и имею возможность рассказать вам о некоторых математи- ческих методах, развиваемых мною в течение ряда лет. Прежде всего я хотел бы в нескольких словах описать общее направление этих мето- дов. В атомной теории мы имеем дело с различными полями. Здесь есть ряд очень хорошо известных полей, таких, как электромагнитное и гравитационное; однако в последнее время мы сталкиваемся также с рядом иных полей, поскольку, согласно общим идеям де Бройля и Шредингера, каждой частице сопоставляется волна и эти волны мож- но рассматривать как поле. Таким образом, в атомной физике перед нами стоит задача построить теорию, описывающую различные поля, взаимодействующие друг с другом. Она должна находиться в согласии с принципами квантовой механики, однако создать такую теорию — весьма нелегкая задача. Можно получить значительно более простую теорию, если перейти к соответствующей классической механике, которая представляет со- бой частный случай квантовой механики при стремлении постоянной Планка h к нулю. Наглядно показать, как строится теория, намного легче в терминах классической механики. Поэтому то, о чем я буду говорить в этих лекциях, будет в основном относиться к классической механике. Перевод с английского А. Г. Миронова по редакцией акад. В. А. Фока.
8 Лекции по квантовой механике Вы можете подумать, что такой способ на самом деле не очень хорош, ибо классическая механика недостаточно пригодна для описа- ния Природы. Природа описывается квантовой механикой. Зачем же нужно тогда обращаться к классической механике? Дело в том, что квантовые теории поля, как я уже сказал, весьма сложны, и до сих пор оказалось возможным построить квантовые теории лишь для полей довольно простого типа с простыми взаимодействиями между ними. Вполне вероятно, что эти простые поля с простыми взаимодействиями между ними не дают адекватного описания Природы. Успехи кванто- вых теорий поля довольно ограничены. Мы непрерывно сталкиваемся с трудностями и хотели бы расширить общие рамки подхода, что поз- волит рассматривать поля более общего типа. Например, мы хотели бы учесть возможность того, что уравнения Максвелла будут не всегда справедливыми. Вполне вероятно, что при переходе к областям в непо- средственной близости от зарядов, создающих поля, необходимо будет модифицировать теорию Максвелла так, чтобы она стала нелинейной электродинамикой. Это только один пример обобщений, которые по- лезно рассмотреть в нашем теперешнем состоянии незнания основных идей, основных сил и основного характера полей атомной теории. Чтобы можно было приступить к этой задаче, т. е. рассмотреть более общие поля, необходимо перейти к классической теории. Далее, если нам удастся придать классической теории гамильтонову форму, то мы всегда сможем, применив некоторые стандартные правила, по- лучить первое приближение квантовой теории. Мои лекции в основном будут посвящены задаче преобразования общей классической теории к гамильтоновой форме. Сделав это, мы вступили на путь получения последовательной квантовой теории. Во всяком случае, мы будем иметь первое приближение. Конечно, настоящую работу следует рассматривать только как предварительный этап. Окончательным результатом этого этапа долж- но быть построение последовательной квантовой теории, однако на пу- ти к этой цели встречаются весьма серьезные трудности, трудности фундаментального характера, над преодолением которых люди муча- ются немало лет. Трудности перехода от гамильтоновой классической механики к квантовой механике настолько подавляют некоторых, что они начинают думать: а может быть, и весь метод, основанный на клас- сической теории Гамильтона, является неудовлетворительным? Осо- бенно в последние несколько лет предпринимались попытки развить
Глава 1. Метод Гамильтона 9 иные методы построения квантовых теорий поля. На этом пути был достигнут вполне ощутимый прогресс. Был получен ряд условий, ко- торые должны удовлетворяться. Однако эти альтернативные методы, хотя и позволили значительно продвинуться в объяснении эксперимен- тальных результатов, едва ли приведут к окончательному решению проблемы. Мне кажется, что при таких подходах всегда будет теряться нечто такое, что можно получить только при использовании гамильто- ниана или, возможно, некоторого обобщения понятия гамильтониана. Поэтому я придерживаюсь той точки зрения, что гамильтониан дейст- вительно очень существенен для квантовой теории. В самом деле, без использования гамильтоновых методов нельзя решить некоторые из простейших задач квантовой теории, например получить формулу Бальмера для водорода, самый первый из резуль- татов квантовой механики. Следовательно, гамильтониан появляется в теории при самых элементарных подходах, и мне кажется, что и по существу очень важно исходить из гамильтониана; поэтому я хочу рас- сказать вам о том, насколько далеко можно развить гамильтоновы ме- тоды. Мне хотелось бы начать с элементарного подхода, и в качестве от- правной точки я возьму принцип действия. Именно, я полагаю, что существует интеграл действия, зависящий от вида движения системы, такой, что из условия его стационарности при изменении движения мы получаем уравнения движения. Метод, исходящий из принципа дей- ствия, обладает одним большим преимуществом: он позволяет легко согласовать теорию с принципом относительности. Необходимо, что- бы наша атомная теория была релятивистской, ибо в общем случае мы имеем дело с частицами, движущимися с большими скоростями. Если мы хотим ввести в рассмотрение гравитационное поле, то мы должны согласовать нашу теорию с общим принципом относительнос- ти, а это означает, что нам придется работать с искривленным про- странством-временем. Однако гравитационное поле не очень сущест- венно в атомной физике, так как гравитационные силы чрезвычайно слабы по сравнению с другими силами, действующими в атомных про- цессах, и для практических целей можно пренебречь гравитационным полем. Вопрос о введении гравитационного поля в квантовую теорию был исследован до некоторой степени в последние годы, и я думаю, что основным стимулом этой работы была надежда, что учет его может по- мочь преодолеть некоторые трудности. Насколько можно судить в на-
10 Лекции по квантовой механике стоящее время, эта надежда не оправдалась, и введение гравитационно- го поля, по-видимому, скорее добавляет осложнения, нежели устраняет их. Таким образом, введение гравитационных полей в атомную тео- рию не дает особых преимуществ. Однако методы, которые я намерен описать, являются мощными математическими методами, пригодными независимо от того, учитывается гравитационное поле или нет. Начнем с интеграла действия, который я обозначу /= [ Ldt. = I Ldt. A.1) Он выражен в виде интеграла по времени, причем подынтегральное выражение L представляет собой лагранжиан. Таким образом, вмес- те с принципом действия мы имеем лагранжиан1. Теперь нужно выяс- нить, как перейти от лагранжиана к гамильтониану. Когда мы получим гамильтониан, мы сделаем первый шаг на пути к построению кванто- вой теории. Вы могли бы задать следующий вопрос: а нельзя ли взять в качест- ве исходной величины гамильтониан и тем самым сократить работу, связанную с получением из интеграла действия, взятого в качестве отправного пункта, лагранжиана и с переходом от лагранжиана к га- мильтониану? При попытке провести такое сокращение наталкиваются на трудность — оказывается, совсем нелегко сформулировать в тер- минах гамильтониана условия, при которых теория является реляти- вистской. С помощью интеграла действия эти условия сформулировать очень легко: нужно просто потребовать, чтобы интеграл действия был релятивистски инвариантен. Нетрудно привести сколько угодно приме- ров интегралов действия, релятивистски инвариантных. Все они авто- матически приведут к уравнениям движения, согласующимся с требо- ваниями теории относительности, и поэтому любой вывод, основанный на таком интеграле действия, будет также находиться в согласии с те- орией относительности. Получив гамильтониан, мы можем применить стандартный метод и найти первое приближение квантовой теории; если нам повезет, то, возможно, мы окажемся в состоянии продвинуться дальше и постро- 1Английский термин «Lagrangian» на русский язык часто переводят как «функ- ция Лагранжа». Слово «лагранжиан» означает в этом случае пространственную плот- ность функции Лагранжа. Поскольку в этих лекциях последняя не встречается, мы сочли возможным перевести «Lagrangian» как «лагранжиан». (Прим. ред.).
Глава 1. Метод Гамильтона 11 ить строгую квантовую теорию. Вы снова могли бы спросить: нельзя ли до некоторой степени сократить эту работу? Может быть, можно пе- рейти прямо от лагранжиана к квантовой теории и вовсе обойтись без гамильтониана? Что ж, в некоторых простых случаях это можно сде- лать. Для некоторых простых типов полей, рассматриваемых в физике, лагранжиан квадратичен по скоростям и подобен лагранжиану, исполь- зуемому в нерелятивистской динамике частиц. Применительно к таким ситуациям, когда лагранжиан квадратичен по скоростям, разработаны некоторые методы непосредственного перехода от лагранжиана к кван- товой теории. Однако это ограничение случаем только квадратичных по скоростям лагранжианов является чрезвычайно жестким. Я хочу из- бежать этого ограничения и работать с лагранжианом, который может быть совершенно произвольной функцией скоростей. Чтобы получить общий формализм, который будет применим, например, к нелинейной электродинамике, упомянутой мною выше, по моему мнению, нельзя никоим образом сократить процедуру, связанную с получением из ин- теграла действия, взятого в качестве исходной величины, лагранжиана, с переходом от лагранжиана к гамильтониану и затем с переходом от гамильтониана к квантовой теории. Это и есть та процедура, которую я хочу обсудить в настоящем курсе лекций. Чтобы выразить все наиболее простым образом, я хотел бы начать с динамической теории систем, имеющих только конечное число сте- пеней свободы и подобных тем, с которыми вы знакомы из динамики частиц. После этого переход от системы с конечным числом степеней свободы к системе с бесконечным числом степеней свободы (что нам нужно для теории поля) есть уже чисто формальная задача. Рассматривая систему с конечным числом степеней свободы, вве- дем динамические координаты, которые я обозначу через q или qn, где п = 1, ... , N (N — число степеней свободы). Затем мы имеем скорости dqn/dt = qn. Лагранжиан L = L(q, q) является функцией ко- ординат и скоростей. На этом этапе вас может до некоторой степени смутить то зна- чение, которое придается временной переменной в этом формализме. Временная переменная t появляется уже, как только мы вводим ла- гранжиан. Она снова встречается в определении скоростей, и, таким образом, при переходе от лагранжиана к гамильтониану имеется од- на выделенная временная переменная. С релятивистской точки зрения это означает, что мы выбираем одного определенного наблюдателя и на
12 Лекции по квантовой механике всех этапах нашего формализма ведем отсчет времени по часам этого наблюдателя. Это, конечно, не очень уж приятно физику-релятивисту, который предпочел бы рассматривать всех наблюдателей на равных ос- нованиях. Однако такова характерная черта данного формализма, и я не вижу, как ее устранить, если мы хотим сохранить общность рассмот- рения, допуская, что лагранжиан может быть произвольной функцией координат и скоростей. Мы можем быть уверены, что содержание тео- рии является релятивистским, даже если форма уравнений не является явно релятивистской из-за наличия одного выделенного времени, игра- ющего доминирующую роль в теории. Давайте теперь разовьем эту лагранжеву форму динамики и пе- рейдем затем к гамильтоновой форме, следуя возможно более близко тем идеям, с которыми мы встречаемся в динамике при использовании координат общего вида. Мы имеем лагранжевы уравнения движения, получающиеся в результате варьирования интеграла действия d ( dL\ _ dL q 2) dt V dqn ) dqn' Чтобы перейти к гамильтонову формализму, мы введем импульсные переменные рп, определив их как * = f ¦ <1Л> В обычной динамической теории делается предположение, что импуль- сы являются независимыми функциями скоростей, но это предположе- ние является слишком жестким для тех приложений теории, которые мы намерены рассмотреть. Мы хотим допустить возможность того, что эти импульсы не являются независимыми функциями скоростей. В таком случае существуют некоторые соотношения типа <p(q, р) = О, связывающие импульсные переменные. Может быть несколько независимых соотношений этого типа; в та- ком случае мы перенумеруем их, снабдив индексом т = 1, ... , М, так что мы будем иметь <pm(q,p)=0- A-4) Величины q и р являются динамическими переменными теории в га- мильтоновой форме. Они связаны соотношениями A.4), которые назы- ваются первичными связями в гамильтоновом формализме. Эта терми- нология введена Бергманом, и она представляется мне вполне удачной.
Глава 1. Метод Гамильтона 13 Рассмотрим теперь величину pnqn — L. (Всякий раз, когда встре- чается повторяющийся индекс, я подразумеваю, что проводится сум- мирование по всем значениям этого индекса.) Возьмем вариации пе- ременных q и q — координат и скоростей. Эти вариации приведут к появлению вариаций импульсных переменных р. В результате это- го варьирования, с учетом определения A.3), получим Qn ~ L) = 8pnqn + pn6qn - {Q) (^) A.5) Теперь мы видим, что вариация величины pnqn — L содержит толь- ко вариации координат q и импульсов р. Она не содержит вариаций ско- ростей. Это означает, что такую величину pnqn — L можно выразить через q и р независимо от скоростей. Выраженная таким образом, она называется гамильтонианом Н. Однако гамильтониан, определенный таким способом, задан неод- нозначно, ибо мы можем добавить к нему любую линейную комбина- цию величин (р, равную нулю. Таким образом, мы перешли бы к дру- гому гамильтониану Н*=Н + стут, A.6) где коэффициенты ст могут быть произвольными функциями q и р. Гамильтониан Н* ничем не хуже Н; наша теория не может провести различия между Н и Н*. Гамильтониан определен неоднозначно. Можно записать A.5) в виде SH = qnSpn — (j^—)Sqn. Это уравнение справедливо для произвольной вариации q и р, под- чиненной тому условию, что связи A.4) сохраняются неизменными. Переменные q и р нельзя варьировать независимо ввиду того, что они ограничены условиями A.4), но для любой вариации q и р, удовлетво- ряющей этим условиям, данное уравнение выполняется. Согласно обще- му методу вариационного исчисления, примененному к вариационному уравнению со связями данного типа, находим и -^ = f-+um^ A.7) др dq dq
14 Лекции по квантовой механике или, используя A.2) и A.3) дН dipm V = U (L8) где ит — неизвестные коэффициенты1. Здесь мы имеем гамильтоновы уравнения движения, описывающие изменение во времени переменных q и р, но эти уравнения содержат неизвестные коэффициенты ит. Удобно использовать специальное обозначение, которое позволит нам кратко записать эти уравнения, а именно скобки Пуассона. Смысл этого обозначения таков: если мы имеем две функции q и р, ска- жем, f(q, р) и g(q, р), то скобка Пуассона [/, g] для них определяется как lf g] = ид) [Lgl dqndpn dpndqn- U'yJ Скобки Пуассона обладают некоторыми свойствами, вытекающими из их определения, а именно: скобка [/, g] антисимметрична по / и g: [/, g] = ~[g, /], A-Ю) линейна по каждому члену: [Л + /2, g] = [Л, g] + [/2, g] И Т.Д.; A.11) при этом справедливо следующее правило для произведений: Наконец, существует соотношение, известное как тождество Яко- би, связывающее три величины: [/, [g, h]] + \g, [h, /]] + [h, If, g}] = 0. A.13) С помощью скобок Пуассона мы можем иначе записать уравнения дви- жения. Для произвольной функции g переменных q и р мы имеем fjP' (JP" • ^Ь> • I ^о • /-I -| j\ (У -^z. /7 -\— Т) 1114) 1В отличие от ст, ит — числовые коэффициенты. (Прим. ред.).
Глава 1. Метод Гамильтона 15 Если подставить вместо qn и рп их значения, заданные уравнения- ми A.7) и A.8), то мы найдем, что величина A.14) равна просто g = [g, H]+um[g, (pm]. A.15) Таким образом, все уравнения движения записываются в компакт- ном виде в формализме, использующем скобки Пуассона. Можно записать их в еще более краткой форме, если несколько обобщить понятие скобок Пуассона. В том виде, в каком я определил скобки Пуассона, они имеют смысл только для таких величин fug, ко- торые можно выразить как функции переменных q и р. Величина более общей природы, например, обобщенная переменная скорости, которая не выражается через q и р, не имеет скобок Пуассона с другой вели- чиной. Расширим понятие скобок Пуассона и будем считать, что они существуют для любых двух величин и что они удовлетворяют прави- лам A.10)—A.13), но в остальном не определены, когда входящие в них величины не являются функциями переменных q и р. Тогда мы можем записать A.15) как g=[g,H + um<pm]. A.16) Как видите, коэффициенты и появляются здесь в одном из членов скоб- ки Пуассона. Коэффициенты ит не являются функциями q и р, поэтому мы не можем использовать определение A.9) для вычисления скобки Пуассона в A.16). Однако мы можем продолжить исследование ее, ис- пользуя правила A.10)—A.13). Согласно правилу A.11) имеем [g, Н + ит<рт] = [g, Я] + [g, um(pm], A.17) а используя правило для произведений A.12), получаем [g, Um(pm] = [g, Um](pm + Um[g, ipm]. A.18) Последняя скобка в A.18) вполне определена, так как q и (рт обе явля- ются функциями переменных q и р. Скобка Пуассона [g, um] не опре- делена, но она умножается на величину <рт, обращающуюся в нуль. Поэтому первый член в правой части A.18) исчезает. В результате [g, H + umipm] = [g, H] + um[g, ipm], A.19) так что A.16) совпадает с A.15).
16 Лекции по квантовой механике Существует одно обстоятельство, из-за которого мы должны быть осторожны при использовании формализма скобок Пуассона. Мы име- ем связи A.4), но мы не должны пользоваться ни одним из условий связи до вычисления скобок Пуассона. Если мы сделаем это, то при- дем к неверному результату. Поэтому мы примем как правило, что все скобки Пуассона должны быть раскрыты до использования условий связи. Чтобы помнить о наличии в формализме этого правила, я за- пишу связи A.4) в форме уравнений со знаком равенства в виде двух волнистых линий и, т.е. со знаком, отличающимся от обычного. Таким образом, они записываются как tpm и 0. A.20) Я буду называть такие уравнения слабыми, чтобы отличать их от обыч- ных, или сильных уравнений. Условие A.20) можно использовать только после того, как раскры- ты все интересующие нас скобки Пуассона. При условии выполнения этого правила скобка Пуассона A.19) вполне определена, и мы имеем возможность записать наши уравнения движения A.16) в весьма сжа- той форме: g*\g, Ht] A.21) с гамильтонианом, который я буду называть полным гамильтонианом, HT = H + umipm. A.22) Рассмотрим теперь, каковы следствия из этих уравнений движе- ния. Прежде всего, появятся некоторые условия непротиворечивости. Мы имеем величины <р, которые должны быть равны нулю в каж- дый момент времени. Мы можем применить уравнение движения A.21) или A.15), взяв в качестве g одну из функций ip. Мы знаем, что для непротиворечивости метода величина ^должна быть равна нулю, и, та- ким образом, получаем некоторые условия непротиворечивости. По- смотрим, как они выглядят. Полагая в A.15) g= <pm и g= 0, получаем [ipm, Н] + Um> [ipm, ipm>] И 0. A.23) Мы имеем здесь несколько условий непротиворечивости, по од- ному для каждого значения индекса то. Мы должны исследовать эти
Глава 1. Метод Гамильтона 17 условия и выяснить, к чему они ведут. Возможно, что эти условия не- посредственно приводят к противоречию. Они могут привести к про- тиворечию типа 1 = 0. Если такое случается, то это означает, что наш исходный лагранжиан таков, что лагранжевы уравнения движения про- тиворечивы. Можно легко построить пример со всего лишь одной степе- нью свободы. Если мы возьмем L = q, то лагранжево уравнение движе- ния A.2) немедленно даст 1 = 0. Таким образом, как вы видите, нельзя задавать лагранжиан совершенно произвольно. Мы должны при выборе лагранжиана потребовать, чтобы лагранжевы уравнения движения не содержали внутреннего противоречия. С учетом этого требования усло- вия, выражаемые уравнениями A.23), можно разбить на три класса. Условия первого класса сводятся к тождеству 0 = 0, т. е. они удов- летворяются автоматически при учете первичных связей. Условия второго класса сводятся к уравнениям, не зависящим от коэффициентов и, т. е. содержащим только переменные q и р. Такие условия не должны зависеть от первичных связей, иначе они относи- лись бы к условиям первого класса. Таким образом, они имеют вид Х(Я, Р) = 0- A-24) Наконец, существуют среди условий A.23) такие, которые невоз- можно отнести ни к какому из рассмотренных классов; они представ- ляют собой условия, налагаемые на коэффициенты и. Условия первого класса не должны больше нас беспокоить. Каж- дое условие второго класса означает, что мы имеем еще одну связь между гамильтоновыми переменными. Связи, возникающие таким пу- тем, называются вторичными связями. Они отличаются от первичных связей тем, что первичные связи являются просто следствиями урав- нений A.3), определяющих импульсные переменные, тогда как для по- лучения вторичных связей нужно использовать также и лагранжевы уравнения движения. Если в нашей теории появляется вторичная связь, то мы получаем еще одно условие непротиворечивости, потому что мы можем вычис- лить величину х с помощью уравнения движения A.15) и потребовать, чтобы х ~ 0. Таким образом, мы приходим еще к одному условию [Х, Н]+ит[Х, рт]м0. A.25) Это условие нужно исследовать с тех же позиций, что и A.23). Мы сно- ва должны выяснить, к какому из трех классов оно относится. Если
18 Лекции по квантовой механике оно представляет собой условие второго класса, то мы должны продол- жить процесс классификации еще на один этап, поскольку здесь мы имеем добавочную вторичную связь. Мы продолжаем подобным обра- зом до тех пор, пока не исчерпаем все условия непротиворечивости, и в качестве конечного результата у нас останется ряд вторичных свя- зей типа A.24) вместе с набором условий типа A.23), налагаемых на коэффициенты и. Во многих случаях мы будем рассматривать вторичные связи на равных основаниях с первичными. Удобно использовать для них следу- ющее обозначение: й«0, к = М + 1, ... ,М+К, A.26) где К — полное число вторичных связей. Их следует записывать, так же как и первичные связи, в виде слабых уравнений, поскольку они также представляют собой уравнения, которыми мы не должны поль- зоваться до вычисления скобок Пуассона. Таким образом, всю совокуп- ность связей можно записать так: щ&0, j = 1, ... , М + К = J. A.27) Обратимся теперь к оставшимся условиям третьего класса. Мы должны выяснить, какие ограничения они налагают на коэффициен- ты и. Эти условия суть [tpj, Н] + um[(pj, (pm] и 0, A-28) где по индексу т суммирование проводится от 1 до М, a j принимает любое значение от 1 до J. Эти уравнения содержат условия, которым должны подчиняться коэффициенты и, коль скоро данные уравнения не сводятся просто к связям. Посмотрим на эти уравнения с другой точки зрения. Предположим, что коэффициенты и неизвестны и A.28) представляет собой систему неоднородных линейных уравнений относительно этих неизвестных и, коэффициентами в которых служат функции переменных q и р. Бу- дем искать решение этой системы уравнений, которое даст нам и как функции от q и р, скажем, um = Um(q,p). A.29)
Глава 1. Метод Гамильтона 19 Решение такого типа должно существовать, ибо обратное означало бы, что лагранжевы уравнения движения противоречивы, и этот случай мы отбрасываем. Решение оказывается неоднозначным. Если у нас есть одно реше- ние, мы можем прибавить к нему произвольное решение Vm(q, р) одно- родной системы уравнений, соответствующей A.28): Ут[(р1,(рт] = 0, A.30) и получим таким способом другое решение неоднородной системы уравнений A.28). Мы хотим получить общее решение уравнений A.28), а это означает, что мы должны рассмотреть все независимые реше- ния системы A.30), которые мы можем обозначить через Vam(q, р), а = 1, ... , А. Тогда общее решение системы A.28) имеет вид um = Um+ vaVam, A.31) где коэффициенты va могут быть произвольными. Подставим эти выражения для и в полный гамильтониан A.22) на- шей теории. Это даст нам следующее выражение для полного гамиль- тониана: НТ = Н + Umipm + vaVam>pm. A.32) Мы можем записать его как HT=H' + vaipa, A.33) где Н' = Н + Umtpm A.33а) fa = Vam(pm. A.34) Используя полный гамильтониан A.33), мы по-прежнему будем иметь уравнения движения A.21). Проведенный анализ показывает, что мы удовлетворили всем тре- бованиям непротиворечивости теории и все еще имеем произвольные коэффициенты v. Их число обычно меньше числа коэффициентов и.
20 Лекции по квантовой механике Коэффициенты и не произвольны — они должны удовлетворять требо- ваниям непротиворечивости, тогда как коэффициенты v являются про- извольными величинами. Мы можем взять в качестве v произвольные функции времени, и тем не менее все требования нашей динамической теории будут выполняться. В этом состоит отличие обобщенного гамильтонова формализма от того, с которым мы знакомы из элементарной динамики. Здесь мы име- ем произвольные функции времени, входящие в общее решение урав- нений движения с заданными начальными условиями. Наличие этих произвольных функций времени означает, что мы используем матема- тический аппарат, содержащий произвольные характеристики, напри- мер, координатную систему, которую можно выбрать некоторым про- извольным образом, или калибровку в электродинамике. В результа- те наличия этого произвола в математическом аппарате динамические переменные в последующие моменты времени не полностью определя- ются их начальными значениями, и это проявляется в наличии произ- вольных функций в общем решении. Нам нужно ввести терминологию, которая отражала бы характер величин, встречающихся в формализме. Мне кажется полезной следу- ющая терминология. Я называю, по определению, некоторую динами- ческую переменную R, являющуюся функцией от q и р, динамической переменной первого рода, если ее скобки Пуассона со всеми <р равны нулю: [Д,^-]иО, j = l, ...,J. A.35) Достаточно, если эти условия выполняются в смысле слабых равенств. В противном случае R относится к переменным второго рода. Если R является переменной первого рода, то величина [R, ipj] должна быть равна в сильном смысле некоторой линейной функции от ip, так как все, что слабо исчезает в настоящей теории, в сильном смысле равно некоторой линейной функции от величин (р. По определению ip являют- ся единственными независимыми величинами, слабо равными нулю. Поэтому мы имеем сильные уравнения [R,<Pj] = rjj,<pj,. A.36) Прежде чем переходить к дальнейшему, я хотел бы доказать сле- дующую теорему.
Глава 1. Метод Гамильтона 21 Теорема. Скобка Пуассона двух величин первого рода также яв- ляется величиной первого рода. Доказательство. Пусть R и S — переменные первого рода. Тогда, согласно A.36), мы имеем [S,<pj] = 8jj,<pj,. A.36а) Составим скобку Пуассона [[R, S], <pj]. Мы должны раскрыть ее с по- мощью тождества Якоби A.13): [[R, S], <рД = [[R, <р& S] - [[S, Vi\, R] = [г„.<рг, S] - [8irVi,, R] = Здесь мы использовали уравнения A.36) и A.36а), затем правило про- изведений A.12) и уравнение A.20). Вся эта величина слабо исчезает. Таким образом, мы доказали, что [R, S] является величиной первого рода. ¦ Мы имеем уже четыре различных типа связей. Мы можем разде- лить их на связи первого и второго рода совершенно независимо от их разделения на первичные и вторичные. Я хотел бы обратить ваше внимание на то, что величины Н' и (ра, определяемые согласно A.33а) и A.34), представляют собой величины первого рода. Составив скобку Пуассона ipa с (pj, мы получим соглас- но A.34) Vam[(pm, (pj] плюс слабо исчезающие члены. Поскольку Vam по способу определения удовлетворяет уравнению A.30), <ра есть вели- чина первого рода. Аналогично уравнение A.28) с заменой ит на Um показывает, что Н' — величина первого рода. Таким образом, выра- жение A.33) задает полный гамильтониан в виде комбинации гамиль- тониана Н' — величины первого рода — и некоторых функций ip — также величин первого рода. Любая линейная комбинация <р, конечно, также является связью1, и если мы возьмем линейную комбинацию первичных связей, то в ре- зультате получим еще одну первичную связь. Поэтому каждая из ве- личин <ра является первичной связью, и она относится к первому ро- ду. Таким образом, в итоге мы выразили полный гамильтониан в виде 1Автор, введя выше понятие связей, т.е. соотношений типа ip(q, р) = 0 (напри- мер, A.4)), здесь и далее применяет этот термин (связи) также и для обозначения самих величин <p(q, p). В переводе эта особенность сохранена. (Прим. перев.)
22 Лекции по квантовой механике суммы гамильтониана — величины первого рода — и линейной комби- нации первичных связей первого рода. Число независимых произвольных функций времени, входящих в общее решение уравнений движения, равно числу значений, которые принимает индекс а. Оно равно числу независимых первичных связей первого рода, потому что все независимые первичные связи первого рода входят в сумму A.33). Итак, мы обрисовали общую ситуацию. Мы пришли к ней, исходя именно из уравнений движения Лагранжа, переходя к гамильтониану и раскрывая вид условий непротиворечивости. С практической точки зрения можно, исходя из свойств преобразо- вания интеграла действия, указать, какие произвольные функции вре- мени войдут в общее решение уравнений движения. Каждой из этих функций времени должна соответствовать некоторая первичная связь первого рода. Поэтому мы можем заранее сказать, какими будут пер- вичные связи первого рода, не проводя вовсе подробного вычисления скобок Пуассона; в практических приложениях данной теории мы, оче- видно, сможем сберечь немало сил, используя этот метод. Я хотел бы продвинуться несколько дальше и рассмотреть еще од- ну характерную черту теории. Попытаемся понять с физической точки зрения такую ситуацию: мы исходим из заданных начальных значе- ний переменных и получаем решение уравнений движения, содержащее произвольные функции. Нужные нам начальные значения переменных задаются для переменных q и р. Нам не нужно задавать начальные значения коэффициентов v. Начальные значения q и р соответствуют, как говорят физики, начальному физическому состоянию системы. Фи- зическое состояние определяется только переменными q и р, а не коэф- фициентами V. Далее, начальное состояние должно определять состояния и в по- следующие моменты времени. Но значения переменных q и р неодно- значно определяются в последующие моменты времени по начальным значениям, поскольку у нас появляются произвольные функции v. Это означает, что состояние неоднозначно определяет набор значений пере- менных q и р, несмотря на то, что этот набор q и р однозначно опре- деляет состояние. Должно существовать несколько вариантов выбора q и р, соответствующих одному и тому же состоянию. Таким образом, перед нами стоит задача отыскать все наборы значений переменных q и р, которые соответствуют одному частному физическому состоянию.
Глава 1. Метод Гамильтона 23 Все эти значения переменных q и р в определенный момент време- ни, которые могут получиться в результате развития из одного началь- ного состояния, должны соответствовать одному и тому же физичес- кому состоянию в этот момент. Давайте возьмем некоторые частные начальные значения переменных дирв момент времени t = О и по- смотрим, какими будут значения q и р через небольшой промежуток времени St. Значение произвольной динамической переменной g, имев- шей начальное значение go, в момент времени St есть g{5t) = go + gSt = go+ [g, HT]St = go + St{[g, H'] + va[g, ipa]}. A.37) Коэффициенты v совершенно произвольны и находятся в нашем распо- ряжении. Предположим, что мы возьмем для этих коэффициентов иные значения, например г/. Это привело бы к другому значению gEt), от- личающемуся на AgEt) = 5t(va - v'a)[g, <ра]. A.38) Эту величину можно записать как Ag(St)=ea[g, ipa], A.39) где еа = St(va - v'a) A.40) представляет собой произвольное малое число, малое из-за наличия ко- эффициента 5t и произвольное ввиду того, что величины v и v' могут быть какими угодно. Мы можем изменить все наши гамильтоновы пе- ременные согласно правилу A.39), и новые гамильтоновы переменные будут описывать то же самое состояние. Это изменение гамильтоно- вых переменных осуществляется путем бесконечно малого контактного преобразования с производящей функцией еа<ра. Мы приходим к тому заключению, что величины <ра, впервые появляющиеся в теории как первичные связи первого рода, имеют следующий смысл: они в качест- ве производящих функций (генераторов) бесконечно малых контактных преобразований приводят к таким изменениям переменных q up, кото- рые не связаны с изменением физического состояния. Однако это еще не конец. Можно продвинуться дальше в том же на- правлении. Предположим, что мы применяем последовательно два та- ких контактных преобразования. Проведем сначала первое контактное
24 Лекции по квантовой механике преобразование с производящей функцией еа(ра, а затем второе кон- тактное преобразование с производящей функцией ^а'(раЧ гДе 7а' — некоторые новые малые коэффициенты. Мы получим окончательно g1 = go + Sa[g, (fa}+ya,[g+ea[g, (fa], Va']- A-41) (Я сохраняю члены второго порядка, содержащие произведения sj, но пренебрегаю членами второго порядка, пропорциональными г2 или 72- Это приближение является законным, и оно достаточно для наших це- лей. Я не хочу выписывать больше, чем мне на самом деле нужно для получения искомого результата.) Если последовательно применить два преобразования в обратном порядке, то мы получим g" = go + Ja'[g, (pa']+?a[g + 7a'[g, <Pa'], (pa]- A-42) Давайте теперь вычтем один результат из другого. Разность будет рав- на Ag= ?ala'{[[g, Ы, (pa'] ~ [[g, ?V], Ы}- (L43) На основании тождества Якоби A.13) это выражение сводится к Ag = ea>ya.\g, [<ра, <ра.]]. A.44) Величина Ag также должна соответствовать такому изменению пере- менных q и р, которое не связано с изменением физического состоя- ния, поскольку эта величина возникает в результате комбинации ряда процессов, в каждом из которых по отдельности физическое состояние остается неизменным. Таким образом, ясно, что можно использовать величину [(Ра, (Ра'] A-45) в качестве производящей функции бесконечно малого контактного пре- образования, которое не связано с изменением физического состояния. Вспомним теперь, что (ра являются величинами первого рода, а по- этому скобки Пуассона для них слабо равны нулю и, следовательно, равны в сильном смысле некоторой линейной комбинации величин <р. Эта линейная комбинация величин <р также должна быть первого рода согласно доказанной несколько ранее теореме, по которой скобка Пуас- сона двух величин первого рода также есть величина первого рода.
Глава 1. Метод Гамильтона 25 Таким образом, мы видим, что преобразования, получаемые таким путем и не связанные с каким-либо изменением физического состоя- ния, представляют собой преобразования, производящими функциями (генераторами) которых являются связи первого рода. Эти преобра- зования оказываются более общими, по сравнению с рассмотренными выше, лишь в одном отношении. Производящие функции, которые мы имели прежде, должны были быть первичными связями первого ро- да. Производящие функции, которые мы получаем теперь, могут быть вторичными связями первого рода. Этот расчет показывает, что мы могли бы иметь вторичную связь первого рода в качестве производя- щей функции бесконечно малого контактного преобразования, которое приводит к изменению переменных q и р, но не связано с изменением состояния. Нам нужно было бы, ради полноты, провести еще одно неболь- шое исследование, которое показывает, что скобка Пуассона [Н1, ipa] гамильтониана Н' (величины первого рода) со связью первого рода (р опять является линейной функцией связей первого рода. Снова мож- но показать, что эта величина оказывается возможной производящей функцией для бесконечно малых контактных преобразований, которые не связаны с изменением состояния. Окончательный вывод состоит в том, что преобразованиями ди- намических переменных, которые не связаны с изменением физичес- ких состояний, являются бесконечно малые контактные преобразова- ния, производящая функция которых представляет собой первичную связь первого рода или, возможно, вторичную связь первого рода. Зна- чительная часть вторичных связей первого рода получается как A.45) или как [Н', <ра]. Возможно, по моему мнению, что все вторичные свя- зи первого рода следует отнести к классу генераторов преобразований, которые не связаны с изменением физического состояния, но мне не удалось доказать это. Мне также не удалось найти ни одного примера, в котором имелись бы вторичные связи первого рода, порождающие изменения физического состояния.
Глава 2 Проблема квантования Мы пришли к представлению о том, что существуют определенные преобразования переменных q и р, которые не связаны с изменением состояния и производящими функциями которых служат вторичные связи первого рода. Это наводит на мысль о том, что уравнения движе- ния следует обобщить так, чтобы изменения со временем динамичес- кой переменной g включали не только любые изменения, описываемые уравнением A.21), но также и любые изменения, не связанные с из- менением состояния. Таким образом, мы должны рассмотреть более общее уравнение движения g=\g,HE], B.1) где Не — обобщенный гамильтониан, являющийся суммой прежнего гамильтониана Нт и всех тех производящих функций (или генерато- ров) с произвольными коэффициентами, отвечающих преобразовани- ям, не связанным с изменением состояния: HE = HT + v'a,<pa,. B.2) Те генераторы <pai, которые не содержатся уже в Нт, будут вторичны- ми связями первого рода. Присутствие новых членов в гамильтониане приводит к добавочным изменениям динамической переменной g, но добавочным изменениям не соответствует никакое изменение состоя- ния, поэтому такие члены определенно должны быть включены в га- мильтониан, даже если мы не получаем добавочных изменений g при работе непосредственно с лагранжианом. Итак, мы приходим к обобщенной гамильтоновой теории. В том виде, в каком теория развита мною здесь, она применима в случае конечного числа степеней свободы, однако ее нетрудно обобщить на случай бесконечного числа степеней свободы. Индексом, нумерующим степени свободы, у нас служит п = 1, ... ,7V; без особого труда можно
Глава 2. Проблема квантования 27 сделать N бесконечным. Дальнейшее обобщение теории мы получим, считая, что число степеней свободы континуально бесконечно. Этим я хочу сказать, что в качестве наших q и р можно взять перемен- ные qx, рх, где х — индекс, который принимает непрерывные значения в некоторой области. Используя этот индекс х, мы должны заменить все наши прежние суммы по п интегралами. С таким изменением можно непосредственно использовать все предыдущее рассмотрение. Имеется только одно уравнение, с которым мы должны поступить несколько иначе, — это уравнение A.3), которое определяет импульс- ные переменные, v Рп г, . • oqn Если п принимает все значения непрерывного спектра, то мы должны понимать под этим частным дифференцированием операцию частного функционального дифференцирования, которую можно точно опреде- лить следующим образом. Придадим скоростям в лагранжиане вариа- ции Sqx и положим затем SL = fpx5qx. B.3) Коэффициент при Sqx, стоящий в подынтегральном выражении для SL, есть по определению рх. После изложения этой общей абстрактной теории, я думаю, было бы полезно привести простой пример в качестве иллюстрации. Я возь- му для этого электромагнитное поле Максвелла, заданное потенциала- ми Ац. Динамические координаты теперь представляют собой значения потенциалов во всех точках пространства в определенный момент вре- мени. Иными словами, динамическими координатами являются А^х, где индекс х отвечает трем координатам ж1, ж2, х3 точки в трехмер- ном пространстве в заданный момент времени х° (а не четырем коор- динатам х, используемым в теории относительности). Тогда в качестве динамических скоростей мы будем иметь производные по времени от динамических координат, и я буду обозначать их индексом 0 после за- пятой. Любой индекс с запятой перед ним означает дифференцирование по общему правилу:
28 Лекции по квантовой механике Мы имеем дело со специальной теорией относительности, поэтому мож- но поднимать и опускать индексы согласно правилам этой теории: под- нимая или опуская индексы 1, 2 или 3, мы должны менять знак, но, поднимая или опуская индекс 0, знак менять не нужно. В качестве нашего лагранжиана для электродинамики Максвелла мы имеем (в единицах Хевисайда) F^F^Sx. B.5) Здесь dzx означает произведение дифференциалов dxxdx2dx3, ин- тегрирование ведется по всему трехмерному пространству и Filv — тензор электромагнитного поля, определяемый через потенциалы вы- ражением Fflv = Av>tl-A^v. B.6) Величина L является лагранжианом, поскольку интеграл от нее по вре- мени есть интеграл действия максвелловского поля. Возьмем теперь этот лагранжиан и, применяя правила нашего фор- мализма, перейдем к гамильтониану. Прежде всего мы должны ввести импульсы. Сделаем это посредством варьирования скоростей в лагран- жиане. Взяв вариации скоростей, получим 1 [ з [ Ро з 2 у м" j р. Далее, импульсы ??р определяются из выражения SL= B^SA^ocPx, B.8) и эти импульсы будут удовлетворять основному соотношению со скоб- ками Пуассона1 [All)X,BZ,]=t?63(x-x'); /i, i/= 0, 1, 2, 3. B.9) ¦'¦Соотношения типа B.9) автор называет Poisson bracket relations, что в букваль- ном переводе звучит очень громоздко: соотношения со скобками Пуассона. Посколь- ку далее в тексте они многократно используются, то при переводе было принято сокращение: СП-соотношения. Такое решение этой небольшой терминологической проблемы, возможно, не является лучшим, но оно представляется нам естествен- ным, будучи близким по форме к своему квантовому аналогу — перестановочным соотношениям. (Прим. перев.)
Глава 2. Проблема квантования 29 Здесь А берется в точке х трехмерного пространства, В — в точке х' трехмерного пространства; g^ — просто символ Кронекера, а 53(х — х') представляет собой трехмерную дельта-функцию от х — х'. Сравнив выражения B.7) и B.8) для SL, найдем В» = F^°. B.10) Учтем, что тензор Fpi/ антисимметричен: р»" = -Fut*. B.11) Таким образом, если мы возьмем \х = 0 в B.10), то получим нуль. Итак, величина _В° равна нулю. Это — первичная связь. Я запишу ее в виде слабого равенства В°х и 0. B.12) Другие три импульса ВТ (г = 1, 2, 3) равны просто компонентам элек- трического поля. Я хотел бы напомнить вам, что равенство B.12) выражает не прос- то одну первичную связь — оно включает в себя утроенное бесконечное число первичных связей ввиду наличия индекса х, отвечающего неко- торой точке трехмерного пространства, и каждое значение х дает нам свою первичную связь. Введем теперь гамильтониан. Мы определим его обычным образом: Н= f 3 J p' Л -I 1 \ TPr® Д _|_ jL TPrs fp _|_ jL TPr® fp 1 rl rp /•n i ^ BЛЗ) — / (kprsp _ kprOp A_ pr® A ~ J {4  го о FFr8 + BB A0B Окончательный вид этого выражения получен после выполнения ин- тегрирования по частям. Это выражение для гамильтониана вовсе не содержит скоростей. В него входят только динамические координаты и импульсы. Правда, величины Frs содержат частные производные потен- циалов, но эти частные производные берутся только по переменным ж1,
30 Лекции по квантовой механике ж2, ж3. При этом никаких скоростей не появляется. Такие частные про- изводные являются функциями динамических координат. Мы можем теперь вывести условия непротиворечивости с помо- щью первичных связей B.12). Поскольку условия B.12) должны вы- полняться всегда, величина [В0, Н] обязана равняться нулю. Это ведет к уравнению Вгг и 0. B.14) Оно снова является связью, так как в него вовсе не входят скорости. Это — вторичная связь, возникающая таким путем в теории Макс- велла. Продолжая проверять условия непротиворечивости, мы должны раскрыть равенство [В1;, Я] = 0. B.15) Мы найдем, что оно сводится к тождеству 0 = 0. Это равенство не да- ет нам ничего нового и выполняется автоматически. Мы, следователь- но, получили все связи в нашей задаче. Условие B.12) дает первичную связь; B.14) выражает вторичную связь. Нам нужно выяснить теперь, первого или второго рода эти связи; мы найдем без труда, что все они первого рода. Действительно, вели- чины Bq являются импульсными переменными. Скобки Пуассона их друг с другом все равны нулю. Также и для ВТГ и Во скобки Пуассона их друг с другом обращаются в нуль. Это же справедливо и для Вггх с Вггх,. Поэтому все эти величины являются связями первого рода. В электродинамике Максвелла связи второго рода отсутствуют. Выражение B.13) определяет Н как величину первого рода, поэ- тому гамильтониан Н можно взять в качестве Н' в формуле A.33). Посмотрим теперь, чему равен полный гамильтониан: Нт = dzx - f A0Brr dzx + f vxB°d3x. B.16) Функция vx представляет собой произвольный коэффициент в каждой точке трехмерного пространства. Мы всего лишь добавили здесь пер- вичные связи первого рода с произвольными коэффициентами, что мы обязаны были сделать согласно правилам построения полного гамиль- тониана.
Глава 2. Проблема квантования 31 Зная полный гамильтониан, мы получаем уравнения движения в стандартной форме A.21): gK, [g, HT]. Величина g здесь может быть какой-либо характеристикой поля в неко- торой точке х трехмерного пространства или может быть также функ- цией переменных поля в различных точках трехмерного пространства. Она может быть, например, интегралом по трехмерному пространству. Эта величина g в самом общем смысле может быть любой функцией q и р во всем трехмерном пространстве. Допустимо взять g = Ао, и тогда мы получим Ao,0 = v, B.17) поскольку скобки Пуассона для Ао с любой величиной, за исключени- ем В0, входящей в последний член в B.16), обращаются в нуль. Отсюда выясняется смысл произвольного коэффициента vx, имеющегося в пол- ном гамильтониане. Это производная по времени от Ао. Далее, чтобы получить физически допустимое движение самого об- щего вида, мы должны перейти к обобщенному гамильтониану. Для этого мы добавляем вторичные связи первого рода с произвольными коэффициентами их и получаем обобщенный гамильтониан НЕ = НТ+ f uxBrr dzx. B.18) Включение в гамильтониан добавочного члена делает возможным дви- жение более общего типа. При этом становятся допустимыми новые из- менения переменных q и р такие, как преобразования калибровки. Это добавочное изменение переменных q и р приводит к новому набору q и р, который должен соответствовать тому же самому состоянию. К такому результату мы приходим, преобразуя в соответствии с нашими правилами теорию Максвелла к гамильтоновой форме. После того как мы дошли до рассматриваемого этапа этой процедуры, мы ви- дим, что имеется возможность некоторого упрощения. Это упрощение возможно потому, что переменные Ао и Во не имеют никакого физи- ческого смысла. Посмотрим, что вытекает для Ао и Во из уравнений движения. Переменная Во = 0 в любой момент времени. Это неинте- ресно. Переменная Ао есть величина, производная по времени от кото- рой совершенно произвольна. Это снова неинтересно. Переменные Ао
32 Лекции по квантовой механике и Во, следовательно, не представляют для нас никакого интереса. Мы можем устранить их из теории, и это приведет к упрощенному га- мильтонову формализму, в котором у нас меньше степеней свободы, но по-прежнему сохранены все степени свободы, интересные с физической точки зрения. Чтобы провести это «изгнание» переменных Aq и Во, опустим член vxB° в гамильтониане. Этот член просто обеспечивал возможность произвольного изменения Aq. Член — AqBvt в гамильтониане Нт мож- но скомбинировать со слагаемым ихВгг в обобщенном гамильтониане. В любом случае коэффициент их является произвольным. Скомбиниро- вав эти два члена, мы просто заменяем коэффициент их на столь же произвольный коэффициент и'х = их — А0. Таким образом, мы получаем новый гамильтониан Я = I (jFrsFrs + | ?,,?,,) dzx + I u'xBrr d3x. B.19) Этот гамильтониан вполне позволяет найти уравнения движения для всех физически интересных переменных. Переменные Ао и Во уже больше не входят в него. Таков гамильтониан теории Максвелла в его простейшем виде. Обычный гамильтониан, с которым работают в квантовой элек- тродинамике, не вполне совпадает с этим. Его форма основывается на теории, развитой первоначально Ферми. Теория Ферми содержит огра- ничение, налагаемое на потенциалы, А^ = 0. B.20) Наложение такого ограничения на выбор калибровки вполне допусти- мо. Гамильтонова теория, развиваемая мною здесь, не содержит такого ограничения, так что в ней разрешен совершенно произвольный выбор калибровки. Таким образом, данная теория несколько отличается от формализма Ферми. В нашем формализме во всей полноте выявляют- ся трансформационные свойства теории Максвелла при самых общих градиентных преобразованиях. Теория Максвелла здесь иллюстрирует общие идеи относительно первичных и вторичных связей. Я хотел бы теперь вернуться к общей теории и рассмотреть проб- лему квантования гамильтоновой теории. Чтобы обсудить этот вопрос о квантовании, возьмем сначала случай, когда все связи являются свя-
Глава 2. Проблема квантования 33 зями первого рода, а связи второго рода отсутствуют. Мы считаем на- ши динамические переменные q и р операторами, удовлетворяющими перестановочным соотношениям, соответствующим СП-соотношениям классической теории. Это совершенно ясно. Затем мы вводим уравне- ние Шредингера ifM. = Н'ф, B.21) at где ф — волновая функция, на которую действуют операторы q и р. Оператор Н' представляет собой гамильтониан — величину первого рода в нашей теории. Далее мы налагаем на волновую функцию некоторые дополнитель- ные условия, а именно: щф = 0. B.22) Каждая из наших связей, таким образом, приводит к дополнительно- му условию для волновой функции. (Напомним, что все связи сейчас первого рода.) Первое, что мы должны сделать теперь, — это проверить, согласу- ются ли между собой уравнения для ф. Возьмем два из дополнитель- ных условий и посмотрим, нет ли противоречия между ними. Рассмот- рим B.22) и (pj,ip = O. B.22а) Умножив B.22) на ipji, получим <Pj,<Pjfl> = 0, B.23) а умножив B.22а) на ipj, найдем <р}<руф = 0. B.23а) Вычитая одно равенство из другого, имеем [ipj, <Рэ'}Ф = 0- B.24) Это есть дополнительное условие, налагаемое на ф, которое должно выполняться для непротиворечивости. Но мы не хотим иметь ника- ких новых условий для ф. Мы хотим, чтобы все требования, которым
34 Лекции по квантовой механике должна подчиняться ф, содержались в B.22). Иначе говоря, мы хотим, чтобы B.24) следовало из B.22), а это означает, что мы требуем вы- полнения равенства VPhfA = ciJ'J"<Pj"- B-25) Если равенство B.25) действительно выполняется, то B.24) являет- ся следствием B.22), а не новым условием, налагаемым на волновую функцию. Далее мы знаем, что в классической теории все связи (р первого рода, а это значит, что в этом случае скобка Пуассона любых двух свя- зей ip равна линейной комбинации (р. Переходя к квантовой теории, мы должны получить подобное равенство, справедливое для коммутатора, но при этом совсем не обязательно должно следовать, что все коэффици- енты с стоят слева. Нам нужно, чтобы все коэффициенты с находились слева, ибо в общем случае они будут функциями координат и импульсов и не будут коммутировать с (р в квантовой теории; B.24) будет являть- ся следствием B.22) только при условии, что все коэффициенты с стоят слева. При введении в квантовую теорию величин <р может появиться не- которая неоднозначность. Соответствующие классические выражения могут содержать величины, не коммутирующие в квантовом случае, и тогда мы должны решить вопрос, в каком порядке ставить множи- тели в квантовой теории. Нужно попытаться подобрать такое распо- ложение этих множителей, чтобы было справедливо равенство B.25) и все коэффициенты с в правой части B.25) стояли бы слева. Если мы сможем это сделать, то тогда все дополнительные условия будут согла- сованы друг с другом. Если же это сделать не удастся — тогда нам не везет и мы не в состоянии построить последовательную квантовую теорию. Во всяком случае, мы имеем первое приближение квантовой теории, ибо наши уравнения вполне удовлетворительны, если рассмат- ривать их только с точностью до первого порядка по постоянной План- ка Н и пренебречь величинами порядка Н2. Я обсудил сейчас требования, предъявляемые к дополнительным условиям для согласования их друг с другом. Подобное же рассмотре- ние следует провести, чтобы проверить непротиворечивость дополни- тельных условий уравнению Шредингера. Если мы возьмем волновую функцию -ф, которая удовлетворяет дополнительным условиям B.24), и предположим, что она изменяется со временем согласно уравнению
Глава 2. Проблема квантования 35 Шредингера, то будет ли наша функция <ф по истечении небольшого про- межутка времени по-прежнему удовлетворять дополнительным усло- виям? Мы можем установить, что это имеет место при выполнении следующего требования: [ifj, Н]ф = 0; B.26) оно означает, что если мы не хотим получить новое дополнительное условие, коммутатор [ipj, H] должен быть некоторой линейной функ- цией величин ip, т. е. [ч>5,Н\ = Ъц,<р5,. B.27) Снова мы пришли к уравнению, выполняющемуся, как нам известно, в классической теории. Величины ipj и Н относятся к первому роду, по- этому скобка Пуассона для них слабо исчезает. Таким образом, скобка Пуассона в классической теории равна в сильном смысле некоторой ли- нейной функции величин ip . Снова мы должны попытаться найти такое взаимное расположение величин, чтобы в соответствующем квантовом уравнении все наши коэффициенты стояли слева. Это необходимо для построения последовательной квантовой теории, но, вообще говоря, для того чтобы это сделать, нужна известная доля удачи. Рассмотрим теперь задачу о квантовании гамильтоновой теории, в которой есть связи второго рода. Этот вопрос мы сначала обсудим на простом примере. В качестве последнего мы можем взять две связи второго рода gi и 0 и pi к, 0. B.28) Если в теории появляются эти связи, то, так как они относятся ко второму роду, их скобка Пуассона будет отлична от нуля. Что можно сделать с ними при переходе к квантовой теории? Мы не можем нала- гать B.28) в качестве дополнительного условия на волновую функцию, как это мы делали со связями первого рода. Если мы попытаемся по- ложить цхф = 0 и рхф = 0, то мы немедленно придем к противоречию, поскольку мы должны были бы иметь (qipi -piqi)ip = ihip = 0. Следовательно, так поступать нельзя. Мы должны принять какой-то другой план действий.
36 Лекции по квантовой механике В данном простом случае совершенно очевидно, каким должен быть этот план. Переменные q\ и р\ не представляют интереса, раз они могут иметь только нулевые значения. Поэтому степень свободы с номером 1 не имеет никакого значения. Мы можем отбросить степень свободы 1 и работать с другими степенями свободы. Это сводится к другому опре- делению скобок Пуассона. Нам нужно использовать следующее опреде- ление скобок Пуассона в классической теории: di дг, д? dV Здесь суммирование проводится по п = 2, ... , N. Этого будет доста- точно, поскольку здесь учитываются все физически интересные пере- менные. После этого мы могли бы просто взять gi и р\ тождественно равными нулю. В этом нет никакого противоречия, и мы можем пе- реходить к квантовой теории, формулируя ее только для системы со степенями свободы п = 2, ... , N. В данном простом случае совершенно ясно, что нужно сделать для построения квантовой теории. Попытаемся теперь рассмотреть более общий случай. Предположим, что мы имеем Pi ~ 0, gi к, f(qr, рг), г = 2, ... , N; здесь / является произвольной функцией всех других переменных q и р. Мы можем подставить f(qr, pr) вместо q\ в гамильтониан и во все другие связи и таким образом устранить степень свободы с номером 1. О ней можно забыть и просто рассматривать другие степени свободы, а затем перейти к квантовой теории для системы с этими остальными степенями свободы. Нам снова придется использовать скобки Пуассона типа B.29), в которых учитываются только остающиеся степени сво- боды. Этот прием используется при квантовании теории, содержащей связи второго рода. Существование связей второго рода означает, что имеются некоторые степени свободы, несущественные с физической точки зрения. Мы должны выявить эти степени свободы и определить новые скобки Пуассона, в которых учитываются только остающиеся степени свободы, имеющие физическое значение. Тогда с помощью этих новых скобок Пуассона мы сможем перейти к квантовой теории. Я хо- тел бы обсудить общую процедуру выполнения этой задачи.
Глава 2. Проблема квантования 37 Вернемся пока к классической теории. Мы имеем ряд связей ipj ss 0; некоторые из них относятся к первому роду, некоторые — ко второму. Мы можем заменить эти связи их независимыми линейными комбина- циями, которые будут ничем не хуже первоначальных связей. Попыта- емся подобрать линейные комбинации таким образом, чтобы свести как можно больше связей к связям первого рода. Может остаться некоторое число связей второго рода, составляя линейные комбинации которых, мы уже не сможем получить связей первого рода. Эти оставшиеся связи второго рода я обозначу через %s, s = 1, ... , S. Таким образом, S есть число связей второго рода, никакая линейная комбинация которых не относится к первому роду. Рассмотрим такие оставшиеся связи второго рода и составим скоб- ки Пуассона для всех их друг с другом, а затем построим из этих скобок Пуассона детерминант Д: Д = 0 [Х2, Xl] [хъ Хг] 0 [хь Хз] [Х2, Хз] [Х2, ъ Xs] i Xs] Теперь я хочу доказать следующую теорему. Теорема. Детерминант Д не обращается в нуль даже в слабом смысле. Доказательство. Предположим, что детерминант обращается в нуль. Я хочу пока- зать, что это допущение приводит к противоречию. Если детерминант исчезает, то его ранг равен Т < S. Построим тогда другой детерминант: А = Xi X2 0 [X2, ¦) [Хь Х2] 0 Хт+i [Xt+i> Xi] [Xt+i> Хг] [Хь XT] [Хг, Хт] .XtI Он имеет Т + 1 строк и столбцов. Число Т + 1 может равняться S или может быть меньше S. При разложении детерминанта А по элементам его первого столбца каждый из этих элементов умножается на один из миноров Д. Мне нужно, чтобы не все эти миноры обращались в нуль.
38 Лекции по квантовой механике Может все же случиться так, что они исчезают все. В таком случае следует выбрать иным образом набор величин %, входящих в А. Всегда должен существовать некоторый способ такого выбора \, входящих в А, при котором не все миноры исчезают, ибо ранг Д равен Т. Поэтому мы выбираем \ таким образом, чтобы коэффициенты при элементах первого столбца не все обращались в нуль. Теперь я покажу, что скобки Пуассона детерминанта А с любой из величин (р равны нулю. Если мы хотим составить скобку Пуассона (р с детерминантом, то искомый результат мы получим, взяв скобку Пу- ассона <р с первым столбцом детерминанта, прибавив к этому скобку Пуассона <р со вторым столбцом, и т. д. Таким образом, имеем [<Р, Xi] [<Л Х2\ О \Х2, Xl] Xt+i\ Xi О Х2 [Х2, Xl] Xi О Х2 [<Р, [Х2, Xl]] Хт+i i, Х2]] о Хт+i [Хт+nXi] [ч>,[Хт+пХ2\] ¦ Результат выглядит довольно громоздко, но нетрудно заметить, что каждый из этих детерминантов обращается в нуль. Прежде всего ис- чезает первый детерминант в правой части. Действительно, если ip от- носится к первому роду, то тогда обращается в нуль первый столбец; если <р относится ко второму роду, то тогда <р представляет собой одну из величин х, и мы имеем детерминант, являющийся частью детер- минанта Д из Т + 1 строк и столбцов. Но, по предположению, ранг Д равен Т, поэтому любая его часть с Т+1 строками и столбцами обраща- ется в нуль. Далее, второй детерминант в правой части слабо исчезает, ибо слабо исчезает его первый столбец. Аналогичным образом все дру- гие детерминанты слабо обращаются в нуль. В результате вся правая часть равна нулю в слабом смысле. Таким образом, детерминант А яв- ляется величиной, скобки Пуассона которой с любой из величин <р слабо равны нулю. Кроме того, мы можем разложить детерминант А по элементам его первого столбца и получить А в виде линейной комбинации величин х-
Глава 2. Проблема квантования 39 Таким образом, мы пришли к тому результату, что скобки Пуассона не- которой линейной комбинации \ со всеми ip равны нулю. Это значит, что данная линейная комбинация ip относится к первому роду. Такой вывод противоречит нашему предположению о том, что мы выявили все, какие только есть, связи первого рода. Тем самым теорема дока- зана. ¦ Попутно выясняется, что число остающихся связей %, которые нельзя отнести к первому роду, должно быть четным, потому что де- терминант А антисимметричен. Любой антисимметричный детерми- нант с нечетным числом строк и столбцов обращается в нуль. Рассмат- риваемый детерминант не исчезает, а потому должен иметь четное чис- ло строк и столбцов. Ввиду того, что детерминант Д не равен нулю, мы можем ввес- ти матрицу caai, обратную той, чей детерминант есть Д. Определим матрицу cssi с помощью уравнения CsAXs'Xs"} =Sss"- B-30) Дадим теперь новое определение скобок Пуассона, соответствую- щее этому формализму: для любых двух величин ? и ц новая скобка Пуассона определяется как l^vT = [^v]-[^Xs]csAXs',v]- B.31) Нетрудно проверить, что определенные таким образом новые скоб- ки Пуассона подчиняются всем правилам обычных скобок Пуассона: скобка [?, ту]* антисимметрична относительно ? и ту, линейна по ? и по ту, для нее имеет место правило произведений [?i^2; ту]* = Cife? ту]* + + [?i> ^]*С2; и она удовлетворяет тождеству Якоби [[?, ту]*, С]* + + [[Л: С]*: С]* + [[С; С]*> V]* = 0. Я Не ЗНЭЮ НИКЭКОГО ИЗЯЩНОГО СПОСО- ба доказательства тождества Якоби для новых скобок Пуассона. Если мы просто подставим соответствующие выражения и раскроем их пу- тем довольно сложных выкладок, то найдем, что все члены взаимно уничтожаются и левая часть будет равна нулю. Я думаю, что должен существовать какой-то более прозрачный способ доказательства это- го тождества, но мне не удалось его отыскать. Прямой метод описан мною1. Эту задачу также рассматривал Бергманн2. xDirac P. A.M. — Can. Journ. of Math., 1950, v. 2, p. 147. 2BergmannP. G-, Goldberg I. — Phys. Rev., 1955, v. 98, p. 531.
40 Лекции по квантовой механике Посмотрим теперь, что можно сделать, имея эти новые скобки Пу- ассона. Прежде всего я хотел бы отметить, что уравнения движения по- прежнему справедливы с новыми скобками Пуассона, коль скоро они верны при первоначальном определении скобок Пуассона. Так как все члены вида [xsi, HT] слабо обращаются в нуль и Нт является величиной первого рода, то [g, Нт]* = [g, Нт] - [g, Х.]сяя.\х.., Нт] и [g, HT]. Таким образом, мы можем написать Теперь, если мы возьмем произвольную функцию ? любых пере- менных q и р и составим новую скобку Пуассона ее с одной из вели- чин Xi скажем xs"i то с Учетом определения B.30) получим [С, хА* = [С, х.»] - [С, х.]с„,[х.', х.»] = К, xs>>] - К, Xs\Sss» = о. Следовательно, мы можем положить величины х равными нулю до вы- числения новых скобок Пуассона. Это означает, что равенство Xs = 0 B.32) можно рассматривать как равенство в сильном смысле. Модифицируя таким способом нашу классическую теорию и вво- дя эти новые скобки Пуассона, мы подготавливаем почву для пере- хода к квантовой теории. Затем мы ставим перестановочные соот- ношения в соответствие новым СП-соотношениям и считаем сильные равенства B.32) уравнениями для операторов квантовой теории. Тем самым осуществляется переход к квантовому случаю. Остающиеся сла- бые уравнения — все первого рода; они снова становятся дополнитель- ными условиями, налагаемыми на волновые функции. Ситуация оказы- вается теперь аналогичной предыдущему случаю, в котором имелись только связи (р первого рода. Следовательно, мы опять развили метод квантования нашей общей классической теории в гамильтоновой форме. Конечно, снова нужно, чтобы нам повезло, и тогда мы сможем сделать так, чтобы все коэффициенты стояли слева в условиях непротиворечи- вости.
Глава 2. Проблема квантования 41 Этим завершается построение общего метода квантования. Отме- тим, что при переходе к квантовой теории различие между первичны- ми и вторичными связями теряет всякое значение; оно в значительной мере зависит от вида исходного лагранжиана. Коль скоро мы перешли к гамильтонову формализму, мы фактически можем забыть о разли- чии между первичными и вторичными связями. Различие же между связями первого и второго рода является очень важным. Мы должны отнести как можно больше связей к первому роду и ввести новые скоб- ки Пуассона, которые позволят нам рассматривать остающиеся связи второго рода как сильные.
Глава 3 Квантование на искривленных поверхностях Мы исходили из классического принципа действия. Наш интеграл действия мы взяли лоренц-инвариантным. Из этого интеграла действия получили лагранжиан. Затем мы перешли от лагранжиана к гамильто- ниану и далее, следуя определенным правилам, к квантовой теории. Таким образом, мы начали с классической теории поля, в основе ко- торой лежит принцип действия, и пришли в конце концов к квантовой теории поля. Вы могли бы подумать теперь, что на этом наша работа завершена. Имеется, однако, еще один важный вопрос, который необхо- димо рассмотреть, а именно: является ли наша квантовая теория поля, построенная таким способом, релятивистской теорией? При обсужде- нии можно ограничиться специальной теорией относительности. Итак, мы должны выяснить, согласуется ли наша квантовая теория со специ- альной теорией относительности. Мы исходили из принципа действия и требовали, чтобы наш интег- рал действия был лоренц-инвариантным. Этого достаточно для обеспе- чения релятивистского характера нашей классической теории. Уравне- ния движения, вытекающие из лоренц-инвариантного принципа дейст- вия, обязаны быть релятивистскими уравнениями. Правда, когда мы преобразовываем эти уравнения движения к гамильтоновой форме, то нарушаем четырехмерную симметрию. Мы представляем наши урав- нения в виде A.21) gK, [g, HT]. Здесь точка сверху означает операцию d/dt и относится к одно- му абсолютному времени, так что классические уравнения движения в гамильтоновой форме не являются релятивистскими по внешнему ви- ду, но мы знаем, что они должны быть релятивистскими по существу, потому что они выведены на основе релятивистских допущений.
Глава 3. Квантование на искривленных поверхностях 43 Однако при переходе к квантовой теории мы делаем новые пред- положения. Выражение для Нт, которое мы имеем в классической те- ории, не определяет квантовый гамильтониан однозначно. Мы должны решить, в каком порядке расположить некоммутирующие сомножите- ли в квантовой теории. Выбор этого способа упорядочения находится в нашем распоряжении, и поэтому мы принимаем новые допущения. Эти новые допущения могут нарушить релятивистскую инвариант- ность теории, так что квантовая теория поля, полученная с помощью этого метода, не обязательно будет согласовываться с требованиями теории относительности. Теперь перед нами стоит задача выяснить, каким образом мы можем обеспечить релятивистский характер нашей квантовой теории. С этой целью вернемся к исходным принципам. Уже недостаточ- но рассматривать только одну временную переменную, отвечающую одному частному наблюдателю; мы обязаны включить в рассмотрение различных наблюдателей, движущихся друг относительно друга. Мы должны построить квантовую теорию, в равной мере пригодную для любого из этих наблюдателей, т.е. для произвольного выбора оси вре- мени. Чтобы создать теорию, которая могла бы включать различные временные оси, мы должны сначала получить соответствующую клас- сическую теорию и затем по стандартным правилам перейти от этой классической теории к квантовой. Я хотел бы вернуться к начальной стадии развития нашего гамиль- тонова формализма и рассмотреть частный случай. Мы начинали с то- го, что выбирали лагранжиан L, являющийся функцией динамических координат и скоростей q и q, вводили импульсы, а затем определяли гамильтониан. Возьмем теперь частный случай, когда L представляет собой однородную функцию первого порядка от скоростей q. Тогда по теореме Эйлера qn§l=L. C.1) Отсюда сразу следует, что pnqn — L = 0. Таким образом, мы получаем здесь гамильтониан, равный нулю. В этом случае у нас обязательно есть первичные связи. Одна пер- вичная связь определенно существует, так как импульсы р являются однородными функциями нулевого порядка от скоростей, т. е. функци-
44 Лекции по квантовой механике ями только отношений скоростей. Число импульсов р равно N — числу степеней свободы, а число отношений скоростей есть N —1. N функций от N — 1 отношений скоростей не могут быть независимыми. Долж- на быть по крайней мере одна функция р и q, которая равна нулю, т.е. должна существовать по крайней мере одна первичная связь. Их вполне может быть больше, чем одна. Ясно также, что если при рав- ном нулю гамильтониане мы имеем вообще какое-нибудь движение, то должна существовать по крайней мере и одна первичная связь первого рода. Для полного гамильтониана мы имеем выражение A.33) HT = H' + va<pa. Гамильтониан Н' должен быть величиной первого рода, и, так как О, несомненно, является величиной первого рода, мы можем взять Н' = 0. В таком случае наш полный гамильтониан целиком составлен из пер- вичных связей первого рода с произвольными коэффициентами НТ = vaipa, C.2) откуда видно, что должна существовать по крайней мере одна первич- ная связь первого рода, если мы вообще хотим иметь какое-нибудь движение. Уравнения движения выглядят тогда следующим образом: Очевидно, все величины g можно умножить на произвольный множи- тель, так как коэффициенты v произвольны, и, следовательно, в них всегда можно включить этот множитель. Умножение же всех dg/dt на некоторую величину означает, что мы переходим к другой шкале от- счета времени. Таким образом, в этом случае мы имеем гамильтоновы уравнения движения, в которых шкала отсчета времени произвольна. Мы могли бы ввести другую временную переменную т вместо t и по- лучить, используя т, уравнения движения вида ^*Va\g,<Pa]. C-3) Итак, мы имеем теперь гамильтонову систему уравнений движе- ния, в которой отсутствует абсолютная временная переменная. Любую
Глава 3. Квантование на искривленных поверхностях 45 переменную, монотонно возрастающую с увеличением t, можно исполь- зовать в качестве времени, и уравнения движения останутся той же самой формы. Таким образом, для гамильтоновой теории, в которой га- мильтониан Н' равен нулю и вообще любой гамильтониан слабо равен нулю, характерной чертой является отсутствие абсолютного времени. Мы можем подойти к рассматриваемому вопросу также с точки зрения принципа действия. Если I — интеграл действия, то I = L(q, q) dt = C.4) ибо L является однородной функцией первого порядка от dq/dt. Поэто- му мы можем выразить интеграл действия через т совершенно в том же виде, как и через t. Это показывает, что уравнения движения, вы- текающие из принципа действия, должны быть инвариантны относи- тельно перехода от t к т — уравнения движения не связаны ни с каким абсолютным временем. Мы имеем, таким образом, специальную форму гамильтоновой те- ории; однако на самом деле эта форма является не такой уж специ- альной, ибо при любом исходном гамильтониане всегда можно взять временную переменную в качестве добавочной координаты и преоб- разовать теорию к такой форме, в которой гамильтониан слабо равен нулю. Делается это по следующему общему правилу. Мы берем вре- мя t и считаем его новой динамической координатой, обозначаемой до- Строим новый лагранжиан dq0 ( dq[dr\ i dqk\ ( L = ——L\ q, — I = L I щ, —;— I, k = 0, 1, 2, ... , N. C.5) «r V dqa/drJ V dr ) Здесь L* содержит на одну степень свободы больше, чем исходный ла- гранжиан L. Лагранжиан L* не равен L, но * dr = I L dt. Поэтому действие оказывается тем же самым, выражается ли оно че- рез L* и т или через L и t. Таким образом, для любой динамической сис- темы мы можем рассматривать время как добавочную координату до и затем перейти к новому лагранжиану L*, содержащему на одну сте- пень свободы больше и представляющему собой однородную функцию
46 Лекции по квантовой механике первого порядка от скоростей. Лагранжиан L* дает нам гамильтониан, равный нулю в слабом смысле. Этот специальный случай гамильтонова формализма, когда га- мильтониан слабо обращается в нуль, и есть то, что нам нужно для релятивистской теории, поскольку мы не хотим в релятивистской те- ории иметь какое-нибудь одно выделенное время, играющее особую роль; желательно иметь возможность рассматривать различные време- на т, которые все должны быть равноправны. Посмотрим теперь более подробно, как можно воспользоваться этой идеей. Мы хотим рассмотреть состояния в не- которых заданных системах отсчета време- ни, отвечающих различным наблюдателям. Теперь изобразим пространство-время так, как показано на рис. 1. Состояние в опреде- ленный момент времени задается физичес- кими условиями на трехмерной плоской про- странственноподобной поверхности Si, орто- гональной оси времени. Состояние в другие моменты времени характеризуется физичес- кими условиями на других поверхностях ?2, ?з, ... Далее мы хотим ввести другие сис- темы отсчета времени, отвечающие различ- ным наблюдателям, и состояние, рассматри- ваемое относительно новых временных осей, будет характеризоваться физическими условиями на других плоских пространственноподобных поверхностях типа S[. Мы хотим иметь та- кую гамильтонову теорию, которая давала бы нам возможность перехо- дить от состояния, скажем, Si, к состоянию S[. Исходя из заданных на- чальных условий на поверхности Si и используя уравнения движения, мы должны суметь получить физические условия на поверхности S[. Таким образом, движению поверхности должны отвечать четыре степе- ни свободы; одна, соответствующая перемещению поверхности парал- лельно самой себе, и, кроме того, три степени свободы, соответству- ющие произвольному изменению направления нормали к этой плоской поверхности. Это означает, что в решение уравнений движения, ко- торые мы стремимся отыскать, будут входить четыре произвольные функции. Таким образом, нам нужна гамильтонова теория (по крайней мере) с четырьмя первичными связями первого рода. X0' s, 1 2 3 X X X Рис. 1
Глава 3. Квантование на искривленных поверхностях 47 Могут существовать и другие первичные связи первого рода, если имеются степени свободы движения иного типа, например, если воз- можны градиентные преобразования электродинамики. Чтобы упрос- тить обсуждение, я пренебрегу этой возможностью существования других первичных связей первого рода и буду рассматривать только те связи, которые обусловлены требованиями теории относительности. Мы могли бы продолжить построение теории, относящейся к этим плоским про- странственноподобным поверхностям, кото- рые могут двигаться с четырьмя степеня- ми свободы, но мне бы хотелось рассмотреть сначала более общую теорию, в которой мы будем интересоваться состоянием, опреде- ленным на произвольной искривленной про- странственноподобной поверхности типа S на рис. 2. Она представляет собой трехмер- ную поверхность в пространстве-времени, обладающую тем свойством, что она везде пространственноподобна, т. е. нормаль к по- верхности находится внутри светового кону- са. Мы можем построить гамильтонову тео- рию, описывающую изменение физических условий при переходе от какой-либо одной искривленной пространственноподобной поверхности к другой, близлежащей. Вводить в рассмотрение искривленные поверхности, однако, вовсе не обязательно с точки зрения специальной теории относительности. Если бы мы хотели включить в нашу теорию гравитационные поля и принципы общей теории относительности, то тогда использование этих искривленных поверхностей имело бы полный смысл, но в слу- чае специальной теории относительности искривленные поверхности не обязательны. Однако я предпочитаю ввести их на данном этапе уже при обсуждении в рамках специальной теории относительности, так как я считаю, что объяснить основные идеи легче при использовании искривленных поверхностей, а не плоских. Объясняется это тем, что, работая с такими искривленными поверхностями, мы можем произво- дить локальные деформации поверхности, подобные SS на рис. 2, и ис- следовать изменения уравнений движения, связанные с этими локаль- ными деформациями поверхности. Рис. 2
48 Лекции по квантовой механике Один из возможных путей дальнейшего развития таков: мы мо- жем задать интеграл действия на совокупности искривленных поверх- ностей типа S, найти разность интегралов действия для двух сосед- них поверхностей, разделить эту разность на некоторый параметр 8т, служащий мерой расстояния между двумя соседними поверхностями, взять этот результат в качестве нашего лагранжиана и затем, приме- нив наш стандартный метод, перейти от лагранжиана к гамильтониану. Наш лагранжиан обязательно был бы однородной функцией первого по- рядка от скоростей, выраженных в виде производных по временному параметру т, характеризующему переход от одной из этих простран- ственноподобных поверхностей к другой, соседней. В результате мы пришли бы к гамильтоновой теории с гамильтонианом, слабо равным нулю. Однако я не хочу проделывать всю эту работу и вдаваться в под- робности процедуры, в основе которой лежит принцип действия. Я хо- чу сократить этот путь и обсудить характер получающейся в конечном счете гамильтоновой теории. Мы можем извлечь довольно много све- дений относительно характера гамильтоновой теории просто из того, что, как мы знаем, должны существовать степени свободы, отвечающие произвольному движению пространственноподобной поверхности, при условии, что она всегда остается пространственноподобной. Этим сте- пеням свободы, отвечающим движению пространственноподобной по- верхности, должны соответствовать в гамильтониане первичные связи первого рода, по одной первичной связи первого рода для каждого типа элементарных движений поверхности, которые можно ввести. Я разо- вью теорию с этой точки зрения. Прежде всего мы должны ввести подходящие динамические пере- менные. Будем описывать точку на пространственноподобной поверх- ности S тремя криволинейными координатами (ж1, ж2, ж3) = (ж'). Что- бы задать положение этой пространственноподобной поверхности в про- странстве-времени, введем другой набор координат уА (Л = 0, 1, 2, 3), в качестве которых мы можем взять прямолинейные ортогональные координаты специальной теории относительности. (Я использую за- главную букву для индекса, относящегося к у-координатной системе, и строчную букву, например г, для индекса, относящегося к ж-коорди- натной системе.) Четыре функции уА переменных хг будут характе- ризовать поверхность S в пространстве-времени, а также и способ ее параметризации, т.е. систему координат ж1, ж2, ж3.
Глава 3. Квантование на искривленных поверхностях 49 Мы можем использовать эти уА в качестве динамических коорди- нат q. Введем величину Ул,г = ^ (г = 1,2,3); C.6) она будет функцией динамических координат q. Далее введем ? C.7) где т — параметр, изменяющийся при переходе от одной поверхнос- ти к другой, соседней; это даст нам скорость q. Итак, переменные уА являются динамическими координатами, необходимыми для описания поверхности, и уА — скоростями. Нам понадобится ввести импульсные переменные гоЛ, сопряженные с этими динамическими координатами. Импульсные переменные будут связаны с координатами СП-соотношениями [Уьх,и>г*]=ёьг83(х-*')- C-8) Нам будут нужны другие переменные для описания любых физи- ческих полей, имеющихся в задаче. Если мы имеем дело со скалярным полем V, то функция У (ж) для всех значений ж1, ж2, ж3 даст нам новые динамические координаты q. Частные производные Уг будут функция- ми q. Величина dV/дт будет скоростью. Производная от У по любому направлению выражается через dV/дт и Уг, т.е. выражается через ди- намические координаты и скорости. Лагранжиан будет содержать эти производные У по произвольным направлениям и потому будет функ- цией динамических координат и скоростей. Для каждого У нам потре- буется сопряженный импульс U, удовлетворяющий СП-соотношениям [V{x), U{x')] =8z{x-x'). C.9) Таким способом трактуется скалярное поле. Аналогичный метод с введением необходимых добавочных индексов пригоден для вектор- ных, тензорных или спинорных полей. Нам нет нужды рассматривать это особо. Исследуем теперь, каким будет гамильтониан. Гамильтониан дол- жен быть линейной функцией первичных связей первого рода ти- па C.2). Прежде всего мы должны выяснить, каков вид первичных
50 Лекции по квантовой механике связей первого рода. Должны существовать первичные связи первого рода, соответствующие произвольным деформациям поверхности. Что- бы обеспечить изменение динамических координат у, эти связи долж- ны содержать переменные w, сопряженные с у, и в них будут входить другие переменные поля. Мы можем выразить такие связи в виде wA+KA*0, C.10) где КА — некоторая функция гамильтоновых переменных q и р, не зависящая явно от w. Мы можем утверждать, что гамильтониан представляет собой просто произвольную линейную функцию всех величин C.10) НТ = J cA{wA+KA)dAx. C.11) Интегрирование здесь проводится по трем координатам х, опре- деляющим точку на поверхности; с — произвольные функции трех х и времени. Общее уравнение движения, конечно, выглядит как g яз [g, Нт\- Смысл коэффициента сЛ можно выяснить, если взять это уравнение движения и положить в нем функцию g равной одной из переменных у. Для g = yA в некоторой заданной точке ж1, ж2, хъ мы получаем Уа = [г/Л, J с'Г« +K'T)dzx'] = Jc'T[yA, w'Y+K'Y]dzx. C.12) Здесь штрих при переменных поля сГ, «;г или Кт означает, что берутся значения этих величин в точке х1 , х2 , х3 . Скобка Пуассона уА с К^ равна нулю, так как К'г не зависит от w, поэтому нужно взять скоб- ку Пуассона уА только с w'r = wr(x'). Это даст нам дельта-функцию, и, следовательно, Уа = сА. C-13) Таким образом, коэффициенты сЛ оказываются величинами типа скоростей, описывающими изменение нашей поверхности с изменени- ем параметра т. Выбирая эти сЛ произвольным образом, мы можем получить произвольное изменение поверхности в зависимости от т. Это позволит нам представить вид гамильтониана в теории поля, развитой для состояний на искривленных поверхностях.
Глава 3. Квантование на искривленных поверхностях 51 Мы можем несколько глубже проанализировать свойства этого га- мильтониана, разлагая входящие в него векторы на компоненты, нор- мальные и тангенциальные к поверхности. Для любого вектора ?Л мож- но определить его нормальную компоненту где /л — единичный вектор нормали, и тангенциальные компоненты (отнесенные к ж-координатной системе) Векторы I определяются величинами уА. и поэтому являются функци- ями динамических координат. Любой вектор можно разложить таким путем на составляющие — нормальную к поверхности и тангенциаль- ные. Скалярное произведение определяется как ?аЛ* = ?±г1±+'УгЧтЛ., C-14) где /jrsdxrdxs — элемент метрики поверхности, записанный в ж-коор- динатной системе. Матрица ryrs является обратной по отношению к ^rs (г, я = 1, 2, 3). Используя определение скалярного произведения C.14), мы можем выразить наш полный гамильтониан через тангенциальные и нормаль- ные компоненты w и К: НТ = JyA(wA+KA)d3x = = f(.y±(.w± + K±) + YsVr(w8 + Ks))d3x. C.15) Здесь уА = уА1А и уг = уАуАг. Нам понадобится знать СП-соотношения между нормальными и тангенциальными членами выражения C.15). Я выпишу сначала СП-со- отношения для различных компонент w. Мы имеем, очевидно, К, Ч] = о. (зле) Эта форма записи связана с внешними координатами у; но когда мы разложим наши величины w на нормальные и тангенциальные компо- ненты, скобки Пуассона их друг с другом уже больше не будут рав- ны нулю. Скобки Пуассона нетрудно раскрыть путем прямого расчета.
52 Лекции по квантовой механике Я не хочу вдаваться в детали этой выкладки. Упомяну только, что под- робный расчет можно найти в моей работе1. Результаты таковы: [wr, w's] = ws5yr(x — х') + w'rSjS(x — ж'), C-17) [w±, w'r] = w'±S,r(x - x'), C.18) Kl, w'±] = -2wr'S,r(x - x') - wr;rS(x - x'). C.19) Мы знаем также, что [и)д + -ЙТд, w'v + K'v] к, 0 для /j,, v = r, s или ± . C.20) Отсюда можно вывести следующее: К + Кг, ьо'„ + К'в] = = {w, + KsN,r(x - х') + « + К)Ы* ~ х')> [w± + K±, w'r + K'r] = (w'± + K'±)S,r(x - x'), C.22) [w±+K±,w'±+K'±] = = -2{wr + Kr)8,r{x - x') - {wr + Kr),r6(x - x). C.23) Эти результаты можно было бы получить непосредственно на осно- ве определений нормальных и тангенциальных компонент величин w, но проще их вывести с помощью следующих соображений. Так как все величины wv + Kr, w± +K± относятся к первому роду, их скобки Пу- ассона слабо обращаются в нуль. Поэтому К + кг, w'a + к'я], к + к±, < + к'г] и [w± + К±, w'± + К'±] все должны быть равны нулю в слабом смысле. Мы можем теперь вы- яснить, чему они равны в сильном смысле. Мы должны добавить в пра- вые части C.21)-C.23) величины, слабо равные нулю и, следователь- но, построенные из wr + Кг и w± + K± с некоторыми коэффициен- тами. Далее, раскрывая члены в правых частях, содержащие w, мы 1Р. A.M.Dirac, Can. Journ. of Math., 1951, v. 3, p. 1.
Глава 3. Квантование на искривленных поверхностях 53 сможем найти эти коэффициенты. Члены, содержащие w, могут по- явиться только из скобок Пуассона юсш (см. C.17)—C.19)). Составив скобку Пуассона [w, К'], мы не получим никаких членов с w, ибо при этом мы имеем скобку Пуассона w-импульса с некоторыми функция- ми динамических координат и импульсов, отличающихся от w, а это не может дать импульсных переменных w. Аналогично скобка Пуассо- на if с if не будет содержать никаких переменных w. Поэтому единст- венными величинами w, появляющимися в правой части C.21), будут те, которые стоят справа в C.17). Нужно ввести еще некоторые члены в правую часть C.21), чтобы все выражение в целом слабо обращалось в нуль. Какие именно члены мы должны добавить, совершенно ясно — это (iwg + KsNtr(x — х') + (w'r + K'r)SjS(x — х'). Аналогичным образом определяются правые части C.22) и C.23). Другой вопрос, которого стоит коснуться, связан с членами ws+Ks в полном гамильтониане C.15). Они соответствуют такому движению, при котором изменяется система координат на искривленной поверх- ности, но не сама поверхность. Этому отвечает движение каждой точки поверхности по касательной к ней. Положим у± = 0. Это означает, что поверхность не движется в на- правлении, перпендикулярном к ней, а просто происходит изменение координат поверхности. В таком случае мы имеем уравнения движе- ния типа g= JYsyr[g^s+Ks]d3x. C.24) Такой вид должно иметь уравнение движения, описывающее из- менение g при преобразовании системы координат на неподвижной поверхности. Однако такое изменение g должно быть тривиальным; его можно определить, просто используя геометрические свойства ди- намической переменной g. Если g — скалярная величина, то тогда нам известно, как она изменяется при изменении системы коорди- нат х1, х2, х3. Если g — компонента вектора или тензора, характер ее изменения установить несколько сложнее, но все же можно; анало- гично, если g — спинор. В любом случае это изменение g, по существу, тривиально. Это означает, что Кв можно определить из одних только геометрических соображений. Я покажу это на одном или двух примерах. В случае скалярного поля V с сопряженным импульсом U в Кг имеется член V,rU. C.25)
54 Лекции по квантовой механике Для векторного поля, скажем, трехмерного вектора As, сопряженным которому является Bs, в Кг имеется член АЙ>гВв-{АгВв),я; C.26) аналогично получаем для тензоров; выражения для спиноров несколько сложнее. Первое слагаемое в C.26) описывает изменение As, возника- ющее из-за трансляции, связанной с изменением координатной систе- мы, второе слагаемое описывает изменение А8 за счет вращения, также связанного с преобразованием системы координат. В случае скаляра по- добный член, отвечающий вращению, в C.25) отсутствует. Мы можем получить полное выражение для Кг, суммируя вклады от всевозможных полей, имеющихся в задаче. В результате мы уви- дим, что эту тангенциальную компоненту К можно найти просто из геометрических соображений. Отсюда ясно, что тангенциальная ком- понента К не имеет реального физического значения, она определяет- ся только формой математического аппарата. Величиной, существен- ной с физической точки зрения, является нормальная компонента К в C.15). Эта нормальная компонента К в сумме с нормальной ком- понентой w даст нам связь первого рода, отвечающую движению по- верхности нормально к себе самой. Это уже величина, важная с точки зрения динамики. Проблема построения гамильтоновои теории поля для состояний на этих искривленных поверхностях включает вопрос об определении выражений для К, удовлетворяющих необходимым СП-соотношени- ям C.21)-C.23). Тангенциальную составляющую можно, как мы об- судили, найти из геометрических соображений; она, конечно, долж- на удовлетворять СП-соотношению C.21). В СП-соотношение C.22) К± входит линейно; этому соотношению будет удовлетворять любая величина К±, представляющая собой скалярную плотность. Таким об- разом, для выполнения этого СП-соотношения вполне достаточно, что- бы величина К± преобразовывалась подходящим образом при изме- нении системы координат ж1, ж2, ж3. Соотношению C.23), квадратич- ному по К±, удовлетворить трудно. Поэтому проблема формулировки гамильтоновои теории поля в случае искривленных пространственнопо- добных поверхностей сводится теперь к задаче отыскания нормальной компоненты величины К, являющейся скалярной плотностью и удов- летворяющей СП-соотношению C.23).
Глава 3. Квантование на искривленных поверхностях 55 Один из возможных путей определения такой нормальной компо- ненты К основан на использовании лоренц-инвариантного принципа действия. Исходя из принципа действия, мы могли бы получить все компоненты К. Действуя таким образом, мы получили бы тангенциаль- ную компоненту К не обязательно такой же, как прежде, составленной из членов типа C.25) и C.26), из-за возможного изменения, связанно- го с контактным преобразованием. Однако эффект такого контактного преобразования можно исключить, переписав принцип действия, добав- ляя в интеграл действия полный дифференциал. Это не окажет влия- ния на уравнения движения. С помощью такого изменения принципа действия можно добиться того, чтобы тангенциальная компонента К, полученная из принципа действия, точно совпала со значением, най- денным с помощью простых геометрических соображений. Затем мы можем определить нормальную компоненту К, используя наш общий метод перехода от принципа действия к гамильтониану. Если принцип действия релятивистски инвариантен, то нормальная компонента К, полученная таким способом, должна удовлетворять условию C.23). Мы можем теперь обсудить переход к квантовой теории. В процес- се квантования мы преобразуем величины w и переменные, входящие в if, в операторы. Теперь мы должны быть осторожны при выборе спо- соба определения тангенциальных и нормальной компонент ю,ия опре- деляю их следующим образом: "V =yA,rwA, C.27) т. е. помещаю импульсную переменную w справа. (Вы знаете, что в квантовой теории результаты будут различными в зависимости от того, справа или слева мы поставим w.) Аналогично и>± = h™k- C-28) Тем самым эти величины полностью определены. Далее, в квантовой теории мы имеем слабые уравнения wr+Kr pa О и w± + К± ра 0, дающие нам, согласно B.22), дополнительные условия для волновой функции: («V + Кг)<р = О, C.29) (w± + K±)ip = 0. C.30)
56 Лекции по квантовой механике Потребуем, чтобы эти дополнительные условия были непротиворечивы. Согласно B.25) мы должны добиться того, чтобы в перестановочных со- отношениях C.21)-C.23) коэффициенты в правых частях стояли перед связями (слева от них). В случае тангенциальных компонент условия C.21) будут выпол- нены, если мы подберем порядок следования сомножителей в Кг так, чтобы импульсные переменные всегда находились справа. В C.21) у нас есть ряд величин, которые линейны по импульсным переменным, при- чем последние находятся справа; коммутатор любых двух таких вели- чин снова будет линеен по импульсным переменным, и они снова будут стоять справа. Поэтому импульсные переменные всегда будут оказы- ваться справа, и все входящие сомножители всегда будут располагаться в желательном порядке. Теперь мы должны рассмотреть задачу упорядочения в компонен- те К±, с которой столь просто разделаться не удается. Нормальная компонента К± обычно содержит произведение некоммутирующих со- множителей, и нужно расставить их так, чтобы условия C.22) и C.23) выполнялись, причем в каждом члене в правой части коэффициенты должны находиться слева. С уравнением C.22) особых затруднений не возникает. Все, что нам нужно, это просто взять К± в виде скаляр- ной плотности, так как стоящая в правой части величина w'± + К'± не имеет при себе никаких некоммутирующих с ней коэффициентов; единственным коэффициентом служит дельта-функция, которая явля- ется с-числом, а не оператором. Однако с соотношением C.23) дело обстоит уже не так просто. Его правую часть при рассмотрении квантовой теории следует выписать в более развернутом виде: [w±+K±,w'±+K'±] = = -2Ys(ws + Ks)Sjr(x - х') - (Y"(ws + Ks)),rS(x - x'). C.31) Я записал это соотношение с коэффициентами 7rs, стоящими слева, и именно таким образом они должны быть расположены в квантовой теории. При построении квантовой теории поля для состояний на произ- вольных искривленных поверхностях необходимо определить такую величину К±, для которой имеет место СП-соотношение C.31) с ко- эффициентами 7rs; стоящими слева. Если C.31) выполняется, то до-
Глава 3. Квантование на искривленных поверхностях 57 полнительные условия C.30) непротиворечивы, а мы уже выяснили, что условия C.29) не противоречат друг другу и что C.30) согласуется с C.29). Итак, мы сформулировали условия, при выполнении которых на- ша квантовая теория будет релятивистской. Нужно, конечно, извест- ное везение, чтобы нам удалось удовлетворить этим условиям. Мы не можем сделать это в общем случае. Имеется одно важное общее прави- ло, которое состоит в том, что если нам удалось найти величину К±, удовлетворяющую этим и некоторым другим условиям, то нетрудно построить и другие К±, удовлетворяющие рассматриваемым услови- ям. Допустим, что мы имеем решение, в котором К содержит только недифференцируемые импульсные переменные вместе с динамически- ми переменными, которые могут находиться под знаком производной. Существует ряд простых полей, для которых К± удовлетворяет СП-со- отношениям C.22) и C.23) и имеет указанный простой вид. Тогда мы можем прибавить к К± произвольную функцию недифференцируемых переменных q. Иначе говоря, мы берем новую величину Очевидно, что добавление к К± этого члена <р может повлиять на пра- вую часть C.31) и там появится величина, пропорциональная дель- та-функции. Мы не можем получить никаких производных от дель- та-функции, ибо добавочные члены происходят от скобок Пуассона функции <p{q) с недифференцируемыми импульсными переменными. Поэтому единственным изменением правой части в результате добав- ления к К± члена <р может быть появление слагаемого, кратного дель- та-функции. Но правая часть должна быть антисимметричной относи- тельно перестановки х и х'', ибо левая часть, очевидно, обладает этим свойством. Это обстоятельство как раз и исключает возможность по- явления величины, пропорциональной дельта-функции, в правой час- ти C.31), так что она вовсе не изменится. Поэтому, если исходная ве- личина К± удовлетворяет СП-соотношению C.31), то тогда и новая величина К\_ будет обладать тем же свойством. Чтобы завершить доказательство, нужно принять во внимание еще одно обстоятельство. Величина <р может также содержать Г = = у/— detgVs- Прямым расчетом нетрудно проверить, что [w±, Г'] со- держит недифференцируемую 6(х — х'), и поэтому наше рассуждение останется в силе, если включить Г в <р. Фактически мы должны это
58 Лекции по квантовой механике сделать, иначе мы нарушим справедливость соотношения C.22), тре- бующего, чтобы К\_ и К± были скалярными плотностями. Мы, таким образом, обязаны добавить Г в нужной степени, чтобы сделать <р ска- лярной плотностью. Этот метод обычно используется на практике при введении в рас- смотрение взаимодействия между полями, не нарушающего реляти- вистского характера теории. Для различных простых полей указанные условия оказываются выполненными. В таких случаях мы имеем необ- ходимый нам элемент удачи, так что мы можем учесть взаимодействие между полями описанного простого вида, и условия, обеспечивающие релятивистский характер квантовой теории, не будут нарушены. Существует несколько примеров, в которых нам не сопутствует необходимое везение, и нам не удается так расположить сомножители в К±, чтобы было справедливо соотношение C.31) с коэффициентами, стоящими слева. В таком случае мы не знаем, как провести кванто- вание теории для состояний на искривленных поверхностях. Но на са- мом деле мы пытаемся достичь значительно большего, чем необходи- мо, когда ставим перед собой задачу построения квантовой теории для состояний на искривленных поверхностях. В целях развития теории, согласующейся со специальной теорией относительности, вполне было бы достаточно ограничиться состояниями, определенными только на плоских поверхностях. Это приведет к некоторым условиям, налагае- мым на К±, не столь жестким, как те, что я сформулировал здесь. И, по всей вероятности, мы сможем удовлетворить этим менее жест- ким условиям, не будучи в состоянии удовлетворить условиям, приве- денным выше. Таким примером служит электродинамика Борна-Инфельда, ко- торая является модификацией электродинамики Максвелла и основы- вается на интеграле действия, совпадающем с максвелловским в слу- чае слабых полей, но отличающемся от него для сильных полей. Элек- тродинамика Борна-Инфельда приводит к классическому выражению для К±, содержащему квадратные корни. Это выражение имеет такой вид, что удовлетворить условиям, необходимым для построения реля- тивистской квантовой теории на искривленных поверхностях, кажется невозможным. Однако представляется возможным построить теорию на плоских поверхностях, когда эти условия оказываются менее огра- ничивающими.
Глава 4 Квантование на плоских поверхностях Мы имели дело с состояниями, определенными на произвольных пространственноподобных искривленных поверхностях в пространстве- времени. Я подытожу полученные нами результаты, касающиеся тех условий, при выполнении которых квантовая теория поля, сформули- рованная в терминах этих состояний, будет релятивистской. Для описа- ния поверхности мы вводим переменные, представляющие собой четы- ре координаты уА для каждой точки хг = (ж1, ж2, ж3) на поверхности. Переменные ж образуют криволинейную систему координат на поверх- ности. Величины у тогда рассматриваются как динамические коорди- наты, и существуют сопряженные им импульсы wA(x), также являю- щиеся функциями переменных х. Далее мы получаем набор первичных связей первого рода, возникающих в гамильтоновом формализме, типа wA+KAzi0. C.10) Величины К не зависят от w, но могут быть функциями любых дру- гих гамильтоновых переменных. В эти К будут входить имеющиеся в наличии физические поля. Мы анализируем полученные связи, разла- гая их на компоненты, тангенциальные и нормальные к поверхности. Тангенциальные компоненты суть wr + Кг и 0, D.1) тогда как нормальная компонента — w± + К± и 0. D.2) В результате этого анализа мы находим, что величины Кг можно получить лишь из геометрических соображений. Эти Кг следует рас- сматривать как нечто довольно тривиальное, связанное с такими пре- образованиями, при которых изменяются координаты поверхности, но
60 Лекции по квантовой механике сама поверхность не движется. Связям первого рода D.2) отвечает дви- жение поверхности в направлении, нормальном к ней, и они являются физически существенными. Для непротиворечивости теории должны быть выполнены СП-соот- ношения C.21)-C.23). Некоторые из этих соотношений содержат прос- то Кг и автоматически удовлетворяются в том случае, когда величи- ны Кг выбираются в соответствии с геометрическими требованиями. Некоторые из условий непротиворечивости линейны по К± и автома- тически удовлетворяются, если мы выберем К± в виде скалярной плот- ности. Далее, наконец, мы имеем условия непротиворечивости, квад- ратичные по К±, и эти последние существенны, ибо им нельзя удовле- творить с помощью тривиальных соображений. Этим важным условиям непротиворечивости можно удовлетво- рить в классической теории, если исходить из лоренц-инвариантного принципа действия и вычислять К±, следуя стандартным правилам пе- рехода от принципа действия к гамильтониану. Проблема построения релятивистской квантовой теории сводится тогда к задаче подходяще- го выбора некоммутирующих сомножителей, входящих в квантовую величину К±, т. е. такого выбора, чтобы выполнялись условия непроти- воречивости, а это означает, что коммутатор двух величин вида D.2), взятых в двух точках пространства ж1, ж2, ж3, должен быть линейной комбинацией связей с коэффициентами, стоящими слева. Таким кван- товым условиям непротиворечивости обычно бывает довольно трудно удовлетворить. Это оказывается возможным в некоторых простых при- мерах, но в более сложных случаях удовлетворить этим условиям, по- видимому, нельзя. Мы приходим к выводу о невозможности построить квантовую теорию для таких более общего типа полей, используя со- стояния, определенные на произвольных искривленных поверхностях. По-видимому, стоит упомянуть, что величины К имеют простой физический смысл: Кг можно интерпретировать как плотность им- пульса, К± — как плотность энергии. Таким образом, плотность им- пульса, выраженная через гамильтоновы переменные, представляет со- бой величину, которую всегда легко найти просто из геометрического характера проблемы, а плотность энергии является существенной ве- личиной, которую необходимо выбрать правильно (удовлетворив опре- деленным перестановочным соотношениям), чтобы выполнялись тре- бования релятивистской инвариантности.
Глава 4- Квантование на плоских поверхностях 61 Даже если не удается построить квантовую теорию, используя со- стояния, определенные на произвольных искривленных поверхностях, может все же оказаться возможным построить такую теорию, исполь- зуя состояния, определенные только на плоских поверхностях. Соответствующую классическую теорию можно получить, нало- жив просто условия, которые сведут искривленные поверхности, рас- сматривавшиеся нами ранее, к плоским. Эти условия будут следующи- ми. Поверхность характеризуется функциями уА(х); чтобы она была плоской, указанные функции должны иметь вид уА(х) =aA + bArxr, D.3) где коэффициенты а и b не зависят от переменных х. Если функ- ции Уд (ж) имеют такой вид, то поверхность будет плоской и система координат хТ станет прямолинейной. На данном этапе мы не требуем, чтобы система координат хг была ортогональной — я введу эти усло- вия несколько позже. Таким образом, мы рассматриваем произвольную косоугольную прямолинейную систему координат хт. Теперь наша поверхность задана величинами аЛ, ЬАг, и эти вели- чины будут выступать в качестве динамических переменных, нужных для задания поверхности. Их стало значительно меньше, чем прежде. Фактически у нас здесь только 4 + 12 = 16 переменных. Мы имеем эти 16 динамических переменных, определяющих поверхность, вмес- то прежних уА(х), эквивалентных совокупности 4 • ос3 динамических координат. Ограничив таким способом класс поверхностей, мы можем рас- сматривать это ограничение как введение ряда связей в наш гамиль- тонов формализм — связей, которые выражают 4 • сю3 координат у че- рез 16 переменных. Эти связи будут связями второго рода. Введение таких связей означает сокращение числа эффективных степеней свобо- ды для поверхности с 4 • сю3 до 16 — весьма кардинальное сокращение! В предыдущей лекции я обрисовал общий метод трактовки связей второго рода. Сокращение числа эффективных степеней свободы при- водит к новому определению скобок Пуассона. Этот общий метод не обязателен в данном случае, поскольку здесь условия достаточно прос- ты и можно воспользоваться более прямым методом. В самом деле, мы можем непосредственно установить, что эффективные импульсные пе- ременные остаются в теории и после сокращения числа эффективных степеней свободы для поверхности.
62 Лекции по квантовой механике Ограничив таким образом наши динамические переменные, мы должны, конечно, наложить ограничение и на скорости: У А = а а + bkrxr. D.4) Точка сверху означает дифференцирование по некоторому параметру т. С изменением т изменяется рассматриваемая плоская поверхность — она перемещается параллельно самой себе и при этом изменяется на- правление ее нормали. Поверхность, таким образом, движется с че- тырьмя степенями свободы, и зависимость аА + ЪАг от параметра т отражает это движение. Полный гамильтониан теперь есть НТ = JyA(wA+KA)d3x = = аА f(wA + KA)d3x + ЪА f xr(wA + KA)d3x. D.5) (Я вынес величины аА и bA за знак интеграла, поскольку они не зависят от переменных х.) Выражение D.5) содержит переменные w только в виде комбинаций / wAd3x и / xrw d3x. Здесь мы имеем 16 комбинаций переменных w, которые будут служить новыми импульсными переменными, сопряженными 16 переменным а и Ь, требующимся для описания поверхности в данном случае. Мы можем снова выразить Нт через нормальные и тангенциальные компоненты этих величин: Яг = aklA f(w± + K±)d3x + aAbAr f (wr + Kr)d3x + + bAlA f xr(w± + K±)d3x + bAxbA f xr(ws + Ks)d3x. D.6) Теперь введем условие: координатная система хг ортогональна. Это значит, что ЬаХ = grs = Srs- D.7)
Глава 4- Квантование на плоских поверхностях 63 Дифференцируя D.7) по т, получаем htf+bAtf=O. D-8) (Я совершенно свободно поднимаю индексы Л, так как Л-координатная система является просто координатной системой специальной теории относительности.) Из этого уравнения видно, что величина bArb^ ан- тисимметрична по индексам г и s. Поэтому последний член в выраже- нии D.6) равен fr(ws + Ks) - xs(wr + Kr)} d3x. Теперь вы видите, что в НТ входит не столь много, как прежде, линейных комбинаций переменных w. Единственными остающимися линейными комбинациями w являются следующие: Р±= I w±d3x, D.9) Pr = I wrd3x, D.10) а также = f xr Mr± = f xrw±d3x D.11) = / {xrws - Mrs = / (xrws - xswr)d3x. D.12) (Теперь мы можем совершенно спокойно поднимать и опускать индек- сы г, так как они относятся к прямолинейным ортогональным осям.) Эти величины представляют собой импульсные переменные, сопряжен- ные переменным, требующимся для задания поверхности в том случае, когда, согласно наложенному ограничению, поверхность является плос- кой относительно прямолинейной ортогональной системы координат. Весь набор импульсных переменных, определяемых выражения- ми D.9)-D.12), можно записать как Рд и МД!/ = —Mvll, где индек- сы /1 и v принимают 4 значения, причем значение 0 соответствует нор- мальной компоненте, а значения 1, 2, 3 отвечают трем ж-компонентам.
64 Лекции по квантовой механике Индексы fi и V, относящиеся к ж-координатной системе, обозначены строчными буквами, чтобы отличить их от индекса Л, относящегося к фиксированной у-координатной системе. Итак, теперь число наших импульсных переменных сокращено до 10, и соответственно этим 10 импульсным переменным мы имеем 10 первичных связей первого рода, которые можно записать как «0, D.13) М„„ + т„„ и 0, D.14) где Р± = I K±d3x, D.15) Pr = f Krd3x, D.16) тг± = / xrK±d3x D-17) и mrs = / (xrKs - xsKr)<fx. D-18) Мы имеем теперь 10 первичных связей первого рода, отвечающих движению плоской поверхности. В третьей лекции я упомянул, что не- обходимо иметь 4 первичные связи первого рода C.10), чтобы плос- кая поверхность могла произвольно двигаться. Сейчас мы видим, что ограничиться четырьмя связями неудобно. Это число нужно увеличить до 10, потому что 4 элементарных движения поверхности (нормально к самой себе и изменение направления ее нормали) не образуют группу. Чтобы получить набор элементарных движений, составляющих группу, мы должны расширить его с 4 до 10, причем 6 добавочных элементов группы включают трансляции и повороты поверхности. Эти послед- ние движения сводятся просто к преобразованию системы координат на поверхности, но не влияют на поверхность как целое. Таким путем мы пришли к гамильтонову формализму, содержащему 10 первичных связей первого рода. Мы должны теперь обсудить условия непротиворечивости, выра- женные посредством СП-соотношений. Они должны выполняться для
Глава 4- Квантование на плоских поверхностях 65 того, чтобы все связи были связями первого рода. Рассмотрим сна- чала СП-соотношения, связывающие друг с другом импульсные пе- ременные Рц и Ммг/. Эти импульсные переменные заданы, соглас- но D.9)-D.12), через w, а нам известны СП-соотношения переменных w друг с другом, а именно C.17)-C.19), следовательно, мы сможем найти СП-соотношения для переменных Р и М. Однако нет необходимости продолжать здесь процедуру определения СП-соотношений для пере- менных Р и М. Достаточно уяснить себе, что эти переменные в точ- ности соответствуют операторам трансляций и поворотов в четырех- мерном плоском пространстве-времени, и потому СП-соотношения для них должны точно соответствовать перестановочным соотношениям между операторами трансляций и поворотов. В любом случае мы по- лучаем следующие СП-соотношения: [Р», РА = 0 D.19) (это означает, что различные трансляции коммутируют), [Р„, Мра] = gfipPa - gflaPp, D.20) [Мм„, Мра] = -gpPMv<T + gvpM^ + g^Mvp - gvvMpp. D.21) Теперь рассмотрим условия, при выполнении которых первичные связи D.13) и D.14) будут первого рода. Скобка Пуассона любых двух из них должна быть величиной, которая слабо равна нулю, и, следо- вательно, она должна представлять собой линейную комбинацию этих связей. Таким образом, мы приходим к СП-соотношениям = 0, D-22) ц + Рц, Мра + П1ра\ = gp.piPa + ра) ~ g»APP + Рр) D-23) [М„„ + т„„, Мра + тра] = -glip(Mva + mva) + + gvp{Mlia + т^и) + g^iM^p + mvp) - guaiM^p + гпцр). D.24) Для получения этих соотношений использовалось следующее сооб- ражение: в правой части каждого соотношения должна стоять величина, которая слабо равна нулю, и нам известны члены в правых частях, в ко- торые входят переменные Р, М, так как эти члены происходят только
66 Лекции по квантовой механике от скобок Пуассона D.19)-D.21). (Я уже использовал то же самое со- ображение в случае искривленных поверхностей при выводе соотноше- ний C.21)-C.23), так что нет необходимости подробно рассматривать это здесь. В качестве примера разберем, как выводится D.23). Члены, содержащие Р, являются как раз теми же самыми, что и в D.20). Они получаются из скобки Пуассона Р и М. Остальные члены добавлены для того, чтобы полное выражение слабо равнялось нулю.) Соотноше- ния D.22)-D.24) представляют собой условия непротиворечивости. Мы можем провести дальнейшее упрощение, невозможное в случае криволинейных координат, следующим образом. Предположим, что на- ши основные характеристики поля выбраны таким образом, что они связаны только с ж-координатной системой. Они являются характе- ристиками поля в некоторых частных точках х на поверхности, и мы можем выбрать их так, чтобы они вовсе не зависели от у-координат- ной системы. Тогда величины К±, Кг совершенно не будут зависеть от у-координатной системы, а это означает, что скобки Пуассона К±, Кг с переменными Р, М будут равны нулю. В таком случае скобки Пуассона каждой из переменных р, т и каждой из Р, М равны нулю. Это свойство вытекает из естественного выбора динамических пе- ременных для описания имеющихся физических полей. Мы не можем провести соответствующего упрощения при использовании искривлен- ных поверхностей, потому что в величины К±, Кг войдут перемен- ные grs, с помощью которых задается метрика. Из-за этого мы не мо- жем представить К±, Кг в такой форме, которая совсем не была бы связана с у-координатной системой, поскольку координаты у входят в переменные grs. Однако для плоских поверхностей это упрощение осуществимо и приводит к тому, что соотношения D.22)-D.24) при- нимают более простой вид: [Р/., Ри] = 0, D.25) \Рц, тра] = g^pPa - gftaPp D.26) mvp - gvamw. D.27) Величины Р и М выпали из этих соотношений, так что условия непротиворечивости содержат теперь только характеристики поля, но
Глава 4- Квантование на плоских поверхностях 67 не содержат переменных, вводимых для описания поверхности. Факти- чески эти условия просто означают, что переменные рига удовлетво- ряют СП-соотношениям, соответствующим операторам трансляций и поворотов в плоском пространстве-времени. Проблема построения ре- лятивистской теории поля сводится теперь к отысканию величин р, то, удовлетворяющих СП-соотношениям D.25)-D.27). Вспомним, что эти величины определены с помощью К± и Кг — плотности энергии и плотности импульса. Выражение для плотности импульса точно такое же, как и в случае криволинейных координат. Эта величина определяется только из геометрических соображений. На- ша задача сводится к нахождению плотности энергии К±, приводящей к таким р и то, при которых соотношения D.25)-D.27) выполняются. Если мы исходим из лоренц-инвариантного интеграла действия и выводим из него К± с помощью стандартных гамильтоновых методов, то плотность энергии К± автоматически будет удовлетворять указан- ным условиям в классической теории. Проблема построения реляти- вистской квантовой теории сводится тогда к задаче правильного выбо- ра порядка сомножителей, входящих в К±, а именно такого, чтобы со- отношения D.25)-D.27) удовлетворялись также и в квантовой теории, когда скобки Пуассона переходят в коммутаторы, а р и то содержат некоммутирующие величины. Рассмотрим соотношения D.25)-D.27) и выразим в них р и т че- рез величины К. Тогда мы увидим, что некоторые из этих соотношений окажутся независимыми от К±. Они автоматически удовлетворяются при должном выборе Кг, согласующемся с геометрическими требова- ниями. Некоторые из соотношений линейны по К±. Им можно удовле- творить, взяв К± в виде трехмерной скалярной плотности в простран- стве переменных х. Итак, будем считать, что задача о выполнении со- отношений, линейных по К±, решена. Трудно удовлетворить условиям, квадратичным по К±. Они имеют следующий вид: [ [ xrK±d3x, f K'±d3x'] = Г Krd3x, D.28) \ f xrK±d3x, f x'sK'±d3x'] =- f(xrKs-xsKr)d3x. D.29) \_J J J J Уравнение D.28) получено из D.26), где мы положили fi =±, р = г и <г = ±, а уравнение D.29) получено из D.27), где мы взяли i> = ±
68 Лекции по квантовой механике и сг = ±. Таким образом, проблема получения релятивистской кванто- вой теории поля сводится теперь к задаче нахождения такой плотности энергии К±, которая удовлетворяет условиям D.28) и D.29) с учетом некоммутативности сомножителей. Мы можем проанализировать эти условия еще несколько деталь- нее, приняв во внимание, что скобка Пуассона, связывающая К± в од- ной точке и К'± в другой, будет представлять собой сумму членов, содержащих дельта-функции и производные от дельта-функций: [к±, к'±] =аё + 2br6,r + crs6,rs + ... D.30) (Символ д означает трехмерную дельта-функцию, содержащую три ко- ординаты х и три координаты х' первой и второй точек соответствен- но.) Здесь а = а(х), b = b(x), с = с(х), ... Можно было бы написать коэффициенты, зависящие также от х1', но в таком случае их мож- но заменить коэффициентами, зависящими только от х, ценой некото- рых изменений указанных коэффициентов ряда. Нет никакой глубокой асимметрии между переменными х и ж', асимметрия имеется только в отношении способа записи уравнения. Уравнение D.30) является общим соотношением, связывающим значения плотности энергии в двух точках. Далее, во многих случа- ях, включающих все наиболее известные поля, производные от дельта- функции порядка выше второго не появляются. Исследуем этот случай подробнее. Примем, что производных порядка выше второго нет. Это означает, что ряд D.30) обрывается на третьем члене. В этом частном случае мы можем получить довольно много сведе- ний относительно коэффициентов a, b и с, используя свойство антисим- метрии скобки Пуассона D.30) по отношению к перестановке точек х dbr(x') и х'. Переставляя местами ж и ж' в D.30) и учитывая, что —-^—р— = 0 и т.д., получаем [К'±, К±] = а'ё - 2Ъ'гё,г + c'rs8,rs = а'ё - 2(b'rS),r + (с>„ё),гя = = аё- 2(М),Г + {crsS),rs = (a- 2br,r + crs,ra)S + D.31) + (—2ЬГ + 2сгв)в)?)Г + crs8yTS. Выражение D.31) должно тождественно равняться выражению D.30) с обратным знаком. Чтобы коэффициенты при 8}Г8 отвечали такому
Глава 4- Квантование на плоских поверхностях 69 требованию, мы должны иметь сГ8 = 0. D.32) При этом оказываются согласованными и коэффициенты при 6уГ. Нако- нец, чтобы коэффициенты при д отвечали этому требованию, мы долж- ны иметь a = br,r. D.33) Это дает [К±, К'±] = 2br6,r + br,rS. D.34) Подставим теперь этот результат в соотношения D.28) и D.29). Они примут следующий вид: Krd3x= xrBbse,s+bs,se)d3xd3x' = xrbs,sd3x = brd3x, D.35) - (xrKs - xsKr)d3x = xrx'sBbt5j + bt,tS)d3xd3x' = J f r D-36) = / (-2xrbs + xrxsbt,t)d3x = (-xrbs + xsbr)d3x. dx (Заметим, что xTyS = -jr-r- = —ers.) Таким образом, наши условия не- противоречивости сводятся к D.35) и D.36), и мы видим, что они удов- летворяются, если взять Ъг = Кг. Это не самое общее решение; в более общем случае мы могли бы иметь ЪТ = Кг+6„,8, D.37) где #rSjS — произвольная величина, удовлетворяющая условию @г. - esr)d3x = 0. D.38) Таким образом, в может обладать произвольной симметричной частью, а ее антисимметричная часть должна представлять собой дивергенцию некоторой величины.
70 Лекции по квантовой механике В этом заключается общее требование, обеспечивающее реляти- вистский характер теории поля. Мы должны найти плотность энер- гии К±, удовлетворяющую СП-соотношению D.34), где величины Ъг связаны с плотностью импульса согласно D.37). Если мы находим плот- ность энергии из лоренц-инвариантного действия, то это условие опре- деленно будет выполнено в классической теории. Оно может не вы- полняться в квантовой теории из-за неверного расположения сомножи- телей. Релятивистски инвариантную квантовую теорию мы получим только в том случае, если нам удастся выбрать порядок сомножите- лей в выражении для плотности энергии таким образом, чтобы точно удовлетворить условиям D.34) и D.37). Условия, которые обеспечива- ют здесь релятивистский характер квантовой теории, не столь строги, как те, что мы получили, рассматривая состояния, определенные на произвольных искривленных поверхностях. Я хотел бы проиллюстрировать это на примере электродинамики Борна-Инфельда. Эта электродинамика согласуется с электродинами- кой Максвелла в случае слабых полей, но отличается от нее в случае сильных полей. (Мы относим здесь величины, описывающие электро- магнитное поле, к некоторым абсолютным единицам, определенным че- рез заряд электрона и его классический радиус, так что можно говорить о сильных и слабых полях.) Общие уравнения электродинамики Борна- Инфельда вытекают из принципа действия, причем интеграл действия равен 1=1 J-dette^+F^tPx. D.39) На этом этапе мы можем использовать криволинейные координа- ты. Тензор g^ задает метрику в криволинейных координатах, а тен- зор F^ определяет электромагнитное поле, измеряемое в абсолютных единицах. С помощью общей процедуры мы можем перейти от этого интег- рала действия к гамильтониану. В результате получим гамильтониан, в который входят, помимо переменных, нужных для описания поверх- ности, динамические координаты Аг, г = 1,2, 3. Компонента Aq оказы- вается несущественной, точно так же, как и в случае поля Максвелла. Сопряженные Аг импульсы Dr представляют собой компоненты элек- трической индукции, и они удовлетворяют СП-соотношениям [Ar, D's]=[?r8(x-x'). D.40)
Глава 4- Квантование на плоских поверхностях 71 Оказывается, что величина А входит в гамильтониан только под знаком ротора, а именно, через переменные поля: Br = \erHFH =erstAt,s. D.41) Символ erst = 1 при (rst) = A, 2, 3) и антисимметричен по всем индексам. Перестановочные соотношения между В и D таковы: [Br, D's] = erstS4x - х1). D.42) Плотность импульса в этом случае равна Kr = FrsDs. D.43) Она точно такая же, как в теории Максвелла. Это согласуется с тем общим принципом, что плотность импульса определяется только из гео- метрических соображений, т.е. задается геометрией полей, которые мы используем, и не зависит от принципа действия. Плотность энергии теперь равна К± = {Г2 - jrs(DrDs + BrBs) - Y'FrtFsuD^4}112. D.44) Здесь 7rs — метрический тензор трехмерной поверхности, и 2 . D.45) Работая с искривленными поверхностями, мы требуем, чтобы К± удов- летворяла СП-соотношению C.31). В классической теории это требо- вание обязано выполняться, поскольку величина К± получается из лоренц-инвариантного интеграла действия. Но нам не удастся добить- ся того, чтобы она удовлетворяла необходимому перестановочному со- отношению в квантовой теории. В выражении для К± имеется квад- ратный корень, из-за чего с ним очень неудобно обращаться. Кажется совершенно безнадежным пытаться точно удовлетворить перестановоч- ным соотношениям с коэффициентами jrs, стоящими слева. Поэтому, по-видимому, невозможно построить квантовую электродинамику Бор- на-Инфельда для состояния, определенного на искривленной поверх- ности.
72 Лекции по квантовой механике Перейдем, однако, к плоским поверхностям. В этом случае нам нужно рассмотреть СП-соотношение D.34). Мы знаем, что в классичес- кой теории с этим условием все обстоит благополучно. Следовательно, в классическом случае должно выполняться СП-соотношение [К±, К'±] = 2КГ6,Г + КГуГ8. D.46) И без подробного расчета ясно, что это соотношение должно остать- ся в силе и в квантовой теории, так как Кг построена целиком из Ds и В1. Действительно, переходя к квантовой теории, мы получаем вели- чины D и В, расположенные некоторым образом, но все D и В, взятые в одной и той же точке, коммутируют друг с другом. Это видно из формулы D.42). Если положить в ней х' = х, то мы найдем [Br,D']=ere%@) = 0 D.47) (производная от дельта-функции при значении аргумента, равном ну- лю, считается равной нулю). Таким образом, нас не должен беспоко- ить вопрос о некоммутативности D и В, входящих в Кг. Поэтому мы должны получить классическое выражение, так что условия непроти- воречивости выполняются. Таким образом, в случае электродинамики Борна-Инфельда усло- вия непротиворечивости в квантовой теории на плоских поверхностях выполняются, хотя они не выполняются на искривленных поверхнос- тях. Физически это означает, что мы можем сформулировать основные уравнения квантовой электродинамики Борна-Инфельда в согласии со специальной теорией относительности, но мы столкнемся с затрудне- ниями, если захотим согласовать эту теорию с общей теорией относи- тельности. Этим завершается обсуждение условий непротиворечивости, обес- печивающих релятивистский характер квантовой теории. Однако, даже удовлетворив этим условиям, мы еще не избавимся от всех затрудне- ний. На нашем пути имеется еще ряд вполне внушительных препят- ствий. Если бы мы имели дело с системой только с конечным числом степеней свободы, то все препятствия были бы преодолены и перед на- ми стояла бы задача непосредственно решить дифференциальные урав- нения для ф. Но в теории поля имеется бесконечное число степеней свободы, и эта бесконечность может привести к неприятности. Как правило, так оно и бывает.
Глава 4- Квантование на плоских поверхностях 73 Мы должны решить уравнения, в которых искомая величина — волновая функция ф — зависит от бесконечного числа переменных. Обычным методом решения уравнений такого типа является примене- ние теории возмущений, в которой волновая функция разлагается в ряд по степеням некоторого малого параметра, и решение ищется методом последовательных приближений. Но мы сталкиваемся с тем осложне- нием, что на некотором этапе уравнения приводят к расходящимся ин- тегралам. На разрешение этой проблемы затрачены огромные усилия. Разви- ты методы обращения с этими расходящимися интегралами, которые, по-видимому, удовлетворительны с точки зрения физика, даже если их невозможно обосновать математически1. Создана техника перенор- мировок, позволяющая устранить расходимости в некоторых случаях теории поля. Поэтому, даже удовлетворив формально требованиям непротиво- речивости, мы можем столкнуться еще с тем затруднением, что не бу- дем знать, как найти решения волнового уравнения, удовлетворяющие необходимым дополнительным условиям. Если мы сможем получить такие решения, то останется еще дальнейшая проблема введения ска- лярных произведений для них, т. е. мы должны будем рассмотреть эти решения как векторы в гильбертовом пространстве. Ввести эти скаляр- ные произведения необходимо, так как это позволит дать физическую интерпретацию нашей волновой функции по обычным правилам физи- ческой интерпретации квантовой механики. Скалярные произведения необходимо задать для волновых функций, удовлетворяющих дополни- тельным условиям, но мы не обязаны беспокоиться об определении ска- лярных произведений для волновых функций общего вида, не удовле- творяющих дополнительным условиям. Может оказаться, что для этих общих волновых функций нет никакого способа ввести скалярные про- изведения, но это не имеет никакого значения. Для физической интер- претации в квантовом случае требуется только, чтобы эти скалярные произведения существовали для волновых функций, удовлетворяющих всем дополнительным условиям. Вы видите, что в задаче построения гамильтоновой теории в кван- товом аспекте имеются весьма внушительные трудности. Что касается классической формулировки, развитый метод, по-видимому, в значи- 1 Процедура перенормировок в квантовой теории поля строго обоснована матема- тически в работах Н.Н.Боголюбова и его последователей. (Прим. ред.)
74 Лекции по квантовой механике тельной мере завершен, и мы ясно представляем себе положение вещей; в случае же квантовой механики мы фактически только приступили к исследованию проблемы. Имеются трудности в нахождении реше- ний, даже когда дополнительные условия формально непротиворечивы, и затруднения возможны также при введении скалярных произведений для решений. Затруднения весьма серьезны, и это привело к тому, что ряд физи- ков подвергает сомнению ценность всего метода Гамильтона. Довольно много физиков работают сейчас над проблемой построения квантовой теории поля без использования какого бы то ни было гамильтониана. Их общий метод состоит в следующем. В рассмотрение вводят величины, имеющие физический смысл; далее используют общие принципы для того, чтобы наложить условия на рассматриваемые величины, и наде- ются, в конце концов, что условий, налагаемых на физически важные величины, окажется достаточно для вычисления их. Сторонники этого метода все еще очень далеки от цели, и, по моему мнению, обойтись во- все без метода Гамильтона невозможно. Метод Гамильтона доминирует в механике при классическом подходе. Возможно, что наш метод пере- хода от классической механики к квантовой механике еще не является корректным. Тем не менее я думаю, что любая будущая квантовая те- ория должна содержать элемент соответствия гамильтоновой теории, может быть, даже и не в такой именно форме, как это представлено здесь. Я довел изложение метода Гамильтона до той стадии, до которой он разработан к настоящему времени. Это очень общий и мощный ме- тод; его можно использовать в самых разных задачах. Он может быть приспособлен к задачам, в которых поле имеет сингулярности (в точ- ке или на поверхности). При таком развитии гамильтоновой теории мы должны руководствоваться следующей общей идеей. Нужно най- ти такое действие I, зависящее от некоторых параметров q, что при варьировании q мы будем иметь вариацию 61, линейную по Sq. Ли- нейность 81 по 5q необходима для того, чтобы можно было применить рассмотрение, описанное в настоящих лекциях. Способ, с помощью которого можно ввести свойство линейности при наличии сингулярностей, состоит в следующем. Нужно использо- вать криволинейные координаты и не варьировать никаких уравнений, определяющих положение сингулярной точки или сингулярной поверх- ности. Например, если мы имеем дело с сингулярной поверхностью, за-
Глава 4- Квантование на плоских поверхностях 75 данной уравнением fix) = О, то мы должны иметь вариационный прин- цип, в котором fix) не варьируется. Если мы позволим функции /(ж) изменяться и будем считать, что / сама определяет некоторые из пара- метров q, то в этом случае вариация 81 не будет линейной по Sq. Но мы можем фиксировать /(ж) относительно некоторой криволинейной сис- темы координат х и затем варьировать поверхность путем варьиро- вания криволинейной системы координат при равной нулю вариации функции /. В таком случае общий метод, который я здесь обсудил, ока- зывается вполне удовлетворительным в рамках классической теории. При переходе к квантовой теории возникают затруднения, о которых я говорил.
ОБОБЩЕННАЯ ГАМИЛЬТОНОВА ДИНАМИКА* 1. Введение Уравнениям динамики придал общий вид Лагранж, записавший их в терминах набора обобщенных координат и скоростей. Альтернатив- ный общий вид в терминах координат и импульсов позднее был дан Гамильтоном. Рассмотрим сравнительные достоинства этих двух форм. В лагранжевой форме очень легко удовлетворить требованиям спе- циальной теории относительности, просто взяв лоренц-инвариантным действие, т.е. интеграл лагранжиана по времени. Так просто сделать релятивистской гамильтонову форму нельзя. При построении квантовой теории следует исходить из гамиль- тоновой формы. Имеются прочно укоренившиеся правила перехода от гамильтоновой динамики к квантовой динамике путем превращения координат и импульсов в линейные операторы. В простых случаях эти правила приводят к однозначным результатам, и хотя в сложных при- мерах без неоднозначностей не обходится, практическая пригодность правил установлена. Таким образом, в настоящее время каждая из форм имеет собст- венную ценность, и пользоваться следует обеими. Обе формы тесно свя- заны. Исходя из любого лагранжиана можно ввести импульсы, и в слу- чае, когда импульсы суть независимые функции скоростей, можно по- лучить гамильтониан. Настоящая статья посвящена построению более общей теории, применимой и в ситуации, когда импульсы не являют- ся независимыми функциями скоростей. Получена более общая форма гамильтоновой динамики, которую по-прежнему можно использовать для квантования и которая оказывается специально приспособленной для релятивистского описания динамических процессов. *Can. J. Math., V. 2, №2 A950), Р. 129-148. Перевод с английского В.П.Павлова. Эта работа основана на первой половине курса лекций, прочитанного на Канад- ском математическом семинаре в Ванкувере в августе 1949 г.
2. Сильные и слабые уравнения 77 2. Сильные и слабые уравнения Рассмотрим динамическую систему с N степенями свободы, опи- сываемую обобщенными координатами qn (п = 1, 2, ... , N) и скорос- тями dqn/dt или qn. Возьмем лагранжиан L, который пока может быть произвольной функцией координат и скоростей L = L{q, q). B.1) Определим импульсы соотношением Рп = ft" B-2) Для развития теории введем вариационную процедуру, варьируя каждую из величин qn, qn, pn независимо на малую величину Sqn, Sqn, Spn порядка е и работая с точностью до ё. В результате такой вариа- ции уравнение B.2) нарушится, так как его левая часть будет отлична от правой на величину порядка е. Теперь нам придется различать два сорта уравнений: уравнения типа B.2), которые оказываются нарушен- ными на величину порядка е после применения вариации, и уравнения, остающиеся справедливыми с точностью до е под действием вариации. Уравнение B.1) будет этого второго сорта, поскольку вариация L будет по определению равна вариации функции L(q, q). Уравнения первого сорта мы будем называть слабыми уравнениями и писать их с обычным знаком равенства «=», а уравнения второго будем называть сильными уравнениями и писать их со знаком «=». Мы имеем следующие правила, регулирующие алгебраические дей- ствия со слабыми и сильными уравнениями: если А = 0, то 6А = 0; еслиХ=0, то Из слабого уравнения X = 0 мы можем заключить, что SX2 = 2XSX = О, так что получится сильное уравнение Х2 = 0.
78 Обобщенная гамилътонова динамика Аналогично из двух слабых уравнений Х\ = 0 и Хг = 0 мы можем вывести сильное уравнение ХХХ2 = 0. Может оказаться, что все N величин dL/dqn в правой части B.2) являются независимыми функциями N скоростей qn. В этом случае уравнения B.2) определяют каждую q как функцию аргументов q и р. Об этом случае будем говорить как о стандартном, и именно его обыч- но рассматривают в динамической теории. Если dL/dqn не являются независимыми функциями скоростей, можно исключить q из уравнений B.2) и получить одно или более урав- нений ф, р) = 0, B.3) содержащих только переменные q и р. Мы можем считать уравне- ние B.3) записанным так, что вариация меняет <р на величину поряд- ка е, так как если она меняет ip на величину порядка ек, то следует лишь заменить в B.3) ц> на у1/*, и желаемое условие окажется выполненным. Теперь вариация нарушает уравнение B.3) на величину порядка г, так что оно правильно пишется как слабое уравнение. Нам потребуется ис- пользовать полный набор независимых уравнений типа B.3), например: <Pm{q,p) = 0, m = l, 2, ...,М. B.4) Условие независимости означает, что ни одну из (р нельзя представить в виде линейной комбинации остальных с коэффициентами, зависящи- ми от q и р. Условие полноты означает, что любая функция аргументов q и р, обращающаяся в нуль вследствие уравнений B.2) и меняющаяся при вариации на величину порядка е, может быть представлена как ли- нейная комбинация функций tpm с коэффициентами, зависящими от q и р. Мы можем следующим образом описать соотношение между силь- ными и слабыми уравнениями. Возьмем ЗТУ-мерное пространство с ко- ординатами <7, q и р. В этом пространстве найдется 27У-мерная область, в которой уравнения B.2) удовлетворяются. Назовем ее областью R. Уравнения B.4) также удовлетворяются в этой области, поскольку они следуют из B.2). Рассмотрим теперь все точки ЗТУ-мерного простран- ства, которые удалены от R не далее чем на расстояния порядка е. Они
3. Гамильтониан 79 образуют SN-мерную область подобную оболочке с толщиной поряд- ка е. Назовем ее областью Re. Слабое уравнение выполняется в облас- ти R, сильное уравнение выполняется в области Rs. 3. Гамильтониан Гамильтониан Я определяется соотношением Я = pnqn - L, C.1) где подразумевается суммирование по всем значениям повторяющегося в одном члене индекса. Имеем SH = S(pnqn - L) =pnSqn + qnSpn - -^—Sqn - -^Sqn = qnSpn - -^—Spn. oqn oqn oqn C.2) Мы обнаружили, что SH не зависит от Sqn. Этот важный результат справедлив вне зависимости от того, стандартный у нас случай или нет. Уравнение C.1) дает определение Н как функции q, q и р, справед- ливое во всем ЗТУ-мерном пространстве q, qn p. Мы будем пользоваться этим определением только в области Re, а в ней справедлив, с точнос- тью до первого порядка, результат C.2). Это означает, что если мы оставим постоянными q и р и возьмем вариацию первого порядка у q, вариация Н будет второго порядка. Таким образом, если мы сохраним постоянными q и р и возьмем конечную вариацию q, оставаясь все время в области Re (что возможно, когда случай не стандартный), ва- риация Н будет первого порядка. Если же мы остаемся в области R, вариация Н будет равна нулю. Следовательно, в области R гамильтони- ан Н является функцией только q и р. Обозначив эту функцию Ж(д, р), мы имеем слабое уравнение Я = Jtf(q, p), C.3) справедливое в области R. В стандартном случае функция Ж — это обычный гамильтониан. Отправляясь от точки вйи совершая общую вариацию, из C.2) мы имеем 6(Н -Ж)= (qn - w
80 Обобщенная гамилътонова динамика Таким образом, 8{Н — Ж) зависит только от Sq и др. Если вариация такова, что мы остаемся в области R, то, конечно, д(Н — Ж) = 0. Та- ким образом, д(Н — Ж) обращается в нуль для любой такой вариации q и р, что можно выбрать Sq сохраняющими уравнения B.2). Это на- лагает на Sq и 8р единственное ограничение — чтобы они сохраняли уравнения B.4), т. е. приводили к Spm = 0 для всех т. Таким образом, 6(Н — Ж) равна нулю для любых величин Sq, Sp, которые дают 6срт = 0, а, следовательно, для произвольных Sq, Sp S(H -Ж) = vmSym C.4) с подходящими коэффициентами vm. Эти коэффициенты будут функ- циями q, q и р, а с помощью B.2) их можно представить функциями только q и q. Теперь из C.4) и B.4) мы получаем S(H - Ж - vmipm) = S(H -Ж)- vmS(pm - ipmSvm = 0 и, следовательно, H = 3tf + vmipm. C.5) Мы имеем здесь сильное уравнение, справедливое с точностью до первого порядка в области Re, в противоположность слабому уравне- нию C.3), справедливому только в R. Уравнение C.4) дает х дЖх . дЖ с . д д v6<p = 8p + 6q + v Сравнивая это с C.2), мы получаем дЖ q= dqn dqn орпт C.7) dq Уравнения C.6) выражают q через q, p и v, C.6) и C.7) показыва- ют, что 2N переменных qn, qn можно выразить через 2N + М перемен- ных qn, pn, vm. Между этими 2N + М переменными имеется М соотно- шений B.4). Любых других соотношений между этими переменными
4. Уравнения движения 81 быть не может, иначе 2N переменных qn, qn не были бы независимыми. Таким образом, каждая из v не должна зависеть от q, р и остальных v. Сами v можно считать переменными типа скорости, служащими для фиксации тех q, которые нельзя выразить через q и р. Работая с гамильтоновой формой динамики, мы используем в ка- честве основных переменные q, p и v, которые предполагаются связан- ными некоторыми соотношениями B.4), а в остальном — независимы- ми. Мы будем называть их гамильтоновыми переменными. 4. Уравнения движения Обычные лагранжевы уравнения движения мы считаем слабыми уравнениями Подставляя в D.1) значения р из B.2), мы получаем уравнения, содер- жащие ускорения qn. В стандартном случае эти уравнения определят все q как функции q и q. В случае с М уравнениями B.4) уравнения движения дадут нам только (N — М) уравнений для q. Остающиеся М уравнений движения покажут нам, как меняются со временем tpm. Для самосогласованности tpm должны остаться нулями. Эти условия само- согласованности будут исследованы позднее. С помощью C.7) уравнения движения D.1) принимают вид Уравнения D.2) вместе с C.6) образуют гамильтоновы уравнения дви- жения. Их задают функция Ж и уравнения tpm = 0. Гамильтоновы уравнения движения выражают q и р через гамильтоновы перемен- ные q, p, v. Они не дают прямой информации о v, но исследование усло- вий самосогласованности даст нам некоторую косвенную информацию. Гамильтоновы уравнения движения выглядят проще, если восполь- зоваться понятием скобки Пуассона (СП). Для любых двух функций ? и т] аргументов q и р СП [?, 77] определяется соотношением Г? 1 - ®L д± _ д^дт]_ [^vi~dqndpn dPndqn- {^-6)
82 Обобщенная гамилътонова динамика Легко проверить, что СП остается инвариантной относительно такого преобразования к новым q и р, при котором новые q — любые неза- висимые функции первоначальных q, а новые р определяются новыми уравнениями B.2) с L, выраженным через новые q и их производные по времени. СП приобретает свое значение благодаря этому свойству инвариантности. СП обладает следующими свойствами, легко проверя- емыми из определения: К, v] = -iv, & К, f(m, 42, ...)] = |?К, 4i] + |?& %] + ... , D-4) К, [v, С]] + [v, [С, С]] + [С, К, ч]] = о. Во втором из этих свойств / — любая функция набора величин щ, щ, ..., каждая из которых зависит от q и р. Третье свойство, называ- емое тождеством Пуассона1, справедливо для любых трех функции ?, г), С, зависящих от q и р. Желательно расширить понятие СП на функции, зависящие от ско- ростей q, которые нельзя выразить только через q и р. Мы примем, что эти более общие СП обладают свойствами D.4), а в остальном про- извольны. Напротив, мы можем предположить, что q произвольным образом зависят от q и р, а свойства D.4) тогда можно вывести для ?, Т] и С, зависящих и от q. Из сильного уравнения А = 0 мы можем вывести слабые уравнения М М 9Л =0 0 =0 =0 с^п ' dqn ' и, следовательно, с использованием второго из свойств D.4) К, 4 = о для любой ?. Может оказаться, что [?, Л] = 0 (например, когда А = 0 по определению), но в общем случае это не так. Из слабого уравнения X = 0 не следует общего заключения, что [?, X] = 0. 1В нашей литературе это тождество обычно называют тождеством Якоби. (Прим. перев.)
5. Однородность по скоростям 83 Если g — любая функция q и р, из C.6) и D.2) мы имеем D.5) Это — общее гамильтоново уравнение движения. С помощью B.4) его можно переписать и виде g = [g, Ж] + vm[g, ipm] + [g, vm](pm = [g, H], D.6) в точности совпадающем с обычным гамильтоновым уравнением дви- жения, записанным через СП. 5. Однородность по скоростям Теория принимает особенно простой вид в случае, когда лагран- жиан однороден первой степени по скоростям. Тогда определяемые со- отношением B.2) импульсы однородны нулевой степени по q и зависят поэтому только от отношений q. Поскольку имеется N импульсов р и только N — 1 независимых отношений q, теперь р не могут быть независимыми функциями q, и должно существовать хотя бы одно со- отношение B.4), связывающее q и р. Случай, когда имеется только одно соотношение между q и р, можно считать теперь стандартным. Из теоремы Эйлера мы имеем и, следовательно, L = qnpn, так что Н = 0. E.2) Это слабое уравнение, справедливое в области R, позволяет нам взять Ж = 0, так что C.5) переходит в Я = vm(pm. E.3)
84 Обобщенная гамилътонова динамика Общее уравнение движения D.5) теперь имеет вид g=vm\g,<pm]. E.4) Гамильтоновы уравнения движения полностью фиксированы теперь уравнениями ipm = 0. Правая часть уравнения E.4) однородна по v. Взяв любое реше- ние уравнений движения, можно получить из него другое решение, домножив все v на множитель j, произвольно меняющийся со вре- менем. Скорость изменения всех динамических переменных в новом решении будет домножена на j. Новое решение получится из предыду- щего, если время t заменить новой независимой переменной т, такой, что dt/dr = 7- Новая независимая переменная совершенно произволь- на: она может быть любой функцией t, а также q и q. Итак, взяв лю- бое решение уравнений движения, мы можем получить из него другое решение, заменив t произвольной т, так что уравнения движения не да- ют нам никакой информации о независимой переменной. В этом состо- ит важная черта динамической теории с однородностью по скоростям, предоставляющая особые удобства для релятивистской формулировки. Лагранжиану любой динамической системы можно придать одно- родность по скоростям, взяв время t дополнительной координатой qo и воспользовавшись уравнением % = 1, чтобы добиться однородности первой степени по всем скоростям, включая qo. Как было показано авто- ром [1], после этого можно вывести новые лагранжевы уравнения дви- жения для всех q. Так мы можем получить новую формулировку в «од- нородных скоростях» для общей динамической системы. Новая форму- лировка даст все уравнения старой, за исключением уравнения до = 1- Если в новой формулировке желательно его иметь, мы можем считать его дополнительным условием, не выводимым из уравнений движения, но согласованным с ними. Однако мы вполне можем обойтись и без него, так как его роль сводится лишь к фиксации независимой переменной, которая без этого в «однородной» формулировке была бы произвольной. Таким образом, мы можем без потери общности ограничиться те- орией с однородностью по скоростям. Поскольку она приводит к не- сколько более простым уравнениям, в дальнейшем мы и сделаем это. Точка будет обозначать дифференцирование по произвольной незави- симой переменной т.
6. Условия самосогласованности 85 6. Условия самосогласованности Для самосогласованности уравнения движения должны сохранять нулем каждую из ipm. Таким образом, подставив tpmi вместо g в E.4), мы получаем Vm[<Pm', <Рт] = 0. F.1) Предположим, что уравнения F.1) приведены к наиболее простому виду с помощью набора уравнений B.4). При этом допускается сокра- щение множителей, когда их можно считать не обращающимися в нуль. Получившиеся уравнения должны быть одного из четырех типов. Тип 1. Уравнение содержит некоторые из переменных v. Тип 2. Уравнение не зависит от v, но содержит некоторые из пе- ременных q и р. Таким образом, оно имеет вид x{q, p) = о F.2) и не зависит от уравнений B.4). Тип 3. Уравнение сводится к 0 = 0. Тип 4. Уравнение сводится к 1 = 0. Уравнение типа 2 приводит к новому условию самосогласованнос- ти, так как х должна сохранять нулевое значение. Подставив в E.4) X вместо g, мы получаем «т[Х,?>т]=0. F.3) Это уравнение, приведенное к наиболее простому виду с помощью уравнений B.4) и уже имеющегося уравнения F.2), снова будет одним из четырех типов. Будучи уравнением типа 2, оно приведет еще к одно- му новому условию самосогласованности. Эта процедура продолжается для каждого уравнения типа 2, пока она не приведет к уравнению дру- гого типа. Если одно из полученных таким образом уравнений — типа 4, то уравнения движения противоречивы. Этот случай не представляет ни- какого интереса и в дальнейшем не рассматривается. Уравнения ти- па 3 удовлетворяются автоматически. В итоге в нашей теории остаются уравнения типов 1 и 2. Обозначим полный набор уравнений типа 2: Хк(9,Р)=0, к = 1,2,..., К. F.4)
86 Обобщенная гамилътонова динамика Мы можем полагать, что функции xfc, подобно (рт, в B.4) выбраны так, что их вариации порядка е. Тогда уравнения F.4) корректно записы- ваются как слабые уравнения. Эти новые слабые уравнения сужают область R, в которой слабые уравнения справедливы, понижая ее раз- мерность до 2N — К. Окажется суженной и область Re, так как теперь она будет состоять из точек, удаленных не более чем на расстояния порядка е от новой области R. Для изучения уравнений типа 1 удобно ввести некоторые новые понятия. Назовем одну из величин ipm величиной первого рода {first class (p), если ее СП со всеми (р и \ обращаются в нуль. Таким образом, <Рт> — первого рода, если [<Pm',<Pm]=Q, т=1,2, ... , М, [?W,X*]=0, k = 1,2,..., К. Эти уравнения обязаны удовлетворяться только в слабом смысле, т.е. только как следствия уравнений <рт = 0 и Xj = 0. Таким обра- зом, каждая из левых частей F.5) должна равняться в сильном смысле некоторой линейной комбинации (рт и \ь- Величину (р, не удовлетво- ряющую всем этим условиям, мы называем величиной второго рода (second class ф). Мы можем подвергнуть величины ip линейному преобразованию вида Vm =7mm'?'m', F.6) где 7 — любые функции q и р, такие, что их детерминант не обращается в нуль в слабом смысле. Тогда для всех целей теории величины <р и <р* эквивалентны. Проделаем преобразование такого типа с тем, чтобы обратить в ве- личины первого рода как можно больше (р. Получившиеся тогда (р пер- вого рода обозначим (ра, а (р второго рода — (р^, где C = 1, 2, ... , В, и а = 5 + 1, В + 2, ... , М. Если tpmi — первого рода, то уравнение F.1) удовлетворяется авто- матически. Далее, в уравнениях F.1) и F.3) мы можем оставить толь- ко <рт второго рода, поскольку <рт первого рода дают нулевой вклад. Таким образом, в уравнениях F.1) и F.3) выживают только члены vfi[<Pfi,<Pfi']=0, /3,/3'= 1,2,..., В, Хк]=Ь к = 1,2,..., К.
6. Условия самосогласованности 87 Это и есть все уравнения типа 1. Они показывают, что либо все обращаются в нуль, либо матрица О ••• [?>2,Хк\ ¦¦¦ [<PbiXk\ F.8) имеет ранг, меньший В (в слабом смысле). Сейчас будет показано, что реализуется первая из альтернативных возможностей. Предположим, что матрица F.8) имеет ранг U < В. Образуем детерминант D = о 32, </ о 2: 4>ц\ <Pu+i F.9) Он — линейная комбинция у^ и поэтому обращается в нуль в слабом смысле. СП любой величины / с D равна сумме детерминантов, обра- зованных взятием СП каждого из столбцов F.9) с /. За исключением детерминанта с СП первого столбца с /, все они обращаются в нуль в слабом смысле, поскольку все элементы их первого столбца — нули в слабом смысле. Таким образом, [D, /] = 0 32; i> Ы <Ри\ <Ри\ . F.10) Если взять в качестве / любую из tpa, первый столбец в F.10) обра- щается в нуль, и поэтому [D, <ра\ = 0. Если взять в качестве / любую из ipp или Xi T0 либо детерминант F.10) имеет два одинаковых столб- ца и поэтому обращается в нуль, либо он есть минор матрицы F.8) с U + 1 строками и столбцами и обращается в нуль, поскольку ранг этой матрицы по предположению равен U. Таким образом, D имеет нулевую СП со всеми tp и \-
88 Обобщенная гамилътонова динамика Может оказаться, что D обращается в нуль в сильном смысле — из- за того, что обращаются в нуль в слабом смысле алгебраические допол- нения всех элементов его первого столбца. В этом случае мы возьмем другой детерминант D, со столбцами помимо первого, отвечающими любым U столбцам F.8), и строками, отвечающими любым U + 1 стро- кам F.8). Благодаря предположению, что F.8) имеет ранг U, мы всегда можем выбрать такой детерминант D, что не все алгебраические допол- нения элементов его первого столбца обращаются в нуль. Таким обра- зом, мы получаем D, являющийся величиной первого рода и одновре- менно линейной комбинацией tpp. Это противоречит предположению, что ранее мы сделали величинами первого рода максимально возмож- ное число /р. Мы можем заключить, что если мы сделали величинами первого ро- да максимально возможное количество <р, то обращаются в нуль все v, ассоциированные с <р второго рода. Тогда гамильтониан E.3) сводится к Н = Va(fia, F-11) а общее уравнение движения E.4) приобретает вид g=Va\g,<pa]. F.12) Обращение в нуль vp и уравнения F.4) гарантируют, что все условия согласованности удовлетворяются; va остаются полностью неопреде- ленными. Каждый из них дает начало свободе в движении — произ- вольной функции в общем решении уравнений движения. В стандарт- ном случае имеется в точности одна у>, которая с необходимостью — первого рода, и поэтому имеется одна произвольная функция в общем решении уравнений движения. Это связано с произволом в независимой переменной т. 7. Дополнительные условия Имея дело с конкретной динамической системой, мы можем по- желать, чтобы координаты и скорости подчинялись уравнениям, до- бавочным к уравнениям движения, которые следуют из лагранжиана. Такие дополнительные условия должны вводиться в теорию как еще одни слабые уравнения.
8. Преобразования гамильтоновой формы 89 С помощью уравнений C.6) (с Ж = 0) дополнительные условия можно записать как соотношения между q, р и v. Они могут привести к уравнениям только между q и р. Такие уравнения следует тракто- вать как новые ^-уравнения и присоединить к набору F.4). Они при- ведут к новым условиям согласованности, с которыми следует обра- щаться так же, как и с предыдущими, и это может дать следующие новые ^-уравнения. <р первого рода следует теперь определять как име- ющие нулевые СП и с этими новыми \i так что дополнительные усло- вия могут понизить число связей (р первого рода. Тогда это вызовет снижение числа степеней свободы. Те из дополнительных условий, которые не дают ^-уравнений, да- дут условия на переменные v. Как правило, эти последние условия бу- дут более сложного вида, чем просто требования обращения в нуль некоторых v, как это всегда было с условиями на v, следовавшими из условий согласованности. Они приведут к дальнейшему снижению чис- ла степеней свободы, понизив его до величины, меньшей числа <р пер- вого рода. 8. Преобразования гамильтоновой формы Возьмем набор зависящих от q и р функций 9S (s = 1, 2, ... , S), таких, что детерминант 0 [0i, 02] Pi, 0з] ••• [0i,0s] [02, 0l] 0 [02, 0S] ... [02, 0S] д = •1) [0S, 0l] [0S, 02] [05, 03] ••• 0 не обращается в нуль в слабом смысле. Это значит, что S должно быть четным. Пусть cssi обозначает алгебраическое дополнение [0g, 0„/], де- ленное на Д, так что Cs's[0S'i 0s"} = 8SS». (8-2) Тогда для любых двух величин ? и г] мы можем определить новую СП [?, г)]* формулой К,чГ = К,ч] + К,0.]с„4<?.',ч]- (8-3)
90 Обобщенная гамилътонова динамика Легко видеть, что новая СП обладает первыми двумя из свойств D.4), а в справедливости третьего, тождества Пуассона, убеждает прямая выкладка (см. приложение, §12). Новая СП дает для любой ?: К, es}* = к, в.] + к, в..]ся.в..[0.", о.\ = К, о.\ - К, в.']б.: = о. (8.4) Чтобы понять значение новых СП, возьмем случай, когда набор в состоит из S/2 координат q и сопряженных им импульсов р. Тогда мы видим, что новая СП получается вычеркиванием из суммы по п в определении D.3) всех членов, содержащих производные по этим q и р. Таким образом, новая СП относится к системе с N — =rS степенями свободы. Взяв в качестве 9 не в точности некоторые q и р, а любые независимые функции этих q и р, мы получаем ту же самую новую СП. Для таких общих в новые СП по-прежнему будут относиться к системе с N— -S степенями свободы, но редукция числа степеней свободы более сложна и не сводится к простому вычеркиванию некоторых q и р. Предположим, что в качестве в выступают все (р или х (у должны быть второго рода, так как иначе Д = 0). Тогда мы имеем [0s, Н] = 0 для всех s, и, следовательно, [g, Н]* = [g, H] = g, (8.5) где g — любая функция q и р. Таким образом, с помощью новой СП можно записывать гамильтоновы уравнения движения. Таким путем мы получаем новую форму уравнений движения, более простую, по- скольку эффективное число степеней свободы понизилось. Теперь каждая из в обращается в нуль в слабом смысле. Работая только с новыми СП, мы без риска вступить в противоречие можем полагать, что каждая из в обращается в нуль в сильном смысле, потому что согласно (8.4) обращается в нуль новая СП в с чем угодно. Тогда мы можем использовать сильные уравнения вв = 0, чтобы упростить гамильтониан. Назовем \ величиной первого рода, если она имеет нулевую СП со всеми tp и Xi и величиной второго рода в противном случае. Мы можем проделать над \ линейное преобразование вида Xk = ikk'Xk' + l'km<Pm, (8-6) где 7 и 7' — любые функции q и р, такие, что детерминант 7 не обра- щается в нуль в слабом смысле; тогда новые х* эквивалентны старым
8. Преобразования гамильтоновой формы 91 для всех целей теории. Проделаем преобразование такого типа с тем, чтобы обратить в величины первого рода как можно больше х, и полу- чившиеся тогда х первого рода обозначим Ха, а второго рода — Х/3- Мы можем взять в качестве 0 все ^ и ^. Тогда детерминант Д не обращается в нуль. Доказательство этого факта аналогично доказа- тельству того, что ранг матрицы F.8) равен В: предположив, что Д имеет ранг Т < S, и построив детерминант вида 01 0 [0Ь02] ••• [0Ь0Г] 02 [02, 01 ] 0 ••• [02, Вт] г+1 [0г+1, 0i] [0г+1, 0г] ••• [0г+1,0г. (8.7) следует убедиться, что Д является величиной первого рода по отноше- нию к (р и х и одновременно — линейной комбинацией <рр и Х/3: так что это противоречит предположению, что величинами первого рода сделано максимальное число (р и х- Такой выбор 0 дает максимальное в описанном методе упрощение гамильтоновых уравнений движения. Мы получаем новую схему, в ко- торой все уравнения для <рр и Х/з сильные. Мы можем использовать эти уравнения для полного исключения из теории некоторых q и р. Вид новой схемы неоднозначен, поскольку неоднозначны <рр и Х/з- Просто заменив <рр и Х/3 линейными комбинациями их самих, мы не изменим окончательного вида. Однако мы можем добавить к /рр любые линейные комбинации tpa, а к Х/з — любые линейные комбинации ipa и Ха- Это не изменит Д или с88<, но, вообще говоря, изменит [?, 77]*, так что вид гамильтоновой схемы внешне изменится. Конечно, внешне отличающиеся схемы должны быть эквивалентны, поскольку все они дают одни и те же уравнения движения. В качестве применения описанного метода рассмотрим случай, ког- да лагранжиан не содержит некоторых скоростей. Предположим, что L не содержит tjj (j = 1, 2, ... , J < N). Тогда каждый pj в слабом смыс- ле равен нулю, а в сильном — (р. Предположим, что ни одна линейная комбинация pj не является величиной первого рода. Тогда мы можем считать, что pj суть <рр. Возьмем теперь в качестве половины набора 0 эти pj, а в качестве другой половины — подходящие <р или х второго рода, так чтобы Л не обращался в нуль. Эти другие 0 назовем 0j. Лег- ко видеть, что при таком выборе в именно новые СП и получились бы
92 Обобщенная гамилътонова динамика применением определения D.3) к тем степеням свободы, для которых из числа q исключены qj, причем каждый pj считается сильно равным нулю, а каждая qj — сильно равной функции остальных q и р, заданной уравнениями Oj = 0. Таким путем мы получаем новую гамильтонову схему (не обязательно максимально упрощенную, поскольку могут су- ществовать другие <рр их/3? не включенные в число в), в которой qj, и pj не появляются как независимые динамические переменные. Новую схему можно было бы получить и более прямым путем, с самого начала не считая qj координатами и вообще не вводя сопря- женных им импульсов. Посмотрим, какие модификации внесло бы это в развитие теории. Обозначим через п те и только те значения индексов, для которых q не есть qj, т.е. значения J + 1, J + 2, ... , N. Тогда уравнения B.2) и C.1) остаются в силе, а уравнение C.2) следует заменить на 5H = qn5pn-j^5qn-j^5qj, (8.8) oq OQj поскольку мы допускаем варьирование qj. Уравнения Y~ = 0 (8.9) мы можем считать при этом дополнительными условиями. Тогда урав- нение (8.8) сводится просто к C.2). Мы можем заключить, что Н имеет вид E.3), где <рт зависят от qn и рп, не зависят от qj и обращаются в нуль как следствие уравнений B.2). В дальнейшем теорию можно развивать, как и ранее, в терминах <р и х, не зависящих от qj. Те же из уравнений для <р и %, которые содержат qj, можно считать опреде- ляющими qj через другие переменные, и в дальнейшем они не играют в теории никакой роли. В такой форме теории мы имеем лагранжиан, содержащий завися- щие от импульсов переменные qj. Появление импульсных переменных в лагранжиане аналогично появлению скоростей va в гамильтониане. 9. Гамильтониан как исходное понятие Вместо того, чтобы начинать с лагранжиана и получать из него га- мильтониан, можно начинать с гамильтониана. Мы полагаем, что име- ются некоторые динамические переменные qn и рп (п = 1, 2, ... , N)
9. Гамильтониан как исходное понятие 93 и, возможно, другие динамические переменные, между которыми опре- делены СП, обладающие свойствами D.4), и что их связывают неко- торые слабые уравнения в качестве ^-уравнений. На таком пути нет оснований различать tp и \- По крайней мере, одна из tp должна быть первого рода, т.е. иметь нулевые СП со всеми tp, иначе не будет непро- тиворечивого движения. Предположим затем, что гамильтониан есть линейная комбинация <ра {tp первого рода) с новыми переменными va в качестве коэффициентов, а гамильтоновы уравнения движения име- ют вид D.6) или F.12). Сами v могут быть произвольными функциями независимой переменной т. Прежнюю схему уравнений движения, выведенных из лагранжи- ана и включающих как tp, так, возможно, и \-> следует считать при- мером настоящей схемы, в котором некоторые из v обращены в нуль дополнительными условиями. Тогда <ра, отвечающие этим va, суть \ первого рода в прежней схеме. Такие дополнительные условия, да и любые дополнительные условия, содержащие v, ничего не дают в при- менениях теории к релятивистской динамике, рассматриваемых в сле- дующем разделе, и не могут быть перенесены в квантовую теорию, так что в дальнейшем они исключаются. Дополнительные же условия, по содержанию v, суть в точности ^-уравнения. СП двух <р первого рода есть tp первого рода, в чем можно убедить- ся следующим образом. СП [<ра, <ра'] слабо обращается в нуль и поэтому в сильном смысле равна линейной комбинации <р — единственных ве- личин, слабо равных нулю в настоящей схеме. Мы должны показать, что ее СП с любой tp слабо равна нулю. Из тождества Пуассона: [р, [<ра, <ра,]] = [[tp, <ра], <ра,] - [[tp, tpa,}, <pa]. (9.1) Поскольку <ра — первого рода, [tp, tpa] слабо равна нулю и потому в сильном смысле есть линейная комбинация tp, откуда ее СП с ipa* пер- вого рода слабо обращается в нуль. Аналогично слабо обращается в нуль второй член в правой части (9.1), и необходимый результат доказан. Предположим, что имеется А независимых tp первого рода и М всех независимых tp. В фазовом пространстве B7У-мерном простран- стве переменных qn и рп) имеется BN — М)-мерное подпространст- во, в котором выполнены все ^-уравнения. Назовем его BN — М)-про- странством. Состояние динамической системы при данном значе- нии т фиксируется заданием переменных q и р, удовлетворяющих
94 Обобщенная гамилътонова динамика всем (^-уравнениям, т. е. представляется точкой Р в BN—М)-простран- стве. Движение системы, исходным для которого является это состоя- ние, представляется в BN — М)-пространстве кривой с началом в Р. Благодаря произвольности А переменных va эта кривая может уходить в любом направлении в малом пространстве А измерений, охватываю- щем Р. Для каждой точки BN — М)-пространства имеется такое ма- лое Л-мерное охватывающее пространство. Покажем теперь, что эти малые пространства интегрируемы. Предположим, что в интервале времени 6т = Е\ обращаются в нуль все v, за исключением va>, равной 1, в следующем интервале 6т = е2 — все v, за исключением ?;а», также равной 1. Тогда любая функция g, зависящая от q и р, в конце первого интервала переходит в g + ?i[g, <pa.]. В конце второго интервала, с учетом членов порядка ?i?2, но в прене- брежении членами порядка е\ и е|, она переходит в g+?y[g, ipa>] + E2 [g + ?l [g, (fa'], (fa"}- (9.2) Если эти два движения совершаются в обратной последовательности, g переходит в S2[g, (fia"} +?l[g+?2[g, <Pa"], Va']- (9.3) Разность между (9.2) и (9.3) благодаря тождеству Пуассона равна <Pa', Va"}]- (9.4) Выше было показано, что [<pai, <pa"\ есть <р первого рода, так что (9.4) есть возможное изменение g, описываемое уравнениями движения при подходящем выборе v и поэтому отвечающее повороту в малом Л-мер- ном пространстве вокруг начальной точки. Это и есть условие интег- рируемости. Если в дополнительные условия войдут v, эта интегрируе- мость может подпортиться. Таким образом, для выведенных из лагран- жиана уравнений движения интегрируемость не обязательно имеет место. Объединение малых пространств образует набор лежащих в BN — М)-пространстве Л-мерных пространств, таких, что движение
9. Гамильтониан как исходное понятие 95 всегда происходит только в одном из них. Назовем эти пространст- ва ^-пространствами. Каждая кривая в Л-пространстве представляет возможное решение уравнений движения. Каждая точка BN — М)-про- странства лежит в некотором Л-пространстве, содержащем все начи- нающиеся в этой точке траектории. Полным решением уравнений дви- жения допустимо считать само Л-пространство, а не кривую общего положения в нем. Точку данного Л-пространства можно фиксировать А координата- ми, каждая из которых есть некоторая функция q и р. Обозначим эти координаты ta (а = 1, 2, ... , А). Они будут играть роль временных переменных. Само ^-пространство можно описать, задав зависимость всех q и р от ta. Если g есть любая из q и р или их функция, мы имеем e=h§fa, (9.5) поскольку зависимость g от т можно считать порожденной зависимос- тью ta от т. Используя гамильтоновы уравнения движения F.12) для g и i, мы получаем Va[g, ?>а] = Va[ta, Va]^~- Это уравнение выполняется для произвольных va, так что дг [g, <pa] = [ta, Va]^. (9.6) Уравнения (9.6) можно считать общими уравнениями движения, фик- сирующими Л-пространство. В теории с однородностью по скоростям именно они наиболее похожи на обычные гамильтоновы уравнения дви- жения. Если А = 1, то мы можем взять в качестве времени единствен- ную переменную ta и (9.6) сведется в точности к обычным гамильто- новым уравнениям движения. Чтобы перейти от гамильтониана к лагранжиану, мы введем ско- рости qn уравнениями ^ = ^ (97) а затем определим L: L = pnqn - Н = pnqn - va(pa. (9.8)
96 Обобщенная гамилътонова динамика Это задает L как функцию q, q, р и v, причем линейную по q и v. Взяв независимые вариации 6q, 6q, 6р, Sv, мы получаем SL = qnSpn + pnSqn - (paSva - Таким образом, SL не зависит от 6рп и 6vn. Этот результат следует сопоставить с C.2). Если уравнения (9.7) вместе с (^-уравнениями выражают q как не- зависимые функции р и v, позволяя тем самым считать р и v функция- ми q и <7, то (9.9) показывает, что L есть функция только q и q в сильном смысле. Эта функция должна быть однородной первой степени по q. Ее частные производные по q и q дают ^ - v ^- ~ -v ^ - v (9 10) Это обычные лагранжевы уравнения. Если уравнения (9.7) вместе с (^-уравнениями не выражают q как независимые функции р и v, то они приводят к некоторым соотноше- ниям, связывающим только q и q, скажем, R,{q,q) = o, i = 1,2,..., J. (9.11) Rj однородны по q, и мы выбираем их так, чтобы однородность была первой степени. Дальнейшие действия аналогичны методу §3, но с взаимной переменой ролей у р и q. Мы получаем аналогичный C.5) результат L^^ + XjRj, (9.12) где !? зависит только от q и q и должен быть однородным первой сте- пени по <7, а коэффициенты Aj зависят от q, p и v. Если А считать независимыми переменными при частном диффе- ренцировании L, a L тогда однороден первой степени по q, мы воз- вращаемся к уравнениям (9.10). Таким образом, мы имеем лагранжи- ан, содержащий импульсные переменные; нечто подобное обсуждалось в конце предыдущего раздела, причем тогдашние qj отвечают тепереш- ним Aj, а дополнительные условия (8.9) — уравнениям (9.11).
10. Приложение к релятивистской динамике 97 10. Приложение к релятивистской динамике В обычной нерелятивистской динамике работают с состояниями динамической системы в данный момент времени, причем это состо- яние характеризуется заданием значений q и р. Имеются уравнения движения, позволяющие по состоянию в один момент времени вычис- лить состояние в другой момент. Гамильтонова форма этих уравнений движения в случае однородности по скоростям требует только одной ip первого рода. Чтобы получить динамическую теорию, удовлетворяющую част- ному принципу относительности, мы должны построить схему уравне- ний, равно применимых для наблюдателей со всеми скоростями. Если мы работаем с мгновеньями1, мы должны охватить мгновенья отно- сительно всех наблюдателей. Тогда мгновенье — это любая плоская трехмерная поверхность в пространстве-времени, нормаль к которой лежит внутри светового конуса. Чтобы описать общее мгновенье, нуж- ны четыре параметра — три для фиксации направления нормали (ско- рости наблюдателя) и четвертый, чтобы различить разные мгновенья для одного наблюдателя. Включая понятие мгновений, релятивистская динамика должна позволять по заданному состоянию в любое из этих мгновений вычис- лять состояние в любое другое. Мы должны располагать уравнениями движения, показывающими, как меняются динамические переменные с изменением этих мгновений. Мы должны допустить произвольные изменения мгновений — как трансляции в пространстве-времени, так и изменения в направлении нормали, и все это должны суметь описать уравнения движения. Таким образом, нам нужны четыре <р первого ро- да, чтобы породить четыре степени свободы в изменении мгновенья. Четыре параметра, описывающих мгновенье, следует понимать как q, подчиняющиеся наряду с другими q и р уравнениям движения D.6) или F.12). Их отличие от других q и р состоит в том, что именно их удобно взять в качестве переменных t в уравнениях движения (9.6). Тогда эти уравнения явно показывают, как меняются любые q и р при данном изменении мгновенья. Есть другие формы релятивистской динамики, не использующие мгновений, как то обсуждалось автором [2]. Есть точечная форма, в ко- торой состояние определяется относительно точки в пространстве- вре- 1With instant — см. [2].
98 Обобщенная гамилътонова динамика мени. Для этой формы также нужны четыре <р первого рода, соответ- ственно четырем степеням свободы движения точки. Далее, есть фрон- тальная форма, для которой нужны три <р первого рода, соответственно трем степеням свободы движения фронта. Наконец, мы можем задавать состояние на произвольной трехмерной пространственноподобной по- верхности в пространстве-времени. Тогда число <р первого рода должно быть бесконечным, соответственно всем деформациям, которые мож- но сделать с этой поверхностью. В каждой из этих форм переменные, описывающие точку, волновой фронт или произвольную пространст- венноподобную поверхность, следует понимать как q, подчиняющиеся уравнениям движения D.6) или F.12) и предпочтительно удобные для выбора в качестве переменных t в уравнении (9.6). Обсуждавшиеся выше <р первого рода минимально необходимы для построения релятивистской динамики в соответственных формах. Мо- гут быть и другие. Например, электродинамика, допускающая кали- бровочные преобразования даже после фиксации начальных значений всех q и р, должна обладать добавочными степенями свободы, для по- рождения которых будут нужны добавочные tp первого рода. 11. Квантование Чтобы проквантовать динамическую систему, получившую клас- сическое описание, нужно построить систему линейных операторов, со- ответствующих классическим динамическим переменным q и р и их функциям. Ни классическим переменным v, ни переменным типа ско- рости вообще, ни комбинациям, явно содержащим т, — нет соответ- ствий среди операторов. Все операторы действуют на векторы ф гиль- бертова пространства, представителями которых в любом представле- нии являются волновые функции, характеризующие состояния в кван- товой теории. Вещественным классическим переменным соответству- ют самосопряженные операторы. Аналогия между линейными операторами и их классическими двойниками должна удовлетворять двум общим принципам. С обозна- чением одинаковыми символами обоих партнеров-двойников, эти прин- ципы суть: (i) СП-соотношения между классическими переменными соответ- ствуют перестановочным соотношениям между операторами согласно формуле [?, 77] соответствует 2-к(^т] — rj(,)/ih;
11. Квантование 99 (И) слабые уравнения между классическими переменными соответ- ствуют линейным условиям на векторы ф согласно формуле X{q, р) = 0 соответствует Хф = 0. Процедура перехода от классической к квантовой теории не вполне определена математически, поскольку всякий раз, когда классическое выражение содержит произведение двух множителей, СП которых не обращается в нуль, есть произвол в порядке, в котором должны по- явиться эти два множителя в соответствующем квантовом выраже- нии. В простых реальных примерах этот вопрос решается без труда. В сложных примерах может оказаться невозможным так выбрать по- рядок в каждом месте, чтобы сделать непротиворечивыми все кванто- вые уравнения, а тогда и неизвестно, как проквантовать теорию. Все современные методы квантования являются по сути практическими приемами, основанием для применения которых служат соображения простоты. Имеются некоторые общие соображения, которые следует иметь в виду при переходе к квантовой теории, чтобы сразу не столкнуться с тривиальной противоречивостью квантовых уравнений. В классичес- кой теории мы имеем некоторое число ^-уравнений (включая в него на равных правах %-уравнения), которые в квантовой теории следу- ет трактовать в соответствии с принципом (п). Для классических <р мы можем провести линейное преобразование F.6), и новые <р будут ничем не хуже старых. Проводя соответствующее преобразование в квантовой теории, мы должны озаботиться тем, чтобы все коэффициенты 7 стоя- ли слева от (р. Общая (р в квантовой теории есть линейная комбинация исходных <р с коэффициентами слева. Из двух квантовых уравнений, полученных по (^-уравнениям со- гласно принципу (п), мы можем заключить, что (p2<Pli/> = 0, <pi<p2il> = 0, а отсюда согласно принципу (i) [(pi, (р2]Ф = 0. Это соответствует классическому слабому уравнению [<Pi, У2] = 0.
100 Обобщенная гамилътонова динамика Мы можем заключить, что если переход к квантовой теории возможен, то все <р должны быть первого рода. Квантовую теорию можно построить и по классической теории с <р второго рода — предварительно превратив все у^-уравнения в сильные уравнения с помощью преобразования, описанного в § 8. Квантовым эк- вивалентом сильных уравнений будут уравнения между операторами, по которым одни из них можно определить через другие. Квантовые уравнения <рф = 0, полученные из классических /р-урав- нений применением принципа (И) к tp первого рода, представляют со- бой волновые уравнения Шредингера. Обычная классическая динамика с единственной tp первого рода приводит к единственному уравне- нию Шредингера. В общей теории каждой классической степени свобо- ды, характеризующей произвол в движении, отвечает свое уравнение Шредингера. В этих уравнениях все операторы соответствуют дина- мическим переменным при одном и том же значении т. Операторы, относящиеся к различным значениям т, принадлежат разным алгеб- раическим системам, и, по-видимому, в квантовой теории нет ничего похожего на т-зависимость классических переменных. Однако описываемая уравнением (9.6) зависимость классических величин от параметров t имеет квантовый аналог, если только t выбра- ны так, что их взаимные СП равны нулю, и поэтому в квантовой те- ории им можно одновременно придать числовые значения. Предпочти- тельные t различных форм релятивистской динамики, обсуждавшихся в предыдущем параграфе, удовлетворяют этому условию. Непосредст- венно перенести в квантовую теорию уравнения (9.6) мы не можем, поскольку, как легко проверить, получившиеся уравнения не были бы инвариантны при общих линейных преобразованиях tp F.6). Сначала мы должны привести уравнения (9.6) к стандартному виду. Преобра- зованием F.6) мы образуем новый набор tp, скажем tpa, находящихся в таком взаимно однозначном соответствии с ta, что [*а, ?><•']=<*„„-. A1.1) Для таких tp уравнения (9.6) сводятся к Эти уравнения уже можно перенести в квантовую теорию, и тогда они станут гейзенберговыми квантовыми уравнениями движения в нашей обобщенной динамике.
12. Приложение 101 12. Приложение Доказательство тождества Пуассона для новых СП, определенных уравнением (8.3). Воспользуемся индексами г, s,t, ... для идентифи- кации различных в. Мы имеем но определению [К, v]*, СГ = К, v] + К, вг]сг,[вв, v], С] + +[& ч] + К, я.-к.р., ч], ^]с*«[^, С] = = К, ч], С] + К, 0Г], <]с,.[0., v] + К, ^][crs, C][^, ч] + A2 х) +К, вг]сг.[[в., v], С] + [К, v], OtUulOu, С] + +[К, вг], et]cTS[Os, чШОи, С] + К, вт][ст., 9t][6., чЫОи, С] + Пусть оператор Е означает суммирование по трем циклическим пере- становкам величин ?, г], С- Тогда мы должны доказать, что В применении к первому члену A2.1) Е дает нуль благодаря обычному тождеству Пуассона. Применение S ко второму, четвертому и пятому членам дает Zcr.W., ту]{[[С, вг], С] + [[Or, С], С] + [[С, ?],вг]} = о снова благодаря обычному тождеству Пуассона. Применение к шестому и восьмому членам A2.1) дает после циклической перестановки г, и, s, t в восьмом: , v][eu, CKK, вг], et] + [[ви С], вг]} = в] С] [ ' ' Из (8.2) можем заключить, что [сы[вг, et], С] = 0, или [ctu, ?][вг, et] + <ни[[вг, et], Q = 0. A2.3)
102 Обобщенная гамилътонова динамика Таким образом,A2.2) сводится к и, (}[ctu, ?] = V[9 после еще одного использования (8.2). Это выражение сокращается с ре- зультатом применения Е к третьему члену A2.1). Применение S к оста- ющемуся, седьмому члену A2.1) дает К, er][n, es}[(, eu]{ctu[crs, 9t] + ctr[csu, 9t] + cts[cur, 9t]}. A2.4) Обозначив Ergu результат суммирования по циклическим перестанов- кам индексов г, s, и и одновременно индексов г', s', и', мы имеем бла- годаря обычному тождеству Пуассона Srsucrr<c8S'<w[[6»r', 9S>], 9U>] = 0. A2.5) Замена ^ на 9и< в A2.3) дает [err-, 9и.][9г; 9..] + СгА[9г-, 9..], 9и.] = 0, так что из A2.5) следует ^rsuCss'Cuu'[9ri, 98i][cTri, 9U>] = 0. С помощью (8.2) это сводится к ^rs«Cuu'[Crs, uui\ = U, что свидетельствует об обращении A2.4) в нуль. На этом доказательст- во завершается. Все выписанные выше уравнения можно понимать как сильные, поскольку слабых уравнений в доказательстве не использова- лось. Литература [1] Dirac P. A. M. Homogeneous variables in classical dynamics, Proc. Camb. Phil. Soc, 1993, V. 29, P. 389. [2] Dirac P. A.M. Forms of relativistic dynamics, Rev. Mod. Phys., 1949, V. 21, P. 392.
ОБОБЩЕННАЯ ГАМИЛЬТОНОВА ДИНАМИКА* Предложенная автором процедура перехода от лагранжиана к га- мильтониану в ситуации, когда импульсы не являются независимыми функциями скоростей, приведена к более простой и практичной форме, причем основные результаты получены прямым решением уравнений, вытекающих из требований самосогласованности. Показано, как (при некоторых условиях) можно исключить часть степеней свободы и тем самым добиться существенного упрощения гамильтонова формализма. Обычная процедура перехода от лагранжевой формы уравнений движения к гамильтоновой форме требует, чтобы импульсы были не- зависимыми функциями скоростей. На практике имеется ряд важных случаев, когда это условие не выполнено — например, в релятивист- ской теории поля, — и возникает необходимость обобщить процедуру. Один из способов сделать это был предложен автором [1]. В настоящей статье он приводится к более простому и практичному виду. Альтернативный подход к проблеме дан Андерсоном и Бергма- ном [2]. Будучи приложим только к квадратичным по скоростям ла- гранжианам, их метод менее общий, чем настоящий. В настоящем ме- тоде лагранжиан может быть любой функцией скоростей и координат, при единственном ограничении, чтобы лагранжевы уравнения движе- ния не приводили к несовместности. 1. (^-уравнения Рассмотрим динамическую систему, описываемую в терминах ко- ординат qn (п = 1, 2, ... , N) и скоростей qn с лагранжианом L = = L(q, q). Как обычно, определим импульсы "•=ЯЕ- <1Л) Может оказаться, что р не являются независимыми функциями q. Если *Proc. Royal Soc, V. 246, 1958, P. 326-332. Перевод с английского В.П.Павлова.
104 Обобщенная гамилътонова динамика среди р имеется только N — М независимых функций q, возникнет М независимых соотношений <Pm(p,q)=0, m = l, 2, ...,М, A.2) М может быть любым — от 0 до N. Лагранжевы уравнения движения d dL _ dL q „\ dt dqn dqn задают теперь N — М функций, зависящих от ускорений q'n, и дают М уравнений, связывающих только координаты и скорости. Может оказаться, что дифференцированием по времени (однократным или, возможно, многократным) мы можем получить некоторые новые не- зависимые уравнения, содержащие ускорения. Если таких уравнений недостаточно, чтобы задать все ускорения, то общее решение уравне- ний движения с данными начальными значениями q и q будет содер- жать несколько произвольных функций времени. Сделаем произвольные малые вариации 6qn, 6qn координат и ско- ростей. Они приведут к вариациям 6рп, сохраняющим уравнения A.1). Эти вариации должны сохранять и уравнения A.2), являющиеся след- ствием A.1), так что Уравнения A.4) будут единственными ограничениями на вариации 6рп, учитывающими уравнения A.2) в том смысле, что независимые вари- ации первого порядка у р и q дают вариации первого порядка у <р. Мы имеем S(pnqn ~ L) = pnSqn + qnSpn - ^—Sqn - ^^Sqn = qnSpn - ^— oq oq OQ A.5) Поскольку члены с Sq сокращаются, вариация по q, сохраняющая уравнения A.1) в отсутствие вариаций по q и р, оставляет неизмен- ной pnqn — L. Это означает, что pnqn — L является функцией только q и р, так что мы можем положить pnqn -L = H(q, p). A.6)
1. ip-уравнения 105 Конечно, функция Н(q, р) определена неоднозначно. Мы можем сделать замену Н^Н + ст>рт, A.7) где ст — любые функции q и р. В случае, когда L однороден первой степени по q, мы можем взять Н = 0. Теперь уравнение A.5) дает где вариации 6qn, 6pn ограничены уравнением A.4), а в остальном про- извольны. Поэтому А - дН j- „ dipm П Я\ +U dqn~ dqn+Umdqn> [^> где ит — некоторые коэффициенты. При преобразовании A.7) к ит добавляются функции, зависящие только от q и р, а именно, минус ст. Уравнения A.8) показывают, что q заданы через q.N — M независи- мых переменных р и М новых переменных и. Таким образом, вместо q и q мы можем взять в качестве основных динамических переменных q, р и и. Это и есть гамильтоновы переменные. С помощью A.9) уравнения движения A.3) принимают вид v - dqn Umdqn- A'iU) Если обычным образом определить скобку Пуассона (СП) гА т дА дВ дА дВ (л ,и [А, В\ = -— —-—, A-11) то для любой g, зависящей от q и р, имеем g=[g, H]+um[g, ipm]. A.12)
106 Обобщенная гамилътонова динамика Одно это уравнение охватывает все уравнения A.8) и A.10). Оно есть общее гамильтоново уравнение движения. Определение СП A.11) требует, чтобы q и р считались независи- мыми переменными. Любые соотношения, ограничивающие, подобно уравнениям A.2), независимость q и р, не должны использоваться до взятия СП, иначе СП потеряют однозначную определенность. Чтобы помнить об этом при работе с некоторыми из наших уравнений, удобно назвать такие ограничивающие уравнения слабыми уравнениями и за- писать их в виде 2. х~УРавнения Дифференцируя по времени A.2) и используя A.12), мы получаем [ipm', Н] +Um[(pm', (рт] = 0. B.1) Если не все эти уравнения сводятся к 0 = 0, они уменьшат число га- мильтоновых переменных q, p, и, выявив некоторые соотношения меж- ду ними. Может оказаться, что уравнения B.1) приводят к некоторым соот- ношениям только между q и р, независимым по отношению к ^-урав- нениям. Они должны быть слабыми уравнениями, поэтому запишем их в виде )~0 (fc = l, 2, ...). B.2) Дифференцируя по времени каждое из уравнений B.2), получаем \Xk,H]+um\Xk,<pm]=0. B.3) Эти уравнения могут приводить к новым соотношениям только меж- ду q и р, т. е. к новым уравнениям B.2), которые, в свою очередь, могут привести к новым уравнениям B.3). Продолжим эту процедуру до тех пор, пока она идет, получив таким образом все уравнения B.2) и B.3), являющиеся следствиями A.2) и общего уравнения движения A.12). Пусть полный набор описывается индексами к = 1, 2, ... , К. Таким образом, число независимых р и q мы свели до 2N — М — К, аи ограни- чили уравнениями B.1) и B.3), если только эти уравнения не сводятся к 0 = 0 или к ^-уравнениям.
2. х~УРавнения Рассмотрим эти уравнения B.1) и B.3) как уравнения для неиз- вестных ит с коэффициентами, заданными как функции q и р. Они должны иметь решение um=Um(q,p), B.4) поскольку из отсутствия его следовала бы противоречивость лагран- жевых уравнений движения A.3). По смыслу решения B.4), уравнения [(рт', H] + Um [<рт>, <рт] » 0, \Хк, Н] + Um[xk, ?>т] ~ 0 выполняются вследствие A.2) и B.2). Вообще говоря, решение B.4) неоднозначно. Мы можем добавить к Um любое решение Vm = Vm(q, p) уравнений Vm[<pm',<pm]tt0, Vm[xk, <Рт] & 0- B-6) Пусть Vam (а = 1, 2, ... , А) — все независимые решения уравне- ний B.6). Тогда общее решение уравнений B.1) и B.3) есть um = Um+ vaVam, B.7) где va — произвольные коэффициенты. С помощью уравнений B.7) можно исключить переменные ит, так что в качестве основных гамильтоновых переменных мы имеем 2N — М — К оставшихся независимыми после учета уравнений A.2) и B.2) переменных q и р и А переменных va. Полное число этих пе- ременных может быть значительно меньше первоначального числа 2N независимых переменных, поскольку уравнения движения могут со- кратить его. Андерсон и Бергман называют (^-уравнения первичными связями, а ^-уравнения — вторичными связями. Во многих аспектах <р и х вы~ ступают на равных, и поэтому удобно их все обозначать как Xj (J = = 1, 2, ... , М + К). С гамильтоновой точки зрения существенно то различие между ними, что ip фигурируют в общем уравнении движе- ния A.12), а х нет-
108 Обобщенная гамилътонова динамика 3. Условие принадлежности первому роду По определению зависящая от q и р функция есть величина первого рода, если все ее СП с Н и Xj обращаются в нуль. Достаточно, чтобы это обращение было слабым, т.е. с использованием уравнений A.2) и B.2). Зависящая от q и р функция, не удовлетворяющая этим условиям, на- зывается величиной второго рода. Теорема. СП двух величин первого рода есть величина первого рода. Доказательство. Пусть X и Y — первого рода, так что Эти слабые уравнения означают, что [х, Xj] = Xjj'Xj', [Y, Xj] = Vjj'Xj' с некоторыми коэффициентами xjji и yjji. Следовательно, [[X, Y], Xj] = [[X, Xj], Y] - [\V, Xj], X] « xir[Xy, Y] - yjr\xj', X] » 0. Аргументация сохраняет силу, если заменить Xj на Н, откуда [[X, Y], Н] и 0. Следовательно, [X, Y] — первого рода. ¦ Положим, Я + Um<pm = Н'. C.1) Уравнения B.5) показывают, что СП Н' с любой Xj слабо обращается в нуль. Далее, [Н,Н']кит.[(рт.,Н\к0 из первого из уравнений B.5), умноженного на Umi. Таким образом, Н' — первого рода. Заметим, что гамильтониан Н' может быть получен из Н преобразованием A.7). Любая линейная комбинация <р с коэффициентами, зависящими от q и р, может рассматриваться как другая ip. Положим, Vamipm = ipa. C.2) Уравнения B.6) показывают, что СП <ра с любой Xj слабо обращается в нуль. Мы только что видели, что СП <ра с Н' обращается в нуль, так
4. Редукция числа степеней свободы 109 что СП ее с Я также должна обращаться в нуль. Следовательно, <ра — первого рода. Благодаря B.7) общее уравнение движения A.12) принимает вид g=[g,H']+va[g,pa}. C.3) Теперь оно содержит гамильтониан первого рода Н' и <р первого ро- да (ра. Коэффициенты va, отвечающие этим ip первого рода, никак не ограничиваются уравнениями движения. Таким образом, в общем ре- шении уравнений движения с данными начальными условиями каждый из них приводит к произвольной функции времени. Каждая <р первого рода имеет вид Um<pm, где Um удовлетворя- ют B.5). Поэтому каждая независимая ip первого рода должна появить- ся в C.3). Следовательно, число независимых функций времени в об- щем решении уравнений движения равно числу независимых <р первого рода. Следует считать, что все решения уравнений движения, разли- чие которых при данных начальных условиях вызвано разным выбором произвольных функций времени, отвечают одному и тому же физичес- кому состоянию движения, по-разному описываемому в зависимости от выбора некоторых не имеющих физического значения математичес- ких переменных (например, от выбора калибровки в электродинамике или координатной системы в релятивистской теории). На практике инвариантные свойства интеграла действия обычно позволяют узнать, какие произвольные функции времени имеются в об- щем решении уравнений движения. Это знание помогает выделить <р первого рода из набора всех <р, не прибегая к трудоемкому вычисле- нию всех СП. Любая переменная скорости, отбрасывание которой не сказывается на физическом состоянии, должна появиться как коэффи- циент va, связанный с ip первого рода, в гамильтоновом уравнении дви- жения C.3). 4. Редукция числа степеней свободы Предположим, что некоторые <р первого рода содержат импульсные переменные лишь линейно с числовым коэффициентом. Хотя матема- тически это — очень специальный случай, на практике он появляется часто и поэтому важен. Тривиальной заменой переменных мы можем привести эти ip пер- вого рода к виду Pr-/f«0, г = 1, 2, ...,R, D.1)
110 Обобщенная гамилътонова динамика где fr зависят только от q. Условие принадлежности первому роду тре- бует, чтобы СП величин рТ — fr слабо обращались в нуль. Эти СП могут зависеть только от q. В предположении, что нет Xj, зависящих только от q, эти СП должны обращаться в нуль сильно. Следовательно, где F — некоторая функция, зависящая от q. Добавим теперь к лагран- жиану член dF-дКп D 2) At ~ dqjn> D'2) это не изменит уравнений движения. К рг добавится dF/dqr, так что (^-уравнения D.1) примут вид Рг » 0. D.3) Продолжим работу с новым лагранжианом. Любую из Xj, не попа- дающую в D.3), назовем Xi (г' = 1) 2, ... , М + К — R); х% могут быть как первого, так и второго рода. Не теряя общности, можно предполо- жить, что Xi не зависят от переменных рг. Можно предположить, что и Н' не зависит от рг, поскольку преобразованием A.7) к другому Н' первого рода всегда можно добиться этого. Поскольку рТ — первого рода, мы имеем [х»,Рг]«0, [[хи Рг], Рг'] ~0 D.4) и т.д. Следовательно, если у Xi вообще есть зависимость от qr, она может быть лишь в виде Xi=Pii'Xl, D-5) где х* слабо обращаются в нуль и не зависят от qr, так что qr появляют- ся только в коэффициентах /3,,*. Это означает, что условия ^йО экви- валентны условиям х* ~ 0: не затрагивающим переменных qr. Число х* должно быть равно числу Xi {х* по количеству не могут превышать Xi, поскольку все условия х* ~ 0 суть следствия условий х% ~ 0 плюс условий D.4), которые сами являются следствиями Xi ~ 0)-
Литература 111 Если Xi — первого рода, применение теоремы предыдущего раздела к Хг и Рг показывает, что Хг выражается через х* только первого рода, т. е. что коэффициенты /Зц' в D.5) можно сделать ненулевыми лишь для x*i' первого рода. Проделав над Н' такую же работу, как над Xii мы находим, что Н' = Н"+ЪХ1 D-6) где Н", как и %*, не зависит от qr. Поскольку Н' — первого рода, мы можем заключить, что Н" — первого рода и что любые из фигуриру- ющих в D.6) х* — первого рода. Посмотрим теперь, какой вид примет уравнение движения C.3). Для g, совпадающей с одной из qr, мы обнаруживаем, что qr произ- вольна, так что qr меняется произвольно. Для g, зависящей от пере- менных qs, ps (s = R + 1, ... , 2V), мы получаем уравнение движения вида g=[g,H"}+wa[g,x*a], D.7) где Ха сУть X* первого рода. (В их число не обязательно попадают все х* первого рода.) Переменные рг в этом уравнении не появляются, а от qr могут зависеть лишь коэффициенты wa. Предположим, что произвольные вариации wa можно получить, варьируя qr и те из коэффициентов va в C.3), которые связаны с ины- ми, чем рг, <р первого рода. На практике это предположение обычно оправдывается. Тогда мы можем считать wa в D.7) произвольными коэффициентами, которые вместе с qs и ps образуют основные гамиль- тоновы переменные. В общем уравнении движения D.7) qr и рт больше не появляются. По своему характеру это уравнение столь же фунда- ментально, что и C.3), но относится только к степеням свободы qs, ps. Таким образом, степени свободы qr, pr выпали из теории. Может оказаться, что некоторые из x*ai фигурирующих в D.7), со- держат импульсные переменные лишь линейно с численными коэффи- циентами. Тогда мы можем повторить всю процедуру и добиться даль- нейшей редукции числа эффективных степеней свободы. Литература [1] Dirac P. A.M., Can. J. Math., 1950, V. 2, P. 129. [2] Anderson J.L., Bergmann P.G., Phys. Rev., 1951, V. 83, P. 1018.
ОБЩАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ Предисловие редактора перевода Новая книга выдающегося физика нашего времени иностранного члена АН СССР П. А. М. Дирака основана на его лекциях, прочитан- ных в Университете штата Флорида, и предназначена для читателя, начинающего изучать общую теорию относительности Эйнштейна. От- личительной чертой этой книги является компактность и изящность изложения. В последнее время появилось много монографий по общей теории относительности, включающих наряду с фундаментальными во- просами теории ее многочисленные приложения в астрофизике и кос- мологии. На этом фоне книгу П. А. М. Дирака можно назвать «матема- тическим минимумом» в области общей теории относительности. Изложение ведется в рамках традиционной геометрической идео- логии, основывающей обсуждение эйнштейновской гравитации на ри- мановой геометрии. Прочитав эту книгу, читатель без труда разберет- ся в приложениях теории. Методы получения некоторых классических результатов являются оригинальными. В частности, в самом общем виде получены уравнения движения непрерывно распределенных источников внешних полей как следствие уравнений Эйнштейна и уравнений соответствующих полей. Эту книгу с интересом прочтут также и те, кто уже активно ра- ботает в области общей теории относительности или преподает этот предмет. Они сумеют оценить ее исключительные достоинства. Д. И. Блохинцев Перевод с английского под редакцией члена-корреспондента АН СССР Д. И. Блохинцева.
Предисловие автора Согласно общей теории относительности Эйнштейна, для описания физической реальности требуется искривленное пространство. Чтобы продвинуться глубже в понимании физических закономерностей, нуж- но установить корректный вид уравнений, необходимых для описания искривленного пространства. Для этого имеется хорошо развитый, но довольно сложный математический аппарат. Каждый, кто хочет понять теорию Эйнштейна, должен им овладеть. Эта книга создана на основе курса лекций, прочитанных на физи- ческом факультете Университета штата Флорида. Необходимый мате- риал изложен в ней в доступной и компактной форме. Для ее понимания не требуется предварительных знаний, выходящих за рамки фундамен- тальных идей специальной теории относительности и умения диффе- ренцировать полевые функции. Это позволит читателю, изучающему общую теорию относительности, преодолеть возникающие трудности с минимальной затратой времени и энергии и подготовить себя к более глубокому изучению специальных аспектов предмета. Талахасси, шт. Флорида П. А. М. Дирак Февраль 1975
1. Специальная теория относительности Для описания физического пространства-времени требуется че- тыре координаты: время t и три пространственные координаты х, у, z. Положим t = х°; х = х1; у = х2; z = х3, тогда четыре координаты можно записать в виде жр, где индекс /л про- бегает значения 0, 1, 2, 3. Индекс записан в верхней позиции, чтобы выполнить условие баланса индексов во всех общих уравнениях тео- рии. Точное значение выражения «баланс индексов» станет ясным чуть позже. Возьмем точку, близкую к рассмотренной точке жр; пусть ее ко- ординаты будут жр + dx^. Четыре величины dx^, описывающие сме- щение, можно рассматривать как компоненты вектора. Законы спе- циальной теории относительности позволяют производить линейные однородные преобразования координат, выражающиеся в линейных од- нородных преобразованиях dx^1. Эти преобразования таковы, что вели- чина (dx0J - (dx1J - (dx2J - (dx3J A.1) является инвариантом (выбрана система единиц измерений длины и времени, в которой скорость света с = 1). Совокупность величин А^1, которые при преобразованиях коорди- нат преобразуются так же, как dxS, называют контравариантным век- тором. Инвариантную величину (А0J - (А1J - (А2J - (А3J = (А, А) A.2) можно назвать квадратом длины вектора. Если есть второй контрава- риантный вектор В*4, то существует инвариантное скалярное произве- дение А°В°-А1В1 -А2В2-А3В3 = (А, В). A.3)
1. Специальная теория относительности 115 Для удобства записи таких инвариантов введем нижние индексы. Опре- делим Ао = А0; А1 = -А1; А2 = -А2; А3 = -А3. A.4) Тогда запишем выражение в левой части A.2) в виде А^А^, где подра- зумевается суммирование по четырем значениям индекса fj,. В таких обозначениях A.3) можно представить в виде А^В^ или А^В^. Четыре величины Ац, введенные выражениями A.4), также можно рассматривать как компоненты вектора. Законы преобразования этих величин при преобразованиях координат несколько отличаются от за- конов преобразования из-за различия в знаках. Такой вектор называют ковариантным вектором. Из двух ковариантных векторов А^ и В^ можно образовать шест- надцать величин A^BV (индекс г/, так же как все греческие индексы в этой книге, пробегает значения 0, 1, 2, 3). Эти шестнадцать вели- чин образуют компоненты тензора второго ранга. Их иногда называют внешним произведением векторов А11 и ??р, в отличие от скалярного произведения A.3), которое называют внутренним произведением. Тензор A^BV является специальным, так как его компоненты свя- заны друг с другом определенными соотношениями. Однако, складывая несколько тензоров, образованных таким способом, можно получить тензор второго ранга самого общего вида, скажем Этот тензор обладает важным свойством: при преобразованиях коор- динат его компоненты преобразуются так же, как величины А^ВЬ'. Можно опустить один из индексов в Г'"', применяя правило опуска- ния индексов к каждому члену в правой части A.5). Так образуется Т^ или T^v. Опуская оба индекса, получаем величину Трг/. В Тр" можно положить v = /л, что приводит к Т^. Здесь должно быть произведено суммирование по четырем значениям ц. Далее всегда по дважды повторяющимся индексам подразумевается суммирование. Значит, Т^ является скаляром; Т^ тождественно равно Т^р. Можно продолжить эту процедуру и перемножить более чем два вектора с различными индексами. Таким способом строятся тензоры высшего ранга. Если все векторы контравариантны, то у тензора будут только верхние индексы. Если же опустить некоторые индексы, то по- лучим тензор общего вида с рядом верхних и рядом нижних индексов.
116 Общая теория относительности Положим определенный нижний индекс равным определенному верхнему индексу. Тогда должно быть произведено суммирование по всем значениям этого индекса. Он становится немым. Остается тен- зор, имеющий на два свободных индекса меньше, чем первоначальный. Такую процедуру называют сверткой. Итак, если исходить из тензора четвертого ранга Трг//9'т, то, сворачивая сначала по индексам <т и р, по- лучим тензор второго ранга T^vpp, который имеет только шестнадцать компонент, соответствующих четырем значениям индексов ц и и. Про- изведя свертку снова, придем к скаляру Т^^рр, состоящему из единст- венной компоненты. Теперь проясняется смысл выражения «баланс индексов». Каждый свободный индекс появляется в уравнении один и только один раз в каждом члене (слагаемом) уравнения и является всегда (во всех сла- гаемых) верхним или всегда нижним. Индекс, возникающий дважды в одном члене, является немым и должен находиться один раз в верхнем и один раз в нижнем положении. Его можно заменить любым другим греческим индексом, еще не использованным в этом члене уравнения. Таким образом, Ttivpp = Tlivaa. Индекс никогда не должен появляться более чем дважды в одном члене. 2. Неортогональные декартовы координаты Прежде чем перейти к математическому аппарату общей теории относительности, удобно рассмотреть промежуточный формализм — специальную теорию относительности в неортогональных декартовых координатах. При переходе к неортогональным осям каждая из величин dx^ в вы- ражении A.1) оказывается линейной функцией новых dx^, и квадратич- ная форма A.1) становится общей квадратичной формой по новым dx^, которую можно записать в виде g^dxfdx», B.1) где подразумевается суммирование как по fj,, так и по и. Коэффици- енты g^ зависят от выбора неортогональной декартовой системы ко- ординат. Мы, конечно, полагаем g^ = gVfi, так как любое различие между g^ и gv>l не сказалось бы на выражении для квадратичной фор- мы B.1). Имеется, таким образом, десять независимых коэффициен- тов gpv.
2. Неортогональные декартовы координаты 117 При преобразованиях координат четыре компоненты А^ произ- вольного контравариантного вектора преобразуются так же, как dx^. Тогда g^A^A" является инвариантом. Этот инвариант есть квадрат длины вектора А^1. Пусть В11 — другой контравариантный вектор; тогда А11 + \В^ также является вектором для произвольного значения числа А. Квадрат его длины есть gliV(A" + \B")(AV + \BV) = Эта величина должна быть инвариантом при всех значениях А. Отсюда следует, что коэффициенты при А0, А1 и А2 являются инвариантами. Коэффициент при А1 имеет вид так как во втором члене левой части можно поменять местами ц и v и воспользоваться условием g^ = gufi. Таким образом, выясняется, что g^A^B11 является инвариантом. Этот инвариант есть скалярное произведение А^ и ??р. Пусть g — детерминант g^. Значение g не должно равняться нулю; в противном случае четыре оси не описывают независимые направле- ния в пространстве-времени и не могут быть выбраны в качестве ко- ординатных осей. В ортогональных декартовых координатах, рассмот- ренных в предыдущей главе, диагональные элементы g^ равны 1, —1, — 1, —1, а недиагональные элементы равны нулю. Тогда g = —1. В неор- тогональных декартовых координатах g должен оставаться отрицатель- ным, поскольку неортогональные координаты могут быть получены из ортогональных непрерывным процессом, выражающимся в непрерыв- ном изменении g; следовательно, значение g не может проходить через нуль. Определим величину А^, называемую ковариантным вектором, следующим образом: А^ = gllvAv. B.2) Так как g не обращается в нуль, эти уравнения позволяют выразить Av через Ац. Пусть результат имеет вид Av = ffAp. B.3)
118 Общая теория относительности Каждая компонента g^v равна алгебраическому дополнению соответ- ствующей компоненты g^ в детерминанте матрицы g^, деленному на сам детерминант g. Следовательно, g^" = g"'*. Подставим в B.2) выражение для Av из B.3). Чтобы не получить три одинаковых индекса в одном члене, нужно заменить немой индекс ц в B.3) каким-нибудь другим греческим индексом, скажем р. Тогда по- лучим Так как это соотношение должно иметь место для произвольной четы- рехкомпонентной величины А^, заключаем, что W" = & B-4) где \у при 11 ф р. При помощи формулы B.2) можно опустить у тензора любой верх- ний индекс; при помощи формулы B.3) можно поднять любой нижний индекс. Если определенный индекс поднять и снова опустить, то, со- гласно B.4) и B.5), тензор не изменится. Заметим, что g^ просто про- изводит замену ц индексом р: или р индексом fj,: Применив правило поднятия индекса к fj, в g^, получим Это согласуется с B.4), если принять во внимание, что вследствие сим- метрии gpv индексы в gav можно писать один под другим. Поднимая далее по тому же правилу индекс г/, имеем а/3 _ gVPga Ь В bv Этот результат непосредственно следует из B.5). Правила поднятия и опускания индексов применимы ко всем индексам в g^, g1^, g^v.
3. Криволинейные координаты 119 3. Криволинейные координаты Теперь перейдем к системам криволинейных координат. Рассмот- рим величины, локализованные в точке пространства-времени. Это могут быть многокомпонентные величины с компонентами, отнесен- ными к координатным осям в данной точке. Если подобная величина существует во всех точках пространства, ее называют полевой величи- ной. Полевую величину Q (или одну из ее компонент, если их несколь- ко) можно продифференцировать по любой из четырех координат. За- пишем результат: dQ/dx" = Q)lt. Нижний индекс через запятую всегда будет обозначать такую произ- водную. Индекс \i помещен внизу, так как верхний индекс в левой час- ти находится в знаменателе. Изменение Q при переходе от точки х^1 к близлежащей точке жр + 5х^ имеет вид SQ = Q^Sx". C.1) Видно, что условие баланса индексов выполнено. Нам понадобятся локализованные в точке векторы и тензоры с ком- понентами, отнесенными к координатным осям в этой точке. При пре- образованиях координат компоненты таких величин преобразуются по тому же закону, что и в предыдущем разделе, но зависящему от преоб- разования координат в рассматриваемой точке. Получим, как и преж- де, величины g^ и g^v с нижними и верхними индексами. Однако они больше не константы, а меняются от точки к точке, т. е. являются по- левыми величинами. Рассмотрим результат специального преобразования координат. Пусть каждая из новых криволинейных координат х р есть функция четырех ж*\ Удобнее писать жр , где штрих стоит при индексе, а не при основном символе. Варьируя х^, получаем четыре величины 6х^, образующие контра- вариантный вектор. Компоненты этого вектора в новых координатах, согласно C.1), имеют вид 6х/ = (дх//дх"Nх" = x'l,'uSxv. Отсюда получаем закон преобразования любого контравариантного вектора Av A» =x/vAv. C.2)
120 Общая теория относительности Переставив новую и исходную системы координат и изменив индексы, получим Ах = х^.А»'. C.3) Из свойств дифференцирования в частных производных известно, что [в обозначениях B.5)] (дхх/дх»')(дх»' /дх") = g?. Таким образом, Это позволяет увидеть согласованность C.2) и C.3), так как подстанов- ка C.2) в правую часть C.3) дает Чтобы выяснить, как преобразуется ковариантный вектор В^, исполь- зуем условие инвариантности величины А^В^. С учетом C.3) запишем: А»'В „. =АХВХ= х^А» Вх. Этот результат должен оставаться справедливым для всех значений че- тырех величин А^ , поэтому, приравняв коэффициенты при А^ , можно получить В^=х^,Вх. C.5) Формулы C.2) и C.5) позволяют теперь преобразовывать произ- вольный тензор с любым числом верхних и нижних индексов. Коэф- фициенты типа х% и хх I, как раз и должны быть использованы для каждого верхнего и нижнего индекса соответственно с соблюдением баланса индексов, например: Ta'0'y=xa'^x?liaryT'1'i'v. C.6) Любая величина, преобразующаяся по такому закону, есть тензор. Со- отношение C.6) можно считать определением тензора.
4. Нетензорные величины 121 Заметим, что для тензора существенна симметрия или антисим- метрия по индексам типа Ли//, так как это свойство сохраняется при преобразовании координат. Формулу C.4) можно переписать в виде „А /3' W _ р\ ,а' , "о/З' —bvi откуда следует, что g^ есть тензор. Для произвольных векторов А11, В" имеем о- , „, Аа' R&' — а- Л^Яи — а- т^ tv Аа'R&' Так как это справедливо для всех значений Аа и В13 , заключаем, что ga'0' =glivX»a,XVfil. C.7) Отсюда следует, что g^ является тензором. Аналогично можно пока- зать, что gV — тензор. Эти величины называют фундаментальными тензорами. Произвольную скалярную полевую величину можно считать как функцией четырех х^, так и функцией четырех х^. Согласно свойствам операции дифференцирования в частных производных с _ с ™А Следовательно, Sy\ преобразуется, как В\ из уравнения C.5), и, та- ким образом, производная от скалярного поля является ковариантным векторным полем. 4. Нетензорные величины Существуют величины N^up,,, с различными верхними и нижни- ми индексами, которые не являются тензорами. При преобразованиях координат тензорная величина должна преобразовываться по закону вида C.6). В противном случае эта величина — не тензор. Тензор обла- дает тем свойством, что если все его компоненты обращаются в нуль в одной системе координат, то они равны нулю и в любой другой. Для нетензоров это не обязательно так. Поднимать и опускать индексы нетензорных величин можно по тем же правилам, что и для тензоров. Так, 6 Iv vp — Iv р-
122 Общая теория относительности Эти правила фактически никак не связаны с законами преобразова- ния к новой системе координат. При определении нетензорных вели- чин с тем же успехом можно не делать различия между верхними и нижними индексами. Тензоры и нетензоры могут стоять вместе в одном уравнении. Ба- ланс индексов понимают для нетензоров так же, как для тензоров. Теорема о частном. Пусть величина Р\ци такова, что AxP\ltl/ яв- ляется тензором для любого вектора А". В этом случае Р\ци — тензор. Чтобы доказать это, введем Q^ = АхР\^и. По условию Q^ есть тензор, поэтому Q/3-/ = Qfi'v'xf px" т. Тогда АаР „ — Лх'Р^, , ,т^\ти' Так как Ах — вектор, из C.2) имеем: Ах =Аахха. Таким образом, Это равенство должно выполняться для всех значений Аа; следователь- но, Ра — Р , , ,ТХ> ТЙ т"' Видно, что Papj — тензор. Теорема остается справедливой для величины с произвольным чис- лом нижних и верхних индексов. 5. Искривленное пространство Двухмерное искривленное пространство легко себе представить как поверхность в трехмерном евклидовом пространстве. Аналогичным образом можно иметь дело с искривленным четырехмерным простран- ством в плоском пространстве большего числа измерений. В этом слу- чае искривленное пространство называют римановым. Малая область риманова пространства близка к плоскому пространству.
6. Параллельный перенос 123 Эйнштейн предположил, что физическое пространство является пространством именно такой природы, и поэтому положил риманову геометрию в основу теории гравитации. В искривленном пространстве нельзя ввести систему прямолиней- ных координат. Приходится пользоваться криволинейными координа- тами типа рассмотренных в разд. 3. Формализм этого раздела можно целиком применить к искривленному пространству, так как все обсуж- давшиеся там уравнения являются локальными, что делает их нечув- ствительными к кривизне. Инвариантный интервал ds между точкой жм и близлежащей точ- кой жм + dx^1 дается выражением вида B.1): ds2 = gf Интервал ds для временеподобных точек является действительным, для пространственноподобных точек — мнимым. В криволинейных координатах g^, заданная как функция коорди- нат, фиксирует все элементы инвариантного расстояния; таким обра- зом, g^ задает метрику. Величина g^ определяет как координатную систему, так и кривизну пространства. 6. Параллельный перенос Пусть вектор АЙ локализован в точке Р. Если пространство ис- кривлено, понятие параллельного вектора в другой точке Q лишено смысла, в чем легко убедиться на примере искривленного двухмерного пространства в трехмерном евклидовом пространстве. Однако в точ- ке Р', близкой к Р, существует вектор, параллельный А^1 с точностью до членов второго порядка по расстоянию между точками Р и Р'. Тог- да можно придать смысл операции переноса вектора А^1 из точки Р в точку Р', оставляющей вектор параллельным самому себе и не изме- няющей его длины. При помощи операции параллельного переноса можно непрерывно перемещать вектор вдоль некоторой траектории. Выбрав траекторию от Р до Q, получим вектор в точке Q, параллельный, в смысле дан- ной траектории, исходному вектору в точке Р. Другая траектория даст иной результат. Понятие вектора в точке Q, параллельного исходному вектору в точке Р, не является абсолютным. Если произвести парал- лельный перенос вектора из точки Р вдоль замкнутой траектории, то
124 Общая теория относительности получим снова вектор в точке Р, который, вообще говоря, отличается от исходного направлением. Уравнения для параллельного переноса вектора можно получить, предположив, что наше четырехмерное физическое пространство нахо- дится в плоском пространстве большего числа, скажем N, измерений. Введем в этом iV-мерном пространстве прямолинейные координаты zn (п = 1, 2, ... , N). Эти координаты могут быть неортогональными. Для двух близлежащих точек существует инвариантное расстояние: ds2 = hnmdzndzm, F.1) где суммирование по п и т ведется от 1 до Л". В отличие от gM!/ ве- личины hnm являются константами. С их помощью можно опускать индексы в iV-мерном пространстве: dzn = hnmdzm. Физическое пространство образует четырехмерную «поверхность» в плоском iV-мерном пространстве. Каждая точка жм этой поверхнос- ти определяет некоторую точку уп в iV-мерном пространстве. Каждая координата уп является функцией четырех жм. Уравнения поверхности задаются путем исключения х^ из N функций уп{х). Таких уравне- ний N - 4. Дифференцируя уп(х) по параметрам х^, получаем дуп(х)/дх» = Уу. Для двух близких точек поверхности, различающихся на Sx^, имеем Syn = V^Sx^. F.2) Согласно F.1) квадрат инвариантного расстояния между этими точка- ми имеет вид Поскольку hnm — константы, то Ss2 можно записать в виде 5s2 = у^уп,„5х»5х\ Кроме того, 5s2 = g^
6. Параллельный перенос 125 Отсюда получаем, что е^ = УфУп,и- (б.з) Рассмотрим в физическом пространстве контравариантный век- тор АЙ, локализованный в точке х. Компоненты А11 преобразуются так же, как 5хЙ из F.2), и из них, следовательно, можно образовать соот- ветствующий контравариантный вектор Ап в iV-мерном пространстве, преобразующийся так же, как Sy11 из F.2). Тогда Ап = уп^Ац_ F4) Вектор Ап, разумеется, принадлежит поверхности. Сместим теперь Ап в соседнюю точку поверхности x+dx, оставляя его параллельным самому себе (это означает, что компоненты Ап оста- ются неизменными). Вследствие кривизны пространства вектор в точ- ке x + dx уже не принадлежит поверхности. Однако его проекция на по- верхность задает определенный вектор, принадлежащий поверхности. Для нахождения проекции на поверхность нужно разложить вектор на тангенциальную и нормальную составляющие и затем нормальную составляющую отбросить: Ап = А?ап + АЦог. F.5) Если обозначить К^ компоненты Afan в координатной системе х, при- надлежащей поверхности, то в соответствии с F.4) можно записать: A2an = K*y^(x + dx), F.6) где коэффициенты у^ взяты в новой точке х + dx. Составляющая А™ог по самому определению ортогональна любому тангенциальному вектору в точке x + dx и, следовательно, любому век- тору типа правой части F.6) независимо от вида К1*. Тогда А™огуп,»(х + dx) = 0. Если теперь умножить F.5) на уПу„(х + dx), то член с А"ог исчезает, и с учетом F.3) получим АпупАх + dx) = к>гУф(х + <1х)уп,„(х + dx) = K^g^ix + dx).
126 Общая теория относительности Таким образом, с точностью до величин первого порядка по dx находим: Kv(x + dx) = An[ynyV{x) + yn,v,adxa] = = Any^[yn,v + yn,v,*dxa] = Av + A^y^yn^^dxa. Так как Kv есть результат параллельного переноса Av в точку х + dx, можно положить так что dAv обозначает изменение Av при параллельном переносе. Тог- да имеем dAv = A^yn^dx'. F.7) 7. Символы Кристоффеля Дифференцируя F.3), получаем (вторая запятая при двукратном дифференцировании опущена) Sliv,a = УфаУп,и ~\~ УфУп,иа = Уп,цсгУ\v Л~ Уп^аУф^ \> •*¦) поскольку немой индекс п вследствие постоянства hnm можно поднять и опустить. Меняя местами \i и а в G.1), получаем gw,n = Уп,<г»У™„ + Уп,1>»У™а- G.2) Переставляя v и а в G.1), имеем g^,v = УпФиУ^ + УщаиУ^- G.3) Теперь сложим G.1) и G.3), вычтем из полученного уравнения G.2) и разделим пополам. В результате получим: A/2)(g^ + glta>l, - gvatli) = у„,„ау^. G.4) Положим Гдг/о- = (l/2)(gfiV,a. + gp,,^ - gva^). G.5) Эту величину называют символом Кристоффеля первого типа. Она сим- метрична по двум последним индексам. Символ Кристоффеля первого типа не является тензором. Из G.5) непосредственно следует: Теперь ясно, что F.7) можно записать в виде dAv = A»TllvrTdxa. G.7)
7. Символы Кристоффеля 127 Это уже не относится к iV-мерному пространству, так как символ Крис- тоффеля выражается только через метрический тензор g^ физического пространства. Можно показать, что длина вектора не изменяется при параллель- ном переносе. Действительно: = AvdAv Далее, f^g^ + ^gpv,* = {g*^^),* = &,„ = 0. Умножая на получаем Это полезное соотношение выражает производную g01® через производ- ную g^. Отсюда Следовательно, выражение G.8) обращается в нуль. Таким образом, длина вектора не изменяется. В частности, нулевой вектор (т.е. вектор нулевой длины) при параллельном переносе остается нулевым. Постоянство длины вектора при параллельном переносе следует также из геометрических соображений. При разложении вектора А^ на тангенциальную и нормальную составляющие, согласно F.5), нор- мальная составляющая инфинитезимальна и ортогональна тангенци- альной составляющей. Значит, в первом приближении длина вектора равна длине его тангенциальной составляющей. Постоянство длины произвольного вектора влечет за собой посто- янство скалярного произведения gtiVAliBv двух произвольных векто- ров А и В. Это можно показать, используя постоянство длины векто- ра А + ХВ при произвольном значении параметра А. Часто бывает полезно поднять первый индекс символа Кристоффе- ля так, чтобы образовать величину '-vtr — о ^Avat которую называют символом Кристоффеля второго типа. Она симмет- рична по двум нижним индексам. Как пояснялось в разд. 4, операция поднятия индекса определена и для нетензорных величин.
128 Общая теория относительности Формулу G.7) можно переписать в виде dAv = T^Apdx*. G.10) Это стандартная запись в ковариантных компонентах. Введя второй вектор Bv', получим d(AvB") = 0; AvdBv = -BvdAv = -BT^A^dx" = -ВТ^Д". Последнее соотношение справедливо для произвольного А„. Тогда dBv = -r^B^dx". G.11) Это — стандартная запись для параллельного переноса в контравари- антных компонентах. 8. Геодезические Пусть точка с координатами z^1 движется по какой-либо траек- тории, тогда zM является функцией некоторого параметра т. Поло- жим dz1* /dr = иЙ. Имеется, таким образом, вектор им, определенный в каждой точке траектории. Предположим, что при движении вдоль траектории век- тор им смещается посредством параллельного переноса. Тогда задание начальной точки и начального значения вектора им определяет всю тра- екторию. Действительно, надо сместить начальную точку из г' в г11 + + u^dr, затем посредством параллельного переноса сместить в эту но- вую точку вектор им, потом снова сместить точку в направлении, за- данном новым вектором им, и т.д. Определена не только траектория, но и параметр г вдоль нее. Траекторию, полученную таким способом, называют геодезической. Если им в начальной точке является нулевым вектором, то он оста- нется нулевым вектором во всех других точках; в этом случае траек- торию называют нулевой геодезической. Если и в начальной точке — времениподобный вектор (имим > 0), то он останется времениподоб- ным вектором во всех других точках, и мы имеем времениподобную геодезическую. Соответственно, если им начальной точке является про- странственно-подобным вектором (имим < 0), то он останется про- странственно-подобным во всех других точках, и мы получим про- странственно-подобную геодезическую.
9. Свойство стационарности геодезических 129 Обратившись к уравнению G.11) с Bv = uv и dxa = dza, получим уравнения геодезической: du"/dT + T^dz'/dr = О, (8.1) или d2zv/dr2 + r^(dzti/dT)dzcr/dT = 0. (8.2) Для времениподобной геодезической можно привести длину на- чального вектора им к единице, умножив его на соответствующий мно- житель. Для этого потребуется лишь изменить масштаб т. Теперь век- тор иЙ всегда будет иметь единичную длину. Он представляет собой вектор скорости v^1 = dz^/ds, а параметр г становится собственным временем s. Уравнение (8.1) приобретает вид dv^/ds + T»avvva = 0, (8.3) а уравнение (8.2) — вид d2z»/ds2 + Y^{dzvlds)dzalds = 0. (8.4) Предположим, что мировая линия частицы, не находящейся под воздействием каких-либо сил, кроме гравитационных, есть времени- подобная геодезическая. Это заменяет первый закон Ньютона. Уравне- ние (8.4) задает ускорение и является уравнением движения. Предположим также, что траектория светового луча есть нулевая геодезическая. Она задается уравнением (8.2) с некоторым парамет- ром г вдоль траектории. Собственное время s в этом случае использо- вать нельзя, поскольку ds обращается в нуль. 9. Свойство стационарности геодезических Геодезическая, не являющаяся нулевой, обладает следующим свой- ством: интеграл J ds, взятый вдоль участка траектории с граничными точками Р и Q, при малых вариациях траектории с фиксированными граничными точками постоянен. Пусть каждая точка траектории с координатами z^1 смещена в точ- ку с координатами z^1 + Sz1*. Если смещение вдоль траектории обозна- чить dx^: ds2 = g^dx^dx",
130 Общая теория относительности то 2ds S(ds) = dxlidxv5gtiu + g^dx^Sdx" + gllvdxv5dxli = = dx^dxug^xSxx + 2gliXdx>i5dxx. Кроме того, 5dxx = d5xx. Таким образом, поскольку dx^ = v^ds, то 5(ds) = [(l/2)gfil/yXv»vxx + gltXv»d5xx/ds]ds. Следовательно, 5 I ds= 15{ds)= f[{l/2)g^xvlivv5xx + g^v»d5xx/ds}ds. Интегрируя по частям и используя условие Sxx = 0 в граничных точ- ках Р и Q, получаем S jds = j[(l/2)gfl^xv^vv - {dlds)(gliXv»)}dxxds. (9.1) Условием обращения (9.1) в нуль при произвольном 5хх является (d/ds)(gfiXvn - {Il2)g^xv»vv = 0. (9.2) Далее, Тогда условие (9.2) принимает вид gfi\dv»/ds + YXtiVv»vv = 0. Умножив это уравнение на gXrT, можем записать: dva/ds + Y°vv»vv = 0, т.е. как раз условие (8.3) для геодезической. Отсюда видно, что для геодезической выражение (9.1) обращается в нуль и J ds = const. И наоборот, если J ds постоянен, можно пока- зать, что траектория является геодезической. Таким образом, условие постоянства J ds можно использовать как определение геодезической, за исключением случая нулевой геодезической.
10. Ковариантное дифференцирование 131 10. Ковариантное дифференцирование Пусть S — скалярное поле. Тогда, как было показано в разд. 3, SyV есть ковариантный вектор. Далее, пусть А^ — векторное поле. Явля- ется ли его производная А^^ тензором? Чтобы ответить на этот вопрос, посмотрим, как преобразует- ся ^4м,г/ при преобразованиях координат. В обозначениях разд. 3 А^ преобразуется, согласно уравнению C.5): и, следовательно, Это выражение является точным законом преобразования тензора, если в правой части отсутствует последний член. Значит, М)„ — не тензор. Можно, однако, модифицировать операцию дифференцирования так, чтобы получить тензор. Возьмем вектор Ац в точке х и сместим его посредством параллельного переноса в точку х + dx. При этом А остается вектором. Вычтем его из вектора А в точке х + dx — раз- ность тоже является вектором. В первом приближении получим А^х + dx) - [А»{х) + T«vAadxv\ = (А^ - T^Aa)dxv. Эта величина есть вектор для произвольного вектора dx", следователь- но, согласно теореме о частном (см. разд. 4), коэффициент А^^ — Т^Аа является тензором. Легко проверить непосредственно, что при преобра- зованиях координат он преобразуется по тензорному закону. Это выра- жение называется ковариантной производной А^ и записывается в виде Знак « : » перед нижним индексом далее будет обозначать ковариант- ную производную, подобно тому, как запятая обозначает обычную про- изводную. Пусть Bv — некоторый другой вектор. Определим ковариантную производную внешнего произведения как (ЛмВ„)!в. = Ali:aBv + ApB^. A0.2)
132 Общая теория относительности Очевидно, что это тензор с тремя индексами. Его явный вид есть Пусть Тци — тензор с двумя индексами. Он выражается в виде суммы членов вида А^Ви; тогда его ковариантная производная запи- сывается так: т —т — га т — га т (^п':^) Это правило можно обобщить для случая ковариантной производной тензора с любым числом нижних индексов: У^...-.(т = У^...:а — Г — член для каждого индекса. (Ю-4) В каждом из этих Г-членов нужно выполнить условие баланса индексов. Этого достаточно для однозначной расстановки индексов. Ковариантная производная скаляра получается из общей формулы A0.4) при нулевом числе индексов в Y: Yia = Ya. A0.5) Применим A0.3) к фундаментальному тензору g^. С учетом G.6) это дает р- — р- — Га р- — Га р- — р- —Г —Г —О bliv-<T — ёд^,о" х iMjboiv Lva&tJ:Ct — ёд^,о" ±^да" ±д^а" — и* Таким образом, при ковариантном дифференцировании g^ можно рас- сматривать как константу. Формула A0.2) представляет собой обычное правило, используемое при дифференцировании произведения. Предположим, что это правило справедливо и для ковариантной производной скалярного произведения двух векторов. Тогда (А»В„)..а = А»..„В» + А»В„:а. A0.6) Отсюда, согласно A0.5) и A0.1), получаем
10. Ковариантное дифференцирование 133 следовательно, Так как это справедливо для произвольного В^, имеем: А":а = А",а + Г^Аа, A0.7) что является стандартным выражением для ковариантной производной контравариантного вектора. Здесь возникает тот же символ Кристоф- феля, что и в стандартной формуле A0.1) для ковариантного вектора, но со знаком плюс. Расположение индексов полностью определяется тре- бованиями баланса индексов. Этот формализм можно обобщить на случай ковариантной произ- водной тензора с любым числом верхних и нижних индексов. Г-члены возникают для каждого индекса (со знаком плюс для верхнего и со зна- ком минус для нижнего индексов соответственно). Если свернуть два индекса, то соответствующие Г-члены сократятся. Формула для ковариантной производной произведения (XY):a = X:aY + XY:a A0.8) справедлива в самом общем случае для любых тензорных величин X и Y. Поскольку g^ при ковариантном дифференцировании ведет себя как константа, индексы можно поднимать и опускать до дифферен- цирования: результат будет тот же, что и при перемещении их после дифференцирования. Ковариантная производная нетензорной величины не имеет смыс- ла. Физические законы должны быть справедливы во всех системах координат. Значит, они должны выражаться в виде тензорных уравне- ний. Если уравнения содержат производные полевых величин, то это должны быть ковариантные производные. Полевые уравнения получа- ются заменой обычных производных ковариантными. Например, урав- нение Даламбера ПУ = 0 для скалярного поля V в ковариантной форме принимает вид g^V:fi:u = 0. С учетом A0.1) и A0.5) это дает: ^TOV - W*) = о- (ю-9)
134 Общая теория относительности Даже если рассматривать задачу в плоском пространстве (т.е. в пре- небрежении гравитационным полем) и использовать криволинейные ко- ординаты, следует записывать уравнения в терминах ковариантных производных, чтобы они сохраняли свой вид во всех системах коор- динат. 11. Тензор кривизны Из формулы для дифференцирования произведения A0.8) видно, что в этом отношении ковариантное дифференцирование вполне ана- логично обычному. Однако важное свойство обычного дифференциро- вания, которое заключается в том, что при действии двух операторов дифференцирования их порядок не имеет значения, для ковариантного дифференцирования в общем случае не сохраняется. Начнем с рассмотрения скалярного поля S. Из A0.1) имеем Полученное выражение симметрично по индексам ц и v, так что в этом случае порядок операторов ковариантного дифференцирования не име- ет значения. Теперь подействуем двумя операторами ковариантного дифферен- цирования на вектор Av. Из формулы A0.3) с Av:p вместо Тир находим А —А — Та А — Та А — IА — Та А \ — ¦t±u:p:(T — ¦t±u:p,(T Li/a ot:p L pa--t±u:a — \-t±u,p L иp ct)*& _ Г" Г/3 _ F« p/3 \ Переставляя индексы р и а и вычитая получившееся выражение из предыдущего, получаем Av.p-.a — Av.a.p = ApRvpa., (\\.2) где о/З — р/З _ р/З I pa р/3 _ уа р/3 (л i оЛ vupa ua,p up,а ~ иа ар up аа' \ *-* 1 Левая часть A1.2) является тензором. Следовательно, и правая часть A1.2) есть тензор. Это справедливо для произвольного вектора Ар, по- этому, согласно теореме о частном (см. разд. 4), R^pa — тензор. Его называют тензором Римана-Кристоффеля, или тензором кривизны.
12. Критерии плоского пространства 135 Тензор кривизны обладает очевидным свойством: Rtpa = -RtP- (И -4) Из A1.3) непосредственно следует, что R$p* + К™ + R™P = °- (и-5) Опустим индекс /3 на место первого нижнего индекса. Это даст где (pa) обозначает предыдущие члены с переставленными местами р и а. Тогда из G.6) получим Ыщ/ра — *-p,vtr,p ~ efi,fi,p'-v(T ~i~ '-f'Pp'-va ~ = Г»и*,р ~ Г/З^рГ^а- С учетом G.5) ?*>p,vp<r \^1 ^)\ёц(т,ир gvoфр gp,p,v<j + ёирфег) + i Г Г/3 - Г Г/3 ( ) Теперь видны еще некоторые свойства симметрии тензора кривизны, а именно: ¦Ищ/ра = ~^vp,p<r A1.7) Результатом всех этих свойств симметрии является то, что из 256 ком- понент R^vpa независимыми являются лишь 20. 12. Критерии плоского пространства Если пространство является плоским, можно выбрать прямолиней- ную систему координат; тогда g^ будет константой и, следователь- но, R^vpa обратится в нуль.
136 Общая теория относительности И, наоборот, если R^pa обращается в нуль, можно показать, что пространство является плоским. Вектор Ац, расположенный в точке х, сместим посредством параллельного переноса в точку х + dx. Затем сместим его посредством параллельного переноса в точку х + dx + Sx. Если Яцира обращается в нуль, то при смещении А^ из х сначала в точ- ку x + Sx, а затем в точку x + Sx + dx результат должен быть прежним. Таким образом, при смещении вектора из одной точки в другую резуль- тат не зависит от траектории перехода. Тогда, перемещая параллель- ным переносом исходный вектор А^ из точки х во всевозможные точки, получаем векторное поле, удовлетворяющее условию А^.м = 0, т. е. А„,„ = Y%K- A2-1) Можно ли представить такое векторное поле в виде градиента от скаляра? Положим в A2.1) А^ = Бф. Получим S,^ = r^vS,a. A2.2) Вследствие симметрии ГД, по нижним индексам выражения для Бф1/ и S,vfl совпадают, и уравнение A2.2) является интегрируемым. Выберем четыре независимых скаляра, удовлетворяющих A2.2), в качестве координат ха новой координатной системы. Тогда „а' _ ро- а' Согласно трансформационному закону C.7) Дифференцируя это соотношение по xv, находим с учетом G.6) gp,\,v ~ ga'D',uX" Mxf A = ga'/3'(z" Ц»Х^ А + х" цХ& \„) = = ga'fi-{T^vxfaxfX + xf^xfa) = gaXT^ + g^T^ = Следовательно, ga'/3',vX"'„xf A =0. Значит, ga>p,v = 0. В новой системе координат метрический тензор является константой. Таким образом, мы имеем дело с плоским про- странством в прямолинейной системе координат.
13. Тождества Бианки 137 13. Тождества Бианки Прежде чем обсуждать вторую ковариантную производную произ- вольного тензора, рассмотрим тензор, являющийся внешним произве- дением векторов А^ и ВТ: \Ар,Вт).р.гт = уАц:рНт + А^?>т.р).а = А^.р.а?>т + Ац:р?>т:а + Теперь поменяем местами р и а и вычтем полученное равенство из исходного. С учетом A1.2) это даст (А^Вт)..р:сг - {А,,Вт)..а..р = AaR«paBr + А^раВа. Произвольный тензор Гмт выражается в виде суммы членов типа А^Вт, тогда он должен удовлетворять соотношению Пусть ТцТ является ковариантной производной вектора А^.т. Тогда A —A —A Ra 4- A Ra ¦t±p,:T:p:(T ¦г1-р,\т\гт\р — ot:T±i'pJpa ~r -t±p,:ot±i'Tpa' Выполним в этой формуле циклические перестановки индексов г, р и а и сложим полученные три уравнения. Из левой части имеем Ар-.р-.а-.т ~ Ди:0-:/э:т + Цикл, перест. = (AaR%pa):T + цикл, перест. = = Aa:TR«p(r + AaR«pa:T + цикл, перест. A3.2) Правая часть дает Aa:TR%pa + цикл, перест., A3.3) так как остальные члены сокращаются [см. равенство A1.5)]. Первые члены в A3.2) и A3.3) сокращаются и остается AaR%pa:T + цикл, перест. = 0. Множитель Аа фигурирует во всех членах этого уравнения и может быть отброшен. В результате имеем В дополнение к условиям симметрии из разд. 11 тензор кривизны удовлетворяет этим дифференциальным уравнениям. Эти уравнения известны под названием тождеств Бианки.
138 Общая теория относительности 14. Тензор Риччи Свернем R^pa по двум индексам. Если свертка производится по индексам, относительно перестановки которых Я^р1Т антисиммет- ричен, то, разумеется, результатом будет нуль. Если же сворачи- вать Rfivpa- по другим парам индексов, то получим результаты, отлича- ющиеся один от другого лишь знаком. Это следует из свойств симмет- рии A1.4), A1.7) и A1.8). Произведем свертку по первому и последнему индексам. Получим ДД ТУ vpfi — Ыир. Этот тензор называют тензором Риччи. Умножая A1.8) на g^a, находим, что Rvp = Rpv, A4-1) т.е. тензор Риччи симметричен. Можно свернуть Rvp по оставшимся двум индексам и образовать gvpRvp = Rvv = R. Величина R — скаляр и называется скалярной кривизной. Она опре- делена таким образом, что является положительной для сферы в трех- мерном пространстве, в чем можно убедиться непосредственным вы- числением. Тождества Бианки A3.4) содержат пять индексов. Свернем их дважды и получим соотношение с одним свободным индексом. Поло- жим в A3.4) г = а и умножим на g^p: т.е. WRZpaU + №PR%a):p + {g"PR%p):a = 0- A4.2) Далее, pjipna — „W> рй/Зр _ ^p a/3 ту _ a/3 ту _ туа о lipa ~ о Ь Ы/Зцра — 6 6 rLti/3ap — & Л/Зо- — "-„• Вследствие симметрии RatT можно писать индексы один над другим, т.е. R™. Тогда уравнение A4.2) приобретает вид RZ, а
15. Эйнштейновский закон гравитации 139 или 2К,а - ка = о, что представляет собой тождества Бианки для тензора Риччи. Подняв индекс а, можем записать [R™ - A/2)^аД]:а = 0. A4.3) Выражение для тензора Риччи, согласно A1.3), в явном виде вы- глядит следующим образом: Д— г™ — г™ — г™ т@ -\- г™ т@ (^ а 4Л 1м> — vp,a,v lnv,a lp,vv a/3 + l Д/31vа- У1*-*) Первый член здесь, на первый взгляд, не симметричен по ц и v, тогда как остальные три, очевидно, симметричны. Доказательство симмет- рии первого члена требует проведения некоторых выкладок. Чтобы продифференцировать детерминант g, необходимо продиф- ференцировать в нем каждый элемент gx^ и домножить его на алгеб- раическое дополнение ggx'i. Таким образом, xw A4.5) Следовательно, ) g-))V. Отсюда вытекает, что первый член в A4.4) симметричен по \х и и. 15. Эйнштейновский закон гравитации До сих пор содержание книги носило чисто математический харак- тер, за исключением физического предположения о том, что траектория частицы есть геодезическая. Многие результаты, изложенные в преды- дущих разделах, были получены в прошлом веке и относятся к искрив- ленному пространству произвольного числа измерений. В предшест- вующем формализме размерность пространства фигурирует лишь по- стольку, поскольку g^ = число измерений.
140 Общая теория относительности Эйнштейн предположил, что в пустом пространстве R^u = 0. A5.1) В этом и состоит эйнштейновский закон гравитации. «Пустое» здесь означает отсутствие материи и каких-либо физических полей, за ис- ключением самого гравитационного поля. Гравитационное поле не на- рушает пустоты. Все остальные поля нарушают. Условия пустоты про- странства с хорошей точностью справедливы для межпланетного про- странства в Солнечной системе, и здесь применимо уравнение A5.1). Плоское пространство, очевидно, удовлетворяет соотношению A5.1). Геодезические в плоском пространстве являются прямыми линиями; таким образом, частицы движутся по прямым линиям. В случае ис- кривленного пустого пространства эйнштейновский закон накладывает ограничения на кривизну. Вместе с предположением о том, что плане- ты движутся по геодезическим это дает некоторую информацию об их движении. На первый взгляд, эйнштейновский закон гравитации не имеет ни- чего общего с ньютоновским. Чтобы увидеть аналогию, нужно рассмат- ривать g^ как потенциалы, описывающие гравитационное поле. В от- личие от одного ньютоновского потенциала в эйнштейновской теории их десять. Эти потенциалы описывают не только гравитационное поле, но и координатную систему. Гравитационное поле и система координат в эйнштейновской теории неразрывно связаны, и их не удается описать независимо друг от друга. При рассмотрении компонент g^ как потенциалов A5.1) оказыва- ется полевым уравнением и выглядит как обычное полевое уравнение в том смысле, что оно является уравнением второго порядка, так как вторые производные входят в A4.4) через символы Кристоффеля. Урав- нение A5.1) отличается от обычных полевых уравнений тем, что оно нелинейно, существенно нелинейно. Эйнштейновские уравнения весьма сложны, и находить их точные решения трудно. 16. Ньютоново приближение Рассмотрим статическое гравитационное поле в статической сис- теме координат. Тогда g^ постоянно во времени, т. е. g^o = 0. Далее, для т = 1, 2, 3 должно выполняться условие: gmO = 0.
16. Ньютоново приближение 141 Следовательно, и gmn является обратной матрицей по отношению к gmn. Латинские ин- дексы всегда пробегают значения 1, 2, 3. Отсюда находим, что Гтоп = О, а тогда и Го™ = 0. Рассмотрим частицу, движущуюся со скоростью малой по сравне- нию со скоростью света. Тогда vm есть малая первого порядка. В пре- небрежении величинами второго порядка малости получим, что goo(v0J = 1. A6.1) Частица движется по геодезической. Уравнение геодезической (8.3) с точностью до членов первого порядка дает dvm/ds = -T™(v0J = -gmnTn00(v0J = (l/2)gmngoo,n^°J- Но с точностью до членов первого порядка dvm _ dvm dx11 _ dvm о ds ~ dx» ds ~ dx° ' Тогда с учетом A6.1) запишем dy^_ _ \„тп 0 _ ran/ I О ~ 9 gOO,nv — g \goo dx° 2l Поскольку g^v не зависит от х , можно опустить индекс то, что даст соотношение dvm/dx° = (goo/2),m- A6.3) Видно, что частица движется так, будто она находится под воздействи- 1/2 ,-, ем потенциала go'o . При получении этого результата никак не исполь- зовалось уравнение Эйнштейна. Теперь для сравнения эйнштейновской теории с ньютоновской учтем закон Эйнштейна, приводящий к опре- деленным уравнениям для потенциала. Предположим, что гравитационное поле является слабым, так что кривизна пространства-времени мала. Тогда можно выбрать систему координат, для которой кривизна координатных осей (для каждой из осей три координаты фиксированы) мала. В этом случае g^ в первом
142 Общая теория относительности приближении есть константа, а gM1/)O-, и все символы Кристоффеля ма- лы. Уравнение Эйнштейна A5.1) с точностью до членов первого порядка приобретает вид [см. A4.4)] Га - Г" =0 да, v *дг/,а "¦ Сворачивая A1.6) по двум индексам с перестановкой р и /х и пренебре- гая членами второго порядка малости, можно преобразовать это соот- ношение к следующему более удобному виду: ^{gpa^v - gva,np ~ gp,p,ua + g^u,pa) = 0. A6.4) Положим теперь yi, = v = 0 и используем условие независимости g^v от х°. Получим gmng00,mn = 0. A6.5) Уравнение Даламбера A0.9) в приближении слабого поля принимает вид 8^"Уфи = 0. В статическом случае это выражение сводится к уравнению Лапласа: gmnVmn = 0. Уравнение A6.5) как раз и означает, что goo удовлетворяет уравнению Лапласа. Можно выбрать единицу измерения времени так, чтобы goo мало отличалось от единицы. Тогда положим: goo = 1 + 2V, A6.6) где V — мало. В этом случае goo1/2 = 1 + У и V становится потенциа- лом. Поскольку V удовлетворяет уравнению Лапласа, его можно отож- дествить с ньютоновским потенциалом, равным —т/г, где т — масса источника. Теперь видно, что A6.2) приводит к соотношению: Ускорение = — gradF, так как диагональные элементы gmn рз — 1. Значит, знак при V был выбран правильно.
17. Гравитационное красное смещение 143 Таким образом, закон Эйнштейна переходит в закон Ньютона, ког- да поле является слабым и статическим. Следовательно, результаты ньютоновской теории по объяснению движения планет остаются в силе. Приближение статичности оправдывается малостью скоростей планет по сравнению со скоростью света. Приближение слабого поля является хорошим, так как пространство очень незначительно отклоняется от плоского. Рассмотрим порядки некоторых величин. Значение потенциала V на поверхности Земли оказывается поряд- ка 10~9. Таким образом, goo из формулы A6.6) очень близко к единице. Но даже такое малое отличие goo 0T единицы приводит к значитель- ным гравитационным эффектам, наблюдаемым на Земле. Взяв радиус Земли порядка 109см, найдем, что значение goo,m порядка 10~18см~1. Следовательно, отклонение пространства от плоского крайне мало. Од- нако, чтобы получить ускорение в гравитационном поле на поверхнос- ти Земли, нужно умножить это отклонение на квадрат скорости света, т.е. на 9 • 1020(см/секJ. Поэтому ускорение (около 103см/сек2) вполне ощутимо, хотя само отклонение пространства от плоского бесконечно мало, для того чтобы его можно было наблюдать непосредственно. 17. Гравитационное красное смещение Рассмотрим монохроматическое излучение покоящегося атома, на- ходящегося в статическом гравитационном поле. Длина волны излучае- мого света соответствует определенному значению As. Поскольку атом покоится, в статической системе координат типа системы, использовав- шейся в разд. 16, имеем As2 = где Ах° — период, т. е. время между соседними максимумами, отне- сенное к выбранной системе координат. При распространении света в другую область пространства Ах° не изменяется. Величина Ах° — не то же самое, что период некото- рой спектральной линии атома, находящегося в данной точке. Эту роль играет As. Таким образом, период зависит от гравитационного потен- циала goo в той точке, где свет был излучен:
144 Общая теория относительности — 1/2 Множитель g00 ' описывает смещение спектральной линии. В ньюто- новом приближении A6.6) имеем Дж° ~ 1 - V. Значение V отрицательно в области сильного гравитационного поля, например, на поверхности Солнца. Поэтому свет, излучаемый на Солн- це, смещен относительно света, излучаемого на Земле, в красную часть спектра. Этот эффект можно было бы наблюдать для света от Солнца, если бы он не терялся на фоне других физических эффектов, таких, как эффект Доплера, возникающий из-за движения излучающих ато- мов. Красное смещение более заметно для света от белых карликов, где вследствие высокой плотности материи гравитационный потенциал на поверхности звезды гораздо выше. 18. Решение Шварцшильда Уравнения Эйнштейна для пустого пространства представляют со- бой очень сложные нелинейные уравнения, и нахождение их точных ре- шений является весьма трудной задачей. Однако в одном специальном случае решение находится без особых усилий, а именно: в случае ста- тического сферически-симметричного поля, создаваемого покоящимся сферически-симметричным телом. Условие статичности означает, что в статической координатной системе goo не зависит от времени х°, или t, и, кроме того, gom = 0. В качестве статической координатной системы можно выбрать сфери- ческие полярные координаты х1 = г, х2 = в, х3 = <р. Наиболее общее выражение для ds2 в случае сферической симметрии имеет вид ds2 = Udt2 -Vdr2 -Wr2(de2 + sin2 Od<p2), где U, V и W зависят только от г. Не нарушая сферической симметрии, можно заменить г произвольной функцией от г. Используем это обсто- ятельство для максимального упрощения выражения для ds2. Удобнее всего обратить множитель W в единицу. Тогда ds2 можно записать следующим образом: ds2 = expBv)dt2 - expBA)dr2 - г2 dB2 - г2 sin2 в dip2, A8.1)
18. Решение Шварцшилъда 145 где v и А зависят только от г. Функции v и А должны быть выбраны так, чтобы удовлетворять уравнениям Эйнштейна. Из A8.1) можно выразить g^ через i/иА: goo = ехрBг^); gxl = - ехрBА); g22 = -r2; g33 = -r2 sin2 в; gfiv = О ДЛЯ /Л ф Р. Далее находим /° = exp(-2i/); g11 = - ехрBА); g^v = 0 для fj, ф v. Теперь необходимо выразить через v и \ все символы Кристоффе- ля. Многие из них обращаются в нуль, а оставшиеся имеют вид: Г1 — \'- Г2 — Г3 — г- 111 — л ) М2 — Агз — ' ) Г212 = -гехр(-2А); Г233=^8в; Гз^ = -г sin2 0ехр(-2А); Г323 = - sin в cos в, где штрих означает дифференцирование по г. Эти выражения нужно подставить в A4.4). В результате получим: Доо = (-„" + AV - г/2 - 2v'/r) ехрBг^ - 2А); A8.2) Дп = 1/" - AV + г^'2 - 2А'/г; A8.3) Л22 = A + м/' - г А') ехр(-2А) - 1; A8.4) Дзз = Д22 sin в (остальные компоненты Ддг/ в этом случае тождественно равны нулю). Эйнштейновский закон гравитации требует, чтобы эти выражения обращались в нуль. Обращение в нуль A8.2) и A8.3) дает X' + р' = 0. При больших г пространство должно быть близко к плоскому, так что при г —> сю и А, и v должны стремиться к нулю. Следовательно,
146 Общая теория относительности Из обращения в нуль A8.4) следует, что (l + 2ri/)expBv) = 1, или [гехрBг^)] = 1. Отсюда г ехрBг^) = г - 2га, где m — постоянная интегрирования. Подстановка последнего соотно- шения в A8.2) и A8.3) также обращает их в нуль. Из этого же соотно- шения получаем выражение для goo: goo = 1 - 2т/г. A8.5) Для больших значений г должно быть справедливо ньютоново при- ближение. Сравнение A8.5) с A6.6) показывает, что постоянная интег- рирования га, которая появляется в A8.5), есть не что иное, как масса тела, создающего гравитационное поле. Полное решение уравнений Эйнштейна имеет вид Оно известно под названием решения Шварцшильда и применимо вне тела, создающего гравитационное поле, т.е. в области, где отсутству- ет материя. Таким образом, это уравнение с приемлемой точностью справедливо вне поверхности звезды. Для движения планет вокруг Солнца решение A8.6) дает малые по- правки к ньютоновской теории. Они ощутимы только для Меркурия — ближайшей к Солнцу планеты — и объясняют отклонение траектории этой планеты от траектории, предсказываемой теорией Ньютона. Это является убедительным подтверждением эйнштейновской теории. 19. Черные дыры При г = 2га решение A8.6) становится сингулярным, так как в этой точке goo = 0 и gii = —сю. Может показаться, что г = 2га является минимально возможным радиусом тела массы га. Однако ближайшее рассмотрение показывает, что это не так.
19. Черные дыры 147 Рассмотрим частицу, падающую на центральное тело. Пусть ее вектор скорости есть Vй = dz^/ds. Предположим, что частица падает по радиусу так, что v2 = v3 = 0. Ее движение определяется уравнением геодезической (8.3): dv°/ds = -^„«"и" = -^To^v^v" = = WiuV = -{f°(dgoo/ds)v°. Учитывая что, g00 = 1/goo, получаем goodv°/ds + (dgoo/ds)v° = 0. Это уравнение интегрируется и дает соотношение goov° = к, где к — постоянная интегрирования, которая равна значению goo B на- чальной точке траектории частицы. В рассматриваемом случае имеем, как и прежде, Умножая это уравнение на goo и используя соотношение googii = —1, полученное в предыдущем разделе, находим к2 - (v1J = goo = 1 - 2m/r. Для падающего тела v1 < 0; следовательно, v1 = -{к2 -1 + 2то/гI/2. Тогда dt/dr = v°/v1 = -к{1 - 2т/г)-1(к2 - 1 + Imjr)-1!2. Пусть частица находится вблизи критического радиуса, т. е. г = 2т + е, где е мало и члены порядка е2 отброшены. Тогда dt/dr = -2т/е = -2т/(г - 2т). Интегрируя это соотношение, получаем t = —2mln(r — 2га) + const. Таким образом, при г —> 2га t —> сю, т.е. для достижения частицей критического радиуса 2га требуется бесконечное время. Предположим, что удаленный наблюдатель рассматривает части- цу, излучающую свет определенной частоты. Свет испытывает красное
148 Общая теория относительности смещение, описываемое множителем gg0 ' = A — 2m/r)~xl2. При до- стижении частицей критического радиуса этот множитель обращается в бесконечность. С точки зрения удаленного наблюдателя, все физи- ческие процессы в частице по мере ее приближения к критическому радиусу г = 2т протекают все медленнее и медленнее. Рассмотрим теперь наблюдателя, движущегося вместе с частицей. Для такого наблюдателя приращение времени совпадает с ds. Тогда ds/dr = 1/v1 = -(к2 - 1 + 2т/г)-1'2. При г —> 2т величина ds/dr стремится к — к~х. Следовательно, дости- жение частицей радиуса г = 2т происходит за конечное собственное время наблюдателя. Если в момент достижения критического радиу- са возраст движущегося наблюдателя конечен, то что же произойдет с ним дальше? По-видимому, наблюдатель будет продолжать свобод- но падать в пустом пространстве, двигаясь в область все меньших и меньших значений г. Для того чтобы рассмотреть продолжение решения Шварцшильда на область г < 2т, необходимо ввести нестатическую систему коор- динат; g^ в этом случае становится функцией временной координаты. Оставим координаты в и <р прежними, а вместо ( и г введем тир, определяемые соотношениями: T = t + f(r); p = t + g(r), A9.1) где fug — произвольные функции. Тогда справедливо равенство dr2 - ^dp2 = (dt + /'drJ - ^(dt + g'drJ = (l- ^)dt2 + fpf^2 ?i7Tb „/2 \ i 2 J r~g Jar — dr2, A9.2) полученное за счет выбора функций fug, которые удовлетворяют усло- виям: /' = Bm/r)g/ A9.3) и Bm/r)g12 - f'2 = A - 2m/r)-1. A9.4) Здесь штрих означает производную по г.
19. Черные дыры 149 Исключив из этих уравнений /, найдем g1 = (r/2mI/2(l-2rn/r)-1. A9.5) Чтобы проинтегрировать уравнение A9.5), положим г = у2 и 2га = а2. При г > 2га величина у > а. Получаем dg/dy = 2ydg/dr = Bу4/а)/(у2 -а2), откуда g = B/За)у3 + 2ау - а2 Ы[(у + а)/(у - а)]. A9.6) Окончательно из A9.3) и A9.5) имеем что интегрируется и дает B/3)(l/v/2^)r3/2 =g-f = p-T. A9.7) Таким образом, г = М(р-тK/2, A9.8) где ц= [C/2) V^m]273. Из проведенных выкладок видно, что удовлетворить условиям A9.3) и A9.4) можно. Значит, справедливо равенство A9.2). Подставляя A9.2) в решение Шварцшильда A8.6), получаем ds2 = dr2 ^—^dp2 -Ц2(р- тL/3И2 + sin2 в d^2). A9.9) { - тJ'3 Критический радиус г = 2га, согласно A9.7), соответствует р — т = = im/S. В метрике A9.9) сингулярность отсутствует. Поскольку метрику A9.9) можно явно преобразовать в решение Шварцшильда при помощи преобразования координат, то она удов- летворяет уравнениям Эйнштейна для пустого пространства в облас- ти г > 2т. Из отсутствия сингулярности при г = 2т и из аналитичес- кой непрерывности заключаем, что A9.9) удовлетворяет уравнениям
150 Общая теория относительности Эйнштейна и при г ^ 2т. Метрика A9.9) остается применимой вплоть до точки г = 0 или р — т = 0. Сингулярность появляется при переходе от новых координат к ис- ходным A9.1). Но так как введена новая система координат, забудем об исходной, и тогда сингулярность больше появляться не будет. Видно, что решение Шварцшильда для пустого пространства рас- пространимо на область г < 2т. Однако эта область изолирована от области г > 2т. Как нетрудно проверить, любому сигналу, даже свето- вому, потребуется бесконечное время, чтобы пересечь границу г = 2т. Таким образом, область г < 2т не является непосредственно наблюда- емой. Такую область называют черной дырой, так как материальные тела могут попасть внутрь сферы радиусом г = 2т (за бесконечное время по часам удаленного наблюдателя), но ничто не может выйти наружу. Возникает вопрос, существуют ли такие области в действитель- ности? Определенно можно сказать только одно: уравнения Эйнштей- на их существование допускают. Массивный звездный объект может сжаться до очень малых размеров; в этом случае гравитационные си- лы становятся настолько большими, что никакие другие из известных физических сил не смогут их уравновесить и предотвратить тем са- мым дальнейшее сжатие. Похоже, что сжатие такого объекта должно привести к образованию черной дыры1. Правда, по часам удаленного наблюдателя на это потребовалось бы бесконечное время, однако по отношению к самой падающей материи время сжатия конечно. 20. Тензорные плотности Элемент четырехмерного объема при преобразованиях координат преобразуется по закону: dx0' dx1'dx2'dx3' =dx°dx1dx2dx3J, B0.1) где J — якобиан; °'х1'х2'х3')/д(х°х1х2х3) J = д(х°'х1'х2'х3')/д(х°х1х2х3) = detx'V 1B последнее время появились аргументы в пользу того, что определенные фи- зические поля, не предотвращая сжатия, предотвращают появление сингулярности в метрике, т.е. образование черной дыры (см., например: М.А.Марков. Глобаль- ные свойства вещества в коллапсированном состоянии. — «Успехи физ. наук», 1973, т. 111, с. 3). — Прим. пер.
20. Тензорные плотности 151 Для краткости запишем B0.1) в виде d4x' = Jd4x. B0.2) Учтем, что gap %^ a eiJ,'i>l'E^ /3* Правую часть этого выражения можно рассматривать как произ- ведение трех матриц; у первой матрицы индекс а обозначает строки, индекс /л' — столбцы; у второй матрицы индекс /л' обозначает строки, индекс v' — столбцы; у третьей матрицы индекс v' обозначает стро- ки, индекс /3 — столбцы. Это произведение равно матрице gap из левой части. Соответствующее соотношение должно иметь место и для детер- минантов, поэтому g = Jg'J или g = «/V • Далее, так как g является отрицательно определенной величиной, можно образовать y/—g, где подкоренное выражение выбрано положи- тельно определенным. Таким образом, Пусть S — некоторое скалярное поле. Для него S = S'. Тогда /у у J J при условии, что область интегрирования в координатах х' соответ- ствует области интегрирования в координатах х. Следовательно, S^/—gd4x = инвариант. B0.4) Назовем величину SyJ—g, интеграл от которой является инвариантом, скалярной плотностью. Аналогично для любого тензорного поля Гдг/ • • • величину Гдг/ • • 'y/—g можно назвать тензорной плотностью. Когда область интегрирования мала, fTfl"y/—gd4x является тензором. Если область интегрирования не мала, то этот интеграл не будет тензором, так как он представляет
152 Общая теория относительности собой сумму тензоров, заданных в разных точках и, следовательно, не преобразуется по какому-либо простому закону при преобразованиях координат. Величина y/—g в дальнейшем используется очень часто. Далее для краткости будем записывать ее в виде у/~. Так как то формула A4.5) дает уГ,и = A/2) VVgW> B0-5) и формулу A4.6) можно записать в виде Г^Д\Г = y/~,v. B0.6) 21. Теоремы Гаусса и Стокса Ковариантная дивергенция Лд:д вектора Лд является скаляром. Для нее можно записать выражение Отсюда А^щуГ = И"\О,Д- B1-1) Подставив в качестве S в B0.4) Лд:д, получим инвариант /г Л Д / /-/^ гп — I f Л Д., / 1 /-/^ /»» ,/ Если интеграл берется по ограниченному (четырехмерному) объему, то правую часть можно преобразовать по теореме Гаусса в интеграл по (трехмерной) граничной поверхности этого объема. При Л":д = 0 (Л"\Г);Д = 0. B1.2) Это приводит к закону сохранения, а именно к закону сохранения жид- кости, плотность которой есть А°у/~, а поток задается трехмерным
21. Теоремы Гаусса и Стокса 153 вектором Атл/~ (то = 1, 2, 3). Можно проинтегрировать B1.2) по трех- мерному объему V при некотором фиксированном х°. В результате получим — поверхностный интеграл по границе объема V. Если отсутствуют токи, пересекающие границу объема V, то J A°y/~d3x есть константа. Эти результаты для вектора А11 нельзя, вообще говоря, распростра- нить на тензор с большим числом индексов. Рассмотрим тензор с дву- мя индексами У". В плоском пространстве, используя теорему Гаусса, можно преобразовать jY^^d^x в поверхностный интеграл; в искрив- ленном пространстве в общем случае нельзя преобразовать объемный интеграл fY1*" yVy/~d4x в поверхностный. Исключение составляет ан- тисимметричный тензор F^v = —Fvfl. В этом случае г :<т — г ,о-1 <тр ~Г <тр отсюда с учетом B0.6) ГДг/ _ рдг/ , рд j?pv , рг/ рдр _ рдг/ , Тогда F»vxvyT = (F^yT),,- B1-3) Следовательно, J Ffiv.1/y/~d4x равен поверхностному интегралу, и при условии F11".м = 0 получаем закон сохранения. Для симметричного тензора У" = Yvfl, если опустить один из ин- дексов и работать с Уд".^, то можно получить соответствующее урав- нение с дополнительным членом: 1 ц :а — 2д ,а 1ца1а 'LaaIp1' Подставив а = v и использовав B0.6), получим у i/ -у v _|_ / 1 / т^а р T^ai> 2 д :г/ — 2д,г/"ГУ V ,ахд 1адг'2 Поскольку Yav симметричен, то можно с учетом G.6) заменить Гадг/ в последнем члене величиной
154 Общая теория относительности В итоге можно записать V-V" = (У^уП,и - A/2)&/Э,дГа/Э^. B1.4) Для ковариантного вектора Ац имеем выражение: Результат B1.5) можно сформулировать так: ковариантный ротор ра- вен обычному ротору. Это утверждение справедливо только для кова- риантного вектора. Для контравариантного вектора по соображениям баланса индексов ротор образовать нельзя. Положим /л = 1, v = 2. Тогда получим А1:2 -А2:1 =А1}2 - А2Л. Проинтегрируем это равенство по некоторой области поверхности х° = = const, х3 = const. Согласно теореме Стокса имеем Ц 0*1:2 - A^dx1 dx2 = / / {A1<2 - A^dx1 dx2 = JJ B1.6) = / (Aidx1 + A2dx2), где последний интеграл берется по границе области. Таким образом, по- лученный интеграл по замкнутому контуру равен потоку через поверх- ность, ограниченную этим контуром. Этот результат должен иметь место не только в системе координат, в которой уравнение рассматри- ваемой поверхности есть х° = const, х3 = const, но и в общем случае, т. е. в любой системе координат. Чтобы получить инвариантный способ записи этого результата, введем общее выражение для элемента двухмерной поверхности. Эле- мент поверхности, определяемый двумя малыми контравариантными векторами ^д и ?д, задается антисимметричным тензором второго ран- га: Тогда, если ?д и ?д имеют вид @, dx1, 0, 0) и @, 0, dx2, 0), то две ком- поненты dS1*" выглядят следующим образом: dS12 = dx1dx2; dS21 = -dx1dx2,
22. Гармонические координаты 155 а остальные компоненты обращаются в нуль. Левая часть B1.6) при- нимает вид JJ Alt.MdSliV; правая часть B1.6) есть, очевидно, f АЙс1хЙ, поэтому имеем \ Ц (А^ - A^dS^ = I A^dx». B1.7) Поверхность Периметр 22. Гармонические координаты Уравнение Даламбера \3V = 0 для скалярного поля V с уче- том A0.9) дает (?"(УФи - T°vV,a) = 0. B2.1) В плоском пространстве в неортогональной системе координат каждая из четырех координат хх удовлетворяет уравнению Охх = 0. В B2.1) можно в качестве V подставить хх. Так как хх в отличие от V не явля- ется скаляром, полученное уравнение, разумеется, не будет тензорным, т. е. это уравнение справедливо только в определенных координатных системах. Оно накладывает на координаты некоторые ограничения. Если в качестве V подставить жА, то V следует заменить величи- ной хху(х = g^. Тогда уравнение B2.1) примет вид ^ТД, = 0. B2.2) Координаты, удовлетворяющие этому условию, называют гармоничес- кими. Они аппроксимируют неортогональные координаты с максималь- ной точностью, какая только возможна в искривленном пространстве. При желании их можно использовать в любой ситуации, однако очень часто дело того не стоит, так как тензорный формализм в произвольных координатах действительно является весьма удобным аппаратом. При рассмотрении гравитационных волн гармонические координаты все же оказываются очень полезными. Из G.9) и G.6) имеем в произвольных координатах %a B2.3) Отсюда с учетом B0.6) следует равенство % B2.4)
156 Общая теория относительности Сворачивая его по двум индексам (полагаем а = ь>), получаем WvyT),v = -f?%v>T- B2-5) Видно, что альтернативная форма записи условий гармоничности есть (^"лЛ,* = О- B2.6) 23. Электромагнитное поле Уравнения Максвелла в стандартной записи имеют вид: Е = -(l/c)dA/dt - grat^; B3.1) H = rotA; B3.2) (l/c)dH/dt= -rotE; B3.3) divH = 0; B3.4) (l/c)dE/dt = rot H - 4ttj; B3.5) divE = 477/). B3.6) Сначала запишем их в четырехмерной форме в рамках специальной тео- рии относительности. Потенциалы АиФ образуют 4-вектор к согласно соотношениям к0 = Ф, кт = Ат, т = 1, 2, 3. Введем Тогда в соответствии с B3.1) Fi = _<№_<№ = dki__dko= F =_Fw дх° дх1 дх° дх1 10 ' и согласно B3.2) Эх2 дх3 ~ Эх2 ' дх3 = ^23 = F23.
23. Электромагнитное поле 157 Таким образом, шесть компонент антисимметричного тензора F^v определяют полевые величины Е и Н. Из B3.7) следует, что -Рдг/,о- + Fva,fi + Fa\i,v — 0- B3.8) Это уравнение содержит в себе уравнения Максвелла B3.3) и B3.4). Далее, из B3.6) имеем FOl/yV = FOm,m = -Fm0,m = divE = Апр. B3.9) Аналогично из B3.5) получаем F ,V-F ,0 + F ,2 + F ;3_-_ + _-__47rJ. B3.10) Плотность заряда р и ток jm образуют 4-вектор «7м согласно соотно- шениям «7° = р, Jm = jm. Тогда B3.9) и B3.10) объединяются в одно уравнение F»vyV = A-kJ». B3.11) Итак, уравнения Максвелла переписаны в четырехмерной форме, тре- буемой специальной теорией относительности. Чтобы перейти к общей теории относительности, нужно запи- сать уравнения в ковариантной форме. С учетом равенства B1.5) тен- зор B3.7) можно непосредственно обобщить: тр _ и _ и Это позволяет определить ковариантные полевые величины _Рдг/. Далее получаем Выполняя циклическую перестановку индексов /л, и, а и складывая полученные таким образом уравнения, имеем [с учетом B3.8)]: Ffiv-.a + Fva-.ц + Fan-.v = -Рдг/,о" + -Рг/<т,д + -^о-д,г/ = 0. B3.12) В результате это уравнение Максвелла автоматически приобретает ко- вариантный вид.
158 Общая теория относительности Остается разобраться с уравнением B3.11). В рамках общей теории относительности оно не справедливо и должно быть заменено ковари- антным уравнением F»"..,, = 4тг«/д. B3.13) Из равенства B1.3), которое справедливо для любого антисимметрич- ного тензора второго ранга, получаем Отсюда непосредственно следует равенство Это уравнение, аналогичное уравнению B1.2), представляет собой за- кон сохранения электричества. Учет кривизны пространства не нару- шает его, закон выполняется точно. 24. Модификация уравнений Эйнштейна в присутствии материи В отсутствие материи уравнения Эйнштейна имеют вид Д"" = 0. B4.1) Отсюда следует, что R = 0 и, таким образом, Д"" - (l/2)g^"R = 0. B4.2) Если взять за исходное уравнение B4.2), то путем свертки можно по- лучить R - 2R = 0 и, следовательно, вернуться к B4.1). В качестве основных уравнений пустого пространства можно использовать как B4.1), так и B4.2). В присутствии материи эти уравнения необходимо модифициро- вать. Предположим, что модифицированное уравнение B4.1) записы- вается так: Д"" = X"", B4.3) а B4.2) принимает вид Д"" - {\/2)gftvR = У". B4.4)
25. Тензор энергии-импульса материи 159 Здесь Хдг/ и У — симметричные тензоры второго ранга, отражающие присутствие материи. Теперь видно, что B4.4) — более удобная для работы запись, так как имеют место тождества Бианки A4.3), которые показывают, что R]W = 0. Следовательно, B4.4) влечет за собой равенство: Y^:v = 0. B4.5) Любое тензорное поле УД1/, порождаемое материей, должно удовлетво- рять этому условию; в противном случае уравнения B4.4) не являются согласованными. Для удобства введем в уравнение B4.4) коэффициент —8тг, и пере- пишем его в виде Д"" - A/2)^"Д = -8ttY^. B4.6) В дальнейшем будет показано, что тензор У с этим коэффициентом следует интерпретировать как плотность и поток энергии и импульса (негравитационного происхождения), причем У0 представляет собой плотность, а У — поток. В плоском пространстве уравнение B4.5) имело бы вид У% = 0 и влекло бы за собой закон сохранения энергии и импульса. В искрив- ленном пространстве энергия и импульс сохраняются лишь приближен- но. Отклонение от закона сохранения вызвано действием гравитацион- ного поля на материю и наличием собственных энергии и импульса гравитационного поля. 25. Тензор энергии-импульса материи Пусть задано распределение материи, скорость которой непрерыв- но меняется от точки к точке. Если обозначить z1* координаты элемен- та материи, то можно ввести вектор скорости Vй = dz^/ds, который,
160 Общая теория относительности подобно полевым величинам, будет непрерывной функцией координат точки. Вектор скорости обладает следующими свойствами: «»W = 1; , 1) 0 = {g»uvW)..* = gllv{v^vv..rT + v»..avv) = 2gllvv»vv..a. K ' ; Отсюда vvvvia = 0. B5.2) Можно ввести скалярное поле р таким образом, чтобы векторное поле pvд определяло плотность и поток материи так же, как «7м опре- деляет плотность и поток электрического заряда; другими словами, чтобы pv°sj~ являлось плотностью, a pvmsj~ — потоком. Необходимое условие для сохранения материи: или "):д = 0. B5.3) В рассматриваемом случае плотность и поток энергии материи бу- дут иметь вид pv°v°y/~ и pv°vmy/~ соответственно, плотность и поток импульса — pvnv°y/~ и pvnvmy/~. Положим Г"" = pv»vv. B5.4) Тогда Т11"yj~ содержит плотность и поток энергии и импульса. Эту ве- личину называют тензором энергии-импульса материи. Тензор, Тд", разумеется, симметричен. Можно ли в качестве материального члена в правой части уравне- ний Эйнштейна B4.6) использовать Тд"? Для этого требуется, чтобы выполнялось равенство Тдг/:„ = 0. Из B5.4) имеем T"% = (pv^v"):v = v"(pvv)..v + pvvv*:v. Первый член в правой части обращается в нуль в силу закона сохра- нения массы B5.3). Второй член исчезает, если материя движется по
25. Тензор энергии-импульса материи 161 геодезическим, поскольку в случае, когда вместо того, чтобы быть за- данной только на мировой линии, Vй определена как непрерывная по- левая функция, имеем dv^/ds = v»,vvv. Тогда (8.3) приобретает вид или v»:vVv = 0. B5.5) Теперь видно, что тензор энергии-импульса материи B5.4) с со- ответствующим численным множителем к можно подставить в урав- нения Эйнштейна B4.4). Получим №"" - (l/2)g^"R = kpv^v". B5.6) Определим теперь значение коэффициента к. Перейдем, следуя ме- тоду, изложенному в разд. 16, к ньютонову приближению. Заметим прежде, что сворачивая B5.6), имеем -R = кр. Тогда B5.6) можно записать в виде В приближении слабого поля, в соответствии с A6.4), получаем ep&,[iv evfr,\ip §iip,i>a ~r §fiv,p(T} — = kp[vpVv - A/2)g^,,]. Рассмотрим статическое поле и статическое распределение материи. В этом случае vo = 1, vm = 0. Полагая /х = v = 0 и пренебрегая членами второго порядка малости, находим -(l/2)V2goo = или с учетом A6.6) 2 Для того чтобы это совпало с уравнением Пуассона, нужно взять к = = -8тг.
162 Общая теория относительности Таким образом, уравнения Эйнштейна в присутствии движущейся материи имеют вид R = -%-Kpv»vv. B5.7) Тогда Т**", задаваемое B5.4), совпадает с У" из уравнения B4.6). Условие сохранения массы B5.3) дает Р-.^ + ргЛ,, = 0; следовательно, dpi da = [dpjdx^v^ = -,w%. B5.8) Это условие фиксирует закон изменения р вдоль мировой линии элемен- та материи. При переходе от мировой линии некоторого элемента к ми- ровой линии соседнего элемента условие B5.8) допускает произвольное изменение р. Значит, можно выбрать р, обращающимся в нуль везде, кроме семейства мировых линий, образующих трубку в пространстве- времени. Такое семейство описывало бы частицу конечных размеров. Вне частицы /9 = 0; следовательно, применимы уравнения Эйнштейна для пустого пространства. Заметим, что если принять общий вид полевых уравнений B5.7), то из них можно вывести два следствия: сохранение массы и движение материи по геодезическим. Вспомним для этого, что [R^v — (l/2)gflvR\:v обращается в нуль вследствие тождества Бианки, откуда имеем (pv*vv):v = 0 или vltiffvv)..v+pvvvli..v = 0. B5.9) Умножим это уравнение на v^. Второй член даст нуль, что следует из B5.2), и останется (pv")..v = 0, а это как раз совпадает с условием со- хранения B5.3). Теперь уравнение B5.9) сводится к равенству vvv^-.v = = 0, т. е. к уравнению геодезической. Таким образом, нет необходимос- ти делать предположение о том, что частица движется по геодезичес- кой. Для малой частицы движение вдоль геодезической обеспечивается применимостью уравнений Эйнштейна для пустого пространства в об- ласти вокруг частицы.
26. Вариационный принцип для гравитации 163 26. Вариационный принцип для гравитации Введем скаляр /= I R^d4x, B6.1) где интегрирование проведено по определенному четырехмерному объ- ему. Придадим g^ малое приращение Sg^, оставляющее g^ и его пер- вые производные неизменными на границе объема. Требование 81 = О при произвольных bgnV приводит, как будет показано ниже, к уравне- ниям Эйнштейна для пустого пространства. Из A4.4) имеем R = fR^ =R*-L, где L = grv{V%V% - Г^Г^). B6.3) Скаляр / содержит вторые производные g^, поскольку они входят в R*. Однако эти производные входят лишь линейно и, следовательно, их можно исключить интегрированием по частям. Получим + ОГГиг; Два первых члена являются полными производными, и поэтому они не дают вклада в /. Тогда в B6.4) необходимо оставить только два последних члена. С учетом B2.5) и B2.4) они принимают вид Это совпадает с 2L^/~ из B6.3). Таким образом, для / получаем выра- жение: = [
164 Общая теория относительности содержащее только g^ и его первые производные. Скаляр / является однородной квадратичной формой по первым производным. Положим SB = Ly/~ и возьмем эту величину (с соответствующим численным множителем, который будет определен ниже) в качестве плотности действия для гравитационного поля. Величина SB не являет- ся скалярной плотностью, однако работать с ней удобнее, чем с величи- ной Ry/~, являющейся скалярной плотностью, так как Ь? не содержит вторых производных gpv Согласно классической динамике, действие есть интеграл по вре- мени от лагранжиана. В рассматриваемом случае = Г S?dix = I' dx0 IS?dx1dx2dx3, I = так что лагранжианом, очевидно, является S?dx1dx2dx3. /¦ Таким образом, ЗВ можно рассматривать и как плотность лагран- жиана (в трех измерениях), и как плотность действия (в четырех из- мерениях). Компоненты g^ можно считать динамическими координа- тами, а их временные производные — скоростями. Заметим далее, что лагранжиан является квадратичной (неоднородной) формой по скорос- тям, как обычно и бывает в классической динамике. Теперь проварьируем Ь?'. Используя B0.6) и B2.5), получаем , ?/ V ЦрЧ B6.5) а согласно B2.3) H Д B6.6) Вычитая B6.6) из B6.5), находим 82 = Г?„8{вГ),а
27. Действие для непрерывно распределенной материи 165 Два первых члена отличаются от на полную производную. Отсюда имеем 81 = 8 f %d4x = I Rllv8{gflvy/~)d'ix, B6.8) где Ддг, задается формулой A4.4). При произвольных 8gllv величи- ны 8{gllvy/~) также являются произвольными и независимыми, тогда требование обращения B6.8) в нуль приводит к уравнениям Эйнштейна в форме B4.1). Методом, аналогичным G.9), можно показать, что . B6.9) В соответствии с B0.5) получим 6уГ = O-myTfffSgaf,. B6.10) Таким образом, Тогда B6.8) можно записать в другой форме: 81=- B6.11) Требование обращения B6.11) в нуль приводит к уравнениям Эйнштей- на в форме B4.2). 27. Действие для непрерывно распределенной материи Рассмотрим непрерывное распределение материи, скорость кото- рой непрерывно меняется от точки к точке, подобно тому, как это бы- ло сделано в разд. 25. Запишем вариационный принцип в присутствии материи, взаимодействующей с гравитационным полем, в виде 8(Ig + Im) = 0, B7.1)
166 Общая теория относительности где гравитационная часть действия Ig совпадает с точностью до неко- торого численного множителя к с / из предыдущего раздела, а 1т — материальная часть действия, которая сейчас и будет определена. Усло- вие B7.1) должно приводить к уравнениям Эйнштейна B5.7) для грави- тационного поля в присутствии материи и к уравнениям геодезической для движения материи. В дальнейшем необходимо будет знать, как влияет на 1т произ- вольная вариация положения элемента материи. Рассуждение станет более понятным, если предварительно рассмотреть чисто кинематичес- кие вариации безотносительно к метрике g^. В этом случае существует принципиальное различие между ковариантными и контравариантны- ми векторами, и нельзя перейти от одного к другому. Скорость опи- сывается отношением компонент контравариантного вектора и*1 и не может быть нормирована без введения метрики. Для непрерывного потока материи вектор скорости им (с некото- рым неизвестным множителем) задан в каждой точке. Можно постро- ить совпадающую по направлению с им контравариантную векторную плотность /5м, которая определяет величину и скорость потока в виде p°dx1dx2dx3, равного количеству материи в элементе объема dx1dx2dx3 в определен- ный момент времени и p1dx°dx2dx3 равного количеству материи, прошедшей через элемент поверхнос- ти dx2dx3 за время dx°. Предположим, что материя сохраняется, тогда р")Д = 0. B7.2) Пусть каждый элемент материи смещен из точки z^ в точку где &м — мало. Требуется определить результирующее изменение рЙ в заданной точке х. Сначала рассмотрим случай Ь° = 0. Изменение количества мате- рии, находящейся в трехмерном объеме V, равно с обратным знаком количеству материи, прошедшей через границу объема > fp°dx1dx2dx3 = - fp°brdSr, г = 1,2,3,
27. Действие для непрерывно распределенной материи 167 где dSr обозначает элемент поверхности, ограничивающей объем V. Правую часть этого равенства можно преобразовать по теореме Гаусса; тогда получим ёр° = -(pV),r. B7.3) Теперь этот результат нужно обобщить на случай Ь° ф 0. Если &м пропорционально рм, то каждый элемент материи смещается вдоль сво- ей мировой линии и, следовательно, вектор р^ не изменяется. Обобще- ние B7.3) имеет, очевидно, следующий вид: 5р° = (ргЪ° -p°br),r, так как при Ь° = 0 последнее уравнение совпадает с B7.3), а при &м, про- порциональном р*1, дает Sp° = 0. Соответствующая формула справедли- ва и для других компонент р^, так что окончательно общий результат имеет вид Sp^ = (p^b^ — p^bv\v. B7.4) При описании непрерывного потока материи р^ является основной характеристикой, которая должна войти в функцию действия. Величи- на р*1 должна варьироваться, согласно формуле B7.4), и затем после соответствующего интегрирования по частям коэффициенты при каж- дой из компонент &м должны быть приравнены нулю. Это приведет к уравнениям движения материи. Действие для изолированной частицы массы т имеет вид -т I ds. B7.5) Необходимость введения коэффициента — т станет понятной, если рас- смотреть случай специальной теории относительности, для которой ла- гранжиан имел бы вид производной по времени от B7.5), а именно: L = -mds/dx0 = -т[1 - (dxr/dx°)dxr/dx0]1'2 (суммирование проведено по г; г = 1, 2, 3). Отсюда получаем выраже- ние для импульса: дЬ _ _ dx d(dxr/dx°) dx° V dx° dx°
168 Общая теория относительности Действие для непрерывно распределенной материи получим заме- ной т в B7.5) величиной p°dx1dx2dx3 и интегрированием: Im = - f p°dx1dx2dx3ds. B7.6) Чтобы записать 1т в более понятной форме, введем метрический тензор и положим jf = pv»^, B7.7) где р — скаляр, определяющий плотность, а им — вектор единичной длины, совпадающий по направлению с иЙ. Получим 1т = - [ p^~v°dx1dx2dx3ds = - I p^~dix, B7.8) где учтено, что v°ds = dx°. Такая форма записи действия не удобна для варьирования, так как р и Vй не являются независимыми переменными. Чтобы можно было воспользоваться формулой B7.4), рии11 должны быть выражены через р^. Из B7.7) находим Тогда B7.8) принимает вид J1/24. B7.9) Для определения вариации этого выражения воспользуемся соотноше- нием: Теперь из вариационного принципа B7.1) после подстановки в не- го B6.11), умноженного на коэффициент к, имеем
28. Действие для электромагнитного поля 169 Приравнивая нулю коэффициент при Sg^ и выбирая к = (З-бтг), по- лучаем уравнения Эйнштейна B5.7). Последний член B7.10), с уче- том B7.4) и B5.2), дает = /"(«„,„ - vv^)pvb^d4x = /"(«„:„ - и„щ)(пГЪГуГ<Рх = B7.11) = /' vlt..vpvv Приравняв нулю коэффициент при &м, получим уравнение геодезичес- кой B5.5). 28. Действие для электромагнитного поля Обычное выражение для плотности действия электромагнитного поля имеет вид {8п)-1(Е2-Н2). Если записать его в четырехмерных обозначениях специальной теории относительности, обсуждавшихся в разд. 23, то получим Это приводит к следующему выражению для инвариантного действия в общей теории относительности: 1ЭМ = (-167Г)1 FpVF»vyT*x. B8.1) Следует принять во внимание, что F^ = &М)„ — киф; значит, 7ЭМ явля- ется функцией только g^v и производных от электромагнитных потен- циалов. Будем варьировать сначала g^, оставляя ка постоянным; тог- да F^v (но не F^") является константой. Из B6.10) и B6.9) имеем
170 Общая теория относительности Таким образом, B8.2) где симметричный тензор Ера, определяемый соотношением 4ттЕра = -F^F™ + (l/4)g("TFliVFltu, B8.3) есть тензор энергии-импульса электромагнитного поля. Заметим, что в специальной теории относительности АттЕ00 = Е2 - A/2)(Е2 - Я2) = A/2)(?2 + Я2); 4тг?01 = -F°2F12 - F°3F13 = .Б2Я3 - .Б3Я2, т. е. Е00 описывает плотность энергии, а ЕОп совпадает с вектором Пойнтинга, характеризующим интенсивность потока энергии. Вариация fcM при фиксированных gap с учетом B1.3) дает B8-4) Складывая B8.2) с B8.4) и умножая результат на —16тг, получаем выражение для полной вариации: ] . B8.5) 29. Действие для заряженной материи В предыдущем разделе было рассмотрено электромагнитное поле в отсутствие зарядов. Чтобы описать заряды, необходимо ввести соот- ветствующий член в действие. Для уединенной частицы с зарядом е дополнительный член в действии имеет вид -е I k^dx11 = -e I k^ds, B9.1) где интегрирование ведется вдоль мировой линии.
29. Действие для заряженной материи 171 Если частица, несущая заряд, является точечной, то возникают трудности, связанные с тем, что ее электрическое поле содержит син- гулярность1. Эти трудности можно обойти, если рассматривать вместо точечного носителя заряда непрерывно распределенную материю. Бу- дем описывать эту материю в рамках формализма, развитого в разд. 27, предполагая, что каждый элемент материи несет заряд. В кинематических задачах фигурировала контравариантная век- торная плотность р*1, определяющая плотность и поток материи. Здесь необходимо ввести контравариантную векторную плотность ^м, опре- деляющую плотность и поток электричества. Эти два вектора должны совпадать по направлению. При малых смещениях приращение вектор- ной плотности ^м в соответствии с B7.4) можно записать следующим образом: SJi1 = (/"^ - /м&")^ B9.2) с теми же значениями &м, что и в A7.4). Для частицы, несущей заряд, действие B9.1) в случае непрерывно- го распределения заряженной материи приводит [аналогично B7.6)] к = - [ /°kllVtldx1dx2dx3ds. При введении метрики полагаем, в соответствии с B7.7), что /" = (Tv^yT, B9.3) где <т — скалярная функция, определяющая плотность заряда. Тогда действие принимает вид, аналогичный B7.8): Ig = - { ak^sfd^x = - IknJ^dtx. B9.4) Таким образом, Iq = - = [[-av^Skf, + ^.„(/"Ь" " /МО d4x = B9.5) = [<T(-v»6kli+FliVvv 1Эта проблема обсуждается, например, в книге В. Паули. Теория относитель- ности. Пер. с англ. М. — Л., ГИТЛ, 1947. — Прим. пер.
172 Общая теория относительности Уравнения взаимодействия заряженной материи с гравитационным и электромагнитным полями следуют из общего вариационного прин- ципа S(Ig + Im+ /эм + /,) = 0. B9.6) Итак, возьмем сумму выражений B9.5), B8.5) и B7.10) с заменой по- следнего члена в B7.10) на B7.11) и приравняем нулю суммарные ко- эффициенты при вариациях Sg^, Sk^ и &м. Если коэффициент при \Z~Sgpv умножить на — 16тг, то получим Д"" - (l/2)gfll/R + %-kPv»vv + 8тгЕ»» = 0. B9.7) Уравнение B9.7) представляет собой уравнение Эйнштейна B4.6) с У1", состоящим из двух членов: тензора энергии-импульса материи и тен- зора энергии-импульса электромагнитного поля. Коэффициент при ^/~8к^ дает Из B9.3) видно, что crv^ совпадает с вектором тока JM; таким образом, B9.8) Уравнение B9.8) представляет собой уравнение Максвелла B3.13) в присутствии зарядов. Наконец, для коэффициента при ^/~Ь^ находим pvn-.vv" + aFnvv" = 0, или vv + F^r = 0. B9.9) Второй член в B9.9) представляет собой силу Лоренца, приводящую к отклонению траектории элемента материи от геодезической. Уравнение B9.9) является следствием уравнений B9.7) и B9.8). Действительно, возьмем ковариантную дивергенцию от уравненияB9.7). С учетом тождеств Бианки получим (pv^v" +Е^):„ = 0. B9.10)
30. Вариационный принцип в общем случае 173 Далее, согласно B8.3), и с использованием B3.12) и B9.8) имеем "':,, = -Fi"*Fva:v - F»a..vFva P (Fpa..v - Fpv..a - Fva..p) = Таким образом, B9.10) принимает вид v»(pvv)..v + ру"у>*..„ + F»aJa = 0. B9.11) Умножая B9.11) на v^ и используя B5.2), получаем (PVV);V = -F^V^Ja = 0 (здесь учтено условие Ja = crva, заключающееся в том, что Ja и va должны совпадать по направлению). Тогда первый член в B9.11) об- ращается в нуль, и мы приходим к B9.9). Таким образом, уравнения, следующие из вариационного принципа B9.6), не являются независи- мыми, что далеко не случайно. Причины этого обсуждаются в разд. 30. 30. Вариационный принцип в общем случае Метод, развитый в разд. 29, можно обобщить на случай взаимодей- ствия гравитационного поля с любыми другими полями, взаимодейст- вующими между собой. Вариационный принцип в общем случае можно записать в виде S(Ig + Г) = 0, C0.1) где Ig — гравитационное действие, обсуждавшееся выше, а/' — дейст- вие для всех остальных полей, состоящее из суммы слагаемых, по од- ному для каждого поля. Большим преимуществом использования вари- ационного принципа является возможность легко получать корректные уравнения любых взаимодействующих полей. Необходимо лишь найти действие для каждого из рассматриваемых полей и включить все эти члены в C0.1). Гравитационное действие Ig = J ^? d4x, где SB — лагранжева плот- ность из разд. 26 с множителем A67Г). Для вариации Ig имеем = f (^-Sg^+^-Sg^Mx = [\ **--(**-) W*.
174 Общая теория относительности Выкладки разд. 26, приводящие к B6.11), показывают, что C0.2) Пусть ipn (n = 1, 2, 3) обозначает негравитационные полевые вели- чины. Предполагается, что каждая из (рп является компонентой тензо- ра; конкретные тензорные свойства несущественны. Величина Г имеет вид интеграла от скалярной плотности: Г = J 5?' d4x, где 5?' — функ- ция (рп и их первых (возможно, также и высших) производных. Вариация действия дает следующий результат: S(Ig + !')=[ {p^Sg^ + ? Хп^п) ^Td4x, C0.3) •' п где p^v = putl, так как любой член, содержащий д (производная от полевой величины), при помощи интегрирования по частям можно пре- образовать к выражению, которое включается в C0.3). Таким образом, вариационный принцип C0.1) приводит к полевым уравнениям р^ = 0; C0.4) Хп = 0. C0.5) Здесь p^v состоит из двух слагаемых: члена C0.2), обусловленного Ig, и члена (обозначим его N^u), порождаемого !?'. Разумеется, N^ = = Nvlt. Величина 5?' обычно не содержит производных от g^; в этом случае . C0.6) Теперь уравнение C0.4) принимает вид Д"" - A/2)^"Д - 16тг7У^ = 0. Это не что иное, как уравнение Эйнштейна B4.6) с Г"" = -2ЛГ"". C0.7) Отсюда видно, какой вклад в правую часть дает каждое из полей в зави- симости от того [согласно C0.6)], каким образом входит g^ в действие для этого поля.
30. Вариационный принцип в общем случае 175 Для согласованности уравнений iV" должно удовлетворять соот- ношению iV".„ = 0. Это свойство можно в самом общем виде вывес- ти из условия, что Г инвариантно относительно преобразований коор- динат, оставляющих неизменной граничную поверхность. Рассмотрим преобразование координат, скажем, жм = жм + &м, где Ь*1 мало и явля- ется функцией х, и будем искать вариацию Г в первом порядке по &м. Трансформационный закон для g^ имеет [согласно C.7)] вид gltAx)=xfltxf'vga,fi,(x'), C0.8) где штрихованные индексы стоят при преобразованном тензоре. Пусть Sgap обозначает изменение gap в первом порядке не при фикси- рованном значении поля, а при фиксированных значениях координат, в которых gap задано, так что ga'0'(z') = ga/3{x') + Sga/3 = ga/3{x) + gap^b" + Sga/3. Имеем далее ¦L, V- — Vх < и )ф ~ Ьц > u,fi- Тогда из C0.8) следует, что bPv)\gafi(x) + gc^V + Sga0] = Итак, Определим теперь вариацию Г при таком изменении g^; осталь- ные поля имеют в точке жм те же значения, что и до преобразования координат в точке жм. Воспользовавшись C0.6), и на основании тео- ремы, выражаемой формулой B1.4), справедливой для произвольного симметричного тензора второго ранга, находим 6Г = Igllv^ I{gl j ba d4x = Инвариантность I' означает, что величина SI' должна обращаться в нуль при любых значениях Ьа. Следовательно, Nav:v = 0. Вследствие этого равенства полевые уравнения C0.4), C0.5) не являются независимыми.
176 Общая теория относительности 31. Псевдотензор энергии —импульса гравитационного поля Введем величину t^", определяемую соотношением 6д Y — {О~С j OgaR,v)ga/Зф —<§7* * V / Тогда имеем Далее, " Ogc.fi Согласно C0.2), ) --*z ,v' ,v Oga/ Теперь с помощью полевых уравнений B4.6) получаем таким образом, из B1.4) и условия У^"^ = 0 имеем = 0. C1-2) Мы пришли к закону сохранения, поэтому сохраняющуюся плот- ность (tfj," + Y^")^ естественно рассматривать в качестве плотности энергии и импульса1. Как было показано, У^" представляет собой энер- гию и импульс негравитационных полей; следовательно, t^ описывает энергию и импульс гравитационного поля. Однако t^" не является тен- зором. Уравнение C1.1), определяющее tpv, можно записать в виде */ = {dL/dgafi,v)gafitll - g^L. C1.3) 1К закону сохранения C1.2) приводит также выражение для tM"v^i отличаю- щееся от C1.1) членом вида дщ^"/дха, где щ^иа = —f)ljav, т.е. tM" определено неоднозначно. Действительно, известно несколько выражений для этой величины: Эйнштейна, Ландау-Лифшица и Меллера-Мицкевича. — Прим. пер.
31. Псевдотензор энергии - импульса гравитационного поля 177 Здесь L не скаляр, так как при его получении пришлось для исклю- чения вторых производных трансформировать скаляр R, который был первоначально выбран в качестве действия. Значит, t^ не может быть тензором. Эта величина получила название псевдотензор. При нахождении выражения для энергии гравитационного поля не- возможно удовлетворить одновременно следующим условиям: 1) после добавления к другим формам энергии величины t^ полная энергия со- храняется; 2) энергия, заключенная в определенном (трехмерном) объ- еме в фиксированный момент времени, не зависит от выбора систе- мы координат. Таким образом, гравитационную энергию, вообще говоря, нельзя локализовать. В лучшем случае можно пользоваться псевдотен- зором, удовлетворяющим только условию 1). Это дает приближенную информацию о гравитационной энергии (впрочем, в некоторых специ- альных случаях эта информация может быть точной). Запишем интеграл /"( Yll°)y/~dx1dx2dx3 C1.4) по трехмерному объему, включающему некоторую физическую систе- му в определенный момент времени. Можно ожидать, что при стремле- нии объема к бесконечности мы получим полные энергию и импульс, причем: а) интеграл сходится, б) поток через поверхность, ограничива- ющую объем, стремится к нулю. Тогда из уравнения C1.2) видно, что значения интеграла C1.4) в момент времени х° = а и некоторый другой момент х° = Ъ равны. Более того, этот интеграл не должен зависеть от выбора системы координат, так как можно, не изменяя координат в мо- мент времени х° = а, преобразовывать их при х° = Ь. Таким образом, найдено однозначное сохраняющееся выражение для полных энергии и импульса. Условия а) и б), необходимые для сохранения полных энергии и импульса, в практически интересных случаях выполняются редко. Эти условия имели бы место, если бы пространство было статическим вне конечной четырехмерной трубки; такая ситуация реализуется, когда некоторые материальные тела начинают двигаться в определенный мо- мент времени, и это движение создает возмущения, распространяющи- еся вовне со скоростью света. В случае обычной планетарной системы движение происходит от бесконечного прошлого и условия а), б) не выполняются. Особого обсуждения требует вопрос об энергии гравита- ционных волн; этой проблеме посвящен разд. 33.
178 Общая теория относительности 32. Явное выражение для псевдотензора Формулу C1.1), определяющую t^", можно записать так: C2.1) где qn (п = 1, 2, ... , 10) соответствуют десяти gpV, и по всем значе- ниям п проведено суммирование. Аналогично C2.1) можно переписать в виде t^yT = (dSe/dQm,v)Qm>lt - (?Se, C2.2) где Qm — любые десять независимых функций qn. Чтобы показать это, заметим, что Следовательно, dQ dqn,v dQm>a dqn,v dQm,a dqn " dQm,v dqn ' Тогда 9Qm _ die n a <ln,ii — яг. Чт, ill откуда следуют равенства C2.1) и C2.2). Для получения явного вида t^ удобно воспользоваться выраже- нием C2.2) и взять в качестве Qm величины g^v^/~. Теперь можно использовать формулу B6.7), из которой находим (с введением коэф- фициента 16тг) где с — некоторый коэффициент. Следовательно, C2-3) 33. Гравитационные волны Рассмотрим область пустого пространства, в которой гравитаци- онное поле слабое и g^ приблизительно постоянно. Тогда применимо уравнение A6.4) или ё> \Bilv,P<7 ~ 8np,v<r ~ e{ia,vp ~ ёр<гф1>) == U. (oo.lj
33. Гравитационные волны 179 Введем гармонические координаты. Условие B2.2) с опущенным индек- сом Л дает g^1/[gpfl,v-(l/2)gflv,p}=0. C3.2) Продифференцируем это уравнение по х" и пренебрежем членами вто- рого порядка. В результате получим ^,pff] = 0. C3.3) Поменяем местами р и <т: g»v\gwP ~ (l/2)^,pff] = 0. C3.4) Сложим C3.1), C3.3) и C3.4): gTgpw = о. Таким образом, каждая компонента gpa удовлетворяет уравнению Да- ламбера, и решение этого уравнения будет состоять из волн, распро- страняющихся со скоростью света. Это и есть гравитационные волны. Рассмотрим энергию таких волн. Вследствие того, что псевдотен- зор не является настоящим тензором, мы не получим в общем случае ясного результата, не зависящего от выбора системы координат. Одна- ко в одном специальном случае, а именно когда все волны движутся в одном направлении, можно получить «чистый» результат. Если все волны движутся в направлении оси ж3, то координатную систему можно выбрать так, что g^ будут зависеть только от одной переменной х° — хъ. Рассмотрим более общий случай, когда все ком- поненты g^ являются функциями одной переменной 1аха, где 1а — константы, удовлетворяющие условию gflpla = 0 (в пренебрежении переменной частью g9"). Тогда имеем где w^ — производная от g^ по 1ах". Разумеется, мм„ = uvfl. Из усло- вия гармоничности C3.2) следует, что
180 Общая теория относительности где и = и^. Это соотношение можно записать в виде uvp\v = (l/2)u/p, C3.6) или [и"" - A/2)^и}1„ = 0. C3.7) Из C3.5) находим Выражение для L B6.3) в гармонических координатах сводится к сле- дующему: lv-uvpV). После раскрытия скобок получим девять членов, но нетрудно показать, что каждый из них обращается в нуль в соответствии с C3.6) и усло- вием 1а1а = 0. Таким образом, плотность действия обращается в нуль. Аналогичный результат имеет место в электромагнитном поле, для ко- торого в случае волн, распространяющихся только в одном направле- нии, плотность действия также обращается в нуль. Теперь мы должны найти псевдотензор C2.3). Имеем C3.8) тогда = -К'3 - Следовательно, согласно C3.8) и C3.7) )^ = ^Л-иа0 + (i/2)g°V,. = о- В результате остается - A/2)и2]у.
34. Поляризация гравитационных волн 181 Полученное для t^" выражение имеет вид тензора. Это означает, что при преобразованиях координат, сохраняющих характер поля, так что g^ остается функцией только от одной переменной 1аха (т. е. при- сутствуют только волны, распространяющиеся в одном направлении), tp" преобразуется как тензор. Такие преобразования координат могут состоять только во введении координатных волн, движущихся в на- правлении /„-. Их общий вид: жм = жм + &м, где &м является функцией только l$xs. Когда имеются волны, движущиеся только в одном направ- лении, гравитационная энергия может быть локализована. 34. Поляризация гравитационных волн Чтобы понять физический смысл C3.9), вернемся к случаю, когда волны движутся в направлении оси ж3, так что 10 = 1, ^ = 12 = О, /з = —1, и используем координаты, близкие к координатам специаль- ной теории относительности. Тогда из условий гармоничности C3.6) следуют равенства: «оо + «оз = A/2)м; и10 + и13 = 0; «20+^23=0; и30+и33 =-A/2)и. Отсюда иоо + и3з = и = и00 - мц - U22 - М33; значит, ми + И22 = 0. C4.1) Кроме того, 2мОз = -(моо +мзз)- Теперь из C4.1) получаем иа0иа0 - A/2)м2 = моо2 + ми2 + М222 + мзз2 - 2мО12 - -2м022 - 2м032 - 2м122 - 2м232 - 2m3i2 - A/2)(м00 - м33J = = Мц2 + М222 + 2mi22 = A/2)(мц - м22J + 2м122. Таким образом, 16тг*о° = A/4)(мц - м22J + Mi22 C4.2) и + 3 i 0
182 Общая теория относительности Видно, что плотность энергии положительно определена, и энергия переносится в направлении оси х3 со скоростью света. Для обсуждения вопроса о поляризации волн введем оператор R по- ворота в плоскости ххх2, действующий на произвольный вектор (А\А2) следующим образом: RA\ = A^\ RA2 = —А\. Тогда R2Ai = —А\, т. е. собственные значения оператора iR при действии на вектор рав- ны ±1. Оператор R действует на иар так: Run = И21 + И12 = 2mi2; Rui2 = 1122 — иц; Ru22 = -U12 - M2i = —2«i2. Таким образом, Д(иц + И22) = 0 и Д(иц — И22) = 4mi2; Д2(иц — И22) = = -4(иц -и22). Значит, под действием R Иц + «22 не изменяется, тогда как при действии на иц — и\2 или и\2 iR имеет собственные значения ±2. Таким образом, компоненты иар, дающие вклад в энергию C4.2), соответству- ют спину 2. 35. Космологический член Обобщение уравнений гравитационного поля в пустом пространстве Я„и = А^„ C5.1) где Л — константа, рассмотрел сам Эйнштейн. Это уравнение — тен- зорное, т. е. оно допустимо в качестве закона природы. Так как для уравнений Эйнштейна без дополнительного члена было получено хорошее согласие с экспериментами внутри Солнечной систе- мы, Л следует выбрать достаточно малой, чтобы не возникло расхож- дений с экспериментом. Величина Дд„ содержит вторые производные от g^; значит, Л имеет размерность (длина). Чтобы Л была малой, эта длина должна быть очень большой. Величина А/2 — космологи- ческая длина порядка радиуса Вселенной. Этот дополнительный член важен в космологических теориях, но для близлежащих объектов дает пренебрежимо малый эффект. Чтобы учесть этот член в теории поля, необходимо ввести в лагранжиан допол- нительный член I]. = с / y/~d4x, где с — соответствующая константа.
35. Космологический член 183 Из B6.10) имеем SI/. = с j hgftvSglll,^~dix. Тогда из вариационного принципа S(Ig + Ik) =0 следует равенство: 16тг[Л^ - A/2)^"Д] + {l/2)cg»v = 0. C5.2) Из уравнения C5.1) получаем R = 4Л и, следовательно, R^ — — (l/2)gIJiVR = —Xg^v. При выборе с = 32тгА это совпадает с C5.2). При взаимодействии гравитационного поля с любыми другими по- лями остается только включить член 1%. в полное действие, и мы полу- чим обобщенные полевые уравнения с эйнштейновским космологичес- ким членом.
ТЕОРИЯ ЭЛЕКТРОНОВ И ПОЗИТРОНОВ* Нобелевская лекция, 12 декабря 1933 г. Физики-экспериментаторы обнаружили, что материя состоит из маленьких частиц различного сорта, причем частицы каждого сорта в точности подобны друг другу. Некоторые из этих частиц, наверное, являются сложными, т.е. состоят из других частиц более простой при- роды. Однако существуют другие частицы, сложность которых не была показана до сих пор и, как мы надеемся, никогда не будет доказана, так что мы считаем их элементарными и основными. На основании общих философских соображении хотелось бы, как кажется на первый взгляд, иметь возможно меньшее число элементар- ных частиц, лучше всего один сорт, или, в крайнем случае, два, так, чтобы вся материя была построена из них. Однако результаты экспери- мента показывают, что основных частиц должно быть больше. В самом деле, число элементарных частиц стремилось довольно катастрофичес- ки увеличиваться в течение последних лет. Пожалуй, такое положение вещей не столь скверно, так как более близкое рассмотрение показывает, что нельзя провести строгого раз- личия между элементарными и сложными частицами. Для интерпре- тации некоторых новейших экспериментов необходимо предположить, что частицы могут создаваться и уничтожаться. Поэтому, если мы на- блюдали какую-либо частицу, вылетевшую из другой, мы не можем с уверенностью утверждать, что последняя является сложной, так как первая частица могла оказаться созданной вновь. Различие между эле- ментарными и сложными частицами становится поэтому условным. Одного этого соображения достаточно, чтобы принудить нас оставить привлекательную с философской точки зрения мысль, что вся материя построена из одного, или, может быть, двух сортов кирпичиков. Я хотел бы остановиться здесь на обсуждении более простого сорта частиц и посмотреть, что можно сказать о них на основании чисто тео- ретических аргументов. Наиболее простыми видами частиц являются: Перевод с английского Д. Иваненко.
Теория электронов и позитронов 185 1. Фотоны, или световые кванты, из которых состоит свет. 2. Электроны и открытые недавно позитроны, являющиеся чем-то вроде зеркального изображения электронов и отличающиеся от послед- них только знаком электрического заряда. 3. Тяжелые частицы — протоны и нейтроны. Я буду рассматривать здесь почти исключительно электроны и по- зитроны не потому, что они наиболее интересны, а потому, что теория для них была развита наиболее полно. В самом деле, вряд ли можно сделать какое-либо теоретическое заключение о свойствах остальных частиц. С одной стороны, фотоны столь просты, что легко укладыва- ются в любую теоретическую схему, так что теория не накладывает каких-либо ограничений на их свойства. Протоны же и нейтроны, с дру- гой стороны, представляются слишком сложными, и до сих пор не было открыто какое-либо надежное основание для построения их теории. Вопрос, которого мы должны коснуться прежде всего, заключает- ся в том, каким образом вообще теория может дать какие-либо сведе- ния о свойствах элементарных частиц. В настоящее время существует общая система квантовой механики, которую можно применить для описания движения любого сорта частиц, каковы бы ни были свойства последних. Однако эта общая система квантовой механики не пригодна для случая скоростей, сравнимых со скоростью света, когда начина- ют играть роль эффекты теории относительности. В настоящее вре- мя не существует релятивистской квантовой механики (т. е. пригодной в случае больших скоростей), которая могла бы применяться к час- тицам с произвольными свойствами. Поэтому, подвергая квантовую механику релятивистскому обобщению, мы накладываем тем самым ограничения на свойства частиц. Таким путем мы можем вывести ряд заключений о частицах из чисто теоретических соображений, основан- ных на общих физических принципах. Этот метод оказался удачным в случае электронов и позитронов. Следует надеяться, что в будущем аналогичная теория будет построена и для других частиц. Я хочу описать здесь общие черты теории элек- тронов и позитронов, показав, каким путем можно вывести свойства спина («вращения») электрона и сделать заключение о существовании позитронов с подобными же свойствами спина, способных притом уни- чтожаться при столкновении с электронами. Мы имеем прежде всего уравнение, связывающее кинетическую энергию W и количество движения рг (г = 1, 2, 3) частицы в реляти-
186 Теория электронов и позитронов вистской классической механике A) Отсюда возможно получить волновое уравнение квантовой механи- ки, подразумевая под W и рг операторы i-p--^- и —i-j^-Jr— и действуя 2тг at 2тг ахг левой частью уравнения на волновую функцию ф. Теперь мы можем написать волновое уравнение: -р2г-т2с2]ф = 0. B) с2 Вспомнив теперь общее требование квантовой механики, чтобы всякое волновое уравнение было линейным относительно оператора W или J-, мы видим, что наше уравнение ему не удовлетворяет. Мы должны за- менить его каким-то уравнением, линейным в W, а чтобы уравнение было релятивистски инвариантным, оно должно быть также линейным относительно рг. Таким образом, мы приходим к рассмотрению урав- нения вида [Ц-- агРг - аотс}ф = 0. C) Это уравнение заключает в себе четыре новых переменных аг и ао, которые являются операторами, действующими на функцию ф. Мы предположим, что они удовлетворяют следующим условиям: а2 = 1; ама„ + avamu = О для ц, ф v\ /i, v = 0, 1, 2, 3; а также, что а коммутируют со всеми р и W. Эти свойства а делают уравнение C) до некоторой степени эквивалентным уравнению B), так как, умножив C) слева на W , — + агрг + аотс, мы получим точно уравнение B). Новые переменные а, которые мы должны ввести, чтобы получить релятивистское волновое уравнение, линейное в W, дают спин электрона. Из общих принципов квантовой механики легко вывести, что переменные а приводят к значению спи- нового момента количества движения, равного половине кванта дей- ствия, деленного на 2тг, и к значению магнитного момента, равного
Теория электронов и позитронов 187 магнетону Бора и направленному против момента количества движе- ния. Эти результаты находятся в полном согласии с экспериментом. На самом деле они и были впервые получены из спектроскопических наблюдений и подтверждены впоследствии теорией. Величины а приводят также к некоторым совершенно неожидан- ным явлениям, связанным с движением электрона. Этот вопрос был подробно исследован Шредингером. Оказывается, что электрон, кото- рый представляется нам медленно движущимся, в действительности должен проделывать колебательное движение очень большой частоты и малой амплитуды, которое накладывается на наблюдаемое нами рав- номерное движение. В результате этого колебательного движения ско- рость электрона всегда равняется скорости света. Это следствие те- ории не может быть непосредственно проверено экспериментом, так как частота колебательного движения столь высока, а амплитуда столь незначительна. Но мы должны доверять этому следствию теории, так как другие выводы из нее, неразрывно связанные с только что ука- занным парадоксальным следствием, как, например, закон рассеяния света электроном, подтверждаются экспериментом. Наши уравнения обладают еще одним важным свойством, на ко- торое я хотел бы указать здесь, и которое привело к предсказанию позитрона. Из уравнения A) мы видим, что оно допускает для кинети- ческой энергии W или положительные значения, большие тс2, или от- рицательные значения, меньшие —тс2. Этот результат сохраняет свою силу и при переходе к квантовому уравнению B) или C). Таким об- разом, эти квантовые уравнения, будучи интерпретированы согласно общей схеме квантовой динамики, допускают в качестве возможных результатов измерения кинетической энергии W какие-либо значения, большие тс2, или же значения, меньшие —тс2. В действительности кинетическая энергия частицы всегда явля- ется положительной. Итак, мы видим, что наши уравнения допускают для электрона два вида движения, из которых только один соответ- ствует привычному. Другой вид движения соответствует электронам с весьма странными свойствами; например, более быстрому движению соответствует меньшая энергия; чтобы заставить такой электрон оста- новиться, нужно придать ему энергию. Можно было бы поэтому попы- таться ввести в теорию в качестве нового допущения, что только один из видов движения встречается в действительности. Но это приводит к серьезной трудности, так как мы находим из теории, что электрон под
188 Теория электронов и позитронов действием возмущения может перейти из состояния движения с поло- жительной энергией в состояние движения с отрицательной энергией. Поэтому, даже если мы предположим, что все электроны в мире нахо- дятся вначале в состояниях положительной энергии, через некоторое время часть из них окажется в состояниях отрицательной энергии. Та- ким образом, допуская состояния отрицательной энергии, теория пред- сказывает нечто, по-видимому, не соответствующее чему-либо извест- ному из эксперимента, но что мы, однако, не можем отбросить прос- то путем нового предположения. Итак, мы должны найти физический смысл отрицательных состояний. Более детальное рассмотрение поведения электронов в этих состо- яниях в электромагнитном поле показывает, что они соответствуют движению электрона с положительным зарядом вместо обычного от- рицательного, т. е. тому, что экспериментаторы называют теперь пози- троном. Поэтому можно было бы попытаться допустить, что электроны в состояниях отрицательной энергии как раз являются позитронами. Но такое решение вопроса не годится, так как наблюдаемые на опыте пози- троны, наверное, не имеют отрицательных энергий. Мы можем, одна- ко, установить связь между электронами в состояниях отрицательной энергии и позитронами иным, значительно менее прямым, образом. Мы воспользуемся принципом Паули, согласно которому в каждом состоянии движения может находиться только один электрон. Допус- тим теперь, что в известном нам мире почти все состояния отрицатель- ной энергии для электронов заняты как раз одним электроном в каждом состоянии, и что равномерное заполнение всех состояний отрицатель- ной энергии является совершенно ненаблюдаемым для нас. Допустим далее, что какое-либо незанятое состояние отрицательной энергии, бу- дучи отклонением от равномерности, наблюдаемо и как раз является позитроном. Незанятое состояние отрицательной энергии, или дырка, как мы будем называть его для краткости, будет обладать положительной энер- гией, так как оно является местом, где имеется недостаток отрица- тельной энергии. В самом деле, дырка ведет себя совершенно подобно обычной частице, и, отождествив ее с позитроном, мы наиболее ра- зумным способом избавляемся от трудности, связанной с появлени- ем отрицательных энергий в наших уравнениях. С этой точки зрения позитрон является точно зеркальным изображением электрона, имею- щим ту же массу, но противоположный заряд. Эти выводы были уже
Теория электронов и позитронов 189 в общих чертах подтверждены экспериментом. Позитрон должен затем иметь такой же, как у электрона, спин, но это заключение не было еще проверено на опыте. На основании нашей теоретической картины мы должны ожидать, что обычный электрон положительной энергии мо- жет упасть в дырку и заполнить ее, причем освободившаяся энергия будет выделена в виде электромагнитного излучения. Это будет соот- ветствовать процессу, в котором электрон и позитрон взаимно уничто- жаются. Обратный процесс, именно создание электрона и позитрона из электромагнитного излучения, тоже может иметь место. Эти процессы по-видимому были обнаружены экспериментально и в настоящее время исследуются более детально. Теория электронов и позитронов, которую я только что набросал здесь, является логически замкнутой картиной, которая согласуется со всеми известными экспериментальными фактами. Было бы желательно построить столь же удовлетворительную теорию и для протонов. Пожа- луй, можно было бы предположить, что та же самая теория применима и к протонам. Это привело бы к возможности существования отрица- тельно заряженных протонов, являющихся зеркальным изображением обычных, положительно заряженных. Недавние экспериментальные ре- зультаты Штерна, касающиеся спинового магнитного момента прото- на, противоречат, однако, подобной теории протонов. Так как протон значительно тяжелее электрона, то вполне возможно, что для него тре- буется значительно более сложная теория, хотя сейчас нельзя сказать, какой она должна быть. Во всяком случае, я считаю вероятным существование отрицатель- ных протонов, ибо, поскольку мы можем еще опираться на теоретичес- кие выводы, между положительным и отрицательным электрическими зарядами имеется полная и совершенная симметрия, и если эта сим- метрия действительно носит фундаментальный характер, то должно оказаться возможным обращать заряд любого сорта частиц. Конечно, отрицательные протоны будет гораздо труднее обнаружить экспери- ментально, так как для этого необходима значительно большая энергия, соответственно большей массе. Если мы станем на ту точку зрения, что полная симметрия между положительным и отрицательным электрическими зарядами является фундаментальным законом природы, то мы должны рассматривать как своего рода случайность, что Земля, и, вероятно, вся солнечная систе- ма содержат избыток обычных отрицательных электронов и положи-
190 Теория электронов и позитронов тельных протонов. Вполне возможно, что некоторые звезды построены иным путем, именно главным образом из позитронов и отрицательных протонов. Конечно, в мире должно быть одинаковое число звезд каждо- го сорта. Оба сорта звезд будут иметь в точности одинаковые спектры, и в настоящее время нет возможности различить их какими-либо аст- рономическими методами.
СКОБКИ ДИРАКА В ГЕОМЕТРИИ И МЕХАНИКЕ А. В. Борисов, И. С. Мамаев В этой книге приведены все работы Поля Дирака по обобщению га- мильтоновой механики на случай вырожденных лагранжианов. Это об- общение было им использовано в дальнейшем для квантования различ- ных полевых систем. Однако возникшая при этом классическая теория имеет собственный интерес и может быть использована при анализе различных задач динамики и геометрии. Изложение Дирака во многом носит интуитивный физический ха- рактер, а его конструкции с современной точки зрения требуют допол- нительного обоснования. В этом приложении мы постараемся остано- виться на некоторых основных дифференциально-геометрических иде- ях, заложенных в рассуждениях Дирака, а также поясним их на ряде примеров, возникающих в классической механике. Отметим также, что несколько узкая задача о переходе от лагранжева к гамильтонову фор- мализму в вырожденном случае заставила переосмыслить основную ак- сиоматическую базу гамильтоновой механики и выделить скобки Пуас- сона в качестве основного объекта. Это фактически привело к созданию теории пуассоновых структур, способствовало развитию таких матема- тических дисциплин, как теория конечномерных и бесконечномерных алгебр Ли, топологии и др. Мы по возможности попытались сделать изложение замкнутым — поэтому сочли разумным напомнить сначала читателю основы гамильтоновой механики, теории пуассоновых мно- гообразий и симплектической геометрии. Более подробные сведения можно найти в нашей книге [10], а также в [29, 31, 26]. 1. Скобки Пуассона и их свойства. Многие задачи динамики допускают запись в гамильтоновой форме
192 А. В. Борисов, И. С. Мамаев где канонические координаты (</, р) определены на некотором четно- мерном многообразии (</, р) 6 М2п — фазовом пространстве. Функ- ция Н называется гамильтонианом. Если ввести скобку Пуассона двух функций F и G по формуле FdG dFdG то уравнения A.1) можно переписать в виде <й = {Qi, Я}, pi = {Pi,H}. A.3) Любая дифференцируемая функция F = F(q, p) также эволюциониру- ет по гамильтонову закону: F = {F,H}. A.4) Классическое изложение гамильтоновой механики, основанное на теории производящих функций и канонических преобразований коорди- нат (</, р), не является инвариантным относительно произвольных координатных преобразований. Поэтому при инвариантном построе- нии гамильтонова формализма (следуя П. Дираку) исходят из урав- нений A.3) и постулируют свойства скобок Пуассона, определенных для функций, заданных на некотором многообразии М с координатами х = (ж1, ... , хп). Требуется, чтобы эти скобки удовлетворяли следую- щим условиям: 1°. {\Fx+nF2, G} = A{Fi, G}+fj,{F2, G}, А, ц б М —билинейность, 2°. {F, G} = —{G, F} — кососимметричность, 3°. {FiF2, G} = Fi{F2, G} + F2{Fb G} — правило Лейбница, 4°. {{Я, F},G} + {{G, H}, F} + {{F, G}, H} = 0 — тождество Якоби. Скобку Пуассона {•, •} мы будем называть также пуассоновой структу- рой, а многообразие М, на котором она задана — пуассоновым. В приведенном определении мы отказались от свойства невырож- денности, (т.е. VF(a:) ф const, 3G ф const, {F, G} ф 0), которое зало- жено в выражении A.2), что позволяет, например, ввести скобку Пу- ассона для нечетномерных систем. При этом пуассонова структура мо- жет оказаться вырожденной и обладать функциями Казимира F/.(x),
Скобки Дирака в геометрии и механике 193 коммутирующими со всеми переменными х, и, стало быть, с любыми функциями — VG(aj), {F^, G} = О (в литературе для функций Казими- ра употребляют также термины: аннуляторы, центральные функции, отмеченные функции и просто казимиры). Свойства 1°-4° позволяют записать скобку Пуассона функций F и G в явном виде Базисные скобки JIJ' = {хг, х^} называются структурными функ- циями пуассонова многообразия М относительно данной, вообще гово- ря, локальной системы координат х [26]. Они образуют структурную матрицу (тензор) J = ||JIJ'|| размером п х п. Если J={-E 0 )' Е = Ш A-6) то получаем каноническую скобку Пуассона, определяемую форму- лой A.2). Структурная матрица Jli(x) обладает следующими свойствами: а) кососимметричность: Jij(x) = -Jji(x), A.7) б) тождество Якоби: дх1 дх1 дх1 Легко видеть, что всякая постоянная кососимметрическая матри- ца JlJ задает пуассонову структуру. Инвариантный объект, определяемый тензором J*J', является би- вектором (бивекторным полем): J(dF, dG) = У J!J(a:)— Л -^, ^ дх1 дх3 где dF — ковектор с компонентами ^т. дх1
194 А. В. Борисов, И. С. Мамаев Векторное поле Хн = {х, Н} определяет на многообразии гамиль- тонову систему, которая в компонентной записи имеет вид A.9) Функция Н = Н(х) при этом называется гамильтонианом (функцией Гамильтона). Коммутатор векторных полей и скобки Пуассона связаны соотно- шением [Хн, XF] = -X{HtF}. Несложно также проверить, что любое гамильтоново поле порождает преобразование, сохраняющее скобки Пуассона. Определение 1. Функция F(x) называется первым интегралом системы, если ее производная вдоль системы равна нулю F = Xh(F) = О ([Хн, Хр\ = 0), это условие эквивалентно тому, что {F, Н} = 0. 2. Невырожденная скобка. Симплектическая структура. Если скобка Пуассона является невырожденной, то ей однозначно со- поставляется замкнутая невырожденная 2-форма. Действительно, для любой гладкой функции F операция Хр = {F, •} является дифференци- рованием и задает некоторый касательный вектор на М. Все касатель- ные векторы можно представить в таком виде. Определим 2-форму ш2 по формуле ш2(Хс, XF) = {F, G]. Из аксиом 1°-4° следует, что она билинейна, кососимметрична, невы- рождена и замкнута. Эта 2-форма называется симплектической струк- турой, а многообразие М — симплектическим многообразием. В общем случае форма ш2 имеет вид ^coijdxi A dxj, где \\oJij\\ = ||J*J'||~1, в ка- ноническом случае A.6) ш2 = ^dpj A dqt. К такому виду по теореме Дарбу [3] приводится локально всякая симплектическая структура. Обратно, невырожденная форма ш2 позволяет установить изо- морфизм касательного ТХМ и кокасательного пространств: вектору ? ? ТХМ ставится в соответствие 1-форма ш1(т]) = ш2 (т], ?) ? Т*М, где т] ? ТХМ. Пусть /: Т*М —>¦ ТХМ — обратное отображение. Легко проверить, что скобка Пуассона двух функций F, G, заданная форму- лой {F, G} = oj2(IdG, IdF), удовлетворяет условиям 1°-4° и условию невырожденности.
Скобки Дирака в геометрии и механике 195 3. Симплектическое слоение. Обобщение теоремы Дарбу. Если скобка Пуассона является вырожденной, то пуассоново многооб- разие (фазовое пространство) расслаивается на симплектические слои (листы), ограничение пуассоновой структуры на которые уже невы- рождено. Эти слои представляют собой общий уровень всех централь- ных функций, и для них справедлива теорема Дарбу. Таким образом, на симплектическом слое мы вновь возвращаемся к ситуации стандартной канонической (симплектической) гамильтоновой механики. Однако для приложений сведение к такой системе не всегда бывает необходимым, так как ведет к потере, например, алгебраичности дифференциальных уравнений и ограниченности применения геометрических методов ис- следования. Рангом пуассоновой структуры в точке х ? М называется ранг структурного тензора в этой точке (очевидно, что он четен). Как прави- ло, под рангом пуассоновой структуры понимают максимальный ранг, который она имеет в некоторой точке ж Е М. Для симплектических многообразий ранг пуассоновой структуры в любой точке постоянен и максимален. Сформулируем общую теорему Дарбу для произвольных (возмож- но вырожденных) пуассоновых многообразий. Доказательство этой тео- ремы восходит к Ли [39] и Дарбу, с более формальными рассуждениями можно ознакомиться в работе [46] (см. также [26]). Теорема. Пусть (М, {•, •}) —пуассоново многообразие размернос- ти пив точке х ? М ранг скобки {•, •} локально постоянен и ра- вен 2г. Тогда существует локальная система {канонических) коорди- нат х\, ... , хг, ?/1, ... , уг, z\, ... , zn-2r, в которой скобки Пуассона имеют вид {xi, Xj} = {2/j, Vj) = {xi, zk} = {2/j, zk} = {zk, zi) = 0, {xi, У,} = Sij, где 1 ^ i, j ^ r, 1 ^ fc, / ^ n - 2r. В указанных координатах симплектический лист задается урав- нениями Z( = Cj, (cj = const), а симплектическая структура на нем задается формой ш = dxi Adyi. Если в любой окрестности точки х ранг не является локально постоянным, то теорема Дарбу уже не являет- ся справедливой. Одно из обобщений теоремы Дарбу для произвольной
196 А. В. Борисов, И. С. Мамаев точки получено А.Вейнстейном [46]. Нормальные формы пуассоновых структур вблизи такой особой точки х ? М обсуждаются в [2, 46]. 4. Пуассоновы подмногообразия. Ограничение скобки. Определение 2. Пусть (М, {•, -}м), (N, {•, -}лг) — пуассоновы многообразия. Отображение f:M—>N называется пуассоновым, если {F(f{x)), G(f(x))}M = {F, G}N(f(x)) D.1) для любых функций F, G: N —>¦ Ж (т. е. отображение сохраняет скобку Пуассона). Пусть N С М — подмногообразие в пуассоновом многообразии. На N можно определить скобку {•, -}лг функций F, G: N —>¦ Ж по фор- муле {F, G}N = {F, G} , D.2) где в правой части стоит ограничение скобки Пуассона двух функций F, G, являющихся гладкими продолжениями функций F, G на объем- лющее многообразие М. Определение 3. Подмногообразие N называется пуассоновым, ес- ли скобка {•, -}лг не зависит от способа продолжения функций F и G. При этом отображение вложения г: N —>¦ М является пуассоновым. Определение 4. Пуассонова структура {•, -}лг на многообразии N, в общем случае содержащая константы, фиксирующие это подмногооб- разие в М, называется ограничением на N скобки {•, •}. Пуассоновость подмногообразия N гарантирует для {•, -}лг выпол- нение тождества Якоби. В случае, если скобка {•, -}лг — невырождена, соответствующее подмногообразие называется невырожденным (сим- плектическим). Несложно проверить, что поверхности уровня функций Казими- ра задают пуассоново подмногообразие, которое является невырожден- ным, если рассмотреть их общий регулярный уровень. Чтобы лучше понять устройство других пуассоновых подмногообразий, сформули- руем простые утверждения, доказанные, например, в [26].
Скобки Дирака в геометрии и механике 197 Предложение 1. Если N — пуассоново подмногообразие, то для всякой функции F: М —>¦ Ш. векторное поле Хр = {•, F}\N касается N. Предложение 2. Если N задано в виде N = {х 6 М, fi(x) = 0}, то для всякой функции F: М —>¦ Ж выполнено {/j, F}\N = 0 (в част- ности, для координатных функций {/j, а^}^ = 0). С точки зрения динамики, функции Казимира представляют собой первые интегралы, существующие у гамильтоновой системы A.9) при любых функциях Гамильтона Н. В общем случае пуассоновы подмного- образия представляют собой систему инвариантных соотношений ди- намической системы A.9), также не зависящую от выбора гамильто- ниана. Симметрии, соответствующие этим функциям, содержатся пол- ностью в пуассоновой структуре. Само обобщение классической гамильтоновой системы A.1) на слу- чай вырожденного структурного тензора с динамической точки зрения эквивалентно рассмотрению систем, представление которых в канони- ческом виде не очевидно заранее, но возможно (локально — это следст- вие теоремы Дарбу) на общем уровне функций Казимира или сущест- вующих у данной системы инвариантных соотношений, определяющих невырожденное пуассоново подмногообразие. 5. Примеры неканонических скобок Пуассона. Системы с гироскопическими силами. Пусть на касательном расслоении ТМ = (</, q) задана лагранжева динамическая система с лагранжиа- ном L, содержащим члены, линейные по скоростям L = T+{f(q),q)+V{q), E.1) T(q, q) — положительно определенная квадратичная по q форма кине- тической энергии, V(q) — потенциал. Линейные члены в E.1) могут возникать либо при наличии в системе гироскопических сил типа си- лы Лоренца, действующей на заряд в магнитном поле, либо в процессе понижения порядка по Раусу в системах, содержащих циклические ко- ординаты [25]. 2-форма Г = Хл я"^" ~ я~^)^* Л dqJ = ^Sijdqi Л dqj называ- г<3 ' ется формой гироскопических сил. Она определена на конфигурацион- ном пространстве М = {q} и является замкнутой. По лемме Пуанка- ре, локально эта форма является точной, что может быть не выполне-
198 А. В. Борисов, И. С. Мамаев но глобально. В этом случае лагранжиан E.1) не является глобально определенным на касательном расслоении (точнее, 1-форма ^ fi(q)dq. в лагранжиане E.1) не определена глобально). Если перейти с помо- щью преобразования Лежандра от лагранжева формализма к гамиль- тонову, то полученный таким образом гамильтониан также не будет определен глобально на кокасательном расслоении (кроме случая, ког- да форма Г точна Г = dA). Чтобы сохранить однозначность гамиль- тониана, можно выполнить преобразование Лежандра без учета в E.1) линейных по q членов. Это приведет к гамильтоновой системе с гло- бально определенным гамильтонианом (который полезно иметь для то- пологических исследований в «целом» [25]), однако к симплектической структуре и>2 = Yl dqi A dqj добавится дополнительный (гироскопичес- кий) член Г = ^gijdqt Л dqj. В скобке Пуассона также появятся до- полнительные слагаемые {%, qi} = 0, {<?, pj} = Sf, {pi, pj} = gij(q). Включение гироскопических членов в скобку Пуассона было предложе- но Сурьо [45]. В работе [25] изложенные соображения применены к урав- нениям Кирхгофа, что позволило явно выделить глобальные эффекты (типа «монополя Дирака») при приведении по Раусу уравнений движе- ния на сферу Пуассона. 6. Скобка Ли —Пуассона. Другой важный пример пуассоновой структуры связан с алгебрами Ли. Пусть ckj — структурные констан- ты алгебры © в базисе {v\, ... , vn}. Скобка Ли - Пуассона ([39], т. 3, гл. 25, § 115, формула G5)) пары функций F, Н, заданных на некотором (другом) линейном пространстве V с координатами х = (х\, ... , хп) и базисом {о;1, ... , шп} определяется формулой , Н} = ± Мх)Щ, F.1) где Jij(x) = 2_,c>ijXk — линейный по хи структурный тензор. Все не- k обходимые тождества для структурного тензора можно получить из свойств структурных констант алгебры Ли: 1 Л. — -Ж. 1. Ьи — Ь]г, z- ^lcimcjk т ckmcij "+" cjmcki) ~ u-
Скобки Дирака в геометрии и механике 199 Более инвариантное описание структуры Ли-Пуассона делается следующим образом. Для любого векторного пространства V и глад- кой функции F: V —>¦ Ж, дифференциал dF(x) в любой точке х ? V является элементом двойственного векторного пространства V*, состо- ящего из линейных функционалов на V. По определению ,,р, , . ,. F(x+ey)-F(x) (dF(x), у) = lim ^ , для любого у Е V, а операция (•, •) есть естественное спаривание про- странства V и двойственного к нему пространства V*. Учитывая это, можно отождествить линейное пространство V, участвующее в исход- ной конструкции скобок Ли-Пуассона с двойственным пространст- вом д* к алгебре Ли д, причем {о;1, ... , шп} — двойственный базис к {i>i, ... , vn}. Дифференциал dF(x) любой функции F: д* —>¦ Ш (опре- деленной на дуальном пространстве) является элементом пространства (д*)* ~ д. Скобка Ли-Пуассона в инвариантной форме имеет вид {F, Н}(х) = (х, [dF(x), <Ш(х)]), х ? 0*, F.2) где [•, •] — скобка Ли на самой алгебре д. Симплектическое слоение для скобки Ли-Пуассона на двойствен- ном пространстве д* к алгебре Ли имеет особенно замечательную ин- терпретацию в терминах представления, двойственного к присоединен- ному представлению группы Ли д на алгебре Ли д (см. [2, 26]). Пусть <3 — группа Ли с алгеброй Ли д. По определению копри- соединенным действием элемента группы / б © называется линейное отображение Ad;*: д* —>¦ д* двойственного пространства, удовлетворя- ющее условию (Ad,* и, w) = (и, Adi-i w) F.3) для всех ш Е д*, w б д, a Ad; — присоединенное действие элемента / на д. Если отождествить касательное пространство Тд*|ш, и> Е д* с са- мим пространством д* (аналогично сделать и для д,) то можно получить инфинитезимальные образующие коприсоединенного действия диффе- ренцированием равенства F.3) (ad* ш, w) = —(w, ad,, w) = (ш, [v, w]), где v, w E g, ш Е g*. Для присоединенного представления adm v = = [w, v].
200 А. В. Борисов, И. С. Мамаев Коприсоединенное действие и скобка Ли-Пуассона связаны следу- ющим замечательным утверждением, доказательство которого можно найти в [2, 26, 29]. Теорема 1. Пусть <3 — связная группа Ли с коприсоединенным представлением Ad^ на д*. Тогда орбиты представления Ad^ в точ- ности совпадают со слоями симплектического слоения, индуцированно- го скобкой Ли-Пуассона на д*. В частности, орбиты коприсоединенного представления группы © являются четномерными подмногообразиями в д*. Кроме того, для каж- дого элемента g 6 © коприсоединенное отображение Ad* g является пуассоновым (сохраняет скобку Пуассона) и оставляет на месте слои этого слоения. В случае, если размерность орбиты коприсоединенного представления не является максимальной, она называется сингулярной. Можно показать, что такие орбиты являются пуассоновыми многообр- азиями — сингулярными симплектическими листами. Замечание 1. При редукции на орбиту коприсоединенного представ- ления возникает невырожденная скобка, порождающая соответствующую замкнутую невырожденную 2-форму. Эта форма была (независимо от С. Ли) открыта Березиным и использовалась Кирилловым, Костантом и Сурьо в связи с теорией представлений и геометрическим квантованием. Тер- мин «скобка Ли - Пуассона» введен А. Вейнстейном (который ввел также термин «функция Казимира», вообще говоря, исторически мало оправдан- ный. Казимир (Н. В. G. Casimir), выполнявший диссертацию под руководст- вом П. Эренфеста (P. Ehrenfest), использовал это понятие при квантовании уравнений Эйлера свободного волчка [35]. С. Ли называл эти функции отме- ченными (ausgezeichnete Funktionen) [39]. Уравнения Гамильтона для структуры Ли-Пуассона ±i = {Xi, tf} F.4) в покомпонентной записи имеют вид Уравнения F.5) можно записать в более инвариантном виде x = ad*dH(x), х?д*, F.6) где ad|, (? б д) — оператор коприсоединенного представления алгебры Лид: adj:0* -»• д*.
Скобки Дирака в геометрии и механике 201 7. Приложения к механике. Оказывается, что ряд задач меха- ники, например, уравнения, изучаемые в классической динамике твер- дого тела, динамике вихрей, могут быть записаны в виде уравнений Га- мильтона на пуассоновом многообразии со скобкой Ли-Пуассона F.1). Отличием этих уравнений от канонической формы записи, как правило, является их простота и алгебраичность. Остановимся более подробно на скобках Пуассона, возникающих в динамике твердого тела. При выборе переменных для описания движения твердого тела во- круг неподвижной точки, в которых уравнения движения имеют наи- более простой вид, еще Л. Эйлер A758 г.) предложил использовать про- екции кинетического момента твердого тела на оси, связанной с телом системы координат. Уравнения Эйлера, описывающие вращение твер- дого тела по инерции (I — тензор инерции) М = М х AM, G-1) А = I = diag(ab а2, а3), М = (Мь М2, М3), могут быть записаны как уравнения Гамильтона со скобкой Ли-Пуас- сона, порожденной структурными константами алгебры soC): {Mh Mj} = -sijkMk G.2) и функцией Гамильтона Н = {AM, M)/2. Скобка G.2) является вырожденной и обладает функцией Казими- ра — интегралом момента: М2 =М12 + М22 + М32. Ненулевой уровень этой функции задает симплектический лист — двумерную сферу, при редукции на него скобка G.2) становится невы- рожденной — ее ранг равен двум (центр сферы является сингулярной нульмерной орбитой). Координатами Дарбу в этом случае является сис- тема цилиндрических координат [26]. Задание гамильтониана Н в виде определяет левоинвариантную риманову метрику на группе Ли 50C). Операторы А: д —> д* и обратный ему А~г = /: д* —t g являются по- ложительно определенными и задают переход от угловых скоростей ш
202 А. В. Борисов, И. С. Мамаев к компонентам кинетического момента М. Уравнения F.6) представля- ют собой уравнения геодезических на группе Ли, снабженной левоинва- риантной римановой метрикой. Связь между уравнениями геодезичес- ких и уравнениями Эйлера динамики твердого тела обсуждается в [3], где также дается определение угловой скорости (кинетического момен- та) в теле и пространстве как элементов алгебр Ли, полученных перене- сением из касательного пространства в некоторой точке группы © при помощи, соответственно, левых и правых сдвигов. Левоинвариантность формы кинетической энергии твердого тела при этом обусловлена тем, что она определяется вектором угловой скорости в теле и не зависит от расположения тела в пространстве. Развивая идею Эйлера, С. Пуассон A810 г.) вывел более общие урав- нения, описывающие движение тяжелого твердого тела в однородном поле тяжести вокруг неподвижной точки, используя, наряду с компо- нентами вектора кинетического момента, проекции единичного орта вертикали 7 = Gi> 72? 7з) на те же оси- Оказывается, что уравнения Эйлера-Пуассона (а также уравнения Кирхгофа, описывающие движение однородного твердого тела в идеаль- ной безвихревой жидкости по инерции) в переменных (М, 7) могут быть представлены как гамильтоновы уравнения со скобкой Ли-Пуас- сона, определяемой коммутационными соотношениями: {Mh Mj} = -sijkMk, {Mh Ъ} = -Sijkjk, bh lj} = 0 G.3) и гамильтонианом Н = =-{AM, M)+P(r, 7), где А = I~x, I — тензор инерции, Р — вес тела, г — радиус-вектор центра масс в системе, связанной с телом. Эти коммутационные соотношения отвечают алгебре еC), являю- щейся полупрямой суммой алгебры вращений soC) и трехмерной ал- гебры трансляций М3. Эта алгебра не является полупростой и обладает абелевым идеалом, определяемым переменными 7г- Переменные типа (М, 7) в механике называют иногда квазикоординатами. Движения тела с полостями, имеющими жидкое вихревое на- полнение, можно также описать как гамильтонову систему на ал- гебре soD), являющейся прямой суммой двух алгебр вращений: soD) = soC) ф soC). При этом, один экземпляр soC) отвечает кинети- ческому моменту тела, а второй — вектору завихренности (см. [8, 31]). Уравнения движения в этом случае были получены А. Пуанкаре [43], ко-
Скобки Дирака в геометрии и механике 203 торый почти в современной форме отметил их связь с алгеброй soD). Другие примеры гамильтоновых уравнений, часть из которых имеют физическое обоснование, приведены в книгах [8, 31]. Замечание 2. Оказывается, что в виде F.6) могут быть также записаны гидродинамические уравнения Эйлера идеальной (несжимаемой и невязкой) жидкости. В этом случае в качестве фазового пространства выступает группа диффеоморфизмов области течения, сохраняющих элемент объема [1, 3]. Замечание 3. В гидродинамике канонические координаты на симплек- тическом листе называются переменными Клебша [40]. Если их введение ло- кально возможно по теореме Дарбу, то глобальное определение сделать не так просто, а иногда и невозможно. Это обусловлено топологией симплектичес- кого листа. В последнее время, кроме линейных, обсуждаются также квад- ратичные скобки Пуассона. Содержательный пример существования квадратичных коммутационных соотношений, возникший из анализа уравнений Янга-Бакстера, был указан Е.К. Скляниным. Он рассмот- рел алгебру скобок Пуассона, порожденную следующими соотношени- ями между образующими So, Sa, Sp, S7 [27]: -)¦ {Sa, So} = 2J01S0S7, м- {Sa, ЗД = -2S0S7, G.4) где '-t Ja/3 = Ja — J/3, Jai J/3, Jj € K. (здесь и далее ^-> обозначает циклические перестановки индексов.) Скобка, задаваемая соотношениями G.4), является вырожденной. Она обладает функциями Казимира F1=S2a + S} + S*, F2 = S20 + JaS2a + J0S} + J7S2r G.5) Более сложный пример квадратичной алгебры скобок Пуассона был указан в работе [11]. При этом между образующими А, В, С, D имеются следующие коммутационные соотношения {А, В} = -АВ, {В,С} = 0, {А, С} = -АС, {B,D} = -BD, {A,D} = -2BC, {С, D} =-CD. { ' Скобка G.6) также является вырожденной. Ее центральными функци- ями являются F1 = AD- ВС, F2 = В/С. G.7)
204 А. В. Борисов, И. С. Мамаев Квадратичные скобки Пуассона возникают также в многомерных интегрируемых цепочках Тоды и Вольтерра и рассмотрены в книге [10]. 8. Процедуры ограничения и скобка Дирака. В п. 1 была рассмотрена возможность ограничения пуассоновои структуры (М, J) на некоторое подмногообразие Nc С М заданной, например, совмест- ным уровнем функций fi{x) = Cj, Cj = const, i = 1, ... , s. Оказалось, что для этого оно должно быть пуассоновым, то есть для любой функ- ции F(x) должно быть выполнено {fi(x),F(x)}\N=0, i = l, ...,«. (8.1) Геометрический смысл условия (8.1) состоит в том, что все га- мильтоновы векторные поля касаются Nc и поэтому корректно на него ограничиваются. Рассмотрим в некотором смысле противоположную ситуацию, ког- да для функций /,, определяющих подмногообразие Nc, матрица \\fij\\ = — ||{/»5 Л'}|| невырождена det WfijW^O. (8.2) Если многообразие М является симплектическим, то условие (8.2), выполненное на всем Nc является необходимым и достаточным услови- ем его симплектичности. Замкнутая форма, задающая на нем симплек- тическую структуру, получается из исходной ш (заданной на всем М при помощи обычной операции ограничения ш N [2, 29]. Приведенная далее процедура может рассматриваться как обобщение операции огра- ничения симплектической формы. При этом функции fi, задающие под- многообразия, в смысле условия (8.2) максимально некоммутируют. В этом случае произвольное гамильтоново векторное поле на М до- пускает единственную проекцию на касательное пространство к под- многообразию Nc. Возникающее при этом векторное поле также яв- ляется гамильтоновым относительно новой пуассоновои структуры — Xi = {xi, H}d, определяемой по формуле {g, h}D = {g, h} + Y,{g, fi}cij{h, fj], (8-3) 4^ где Il^-H = ||{/is fj
Скобки Дирака в геометрии и механике 205 Скобка (8.3) называется скобкой Дирака [14, 37] и может рассмат- риваться во всем фазовом пространстве М (в сильном смысле по Ди- раку), так как замечательным образом удовлетворяет на нем тож- деству Якоби (а не только на Nc). Она корректно определена также при условии вырожденности первоначальной пуассоновой структуры на М. Функции fi(x) являются центральными для скобки (8.3). В вы- рожденном случае они пополняют уже существующий набор централь- ных функций. В структуре Дирака эти функции находятся в инволю- ции {/;, fj}D = 0. Пусть L(f) — линейная оболочка векторных полей Xf{ = {ж, /,} через L(f), a HM — пространство гамильтоновых полей. Усло- вие (8.2) означает, что все поля Xft трансверсальны к касательному расслоению TNC и независимы. Таким образом, определено расслое- ние HM = TNc(BL(f), позволяющее проектировать векторное поле Хд на TNC вдоль L(f). В симплектическом случае поля Хд и Хд — Хд, где Хд = {ж, H}d, ортогональны относительно симплектической фор- мы: ш(Хн, Хн — Xfi) = 0, т.е. Хн представляет собой косоортогональ- ную проекцию поля Хд на TNC. Гамильтоново поле Хд совпадает с Хд на Nc тогда и только тогда, когда Хд касается подмногообразия. В этом случае функции /,, определяющие Nc, задают систему инвариантных соотношений гамильтонова потока Замечание 4. Поле Х§ может быть также получено без явного вычис- ления скобки (8.3) методом неопределенных множителей Лагранжа [14]. Для этого рассмотрим гамильтониан Я'=Я(а;) + 5>(Л-сО, (8.4) г совпадающий с Н{х) на Nc. Условия касания поля Хн* подмногообразия Nc принимают вид {/*,#}+ Х/Ч/й /4=0, i = l, ...,«. (8.5) k В силу (8.2) система (8.5) допускает единственное решение относитель- но А» (ж). Несложно проверить также, что поля Хн- и Х§ совпадают на Nc. Замечание 5. Метод неопределенных множителей, указанный в пре- дыдущем замечании, позволяет конструктивно получить систему инвари- антных соотношений в динамических проблемах. Для этого необходимо за- дать первоначальную форму одного из предполагаемых инвариантных со- стояний с неопределенными коэффициентами, а затем проделать несколько шагов (8.4), (8.5) до тех пор, пока система инвариантных соотношений не
206 А. В. Борисов, И. С. Мамаев будет однозначно разрешима относительно неопределенных коэффициентов и множителей А/. Такой последовательный метод, не учитывающий, однако, гамильтоновой формы уравнений движения, был, по существу, использован классиками (Чаплыгин, Стеклов, Ляпунов) при поиске инвариантных соот- ношений и частных решений в динамике твердого тела [5]. 9. Редукция Дирака. Так как для поля Х^ ранг пуассоновой структуры (8.3) упал на ^ единиц, то будем говорить, что произве- дена редукция первоначальной гамильтоновой системы Хн- С алгеб- раической точки зрения, редуцированная структура, возможно, приоб- ретает дополнительные дробно-рациональные слагаемые, определяемые формулой (8.3). В курсах гамильтоновой механики обычно рассматривают редук- цию гамильтоновой системы, обладающей дополнительными первыми интегралами. Если эти интегралы линейны по импульсам, то процесс редукции сводится к исключению циклической координаты и восходит к Э. Раусу. Соответствующие интегралы носят название циклических или нетеровских. Их существование, как правило, связано с явными симметриями динамической системы. Алгебраический аналог редук- ции Рауса, связанный с понижением ранга пуассоновой структуры из- ложен в [10]. Для нелинейных по импульсам интегралов (соответствую- щие симметрии называются «скрытыми») процесс понижения порядка обычно конструктивно не выполним. Метод Дирака и соответствующая редукция относятся к дина- мическим системам, обладающими инвариантными соотношениями — как правило, нелинейными. Они могут изначально существовать у за- данной гамильтоновой системы, а также получаться в результате вы- полнения некоторых предельных переходов. Рассмотрим процедуру редукции Дирака в более общей форме. Пусть det ||/jj|| = 0. Тогда НМ ф TNC ф ?(/), то есть касатель- ное пространство к Nc и поля Хд не порождают базис в пространстве векторных полей и L(f) П TNC ф 0, т.е. часть векторных полей каса- ется Nc. Подходящим выбором функций /, (ж) в каждой точке Nc матри- ца ||/у || может быть приведена к виду I 2k \ (9.1)
Скобки Дирака в геометрии и механике 207 Допустим, что ранг ||/jj||, г, j = I + 1, ... , / + 2k, равен 2k. Тог- да возможно корректно определить проекцию гамильтонова поля Хн на подмногообразие N* = {ж: f,(x = Cj, i = I + 1, ... ,1 + 2k}. При этом НМ = L*(f) ® TN*, где L*(f) — линейная оболочка полей Хд, г = /+1, • • • , l+2k, на iV*. Полученное в результате проекции векторное поле Хн, являющееся гамильтоновым относительно скобки (8.3) на N*, имеет инволютивный набор интегралов движения Fi(x) = fi(x) , JV* i = 1, ...,/. С использованием этого метода возможна редукция по сим- метриям (редукция Рауса), описанная в [10]. Описанная общая конструкция для вырожденной матрицы ||/jj|| бы- ла также известна Дираку [37]. Игнорируя традиционный математичес- кий формализм (например, не используя теорему Фробениуса), он до- казал интегрируемость полей Хд, г = 1, ...,/, на N*. Функции //(ж), г = 1, ... ,1, Дирак называл величинами первого рода, a fi(x), i = = I + 1, ... , I + 2k, — величинами второго рода, придавая им различ- ный физический смысл. Замечание 6. Приведенная схема редукции может быть использована в теории некоммутативного интегрирования. Предположим, что гамильто- нова система на симплектическом многообразии (М2п, ш) допускает инва- риантное подмногообразие, задаваемое п + k функциями Nc = {х | fi(x) = Ci, i = 1, ... , п + к}, {fi(x), H}\N = 0, такими, что rank \\{ft, fj}\\ = 2k. Разби- вая функции на два соответствующих класса и ограничивая по Дираку систе- му на Bп — 2к)-мерное симплектическое многобразие N*, получим гамильто- нову систему, обладающую п — к инволютивными первыми интегралами. Она уже является интегрируемой по Лиувиллю в обычном смысле, а траектории являются квазипериодическими обмотками (п — &)-мерных торов. Замечание 7. В общем случае для гамильтоновой системы на Мп, об- ладающей инволютивным набором интегралов ограничение поля Хн на поверхность уровня этих интегралов Nc определяет векторное поле, не являющееся гамильтоновым по отношению к какой-либо пуассоновой структуре на Nc (в частности, относительно структуры Дирака). Примером может служить невырожденная вполне интегрируемая гамильто- нова система в шестимерном фазовом пространстве. Ее поток на трехмерном инвариантном многообразии не является гамильтоновым относительно лю- бой пуассоновой структуры на нем.
208 А. В. Борисов, И. С. Мамаев 10. Трансверсальная структура и сингулярные орбиты. Согласно обобщению теоремы Дарбу [46] пуассоново многообразие вбли- зи любой точки хо ? М допускает разложение М ss S х N — на сим- плектический лист S и трансверсальное к нему дополнение N, которое задается как многообразие уровня функций fi(x) = с, с невырожден- ной матрицей ||{/j, /j}||. Оба многообразия S и N пуассоновы; на S пуассонова (симплектическая) структура получается обычным ограни- чением исходной скобки, а на N — может быть получена по формуле Дирака (8.3). Говорят, что на N определена трансверсальная пуассонова структура [2, 46]. Вблизи регулярной точки xq ? М через хо проходит симплекти- ческий лист S максимальной размерности, а скобка Пуассона на N тождественно равна нулю. Нетривиальная пуассонова структура на N возникает вблизи сингулярной точки хо € М, через которую проходит симплектический лист меньшей размерности. В этом случае точка хо является также особой точкой пуассоновой структуры на N, где ее ранг падает до нуля. Трансверсальная пуассонова структура использована в работе [42] для изучения согласованной скобки в цепочках Тоды на полупростых алгебрах Вп. Возникающая в этом случае скобка, полученная из квад- ратичной, оказалась дробно-рациональной. Вопрос о возможности приведения трансверсальной пуассоновой структуры к наиболее простому виду вблизи особой точки (в частнос- ти линеаризация) рассматривался в работах [47, 36]. В [47] приведены примеры нелинеаризуемых пуассоновых структур вблизи сингулярных орбит алгебры Ли. В [42] указаны условия на алгебру Ли и ее сингу- лярные орбиты, при которых трансверсальная пуассонова структура может быть приведена к неоднородному квадратичному виду. 11. Вырожденные лагранжианы и гамильтонов форма- лизм со связями. Введение рассмотренных дифференциально-гео- метрических конструкций в динамику может быть мотивировано проб- лемой перехода от лагранжева формализма к гамильтонову в случае вырожденности лагранжиана по скоростям. Именно из этой постанов- ки исходил П. Дирак, развивая обобщенную гамильтонову механику для целей последующего квантования [14, 45]. Пусть задана лагранжева система dt\dqJ dq '
Скобки Дирака в геометрии и механике 209 с вырожденной по скоростям функцией Лагранжа, т. е. d2L det дщдт = 0. A1.2) В этом случае уравнения A1.1) не могут быть разрешены отно- сительно старших производных, а стало быть, вопрос о нахождении решений при произвольных начальных условиях не является вполне корректным. Оказывается, что более естественным является рассмот- рение системы A1.1) в канонических переменных. Рецепт их введения, обобщающий преобразование Лежандра в невырожденном случае, так- же был предложен Дираком. Если обычным образом ввести канонические импульсы Pi = j?, г = 1,...,п, A1.3) то вследствие A1.2) при обращении A1.3) можно выразить лишь часть скоростей qi = Vi(p,q,Pi,---,Qs), i = s+l, ... ,п. A1.4) Оставшиеся уравнения задают соотношения между р, q, определяющие подмногообразие N={p, q:<pj(p,q)= 0, j = 1, ... , a, } A1.5) (первичные связи по Дираку). Функция Гамильтона H=pq-L A1.6) при учете A1.4) и A1.5) зависит только от координат и импульсов [45]. С учетом того, что вариации 8р и Sq подчиняются условию A1.5) и пользуясь вариационным принципом Гамильтона, уравнения движения можно представить в виде q, p, n, j = 1, ... , s.
210 А. В. Борисов, И. С. Мамаев Неопределенные множители А; находятся из условия сохранения связей A1.5) потоком системы A1.7): j{Vj, Vj} = 0, j = l,..., a. A1.8) Правые части A1.7) могут быть более просто записаны с исполь- зованием скобки Дирака Pi = {Pi, H}d, 4i = {<й, Щ. (П.9) В зависимости от заданного лагранжиана L при решении уравне- ний A1.8) могут встретиться различные ситуации. 1) Системы A1.7), A1.8) несовместны в любой точке фазового про- странства (р, q). В этом случае уравнения A1.7) не допускают решения при произвольных начальных условиях. В качестве при- мера можно рассмотреть систему с лагранжианом L = q. 2) Система A1.8) имеет единственное решение (det||{y>j, <pj}\\ ф 0) (достаточно единственности на подмногообразии N). При этом подмногообразие N является пуассоновым относительно скобки Дирака, а система A1.7) гамильтонова х = {х, H}d с функци- ей Гамильтона A1.6). Для всякой начальной точки на N систе- ма A1.9) допускает решение p(t), q(t), причем q(t) удовлетворяет также уравнениям Лагранжа A1.1). 3) Система A1.8) допускает бесконечно много решений \k(p, q). Это возможно лишь при условии det ||{у», <Pj}\\ = 0. В данном слу- чае гамильтоново описание векторного поля, определяемое систе- мой A1.1), на совместной поверхности уровня A1.5) невозмож- но. Среди связей необходимо выбрать <pi(x), г = 1, ... , 2к, для которых матрица скобок Пуассона невырождена, а коэффициен- ты \i(p, q), i = 1, ... , 2fc, определяются однозначно. Остальные связи <pj(x), j = 2k, ... , s, будут являться интегралами движе- ния получившегося поля, значения которых однозначно находят- ся из системы A1.3). Решения полученной системы p(t), q(t) при подстановке q(t) также удовлетворяют исходной лагранжевой сис- теме A1.1).
Скобки Дирака в геометрии и механике 211 4) Система A1.8) непротиворечива на некотором подмногообразии меньшей размерности, чем на многообразии A1.5). В этом случае появляются дополнительные связи (вторичные связи по Дираку). Рассматривая уже полный набор связей, приходим к одной из си- туаций 2) или 3). В связи с тем, что вторичные связи появляются как условия разрешимости системы A1.8), они не приведут к до- полнительным неопределенным множителям А^ и не сказываются на уравнениях движения A1.7). 12. Голономные связи. Сравнение с классическим описа- нием. Описанная выше процедура отличается от классического га- мильтонова формализма для системы с голономными связями в избы- точных переменных [4]. Покажем, что обе эти конструкции приводят к одним и тем же уравнениям движения для позиционных перемен- ных. Выбор того или иного описания различных задач определяется, как правило, дополнительными соображениями. Рассмотрим лагранжеву систему в М3 L=\q1-U(q) A2.1) со связью f(q) = О (все результаты могут быть перенесены на слу- чай W1 и нескольких связей). Уравнения движения A2.1) можно представить в форме q = X A22) В классической схеме избыточного гамильтонова формализма [4] сис- тема A2.2) описывается уравнениями Гамильтона с гамильтонианом Н = =-(р х пJ + U(q), где п = —у- — единич- 1 \fq\ ный вектор нормали к поверхности f(q) = 0. Функция f(q) является первым интегралом уравнений {/, Н} = 0. Канонические импульсы р не касаются поверхности f(q), тем не менее скорости, определяемые соотношениями A2.3) q = р — (р, п)п, направлены по касательной.
212 А. В. Борисов, И. С. Мамаев Дифференцированием q уравнения A2.3) могут быть приведены к ви- ДУ A2.2). Выполним теперь преобразование Лежандра к каноническим пере- менным р, q без учета связи H=ip2 + U(q). A2.4) Действуя по методу Дирака, дополним связь /(д) = 0 условием ее со- хранения / = {/, Я} = g(p, q) = (р, ||) = 0. Для функций /, g всегда выполнено Чтобы избежать вычисления скобки Дирака, векторное поле на по- верхности / = 0, g = 0 найдем с помощью неопределенных множите- лей Ц, V ОН df dg df Op Op Op Oq Oq Oq Oq Л Из условий равенства нулю производных /, g вдоль решений A2.5) находим v = 0. Полагая ц = Л, находим, что система A2.5) также эквивалентна A2.2). Таким образом, в классическом варианте гамильтонова формализ- ма скобка остается канонической и меняется функция Гамильтона. В подходе Дирака, наоборот, меняется скобка, так что связи становят- ся функциями Казимира, а гамильтониан остается прежним (без учета связи).
Скобки Дирака в геометрии и механике 213 13. Динамика малых масс. В предыдущем разделе была по- казана возможность применения процедуры Дирака для описания ла- гранжевых (или гамильтоновых) динамических систем с голономными связями. С физической точки зрения системы со связями могут рас- сматриваться как предельные задачи для свободных систем. Различные способы задания предельных переходов связаны с различными способа- ми реализации связей [4]. Так голономная механика получается при надлежащем переходе в потенциальной функции, неголономная механика — в силах вязко- го трения (функция Релея). Механика Дирака на физическом уровне может быть интерпретирована как механика малых масс, когда пре- дельный переход происходит в кинетической энергии — некоторые из инерционных характеристик стремятся к нулю. При этом он не затра- гивает потенциала, и в этом смысле механика Дирака является меха- никой малых масс. Более подробное обсуждение содержится в п. 16, 17, здесь мы ограничимся одним примером. Рассмотрим систему двух частиц в трехмерном пространстве с функцией Лагранжа L = \{ql + eq\) + {A(q2), q2) - U{qu q2). A3.1) Уравнения движения имеют вид п - dU A3.2) eh = B(q2) x q2 - f^, В = rot A. oq2 Если масса второй частицы стремится к нулю (е —> 0), то функция Лагранжа оказывается вырожденной по q2, а в уравнениях движения пропадает ускорение q'i. Уравнения A3.2) при г = 0 разрешимы лишь при условии Мя) = (в(ъ), f^)=°- A3-3) Определяя канонические импульсы р = -р-г dq Pi = Qi, P2 = A(q2), A3.4)
214 А. В. Борисов, И. С. Мамаев получим, что условия разрешимости относительно q2 эквивалентны связям: <р(р, q) = P2i ~ Ai(q2), i = 1,2,3. A3.5) Функция Гамильтона не зависит от р2: H=\p\ + U{quq2), A3.6) а уравнения движения с неопределенными множителями примут вид Условие сохранения связи может быть представлено в виде х Л - |^ = 0. A3.8) Oq Условие его разрешимости (вторичная связь) совпадает с A3.3). В общем случае матрица ||{у», fj}\\ невырождена, поэтому с помощью скобки Дирака A3.2) на поверхности уровня ifi = 0, i = 0, ... , 3, по- лучим непротиворечивые уравнения движения, допускающие единст- венное решение p(t), q(t). (q(t) удовлетворяет также уравнению A3.2) при е = 0). Замечание 8. Уравнения A3.8) допускают произвол в определении А: А' = А + /(р, q)B(q2), который тем не менее не сказывается на вектор- ном поле A3.7), определенном на поверхности уровня связей ipi(p, q) = 0, i = 0, ... , 3. Если магнитное поле постоянно В = rot A = const, и энергия взаимодействия зависит лишь от взаимного расстояния г = \qi — <7г|) то уравнения A3.2) при г = 0 допускают гамильтоново описание с невырожденной скобкой.
Скобки Дирака в геометрии и механике 215 Выберем ось 0Z вдоль поля, из A3.2) находим z\(t) = z2(t) = at+b, a, b = const. Проекция движения частиц на плоскость XY описывается уравнениями _ dU(s) .. _ dU(s) дхх 1 дух ' dU(s) . 1 8U (а) A3.9) s = \J{xx - х2J + (г/i - г/2J- Уравнения A3.9) гамильтоновы относительно скобки Пуассона {xi,px} = {yi,Py} = l, {г/2, Х2} = -g, с функцией Гамильтона Замечание 9. Переход от гамильтоновой системы со связями к экви- валентной (вырожденной) лагранжевой системе возможен в случае разреши- мости системы *-<fc+i>to' A3.io) fi{p, Я) = 0, i = l, ... ,n, j = 1, ... , а, относительно неизвестных р, А. При этом функция Лагранжа находится обыч- ным преобразованием Лежандра — L = pq — Н. Несложно проверить, что для указанного примера двух частиц это преобразование приводит к исход- ному лагранжиану A3.1). В общем случае система A3.10) не допускает ре- шения (аналогично случаю неголономных систем, не допускающих гамиль- тонова представления). 14. Дополнительные возможности. 1. Приведем специальный случай редукции Дирака, использован- ный Мозером [23, 41] для получения новых интегрируемых случаев из уже известных. Скобка Дирака (8.3) возникает у Мозера самостоятель- но и ссылки на Дирака у него нет.
216 А. В. Борисов, И. С. Мамаев Допустим, что связи A3.10) могут быть разбиты на две группы Л(ж), ... , fk(x), g!(x), ... , gk(x) так, что f^x), ... , fk{x) и гамильто- ниан Н(х) входят в инволютивный набор функций на многообразии G. Несложно проверить, что любая функция из G также является интег- ралом движения для векторного поля, полученного из исходного с помо- щью редукции Дирака. Эти интегралы находятся в инволюции также и относительно скобки Дирака (8.3). Таким образом было получено n-мерное обобщение (на Sn) класси- ческой интегрируемой задачи Неймана из интегрируемого потока в ев- клидовом пространстве Еп [23, 41]. 2. Редукция по симметриям также может быть интерпретирована в терминах редукции Дирака. Действительно, пусть нам удалось про- интегрировать векторные поля, соответствующие первым интегралам системы Xi = {x,Fi}, i = l,...,k, которые для простоты будем считать инволютивными {Fi, Fj} = 0. Координаты вдоль соответствующих потоков обозначим т». Выбирая в качестве связей функции F\{x), ... , Fu(x), т\(х), ... , Тк(х), с помо- щью скобки Дирака получим редуцированную систему (ранг которой упал на 2к) в точности эквивалентную приведенной системе при стан- дартной редукции по симметриям (редукции по моменту см. [10]). 15. Предельные переходы в общем случае. Рассмотрим го- лономную систему с функцией Лагранжа LE = L0(q, q, Q) + -f- + sL^q, q, Q, s), A5.1) где e — малый параметр. При е = 0 получается вырожденная по Q система. Следуя § 9 гл. 1, получим связи и гамильтоновы уравнения движения. Первичной связью будет служить Р = 8L = 0. е=0 dQ Вторичная связь получается из условия совместности {Р, Яо} = -^=0, A5.2) где Н0(р, q,Q) = pq - Lo
Скобки Дирака в геометрии и механике 217 Пусть Q = f(p, q) — решение уравнения A5.2). Это дает воз- можность вторичную связь представить в виде уравнения Ф = Q — - f(q, Р) = 0, причем {Р, Ф} = -1 ф 0. Используем форму уравнений с неопределенным множителем. Га- мильтониан Н является суммой Нц-\- ХР + n(Q — /), а коэффициенты А, ц однозначно находятся из условий совместности {Р, #} = {Р, Но}-ii = 0, {Q - /, Я} = -{/, Но} - А = 0. Таким образом, Уравнения Гамильтона со связями примут вид Р Oq ' Q dp' A5.3) р = о, Q = f, где Н0(р, q) = Н0(р, q, Q) \Q=f. Обоснованность механики Дирака вытекает из следующих рассуж- дений. Если функцию Гамильтона полной системы (е ф 0) обозначить через Н, то H = H0(p,q)+P^+eH1(p,q,Q,e). Соответствующие канонические уравнения будут дН0 дНг . дН0 Р = ?1 = ! dQ 8Q' Ч~ Решением A5.4) служат формальные ряды Р = Po(t) + epi(t) + ¦ ¦ ¦ , q да да dp dp A5.4) дН, д_р 8 Ч = f(Po(t),9>(t))+eQ1(t) + ---, [ '
218 А. В. Борисов, И. С. Мамаев где Po(t), qo(t) удовлетворяют уравнениям A5.3). Эти ряды не всегда сходятся. Но в случае, если для начальных данных выполнено усло- вие dHo/dQ = О, определяющее вторичную связь, уравнения A5.4) пе- рестают быть сингулярными, ряды будут сходиться, а вместо им- пульса Р следует взять новую переменную Р/е. Случай, когда усло- вие ° = 0 выполнено тождественно, является особым. (При этом Р является интегралом системы при е = 0). Уравнения A5.5) описывают в этом случае решение для Р/е и Q, которые не удовлетворяют A5.3) и вообще каким-либо гамильтоновым уравнениям (при этом, как прави- отт ло, * = 0). Эта ситуация соответствует так называемым ограничен- ным задачам типа ограниченной задачи трех тел в небесной механике. Рассмотрим две задачи динамики твердого тела, в которых произ- водится предельный переход в инерционных характеристиках твердо- го тела двумя различными способами. В одном случае он эквивалентен наложению связей в фазовом пространстве и дает возможность исполь- зовать процедуру Дирака. При этом как первоначальная скобка, так и скобка Дирака, являются вырожденными. В другом — предельная сис- тема не может быть получена при помощи процедуры Дирака и априори является негамильтоновой. Она носит название ограниченной задачи динамики твердого тела (по аналогии с небесной механикой) и была введена в [21]. Корректность обсуждаемого предельного перехода рас- сматривается также в [13]. 16. Предельные переходы в уравнениях Эйлера —Пуассо- на. Уравнения движения твердого тела с неподвижной точкой в ла- гранжевом виде можно записать в виде уравнений Пуанкаре на груп- пе 50C) (см. [10]) dt дш дш d~f A6.1) лагранжиан задачи в случае осесимметричного твердого тела можно представить в форме L= ±(ш1 + lj% + eul) - х1х - zl3, A6.2)
Скобки Дирака в геометрии и механике 219 где е характеризует отношение моментов инерции осесимметричного тензора инерции, (ж, 0, z) — координаты центра масс. При е —> 0 (об- основание возможности придать механический смысл этому предельно- му переходу см. в [22]) обычный переход от уравнений Пуанкаре A6.1) к уравнениям Пуанкаре-Четаева с помощью преобразования Лежандра теряет смысл и получается «первичная» связь 0L Мя = = 0. е=0 Введем функцию Гамильтона, выраженную через Mi = 75-=-, 0Ш1 При этом скобка Пуассона определяется алгеброй еC). Полагая Н* = = Н + ХМ3, получим условие совместности М3 = {М3,Н*} = -xj2 = 0 A6.3) и вторичную связь 72 = 0. Определим новый гамильтониан Н* = Н + АМз + М72- Из условия совместности связей М3 = {М3, Я} = 0, 72 = {72, Щ = 0, получим А = М173/715 V- = 0 (как отмечалось в §9 гл. 1, вторичная связь не сказывается на уравнениях движения). Можно составить урав- нения движения, пользуясь скобкой Дирака, вычисленной по форму- ле (8.3) и гамильтонианом Н M2}D = M1^, {Ми M3}D = -2М2, {М2, M3}D = 2МЬ 71}^ = 0, {Мь 72JD = 273, {Мь 73}D = 0, {M2, 7i}d = -73, {M2, 72}d = 0, {M2, 7з}?, = 71, {M3, 7i}?> = 0, {M3, 72}d = -27i, {M3, 73}d = 0, {jh 7j}d = 0, A6-4)
220 А. В. Борисов, И. С. Мамаев или, записывая уравнения движения на алгебре еC) с функцией Га- мильтона Н. В обоих случаях получим систему 7i = -73-М2, 7з = - имеющей, кроме интеграла энергии и связей, геометрический интеграл и интеграл площадей 722 + 7| = 1, М171 = С. A6.6) Из A6.6) вытекает, что 71 = sin#, 73 = cos# и поэтому в = —М^- Выражая М\ = С/71, получим уравнение для в: в = -Цр- cos в + х cos 6» - z sin 6», A6.7) sin3 в которое можно записать в лагранжевой (гамильтоновой) форме с одной степенью свободы: Система A6.8) эквивалентна приведенной системе для сферического маятника в осесимметричном поле U = — a:sin# — zcosd. Качествен- ный анализ решения A6.7) содержится в [22], где разобранная задача и редукция Дирака рассматриваются в канонических переменных. При х = 0 в A6.3) задача Дирака имеет бесконечное множество решений (А произвольно). В этом случае Мз — первый интеграл, по- этому редукция Дирака должна быть заменена редукцией по симмет- риям. Однако, если произвести предельный переход непосредственно в лагранжевой форме A6.1), предположив, что L= ^{uj\ + uj\ + еш\) - ел-zja A6.9) и е —> 0, получим уравнения «ограниченной задачи динамики твердо- го тела». Физический смысл предельного перехода и геометрическая
Скобки Дирака в геометрии и механике 221 интерпретация движения в этой задаче обсуждаются в [15, 21]. l + Z-J2, 7 = 7 х <*>¦ Уравнения A6.10) при z = 0 исследованы в [21], где методом расщепле- ния сепаратрис показана их неинтегрируемость, в [9] приведены кар- тинки стохастического поведения. 17. Случай вырожденного гамильтониана. Уже неодно- кратно отмечалось, что механику Дирака можно использовать для га- мильтонова описания вырожденных лагранжевых систем. Рассмотрим, в некотором смысле, взаимную задачу о лагранжевом описании вырож- денной гамильтоновой системы. Пусть для гамильтоновой системы на кокасательном расслое- нии Т*М функция Гамильтона вырождена по импульсам, т. е. det д2н A7.2) При каких условиях система A7.1) допускает лагранжево описание, а закон движения q(t) может быть получен при помощи вариационного принципа? Ответ на этот вопрос содержится в работах [18]. Изложим основные результаты, следуя [4]. Для перехода к обобщенным координатам и скоростям необходимо разрешить первое из уравнений A7.1) относительно импульсов. В си- лу уравнения A7.2) это возможно лишь при дополнительных условиях (связях) fi(q,q)=...=fk(q,q)=O, k < п. A7.3)
222 А. В. Борисов, И. С. Мамаев Замечание 10. Уравнения A7.3) являются следствием того, что функ- ции ft(q, -q—J при заданном гамильтониане Н обращаются тождественно в нуль. Выполняя преобразования Лежандра L = pq-H(p,q) , A7.4) Р, получим функцию Лагранжа, определенную на подмногообразии в ТМ, высекаемом уравнениями связей A7.3). Теорема ([4]). Функции (q(t), p(t)): \t\, t2] >-> T*M являются ре- шением гамилыпоновой системы A7.1) тогда и только тогда, когда путь q(t): [ti, ?2] ^ М является экстремалью функционала S = j L(q, q)dt ti в классе кривых с закрепленными концами, удовлетворяющих уравнени- ям A7.3). Уравнения движения могут быть получены методом множителей к Лагранжа. Варьируя функцию SB = L — ^ А;/; по q и А, находим г=1 А(<№\ _ <№. = A(dL\ _ 9L_ ТГ\\ (А®1±\ _ \ Ml =п dt\dq) 8q dAdq) 8q f^Vl\dtdq) l 8q\ A7.5) Для интегрируемых (голономных) связей gi(q) = 0, г = 1, ... , к, уравнения которых также можно представить в форме fi{q, q) = = gi(q) = -jr^Q = 0, система A7.5) приводится к виду d dL dL где ц1 =
Скобки Дирака в геометрии и механике 223 Уравнения A7.6) в случае неинтегрируемых связей /,(<?, q) = О совпадает с классическим уравнением Рауса неголономной механики. Они могут быть получены из условия идеальности связей и принципа Даламбера-Лагранжа. Однако для неинтегрируемых связей их нельзя вывести из вариационного принципа Лагранжа. Этот факт давно из- вестен в неголономной механике [28]. Обсуждение связанных с этой проблемой вопросов содержится, например, в [19, 10]. С точки зрения реализации связей уравнения A7.6) могут быть получены из свободной системы, находящейся под действием линейных по скоростям диссипа- тивных сил (вязкое трение) с помощью предельного перехода, при кото- ром коэффициенты вязкости в диссипативной функции Релея устрем- ляются к бесконечности некоторым согласованным (анизотропным) об- разом. Этот факт был отмечен еще Каратеодори [34], и в некотором смысле дает обоснование корректности описания при помощи уравне- ний A7.6) динамических систем, в которых присутствуют качения без проскальзывания (именно такие системы и рассматриваются в неголо- номной механике). Физический смысл уравнений A7.5) был прояснен в работах [18] и привел к вакономной модели механики с неинтегрируемыми связями. Движения, описываемые A7.5), являются предельными для лагранже- вых систем, инерционные (массовые) характеристики которых (в фор- ме кинетической энергии) устремляются к бесконечности также согла- сованным анизотропным образом. Такая реализация возможна при рас- смотрении систем, движущихся в идеальной жидкости. Например, если в уравнениях Кирхгофа, описывающих движение тяжелого твердого те- ла в безграничном объеме идеальной несжимаемой жидкости [32], при- соединенные массы и моменты (обусловленные инерционностью жид- кости) устремить к бесконечности некоторым определенным образом, то можно получить уравнения плоского движения пластинки, для ко- торой выполняется неинтегрируемая связь, состоящая в том, что про- екции скорости центра масс на ось, перпендикулярную к пластинке, равняется нулю. В неголономной постановке аналогичная задача носит название конька Чаплыгина [33]. При одинаковой связи решения вако- номных A7.5) и неголономных уравнений отличаются друг от друга. Если в неголономном случае средняя высота постоянна, а движение происходит по циклоиде, то в вакономном случае получается более ре- алистическое описание падения пластинки в жидкости. Для него почти все движения стремятся к равномерному падению пластинки широкой
224 А. В. Борисов, И. С. Мамаев стороной вперед. При этом частота малых колебаний пластинки отно- сительно этого устойчивого положения равновесия возрастает [20]. В некоторых учебниках, например в [24], не делается различия между вакономными и неголономными уравнениями, и задачи о паде- нии тел в жидкости изучаются в неголономной постановке (например, падение круглого диска). Эти результаты вряд ли имеют значение для механики. В книге [12] вообще классические задачи неголономной механики о качении разбираются с использованием вакономных уравнений, ко- торые автор наивно постулирует, исходя из вариационного принципа Лагранжа. Естественно, что эти результаты также не имеют механи- ческого содержания. Следует, однако, отметить, что по сравнению с не- голономной механикой количество содержательных примеров из вако- номной механики очень мало. Отметим некоторые проблемы, которые ограничивают применимость уравнений A7.5). Для уравнений A7.5) в случае неголономных связей наличие допол- нительных слагаемых V А, ( — -?¦ —^ ) приводит к тому, что для их i=i \dt aq aq J решения, помимо начальных положений и скоростей q@) и q@) (удов- летворяющих условиям связи), необходимо также задавать начальные значения множителей Лагранжа. Физический смысл этих начальных данных, связанный с различными способами реализации связей обсуж- дается в [18]. В общем случае это приводит к тому, что решения урав- нений A7.5) не удовлетворяют принципу детерминированности, а сам подход содержит скрытые (ненаблюдаемые) параметры. Для натуральной вырожденной гамильтоновой системы рассмот- рим более подробно связь решений с принципом детерминирован- ности, согласно которому движение q(t) во все моменты времени t ? (—ос, +ос) полностью определяется начальными положениями q@) и скоростями q@). Пусть 1 H=±(p,A(q)p)+U(q), A7.7) где А — (пх п)-матрица, для которой det A = 0. Условия разрешимос- ти A7.3) в этом случае линейны по скоростям Ш,я) = Ыд),я)=0, г = 1,...,к, A7.8) здесь ai(q) — собственные векторы A(q), соответствующие нулевым собственным значениям. Пространство T*Mq при этом расслаивается
Скобки Дирака в геометрии и механике 225 на гиперплоскости Fq(q), для каждой точки которых р ? Г9(д) отобра- жение q = ^jf- = a(q)p (i7-9) приводит к одной и той же скорости q. Предложение ([4]). Для всех начальных условий qo = q@), qo = q@) = Apo, удовлетворяющих уравнениям A7.8), движение q(t, qo, Po) не зависит от выбора импульса ро ? Fqo(qo) тогда и только тогда, когда связи A7.6) интегрируемы. Следовательно, гамильтонова система A7.7), для которой уравне- ния A7.8) неинтегрируемы, не подчиняется принципу детерминирован- ности. Обобщение принципа детерминированности для вакономных сис- тем содержится в [18]. Рассмотрим ряд простых примеров систем с вырожденным га- мильтонианом. 18. Примеры, а. Гамильтонов формализм со связями. Рассмот- рим задачу о движении частицы в Жп+1 по поверхности сферы Sn, за- данной уравнением /(«) = Q02 + <7i2 + • • • + Яп2 ~ R2 = 0. A8.1) Функция Лагранжа в избыточных переменных может быть пред- ставлена в форме L=\q2-U(q). A8.2) Перейдем к гамильтонову формализму в избыточных переменных. Введем канонические импульсы по формуле Неопределенный множитель Лагранжа А найдем из условия свя- A8.4) зи A8.1): А = —'——. Функция Гамильтона имеет вид
226 А. В. Борисов, И. С. Мамаев Легко видеть, что вектор, нормальный к поверхности A8.1), явля- дн ется собственным вектором с нулевым собственным значе- нием, поэтому функция Гамильтона вырождена. Для канонических уравнений движения dp' dq с функцией A8.4) справедливо тождество (<?, Я) = О- A8.5) A8.6) В силу интегрируемости связи A8.6) для решения уравнений дви- жения A8.5) подчиняются принципу детерминированности (см. пред- ложение) и не зависят от величины проекции начального импульса на нормаль к поверхности A8.1). Этот пример легко обобщается на произ- вольное число голономных связей. Ь. Системы, получающиеся при гамильтонизации произвольной системы дифференциальных уравнений по методу Лиувилля (которую также часто использует Дирак — некоторые авторы даже приписывают ее Дираку) также оказываются вырожденными. Действительно, произвольная система х = v(x) эквивалентна гамильтоновой системе удвоенной размерности дН . дН х = у = где Я = (v(x), у). A8.7) A8.8) A8.9) В этом случае д2н = 0, следовательно, система A8.9) оказы- вается примером гамильтоновой системы, не допускающей лагранжево описание. Авторы выражают благодарность В.В.Козлову и В.П.Павлову за полезные консультации при написании работы.
Литература 227 Литература [1] Арнольд В. И. Гамилыпоновостъ уравнений Эйлера динамики твер- дого тела и идеальной жидкости. Усп. мат. наук., т. 24, 1969, №3, с. 225-226. [2] Арнольд В. И. Математические методы классической механики. М.: Наука, 1991. [3] Арнольд В. И., Гивенталь А. Б. Симплектическая геометрия. Итоги науки и техники. Совр. проблемы математики. Фундаментальные направления, т. 4, с. 5-140. М.: ВИНИТИ, 1985. [4] Арнольд В. И., Козлов В. В., НейштадтА.И. Математические ас- пекты классической и небесной механики. Итоги науки и техни- ки. Совр. проблемы математики. Фундаментальные направления, том 3, М.: ВИНИТИ, 1985. [5] Архангельский Ю. А. Аналитическая динамика твердого тела. М.: Наука, 1977. [6] БарутА., Рончка Р. Теория представлений групп и ее приложения. том 1,2. М.: Мир, 1980. Пер. с англ. BarutA. RaczkaR. Theory of Group Representations and Applications. PWN. Polish Scientific Publishers, 1977. [7] Богоявленский О. И. Методы качественной теории динамических систем в астрофизике и газовой динамике. М.: Наука, 1980. [8] Богоявленский О. И. Опрокидывающиеся солитоны. Нелинейные ин- тегрируемые уравнения. М.: Наука, 1991. [9] Борисов А. В., Емельянов К. В. Неинтегрируемость и стохастич- ность в динамике твердого тела. Ижевск, Изд-во Удм. ун-та, 1995. [10] Борисов А. В., Мамаев И. С. Пуассоновы структуры и алгебры Ли в гамильтоновой механике. Ижевск, Изд-во РХД, 1999. [11] ВаксманЛ. Л., СойбельманЯ. С. Алгебра функций на квантовой группе sl{2). Функ. ан. и его прил., т. 22, 1988, №3, с. 1-14. [12] ГриффитсП.А. Внешние дифференциальные системы и вариацион- ное исчисление, М.: Мир, 1986.
228 А. В. Борисов, И. С. Мамаев [13] Дерябин М. В. О гамилътоновом формализме Дирака и реализации связей малыми массами. ПММ, т. 64, вып. 1, 2000, с. 41-45. [14] Дирак П. А. М. Обобщенная гамилътонова динамика. (См. с. 76-102 наст, сб.) [15] ДовбышС.А. Геометрическая интерпретация ограниченной по- становки задачи о движении динамически симметричного тяжело- го твердого тела с неподвижной точкой. Сб. научн. метод, статей по теор. механике, М.: МГТУ, 1996, с. 130-135. [16] Дубровин Б. А., Новиков С. П., Фоменко А. Т. Современная геомет- рия. Методы и приложения, том 1,2. М.: Эдиториал УРСС, 1998. [17] Козлов В. В. Методы качественного анализа в динамике твердого тела. М.: МГУ, 1980. [18] Козлов В. В. Динамика систем с неинтегрируемыми связями, Вестн. МГУ, сер. мат. мех. 1982, №3, с. 92-100; 1982, №4, с. 70-76; 1983, №3, с. 102-114. [19] Козлов В. В. К теории интегрирования уравнений неголономной ме- ханики. Успехи механики, т. 8, 1985, №3, с. 85-101. [20] Козлов В. В. О падении тяжелого твердого тела в идеальной жид- кости. Изв. АН СССР, Мех. тв. тела, 1989, №5, с. 10-17. [21] Козлов В. В., ТрещевД. В. Неинтегрируемость общей задачи о вра- щении динамически симметричного тяжелого твердого тела с не- подвижной точкой. П. Вестник МГУ, сер. мат. мех., 1986, №1, с. 39-44. [22] Козлова 3. П. Об одной предельной задаче динамики твердого тела с неподвижной точкой. Под ред. В.В.Козлова и А.Т.Фоменко. Гео- метрия, дифференциальные уравнения и механика, М.: МГУ, 1986, с. 78-84. [23] МозерЮ. Некоторые аспекты интегрируемых гамилътоновых сис- тем. Усп. мат. наук, т. 36, 1981, №5, с. 109-144. [24] НеймаркЮ.И., ФуфаевН. А. Динамика неголономных систем, М.: Наука, 1967.
Литература 229 [25] Новиков С. П. Гамилътонов формализм и многозначный аналог те- ории Морса. Усп. мат. наук, т. 37, 1982, №5 B27), с. 3-49. [26] ОлверП. Приложения групп Ли к дифференциальным уравнениям. М.: Мир, 1989. Пер. с англ. OlverP. Applications of Lie Groups to Differential Equations. Springer, 1986. [27] Склянин Е. К. О некоторых алгебраических структурах, связанных с уравнениями Янга-Бакстера. Функ. ан. и его прил., т. 16, 1982, № 4, с. 27-34. [28] Суслов Г. К. Теоретическая механика, М.-Л., 1946. [29] Трофимов В. В., Фоменко А. Т. Алгебра и геометрия интегрируемых гамилътоновых дифференциальных уравнений. Изд-во «Факториал», Удм. ун-т, 1995. [30] Фоменко А. Т. Дифференциальная геометрия и топология. Дополни- тельные главы. М.: МГУ, 1983. [31] Фоменко А. Т. Симплектическая геометрия. М.: МГУ, 1988. [32] Чаплыгин С. А. О движении тяжелых тел в несжимаемой жидкос- ти. Собр. сочинен., т. 1, ОГИЗ, М.-Л., 1948, с. 312-336. [33] Чаплыгин С. А. О принципе последнего множителя. Собр. сочинен., т. 1, ОГИЗ, М.-Л., 1948, с. 5-14. [34] CaratheodoryC. Der Schlitten, ZAMM, 1933, v. 13, S. 71-76. [35] CasimirH. B. G. Rotation of a Rigid Body in Quantum Mechanics. PhD thesis, J.B. Wolters' Uitgevers-Maatschappij, M.V.Groningen, den Haag, Batavia, 1931. Thesis. [36] Conn J. Linearization of Analitic Poisson Structures. Anuals of Math., 1984, v. 119, p. 577-601. [37] DiracP. A.M. Generalisated Hamiltonian Dinamics. Canadian Jour- nal of Math., v. 2, №2, 1950, p. 129-148. (Русский пер. с. 76-102 наст, сб.) [38] DufourJ.-P., HarakiA. Rotationnels et structures de Poisson quadratiques. C.R.Acad. Sci. Paris, v. 312, Ser. 1, 1991, p. 137-140.
230 А. В. Борисов, И. С. Мамаев [39] LieS. Theorie der Transformationgruppen. V. Bd 1. Teubner, Leipzig, 1888. [40] MarsdenJ.E., WeinsteinA. Coadjoint orbits, vortices, and Clebsch variables for incompressible fluids. Physica D, v. 7, 1983, p. 305-332. [41] MoserJ. Three integrable Hamiltonial systems connected with isospectral deformations. Advan. Math., v. 16, 1975, p. 197-220. [42] OhY.-G. Some Remarks on the Transverse Poisson Structures of Coadjoint Orbits. Lett, in Math. Phys., 1986, №12, p. 87-91. [43] PoincareH. Sur la precession des corps deformables. Bull. Astr., v. 27, 1910, p. 321-356. [44] SattingerD.H., Weaver O.L. Lie Groups and Algebras with Applications to Physics, Geometry and Mechanics. Springer - Verlag, 1986. [45] SouriauJ.M. Structure des systemes dynamiques. Dunod, Paris, 1970. [46] WeinsteinA. The local structure of Poisson manifolds. J. Diff. Geom., v. 18, 1983, p. 523-557. [47] WeinsteinA. Poisson structures and Lie algebras. Proc. Conf. Math. Haritage of E. Cartan. Asterisque, hors serie, 1985. [48] YoshidaH. Necessary condition for the existence of algebraic first integrals, III. Cel. Mech., v. 31, 1983, №4, p. 363-399.
Поль Адриен Морис Дирак Лекции по теоретической физике Дизайнер М. В. Ботя Технический редактор А. В. Широбоков Компьютерный набор и верстка С. В. Высоцкий Корректор О. Ю. Кучеренко Подписано в печать 16.01.01. Формат 60 х 84У16. Печать офсетная. Усл. печ. л. 13,95. Уч. изд. л. 14,21. Гарнитура Computer Modern Roman. Бумага офсетная № 1. Тираж 1000 экз. Заказ № Научно-издательский центр «Регулярная и хаотическая динамика» 426057, г. Ижевск, ул. Пастухова, 13. Лицензия на издательскую деятельность ЛУ №084 от 03.04.00. http://rcd.ru E-mail: borisov@uni.udni.ru