/
Автор: Гальцов Д.В.
Теги: физика математическая физика теоретическая физика
ISBN: 5-211-04511-4
Год: 2003
Текст
Д. В. Гальцов
ТЕОРЕТИЧЕСКАЯ
ФИЗИКА
для
СТУДЕНТОВ-
МАТЕМАТИКОВ
Рекомендовано УМС по физике У МО
по классическому университетскому образованию
в качестве учебного пособия
для студентов физических и математических
специальностей университетов
Издательство
Московского университета
2003
УДК 530.1
ББК 22.31
Г 17
Рецензенты:
кафедра теоретической физики
Томского государственного университета,
профессор В. Ч. Жуковский
Гальцов Д. В.
Г 17 Теоретическая физика для студентов-математиков. —
М.: Изд-во Моск. ун-та, 2003. — 318 с.
ISBN 5-211-04511-4
Книга написана профессором МГУ им. М. В. Ломоносова
как учебное пособие по курсу физики, читаемому на IV и V
курсах отделения математики механико-математического ф-та.
В ней излагаются основы электродинамики, специальной и
общей теории относительности, квантовой механики и
статистической теории равновесных систем. В основном ее содержание
соответствует программе по физике для математических
специальностей университетов; в книгу также включены некоторые
дополнительные разделы, которые могут быть интересны
студентам, более глубоко интересующимся предметом. Книга может
быть также полезна студентам физических специальностей,
испытывающим потребность в кратком и современном изложении
основ теоретической физики.
УДК 530.1
ББК 22.31
ISBN 5-211-04511-4 © Издательство Московского
университета, 2003 г.
© Д. В. Гальцов, 2003 г.
Оглавление
Предисловие 7
Часть I. Электродинамика, специальная и общая
теория относительности
Глава 1. Электростатика 10
1.1. Закон Кулона 10
1.2. Электрическое поле 11
1.3. Электростатический потенциал 15
1.4. Энергия электрического поля 18
Глава 2. Постоянное магнитное поле 20
2.1. Закон Ампера 20
2.2. Магнитное поле 22
2.3. Вектор-потенциал 24
2.4. Работа магнитного поля при перемещении контура с током 25
2.5. Энергия магнитного поля 27
Глава 3. Переменное электромагнитное поле 28
3.1. Закон индукции Фарадея 28
3.2. Сохранение заряда и ток смещения 30
3.3. Энергия и импульс электромагнитного поля 31
3.4. Единственность решений уравнений Максвелла 34
Глава 4. Электромагнитные волны 36
4.1. Плоские волны 37
4.2. Монохроматическая плоская волна 38
4.3. Общее решение однородных уравнений Максвелла ... 40
4 Оглавление
Глава 5. Уравнения Максвелла и группа Лоренца 42
5.1. Уравнение Д'Аламбера 42
5.2. Преобразования Лоренца 45
5.3. Тензор электромагнитного поля 46
Глава 6. Специальная теория относительности 49
6.1. Принцип относительности 49
6.2. Геометрия пространства-времени 51
6.3. Кинематические эффекты СТО 52
6.4. Пространство скоростей 54
Глава 7. Релятивистская механика 57
7.1. Релятивистские уравнения движения 58
7.2. Функция Лагранжа 61
7.3. Уравнения Гамильтона и Гамильтона-Якоби 63
Глава 8. Вариационный принцип для электромагнитного
поля 66
8.1. Поле как механическая система с бесконечным числом
степеней свободы 67
8.2. Действие для электромагнитного поля 68
8.3. Тензор энергии-импульса 70
Глава 9. Электромагнитное излучение 76
9.1. Функции Грина уравнения Д'Аламбера 76
9.2. Запаздывающие потенциалы 79
9.3. Излучение 79
9.4. Радиационное трение 82
9.5. Рассеяние электромагнитных волн 87
Глава 10. Пространство-время в общей теории
относительности 90
10.1. Принцип эквивалентности 90
10.2. Векторы, тензоры, параллельный перенос, кривизна . . 95
10.3. Изометрии 99
10.4. Гравитация или инерция 101
Глава 11. Частицы и поля в искривленном
пространстве-времени 104
11.1. Движение частиц 105
11.2. Скалярное поле 109
11.3. Электродинамика в общековариантной форме 112
11.4. Струны и мембраны 114
Оглавление 5
Глава 12. Динамика гравитационного поля 119
12.1. Уравнения Эйнштейна 120
12.2. Действие для гравитационного поля 124
12.3. Линейное приближение 127
12.4. Черные дыры 130
12.5. Модели Фридмана и инфляция 135
Часть II. Квантовая механика и основы
статистической физики
Глава 13. Физические основы квантовой теории 142
13.1. Постоянная Планка. Фотон 142
13.2. Дискретность в атомной физике. Правила Вора 145
13.3. Волны де Бройля и их статистическая интерпретация . 148
Глава 14. Основные принципы 155
14.1. Состояния и наблюдаемые 155
14.2. Представления 161
14.3. Картины Гейзенберга и Шредингера 164
14.4. Одновременная измеримость и соотношение
неопределенностей 168
14.5. Предельный переход к классической механике 171
Глава 15. Одномерное движение 174
15.1. Свободная частица 174
15.2. Потенциальная яма 176
15.3. Потенциальный барьер 182
15.4. Периодический потенциал 184
15.5. Гармонический осциллятор 186
15.6. Склейка квазиклассических решений в точках поворота 193
Глава 16. Трехмерные задачи 199
16.1. Момент количества движения 199
16.2. Движение в центральном поле 203
16.3. Рассеяние 209
16.4. Кулоново поле 212
16.5. Заряд в электромагнитном поле 218
Глава 17. Теория возмущений 222
17.1. Стационарная теория возмущений 222
17.2. Квантовые переходы 228
17.3. Рассеяние в борновском приближении 232
6
Оглавление
Глава 18. Спин 234
18.1. Спин в нерелятивистской теории 234
18.2. Электрон в центральном поле 239
Глава 19. Многочастичные системы 244
19.1. Принцип Паули 244
19.2. Обменное взаимодействие 246
19.3. Периодическая система элементов 252
Глава 20. Квантовая статистика 257
20.1. Смешанные состояния 257
20.2. Энтропия и температура 260
20.3. Первое начало термодинамики 265
20.4. Каноническое распределение Гиббса 271
20.5. Большое каноническое распределение 276
Глава 21. Квантовые газы 280
21.1. Статистики Ферми, Бозе и Больцмана 280
21.2. Вырожденный ферми-газ 286
21.3. Бозе-газ при низких температурах 292
21.4. Фотоны и фононы в равновесии с веществом 294
Дополнение. Суперсимметрия и метод факторизации 301
Д.1. Суперсимметричный осциллятор 301
Д.2. Суперсимметричная квантовая механика и метод
факторизации 306
Д.З. Суперсимметрия в задаче об электроне в магнитном
поле 314
Предисловие
Книга написана на основе курса лекций, который автор на
протяжении ряда лет читает на механико-математическом факультете
Московского государственного университета им. М.В. Ломоносова для
студентов четвертого-пятого курсов. Первая часть книги включает
классическую электродинамику, специальную теорию относительности v.
элементы теории гравитации. Вторая часть содержит
нерелятивистскую квантовую механику и основы квантовой статистической
физики. Поскольку на изучение всех этих разделов теоретической
физики по существующему учебному плану отводится лишь два семестра,
возникает необходимость краткого, но достаточно полного изложения
предмета. В известной степени, сокращения объема удается достичь,
учитывая относительно более высокий уровень математической
подготовки студентов. Благодаря тому, что изложению физики на
мехмате предшествуют основательный курс теоретической механики, а
также курсы дифференциальной геометрии и функционального
анализа, нет нужды излагать многие математические вопросы, которым,
как правило, уделяется больше внимания в традиционных курсах
теоретической физики, ориентированных на студентов физических
специальностей. Кроме того, существует предназначенная для
математиков литература, в которой обсуждаются именно математические
аспекты физических теорий, в особенности это касается квантовой
механики. Разумеется, приходится отказаться и от изложения большого
числа приложений, сосредоточив внимание на принципиальных
вопросах теории. С другой стороны, поскольку чтение теоретической
физики для студентов-математиков не предваряется курсом общей физики,
автор счел целесообразным дать краткое пояснение
феноменологических основ излагаемых теорий. В частности, электродинамика
излагается в исторической последовательности, а не дедуктивно, как это
принято в большинстве учебников. Ставилась задача не только дать
изложение современных представлений в области классической теории
поля, квантовой механики и статистической физики, но и проследить
8
Оглавление
логику возникновения основных концепций этих теорий в
историческом аспекте. В книгу включены также и некоторые более
современные вопросы, такие, как динамика релятивистских струн и мембран,
суперсимметрия в квантовой механике. Обсуждаются представления о
черных дырах, а также новые идеи в космологии. Изложение ведется
на обычном для курсов физики уровне математической корректности
и не претендует на строгость математических формулировок.
Предполагается, что читатель, знакомый с теорией самосопряженных
операторов в гильбертовом пространстве, теорией обобщенных функций, а
также теорией групп и дифференциальной геометрией многообразий,
смажет самостоятельно восполнить математические пробелы.
При подготовке книги большую помощь оказали бывшие студенты
мехмата Олег Голубицкий, Евгений Дебрев, Михаил Мильченко,
Максим Ушаков, Александр Черепанов, Дмитрий Шварц, Виктор
Шувалов, Ирина Кузнецова. Автор особенно благодарен Владимиру Дяди-
чеву за помощь на заключительном этапе работы над книгой.
Часть I
Электродинамика,
специальная и общая
теория относительности
Глава 1
Электростатика
1.1. Закон Кулона
Изучение свойств электромагнитного поля мы начнем с
простейшего случая электрического поля, постоянного во времени. Лежащий в
основе теории экспериментальный факт состоит в отталкивании
(притяжении) одноименных (разноименных) покоящихся точечных
электрических зарядов по закону обратных квадратов
*■=*?, (1.1)
где gi, дг — величины зарядов, г — расстояние между ними. Эта
формула задает абсолютную величину силы, приложенной к каждому из
зарядов вдоль соединяющей их прямой. Силы равны по величине и
противоположны по направлению в соответствии с третьим законом
Ньютона. Соотношение (1.1), описанное впервые Бернулли в 1760 г.,
носит название закона Кулона. В опытах с изобретенными им
крутильными весами Кулон в конце 80-х годов XVIII в. существенно улучшил
точность электростатических измерений, что и позволило установить
зависимость (1.1) достаточно надежно.
С современной точки зрения носителями заряда являются
элементарные частицы, причем естественной единицей заряда является
заряд электрона е. Кварки (элементарные составляющие протона,
нейтрона и других сильновзаимодействующих частиц — адронов) имеют
заряд, кратный е/3, однако изолированные кварки в обычных
условиях не наблюдаемы. Все наблюдаемые заряженные частицы имеют
заряд, кратный е. В классической электродинамике также
используется представление о непрерывном распределении заряда (в объеме, на
1.2. Электрическое поле
11
поверхности или вдоль кривой), что следует понимать как результат
усреднения. Существенно, что уравнения электродинамики линейны и
допускают простое усреднение. Явное усреднение является предметом
макроскопической электродинамики сплошных сред и выходит за
рамки данного курса, однако мы часто будем использовать непрерывное
распределение заряда р(т) как феноменологическую величину.
Определением ее служит выражение для полного заряда Q в произвольно
выбранном объеме V:
Q = fp(r)dV.
v
В декартовых координатах х* = (х, у, z) элемент объема dV = d3x,
поэтому для точечного заряда е, находящегося в точке Го, следует
положить
р = е63(г-г0), (1.2)
где б3 (г) = 5{x)S(y)6(z) — трехмерная дельта-функция,
нормированная соотношением fS3^)^! = 1 (интегрирование ведется по
любой области, содержащей начало координат). Распределение заряда на
двумерной поверхности описывается с помощью одномерной дельта-
функции. Так, величина
p(r)=a(x,y)S(z) (1.3)
соответствует поверхностной плотности заряда о~{х,у) на
плоскости z = 0. Плотность заряда р(г) — X(z) 8{x) 8(у) отвечает бесконечной
заряженной нити, лежащей на оси z.
1.2. Электрическое поле
Сила (1.1), действующая на пробный заряд е, находящийся в
точке г, со стороны другого заряда q, положение которого-примем за
начало координат, мажет быть представлена в виде
F = eE, E = q^, (1.4)
где Е — напряженность электрического поля, создаваемого
зарядом q. В электростатике понятие электрического поля имеет
вспомогательный характер (сила, действующая на единичный заряд), однако
при рассмотрении движущихся зарядов представление об
электрическом поле (вместе с магнитным полем, вводимым в гл. 2) как о
самостоятельной физической величине приобретает решающее значение.
12
Глава 1. Электростатика
Получим дифференциальные уравнения для Е, исходя из
соотношения (1.4), справедливого для точечного заряда. Используя
равенство
*V - 5 (?) +5 (*) + = (?) "«"М- М
которое выполняется в смысле обобщенных функций (для его
проверки достаточно выполнить интегрирование по объему шара
произвольного радиуса с центром в начале координат, преобразуя интеграл в
левой части в поверхностный по граничной сфере с помощью
формулы Остроградского-Таусса), из (1.4) находим
div Е = 4пр, (1.6)
где р определяется формулой (1.2). Теперь мы можем обобщить
полученное уравнение на случай произвольного распределения зарядов.
Действительно, в силу линейности уравнения (1.6) поле, создаваемое
двумя точечными зарядами, описываемыми плотностями рх и р2,
равно Е = Ei + Е2, т. е. поля складываются как векторы в евклидовом
пространстве (принцип суперпозиции). Поэтому уравнение (1.6)
можно распространить как на произвольную систему точечных зарядов,
так и на случай их (усредненного) непрерывного распределения.
В дальнейшем нам встретятся более сложные полевые уравнения,
в том числе нелинейные, поэтому уместно сделать здесь следующие
общие замечания о допустимых классах функций. В классической
теории традиционным является представление о точечных частицах, для
описания которых необходимы обобщенные функции. Однако
использование обобщенных функций вообще говоря непротиворечиво лишь в
случае, если полевые уравнения линейны. Таковыми являются
уравнения электромагнитного поля, но не являются, например, уравнения
Эйнштейна в теории гравитации. Бели уравнения нелинейны, то
может возникнуть необходимость перемножения обобщенных функций
с совпадающими носителями, что плохо определено математически.
Поэтому в общей теории относительности уже не удается ввести
понятие точечной массы с помощью дельта-функции. В электродинамике
яке сингулярные функции широко используются, хотя и здесь могут
возникать проблемы, например, при вычислении собственной
электромагнитной энергии точечного заряда. Это можно связать с тем, что
полная система уравнений, описывающая данамику системы
точечных зарядов и создаваемого ими поля, уже не является линейной.
Второе независимое уравнение для электрического поля Е можно
1.2. Электрическое поле
13
получить, применяя к (1.4) операцию rot:
rotE
е*
дх
Ех
еу
ду
Еу
ez
dz
Ez
= о,
(1.7)
где ех, еу, ez — орты декартовой системы координат. Один-форма,
соответствующая ротору вектора в трехмерном пространстве, дуальна в
смысле Ходжа внешнему дифференциалу от один-формы,
отвечающей исходному вектору: rot E = *dE, E = Efdx*. Этим соотношением
удобно пользоваться при необходимости записи ротора в
произвольных координатах. Как и (1-6), уравнение (1.7) обобщается на случай
суммарного поля произвольной системы точечных зарядов либо их
непрерывного распределения.
Пусть задана произвольная замкнутая кривая без
самопересечений, которую можно представить в виде границы некоторой двумерной
поверхности. Вычислим поток вектора rotJS через эту поверхность,
преобразуя поверхностный интеграл к интегралу вдоль кривой с
помощью формулы Стокса. В результате найдем, что
/
Edl = 0
(1.8)
вдоль любой замкнутой кривой. Это соотношение означает равенство
нулю работы при перемещении заряда вдоль замкнутого пути или,
что эквивалентно, независимость работы при перемещении заряда из
одной точки в другую от формы пути.
Рассмотрим некоторую систему зарядов, описываемую
плотностью р(г). Выберем произвольную компактную область V с
ориентированной границей dV и проинтегрируем (1.6) по объему, преобразовав
объемный интеграл в поверхностный. В результате получаем
утверждение, известное как электростатическая теорема Гаусса
<Ь EdS = 4nQv = 47Г / p(r) a*x,
av v
(1.9)
в котором левая часть представляет собой поток вектора Е через
поверхность 8V. Заметим, что при этом не предполагается отсутствие
зарядов вне области V, такие заряды, как следует из (1.9), не дают
вклада в поток Е через границу V. Физически это молено связать с
законом обратных квадратов (1.1): потоки поля Е от внешнего
заряда qext через элементы поверхности S\ и 5г, пропорциональные
квадратам расстояний п и гг от заряда, взаимно уничтожаются (рис. 1.1).
14
Глава 1. Электростатика.
Соотношение (1.9) позволяет легко найти напряженность
поля некоторого симметричного распределения заряда (шар, цилиндр,
плоскость), если выбрать область интегрирования V соответствующей
данной симметрии.
Qext
IZ
Е,
t2
Btl
Рис. 1.1. Внешний заряд не
дает вклада в поток (1.9)
Рис. 1.2. К выводу
соотношения (1.10)
Для нахождения электрического поля, порождаемого заданным
источником p{i"), определяющую систему уравнений (1.6), (1.7)
следует дополнить подходящими граничными условиями. Например,
если функция р(г) имеет компактный носитель, то в силу (1.4) поле
должно обращаться в нуль на бесконечности. Общее решение
уравнения (1.6) можно представить в виде суммы частного решения
неоднородного уравнения и общего решения однородного уравнения. Для
получения физического решения часто приходится привлекать
дополнительные соображения. Так, однородному уравнению (1.6), а также
уравнению (1-7) удовлетворяет не зависящий от координат вектор Ео,
однако с физической точки зрения ясно, что однородное поле является
приближением некоторого неоднородного поля, создаваемого
соответствующей системой зарядов. Поэтому при отсутствии зарядов
постоянный вектор Eq следует опустить.
В соответствии со сказанным выше, решения основных уравнений
электростатики (1.6), (1.7) можно рассматривать на множестве
обобщенных функций. При этом вектор электрического поля Е может
иметь разрывы. Получим граничные условия для Е на заряженной
поверхности, выбирая для простоты распределение заряда вида (1-3).
Применяя соотношение (1.8) к контуру, показанному на рис. 1.2,
найдем, что тангенциальная составляющая поля Е% = [jE х п], где п —
нормаль к поверхности, направленная вдоль оси z, должна быть
непрерывна,
1.3. Электростатический потенциал
15
Ец — Et2-
(1.10)
Для получения соотношения
между нормальными составляющими Еп =
Е • п применим электростатическую
теорему Гаусса (1.9) к малому
параллелепипеду (рис. 1.3), высоту
которого устремим к нулю. Тогда поток через
боковую поверхность исчезает, и мы
находим, что скачок нормальной
составляющей пропорционален
поверхностной плотности заряда:
Рис. 1.3. К выводу
соотношения (1-11)
Е,
'т»1
ЕП2 = 47R7.
(1.11)
1.3. Электростатический потенциал
Уравнение (1.8) означает, что электростатическое поле является
потенциальным и его силовые линии (кривые, к которым вектор Е
является касательным) незамкнуты. Действительно, один-форма Е =
Eidx* замкнута в К?: d£ = 0. В силу леммы Пуанкаре эта форма точна,
Е = — dtp, иначе говоря, поле Е можно представить в виде градиента
скалярной функции
E = -gradv3. (1.12)
Величина <р называется электростатическим потенциалом. Силовые
линии поля Е ортогональны поверхностям постоянного потенциала.
Работа, совершаемая полем при перемещении заряда е из точки Т\ в
точку г2, будет равна
Т1
А = е J Edl = e(vi
<Р2),
где интеграл вычисляется вдоль любой кривой, соединяющей точки
Т*1 И Т2-
Подставляя (1.12) в (1.6), получаем уравнение Пуассона для (р:
( д2 д2 д2\
(1.13)
16
Глава 1. Электростатика
где использованы декартовы координаты. В произвольных
координатах хг, отвечающих элементу длины
dl2 = hij(x)dxidxj,
оператор Лапласа имеет вид
где /i*J — тензор, обратный к Лу, и h = det /ц,-.
В области, где р = О, потенциал является гармонической функцией:
Ду> = 0.
Отсюда следует, например, что Е = 0 внутри замкнутой
проводящей поверхности, если там нет других зарядов. На такой поверхности
<р — const (иначе произойдет перераспределение зарядов) и,
следовательно, в силу принципа экстремума для гармонических функций,
(р = const всюду внутри нее. Другое следствие гармоничности
потенциала в пустом пространстве — неустойчивость статической системы
точечных зарядов. Действительно, чтобы некоторый выбранный
заряд находился в устойчивом равновесии с остальными,
потенциальная энергия, которой он обладает в поле <р, создаваемом остальными
зарядами, U = еу>, должна иметь минимум. Но если заряд
рассматривается как пробный, то потенциал в этой точке и ее окрестности
является гармонической функцией и, следовательно, не может иметь
в ней экстремума.
Нетрудно доказать следующую теорему единственности для
уравнения Пуассона (1.13). Решение электростатической задачи Е = grad <p
единственно в компактной области V с границей dV, если плотность
заряда р(г) задана всюду в У и на границе заданы либо потенциал <р,
либо его нормальная производная д<р/дп. Действительно, пусть
имеются два решения ip\ и <ръ, удовлетворяющие уравнению (1.13).
Применим формулу Остроградского—Гаусса к вектору фУф, где ф = (р\ — <рг:
Г div(V>VV) d3x = f ((Vф)2 + ф А ф) <Рх =
V V
= fty^)-dS = Iф~ dS. (1.14)
dv av
Поверхностный интеграл равен нулю в силу граничных условий, кроме
того, Д ф = 0. Остается объемный интеграл от положительно
определенной величины (V^>)2, следовательно, ф = const, т.е. <р\ = <p2+const.
1.3. Электростатический потенциал
17
/ //
: i i
.ill
W ^
1 \
( •
1 1
1 i :
Электростатическое поле Е при этом определено однозначно. Эти
соображения остаются справедливыми и в случае, если граница 8V
отодвигается на бесконечность.
Примером применения теоремы единственности является
электростатический метод изображений. Пусть требуется найти
распределение заряда <т(х, у), индуцированное точечным зарядом q, находящимся
на расстоянии d от проводящей поверхности z — 0, которая
«заземлена» т.е. является
поверхностью
постоянного
потенциала,
принимаемого за нуль, (рис.
1.4, Ь). Такое же
значение
потенциала на плоскости
2=0 имеет
система двух точечных
зарядов q и — q,
симметрично
расположенных
относительно этой плоскости в отсутствие проводящей поверхности (рис.
1.4, а). Замыкая верхнее полупространство бесконечно удаленной
полусферой (на которой также <р = 0), получаем в этой области в обоих
случаях одинаковую электростатическую задачу. Таким образом,
искомое электростатическое поле над проводящей поверхностью равно
у=0
Рис. 1.4. Метод изображений
_, ( r-d r + d \а. .
где 0(z) — функция Хевисайда. Взяв дивергенцию от этого выражения
с учетом соотношений (1.6) и 9'{z) — 6(z), нетрудно получить
распределение поверхностного заряда <т(х, у) на проводящей плоскости (при
этом дифференцировать выражение в круглых скобках не нужно
вовсе, поскольку соответствующая дивергенция в силу (1.3) равна нулю
в плоскости 2 = 0):
а^у>~ 2v' {х*+у*+&)*/*'
В случае достаточно быстрого убывания плотности заряда р(г) на
бесконечности решение уравнения (1.13) можно записать в виде
объемного интеграла
^)=/]7^^'' (1Л5)
18
Глава 1. Электростатика
где интегрирование ведется по всему пространству.
Соотношение (1.15) следует из равенства
А ]^Ьч = ~***{т -г'), (1Л6)
вытекающего из (1.5). Представление электростатического потенциала
в виде (1.15) имеет смысл для таких распределений заряда р{т'), для
которых интеграл конечен при всех г.
1.4. Энергия электрического поля
Хотя электрическое поле Е в электростатике было введено лишь
для удобства описания взаимодействия зарядов, можно показать, что
энергия системы зарядов допускает представление в виде объемного
интеграла от величины Е2/8п. Рассмотрим пару зарядов qi и q% в
точках ri ж г2- Можно считать, что эта конфигурация возникла в
результате перемещения заряда <fo из бесконечности в точку тъ в поле
заряда gi с потенциалом <pqi{r). Пусть ^„(оо) = 0, тогда
совершаемая работа есть q4<pqi(r-i). Меняя заряды местами, найдем, что та же
работа равна qi(Pq,(ri), или, в симметричной форме,
U = \ (<?i¥>(ri) + 92¥>(r2)) • (1-17)
В этой формуле предполагается, что потенциал <р в точке
нахождения каждого из зарядов создается другим зарядом, т.е. собственный
потенциал заряда опускается. Если же перейти к несингулярному
распределению заряда р, то под <р можно понимать потенциал полного
поля и мы получаем
U=lJMr)d3x.
С помощью (1.13) преобразуем это выражение к виду
U = --^ J <р А <р сРх = -^ [ V(<pV<p) d*x + -^ [ (Vcp)2 d*x.
Первый интеграл в правой части выражается через интеграл по
бесконечно удаленной поверхности, причем в случае распределения заряда
в ограниченном объеме <р убывает как 1/г, a Vy> — как 1/г2, и интеграл
оказывается равным нулю. Учитывая (1.12), находим
U= f^d3x.
J 8тг
1.4. Энергия электрического поля
19
Таким образом, величина Е2/8п имеет смысл плотности энергии
электрического поля. Возможность записать энергию взаимодействия
зарядов в виде интеграла по всему пространству от квадрата поля
наводит на мысль, что электрическое поле является не просто удобным
средством описания взаимодействия зарядов, но представляет собой
самостоятельный вид материи, которая обладает энергией. То, что это
действительно так, становится ясным при рассмотрении движущихся
зарядов.
Заметим, что при переходе от (1.17) к (1.18) мы добавили вклады
типа собственной энергии, которые для точечных зарядов бесконечны.
Далее мы увидим (гл. 9), что, рассматривая самосогласованную
систему заряженных точечных частиц и создаваемого ими поля, можно
исключить подобные бесконечности с помощью перенормировки масс
частиц.
Глава 2
Постоянное магнитное
поле
2.1. Закон Ампера
Взаимодействие движущихся зарядов уже не сводится к чисто ку-
лоновскому (1.1). Помимо электрического возникает также магнитное
поле. Магнитное поле порождается электрическим током. Если
имеются носители заряда одного вида (например, электроны) с плотностью
заряда p(r, t), то их движение, описываемое полем скоростей v(r,t),
соответствует плотности электрического тока
j(r,t)=p(r,t)v(r,t). (2.1)
Выделим в пространстве некоторую поверхность S, тогда поток
вектора j через нее равен заряду, переносимому через S в единицу времени:
^=J(5)-/i.dS. (2.2)
s
Величина J(S) есть полный ток через площадку S.
Бели имеются носители заряда различного типа (электроны,
протоны, ионы атомов и молекул), то вместо (2.1) следует написать
а
где суммирование производится по всем типам носителей заряда. В
2.1. Закон Ампера
21
этом случае среда может быть электронейтральной,
а
однако плотность тока при этом может быть отлична от нуля.
Например, в металлах движущимися зарядами являются электроны, в
то время как положительные ионы кристаллической решетки
неподвижны. Плотность заряда электронов равна плотности заряда ионов
и имеет противоположный знак, поэтому усредненная полная
плотность заряда равна нулю. Однако плотность тока, отвечающая
движению только электронов, отлична от нуля. В настоящем разделе
обсуждается случай р = О, j Ф 0 при дополнительном предположении
стационарности, когда плотность тока не зависит от времени, т.е.
j = j (г) (магнитостатика).
Наиболее просто новые закономерности проявляются в случае
токов, текущих по бесконечно тонким
проводникам. Рассмотрим два тока
J\ и J2, участки которых показа- **i\ •'2,
вы на рис. 2.1. Закон, установленный
Ампером в 1820 г., гласит, что два
элемента тока J\dl\ и J2dl2
взаимодействуют с силой
dF12 =
JiJ2 dli x [dl2 x г]
(2.3)
Рис. 2.1. Взаимодействие
элементов тока
где г = Т\ — г2 — радиус-вектор,
соединяющий элементы тока,
расположенные в точках т\ ж г2, с — постоянная размерности скорости
(размерность с легко установить, сопоставляя соотношения (1.1), (2.2),
(2.3)). Формула (2.3) определяет силу, действующую на элемент J\ dl\
со стороны элемента J2 dl2. Вообще говоря,
dFi2 ф —dF\
211
так что для элементов тока не выполняется третий закон Ньютона.
Однако силы, действующие на полные замкнутые токи, равны по
величине и противоположны по направлению, в чем нетрудно убедиться,
интегрируя (2.3) по замкнутым контурам.
22
.Глава 2. Постоянное магнитное поле
2.2. Магнитное поле
Так же как и в случае электростатического взаимодействия, удобно
представить силу (2.3) в виде
dF12 = -± [dli x dB2(n)], (2.4)
где
ав2{г) = ^Щ^р)1 (2.5)
с |г — г2|3 v '
— магнитное поле, порождаемое элементом тока J2 dl2- Полное
магнитное поле тока «7 равно
„,,-£/
[dl' х (г - г')]
\г —г
-Wia—' М
где интегрирование ведется по всему контуру с током (г' —
координата элемента dl'). Соотношение (2.6) называется законом Био-Савара.
Формулу (2.6) с учетом (2.2) можно также переписать в виде
объемного интеграла
который имеет смысл и для проводников конечного сечения, и вообще
для произвольной стационарной плотности тока. Можно также
понимать силу (2.4) как сумму сил, приложенных к отдельным точечным
зарядам, образующим элемент тока. Элементарная сила, действующая
на заряд е, легко находится при учете соотношения (2.1):
F = -с [v х В] (2.8)
и называется силой Лоренца. При этом плотность тока точечного
заряда, движущегося со скоростью v вдоль кривой г = ro(t), в
соответствии с (1.2) и (2.1) равна
j (r, t) = ev(r, t) S3(r - г0(0), (2.9)
где v = dro/dt. Эта величина зависит не только от координат, но и
от времени, поэтому магнитное поле отдельного движущегося заряда
уже не будет стационарным.
Получим дифференциальные уравнения для магнитного
поля В(г). Применим сначала к (2.7) оператор дивергенции. В
подынтегральном выражении будем иметь смешанное произведение оператора
2.2. Магнитное поле
23
V, плотности тока и радиус-вектора г — г'. Изменив порядок в этом
произведении и учитывая, что (г — т')/\т — т'\ = — V(l/|r — г'|),
получим нуль. Таким образом,
div В = 0. (2.10)
Это уравнение означает отсутствие магнитных зарядов.
Следовательно, силовые линии магнитного поля не имеют начала и конца и либо
замкнуты, либо уходят на бесконечность. Мы получили это
утверждение на основании закона взаимодействия элементов тока, известного
уже в начале XIX в. и фактически относящегося к электронам. С тех
пор не было получено никаких экспериментальных указаний на
существование в природе магнитных зарядов, во всяком случае все
известные элементарные частицы магнитных зарядов не имеют. Однако с
точки зрения современной теории существование магнитных зарядов
в принципе не исключено, возможно, их элементарные носители имеют
весьма большую массу и не могут быть обнаружены на существующих
ускорителях.
Второе дифференциальное уравнение для магнитного поля можно
получить, взяв ротор от правой и левой частей уравнения (2.7). Это
дает в подынтегральном выражении двойное векторное произведение,
при раскрытии которого следует воспользоваться формулой (1.5).
Возникающая дельта-функция позволяет выполнить интегрирование, и
мы получаем дифференциальное соотношение
4тг
rotB = — j. (2.11)
с
Таким образом, магнитное поле является чисто соленоидальным.
Циркуляция В вдоль замкнутого контура вычисляется
интегрированием (2.11) с помощью формулы Стокса
<fBdl=^-fjdS=~-J, (2.12)
as s
где контур dS является границей поверхности S, J — полный ток
через S. Это соотношение позволяет легко вычислить напряженность
магнитного поля, порождаемого бесконечным тонким прямолинейным
током J, ориентированным вдоль оси z. Выбирая контур в виде
окружности радиуса г вокруг оси z и учитывая, что силовые линии имеют
вид концентрических окружностей, находим В = 2J/cr. Такой же
закон спадания мы имели бы для электростатического поля точечного
заряда в двумерном пространстве.
24
Глава 2. Постоянное магнитное поле
Помимо бесконечно тонких нитей и объемного распределения
токов полезно ввести также поверхностные токи. Так, если проводником
является плоскость z = 0, будем иметь
j(r) = i(x,y)5(z),
где i(x,y) — поверхностная плотность
тока. Найдем граничные условия для
вектора В, интегрируя уравнение (2.11)
вдоль контура (рис. 1.2) и применяя
теорему Остроградского-Гаусса к
уравнению (2.10), как показано на рис. 1.3. В
результате получаем
Вп - Bt2 = [n х «],
Bni = Вп2,
где п — вектор нормали к поверхности, направленный из области 1 в
область 2. Отсюда нетрудно понять, что если вектор t ориентирован
вдоль оси х, то возникает однородное магнитное поле, направленное
против оси у в верхнем полупространстве и вдоль оси у в нижнем (рис.
2.2).
При использовании криволинейных координат полезна запись
уравнения (2.11) с помощью дифференциальных форм
Рис. 2.2. Магнитное поле
токонесущей плоскости
47Г
dB = —*j,
с
B = Bdr,
где *j является 2-формой, дуальной к 1-форме j = j-dr. Интегральное
соотношение (2.12) принимает вид
as s
2.3. Вектор-потенциал
Условие соленоидольностпи (2.10) означает, что поле В(г) можно
представить в виде ротора другого векторного поля А (г),
В = rot A,
(2.13)
называемого вектор-потенциалом, на языке форм *В = dA, где А =
А • dr. При такой параметризации уравнение (2.10) будет выполнено
2.4. Работа магнитного поля над контуром
25
автоматически, а из (2.11) получаем
47Г
graddiv A - А А = — j. (2.14)
Это уравнение можно упростить, учитывая произвол в выборе вектор-
потенциала А{г), порождающего заданное магнитное поле В(г).
Действительно, преобразование
А —>• А' = А + grad ф(г)
не изменяет В. Выбором т}> можно добиться выполнения
дополнительного условия
div А = 0,
так что уравнение (2.14) принимает вид, аналогичный (1.13):
AA=-—j. (2.15)
с
Здесь подразумевается выбор декартовых координат, при этом
оператор Лапласа действует на каждую компоненту вектора как на скаляр.
Физический смысл вектор-потенциала раскрывается при
вычислении потока магнитного поля через некоторую площадку S с
границей OS:
Ф= Г BdS= <f Adl, (2.16)
S 8S
иначе, магнитный поток через некоторую площадку равен циркуляции
вектора А вдоль ее границы.
В случае локализованной системы токов j(r) решение
уравнения (2.15) можно представить в форме объемного интеграла,
аналогичного (1.15):
с J \г —г'\
Здесь интегрирование ведется по всему пространству, где j отлична
от нуля, причем предполагается, что интеграл сходится при всех г.
2.4. Работа магнитного поля при
перемещении контура с током
Сила Лоренца (2.8) ортогональна скорости и потому не
совершает работы при перемещении изолированного заряда. Однако сила
26
Глава, 2. Постоянное магнитное поле
Ампера (2.4), приложенная к
элементу тока, совершает работу при
перемещении Sr, не параллельном dl\.
Очевидное различие этих ситуаций в
том, что в случае отдельного
заряда его перемещение происходит в
направлении скорости и,
следовательно, вектора плотности тока, в случае
же элемента тока перемещение
зарядов является независимым от их
скорости и происходит вместе с
(произвольным) перемещением
проводника. Вычислим работу, совершаемую при малом перемещении
контура с током, как показано на рис. 2.3. При этом перемещении контур
заметает поверхность цилиндра с основанием Si (начальное
положение поверхности, границей которой является контур) и 52 (ее конечное
положение). Работа равна произведению силы на перемещение:
Рис. 2.3. Работа при
перемещении контура с током
8А=- <f[dl х В] ■ Sr,
где интегрирование ведется вдоль контура с током. Изменив порядок
множителей в смешанном произведении, будем иметь
5A=-<f B[Srxdl] = -- f B-dS,
где d£ = [dlx Sr] есть элемент боковой поверхности цилиндра.
Нетрудно понять, что в силу соленоидальности вектора В поток через
(ориентированную) боковую поверхность цилиндра будет равен разности
потоков через основания цилиндра Si и S2, ориентация которых
связана с направлением тока в контуре правилом правого винта. Поэтому
работа при перемещении контура с током пропорциональна изменению
магнитного потока через этот контур:
SA — —<5Ф, £Ф = Фг — *i)
с
Ф< = J В ■ dS, i
Si
1,2.
(2.17)
Отсюда вытекает простое правило: контур с током стремится
ориентироваться в магнитном поле так, чтобы поток поля через него имел
максимальное значение.
2.5. Энергия магнитного поля 27
2.5. Энергия магнитного поля
Используя выражение для потока магнитного поля через
циркуляцию вектор-потенциала (2.16), можем переписать (2.17) в виде
SA= - S<fAdl= - sf Ajd3x,
где от интегрирования по контуру с током мы перешли к
интегрированию по всему объему, вводя плотность тока в соответствии с (2.2).
Эта формула выражает работу внешнего магнитного поля В = rot A
над пробным током плотности j.
Рассмотрим теперь работу, которую нужно совершить, чтобы
сблизить два контура с токами j\ и j2, первоначально разнесенными на
большое расстояние, где их взаимодействие исчезает. Произведенная
работа будет равна взаимной энергии токов U. Так же как и в случае
зарядов (п. 1.4), один из токов следует считать источником
магнитного поля, а второй ток — пробным. В симметричной относительно j\ и
Эг форме выражение для работы будет равно
U = ± J (Аг - j2 + А2 • ji) d3* = ^ J (A ■ j) d?x. (2.18)
Здесь при переходе к суммарному току j = j\ +j2 учтено, что
собственное магнитное поле не совершает работы над создающим это поле
током, поэтому под А можно понимать вектор-потенциал полного тока j.
Выражение (2.18) можно преобразовать, используя уравнение (2.15)
для А:
'.АДАа*х.
8тг J
С помощью соотношения
div[AxB] = BiotA-ArotB = В2-Aiotiot A = В2+А А А (2.19)
(здесь учтено, что divA = 0) в интеграле можно выделить
поверхностный член, который обращается в нуль, если вектор-потенциал А
спадает на бесконечности как 1/г, и соответственно В — как 1/г2. В
результате находим
В2
Ч
8тг
Таким образом, можно считать, что взаимная энергия токов
сосредоточена в создаваемом ими магнитном поле, причем величина В2/8ж
имеет смысл плотности энергии магнитного поля.
Глава 3
Переменное
электромагнитное поле
В общем случае система движущихся зарядов характеризуется
отличными от нуля плотностями заряда р и тока j, которые являются
функциями координат и времени. При этом обнаруживается
внутренняя взаимосвязь между электрическим и магнитным полями, которые
оказываются различными проявлениями единого электромагнитного
поля. Электромагнитное поле можно понимать как совокупность
полей {Е, В}, однако уравнения для этих полей в нестационарном случае
уже не будут простым объединением уравнений электростатики (1.6),
(1.7) и магнитостатики (2.10), (2.11).
3.1. Закон индукции Фарадея
Одной из новых закономерностей является закон
электромагнитной индукции. Бели в пространстве возбуждено магнитное поле,
зависящее от времени, то генерируется соленоидальная компонента
электрического поля, которая в электростатике была равна нулю см. (1.7).
Закон, установленный Фарадеем, гласит, что циркуляция вектора Е
по контуру dS (электродвижущая сила) пропорциональна взятой со
знаком «минус» производной по времени от потока магнитного поля
через поверхность 5, границей которой является контур dS:
as s
3.1. Закон индукции Фарадея
29
Измерения показывают, что коэффициент пропорциональности
есть 1/с, где с — та же постоянная размерности скорости, которая
входит в закон магнитного взаимодействия элементов тока (2.3) (элек-
тродинаминеская постоянная). Напомним, что эта постоянная была
введена в (2.3) из соображений размерности. Ее присутствие в
выражении для магнитного поля элемента тока (2.5) означает, что Е и В
измеряются в одинаковых единицах, такая система единиц называется
гауссовой.
Знак «минус» в законе Фарадея указывает на направление
электрического поля, при этом подразумевается, что ориентация площадки S
связана с направлением обхода контура dS правилом правого винта.
Преобразовав левую часть с помощью теоремы Стокса, получаем
fiotEdS= --^- f В dS,
S S
и, следовательно, в силу произвольности S для полей E(r,t) и B(r,t)
имеет место дифференциальное соотношение
«*В—\Щ. (3.1,
Это уравнение переходит в уравнение электростатики (1.7), если поля
не зависят от времени. Таким образом, потенциальный характер поля
в электростатике является не абсолютным свойством электрического
поля, а лишь следствием отсутствия переменного магнитного поля.
Возникает естественный вопрос: что произойдет, если в
пространстве, где существует неоднородное постоянное магнитное поле,
перемещать замкнутый проводящий контур? Опыт показывает, что если
поток магнитного поля через контур зависит от времени, то также
возникает электродвижущая сила в полном соответствии с законом
Фарадея. Этот результат можно интерпретировать и иначе: если в
некоторой системе отсчета имеется чисто магнитное поле, то в системе,
движущейся относительно нее, присутствует также и электрическое
поле. Мы приходим к важному заключению: электрическое и
магнитное поля не только связаны между собой соотношением (3.1), но и
действительно являются различными формами единого
электромагнитного поля.
Заметим, что в рассуждениях предыдущего раздела мы получили
выражение для энергии контура с током в магнитном поле, не
учитывая фарадеевской индукции, т. е. предполагая, что перемещение
контура происходит адиабатически, с исчезающе малой скоростью. Мы
30
Глава 3. Переменное электромагнитное поле
вернемся ниже к вопросу об энергии электромагнитного поля без
этого ограничения, при этом оказывается, что выражение для плотности
энергии (Е2+В2)/8п сохраняет свою справедливость и в общем случае
переменного электромагнитного поля.
3.2. Сохранение заряда и ток смещения
Можно попытаться объединить уравнения для Е и В, полученные
в предыдущих главах, с законом электромагнитной индукции, тем
самым распространив их на случай переменного электромагнитного
поля. Однако при этом обнаруживается, что система уравнений будет
несовместна с законом сохранения электрического заряда,
справедливость которого подтверждается в многочисленных экспериментах.
Этот закон гласит, что заряды могут лишь перемещаться в
пространстве, но не могут появляться или исчезать (в частности, рождение
заряженных частиц при столкновениях частиц высоких энергий
всегда происходит так, что суммарный заряд не изменяется).
Математическим выражением закона сохранения заряда является уравнение
непрерывности для плотностей заряда и тока р и j, зависящих от
координат и времени:
^(r,*)+divi(r,t) = 0. (3.2)
Проинтегрировав (3.2) по некоторому объему V, найдем, что
изменение полного заряда в этом объеме равно взятому со знаком «минус»
полному потоку вектора j через границу 8V объема V, равного заряду,
протекающему через 8V в единицу времени. Заметим, что уравнение
непрерывности (3.2) выполняется автоматически для плотности
заряда (1.2) и тока (2.9) точечного заряда.
Дифференцируя уравнение (1.6) для дивергенции электрического
поля, находим
Sp _ j_ ав
dt ~ 4тг ~дТ'
поскольку операторы V и Ь\ перестановочны. С другой стороны,
если экстраполировать уравнение магнитостатики (2.11) на случай
переменных полей, то из него следовало бы divj = 0. Замечательно,
что правильная форма уравнения для rot В в случае переменных
полей была найдена Максвеллом «на кончике пера» и лишь затем
подвергнута экспериментальной проверке. Для совместности с
уравнением непрерывности Максвелл дополнил правую часть (2.11) током сме-
3.3. Энергия и импульс электромагнитного поля
31
щения
1 9Е
*" = *1Г (3'3)
С физической точки зрения наличие в правой части (2.11) тока
смещения означает возможность порождения магнитного поля
переменным электрическим полем в отсутствие реальных токов. В этом можно
усмотреть прямую аналогию с законом электромагнитной индукции.
Следует обратить внимание на то, что производная от электрического
поля будет входить в уравнение с другим знаком. Это обстоятельство
имеет важнейшее значение, благодаря ему возможен процесс взаимной
трансформации вихревых электрического и магнитного полей в
пространстве, который представляет собой не что иное как
распространение электромагнитных волн. Именно обнаружение электромагнитных
волн в опытах Герца и послужило главной экспериментальной
проверкой гипотезы Максвелла о токе смещения.
Итак, объединяя уравнения (1.6), (2.10), (2.11) и (3.1) с током
смещения (3.3), получаем полную систему уравнений Максвелла:
divE = 4icp, (3.4)
divB=0, (3.5)
rotB = ^i + i^, (3.6)
с с at
xotE = -vi- (37)
Теперь закон сохранения заряда (3.2) является следствием полевых
уравнений: дифференцируя (3.4) по времени и беря дивергенцию
от (3.6), получим (3.2).
3.3. Энергия и импульс
электромагнитного поля
Рассмотрим систему из N зарядов еа, а = 1,..., N, движущихся в
самосогласованном электромагнитном поле E(r,t),B(r,t) вдоль
кривых г = ra(t). Каждому заряду соответствует кинетическая энергия £а
и импульс ра, причем
^ = /« = е.(«(гв>0 + \[v х vaB(ra,t)]), (3.8)
^-= fava = eaE(ra,t)va, (3.9)
32
Глава 3. Переменное электромагнитное поле
где va — dra/dt. Заметим, что здесь не предполагается определенной
зависимости £„ и ра от va. Формулировка механики, совместимой с
уравнениями Максвелла, является предметом последующего
изложения. Пока лее мы воспользуемся лишь общими представлениями об
импульсе как величине, производная от которой равна действующей
силе, и об энергии как величине, производная от которой равна работе
(в единицу времени) этой силы.
Плотность заряда и плотность тока системы точечных зарядов
имеют вид
N
р = ]Геа<*3(г-г0(*)), (3.10)
а=1
N
j = J2 e^aS3(r - ra(t)). (3.11)
о=1
Для вывода закона сохранения энергии из уравнений Максвелла
предварительно построим вектор Пойнтинга
S=~[ExB] (3.12)
и вычислим его дивергенцию, воспользовавшись формулой,
аналогичной (2.19):
divS= -£-(ВrotЕ - ЕrotВ\.
С помощью уравнений (3.6), (3.7) преобразуем это выражение к виду
.. _ д(В2+Е2\ .
Подставив j в виде (3.11) и проинтегрировав по объему V с
границей 8V, найдем
d Г Е2 4- В2 ** Г
^j ^ d3s + ^ee.B(ra,t)«a + j Sdtr = 0.
V e=1 8V
Учитывая (3.9), получаем соотношение
d / N Г Г
jt(J2£«+jWd3x) = -fs-d°' С3-13)
0=1 v av
выражающее закон сохранения энергии. Здесь
Е2 + В2
W=~-±r- (3.14)
3.3. Энергия и импульс электромагнитного поля
33
представляет собой плотность энергии электромагнитного поля, эта
величина, не зависящая от производных полей по времени, является
суммой выражений, найденных ранее при рассмотрении статических
полей. Левая часть (3.13), таким образом, представляет собой
изменение в единицу времени полной энергии системы заряженных частиц
и создаваемого ими электромагнитного поля. Согласно (3.13), эта
величина, вообще говоря, не равна нулю, а ее изменение определяется
потоком вектора Пойнтинга (3.12) через границу рассматриваемого
объема. Отсюда ясен физический смысл вектора S как плотности
потока энергии, т. е. энергии, переносимой электромагнитным полем
через единичную площадку с нормалью вдоль S.
Рассмотрим теперь производную по времени от величины S/c2,
выражая dE/dt и dB/dt из уравнений (3.6), (3.7):
l^f = -^Ь' х Щ + ^:(МВ хВ]-[Ех rottf]). (3.15)
Векторные произведения в круглых скобках перепишем в виде
В2
[rot В х В] = dk{BBk) - В div В - V—,
где по векторному индексу к подразумевается суммирование, и
аналогично для Е. Наконец, воспользуемся уравнениями (3.4) и (3.5) для
дивергенций Е и В и подставим р и j из (3.10), (3.11). В
результате интегральная форма уравнения (3.15) принимает вид,
аналогичный (3.13):
|(X>+^/Sd3*) = -/^fc' (3-16)
е-1 v av
где Tfc — совокупность величин, образующих симметричный тензор
второго ранга
Пк = (rk)i = i- (E +2B 5ik - EiEk - В{Вк\. (3.17)
Мы видим, что интеграл от величины S/c2 входит в закон
сохранения аддитивно с импульсами частиц. Поэтому эту величину
естественно интерпретировать как плотность импульса
электромагнитного поля. Одновременно выясняется двойственность смысла вектора S:
как было показано выше, величина S является также плотностью
потока энергии электромагнитного поля. Далее мы увидим, что это не
является простым совпадением и связано с тем, что электромагнитное
поле распространяется в пространстве со скоростью с.
2 — 8210
34 Глава 3. Переменное электромагнитное поле
Левая часть (3.16) представляет собой изменение полного импульса
зарядов и поля в объеме V. Отсюда следует, что величина т%Аг*
является силой, приложенной к системе зарядов со стороны поля, которая
сведена к поверхностной силе, действующей на элемент граничной
поверхности dak. Возможность сведения объемных сил к поверхностным
существует и для сил другой природы, например для упругих сил в
твердых телах. По аналогии тензор т$ц. называется тензором
напряжений (или натяжений) электромагнитного поля.
3.4. Единственность решений уравнений
Максвелла
Сформулируем постановку начальной/граничной задачи для
уравнений Максвелла. Пусть заданы источники р, j всюду в некотором
ограниченном объеме V при всех t, а также заданы начальные
значения электрического и магнитного полей E(r,t = 0), В (г, t = 0) всюду
в V. Предположим, кроме того, что на границе dV задана
тангенциальная компонента электрического [то х Е] либо магнитного [то х В]
поля, где то — нормаль к dV, для всех t. Тогда уравнения (3.4)-(3.7)
имеют единственное решение E(r, i),B(r,i) всюду в V.
Для доказательства этого утверждения предположим, что
существуют два различных решения ^(r,*), JS^r,*) и E2{r,t),B2(r,t).
Построим векторы
Е = Е\ — Е2, В = В\ — Bji
удовлетворяющие свободным уравнениям Максвелла
divJB' = 0 = divS',
15В' 1дЕ'
rotB'= —, rotB' =——-
с at с at
с начальными условиями
Е'
и условиями на границе
= в' =0, rev, (з.18)
[то х Е'} =0 либо [то х В'] = 0. (3.19)
8V
8V
Повторяя выкладки, приведшие к (3.13), получаем
д fE'2 + B'2
di
V 9V
(3.20)
3.4. Единственность решений
35
Поскольку da = ndcr, подынтегральное выражение в правой
части (3.20) равно нулю в силу (3.19). Значение интеграла в левой части
обращается в нуль при t — 0 в силу (3.18), следовательно, интеграл
равен нулю при всех t. Из положительной определенности
подынтегрального выражения тогда следует, что Е' = 0 = В' для г € V при
всех t, что и требовалось доказать.
Заметим, что в такой постановке задачи ищется электромагнитное
поле, создаваемое заданным распределением зарядов и токов. Если
систему (3.4)-(3.7) дополнить уравнениями движения частиц, то можно
рассматривать задачу о самосогласованном решении уравнений
движения зарядов и создаваемого ими поля.
2*
Глава 4
Электромагнитные
волны
Из результатов предыдущего раздела следует, что
электромагнитное поле обладает энергией и импульсом и, следовательно, является
самостоятельным физическим объектом, а не просто удобным
средством описания взаимодействия движущихся зарядов. Дальнейшее
обоснование этого полозкения состоит в изучении решений однородных
уравнений Максвелла в отсутствии источников р и j. Система (3.4),
(3.7) при р = j = О принимает вид
оЪгЯ = 0, divB = 0, (4.1)
„ 1дЕ „ 1дВ , .
rotB = e¥' totB = -c¥' <4"2)
Как электрическое, так и магнитное свободные поля соленоидаль-
ны; имеется также симметрия относительно замены Е —> В, В —> — Б
(преобразование дуальности). Из уравнений (4.2) можно исключить
одно из полей, взяв ротор и производную по времени и учитывая (4.1):
(д-1#)ж = 0, (д-1#)в = 0, (4.3)
дополнительная связь между решениями определяется любым из
уравнений (4.2). Кроме того должно выполняться условие (4.1).
Формально уравнения (4.1), (4.2) имеют тривиальное решение Е =
const, В = const, т. е. постоянные во времени и однородные в
пространстве поля. Разумеется, для создания реальных полей необходимы
специальные конфигурации зарядов и токов (например, постоянные и
4.1. Плоские волвы
37
однородные поля в ограниченной области можно создать с помощью
плоского конденсатора и соленоида). Поэтому если задача (4.1), (4.2)
имеет место во всем пространстве и при всех t, такие решения следует
опускать. Рассмотрим теперь нетривиальные решения.
4.1. Плоские волны
Особенно простой вид имеют решения уравнений (4.3), если
предположить зависимость полей лишь от одной координаты, скажем z, и
времени t. Тогда получаем
(d2z - ±дА Е=(дг- -Л (дх + ±дЛ Е = 0 (4.4)
и аналогично для В. Общее решение (4.4) представимо в виде суммы
двух произвольных векторных функций от z ± ct:
Е = Ег(г -ct) + E2(z + ct),
что можно понимать как суперпозицию плоских волн,
распространяющихся вдоль и против оси z («плоские» означает, что решение не
зависит от координат в поперечной плоскости). Итак, становится ясным
смысл электродинамической постоянной с как скорости
распространения волновых электромагнитных полей. Следует обратить внимание
на то, что скорость электромагнитных волн, в отличие от скорости
массивных частиц, является не свободным, но фиксированным
параметром теории, входящим в уравнения в виде фундаментальной
константы.
Решения Ег и Е2 имеют одинаковые физические свойства, поэтому
рассмотрим одно из них. Помимо (4.3) должны выполняться
уравнения (4.1) и (4.2). Равенство нулю дивергенции поля E(z — ct)
означает, что вектор Е ортогонален оси z, т. е. является двумерным
вектором в плоскости ху. Аналогичный вывод можно сделать относительно
B(z — ct). Наконец, одно из уравнений (4.2) (второе при этом
удовлетворяется автоматически) дает
Ех = Ву, Еу = -Вх, ЕВ = 0 (4.5)
(для их получения ротор следует представить с помощью
определителя и учесть, что dt — —cdz на решениях, зависящих от z — ct;
постоянные интегрирования следует опустить, как указано выше). Итак,
решения типа плоской волны описываются двумя скалярными
функциями Ex(z — ct), Ey(z — ct), т.е. электрическое поле ортогонально
38
.Глава 4. Электромагнитные волны
направлению распространения, магнитное поле ортогонально
направлению распространения и электрическому полю. Векторы Е, В и ez
образуют правую тройку.
Убедимся в том, что плоская электромагнитная волна переносит
энергию и импульс в направлении своего распространения.
Действительно, плотность энергии (3.14) равна
47Г*
W=—(El + El)t (4.6)
а плотность потока энергии (3.12)
S=-^(El + El)ez. (4.7)
Вместе эти соотношения говорят о том, что энергия переносится со
скоростью с. Плоской волне можно также приписать плотность
импульса р = S/c2. Очевидно, ср = Wez; такое соотношение, как мы
увидим далее, характерно для безмассовых частиц.
Наконец, в силу соотношений (4.5) единственной отличной от нуля
компонентой тензора напряжений является
т„ = W.
Поэтому волна, падающая на препятствие, действует на него с
некоторой силой. Пусть происходит полное поглощение волны стенкой,
ортогональной оси z. Сила, действующая на единицу площади стенки,
равна потоку импульса через эту площадь, т. е. tz. Поскольку
отлична от нуля лишь компонента tzz, находим, что сила действует
ортогонально площадке. Аналогично можно рассмотреть наклонное падение,
а также частичное или полное отражение.
4.2. Монохроматическая плоская волна
Особый интерес представляет случай, когда поле Е является
простой периодической функцией своего аргумента вида cos[Lj(t — z/c)].
Рассмотрим этот случай подробнее, полагая для удобства векторной
записи величин, что волна распространяется вдоль произвольно
ориентированного вектора к. Удобно записать решение в виде
вещественной части комплексной функции:
Е
= Re (jE?0ei(fcr-',")) , (4.8)
4.2. Монохроматическая плоская волна
39
где в соответствии с результатом предыдущего раздела частота ш и
волновой вектор к связаны соотношением
ш = с\к\.
Абсолютная величина волнового вектора обратно пропорциональна
длине волны А:
и-т-
а период колебаний в волне есть
г = —.
ы
Величину, стоящую в показателе экспоненты, принято называть фазой
волны: tp = кг — uxt.
Векторные операторы div и rot применительно к (4.8) действуют
особенно просто, поскольку е,кг является собственной функцией
оператора V:
Veifcr = ikeihr,
поэтому имеем
div Е = -Im {kE0eiv) , rot E = -Im ([к х Е0]е^) .
Следовательно, из уравнений (4.1), (4.2), кЕо = 0 и
В=-[кх Е],
(л)
а вектор Пойнтинга будет иметь вид
s = i±E2 = г-w.
4пш ш
Покажем, что конец вектора Е совершает в общем случае
движение по эллипсу в плоскости, ортогональной к. В формуле (4.8)
Е0 есть некоторый постоянный комплексный вектор. Под квадратом
комплексного вектора будем понимать скалярное произведение его на
себя, Eq = Ео ■ Ео, которое также является комплексной величиной.
Обозначим фазу Е$ через 2<ро,
El = \E*\e2i*°,
тогда вектор D = Eoe~ivo будет иметь вещественный квадрат. Это
означает, что его вещественная и мнимая части ортогональны:
D = D^ex + iD2e2, (4.9)
40
Глава 4. Электромагнитные волны
где е.\ и ег — пара ортов, перпендикулярных к (будем считать, что
е\ х е2 = fe/|fc|). Подставляя (4.9) в (4.8), находим
Е = Diei cos(wt — кг — <ро) + -D2e2sin(wi — кг — <ро).
Отсюда следует, что конец вектора Е совершает движение по
эллипсу в положительном или отрицательном направлении в зависимости
от того, одинаковы или различны знаки постоянных D\ и Di
(эллиптическая поляризация). Если D\ = ±Z?2, имеет место круговая
поляризация (правая или левая). Наконец, если одна из величин D\,
D2 равна нулю, имеем линейную поляризацию, векторы Е и В при
этом осциллируют в двух взаимно перпендикулярных направлениях.
Эллиптическую волну можно рассматривать как суперпозицию двух
волн, линейно поляризованных в двух взаимно перпендикулярных
направлениях.
4.3. Общее решение однородных
уравнений Максвелла
Поскольку потенциальная часть вектора Е при отсутствии
зарядов и токов исчезает, для полного описания электромагнитного поля
достаточно лишь вектор-потенциала, т. е. можно выбрать калибровку,
в которой <р = 0. Пря этом подстановка
1 ЗА
Е= £-, В = rot A (4.10)
с от
при дополнительном условии div A = 0 удовлетворяет трем из
уравнений Максвелла, а оставшееся уравнение дает
(А~^)А = °- (4Л1)
Общее решение этого уравнения в терминах, близких к
предыдущему, легко построить с помощью разложения в интеграл Фурье. Ищем
решение в виде
A(r, t)= Г a(k, t)eikr а*к. (4.12)
Учитывая, что Де**г = —fc2e*fcr, получаем из (4.11) уравнение для
коэффициентов Фурье
к2а + \а = 0 (4.13)
4.3. Общее решение однородных уравнений
41
при дополнительном условии
ka(k, t) = О,
вытекающем из равенства div А = 0. Поскольку поле A(r, t) должно
быть вещественным, также имеем
a(k,t) = a*(-k,t). (4.14)
Выбирая, как и выше, пару ортов е\, ег, получим решения
уравнений (4.13), (4.14) в виде
a(k,t) = Y, е> Ык)*~*" + аХ(-*)е***) , (4.15)
А=1,2
где а\(к), А = 1,2, — две произвольные комплексные функции
волнового вектора fc. Подставляя (4.15) в (4.12), находим
A(r,t)= ]Г [еьЮахЮе*1"-»»dk + к. с.
А=1,2-'
(к. с. — комплексно-сопряженное выражение). Это решение описывает
суперпозицию бесконечного числа монохроматических плоских волн.
В силу полноты системы экспонент в этом разложении решение
является общим.
Глава 5
Уравнения Максвелла и
группа Лоренца
Уравнения Максвелла сыграли в истории физики гораздо более
важную роль, нежели частная физическая теория явлений
электромагнетизма. Симметрия этих уравнений относительно группы
Лоренца оказала революционизирующее влияние на физику в целом,
приведя к специальной, а затем общей теории относительности. В этом
разделе мы обсудим эту замечательную симметрию и дадим новую
формулировку уравнений Максвелла, в которой она является
очевидной.
5.1. Уравнение Д'Аламбера
Попытаемся ввести скалярный и векторный потенциалы в
соответствии с полной системой уравнений Максвелла для нестационарных
полей (3.4), (3.7). Как и ранее в статическом случае (гл. 1-2), идея
состоит в том, чтобы обеспечить автоматическое выполнение
уравнений (3.5) и (3.7), не содержащих источников. Ясно, что для этого
следует сохранить параметризацию (2.13) магнитного поля, однако
следует добавить соленоидальную часть в выражение для электрического
поля Е, как и в случае свободного поля (4.10). В результате получаем
1 ЗА
B = iotA, E^-Vip —. (5.1)
с at
При этом уравнения (3.5) и (3.7) удовлетворяются тозкдественно, а
уравнения (3.4) и (3.6) дают систему уравнений для tp и А. Эту си-
5.1. Уравнение Д'Аламбера
43
стему удается упростить, налагая дополнительное условие на <р и А.
Действительно, физически наблюдаемые величины Е и В не
изменяются при следующем преобразовании потенциалов:
А -» А' = А + Уф,
1 дф (5-2)
р^Хр =<p- --£-•
с at
Это преобразование называется калибровочным, симметрия
относительно подобных преобразований является важным свойством не
только электродинамики, но и других физических теорий. Выбором ф
можно добиться выполнения дополнительного условия
I|£+divA = 0, (5.3)
с at
которое включает как частный случай ранее использовавшееся
(при <р = 0) условие div A = 0.
Подставляя (5.1) в (3.4) и (3.6), после применения (5.3) получаем
два независимых уравнения для <р и А:
□ р=-4тгр, (5.4)
□ А=-— J, (5-5)
с
где
1 д2
D = A-c^ <5-6>
— уже встречавшийся нам в гл. 4 оператор Д'Аламбера. Этот оператор
помимо симметрии относительно сдвигов координат и времени
г —> г' = г — Го,
t-H? = t-to,
а также трех 50(3)-вращений в евклидовом пространстве координат
rSR3 обладает симметрией относительно псевдоортогональных
преобразований пар переменных (х, ct), (y,ct) и (z, ct):
х' = х ch ф\ — ct sh ф\,
(5.7)
ct = cichVi ~ xsh^i,
и аналогично для у и z. В совокупности десять перечисленных
преобразований образуют неоднородную группу Лоренца ISO(l, 3) (группу
Пуанкаре). Чтобы получить явно симметричную запись уравнений,
44 Глава 5. Уравнения Максвелла и группа Лоренца
введем псевдоевклидово пространство Ri,3 (пространство Минковско-
го) как фактор-пространство ISO(l, 3)/SO(l, 3). Его точками
являются координаты и время
х» = (ct,r) = (ci,x*), /4 = 0,1,2,3, г = 1,2,3
(координаты события), а элементом длины — интервал, квадрат
которого равен
ds2 = c2dt2 - dr2 = f]^ dx» dx",
J7M„ = diag(l,-1,-1,-1). (5.8)
Группа ISO(l, 3) оставляет инвариантной метрику пространства
событий (5.8).
Оператор Д'Аламбера (5.6) является инвариантным оператором
Лапласа в11|3:
□ = —-Пцидцд,,.
Этого, однако, недостаточно, чтобы установить ковариантность
уравнений (5.4), (5.5). Рассмотрим подробнее правые части этих уравнений,
выбирая р и j соответствующими одному точечному заряду (в силу
линейности уравнений обобщение для произвольного числа зарядов
тривиально). Чтобы выделить инвариантную относительно ISO{\, 3)
четырехмерную дельта-функцию
64(х" - х£) = 63(г - r0)5{ct - ct0), ffi*(x» - х£) d*x = 1
(здесь и далее d4x = cdtdr), введем в выражение для р (1.2) единицу
вида 1 = / 8(х° — Xq) dx°; тогда
= е /V(x" - xft) dx°.
Поскольку функция S4(xl* — х£) инвариантна относительно /50(1,3),
ясно, что р имеет те же трансформационные свойства, что и х°. Точно
так же находим
j = ec Г64(х» - х%)^ dt = ее [64(х» - х»)^ ds,
J dx j ds
где s — инвариантный интервал. Таким образом, j преобразуется
как г, и, следовательно, совокупность величин
j1* = (cp,j)
5.2. Преобразования Лоренца 45
представляет собой вектор в пространстве Минковского (4-вектор
тока).
Трансформационные свойства <р и А теперь однозначно
следуют из того факта, что □ — инвариантный оператор, а правые
части (5.4), (5.5) в совокупности образуют 4-вектор тока jM. Значит,
потенциалы образуют аналогичный вектор
A" = {VtA).
Это также соответствует виду дополнительного условия (5.3), которое
теперь принимает вид 4-дивергенции
дА»
дх"
= 0 (5.9)
и, таким образом, представляет собой уравнение, инвариантное
относительно ISO(l, 3). Итак, система уравнений Максвелла сведена к
уравнению Д'Аламбера для ^-потенциала
47Г
UA* =■ —-j"
с J
с дополнительным условием (5.9).
5.2. Преобразования Лоренца
Преобразования (5.7) имеют естественную физическую
интерпретацию как преобразования к движущейся системе отсчета. Полагая
th ф = V/c, будем иметь
_/_ *~Vt t, = t- $x ^ z/ = z
у2
Ф^¥ Ф
При V/c <tc 1 получаем х' = х — Vt, i! = t, т. е. преобразования
Галилея ньютоновской механики. Новым элементом является
преобразование времени: это плата за одинаковость скорости света во всех
инерциальных системах отсчета. Преобразования (5.10) иногда
называют бустом, следуя англофильской традиции.
При преобразованиях (5.10) перехода к системе, движущейся
относительно исходной в направлении оси х (ориентация осей в обеих
системах предполагается одинаковой), поперечные координаты не
изменяются: у' = у, z' = 2. Если считать вектор скорости
штрихованной системы относительно нештрихованной направленным
произвольно, то преобразования выглядят более громоздко. Для их вывода
следует заменить х на V(r ■ V/V2) (и соответственно х') и учесть, что
46 Глава 5. Уравнения Максвелла и группа Лоренца
поперечная к V часть г не испытывает преобразования. В результате
найдем
г' = 7(г - Vt) + (7 - 1)(г-х n)xn, t' = j(t- ^Л ,
V i C (5.11)
п= —, 7= /
Ф^
с*
По аналогичному закону преобразуются компоненты введенных
выше 4-векторов j1* и Ам. Что касается преобразования напряженно-
стей электрического и магнитного полей, то, как видно из
соотношений (5.1), их трансформационные свойства получить сложнее.
Поэтому можно пойти по другому пути, построив 4-ковариантный объект из
производных 4-потенциала А1*.
5.3. Тензор электромагнитного поля
Рассмотрим 1-форму четырехмерного потенциала
A = Altdxli = (pcdt-A-dr (5.12)
(знак «минус» возник из-за опускания индекса пространственной
части по метрике (5.8)). Калибровочное преобразование (5.2) теперь
выглядит так:
А -> А' = Д _ I dV>, (5.13)
поэтому внешняя производная от А будет калибровочно-инвариантной
величиной:
¥ = dA=^dxflAdxl/.
Производя отождествление результата дифференцирования с
соотношениями (5.1), находим
F = Ecdt Adr -BzdxAdy-BxdyAdz-BydzA dx. (5.14)
Итак, мы получили антисимметричную матрицу, представляющую
собой тензор электромагнитного поля
-Г fiv — ОцАъ, Ui/Ац —
( °
-Ех
-Еу
\-Еж
Ех
0
вг
-By
Еу
-bz
0
вх
ЕЛ
By
-в,
о )
(5.15)
5.3. Тензор электромагнитного поля
47
Таким образом, трансформационные свойства векторов
электрического и магнитного полей Е и В определяются преобразованиями
Лоренца ковариантного антисимметричного тензора второго ранга. Проще
всего получить преобразования компонент векторов Е и В, используя
лоренц-инвариантность 2-формы (5.14). Выражая в (5.14) нештрихо-
ванные координаты через штрихованные
V
dx = j(dx' + V dt'), dt = -y(dt' + -=■ dx'), dy = dy', dz = dz'
и собирая коэффициенты снова в виде (5.14), яо уже относительно
штрихованных величин, находим
Е'Х = ЕХ, В'Х = ВХ,
Е'у = l{Ev - ^Bz), В'у = -у(Ву + ^Ez),
Е'г = >y(Ez + ^Ву), B'z = 7(В, - ^Ey).
Как видно из этих формул, продольные по отношению к V
компоненты Е и В являются инвариантами преобразований.
Можно построить также два квадратичных инварианта:
Д = \f^f^ = b2- е2,
i2 = \^vXtf^fXt = -e-b,
(здесь е*"/Аг — абсолютно антисимметричный тензор в М^з —
символ Леви-Чивитпа, е0123 = 1, остальные компоненты равны ±1 для
четных/нечетных подстановок индексов). Преобразованиями Лоренца
можно всегда добиться того, чтобы векторы Е и В приобрели любые
значения, ограниченные лишь неизменностью инвариантов 1\ и /г-
Поэтому если в некоторой системе Е JL В (72 = 0) и \Е\ > \В\ (Д > 0),
то можно найти систему, в которой поле будет чисто электрическим,
а если \Е\ < \В\, — то лишь магнитным. Если Е • В ф 0 в
некоторой системе {Ii ф 0), то таких систем не существует. В случае если
Ii = I2 = 0, в любой системе поля остаются равными по величине и
ортогональными (в частности, этому условию удовлетворяют плоские
волны).
В четырехмерном пространстве дуальной (в смысле Ходжа)
формой к 2-форме Г является также 2-форма, равная
*F = Be dt Adr + Ez dx A dy + Ex dy A dz + Ey dz A dx,
48 Глава 5. Уравнения Максвелла и группа Лоренца
либо в матричном виде
*F,
м" —: 2бм"Лт
рХт _
/ О
-вх
By
\-вя
вх
о
-Е,
Е„
Ez
О
-Е,
-Ev
Ех
О /
Обратимся к записи уравнений Максвелла на языке тензоров FM„,
bFp». Поскольку F = dA, имеем d¥ = 0. В тензорном виде это
эквивалентно уравнениям
*Ьи/,А] = ° J™60 d^F^ = 0.
(5.16)
Эти уравнения содержат однородные уравнения (3.5), (3.7).
Уравнения (3.4), (3.6) эквивалентны соотношению
drF»" =
4п
(5.17)
Вместе (5.16) и (5.17) можно представить в виде одного комплексного
уравнения
dvT»v = -—j", T»v = F"" + W,
при этом подразумевается, что Im j^ = 0.
Глава 6
Специальная теория
относительности
6.1. Принцип относительности
Еще в ньютоновской механике был сформулирован принцип
относительности, согласно которому физические законы одинаковы во
всех инерциальных системах отсчета (ИСО). Математическим
выражением этого принципа в классической механике была
инвариантность уравнений относительно преобразований Галилея г —¥ r—Vt, где
V — скорость одной системы относительно другой. Подразумевается,
что время не преобразуется и течет одинаково во всех инерциальных
системах отсчета. Справедливость этих положений была проверена в
механических опытах для скоростей, малых по сравнению со
скоростью света.
Уравнения Максвелла не ковариантны по отношению к
преобразованиям Галилея. Однако принцип относительности можно
сформулировать и для уравнений Максвелла, если принять, что переход от
одной ИСО к другой описывается преобразованиями Лоренца.
Поскольку при малых скоростях преобразования Лоренца действительно
переходят в преобразования Галилея, то естественно предположить, что
ньютоновская механика является приближенной формой более
точной релятивистской механики. В конце XIX в. в этом вопросе,
однако, не было ясности и предлагалась альтернативная интерпретация
уравнений Максвелла, согласно которой эти уравнения следовало
относить к некоторой абсолютной системе отсчета, связанной с эфиром.
Это позволяло сохранить принцип относительности механики в фор-
50
Глава 6. Специальная теория относительности
ме Галилея. Эфир должен быть неподвижен относительно Солнца, это
следовало из изменения положения звезд на небесной сфере
(аберрация) при годичном движении Земли. Однако в таком случае скорости
световых сигналов, испускаемых с Земли в различных направлениях,
были бы различными по отношению к Солнцу из-за движения
Земли относительно эфира. Опыты Майкельсона в 80-х гг. прошлого века
опровергли это предположение.
В конечном счете в физике утвердилась точка зрения, выдвинутая
Эйнштейном в форме специальной теории относительности (СТО)
в 1905 г. Основным положением ее стало утверждение о
геометрическом характере преобразований Лоренца как свойстве физического
пространства-времени, а не просто преобразований симметрии частной
физической теории. Это означало необходимость пересмотра
классической механики, более того, это налагало требование лоренцевой
симметрии и на будущие физические теории. В начале XX в. проверка
этого предположения была возможна лишь в рамках
электродинамических экспериментов (что дало положительные результаты), но
впоследствии были открыты другие взаимодействия {слабые и сильные),
теории которых строились уже на основании СТО и которые также
были экспериментально подтверждены. Таким образом, современный
статус СТО покоится на солидной экспериментальной основе.
Вскоре были выяснены и ограничения применимости СТО. В ее
основе лежит предположение о существовании инерциальных систем
отсчета во всем пространстве-времени глобально, что эквивалентно
предположению о справедливости выражения для метрики
пространства событий (5.16) всюду. Это предположение оказалось неверным
при учете гравитационного взаимодействия. Гравитация делает
принципиально невозможным глобальное существование инерциальных
систем отсчета в присутствии любых материальных тел. Однако в
достаточно малой области пространства-времени, где можно считать
гравитационное поле постоянным и однородным, такие системы ввести
можно. Таким образом, при учете гравитации СТО справедлива лишь
локально. Общая теория относительности (ОТО) позволяет
преодолеть это ограничение СТО. Разумеется, пренебрежение гравитацией
оправдано при описании большинства электродинамических явлений,
равно как и явлений в физике высоких энергий, где участвуют
также и слабые взаимодействия. В опытах с элементарными частицами
гравитацией можно пренебречь вплоть до планковской энергии,
имеющей фантастическую величину 1019 ГэВ. Поэтому круг физических
явлений, описываемых СТО, чрезвычайно велик.
Мы уже убедились в том, что наиболее простая формулировка
уравнений электродинамики достигается в пространстве Минковско-
6.2. Геометрия пространства-времени
51
го, представляющем собой естественную геометрическую арену для
СТО. Обсудим теперь подробнее некоторые свойства этой геометрии
в физических терминах.
6.2. Геометрия пространства-времени
В пространстве Минковского
существует инвариантная поверхность,
световой конус, (рис. 6.1) определяемая
уравнением
х2 + у2 + z2 - с2*2 = 0,
которая делит пространство событий на
три части. Верхняя пола конуса (t > 0)
содержит все события, находящиеся в
будущем по отношению к событию,
принятому за начало четырехмерной системы
координат О. Все кривые — мировые
линии — изображающие движение частиц
со скоростью, меньшей с (массивных
частиц) и проходящие через О, лежат
внутри светового конуса. Область внутри нижней полы светового конуса
является областью абсолютного прошлого по отношению к точке О,
эти соотношения хронологии не зависят от выбора той или иной инер-
циальной системы отсчета. Все точки внутри конуса связаны с О
интервалом, квадрат которого положителен; такой интервал называется
времениподобным.
Область вне светового конуса отвечает событиям, связанным с О
интервалом, квадрат которого отрицателен; такой интервал
называется пространственноподобным. События в этой области происходят в
разных пространственных точках в любой инерциальной системе
отсчета и являются абсолютно удаленными от события О. Как мы
увидим ниже, временная последовательность таких событий зависит от
системы отсчета. Два события не могут быть причинно связанными,
если интервал между ними пространственноподобен.
Сама поверхность светового конуса является геометрическим
местом мировых линий безмассовых частиц (фронтов электромагнитных
волн, световых сигналов), распространяющихся со скоростью с. Эта
скорость является предельной скоростью любых перемещений
реальных физических тел.
Рис. 6.1. Световой конус
52
Глава 6. Специальная теория относительности
Вектором в пространстве Минковского Ri,3 является совокупность
четырех величин, преобразующихся, как хм. Квадрат 4-вектора по
псевдоевклидовой метрике
А2 = А^А„ = А% - А2
может быть положительным, отрицательным либо нулем.
Соответствующий вектор называется времениподобным, пространственнопо-
добным либо изотропным.
Инерциальной системой отсчета (ИСО) K(r,t) является
совокупность трехмерного репера и часов, причем предполагается, что в
каждой пространственной точке имеется возможность измерения времени
по глобально синхронизированным часам. Математически с каждой
ИСО связывается система координат хм в Ki)3. Переход к другой ИСО
описывается преобразованиями Лоренца.
6.3. Кинематические эффекты СТО
Преобразования Лоренца приводят к ряду кинематических
особенностей, которые с точки зрения здравого смысла, основанного на
представлениях ньютоновской механики, могут показаться
парадоксальными.
Собственное время
Рассмотрим часы, движущиеся вдоль времениподобной мировой
линии в некоторой выбранной ИСО. Тогда интервал, разделяющий
два близких положения часов, есть
ds2 = с2 dt2 - dr2 = c2dt2- v2 dt2 = c2(l- *р\ dt2, (6.1)
где v — скорость часов.
Рассмотрим другую ИСО, скорость которой в данный момент
совпадает со скоростью часов. Относительно этой системы часы
находятся в покое и, следовательно,
ds2 = c2dt'2. (6.2)
Приравнивая (6.1) и (6.2), получаем
6.3. Кинематические эффекты СТО
53
Здесь t' является собственным временем движущихся часов. Тем
самым раскрывается смысл интервала как (умноженного на с)
собственного времени. Таким образом, движущиеся часы всегда показывают
меньшее время, чем неподвижные.
Лоренцево сокращение масштаба
Пусть линейка, собственная длина которой равна Iq (эта длина
измеряется в ИСО К'(г',1?), в которой линейка покоится),
движется со скоростью г; относительно другой ИСО K(r,t). По часам К в
некоторый момент времени производятся одновременные измерения
координат начала и конца линейки. Тогда (выбирая скорость линейки
направленной вдоль оси х) имеем At = 0 и, следовательно,
согласно (5.10),
л > Ах
Ах =
v^
Обозначим длину линейки, измеренную таким образом в К, через / =
Дх; при этом Iq = Дх', так что
I
= <oV/l-J (6-3)
движущаяся линейка кажется короче. Заметим, что процесс сравнения
асимметричен: в системе К положения начала и конца линейки
замеряются одновременно (At = 0 ), эти события, однако, неодновременны
по часам К' (At1 ф 0).
Поскольку поперечные по отношению к скорости ИСО расстояния
не изменяются, то аналогично (6.3) изменяется элемент объема AV
при переходе от одной ИСО к другой:
AV
= AV0fi-±
При этом четырехмерный объем, является инвариантным:
АП = cAxAyAzAt = cAx'Ay'Az'At'.
Нарушение одновременности событий,
разделенных пространственноподобным интервалом
Пусть два события происходят одновременно (At = 0) в системе К
в разных точках, находящихся на расстоянии Дх = L (интервал
между такими событиями пространственноподобен). Тогда в системе К',
54
Глава 6. Специальная теория относительности
согласно (5.10), находим
At' = - LV
т. е. события неодновременны. Иначе говоря, временная
последовательность событий, разделенных пространственноподобным
интервалом, не является инвариантным понятием и зависит от системы
отсчета; если t[ > t'2 в одной ИСО, то, возможно, t\ < ti в другой.
Некоммутативность лоренцевых преобразований
Результат двух последовательных преобразований Галилея со
скоростями Vi, Vi не зависит от их порядка. В случае преобразований
Лоренца это не так. Действительно, два буста SO(l, 1) в
различных псевдоплоскостях не коммутируют в группе 50(1,3).
Генераторами 50(1,3) являются операторы вращений L^v (псевдовращений) в
различных плоскостях ж** Л xv. Алгебра so(l, 3) имеет вид
[Хдцу, 2/тд] = LMTT)V\ — LmxVvt — Ijvr'HiiX + -^i/Л^т-
В частности,
[Loi,Lo2] — L\2,
т. е. коммутатор двух преобразований Лоренца в
псевдоплоскостях {ct, х) и {ct, у) представляет собой пространственный поворот
вокруг оси z.
6.4. Пространство скоростей
В ньютоновской механике скорости складываются по правилу
параллелограмма как векторы в К3 с евклидовой метрикой. В СТО это
не так; в частности, если источник светового импульса,
распространяющегося со скоростью с, движется относительно неподвижной
системы со скоростью V, то скорость импульса в неподвижной системе
по-прежнему будет равна с. Пусть скорость частицы относительно
системы К есть v = dr/dt, а относительно системы К' равна «' = dr'/dt.
Если скорость системы К' направлена вдоль оси х системы К, то
формулы преобразования компонент скорости можно получить,
дифференцируя (5.10):
6.4. Пространство скоростей 55
Заметим, что если vx — с и vy = vz = 0, то v'x = с независимо от V:
как и следовало ожидать, скорость света одинакова во всех ИСО. Луч
света, распространяющийся в системе К под углом 9 к оси у, (ух =
с cos 9, vy = с sin в), будет виден из системы К' под другим углом:
v„ , зя10\А—
V2
"Л = te 9' =
v'x 6 соав-V/c '
Это явление называется аберрацией, оно хорошо известно в
астрономии (годичное изменение углового положения звезд за счет изменения
направления движения Земли вокруг Солнца).
Если скорость V" системы К1 относительно К имеет произвольное
направление, то преобразование скоростей можно получить
дифференцированием общего преобразования координат и времени (5.11):
,_ v -V + п{У - vn)(l - 7)
V ~ 7(1 -W/c2)
» = £, V=\V\, 7=^=L==-
Абсолютная величина v' при этом имеет простой вид
(6.4)
1 — vv /сг
Формула (6.4) выражает собой неевклидово правило сложения
скоростей в СТО; при V <tC с она переходит в правило
параллелограмма и' = v — V. Будем рассматривать относительную скорость двух
частиц 1 и 2 как скорость частицы 2 в системе покоя частицы 1.
Если скорости близки, «1 = v, v-2 = v + dv, для получения
абсолютной величины относительной скорости dvOTH следует положить в (6.5)
v — V = dv, в результате находим
2 _ dv2 -[VX do]2/С1
dvn~, =
(1 - v2/c2y
Эту величину можно понимать как элемент длины в релятивистском
пространстве скоростей dl2 = dv2TM. Переходя к сферическим
координатам
v = v (sin 9 cos <р, sin 9 sin y>, cos 9),
будем иметь
dv2 v2
*г = (i-v2/c2)2 + T^7?(d"2 + *** °V)'
56 Глава 6. Специальная теория относительности
или, полагая v = ctbip,
dl$ = с2 {d-ф2 + sh2 ф(<1в2 + sin2 0 dtp2)) .
Таким образом, релятивистское пространство скоростей является
пространством постоянной отрицательной кривизны (пространство
Лобачевского).
Глава 7
Релятивистская механика
В ньютоновской механике взаимодействие двух частиц
описывается посредством парного потенциала U(r\ — Г2), и уравнения движения
ma^r = -Va£/, a =1,2 (7.1)
(суммирования по а нет) отвечают представлению о мгновенном
характере распространения взаимодействия. В случае системы зарядов,
взаимодействующих посредством электромагнитного поля, ситуация
иная: во-первых, взаимодействие за исключением
электростатического случая не является потенциальным, во-вторых, электромагнитное
поле, как было показано в главе 5, распространяется с конечной
скоростью с. Кроме того, уравнения (7.1) инвариантны относительно
преобразований Галилея, а не Лоренца, и, следовательно, их совместное
рассмотрение с уравнениями Максвелла при надлежащей замене силы
в (7.1) на правую часть (3.8) невозможно. Вместе с тем можно
ожидать, что в пределе малых скоростей уравнения (7.1) с силой Лоренца в
правой части будут справедливы. Поэтому для отыскания правильной
формы релятивистского уравнения движения заряда можно считать,
что уравнение ньютоновской механики
ш%=,В (7.2)
выполняется в системе отсчета, в которой в выбранный момент
времени v = 0. Затем следует совершить преобразование Лоренца к
ИСО, в которой v не мало. Практически, однако, удобнее сначала
развить релятивистскую кинематику формально, а затем построить
лоренц-ковариантное уравнение, которое в системе покоя переходило
бы в (7.2).
56 Глава 6. Специальная теория относительности
или, полагая v = сЬЪф,
dll = с2 (drl>2 + sh2 4>(сЮ2 + sin2 в dip2)) .
Таким образом, релятивистское пространство скоростей является
пространством постоянной отрицательной кривизны (пространство
Лобачевского).
Глава 7
Релятивистская механика
В ньютоновской механике взаимодействие двух частиц
описывается посредством парного потенциала U{r\ — Гг), и уравнения движения
m0^ = -V„l/, a = 1,2 (7.1)
(суммирования по а нет) отвечают представлению о мгновенном
характере распространения взаимодействия. В случае системы зарядов,
взаимодействующих посредством электромагнитного поля, ситуация
иная: во-первых, взаимодействие за исключением
электростатического случая не является потенциальным, во-вторых, электромагнитное
поле, как было показано в главе 5, распространяется с конечной
скоростью с. Кроме того, уравнения (7.1) инвариантны относительно
преобразований Галилея, а не Лоренца, и, следовательно, их совместное
рассмотрение с уравнениями Максвелла при надлежащей замене силы
в (7.1) на правую часть (3.8) невозможно. Вместе с тем можно
ожидать, что в пределе малых скоростей уравнения (7.1) с силой Лоренца в
правой части будут справедливы. Поэтому для отыскания правильной
формы релятивистского уравнения движения заряда можно считать,
что уравнение ньютоновской механики
ш%=еЕ (7.2)
выполняется в системе отсчета, в которой в выбранный момент
времени v = 0. Затем следует совершить преобразование Лоренца к
ИСО, в которой v не мало. Практически, однако, удобнее сначала
развить релятивистскую кинематику формально, а затем построить
лоренц-ковариантное уравнение, которое в системе покоя переходило
бы в (7.2).
58 Глава 7. Релятивистская механика
7.1. Релятивистские уравнения движения
Движение частиц вдоль кривой г = r(t) изображается в
пространстве событий в виде времениподобной мировой линии хм = x**(s).
Введем 4-вектор касательной к хм, называемый 4-скоростью частицы:
„ dx» ( dt dr\ ( dt drdt\ „/, »\ , ч
где u° = cdt/ds. Квадрат 4-скорости по метрике Минковского (5.8)
равен единице в силу выбора в качестве параметра на кривой
интервала s:
2 _ dx» dxv ds2 Л
u =и^=^ — — = — = 1. (7.4)
С другой стороны,
«2 = («°)2 (l - £) , (7-5)
откуда следует
у 1 - v'/c2 су/1 — v2/c2
В системе покоя частицы
«° = 1, и = 0. (7.7)
Построим теперь 4-вектор ускорения, дифференцируя 4-скорость
по параметру:
u du» dtdu» u° d г n / v\1 , »
Заметим, что в силу равенства и2 = 1 векторы гим и и*4 ортогональны
по метрике (5.8): поскольку du2/ds = 0, то
и^Пц = 0. (7.9)
В системе покоя из (7.8) находим:
-"-(••г), -г- <™>
Поэтому «правильная» форма левой части уравнения (7.2) в
произвольной ИСО должна быть тс2тм. Рассмотрим теперь правую часть
этого уравнения. Построим 4-вектор силы
/" = е^%и" = (/",/), (7.11)
7.1. Релятивистские уравнения движения 59
где F^,, — тензор электромагнитного поля (5.15) с поднятым
индексом fx. Подстановка явных выражений дает
/ = ей0, (е + i[v х В]\ , (7.12)
е
f = -u° (E-v). (7.13)
с
При v -> 0 имеем и0 -» 1, и пространственная часть вектора /**
совпадает с правой частью (7.2). Итак, лоренц-ковариантное уравнение
mc2w" = /" (7.14)
при v —> 0 имеет пространственную часть, совпадающую с (7.2), что и
представляет желаемый результат. Рассмотрим теперь подробнее
компоненту /ц = 0:
mcu°??- = —{E-v). (7.15)
at с
Сократив на и0/с, получим в правой части работу силы / над зарядом
в единицу времени. Отсюда следует, что величина
£ = тс2и° = ™С\/2 (7-16)
■у/1 — VZ/(T
должна быть отождествлена с кинетической энергией частицы, так
что d£/dt = eEv. Заметим, что при v —¥ 0
mv
2
£~тс2+^- + ..., (7.17)
т. е. получаем ньютоновское выражение для кинетической энергии с
точностью до постоянной энергии покоя тс2.
Пространственную часть (7.14) также можно представить в
привычном виде соотношения «производная от импульса равна силе»,
если ввести релятивистский импульс
р = тси = . =, (7-18)
И sj\-v2/c2
переходящий при v —> 0 в импульс ньютоновской теории то. С
помощью р пространственная часть уравнения (7.14) переписывается в
виде
£-.(»+1(.хЯ|). (7.19)
60
Глава 7. Релятивистская механика
Итак, мы приходим к выводу, что лоренц-ковариантное уравнение
duP e
тс~ = -F»vuv (7.20)
as с
имеет ньютоновский нерелятивистский предел, а также содержит в
себе уравнение изменения энергии (компонента и = 0)
Заметим, что это последнее является следствием пространственной
части уравнения (7.20), эквивалентной уравнению (7.19). Действительно,
умножая (7.19) скалярно на v и принимая во внимание определения
(7.16) и (7.18), получим (7.21). Это неудивительно, поскольку
четыре компоненты уравнения (7.20) удовлетворяют условию связи (7.9),
которое автоматически следует из (7.20) ввиду антисимметрии -FM„.
Кинетическая энергия (7.16) и импульс (7.18) удовлетворяют
соотношению
£2 = т2с4 + с2р2. (7.22)
Если объединить £ и р в 4-вектор импульса
р» = тси» = (-,р) ■ (7.23)
то квадрат этого вектора по метрике (5.8) в силу (7.22) будет равен
Р2 = Р*Рц = т2с2. (7.24)
При v —>■ с энергия частицы и ее импульс стремятся к
бесконечности, поэтому скорость света недостижима для частиц отличной от
нуля массы. Однако соотношения (7.22) и (7.24) сохраняют смысл и
при т = 0, в этом случае
£ = с\р\. (7.25)
Это соотношение вполне соответствует формулам (4.6), (4.7),
полученным для электромагнитных волн. В квантовой теории
электромагнитная волна имеет корпускулярный аналог, фотон, для которого энергия
и импульс действительно связаны соотношениями (7.25). Таким
образом, можно сохранить представление о 4-импульсе и для безмассовых
частиц, движущихся со скоростью с. В частности, можно применять
закон сохранения энергии и импульса при рассмотрении столкновений
элементарных частиц в форме
£# = Х>- (7-26)
а=1 а=1
7.2. Функция Лагранжа 61
где р£, р'а — импульсы частиц до и после столкновения. При этом
р\ = т^с2 для массивных частиц и р\ = 0 для безмассовых.
7.2. Функция Лагранжа
Вариационный принцип механики {принцип наименьшего
действия) позволяет свести описание физической системы к выбору
функционала 5[ga(t)], заданного на множестве кривых в
конфигурационном пространстве {qa} € Мк, о = 1,...,К, и называемого
действием, обращение в нуль первой вариации которого
SS[qa(t)] = 0 (7.27)
эквивалентно уравнениям движения. Преимущество такого описания
состоит в том, что действие S должно быть инвариантным
относительно группы симметрии рассматриваемой системы, в то время как
уравнения движения лишь ковариантны, т. е. преобразуются по
некоторому представлению группы симметрии.
Напомним, что функционал S ньютоновской механики
материальной точки может быть построен именно исходя из соображений
инвариантности относительно группы ISO(3) (трансляций и вращений в
К3), а также преобразований Галилея г —> г — Vt, t —> t. Для
свободной частицы требуемую симметрию имеет функционал
*и*>]=/?(£)*■*• <™>
Его вариация
t, t,
5S= f m^^^ldt = mvSr\lf -m f ^ • 5т dt = 0 (7.29)
J dt dt "o J dt
to to
при условии обращения в нуль вариации 5т в начальный и конечный
моменты времени приводит к уравнению движения
го$ = 0. (7.30)
at
В общем случае действие для механической системы с конечным
числом степеней свободы можно представить в виде
S[qa{T)}=fL(qa,qa,T)dT, (7.31)
62 Глава 7. Релятивистская механика
где д°(т) — совокупность обобщенных координат, зависящих от
параметра т (не обязательно совпадающего со временем), qa = dqa/dr и
L ~ функция Лагранжа. Принцип наименьшего действия требует
обращения в нуль первой вариации действия (7.27) при варьировании
переменных с «закрепленными концами»
9аМ-Х7в(т) + &7», Sqa =Sqa =0. (7.32)
Г—То T=Tf
Обращение в нуль вариации (7.27) эквивалентно уравнениям Эйлера—
Лагранжа для L:
jLEL- EL
dr dq°~ dq°- (733)
В релятивистской механике простейший способ удовлетворить
требованиям /50(1,3)-симметрии — это выбрать действие для свободной
частицы пропорциональным интервалу (для упрощения записи будем
опускать пределы интегрирования)
S0 = -mcfds. (7.34)
Если перейти к трехмерным переменным {q°} = {r(t)}, го будем иметь
So = — тс
следовательно, функция Лагранжа равна
I ^2~
L0 = -mc2^l-—.
:/(1)_1<й=—c2/v^-?dt' (7-35)
(7.36)
Ее разложение при малых v
L0 ~ -тс2 + ^ + ... (7.37)
соответствует с точностью до несущественной постоянной
ньютоновской функции Лагранжа в (7.28).
Взаимодействие с электромагнитным полем должно быть введено
так, чтобы помимо /150(1,3)-инвариантности обеспечить линейную
зависимость силы от Е и В. Единственная приемлемая величина
представляет собой интеграл от 1-формы потенциала (5.12) вдоль мировой
линии х* = атм(з):
S\ = — / А = — е / I (pdt А • dr ] .
(7.38)
7.3. Уравнения Гамильтона и Гамильтона—Якоби 63
Объединяя это выражение с So, получаем действие для заряда в
электромагнитном поле S — So + Si в виде
S = Г 1-rocVl - J + ^А ■ v - еу J dt, (7.39)
и, следовательно, функция Лагранжа равна
L = -mc2 i/l - % + - А ■ v - eip. (7.40)
V с* с
Хотя действие (7.38) зависит от 1-формы потенциала,
определенной лишь с точностью до калибровочного преобразования (5.13),
интеграл (7.38) при преобразовании (5.13) изменяется на величину SS\ —
—(e/c)(t^(tf) — ip(to)), при варьировании же согласно (7.32) вариации
переменных на концах интервала равны нулю. Поэтому уравнения
движения будут калибровочно инвариантны.
Подстановка (7.40) в (7.33) (где {qa} = {г}) приводит после
преобразований к уравнению (7.19). При этом следует учесть, что
потенциалы А и <р зависят от г, t, поэтому
dA* dAidx^ dAi ,_,,.
= г 1 и т.д. (7.41)
dt дхз dt dt A V ;
7.3. Уравнения Гамильтона и Гамильтона—
Якоби
Для перехода к гамильтонову описанию необходимо ввести
обобщенный импульс
^ &L е . mv . .
Р=1Г=р+-А, р = (7.42)
dv с y/l-v2/c2
и гамильтониан по обычному правилу
тс2
H = P.v-L= ""„+«¥>• (7-43)
Чтобы представить гамильтониан как функцию Риг, заметим, что
Н — eip = £, поэтому из (7.22) находим выражение
H(r, P, t)=e<p+ JmV + с2 (Р - -с А) *, (7.44)
64
Глава 7. Релятивистская механика
которое зависит от г и t через потенциалы <р и А.
В нерелятивистском пределе это выражение переходит в
следующее:
Н = тс2 + -!- (Р - -А)2 + е<р, (7.45)
2771 V С /
где второй член есть кинетическая энергия р2 /2т, выраженная через
обобщенный импульс Р, а третий — потенциальная энергия.
Уравнения Гамильтона имеют вид
d_r = a_H dP = _dH {7M)
dt 8P' dt дг' к '
при этом полная производная Н по времени равна частной
производной по времени от функции Лагранжа, взятой со знаком «минус» :
S--&
Поэтому Н является интегралом движения, если (р и А не зависят от
времени явно.
Наконец, применим к данной задаче теорию Гамильтона-Якоби.
Напомним, что основным объектом теории является функция
действия, зависящая от координат и времени, которая определяется как
интеграл от функции Лагранжа вдоль истинных траекторий,
заканчивающихся в момент t в произвольной точке г:
t
S(r, t)= f L(t, r, t')dt'. (7.48)
При этом для производных этой функции имеем
Г 8L , Г d 8L . „
d4=d4-94- r = L-P.v=-H.
dt dt дг
(7.49)
Подстановка обобщенного импульса Р и гамильтониана Н,
выраженных через производные от S, в уравнение (7.44), предварительно
возведенное в квадрат, дает уравнение Гамильтона-Якоби
7.3. Уравнения Гамильтона и Гамильтона-Якоби 65
Для решения уравнений движения методом Гамильтона-Якоби
необходимо найти так называемый полный интеграл S(r,tx,t),
содержащий столько произвольных постоянных а, сколько имеется
независимых координат. Согласно теореме Гамильтона-Якоби,
дифференцирование S(r,ex,t) по а дает новые постоянные
— = 0 = const, (7.51)
что и определяет закон движения. В основе этого утверждения
лежит теория канонических преобразований гамильтоновой механики.
Действие S является производящей функцией канонического
преобразования к новым гамильтоновым переменным, в которых функция
Гамильтона тождественно обращается в нуль.
Основным практическим способом решения уравнения
Гамильтона-Якоби является разделение переменных. Если удается ввести
такие координаты, в которых действие Гамильтона-Якоби представимо
в виде суммы функций, зависящих каждая от одной переменной, то
задача решается в квадратурах.
3-8210
Глава 8
Вариационный принцип
для электромагнитного
поля
Уравнения Максвелла были выведены выше на основании
обобщения совокупности экспериментальных фактов. Исторически дело
обстояло именно так: Максвелл получил носящую его имя систему
уравнений, анализируя труды Фарадея, которым был накоплен и
систематизирован обширный экспериментальный материал. С точки зрения
современной теории, уравнения Максвелла представляют собой
уравнения безмасового поля со спином единица. При этом безмассовость
поля приводит к закону Кулона и распространению волн с
универсальной скоростью света. Равенство спина (внутреннего момента
количества движения) единице обусловливает отталкивание одноименных
зарядов. Имеются всего три значения спина классических безмассовых
полей — нуль, единица и два, для которых можно построить
содержательную теорию, включающую взаимодействие с другими полями
и частицами. При этом спины нуль и единица дают притяжение
одноименных зарядов, а спин единица — отталкивание. Спин два
соответствует гравитационному полю, безмассовое поле спина нуль
(скалярное поле) до сих пор экспериментально не наблюдалось. Так же
как и в механике, в теории поля универсальным способом получения
уравнений является принцип наименьшего действия.
8.1. Пале как механическая система
67
8.1. Поле как механическая система с
бесконечным числом степеней свободы
Поле, принимающее непрерывные значения в пространстве, можно
рассматривать как механическую систему с бесконечным числом
степеней свободы. В качестве множества обобщенных координат удобно
выбрать значения 1-формы A(r, t) в каждой пространственной
точке г:
{qa(t)} = {AM(r,t)},
иначе говоря, роль индекса а выполняет совокупность векторного
индекса ц и непрерывно изменяющейся пространственной координаты г.
При этом суммирование по индексу а переходит в суммирование по ц,
и интегрирование по г.
а ц J
поэтому действие становится интегралом по пространству событий от
плотности функции Лагранжа. Лоренц-инвариантность требует,
чтобы производные по времени и пространственным координатам входили
в действие равноправно в виде д/дх11. Таким образом, вместо q" будем
иметь А^„ = диАм. Итак, функционал действия для
электромагнитного поля можно представить в виде
S[A] = ~jc(A(l,AtltV)a^x, (8.1)
где С — плотность функции Лагранжа. Для свободного поля эта
функция не должна зависеть от х явно, физически такая зависимость
означала бы, что система не является замкнутой. Для поля,
порождаемого системой заряженных частиц, функция Лагранжа дополнительно
должна зависеть от координат и 4-скоростей зарядов.
Вариационная задача для поля ставится следующим образом.
Рассмотрим замкнутую область П в пространстве событий с границей
дП = V0 U Vf U Е, (8.2)
где Vo и V/ — две пространственноподобные гиперповерхности,
нормали к которым времениподобны, а Е — бесконечно удаленная
гиперповерхность с пространственноподобной нормалью, замыкающая
гиперповерхность 8(1. В частности, под Vq и Vf можно понимать трехмерное
3*
68
Глава 8. Вариационный принцип для поля
пространство в моменты времени t = to и t = tf в некоторой
заданной лоренцевой системе отсчета. Преобразования Лоренца не
изменяют времениподобности нормалей к Vq и Vf, таким образом, разбиение
(8.2) лоренц-инвариантно.
При варьировании действия (8.1) предполагается, что вариации
SA = 0 на граничных гиперповерхностях Vq, Vf исчезают, что
является обобщением правила варьирования механики (7.32). Уравнение
Эйлера-Лагранжа выводится следующим образом. Варьируем
действие в форме (8.1):
п
n an
где при переходе ко второй строке была использована формула
Остроградского-Гаусса
/dvGvdAx= IGvdEv.
n an
Поверхностный итеграл равен нулю на Vo, Vf, где исчезают вариации
SA^. Кроме того, предполагаем, что поле на пространственной
бесконечности £ отсутствует, поэтому равен нулю также интеграл вдоль £.
В результате в силу произвольности вариаций 5А^ внутри области П
получаем уравнение Эйлера-Лагранжа
9С -*#-. (8-3)
ЗА^ vdA^
которое можно рассматривать как обобщение уравнения (7.33) с
заменой q -> Ац, d/dt ->■ dv.
8.2. Действие для электромагнитного
поля
Явное выражение для плотности функции Лагранжа С. строится из
соображений лоренц-инвариантности, калибровочной инвариантности
и требования линейности полевых уравнений. Более того, часть
действия, описывающая взаимодействие зарядов и поля, нам уже
известна (7.38), и она должна остаться неизменной. Представим ее теперь в
8.2. Действие для электромагнитного поля
69
виде 4-мерного интеграла
Sl = -± J А = -1 Jj^(x)Alx(x)d4x, (8.4)
x(i) П
где введен 4-вектор тока
31Л = ес1uli{s)SA{x - x{s))ds, (8.5)
ассоциируемого с движением заряда е вдоль мировой линии х*1 = x**(s)
(в случае совокупности зарядов следует взять сумму выражений (8.5)
по всем зарядам). Хотя в (8.4) входит калибровочно неинвариантная
величина А^, это не представляет опасности, поскольку действие (8.4)
при преобразовании А^ —^ Ац + d^ip переходит в
Si^S!-~ [рд^нРх = Si - i f д„ (J»rP) d*x, (8.6)
n n
где учтено уравнение непрерывности тока d^j** = 0. Изменение
плотности функции Лагранжа на 4-дивергенцию не влияет на уравнения
Эйлера-Лагранжа, поскольку интеграл в (8.6) можно преобразовать в
поверхностный интеграл по границе дП, что не сказывается на
результате варьирования в силу обращения в нуль вариаций поля на дП.
Плотность функции Лагранжа собственно электромагнитного
поля не должна зависеть явно от А^ (в этом случае калибровочная
инвариантность была бы утрачена) и, следовательно, может зависеть
только от калибровочно-инвариантной внешней производной dA =
F. Наконец, чтобы уравнения были линейными, остается
единственный выбор в виде квадратичного инварианта F2 = FIAVF,U/.
Заметим, что псевдоскалярный инвариант *FijIVF,1v при учете соотношения
(5.16) может быть представлен в виде полной дивергенции *FftvF,i'/ =
dll{e,ivXTAVF\T), которая не изменяет уравнений Эйлера-Лагранжа.
Вводя коэффициент — 1/1&7Г для согласования со сделанным ранее
выбором единиц, окончательно получим
S = SF + Si, (8.7)
Sf = f CFd4x = - ^— f F^F^dtx. (8.8)
Подстановка (8.7), (8.4) и (8.8) в (8.3) приводит к уравнениям
Максвелла
dvF»v = -^-j", (8.9)
70
Глава 8. Вариационный принцип для поля
при этом остальные однородные уравнения выполняются
тождественно: <iF = 0 в силу выбора в качестве обощенных координат поля
1-формы А. Объединяя полевое действие с действием зарядов для системы
N заряженных частиц и порождаемого ими электромагнитного поля,
находим:
N
S = -^Г,тас Jdsa - ^ J j'A^x - —^ Г F^F^^x, (8.10)
a—l
П
где суммирование ведется по всем зарядам и 4-вектор полного тока
определяется выражением
J" =J2e°cf<S4(x ~ x"(s))ds.
Варьирование действия (8.10) по xa(s) затрагивает первые два
слагаемых и приводит к уравнениям движения зарядов, варьирование по А^
дает уравнения Максвелла (8.9). Итак, самосогласованная динамика
зарядов, взаимодействующих посредством электромагнитного поля,
описывается действием (8.10). Заметим, что электромагнитное
взаимодействие двух зарядов не может быть описано с помощью функции
Лагранжа, зависящей только от координат и скоростей частиц.
Физически это означает, что создаваемое зарядами поле является
самостоятельной динамической системой с бесконечным числом степеней
свободы. Таким образом, система двух взаимодействующих зарядов
в электродинамике является системой с бесконечным числом степеней
свободы. В пределе малых скоростей можно построить приближенную
функцию Лагранжа, которая зависит только от координат и
скоростей частиц, в общем случае релятивистского движения этого сделать
нельзя. В частности, как мы увидим далее, движение
взаимодействующих зарядов может сопровождаться электромагнитным излучением,
которое представляет собой порождение зарядами электромагнитных
волн.
8.3. Тензор энергии-импульса
Рассмотрим сначала свободное электромагнитное поле. В этом
случае плотность функции Лагранжа в (8.1) не зависит от координат
явно, поэтому ее полная производная по х** равна
дс = дс ал* ас элл,„
&с" &4Д дх» дАх,и дх» ' К ' '
8.3. Тензор энергия-тшулъса
71
Будем считать, что поле удовлетворяет уравнениям Эйлера-Лагранжа
(8.3). Тогда, преобразуя первое слагаемое в (8.11) и меняя порядок
производных во втором, будем иметь
дхТ = д" {бА^) *** + 8А^д" <^-> • (8Л2>
что группируется в полную производную по х". Равенство (8.12)
можно поэтому представить в виде
дЛц = 0, (8.13)
*? = Ах«ш^-Ъс- (8Л4)
Величина (8.14) называется каноническим тензором
энергии-импульса (ТЭИ). Его построение аналогично построению гамильтониана в
механике, при этом q -> Лд, dt —»• ди. В последнем случае отсутствие
явной зависимости функции Лагранжа от t приводило к равенству нулю
полной производной от функции Гамильтона, т. е. закону сохранения
энергии. Нетрудно понять, что соотношение (8.13) также порождает
закон сохранения, в данном случае для 4-импульса поля
pti{y) = -cfTlrdsv,
V
где V — пространственно-подобная трехмерная гиперповерхность с
нормалью в направлении возрастания t (в некоторой лоренцевой
системе dSv = 5%d3x). Действительно, интегрируя (8.13) по замкнутому
4-объему Q с границей дП вида (8.2), находим
Р№) ~ Р»<Уо) = \fTMdS^ (8-15)
Е
где учтено, что внешняя нормаль к Vo направлена против t. Правая
часть (8.15) обращается в нуль, если поле достаточно быстро спадает
на пространственной бесконечности. В этом случае находим, что Рм
не зависит от выбора гиперповерхности V, т. е. не зависит от времени.
Заметим, что построение ТЭИ содержит неоднозначность, в
частности, если плотность лагранжиана изменить на полную
дивергенцию, то уравнения движения останутся прежними, а тензор энергии-
импульса изменится. Эту неоднозначность можно учесть следующим
образом. Рассмотрим тождество
о f [i/A] _ n
72 Глава 8. Вариационный принцип для поля
которое выполняется для произвольного трехвалентного тензора /й" ,
где квадратные скобки означают антисимметризацию
Добавление к ТЭИ величины
Tf + f^^Tf (8.16)
S
приводит к новому ТЭИ, Т", который также также удовлетворяет
соотношению (8.13). В частности, можно выбрать тензор / так, чтобы
новый тензор энергии-импульса был симметричен по индексам
S S
канонический ТЭИ этим свойством, вообще говоря, не обладает.
Симметричный ТЭИ имеет то преимущество, что позволяет построить
имеющий нулевую дивергенцию тензор 3-го ранга
Мм„а = \ (xfivx - хиТцЛ , (8.17)
9a*Va = О,
такой, что антисимметричный тензор
Lp,,
= J M^dSx (8.18)
сохраняется. Этот тензор называется 4-тензором момента количества
движения.
Построим канонический ТЭИ свободного электромагнитного поля.
Подставляя £р из (8.8) в (8.14), находим
где F2 = FliVF,tv'. Добавляя дивергенцию от тензора
t ["М — Lp"*^
из (8.16) получаем
8.3. Тензор энергии-импульса
73
Подстановка F^v из (5.15) приводит к следующим явным выражениям
для контравариантных компонент симметричного ТЭИ:
(8.20)
где W, S и ту определяются формулами (3.12), (3.14), (3.17). Таким
образом, компонента Г00 является плотностью энергии, смешанные
компоненты Т0' (умноженные на с) равны плотности импульса, а
пространственные компоненты T*J образуют тензор натяжений
электромагнитного поля. Поэтому 4-вектор
J./1I/ _
/ W
\Sx/c
\Sy/c
\Sz/c
Sx/c
Txx
TyX
Tzx
Sy/c
Try
TVV
T*V
Sx/c
Txz
Tyz
r„ ,
P"
= - JT'iVdSv= I [w<Px,- f Sd3!
V \V V
действительно представляет собой 4-импульс поля, находящегося в
объеме V.
Рассмотрим теперь полную систему, состоящую из зарядов и поля.
s
Тогда ТЭИ Т**" уже будет иметь ненулевую дивергенцию:
диТ^ = --F»„3V (8-21)
с
(при вычислении следует воспользоваться уравнениями Максвелла
cF11"^ = —foj1*, dF = 0). Этого и следовало ожидать, поскольку
теперь должен сохраняться лишь полный 4-импульс, включающий
4-импульс зарядов. Такой тензор здесь проще всего построить
исходя из физического смысла его компонент Т**0 как плотности энергии-
импульса (вариационное построение будет описано в гл. 12). Таким
свойством обладает симметричный тензор
Г"" = J2mac u»uva8\x - xa{s))ds, (8.22)
о=1 ^
который представляет собой тензорный аналог плотности 4-тока. Диф-
74
Глава 8. Вариационный принцип для поля
ференцируя по х" с учетом соотношения dx** = u^ds, находим
N
dvT»v = J2mac I u»uvadv5A{x ~xa(s))ds =
a=i ^
N Г d
= -^2macl u£—64(x - xa(s))ds =
= Zm"c / ^S4(x-xa(S))ds =J2 -F"» / <S\x - *„(*)),
a=l J aS o=l C J
что равно правой части (8.21) со знаком минус. Итак, уравнение
непрерывности
dv (т^ + Т»А = О
должно совпадать с дифференциальной формой закона сохранения
энергии-импульса для полной системы. Подставив сюда (8.20) и (8.22),
действительно получаем соотношения (3.13), (3.16), полученные ранее
из уравнений Максвелла.
Подстановка (8.22) в (8.17) и далее в (8.18) приводит к следующему
выражению для тензора момента количества движения
о=1
где pZ = m0cu„. Трехмерная часть этого тензора дуальна моменту
количества движения L = г х р, а смешанные компоненты равны
x« = cx;(*i-^)
Их сохранение представляет собой условие равномерного движения
центра масс, координаты которого определяются через энергии частиц
со скоростью
8.3. Тензор энергии-импульса
75
В заключение заметим, что если в определении (8.17) плотности
тензора момента вместо симметричного ТЭИ использовать
канонический, то для получения сохраняющейся величины нужно будет
добавить тензор спина S^^y.
с с
Мр„\ = ХцТ„\ — ХиТцх + Spvx,
смысл которого как внутреннего момента количества движения
фотона становится ясным в квантовой теории электромагнитного поля.
Глава 9
Электромагнитное
излучение
Важнейшим отличием электромагнитного взаимодействия зарядов
от взаимодействия тел в нерелятивистской механике является
невозможность ограничиться при его описании рассмотрением лишь
величин, характеризующих движение самих частиц. Поскольку уравнения
Максвелла оцисывают распространение электромагнитного поля с
конечной скоростью с, то полное описание взаимодействия должно
включать бесконечное число степеней свободы электромагнитного поля.
При этом оказывается, что создаваемое ускоренно движущимися
зарядами поле содержит волновую составляющую, которая представляет
собой электромагнитное излучение. Последнее затем
распространяется независимо от породивших его заряженных частиц. Для описания
этого явления необходимо построить решение уравнений Максвелла с
источником, отвечающим произвольному движению заряда.
9.1. Функции Грина уравнения
Д'Аламбера
Рассмотрим уравнение для 4-потенциала А**, создаваемого
заданным током j1*:
47Г
ПА» = —-j".
с
9.1. Функции Грина 77
Решение этого уравнения можно представить в виде
А»(х) = - f G(x - х')^(х') dV, (9.1)
где G(x — х') — функция Грина, удовлетворяющая уравнению
□х G{x - х') = -4тг54(х - х'), (9.2)
индекс х означает, что оператор Д'Аламбера □ действует на
координату х.
Функция Грина G определена неоднозначно: к решению
неоднородного уравнения (9.2) можно добавить некоторое решение однородного
уравнения. Доопределение функции Грина требует наложения
дополнительного условия. Естественным требованием является условие
запаздывания
GTet{x - х') = 0 для всех t < t', (9.3)
определяющее запаздывающую функцию Грина. Чтобы построить для
нее явное выражение, введем разности г = t — t', R = r— r'и запишем
оператор Лапласа в сферических координатах
1 д („2 8 \ 1 8 ( . Л 8 \ 1 / д Л2 ,„ л.
где R = \R\ и в, <р — сферические углы вектора R. Поскольку источник
сферически симметричен, при R ф 0 для G = G(t, R) будем иметь
уравнение
Я2
Нетрудно проверить, что функция
1 д fn2dG\ 1 32G n /ftB.
V8R{RdR-)-Sl^ = 0- (95)
6(ct - R) .
R ^ '
удовлетворяет как (9.5), так и дополнительному условию (9.3).
Действительно, имеем
hdR
*Ч")В>(~-й)=
1 Ч2г/„ Т>\ А 1я2!
= ъд18(аг - Л) - ? дВДсг - R) = О,
где учтено, что члены, содержащие первые производные от S(cr — R),
взаимно уничтожаются. Наконец, принимая во внимание
соотношение (1.16), а также равенство 8{ст — R)S3(R) = 6(ct)53(R), находим,
78 Глава 9. Электромагнитное излучение
что уравнение (9.2) с дельта-функцией в правой части
действительно выполняется. Таким образом, выражение (9.6) представляет собой
искомую запаздывающую функцию Грина.
Эти вычисления не изменяются, если вместо ст — R в выражении
для функции Грина взять ст + R:
однако дополнительное условие теперь будет иметь следующий вид:
GadvOc — х') = 0 для всех t>t'.
Это условие определяет опережающую функцию Грина. Ясно, что
истинное поле, создаваемое источником j1*, должно удовлетворять
условию запаздывания, поэтому функция Грина (9.7) сама по себе не
является физической. Однако, полезно представить запаздывающую
функцию Грина в виде суммы собственной и радиационной частей:
Gret = Ggelf + Grad, (9.8)
G.df=i(GW + G.»w). (9-9)
Grad = X (Gret ~ Gadv), (9.10)
что соответствует разбиению поля на четную и нечетную части
относительно инверсии времени т —* —г:
Grad(—т) = —Grad(T),
G^ti-т) = GBelf(r).
Функция Грина G8eif симметрична по отношению к инверсии
времени, поэтому можно ожидать, что она будет описывать кулоновское
поля заряда, которое перемещается вместе с ним (хотя простая
форма кулоновского поля статического заряда уже не будет иметь места).
Функция Grad нечетна относительно инверсии времени, поэтому ей
соответствует излучение, носящее необратимый характер. Заметим, что
функция Grad удовлетворяет уравнению Д'Аламбера без источника
□ Grad=0,
что характерно для свободного волнового поля. Учитывая
соотношение
'№)) = Е^5Г' f{Xi) = 0, (9Л1)
9.2. Запаздывающие потенциалы 79
в котором суммирование ведется по всем (простым) корням
функции /, из (9.6), (9.7), (9.9) и (9.10) находим
G^f = <J(cV - R2) = 6[(a? - s"')(x„ - */)]. (9.12)
Grad = sign(r)J(c2r2 - R2) = sign(T)<J[(x" - x"')(*i. - xM')]. (9.13)
Эти выражения явно лоренц-инвариантны.
9.2. Запаздывающие потенциалы
Подставляя (9.6) в (9.1) и выбирая в качестве источника плотность
тока одиночного заряда (8.5), движущегося вдоль мировой линии хм =
Zq(s), находим
4U(r,t) = ey
у?(а)6(ф - <<,(«)) - |r - ra(s)\)ds
|r-r0(.)|
При интегрировании по s нужно учесть, что uM = dx^/ds и
^ {ф - «о(.)) - |г - r0(S)|} = «° (^ - l) ,
где v = dro/dto, R = г — ro(s), причем равенство нулю
аргумента 5-функции определяет значение интервала s = sret B момент
испускания как функцию точки наблюдения sret(t, r):
to(sTet) =t г - r0(sret) • (9.14)
с
Это соотношение выражает собой факт распространения
электромагнитного поля со скоростью с. С учетом этого получаем
А* ( *\- eufi
^t(r,t)- uo(R_vR/c)
где величины в правой части должны быть взяты при значении
параметра s = sret на траектории, зависящего от t, r.
9.3. Излучение
Чтобы вычислить напряженности электрического и магнитного
полей, нужно продифференцировать A£et no г, t в соответствии с фор-
80
Глава 9. Электромагнитное излучение
мулами (5.1). При этом дифференцирование соотношения (9.14) дает
dto _ Rv dto
~dt ~ +~ШИк'
dtp
dr
c\R R dr)'
или
dto с -R
~dt = c-nv' "=jR'
dr с — nv
Результат вычисления следующий:
E^ дА° lflA = e(n-»)(l-^) | e[nx[(n-f)xa]]
dr с dt д2(1_ш»)3 сзд^.ш»)3
(9.15)
В = [n x JS],
где а = dv/dto — ускорение заряда. Вектор п является единичным
вектором вдоль луча зрения, при этом магнитное поле
ортогонально п. Второе слагаемое в (9.15) отлично от нуля тогда и только
тогда, когда а ф 0. Покоящийся заряд (v — a = 0) создает кулоново
поле Е = en/R2, при этом В = 0. Характерно, что если первое
слагаемое в (9.15) спадает с расстоянием как 1/R2, то второе, зависящее от
ускорения, спадает как 1/R. Поэтому если вычислить поток энергии,
переносимый полем через бесконечно удаленную сферу S2^, то
первое слагаемое в (9.15) вклада не дает, а второе дает отличное от нуля
выражение
1= f S-dtr = j- <f[ExB]nR2dQ = j- <f E2R2сШ =
si. Я, SL
[»x[(n-«)xe]]r
e2 Г \nx (n- s) xa
—--=■ * ± ti <U-—LL^n. (9Л6)
47ГС3 / (i_ пн)6 v ;
S2 V С I
При выводе этой формулы учтено, что при г —> со и конечном го
имеем R ~ г, при этом вектор п нормален к 5^,. Подынтегральное
выражение является положительно определенным, поэтому интеграл
9.3. Излучение
81
положителен, если ускорение отлично от нуля. Отличное от нуля и
положительное значение полного потока энергии через замкнутую
поверхность означает, что заряд необратимо теряет энергию на
излучение. Величина / называется интенсивностью излучения.
Интегрирование по углам в (9.16) удобно выполнить, выбирая
систему отсчета, в которой заряд мгновенно покоится, v = 0. Тогда
имеем
Подынтегральное выражение здесь симметрично относительно
замены п на —п, т. е. в системе покоя заряд излучает одинаково во
взаимно противоположных направлениях. Далее, вектор плотности
импульса электромагнитной волны ориентирован вдоль направления ее
распространения, поэтому из закона сохранения импульса следует, что
излучающий заряд не теряет импульса. Поскольку интенсивность
излучения равна со знаком минус энергии заряда, теряемой в единицу
времени J = —d£/dt, то —d£/ds = Iu°/c. Отсюда следует, что
величина I не изменяется при переходе к произвольной системе отсчета,
поскольку величины £ и и0 обе являются временными компонентами
4-векторов. Таким образом, преобразование (9.17) к произвольной
системе отсчета сводится к замене о2 на инвариант, который совпадает
с о2 в системе покоя. Из (7.10) следует, что такой величиной
является —c4(du>i/ds)2 (квадрат по метрике Минковского). Таким образом, в
произвольной системе отсчета будем иметь
3 da ds v '
Это выражение является положительно определенным, поскольку
4-ускорение — пространственноподобный вектор. К такому же
результату можно прийти, выполнив явно интегрирование по углам в (9.16).
В случае, когда ускорение и скорость параллельны, получаем
/=2е2 а2
ЗсЗ^-ь2/^3'
если же они перпендикулярны, то
/=3^(1-и2/с2)2' (9Л9)
В обоих случаях a — абсолютная величина ускорения в собственной
системе отсчета.
82 Рлава 9. Электромагнитное излучение
Рассмотрим подробнее угловое распределение излучения
(подынтегральное выражение в (9.16)). Раскрывая квадрат векторного
произведения, находим
dl e
dSl 47TC3
[..(.-=)-_,«.)■ (i - $) (i-=r+
+ ?(an)(««)(l-^)"5]. (9.20)
Отсюда видно, что в ультрарелятивистском случае v —> с излучение
сильно анизотропно и происходит в основном в узкий конус вокруг
направления v с углом раствора
Д0
^
Для получения этой оценки следует разложить 1—vn/c « l—v/c+02/2,
где в — (малый) угол между w и п, и рассмотреть предел v —¥ с.
Важным примером является синхротпронпое излучение
заряженных частиц в циклических ускорителях. Если заряженная частица
движется в магнитном поле В перпендикулярно силовым линиям,
центростремительное ускорение равно
=-^-[в х Bh/l - £.
те V с2
Интенсивность излучения определяется формулой (9.19):
J=2e4BV 1
3 т2с* l-v2/c?'
Излучение растет пропорционально квадрату энергии частицы и для
электронов оно является основным источником энергетических потерь
в ускорителях.
Другой важный пример — излучение электрона в атоме. Бели бы
поведение электрона в атоме подчинялось законам классической
электродинамики, то в модели Резерфорда, согласно которой электрон
обращается вокруг точечного ядра, время жизни атомов было бы
ничтожно малым.
9.4. Радиационное трение
Излучение электромагнитных волн приводит к появлению силы
отдачи, действующей на точечный заряд. Эту силу удается вычислить,
9.4. Радиационное трение
83
учитывая в уравнении движения
mc^H = 1f»vuv (9.21)
as с
ext
помимо внешнего поля F^ также собственное поле заряда
/м» = д^А1* - д„А*;\ (9.22)
где А™* — запаздывающий потенциал. Заранее ясно, что собственное
поле расходится в точке, где находится заряд, однако возникающую
расходимость удается устранить с помощью перенормировки массы.
Положим массу т в (9.21) равной некоторой нефизической
«затравочной» массе то, величина которой заранее не фиксирована и может
быть бесконечной (любого знака). Оказывается, что бесконечный член
в правой части (9.21) также пропорционален du^/ds, что и позволяет
объединить его с левой частью, приравняв суммарный коэффициент
физической массе заряда.
Удобно разложить поле на собственную и излучаемую
составляющие согласно разбиению (9.8) физического запаздывающего решения.
Пусть заряд движется вдоль мировой линии x/i(s), тогда s' будем
считать моментом испускания, as — моментом поглощения, в
окончательном пределе s' —> s. Собственное поле (self) в точке x(s) тогда в
соответствии с (9.12) равно
= е f и*(з')6 [(х - х')2] 54 (х - x'{s')) Ла'^х' =
= efu>*(S')8[{x-x'(s'))2}ds', (9.23)
где (х - х')2 = (я" - х"')^ - хм')- Подставляя в (9.22), находим
f%t = 2ef*lvVW]* [(* - *V))2] ds' =
= 4efu^(s'){x - x'{s'))^S' [(x - x'(s'))2] ds', (9.24)
где штрихом обозначена производная от дельта-функции по ее
аргументу. Построим теперь выражение для силы самодействия,
подставляя поле (9.24) в правую часть (9.21) и беря его значение в точ-
84 Глава 9. Электромагнитное излучение
ке х** = x>*(s) на мировой линии:
*Uf=f/&(*(-)K(-) =
= ^- f uv{s)u[v{s')(x{s) - х'С*'))"1*' [(*(*) - x'W))2] ds'. (9.25)
Присутствие (производной от) J-функции означает, что в конечном
счете s = а', однако при переходе к пределу s' = s — <т, a —> 0
возникают сингулярные члены, которые необходимо выделить явно. Затем
следуют члены, конечные при a —»• 0, и, наконец, члены,
обращающиеся в нуль в этом пределе. Поэтому произведем разложение в (9.25)
по <т, имея в виду, что аргумент дельта-функции в пределе
удовлетворяет соотношению
™Ь 2
В остальных членах пишем
х"(я') =***(«)-<"i*
uv(s')=uv -auv +
+
a2
2
— = vfup = 1.
«" + ...,
причем обозначенные многоточием члены более высокого порядка
вклада не дают. Учитывая, что 6'(<j2) = d5{a2)/da2 — четная
функция <т, нетрудно видеть, что ненулевой вклад дают только четные
степени <т в подынтегральном выражении, причем вклад всех степеней
выше второй в пределе исчезает. Единственный неисчезающий член
пропорционален и1*:
/ оо
Стоящий здесь интеграл расходится, однако, замечая, что сила З7^
пропорциональна йм, можем перенести ее в левую часть уравнения
движения (9.21), объединив расходящийся интеграл с затравочной
массой:
оо
=2
е f 2 d с, 2ч j,
тпс = тпос / о —-7rd(cr)do-,
с J do-z
—оо
и считая конечную величину m физической массой. Таким образом,
вклад силы самодействия в уравнение движения заряда сводится к
бесконечной перенормировке его массы.
9.4. Радиационное трение
85
Теперь рассмотрим вклад радиационной составляющей поля в
правую часть (9.21). Отличие радиационной функции Грина Gra<j от GBe\(
заключается в дополнительном факторе sign(x° — х° ) = sign(<r), где
учтено, что вектор «** времениподобен, поэтому вместо (9.25) получаем
Ка = ~Juv(sWv(S')(x(s)-x'{s')r^^5{o-2)da.
Теперь ненулевой вклад дают только нечетные по а члены разложения
степени не выше третьей. Вычисления показывают, что членов первой
степени нет вовсе, а члены третьей степени дают конечный вклад,
пропорциональный интегралу
оо
/
o-3^j-^5(<t2)cUt=-1.
\a\ da*
Для его вычисления следует провести раздвижку точек, полагая
8{<т2) = Urn J(<72-e2), (9.26)
и далее воспользоваться соотношением (9.11). В результате находим
*<**- 3c\ds2 +U ds ds J' ^-Z7)
ext
Наконец, добавив в правую часть внешнее поле FMV, получаем
уравнение Лоренца-Дирака:
duM e ■& »le2(d2u* dv? duv \
ds с v 3 с V ds2
в котором второй член представляет силу радиационного трения.
Следует иметь в виду, что хотя и удается вывести одночастпич-
ное уравнение для излучающего заряда и тем самым исключить из
рассмотрения бесконечное число степеней свободы электромагнитного
поля, полученное уравнение уже не является лагранжевым. Обратим
также внимание на то, что потеря 4-импульса на излучение дается
лишь вторым слагаемым в выражении для силы радиационного
трения в (9.27) (ср. с (9.18)), однако при учете лишь этого слагаемого была
бы утрачена ортогональность 4-скорости и 4-ускорения, лишь полная
сила Т^ ортогональна «й. При этом первое слагаемое в (9.27)
имеет характер полной производной, поэтому оно не моокет описывать
86
Рлава 9. Электромагнитное излучение
необратимую потерю 4-импульса. Поэтому можно попытаться
объединить это слагаемое (при ц = 0) с левой частью уравнения, считая
величину —|^-<fu°/ds добавкой к энергии mc2u° {энергия Шотптпа). Более
детальное исследование показывает, что шоттовская энергия является
конечной частью энергии поля, привязанного к заряду. При
ускоренном движении заряда часть этой электромагнитной энергии может
переходить в излучение. Например, в случае, когда ускорение заряда
постоянно в его собственной системе отсчета (движение в постоянном и
однородном электрическом поле), полная сила радиационного трения
равна нулю, в то время как интенсивность излучения, определяемая
формулой (9.18), отлична от нуля. Разрешение этого парадокса
состоит в том, что энергия (4^импульс) излучения черпается из энергии
(4^импульса) переносимого вместе с зарядом электромагнитного поля.
Следует также иметь в виду, что уравнение движения с силой
радиационного трения является дифференциальным уравнением третьего
порядка, поэтому при построении его решения необходимо задать не
два, а три условия на координаты и их производные. Это необходимо,
в частности, для исключения так называемых самоускоряющихся ре-
ext
тений, которые уравнение (9.28) может иметь при F^u = 0, когда на
заряд не действует внешняя сила. Рассмотрим для простоты случай
скоростей, малых по сравнению со скоростью света. Тогда из (9.28)
при отсутствии внешнего поля получаем
do _ 2 е2 d?v
m<tt "Зс3^2""
Нетривиальным решением этого уравнения является следующее:
а=аоехр(!^)'
где а — ускорение, Гкл = е2/(тс2) — так называемый классический
радиус заряда (для электрона величина порядка Ю-11 см). Ясно, что
при отсутствии внешнего поля излучение происходить не будет,
поэтому самоускоряющееся решение следует отбросить, полагая начальное
ускорение «*о равным нулю.
В этом примере выявляется роль классического радиуса заряда,
который является естественным параметром размерности длины,
который можно построить из массы, заряда и скорости света. Следует
однако иметь в виду, что этот параметр в Лс/е2 и 137 раз меньше
комптпоновской длины волны электрона А = h/mc, являющейся
индикатором масштаба, на котором становятся существенными квантовые
эффекты. Таким образом, последовательное решение проблемы
радиационного трения скорее является задачей квантовой теории поля.
9.5. Рассеяние электромагнитных волн
87
9.5. Рассеяние электромагнитных волн
Рассмотрим систему зарядов, подвергающуюся воздействию
электромагнитных волн от внешнего источника. Поле электромагнитных
волн будет вызывать вынужденное движение зарядов, причем ввиду
его периодичности движение будет ускоренным. Это, в свою очередь,
должно приводить к возникновению вторичного электромагнитного
излучения во всех направлениях. Поэтому если падающая волна имела
определенное направление распространения, то наблюдатель
воспринимает вторичное излучение как рассеяние электромагнитных волн
заряженными частицами.
Рассмотрим рассеяние плоской волны
Е = Е0 srn(ut - fer), В = [k x E]c/u> (9.29)
на свободном заряде, который первоначально покоился, предполагая,
что воздействие волны (9.29) начинается при t = 0. Если еЕ0/тпш «С с,
то за время одного полупериода п/ш заряд приобретает скорость v ~
air/ш (а ~ еЕо/тп — ускорение), малую по сравнению со скоростью
света, а затем начинает ускоряться в противоположном направлении,
так что движение остается нерелятивистским. В этом случае можно
пренебречь действием магнитного поля, а также пространственной
зависимостью в (9.29), поскольку
CU 7Г
fir ~ —у— ~ и/с -С 1.
с ш
В таком приближении уравнение движения будет иметь вид
mo = eE0 sinut, (9.30)
следовательно, ускорение заряда является периодической функцией
времени. Это движение вызывает вторичное электромагнитное
излучение в виде волн той же частоты. Действительно, при v/c <g: 1 второе
слагаемое в (9.15) имеет на больших расстояниях от заряда (где R ~ г)
вид
где п — единичный вектор вдоль направления распространения,
поэтому поле является периодической функцией времени той же частоты.
Угловое распределение интенсивности излучения находим из
соотношения (9.17):
dl е2 , 2 / ч2\ e4£$sin2urfsin20
88
Глава 9. Электромагнитное излучение
где 9 — угол между Е0 и п. Усредненное по времени значение равно
^лат20. (9.31)
dl cEl 2
<Ш 87г
Как видно отсюда, рассеяние происходит во всех направлениях,
кроме в = О,7Г. Процесс принято характеризовать дифференциальным
сечением рассеяния, разделив (9.31) на усредненный по времени поток
энергии в падающей волне 5 = сЕ$/(8п):
Физически da есть эффективная площадь, с которой падающая
волна рассеивается в телесный угол dil в направлении в. Полное сечение
рассеяния определяется как интеграл от (9.32) по всем углам:
-/
r^rin^dW^^rL
(формула Томсона). Таким образом, заряд рассеивает плоскую волну
с эффективной площади ~ г2л.
Рассмотрим теперь рассеяние на связанных зарядах. Пусть в
отсутствие волны заряд совершает периодическое движение с
частотой шо (например, колеблющийся ион в кристаллической решетке).
При этом заряд излучает, однако нас будет интересовать не его
собственное излучение, а дополнительное излучение, возникающее при
воздействии на заряд периодического поля внешней
электромагнитной волны (9.29). Вместо (9.30) тогда будем иметь уравнение
г + JqT = —- sin wt, (9.33)
т
вынужденное решение которого имеет вид
еЕо sin ujt
г =
т ш;
о
Повторяя предыдущие вычисления, для полного сечения рассеяния
получим
87Г 2 Ш4 .„ „ А.
a=Tr™T~2 ^5- (9'34)
а {ш% - ш2)
Характерной особенностью является зависимость сечения от близости
к собственной частоте и, следовательно, избирательный характер
рассеяния. Сечение (9.34) расходится в резонансе ш = w<j. На самом деле
9.5. Рассеяние электромагнитных волн
89
всегда имеются диссипативные процессы, к которым, в частности,
относится и радиационное трение; они препятствуют бесконечному росту
амплитуды колебаний в резонансе. Вводя в левую часть (9.33) дисси-
пативный член уг, где -у — коэффициент трения, вместо (9.34) будем
иметь
_ 8тг 2 а^
° ~ ТГкл (о/2 - ы2)2 + 72"2"
Это сечение остается конечным при w = wq.
Глава 10
Пространство-время в
общей теории
относительности
Представление об инерпиальных системах отсчета, лежащее в
основе СТО, является ограниченным и справедливо лишь до тех пор, пока
мы пренебрегаем эффектами гравитации. Между тем гравитационное
взаимодействие, в отличие от электромагнитного, является
универсальным: все виды материи — электрически нейтральные и
заряженные частицы, электромагнитное и другие известные в физике поля —
подвержены гравитационному взаимодействию с одинаковой
константой связи. Разумеется, во многих случаях гравитационные силы малы
по сравнению с другими видами сил, и тогда оправдано использование
СТО. Но, строго говоря, предположение о глобальном существовании
ИСО при учете гравитации является неверным. В общей теории
относительности (ОТО) инерциальные системы отсчета не играют
выделенной роли и уравнения записываются в общековариантном виде
в искривленном пространстве-времени. На метрику пространства
событий накладываются лишь общие ограничения, такие как лоренцева
сигнатура и дважды дифференцируемость.
10.1. Принцип эквивалентности
Принцип эквивалентности гласит, что силы инерции и
гравитации локально неразличимы. Свободно падающая в гравитационном
10.1. Принцип эквивалентности 91
поле система отсчета является неинерциальной, причем силы инерции
в точности компенсируют гравитационные силы. По этой причине, в
частности, возникает состояние невесомости на спутнике,
вращающемся по околоземной орбите: центробежные силы компенсируют
гравитационное притяжение со стороны Земли. Принцип эквивалентности
справедлив лишь локально, как мы увидим далее, истинное
гравитационное поле отличается от поля сил инерции тем, что тензор
кривизны в первом случае отличен от нуля, а во втором равен нулю. Для
определения тензора кривизны, зависящего от вторых производных от
метрики, необходимы измерения в соседних точках.
Переход от инерпиальных к неинерциальным системам отсчета
описывается преобразованием координат общего вида
X» -¥ Х"'(х), (10.1)
в результате чего не зависящий от координат метрический тензор
пространства событий Минковского становится функцией координат:
ds2=gfiV(x)dx'tdxv, u,v = 0,...,3. (10.2)
Тот или иной выбор координат х1* в пространстве событий ОТО
является в значительной мере вопросом удобства. Интервал (10.2) по
определению является инвариантным, так что при преобразованиях (10.1)
метрический тензор преобразуется следующим образом:
дх» дх"
В отличие от СТО форм-инвариантность метрики уже не
предполагается.
Принцип эквивалентности означает, что гравитационное поле
также проявляет себя через метрику пространства событий 9ци(х). При
этом, однако, уже не существует возможности привести метрический
тензор к плоскому г]^ всюду во всем пространстве-времени. Более
того, не всегда полное пространственно-временное многообразие
удается накрыть одной картой «^(х). Поэтому общее определение
пространства-времени в ОТО — это дифференцируемое многообразие с
набором карт, накрывающих его в совокупности. Математический
аппарат ОТО — дифференциальная геометрия многообразий.
Хотя наличие гравитационного поля препятствует приведению
метрики к виду rip» всюду (не существует глобально определенных ИСО),
это всегда можно сделать в любой заданной точке хм = х%, для чего
достаточно привести матрицу </MJ/(xo) к диагональному виду и затем
произвести перерастяжку координат так, чтобы иметь
9»Лхо) = 4v*> = diag(l, -1, -1, -1). (10.3)
92
Глава 10. Пространство-время в ОТО
Этого еще недостаточно, чтобы построить локальную ИСО, в которой
действие гравитационных сил было бы скомпенсировано действием сил
инерции (мы вернемся к такому построению ниже), однако требование
локальной приводимости к виду (10.3) приводит к важному
ограничению на возможный выбор дц„, связанный с сигнатурой TfMV.
Сигнатура метрики пространства-времени (разность числа плюсов и минусов
в (10.3)) является ее инвариантным свойством. В частности, отсюда
следует, что определитель метрики должен быть отрицателен:
д = det 5Mi/ < 0.
Поскольку в ОТО выбор координат произволен, значения
координат х^ уже не связаны непосредственно с физическими расстояниями и
временем. Поэтому необходимо указать некоторую процедуру
измерения для определения физических расстояний и промежутков времени
между событиями. Промежуток времени dt между событиями,
разделенными интервалом ds2 и происходящими в одной пространственной
точке (dx* = 0), будет равен
dr = -y/g00(x)dx°. (10.4)
Конечный промежуток времени между событиями (х?,х*), (х%,х*) ,
происходящими в одной пространственной точке, определяется
интегралом
х°
т = - I y/goodx°.
X?
В общем случае заранее неясно, какую из координат Xм считать «вре-
меннбй», критерием выбора является положительность
соответствующей компоненты метрики <7оо- Может случиться, что величина ^оо в
некоторой точке обращается в нуль и затем становится
отрицательной. Это означает, что координата х° становится пространственной,
при этом для сохранения сигнатуры метрики необходимо, чтобы еще
одна диагональная компонента метрики изменила знак,
соответствующая ей координата и будет временнбй координатой в этой области.
Такая ситуация характерна для пространства-времени черной дыры.
Вычисление расстояний выглядит сложнее, поскольку при этом
нельзя просто положить dx° = 0: собственное время, вообще говоря,
течет в разных пространственных точках по-разному. Рассмотрим две
точки трехмерного пространства х\ — х* и х\ = х* + dx*.
Распространение светового сигнала из первой точки во вторую и обратно
10.1. Принцип эквивалентности 93
определяется двумя корнями уравнения
ds2 = gij оЯ&х* + 2до{ dxudx{ + soo(dx0)2 = 0,
разрешая которое относительно dx°, находим
<&4 = 9оо
-д<н dxx ± yJ(goi90j ~ 9ij9oo) dxidx3
Полный промежуток координатного времени распространения
сигнала туда и обратно равен dx\ — dx°_, а промежуток истинного времени
получается с помощью (10.4). Умножая на с, получаем удвоенное
расстояние между точками, в результате будем иметь:
di-
= (^^- - дЛ dx'dx3 = 7<; dxW,
V 9оо J
где 7»i можно понимать как метрический тензор трехмерного
пространства. Эта метрика является тензором, обратным к — дгз, т. е.
взятой с обратным знаком пространственной части контравариантного
метрического тензора a1*" пространства событий, получаемого из
соотношений
9^9х. = К-
Другими словами, пространственная метрика *щ удовлетворяет
уравнению
9ijljk = -4-
Расстояние между удаленными точками, вообще говоря, нельзя по-
луить интегрированием элемента dZ, поскольку такой интеграл будет
зависеть от формы пути, если метрика дц„ зависит от х°. Таким
образом, пространственные расстояния в ОТО в общем случае определены
лишь в бесконечно малом. В случае же если метрика не зависит от
временнбй координаты х°, интеграл от dl имеет смысл.
Нетривиальным является в ОТО и вопрос о синхронизации часов,
находящихся в разных пространственных точках. В рассмотренном
выше процессе измерения пространственного расстояния момент х
в точке х% соответствует моменту х° + |(dx+ + dx°_) в точке х£,
поэтому разность временных координат х° двух одновременных событий в
точках, разделенных пространственными координатами dx*, есть
0 _ gojdx*
Ах° =
9оо
Продолжая этот процесс, можно синхронизировать часы вдоль любой
незамкнутой кривой. Но если мы возвращаемся в исходную точку, то,
94
Глава 10. Пространство-время в ОТО
вообще говоря, получим другое показание часов, поскольку в общем
случае
' 9oi dxl
?■
ФО.
Зоо
Если да = 0, то синхронизация часов возможна. Подчеркнем, что
выполнения этого условия всегда можно добиться с помощью некоторого
преобразования координат (10.1). Более того, координатным
преобразованием можно обеспечить также выполнение условия <?оо — 1) так
как в нашем распоряжении имеются четыре произвольных функции.
Система отсчета, в которой
da2 = <?dt2 - gtj dxidxj,
называется синхронной.
В постоянном гравитационном поле можно выбрать координаты
так, чтобы метрический тензор не зависел от временной
координаты х°. Тогда для событий в одной пространственной точке интервалы
физического и координатного времени связаны (в силу (10.4))
соотношением
Дт=-^«КюДх0, (Ю.5)
справедливым и для любых конечных промежутков. Если теперь
рассмотреть две различные пространственные точки х% и х%, то
одинаковому промежутку координатного времени Дх° будут отвечать разные
промежутки физического времени
Дп _ Дт2
V<too(ii) Vffool^a)
В качестве часов можно рассматривать некоторый периодический
процесс с частотой ш ~ 1/Дт. Отсюда получаем соотношение для частот
колебаний
viV9oo(xi) =Ш2у/яоо(х2), (10.6)
выражающее красное смещение в статическом гравитационном поле.
Можно связать эти соотношения с гравитационным потенциалом <р
ньютоновской теории. В классической механике действие для массы т
в гравитационном поле <р имеет вид
SN = I \™\ ~™fi\ dt- (1Q-7)
В ОТО, согласно принципу эквивалентности, действие имеет тот яке
вид, что и в СТО:
/Г I dxi* dxv
da = -тс / \J9nv-Tr—n-dt. (10.8)
10.2. Векторы и др.
95
Сравнивая (10.8) и (10.7), находим, что S и Sn будут отличаться на
несущественную величину / mc2dt (как и в СТО), если квадрат
интервала имеет вид
da2 = g^dx^dx" = (с2 + 2<p)dt2 - dr2,
причем <р <£L с2, v = \dr/dt\ •С 1. Таким образом, в
нерелятивистском ньютоновском пределе только компонента метрики goo отлична
от единицы на малую величину
2ip
goo = 1 + -^-,
и аналогично для других компонент, при этом малые поправки к
пространственной части метрики не дают вклада при v<l. Подставляя
это выражение в (10.5), находим
следовательно, собственное время течет тем быстрее, чем выше
гравитационный потенциал. Аналогично, из (10.6) имеем в слабом
постоянном гравитационном поле
«(i+S)-«(i+S)-
это говорит о том, что частота света уменьшается с увеличением
гравитационного потенциала. Этот эффект хорошо наблюдается
экспериментально в поле Земли для разности высот порядка сотен метров.
10.2. Векторы, тензоры, параллельный
перенос, кривизна
Напомним некоторые сведения из дифференциальной геометрии
многообразий. Вектором называется оператор дифференцирования
вдоль кривой
V = V'i~.
дх»
Этот оператор по определению не зависит от выбора координат, для
его компонент Vм при преобразованиях (10.1) соответственно
получаем
V»' = у» £?_. (ю.9)
дх* '
96
Глава 10. Пространство-время в ОТО
Аналогично для контравариантного тензора имеем следующий закон
преобразования
ari..x.e24.....m.^l...*^. (10Л0)
дх^ дх^ v^u-auj
Сопряженным к пространству векторов является пространство
1-форм (ковекторов)
А = A^dx»,
также инвариантных при преобразованиях (10.1). Для компонент Ац
получаем
дх*
Аи'=Л,—. (ю.п)
Соответственно, для ковариантного тензора будем иметь
„, m dx"1 дх11"
^-■-^=^1...,„^..._. (Ю.12)
Дифференцирование вектора (ковектора, тензора) по х** дает
объект нетензорной природы, который не принадлежит ни к одному их
типов (10.9), (10.10), (10.11), (10.12). Правильный тензорный закон
преобразования имеют ковариантные производные вектора и
ковектора
v„v = v£ = v;fj + rkv\ (Ю.13)
WVA„ = Amv = A„,v - Г^Лд, (10.14)
и соответственно для тензоров высших валентностей
У„Тт "Mrx = Г'11—'1" + r<J1rA'4*—**" + ... + r**"21'*i—^»-1А
Ковариантные производные от смешанных тензоров получаются
суперпозицией приведенных правил, например,
Т7 *TiA .._ /T*iA , Г*Х про -р<Т грХ
'"''/I Р," ' <jvxh A ftv-'-a •
Входящие в (10.13), (10.14) символы, Кристоффеля по определению
симметричны по нижним индексам ГА„ = ГАЙ ; они определяются из
условия ковариантного постоянства метрики
Vasmi, = g^x - Г£л5тх/ - TlxgMT = 0,
20.2. Векторы и др.
97
разрешая которое, находим
г^ = 25Ат(Э/хт,^ + Зт./,м - 9„»,т)-
При преобразованиях координат (10.1) символы Кристоффеля
преобразуются неоднородно:
га' _гл дх^_дх^дх^ д2хх дху ПП1^
Г"'"' ~ »»дх»' Эх"' 9хА + dx»'dxv' &гА ' (10-15)
благодаря чему компенсируются неоднородные члены в законах
преобразования величин типа Vfc, А^<и и др. Используя эте соотношение
можно обратить символы Кристоффеля в нуль вдоль любой заданной
кривой в пространстве-времени.
Ковариантная производная определяет полный дифференциал
тензора
DV* = V£dxv = V$dxv + TxivVxdxv,
который обращается в нуль при его параллельном переносе. При ко-
вариантном дифференцировании произведения выполняется правило
Лейбница, например,
и аналогично для других произведений.
Используя соотношение для определителя метрики
dg = gglxvdgllv = —gg^vdgliU,
находим следующее простое выражение для свертки символов
Кристоффеля по индексу:
„ _ 1 дд 8Ыу/=д
"" 2ддх» дх» '
поэтому ковариантная дивергенция вектора равна
^-^flSrfc^)- (mi6)
Применив эту формулу к вектору А11 = g'iVdvtf} = g^Vutp, где гр —
скаляр, получаем ковариантный оператор Лапласа
4-8210
98
Глава 10. Пространство-время в ОТО
Аналогично упрощается ковариантная дивергенция от
антисимметричного контравариантного тензора 2-го ранга:
Результат параллельного переноса вектора (тензора) из одной
точки в другую зависит от формы пути, при переносе по замкнутому
контуру, натянутому на dxx Л dx\ получим следующие приращения:
6V" = ~R"vxrVvdx^dxl,
6Ац = -Rv' llxrAvdx\dxr2%
где
^л. = 2(9[ЛГ^]т + Г^дГ-]т)
— тензор кривизны Римана-Кристоффеля (индексы в квадратных
скобках означают альтернирование с делением пополам). Этот
тензор имеет следующие свойства (опускание индекса осуществляется по
метрике g^v):
R^vXt = —RvuXt = —RfivrX — Rxrpv — (анти)симметрия,
RfivXr + R^Xtv + R^rux = 0 — тождество Риччи,
R^vXt-,* + R^vra-^ + R^vaX^ =0 — тождество Бианки. (10.17)
Свертывание по паре индексов дает симметричный тензор Риччи
последующее свертывание которого дает скалярную кривизну
R = R£.
Из тождества Бианки (10.17) получаем тождество Бианки для тензора
Риччи
К;» = \0vIL (Ю.18)
В четырехмерном пространстве тензор кривизны R^vXt имеет 20
независимых компонент (21 компонента симметричного тензора Rab =
Rba, где А = {fiis} — бивекторный индекс, А = 1,..., 6, минус
тождество Риччи). Число компонент тензора Риччи в четырехмерном
пространстве равно 10. Таким образом, из 20 компонент тензора Римана
половина может быть выражена через компоненты тензора Риччи, а
10.3. Изометрии
99
половина отлична от нуля и в случае, когда Дм„ = 0. Как мы увидим
ниже, последнее условие означает, что мы имеем свободное
гравитационное поле.
Полезно также следующее представление тензора кривизны со
всеми нижними индексами:
RpvXr = 9vl[t,\\v + 9v[X,t]h + ^/«гГг^ГИА» (10.19)
где оба индекса после запятой означают производные g^vx = дьдх9цт-
Более просто тензор кривизны выглядит на языке форм. Построим
1-формы связности
Г"„ = T»rdxT,
тогда 2-форма кривизны есть
Wv = Д"„Лт<£еа Л dxT = dV»v + Р*„ Л TV (10.20)
Это соотношение проясняет аналогию между тензором кривизны и
тензором напряженности F = dA электромагнитного поля: роль А
играет совокупность форм Р1,,, а появление внешнего произведения
в (10.20) связано с неабелевым характером калибровочных
преобразований (в данном случае локальных преобразований 50(1,3)).
10.3. Изометрии
Напомним определение производной Ли. Пусть задана
конгруэнция кривых, определяемая векторным полем К,Л(х). Эта конгруэнция
определяет однопараметрическую группу диффеоморфизмов х% —>
х?, так что
dt
Будем сравнивать значения тензорного поля Т"{х) в точках хо и xt,
относя индексы к системе координат х%. Значение тензора в точке xt
в координатах системы х£ равно
Производная Ли от T^v вдоль К* определяется так:
'W. . . Ш. . Л
-л:
, « = lim , T%(xt)-T%(x0)
t-ю I t
/
4*
100
Глава 10. Пространство-время в ОТО
Учитывая, что при t —> 0
получаем
CKT\ = K*T%tX - *ГЛГ\ + K^T"X
и аналогично для тензоров произвольной валентности.
Если производная Ли вдоль векторного поля Кй от метрического
тензора 5М„ равна нулю,
Скд^ = 0 = 9lXu,xKx + K^gav + К%д&Л (10.21)
то говорят, что К1* порождает преобразование изометрии. Нетрудно
показать, что (10.21) эквивалентно уравнениям Киллинга
К„„ + Ки.>1Х = 0. (10.22)
В случае пространства Минковского СТО, д^ = rj^v, существует 10
векторов Киллинга, порождающих группу JSO(l, 3). В искривленном
пространстве-времени ОТО возможны иные группы изометрии, при
этом максимальное число линейно независимых векторов Киллинга
равно 10 (максимально симметричное пространство). В последнем
случае тензор кривизны выражается через метрику следующим образом:
где ft — некоторая постоянная, скалярная кривизна при этом
постоянная и равна R = 12ft. При к ^ 0 имеем пространство де Ситтера (анти
де Ситтера), при ft = 0 — пространство Минковского.
Статическое гравитационное поле сферически симметричного
распределения материи имеет четырехпараметрическую группу
изометрии Т х 50(3), где Т — сдвиги по времени, порождаемые полем
Киллинга Kt = d/dt- Тогда существует выбор координат, в которых
интервал пространства-времени имеет вид
da2 = e"c2dt2 - eAdr2 - r2dSl, dQ = d62 + sin2 Bdcp2, (10.23)
где i/ и A — функции радиальной координаты г.
Пространственно однородное и изотропное гравитационное поле,
порождаемое усредненным распределением материи во Вселенной,
имеет 6-параметрическую группу изометрии. Таких групп,
порождающих односвязные пространства, имеется всего три: SO (4)
(соответствующее трехмерное пространство — сфера S3), ISO(3) (евклидова
10.4. Гравитация или инерция
101
трехмерная группа) и 50(1,3) (трехмерное пространство
Лобачевского SO(l,3)/SO(3)). Четырехмерные метрики пространства событий
для этих трех случаев соответственно можно параметризовать так:
da2 = c2dt2 - a2(t) dr2 +
sin2 г
sh2
dfi
(10.24)
10.4. Гравитация или инерция
Если задана метрика д^х), отличная от метрики Минковского,
то это еще не означает, что имеется физическое гравитационное поле-
возможно, мы имеем дело лишь с «неудачным» выбором координат
в плоском пространстве событий. Попытаемся найти преобразование
координат хм -» £**(ж), которое привело бы метрику к виду tj^,,. В
качестве первого шага приведем метрику к виду т)^,, в заданной
точке х%. Для этого достаточно произвести диагонализацию с помощью
некоторой матрицы е^ (х0), а = 0,..., 3, такой, что
Vap = e^(xo)e^(xo)g>iV(x0)-
Будем теперь переносить четверку ковекторных полей е^ (х)
параллельно из точки Xq в произвольную точку х**,
V„e<,Q>(*)=0,
при этом скалярные произведения
(10.25)
гО0 - »/
е^{х)е^{х)д^{х)
(10.26)
будут постоянными. Действительно, поскольку Еа& — скалярная
матрица, имеем
дХ£а(3 = Vxea0 = 0
в силу (10.25) и ковариантного постоянства метрики VxgMV = 0.
Следовательно, еаР = ria&. Перепишем (10.25) в виде
Я р(а) _ ГА (а)
это означает, что левая часть симметрична по индексам ц, и и,
следовательно, существует четверка скаляров £*а\ таких, что
ft-eW = д„д^а\
102 Глава 10. Пространство-время в ОТО
или, иначе,
так что
Предположим, что метрика <^„ невырождена, т.е. detg^v ф 0, тогда
существует обратная матрица efia\, удовлетворяющая соотношению
е(а)еА« — °а>
и мы получаем из (10.26) и равенства ea& = rja^
g^v{x)e^a){x)ev^){x) = 77e/j.
Это, в свою очередь, означает, что в координатах f (°)
ds2 = g^dx^dx» = 77a^^(a)d4(^)-
Тем самым метрика приведена к метрике пространства Минковско-
го. Однако в этом рассуждении есть одно существенное ограничение:
результат параллельного переноса (10.25) не будет зависеть от
формы кривой, соединяющей х% с ж*4 в том и только том случае, когда
тензор кривизны R^vXr — 0- Итак, мы приходим к следующему
утверждению: необходимым и достаточным условием существования
системы координат, в которой метрика совпадает с метрикой Минковского
глобально, является равенство нулю тензора кривизны пространства
событий. Физически это означает, что критерием, позволяющим
отличить гравитационное поле от поля сил инерции, является отличие от
нуля тензора кривизны. Истинное гравитационное поле имеет
отличный от нуля тензор кривизны хотя бы в некоторой области
пространства-времени. Бели же В.ци\т = 0 всюду, то мы имеем дело лишь с
силами инерции. Как мы увидим далее, присутствие любой материи
делает вьшолнение этого условия невозможным, поэтому ИСО могут
существовать лишь локально.
С помощью аналогичных рассуждений можно показать, что
метрику д^ можно привести к виду r}ap в окрестности любой выбранной
точки xq с точностью до членов, пропорциональных квадратам
отклонений атм — Xq. Точнее, существуют так называемые нормальные
римановы координаты, такие, что
д^{х) = г]^ - -Яца„{,(х0)(ха - х%)(х0 -з4) + ..., (10.27)
10.4. Гравитация или инерция
103
в которых отклонение метрики от метрики Минковского
непосредственно определяется кривизной. Такая система отсчета является ло-
кально-инерциальной, в ней символы Кристоффеля обращаются в
нуль в точке х%.
Глава 11
Частицы и поля в
искривленном
пространстве-времени
Принцип эквивалентности позволяет получить уравнения
движения частиц и уравнения электромагнитного поля в заданном
гравитационном поле путем обобщения соответствующих уравнений СТО на
неинерциальные системы отсчета. Такое обобщение достигается
заменой частных производных на ковариантные, или, как иногда говорят,
заменой «запятой» на «точку с запятой». Нетривиальность этого шага
состоит в том, что заранее неясно, не содержат ли «правильные»
уравнения движения в искривленном пространстве-времени добавочные
члены, зависящие от тензора кривизны. Такие члены могут быть
допустимы из общих принципов, и необходимы дополнительные
соображения теоретического либо экспериментального характера чтобы их
принять или отвергнуть. Присутствие кривизны в уравнениях движения
означало бы нарушение принципа эквивалентности, который, однако,
не является абсолютным законом. Например, квантовые поправки к
классическим уравнениям в искривленном пространстве-времени как
правило содержат члены, зависящие от кривизны явно.
Взаимодействие с гравитационным полем, соответствующее правилу д —> V
называется минимальным,; классическая механика и классическая
электродинамика относятся к теориям, для которых это считается
справедливым.
11.1. Движение частиц
105
11.1. Движение частиц
Из принципа эквивалентности следует, что действие для
(нейтральной) точечной частицы в искривленном пространстве-времени
независимо от наличия или отсутствия истинного гравитационного поля
определяется тем же выражением, что и в СТО, с заменой метрики
T]fiu на Эри'
Sm = -тпс Ida — -тпс / J9ци[х(а)}— —- da. (11.1)
Существенное отличие, однако, состоит в том, что теперь при
варьировании по хм следует учитывать зависимость метрики от
координат. Последовательное варьирование действия (11.1) нарушает общую
ковариантность теории, поскольку из четырех компонент 4-скорости
u1* = dx^/ds в силу равенства g^u^u" = 1 независимыми
являются лишь три, поэтому в СТО мы выбирали в качестве
независимых переменных лишь пространственные координаты. Соотношение
Яцг/и^и" — 1 является условием связи, которое вытекает из уравнения
движения. Причина возникновения связи заключается в репораметп-
риэационной инвариантности действия (11.1) относительно
преобразования параметра a = я (А)
Более последовательно уравнение связи можно подучить, вводя в
действие множитель Лагранжа. Это позволяет преодолеть и другой
недостаток действия (11.1) — невозможность использовать его для
безмассовых частиц. Альтернативное действие является функционалом
четырех переменных хм(а) и логранжева множителя h(a):
а г /лл ч 1 /"L-l &X*dxv ,. ,з
Sm[x{X),h] = --J \h *gia, — —+h(mcy
Варьирование по h приводит к уравнению связи
d\. (11.2)
,, ч2 dx^dx" „, „,
(hmc)2=giiU ——, (11.3)
из которого можно выразить лагранжев множитель h через
динамические переменные. Подставив найденное значение в (11.2), мы
возвращаемся к действию в первоначальной форме (11-1). Преимуществом
формы (11-2) является ее применимость и при т = 0; в этом случае
условие связи сводится к изотропности вектора dxM/dX. При т = 0
интервал не годится на роль параметра, поскольку вдоль изотропной
кривой da = 0; в качестве параметра можно тогда выбрать временную
координату х°.
106
Глава 11. Частицы и поля в искривленном пр-ве
Варьирование действия (11.2) по жм приводит к уравнениям
движения
Tx[h Ж9^(*))=^ 9а^ЖЖ- (U.4)
Для частицы ненулевой массы молено положить А = s, тогда из (11.3)
следует
Л-1 = тс (11.5)
и эта величина выпадает из уравнения (11.4), которое можно будет
переписать в более простом виде:
^ = \gafi**vP, (11.6)
где Up = u^g^u. В уравнении (11.6) нетрудно узнать уравнение
геодезической линии в псевдоримановом пространстве, записанное в
терминах ковариантных компонент 4-скорости. Поднятие индекса приводит
к уравнению
^ = ^+0^=0, (И.)
выражающему условие параллельного переноса касательного
вектора и** вдоль кривой. Заметим, что варьированию подвергалась длина
кривой, поэтому геодезическая линия является также и кривой
экстремальной длины. Обратим внимание на то, что масса т не входит
в (11.7), это можно понимать как результат совпадения инертной и
гравитационной масс. Уравнение (11-7) непосредственно применимо и
к случаю т = 0, при этом следует лишь изменить параметризацию
кривой.
Можно показать, что при наличии вектора Киллинга Км свертка
и^Кц является интегралом движения. Действительно, вычисляя
производную от свертки и^Кц по правилу Лейбница, находим
D DuP
-(«"1^) = JT„— + «*%,.„«" = 0,
поскольку первое слагаемое равно нулю в силу (11.7), а второе — в
силу антисимметрии тензора Кц-», вытекающей из уравнения
Киллинга (10.21). Таким образом, каждое преобразование изометрии
пространства-времени порождает интеграл движения. В частности, если
метрика не зависит явно от временной координаты х° = ct, т. е. d/dt
является вектором Киллинга, то сохраняется ковариантная компонента
«о 4-скорости, с этой величиной связана полная энергия в
гравитационном поле
£ = тс2ио = mc2govU1'. (11-8)
11.1. Држжение частиц 107
В ньютоновском пределе gij = —Sij, g0i = 0, g00 = 1 4- 2<p/c2, (p <C c2,
поэтому условие связи дает
откуда u° ~ 1 + v2/2c2 — (р/с2. Подставляя в (11.8), находим
2
£ = тс2 + Т^- + пир, (11.9)
что представляет собой ньютоновское выражение для полной энергии
с точностью до постоянной тс2.
Обсудим четырехмерную гамильтонову форму уравнений,
соответствующую действию в форме (11.2). Заранее оговоримся, что эта
форма отличается от трехмерной, развитой в гл.7. Определяя обобщенные
импульсы как
^ = -|£: = fc-W, (11-ю)
построим гамильтониан
U = -Р„«" - L = \{т2г - дГРМ,
где отрицательный знак перед Рм соответствует выбору знака в (11.10).
Нетрудно проверить, что в силу условия связи (11.3) гамильтониан
"Н = 0. Можно показать, что обращение в нуль гамильтониана на
поверхности связей является следствием репараметризационной
инвариантности действия (11.2). Это общее свойство репараметризационно-
инвариантных теорий не препятствует возможности написания
уравнений Гамильтона, поскольку производные от Н по i1" и Р„ отличны
от нуля:
dx^__9H_ dP» _ &Н
dX ~ dP/ d\ ~ дх"'
Вместо уравнения геодезических более удобно использовать
уравнение Гамильтона-Якоби, при этом отпадает необходимость
вычисления символов Кристоффеля. Уравнение Гамильтона-Якоби
получается заменой в уравнении Н = 0 обобщенного импульса на —dS/dxv. В
калибровке (11.5) получаем
Это уравнение справедливо и при т = 0. Интегралами движения
являются производные от S по циклическим координатам, от которых
108
Глава 11. Частицы и поля в искривленном нр-ве
T>»>=mc>fu»u»S(x-^S»ds,
метрика не зависит. Это вполне соответствует излаженному выше
методу получения интегралов движения в искривленном пространстве-
времени: производные по циклическим координатам соответствуют
векторам Киллинга. Заметим, что в уравнение Гамильтона-Якоби
входит дважды контравариантный тензор дм", обратный к метрике дм„.
Нетрудно показать, что уравнения движения точечной частицы
эквивалентны условию консервативности V^T^" = 0 тензора энергии-
импульса
которое отличается от (8.22) лишь множителем л/—д, появившимся в
результате замены 4-объема на инвариантный объем d4x —> у/—д d*x.
Уравнения движения заряда в электромагнитном поле Ац в
искривленном пространстве-времени можно получить, добавив к
действию в форме (11-1) либо (11.2) вклад, описывающий
взаимодействие. Этот вклад сохраняет вид (7.38), поскольку интеграл от 1-фор-
мы вдоль мировой линии не зависит от метрики. Варьирование в
калибровке (И-5) приводит к уравнению
mc=^- = -F»vuv, (11.12)
as с
отличающемуся от (7.20) заменой обычной производной на ковариант-
ную. Бели пространство-время изометрично вдоль векторного поля
Киллинга К* и 1-форма потенциала Ац также обладает этой
симметрией,
СКАМ = 0,
то аналогично предыдущему можно вывести закон сохранения
проекции обобщенного импульса на вектор Киллинга
D
где обобщенный 4-импульс в калибровке (11.5) равен
8L е
:(K»PJ = 0,
Рц = —тг-^ = rncuu + -AL
Наконец, заменяя Рм = —dS/dx^ в условии связи, получим уравнение
Гамильтона-Якоби для заряда, взаимодействующего как с
электромагнитным, так и с гравитационным полем
(2L + U„\(?S- + -A„X*~=m'c
\дх*
+\^Ш+\*-У~"
11.2. Скалярное поле
109
11.2. Скалярное поле
Прежде чем переходить к описанию максвелловского поля в ОТО,
рассмотрим теорию безмассового скалярного поля; подобные поля,
хотя до сих пор и не наблюдались экспериментально, играют важную
роль в теоретических исследованиях последних десятилетий. На этом
примере мы проследим возникновение тензора энергии-импульса при
варьировании действия по метрике, а также обсудим возможность
неминимального гравитационного взаимодействия.
Рассмотрим вещественное скалярное поле ф(х). Действие,
инвариантное относительно диффеоморфизмов хм —> х1*' и приводящее к
уравнениям поля без высших производных, можно записать в виде
» = \№&&Г-v«i)S=i*.= \liX=i** (11.14
где У(ф) — некоторая вещественная функция, по аналогии с механикой
называемая потенциалом. Варьирование по ф приводит к уравнению
поля
П*-§£=0, (11.14)
где
—. оператор Д'Аламбера, VM — ковариантная производная.
Канонический тензор энергии-импульса имеет вид
V = +*Щ1 ~ W = ФЖ - \&"ЛФ*Ф,Х - П (п.15)
В отличие от максвелловского этот тензор (с опущенным индексом v)
с с
симметричен: T^v = Tvli, что связано с равенством нулю спина
скалярного поля. В силу уравнений поля (11.14) имеет место условие
консервативности ТЭИ
v„ V = ад," + г%,т/ - г^гд" = о, (иле)
которое получается заменой в уравнении непрерывности (8.13) частной
производной на ковариантную. В искривленном пространстве-времени
условие консервативности уже не имеет смысла уравнения
непрерывности и потому не позволяет сформулировать закон сохранения
4-импульса. Однако мы и не вправе ожидать сохранения каких бы то ни
было величин в случае произвольной метрики </м„, вообще говоря, не
110
Глава 11. Частицы и поля в искривленном пр-ве
обладающей симметрией. Если же метрика допускает существование
векторного поля Киллинга, то закон сохранения соответствующей
величины действительно имеет место. Учитывая (10.22) и (11.16),
находим
v„(tmvk») = -^=dv(^^TMvK") = о.
v—g
Отсюда при обычных предположениях об убывании поля на
бесконечности (см. гл. 8) следует независимость интеграла
VK= fTMl/K'idSv (11.17)
от выбора пространственноподобной гиперповерхности Е.
Рассмотрим теперь вариацию действия (11.13) по метрике
пространства-времени. Назовем величину
2 д(£у/=д)
^ = -^£^ (И.18)
метрическим ТЭИ. Отметим, что здесь производная вычисляется по
контравариантной метрике (обратному метрическому тензору), если
же дифференцировать по метрике с нижними индексами, то
получим контравариантный ТЭИ со знаком «минус», поскольку gttv^9>lv —
—g^Sg^v. Метрический ТЭИ по построению всегда симметричен.
Подставляя плотность лагранжиана из (11.13), будем иметь
Туя, = ф,мФ,г, ~ ^Я^Ф.хФ'* - V)~
Этот тензор в точности равен каноническому ТЭИ (11.15) с
опущенным индексом v. Совпадение метрического тензора с каноническим
связано с равенством нулю спина скалярного поля.
Обсудим теперь выбор действия (11.13) с более общих позиций.
Такой выбор соответствует минимальному взаимодействию с
гравитационным полем. В принципе можно допустить существование членов,
явно зависящих от кривизны, например И^ф^ф^ или Иф2 (где ВР" —
тензор Риччи, R — скалярная кривизна). Их добавление может
обеспечить дополнительную симметрию действия, что представляет интерес
в конкретных физических теориях. Так, есть основания полагать, что
уравнения без массовых полей должны быть инвариантными
относительно конформного растяжения метрики
9и„ -)• П2(х)дц„.
(11.19)
11.2. Скалярное поле
111
Если одновременно подвергнуть преобразованию скалярное поле
ф ->• П~хф, (11.20)
то при fl — const можно избавиться от О в первом слагаемом в (11.13),
поскольку д1*" —* Q.~2gliV, у/—д —> П4у/—д. Чтобы второе слагаемое
оставалось инвариантным, потенциал должен иметь вид V ~ ф4.
Однако инвариантность действия будет нарушена, если конформное
преобразование локально, т. е. если Q зависит от х, из-за дополнительных
членов, возникающих при дифференцировании П. Результат действия
на ф оператора Д'Аламбера преобразуется следующим образом:
аф ->■ п~3 пф - фп~4ап.
Можно показать, что аналогичный закон преобразования при
конформном растяжении (11.19) имеет скалярная кривизна:
Д->П-2Д + 6ГГ3ПП.
Это позволяет построить действие, инвариантное относительно
локальных конформных растяжений метрики, вводя неминимальное
взаимодействие через скаляр кривизны. Нетрудно проверить, что
действие с конформной связью
s=hf ((w)2+1яф2 ~ \ф*) ^<**х <и-21)
действительно обладает локальной конформной симметрией.
Соответствующее уравнение поля
Пф+1я,ф-\ф3 = 0
6
содержит скалярную кривизну явно и, таким образом, нарушает
принцип эквивалентности в его сильной форме. Если R = 0, то
действие (11.21) переходит в действие (11.13) при V = Хф4/4. Однако
метрический тензор энергии-импульса, отвечающий действию (11.21),
Т„и = Ф,цФ,* - ^иФ,хФ,х - gV^V^2 - ^дц„Пф2+
+ ^(R»v - \R9^) + \фАд^ (Н-22)
сохраняет память о конформной связи и при R^u = R = 0. Это еще
одно проявление неоднозначности в выборе ТЭИ. Исходя из
вариационного определения тензора энергии-импульса (11.18) можно показать
112
Глава 11. Частицы и поля в искривленном пр-ве
что для скалярного поля с конформной связью должно иметь место
равенство нулю следа Т£ = 0 при выполнении полевых уравнений.
В этом можно усмотреть отличие от случая максвелловского поля,
для которого след тензора энергии-импульса равен нулю
тождественно. Различие состоит в том, что максвелловское поле не преобразуется
при конформном растяжении метрики, в то время как скалярное поле
испытывает преобразование (11.20). Выражение (11.22) действительно
удовлетворяет этому требованию.
11.3. Электродинамика в
общековариантной форме
Электродинамика в искривленном пространстве-времени является
непосредственным обобщением элетродинамики в пространстве Мин-
ковского. Источником электромагнитного поля является
сохраняющийся ток jfi(x). Закон сохранения в общековариантной форме имеет
вид
VMj" = JLdpU»y/=g) = 0, (11.23)
где учтено соотношение (10.16). Это уравнение, в отличие от условия
консервативности тензора энергии-импульса (11.16), по-прежнему
выражает закон сохранения электрического заряда
Q = fj^dSft
в произвольном искривленном пространстве-времени. Математическое
отличие ковариантных дивергенций от вектора и тензора второго
ранга состоит в том, что в первом случае ковариантная дивергенция
сводится к простой дивергенции от того же вектора умноженного на \/--д,
а во втором нет. По этой же причине тензор энергии-импульса
порождает сохраняющуюся величину лишь при наличии вектора Киллин-
га; тогда свертка Тц"К1* становится 4-вектором, для которого
условие консервативности аналогично (11.23) и ведет к закону
сохранения (11.17).
Для точечного заряда, движущегося вдоль мировой линии Xq(s),
плотность тока равна
J V^9
11.3. Общековариантная электродинамика
113
где дельта-функция определена как обычно, J64(x)d4x = 1, т.е. не
является инвариантной относительно общекоординатных
преобразований.
Электромагнитное поле в ОТО описывается тензором поля F^»,
компоненты которого уже не всегда являются физическими
значениями напряженностей электрического и магнитного полей. Для
определения последних необходимо конкретизировать систему отсчета,
поэтому трехмерная формулировка уравнений Максвелла в
искривленном пространстве-времени ОТО становится довольно сложной.
Однако четырехмерная форма уравнений по-прежнему проста. Тензор
электромагнитного поля FMV может быть выражен через 4-потенпиал
двояким образом:
ввиду сокращения здесь членов с символами Кристоффеля. Это
неудивительно, соотношение F = dA не зависит от метрики. Обратим
внимание на то, что исходной величиной, описывающей электромагнитное
поле в ОТО является 4-потенциал с нижними индексами. При
поднятии индексов мы получаем контравариантный тензор поля, который
уже существенно зависит от метрики.
Действие для электромагнитного поля с источником в ОТО
отличается от действия (8.9) в пространстве Минковского лишь
инвариантной мерой интегрирования по пространству событий, а также тем,
что все свертки по индексам теперь осуществляются по метрике,
зависящей от коотрдинат:
s=-\I (тЪ1^"+^) ^^- (и-24)
Варьирование по потенциалу Ам с нижним индексом приводит к
уравнениям Максвелла
V„F"" = -L&Vtv^F"") = -—j". (11.25)
V-9 c
Тождество Бианки d¥ — 0 можно представить в различной форме:
где дуальный тензор поля равен
2V~9
114
Глава 11. Частицы и поля в искривленном пр-ве
(здесь б**1/Ат = ±1 — тензорная плотность). Все эти соотношения
иллюстрируют правило дц —¥ Vfi минимального общековариантного
обобщения СТО.
Построим метрический ТЭИ для свободного электромагнитного
поля. Для удобства варьирования первого слагаемого в (11.24)
предварительно его следует представить в виде F)iVF\Tg,iXgvry/—g,
поскольку роль обобщенных координат максвелловского поля в ОТО играют
ковариантные компоненты Ам, и, следовательно, не зависящими от
метрики следует считать величины FMV, но не F^v. В результате с
помощью формулы (11.18) находим
?> = ^ (f^F\ + j9tiUFa0FaA . (11.26)
Метрический ТЭИ совпадает с симметричным максвелловским ТЭИ
специальной теории относительности (8.19) с точностью до замены 77м„
на 9ци- Что же касается законов сохранения, вытекающих из условия
консервативности Vi.T„" = 0, то они, как и выше, возникают только
при наличии векторов Киллинга. Заметим, что все законы
сохранения в ОТО означают сохранение величин, включающих вклад самого
гравитационного поля. Примером может служить сохранение энергии
точечной частицы в постоянном гравитационном поле (11.8), (11.9),
здесь речь идет о полной энергии, включающей потенциальную
энергию в гравитационном поле.
Действие для электромагнитного поля также обладает
конформной симметрией, причем при преобразованиях (11.19)
потенциал Ац следует оставить неизменным. Поэтому след метрического
ТЭИ (11.26) обращается в нуль тождественно, независимо от
выполнения уравнений движения: Т£ = 0.
11.4. Струны и мембраны
До сих пор нам встречались физические объекты двоякой
природы: точечные частицы и непрерывно распределенные в пространстве
поля. В квантовой теории поля различие между частицами и
полями в значительной степени стирается и, скорее, связано лишь с
различным поведением полей целого и полуцелого спина. Между тем, в
полной квантовой теории фундаментальных взаимодействий, которая
пока еще не существует в окончательном виде и которая должна
включать и квантовую теорию гравитации, оказывается необходимым
рассматривать протяженные объекты различной размерности, которые
не попадают в категории частиц или полей. Следующей за точечной
11.4. Струмы и мембраны
115
частицей в иерархии таких объектов является релятивистская
струна. Струна локализована на некоторой кривой в пространстве, при
своем движении она заметает двумерную поверхность в пространстве-
времени — мировой лист
х» = х"(<т,т), (11.27)
где а — пространственноподобный, а г — времениподобный параметр
(полагаем также аа = (т, <т), а = 0,1). Действие струны выбирается
по аналогии с действием точечной частицы в виде площади мирового
листа
S = -Т J у/- det habd2<r. (11.28)
Здесь коэффициент Т — натяжение струны (в этом разделе
выбираем с = 1), интеграл берется по мировому листу между моментами
времени tq и т/, и Наь — метрика, индуцированная на мировом
листе (11.27),
hab = д^дах"дьх" |хМ=гМ(<г >г), да = (9„ дТ). (11.29)
Струна может быть замкнутой, тогда выбирают <т € [0,7г], x>i(a+ir) =
хм(а), либо открытой: а € [0,7г] без условия периодичности.
Более удобно считать компоненты метрики на мировом листе Наь
независимыми переменными, представив действие в виде
S = -\ f h^dax^dbx'g^y/^h do-dr, (11.30)
такой переход аналогичен переходу от (11.1) к (11-2) для точечной
частицы. Варьирование (11.30) по паь дает условия связи, поскольку
величины hab, входящие в действие без производных, являются ла-
гранжевыми множителями:
' гаЬ = -~-^ = -Т (даХ»дЬХ» - ^abh^d^d^ 9(iv = 0.
Разрешив эти уравнения относительно hab, получим выражение
(11.29), постановка которого в (11.30) возвращает нас к действию
(11.28).
Теорию струны, описываемую действием (11.30), можно иначе
понимать как двумерную теорию поля, полевыми функциями которой
являются скалярные поля хм(<т,г), распространяющиеся в
пространстве т, а с метрикой Наь- Совокупность величин таь тогда
образует тензор энергии-импульса этой двумерной теории. Двумерная
теория поля, помимо инвариантности относительно диффеоморфизмов
116 Глава 11. Частицы и поля в искривленном пр-ве
о~а —> о-'а(т, а), обладает также конформной инвариатностпъю
относительно локальных растяжений метрики каь
hab -*■ n(o-,T)hab. (11.31)
Действительно, при этом y/^h -» fl</^h, hab -» П_1ЛоЬ), остальные
величины не изменяются. Двумерная конформная группа
бесконечномерна, это обеспечивает возможность непротиворечивого
квантования теории и придает ей ряд привлекательных свойств. Например,
в отличие от стандартной квантовой теории поля в четырехмерном
пространстве-времени, которая содержит расходимости и нуждается
в перенормировках, квантовая теория струн является конечной.
Варьирование действия (11.30) по х1* приводит к уравнению
движения
-~da(V=hhabdbx») + habT^daxvdbxx = 0, (11.32)
в котором первый член содержит двумерный инвариантный оператор
Д'Аламбера на мировом листе, а второй член с символами Кристоф-
феля обеспечивает ковариантность теории в пространстве-времени х>*.
Рассмотрим распространение струны в плоском пространстве-
времени д^ = 77м„. Используя инвариантность относительно
двумерных диффеоморфизмов и конформную инвариантность, можно
выбрать на мировом листе метрику Минковского hab = diag(l, —1). Тогда
вместо (11.32) будем иметь
(#-#)*" = (),
откуда следует, что решение представимо в виде суперпозиции двух
произвольных функций:
*" = х%(* - т) + х»(о-+ т), (11.33)
называемых правыми и левыми модами. Таким образом, струна, в
отличие от точечной частицы, обладает внутренней динамикой.
Физически это объясняется тем, что действие (11.28) описывает не
совокупность свободных материальных точек, а объект, обладающий
внутренним натяжением. Чтобы убедиться в этом, построим
метрический тензор энергии-импульса струны, варьируя действие (11.30) по
5й". Предположим, что струна вытянута вдоль оси z, х* = (г, 0,0, ег)
и является бесконечной. Тогда, умножая действие на единицу вида
1 = S^4(x — х(а,г))<^х и воспользовавшись формулой (11.18)
получим
7$ = Т?= Тб(хЩу). (11.34)
11.4. Струны и мембраны
117
Формула (11.34) показывает, что струна натянута вдоль оси z,
причем натяжение экстремально велико, так что скорость бегущих по
струне волн совпадает со скоростью света с = 1.
В теории Максвелла взаимодействие точечного заряда с 4-вектор-
ным полем А1* вводилось как интеграл от 1-формы А вдоль
мировой линии. Аналогично можно ввести взаимодействие струны с полем
2-формы В = B^dx1* A dxv, интегрируя по мировому листу струны.
Поле Вм1/ называется струнным аксионом. Добавка к действию (11.30)
будет иметь вид
5int = - Г В = - f BMVdx»Adxu = - Г Btlv8axlidbXueabdtTdT, (11.35)
где €°Т = —ет" = 1 и аксионный заряд положен равным единице.
Интеграл (11.35) не зависит от метрики gMV и сохраняет все симметрии
действия (11.30), включая конформную.
Разложив правые и левые моды (11.33) в ряды Фурье, получим
бесконечное число осцилляторов, которым в квантовой теории можно
сопоставить некоторые поля. Таким образом, струна описывает
систему бесконечного числа полей. В реалистических моделях
необходимо вводить, наряду с хм, также добавочные антикоммутирующие
координаты, подчиняя теорию условию суперсимметрии (суперструны).
Среди бесконечного числа полей, охватываемого теорей суперструн,
имеется лишь конечное число безмассовых полей, которые и
представляют основной интерес (массивные поля имеют столь большую массу,
что заведомо ненаблюдаемы). Оказывается, что среди этих полей есть
гравитон; это открывает путь к квантовому описанию гравитации,
которое до сих пор не удавалось осуществить в рамках традиционной
квантовой теории поля.
В теории струн размерность пространства событий заранее не
фиксируется, а подлежит определению из самой теории. Теория
суперструн в пространстве Минковского фиксирует размерность D = 10;
в более современной (но пока еще не сформулированной
окончательно) М-meopuu размерность пространства-времени равна одиннадцати.
В 23-мерном пространстве событий могут существовать протяженные
объекты (р-браны) размерности 0 < р < D — hp = 0 отвечает точечной
частице, р = 1 — струне, р = 2 — мембране и т. д. Действие свободной
р-браны является непосредственным обобщением (11.28):
S=-Tp f v/-det/iabd,,+1cr, (11.36)
где a, 6 = 0,... ,р и hab индуцированная метрика в мировом объеме,
118
Глава 11. Частицы и поля в искривленном пр-ве
заметаемом р-браной, который определятся уравнениями
х»=х»{т,<т\...,<тГ). (Ц.37)
Мировой объем параметризован р + 1 вещественными координатами
0-°, a = С, ...,р, причем а0 = т. Действие (11.36) уже не обладает
конформной симметрией относительно локальных растяжений
метрики (11.31), поскольку теперь y/^h ->■ il^+^^y/^h, в то время как для
контравариантных компонент метрики по-прежнему hab -t Q~1hab. В
этом отношении случай струны р = 1 является исключительным.
Можно ввести взаимодействие р-браны с полем (р + 1)-формы
A(p+i) = -4/10,-,*»» <^х>1° Л '•• л dxMp, интегрируя форму по мировому
объему (11.37):
•Sint ~ ~ I Ap+i-
В случае р = D — 1 мировой объем р-браны заполняет все пространство
событий, т. е. мы имеем ситуацию теории поля.
Ненаблюдаемость дополнительных пространственных измерений,
с необходимостью возникающих в теории струн, может быть
объяснена тем, что они образуют компактное многобразие весьма малых
размеров, которое может быть доступно лишь при очень высоких
энергиях. В последнее время обсуждается также возможность
«больших» дополнительных измерений, которые могли бы проявить себя на
ускорителях нового поколения, которые начнут работать уже в
ближайшие годы.
Глава 12
Динамика
гравитационного поля
До сих пор метрика пространства событий считалась заданной.
Теперь обратимся к выводу динамических уравнений для самого
гравитационного поля. Прежде всего нужно уточнить, какие величины
описывают гравитационое поле как таковое. Мы уже знаем, что
метрический тензор пространства событий определен неоднозначно в связи с
произволом в выборе координат. Символы Кристоффеля,
описывающие гравитационные силы, также не определены однозначно, будучи
нетензорными величинами. Их можно обратить в нуль не только в
заданной точке, но и вдоль некоторой кривой в пространстве-времени.
Если проводить аналогию с электромагнитным полем, то в теории
Максвелла вообще отсутствует объект типа метрики, а 4-потенциал А1*
играет роль, аналогичную роли символов Кристоффеля в ОТО, при
этом выбор координат соответствует выбору калибровки 4-потенциа-
ла А*1. Тензор поля F^ аналогичен тензору кривизны в ОТО. Тензор
кривизны как инвариантный оператор от выбора координат не
зависит, а закон преобразования его компонент (п. 10.2) однороден и
значит несингулярным преобразованием координат его нельзя обратить
в нуль. Поэтому уравнения гравитационного поля вместе с
физическими условиями на их решения должны определять тензор
кривизны; что же касается метрики, то следует иметь в виду, что одно и то
же гравитационное поле можно описывать бесконечным числом
способов ввиду неоднозначности выбора координат. Это часто приводит
к непростой задаче идентификации различных метрик, описывающих
одинаковую физическую ситуацию. Тем не менее, решение конкрет-
120
Глава 12. Динамика гравитационного поля
ных задач, как правило, начинается именно с параметризации
метрики, при этом свобода в выборе координат в пространстве событий
используется для максимального упрощения уравнений. Определяющую
роль играет предполагаемая симметрия решения, выводимая из
физических условий задачи. Решение состоит в нахождении всех функций,
параметризующих метрический тензор, тем самым определяется гра-
витационое поле в фиксированной системе координат.
12.1. Уравнения Эйнштейна
Дадим сначала эвристический вывод уравнений Эйнштейна из
уравнения ньютоновской гравитации
A(p = 4irGp, (12.1)
где <р — гравитационный потенциал, р — плотность массы, G —
ньютоновская постоянная, равная 6.67-Ю-8 см3/(г-сек2). В теории
Максвелла «релятивизация» аналогичного уравнения для электростатического
потенциала (с другим знаком в правой части, поскольку одноименные
заряды отталкиваются) приводила к уравнению Д'Аламбера для
потенциала А11 в пространстве Минковского. Возникает вопрос, нельзя
ли получить релятивистское в смысле СТО уравнение и для
гравитационного потенциала.
Из общих соображений следует, что на роль переносчика
гравитационного взаимодействия в СТО могло бы претендовать скалярное
поле либо поле симметричного тензора второго ранга. Векторное
поле не годится, поскольку оно приводит к отталкиванию одноименных
зарядов, роль которых в теории гравитации играют массы тел.
Антисимметричный тензор второго ранга имеет в качестве
напряженности 3-форму, уравнения для которой в 4-мерном пространстве событий
сводятся к уравнению для скаляра. Симметричные тензоры ранга
выше второго вообще не имеют нетривиальных взаимодействий в
классическом пределе. Таким образом, нужно исследовать скалярное поле,
поле симметричного тензора второго ранга, либо смесь обоих полей.
Скалярное поле в чистом виде не годится по следующей причине.
Закон Ньютона для нерелятивистских масс
„ GMt.M-2.
действительно можно получить из уравнения Д'Аламбера для
скалярного потенциала. Однако из опыта следует, что такой же закон,
причем с эффективной постоянной ровно в два раза ббльшей, имеет место
12.1. Уравнения Эйнштейна 121
для взаимодействия фотона с энергией Нш (луча света) с массивным
телом М (отклонение луча в поле Солнца)
'-*&. <™>
роль массы здесь выполняет величина 2Нш/сг. Фотон является
существенно релятивисткой частицей, у которой к тому же имеются два
состояния поляризации. Если предположить, что переносчиком
гравитационного взаимодействия является скалярное поле, и ввести
взаимодействие так, чтобы выполнялся закон Ньютона для нерелятивистских
масс, то предсказание для отклонения луча в поле Солнца будет
противоречить опыту. А именно предсказывается явная зависимость угла
отклонения от поляризации, что не наблюдается экспериментально.
Симметричный тензор второго ранга h^ = hv/1 приводит к более
удовлетворительным результатам. Если выбрать лагранжиан
взаимодействия в виде £int = -\hIJLvTliV, где Т"" — тензор энергии-импульса
материи, то будем иметь согласующиеся с экспериментальными
данными уравнения движения для массивных частиц и фотонов, причем
коэффициент 2 в (12.2) получает естественное истолкование как
следствие конформной симметрии электромагнитного поля,
выражающейся в равенстве нулю следа тензора энергии-импульса Т£ = 0.
Однако если попытаться построить теорию в плоском
пространстве-времени, то такая теория оказывается непоследовательной. В отличие от
максвелловской электродинамики, в которой электромагнитные поля
не взаимодействуют между собой, гравитационное поле с
необходимостью оказывается самодействующим, причем с той же константой
связи G, с которой оно взаимодействует с материальными полями.
Этот результат можно получить в квантовой теории, рассматривая
испускание гравитонов при столкновениях частиц различной природы
в пределе малых частот. С чисто классической точки зрения,
неудовлетворительность линейной теории состоит в невозможности обеспечить
ее инвариантность относительно калибровочных преобразований
hpv -> h^v — £,,,„ — £n,v, (12.3)
где £А — калибровочный 4-вектор, для произвольных £А.
Калибровочная симметрия имеет место лишь для бесконечно малых £л, а
попытка ее расспространения на конечные £л приводит к тому, что
полевые уравнения становятся нелинейными. В результате оказывается,
что необходимо ввести искривленное пространство-время с метрикой
9fiv — Цул/ + h^v,
122
Глава 12. Динамика гравитационного поля
где Tjfxv — метрика Минковского, которая сама становится фиктивной:
расстояния и промежутки времени будут определяться метрикой guv
по правилам, обсуждавшимся в гл. 10. Все эти соображения появились
значительно позже создания Эйнштейном общей теории
относительности, в которой метрика пространства событий играла с самого
начала определяющую роль. Они служат дополнительным аргументом в
пользу этой теории, которая на первый взгляд может показаться
стоящей вне ряда других полевых теорий, формулируемых в пространстве
Минковского.
После этих предварительных замечаний интерпретация
ньютоновского уравнения (12.1) в виде
Длю = ^Гоо, (12.4)
где в правой части стоит компонента тензора энергии-импульса,
представляется вполне естественной. Действительно, для покоящейся
материи Гад = рс2, при этом в ньютоновском пределе «joo = 1 + 2<р/с2.
Теперь это уравнение надо обобщить так, чтобы его правая и левая
части стали общековариантными тензорами. В правой части очевидно
молено взять тензор энергии-импульса Tuu для всех значений
индексов (i, v. В левой части пока мы имеем существенно нековариантное
выражение. Однако замечая, что необходимые нам вторые
производные от метрики входят в тензор кривизны, можно попытаться
построить нужную комбинацию из компонент последнего. Поскольку правая
часть (12.4) — симметричный тензор, то годится некоторая линейная
комбинация тензора Риччи Дм„ и скалярной кривизны, умноженной
на метрику Rg^. Для ее определения заметим, что тензор энергии-
импульса в правой части удовлетворяет ковариантному условию
консервативности VVT£ = 0. Единственной комбинацией Rav и Rg^v,
удовлетворяющей такому же условию, является тензор Эйнштейна
(-*uv ~ Rfii/ ~z9ixvR-
Действительно, в силу тождеств Вианки для тензора Риччи (10.18)
имеем
V„G£ = 0. (12.5)
Далее, в приближении \huv\ <С 1 из соотношения (10.19) находим Goo и
Дроо- Таким образом, левую часть (12.4) можно понимать как
компоненту Coo тензора Эйнштейна, отсюда ясно, что искомое общековари-
антное обобщение нерелятивистского уравнения (12.4) есть уравнения
Эйнштейна
Ruv — ^9uvR = Л Tfit,. (12.6)
12.1. Уравнения Эйнштейна
123
Симметричный тензор в четырехмерном пространстве имеет
10 независимых компонент. Однако для тензора Эйнштейна имеются
тождества Вианки (12.5), так что не все компоненты (12.6)
независимы. Другой особенностью является то, что из 10 уравнений только
6 содержат вторые производные по временнбй координате х°. Для
смешанных компонент G**0 из тождеств Вианки следует соотношение
ъЬ°^=-lb0* - r^G"A - г^А'
в котором правая часть содержит производные по х° порядка не выше
второго и, следовательно, С*0 не содержит вторых производных по х°.
Соответствующие компоненты уравнений Эйнштейна являются
связями. Число связей равно числу произвольных функций при выборе
системы координат в пространстве событий. Таким образом, уравнения
Эйнштейна содержат шесть динамических уравнений для компонент
метрики и четыре уравнения связей.
Уравнения Эйнштейна можно также рассматривать как
алгебраические соотношения, частично определяющие тензор кривизны.
Учитывая определение тензора Риччи, можно получить следующее
представление для тензора Римана:
R
-R/ii/At = C/iz/Ат + 0M[A#r]i/ — 9v[\Rr]iJi — -^9u[X9t]vi (12-7)
где Cuvxt — тензор Вейля, обладающий всеми симметриями тензора
Римана и, кроме того, удовлетворяющий условию Схи\и = 0.
Тензор Риччи отличен от нуля лишь в той области пространства-времени,
в которой отличен от нуля тензор энергии-импульса материи. Тензор
Вейля описывает свободное гравитационное поле вне материи. При
решении уравнений Эйнштейна может быть получена информация и о
свободной части поля, подобно тому, как при решении задачи об
излучении в электродинамике удается однозначно отыскать поле
излучения системы зарядов, удовлетворяющее свободным уравнениям
Максвелла. Для этого необходимо рассматривать уравнения Эйнштейна как
дифференциальные уравнения для метрики, дополнив их
подходящими граничными условиями. Заметим, что метрика входит также и в
соотношение (12.7), определяющее тензор Римана через тензор Риччи.
Уравнения Эйнштейна (12.6) существенно нелинейны относительно
метрики, поэтому в ОТО не имеет места принцип суперпозиции.
Гравитационные поля двух масс складываются линейно лишь в пределе
слабого поля \hu„\ <^ 1.
124
Глава 12. Динамика гравитационного поля
12.2. Действие для гравитационного поля
Функционал, варьирование которого по метрике дает левую часть
уравнений Эйнштейна, имеет вид
S = Sg + 5пов, (12.8)
где
S. = -
16nG
j Ryf=g~dAx,
а поверхностный член будет найден ниже. Варьирование Sg
производится следующим образом. Представим скалярную кривизну в виде
R = Rfivg*1", тогда
SSa = -
16nG
h
/ [(*/- ~ \дм»Я) SgT + g^SRA ,/^d4x, (12.9)
где учтено соотношение
6V4=-\v=g~gliv6g>»'.
Для преобразования последнего члена в (12.9) используем локальную
систему отсчета (10.27). Тогда в точке ж" = а# все Т\ = 0 и мы
находим
g»v5RtiV = dttw», w^ = g^sr^-g^Srfia0.
Величины 6Г£0 в отличие от самих Г^ образуют тензор, поскольку
неоднородные члены в законе преобразования (10.15) сокращаются.
Поэтому ги" есть вектор, и, следовательно, в произвольной системе
координат будем иметь
Соответствующий интеграл преобразуется в интеграл по граничной
гиперповерхности, такие величины обычно принято опускать. Однако
в теории гравитации ситуация осложняется тем, что подынтегральное
выражение содержит вариации не только метрики, но и ее
производных, причем не только тангенциальных, но и нормальных к граничной
гиперповерхности. Это отличие от случая электродинамики связано с
тем, что эйнштейновское действие содержит вторые производные от
метрики. Поэтому поверхностный интеграл нельзя просто опустить,
12.2. Действие для гравитационного поля
125
а необходимо скомпенсировать специально подобранным
поверхностным вкладом в действие. Один из способов записи поверхностного
интеграла в геометрических терминах следующий:
5пов = '^G /{К ~ K°)VF\<?x,
an
где К — след второй квадратичной формы гиперповерхности dil с
нормалью пм
а 7 — определитель трехмерной метрики, индуцируемой на 9П.
Величина К0, соответствует результату, получаемому при замене
метрики на плоскую, ее вычитание, эквивалентное вычитанию бесконечной
константы, необходимо для обеспечения конечности действия. Таким
образом, варьирования действия (12.7) с учетом поверхностного члена
действительно дает тензор Эйнштейна:
SS = -^ J(RMV - \д,>иК)8<Г^<Рх. (12.10)
п
Полное действие для материальной системы и создаваемого ею
гравитационного поля есть сумма (12.8) и действия материи Sm.
Варьируя Sm по метрике получаем метрический тензор энергии-импульса по
правилу (11.18), или, что то же самое,
5Sm = Ycf T^WvV=9d*x. (12.11)
Объединяя соотношения (12.10) и (12.11), получаем уравнения
Эйнштейна (12.6).
Поскольку вариация действия материи по метрике дает тензор
энергии-импульса материи, а вариация гравитационного действия —
тензор Эйнштейна, то возникает вопрос об энергии-импульсе
самого гравитационного поля. Частично ответ на этот вопрос содержится
в характере условия консервативности для тензора энергии-импульса
материи в ОТО: сохраняющиеся величины, которые можно построить
при наличии векторов Киллинга, содержат вклад как материи, так и
гравитационного поля. Можно пойти несколько дальше и представить
условие консервативности тензора энергии-импульса материн в виде
обычной (нековариантной) дивергенции от суммы двух величин, одна
из которых переходит в тензор энергии-импульса материи при
выключении гравитационного поля, а вторая зависит только от метрики и
126
Глава 12. Динамика гравитационного поля
ее производных и может быть интерпретирована как характеристика
энергии-импульса гравитационного поля. По самому построению
такая величина не будет тензором, хотя она и может иметь тензорный
характер относительно ограниченного класса преобразований
координат, например, линейных. Известно несколько таких псевдотензоров,
например, канонический псевдотензор Эйнштейна, мы построим его
в приближении слабого поля в следующем разделе. Другой
известной конструкцией такого рода является симметричный псевдотензор
Ландау—Лифшица. Согласование энергетических характеристик
гравитационного поля, получаемых с помощью различных
псевдотензоров, имеет место для асимптотически плоских пространств событий,
для которых на большом удалении от материальной системы
координаты могут быть выбраны так, что дм„ = Т)^ + h^, причем величины
hfxt, спадают с расстоянием не медленнее, чем 1/г. Бели это условие не
выполнено, то различные лсевдотензоры могут приводить не только к
различным, но и просто абсурдным результатам. В ОТО существуют и
более тонкие методы получения локальных (точнее квазилокальных)
энергетических характеристик гравитационного поля, но как правило
они имеют ограниченную область применимости. Физическая
причина, по которой локальное определение плотности энергии
гравитационного поля в терминах метрики и ее первых производных встречает
затруднения, связана с принципом эквивалентности: простым
преобразованием координат можно обратить эти величины в нуль в любой
наперед заданной точке.
Отметим еще одно важное обстоятельство. Уравнения
Эйнштейна (12.11) связаны тождествами Бианки (12.5) и поэтому они
совместны только при выполнении условия консервативности тензора
энергии-импульса материи. Последнее справедливо при выполнении
уравнений движения. Так, в случае точечной частицы имеем
J V~9
и условие V„TJ£" = 0 сводится к уравнению геодезической
as
Таким образом, уравнение движения частицы содержится в
уравнениях Эйнштейна. Для системы из заряженных частиц и
электромагнитного поля полный тензор энергии-импульса есть T£f + Тр.", где
TpV — максвелловский тензор энергии-импульса (11.26). Условие
консервативности выполняется при выполнении уравнений движения
зарядов (11.12) и уравнений Максвелла (11.25). В этом случае, однако,
22.3. Линейное приближение
127
число материальных уравнений превосходит число тождеств Бианки,
поэтому выполнение материальных уравнений является лишь
достаточным условием совместности уравнений Эйнштейна.
12.3. Линейное приближение
Рассмотрим случай слабого гравитационного поля, выбирая
систему отсчета так, чтобы
9ци = V + V" \h^\ ^ а> (12.12)
где rjfiv — метрика Минковского. Введем вместо fcM„ величины
фци = hMV - -Ti^h, h = ft£,
считая здесь и далее, что поднятие и опускание индексов производится
с помощью метрики Минковского. Координаты пространства событий
по-прежнему могут быть подвергнуты преобразованию, не
выводящему за пределы ограничения (12.12). Это преобразование индуцирует
следующее преобразование величин h^:
Лм„ -> h„„ - £,,,„ - f„iM, |£/i| -С 1. (12.13)
Преобразованием (12.13) можно воспользоваться, чтобы добиться
выполнения следующего калибровочного условия:
V,* = 0 (12.14)
(калибровка Фока-де Дондера). Теперь нетрудно убедиться в том, что
тензор Эйнштейна в линейном по VV" приближении принимает
простой вид
R»v - ^g^R = 2 D ^ + °{Ф2)
(для вывода этой формулы следует воспользоваться
представлением (10.19) тензора кривизны). В результате находим, что уравнения
Эйнштейна в линейном по ф^и приближении сводятся к уравнению
Д'Аламбера в пространстве Минковского
Пф^ = ^Тм„. (12.15)
Отсюда следует, что гравитационное поле, так же как и
электромагнитное, распространяется со скоростью света. Свободное поле фци,
удовлетворяющее уравнению
Пф^ = 0, (12.16)
128
Глава 12. Динамика, гравитационного поля
представляет собой поле гравитационных волн. Плоская
монохроматическая гравитационная волна, распространяющаяся вдоль
волнового вектора к, имеет вид
W = R* {e^e'C"-"*)} , ш = с\к\,
где амплитуды е^„ в силу равенства (12.14) удовлетворяют условиям
поперечности
*%„=(), к» = (-,к), *%, = (). (12.17)
Решения уравнения Д'Аламбера (12.16) можно снова подвергнуть
калибровочному преобразованию (12.13), теперь при дополнительном
условии
□ &= О,
так что преобразованные величины ф^и по-прежнему будут
удовлетворять уравнению (12.16). Этим можно воспользоваться, чтобы
обратить в нуль след ф = ф£, а также смешанные компоненты фы. Тогда
из (12.17) получим
c&ieo* n _ , _
еоо = = 0, еи = О, й<еу = О
(здесь трехмерные индексы поднимаются и опускаются с помощью
Sij). Таким образом, поляризация гравитационных волн
описывается поперечным трехмерным тензором е„ с нулевым следом.
Обозначим через ев, ev пару ортов, лежащих в плоскости, ортогональной к,
и образующих с ним правую тройку: с[к х ев] = ше?. Тогда можно
разложить Qj по двум состояниям поляризации:
etf =«®е§+аве®,
:® = (е?ев- — е^е^ <=® — * (J& Ч> . ч> в\
Таким образом, гравитационные волны, так же как и
электромагнитные, имеют два независимых состояния поляризации. Введенные
символы поляризаций отражают характер движения пробных частиц в
поле гравитационной волны в плоскости, поперечой к направлению ее
распространения.
Гравитационные волны воздействуют на пробные частицы, а также
на электромагнитное поле, передавая им энергию и импульс. В
рамках линеаризованной теории можно построить лоренц-ковариантный
12.3. Линейное приближение
129
тензор энергии-импульса для поля ф^, исходя из лагранжева форма-
лизма. Линеаризованная ОТО аналогична максвелловской
электродинамике, при этом роль калибровочных преобразований играют
четыре преобразования (12.13), индуцируемые инфинитезимальным
преобразованием координат. Существенным отличием является то, что
в рамках теории без высших производных сформулировать теорию
в терминах калибровочно-инвариантных величин оказывается
невозможным. В электродинамике калибровочно-инвариантными являются
компоненты поля FpV, в линеаризованной теории гравитации
аналогичную роль играют компоненты тензора кривизны R^Xr- Но эти
величины построены из вторых производных от г/>й„, с помощью
только первых производных построить калибровочно-инвариантный
тензор из фу.» вообще нельзя. Если в качестве лагранжиана взять, как в
теории Максвелла, квадрат тензора кривизны, то мы получим для ф^и
уравнения четвертого порядка, не совпадающие с (12.15). Бели же
попытаться построить лагранжиан из первых производных от фц„, то
удается обеспечить калибровочную инвариантность только в линейном
приближении по £^. Это служит указанием на то, что результирующая
теория является лишь приближенной.
Действие, обладающее указанными свойствами, имеет вид
Sh = з^ yW.A^ - 2ф1Ш,хф^и - \ф,хФ'*) а«х = \f£d4x.
Варьирование приводит в калибровке (12.14) к уравнению (12.16).
Канонический тензор энергии-импульса(дважды контравариантный)
. tr» = Ф'"я — = ——{ъь^ЛФ**''' - 2фаи<р)-
- ф#ф." - гГ(Фч0,хФа/>^ ~ 2фа0,хфаХ^ - \ф,хФ'*)\
удовлетворяет уравнению непрерывности
dj?" = О,
и, следовательно, приводит к сохранению 4-импульса
Рм= f\01*а*х. (12.18)
Общее решение уравнения Д'Аламбера (12.16) в калибровке Фока—
де Дондера (12.14)
5-8210
130
Глава 12. Динамика гравитационного поля
после подстановки в (12.18) и интегрирования по пространству дает
следующее выражение для 4-импульса поля:
где введены проекции
аф(&) = е*<р*'{к), a*(fc) = eg^(fe).
Правую часть в линеаризованных уравнениях Эйнштейна (12.15)
можно получить, вводя взаимодействие поля Лм„ с тензором энергии-
импульса материи:
«Sint — — -z I htlvT,iV d x.
Заметим, что при калибровочных преобразованиях (12.13) это
выражение изменяется лишь на полную дивергенцию при условии
консервативности Г*»" в смысле СТО, т. е. dvT»v = 0.
Уравнения (12.15) позволяют построить запаздывающие решения
и рассчитать гравитационное излучение системы движущихся тел в
полной аналогии с результатами гл. 9. При этом динамика
материальной системы должна быть негравитационной (например, система
зарядов и создаваемого ими электромагнитного поля). В противном
случае условие консервативности в смысле СТО диТ,Л1' = 0 не
будет выполняться, поскольку гравитационное поле трансформирует это
условие в равенство нулю ковариантной производной. Чтобы
корректно описать гравитационное излучение гравитирующей системы,
необходимо в уравнениях Эйнштейна учесть также члены, квадратичные
по V"ah/) которые можно отнести к правой части уравнений Д'Аламбера,
рассматривая их как вклад эффективного тензора энергии-импульса
гравитационного поля.
Теорию с действием So = S/, + Sinti инвариантную относительно
бесконечно малых калибровочных преобразований (12.13), можно
использовать для итерационного построения нелинейной теории,
инвариантной относительно конечных преобразований. Результирующая
теория, как уже отмечалось в предыдущем разделе, будет совпадать с
эйнштейновской.
12.4. Черные дыры
Гравитационное поле сферически-симметричного статического
распределения материи удобно описывать в системе координат (10.23).
12.4. Черные дыры
131
Рассмотрим поле вне создающего его источника, где Т^„ = 0. Тогда
уравнения Эйнштейна в пустоте сводятся к следующей системе
уравнений для функций i/(r) и А(г):
е"А
(7 + ^)-^ = 0' (1219)
е
-А
/ А' 1 , 1 ,
(~ ~ 3) + 3 = °> (12-2°)
г г г
где первое представляет компоненту G£, а второе — G% тензора
Эйнштейна. Для метрики (10.23) отличны от нуля также компоненты
Gi = Gt = -le~x
-е А ( и" Н 1 1 ,
2 V 2 г 2 У'
однако уравнения Эйнштейна для них не приводят к новым
уравнениям на I/, А: возникающее соотношение является следствием уравнений
(12.19)-(12.20).
Сумма уравнений (12.19)-(12.20) дает i/ = —А', при
интегрировании этого соотношения постоянную можно положить равной нулю
(ненулевую постоянную можно устранить перерастяжкой временной
координаты в (10.23)). В результате интегрирования находим
е« = е-* = 1 + ^. (12.21)
г
Значение постоянной можно получить, переходя к ньютоновскому
пределу при г —> со, при этом должно быть
„ , 2<р , 2GM
доо = е =1+_ = 1__5-,
где ньютоновский потенциал <р = —GM/r и М — масса источника.
Таким образом, решение (12.21) можно представить в виде
.-»-(.-*),
где
2GM
— величина размерности длины называемая гравитационным
радиусом. Для массы Солнца rg ~ 3.4 км. Итак, поле
сферически-симметричного распределения масс во внешней области описывается
метрикой
da2 = (1 - Ь) c2dt2 - -^4- - r2dil, (12.22)
V г / -[ я
г
5*
132
Глава 12. Динамика гравитационного поля
известной как решение Шеарцшилъда. Исходное выражение для
интервала (10.23) было записано в предположении, что все величины
не зависят от времени. Однако можно показать, что формула (12.22)
остается справедливой и для нестационарного распределения материи
(совершающей, например, радиальные пульсации или испытывающей
радиальное сжатие) во внешней области, где Тц„ = 0 (теорема Виркго-
фа). Для того чтобы вещество могло противостоять силам
гравитационного сжатия, необходимо, чтобы давление, развиваемое при
уменьшении объема, нарастало достаточно быстро. Известны три типа
реальных астрофизических объектов, удовлетворяющих этому
требованию. К первому типу относятся нормальные звезды, вещество которых
находится в состоянии больцмановского идеального газ. Второй тип —
белые карлики, в которых вещество находится в твердом состоянии, а
давление в основном создается электронным газом (такой газ
обнаруживает существенно квантовое поведение). Третий тип — нейтронные
звезды, которые практически целиком состоят из нейтронов, также
создающих давление по законам квантовой теории (подробнее это
обсуждается в п. 8.7 ч. 2). Эти три состояния являются результатом
эволюции звезд при их остывании. При этом равновесное состояние
нейтронной звезды возможно лишь для ограниченных значений
полной массы М < Мег, где величина М^. имеет порядок трех солнечных
масс. Значительное число звезд имеет большие массы, поэтому
результатом их эволюции не может быть нейтронная звезда. Гравитационное
сжатие при остывании такой звезды не может остановиться,
происходит гравитационный коллапс
Вне коллапсирующего тела пространство-время по-прежнему
будет статическим (12.22). Это утверждение, которое нетрудно доказать
с помощью уравнений Эйнштейна, известно как теорема Биркгофа.
Поэтому для удаленного наблюдателя коллапсирующее тело не
отличается от обычной звезды. Однако метрика (12.22) имеет особенность
при г = rg, и нам следует рассмотреть подробнее приближение
коллапсирующего тела к гравитационному радиусу. Для упрощения задачи
пренебрежем давлением и будем рассматривать движение частиц на
границе коллапсирующего тела как свободное. Радиальные
геодезические описываются уравнением Гамильтона-Якоби (11.11), в котором
S = —£t + /(г), где £ — полная энергия:
(-?)"?-о-?)(Ю,--,А
Определяя / в квадратурах и дифференцируя действие по £, dS/d£ =
12.4. Черные дыры
133
—to = const, находим (для движения к центру)
Го
Ф -to) = J*[ г~Нг TV2' (12'23)
тс2
где to — момент прохождения точки го. Если падение начинается из
точки го с нулевой скоростью, то, согласно (11.8),
£ = £о = тс2 л /1 -.
V го
Подставляя в (12.23), находим
Интеграл логарифмически расходится при приближении к
гравитационному радиусу, таким образом, приближение границы
коллапсирующего тела к rg происходит бесконечно долго по времени t (этот вывод
не изменяется и при учете давления). Закон приближения имеет
экспоненциальный характер
const exp I —— I .
rgJ
V r9J
Однако по часам наблюдателя, движущегося вместе с границей
коллапсирующего тела, приближение к гравитационному радиусу
происходит за конечное собственное время
ar = fds=f ^(l-^)^-(l-^)-1^,
где dr/dt следует подставить из (12.24). В результате находим
выражение
1 / / Га Г0\
т
_л_!/(й-!кГ"*.
С J \Г Го/
которое остается конечным при г —>■ гд. Для наблюдателя,
находящегося на поверхности коллапсирующего тела, пересечение
гравитационного радиуса вообще будет незамеченным, кривизна
пространства-времени не имеет особенности при г = гд, особенность интервала (12.22)
134
Глава 12. Динамика гравитационного поля
связана с лишь выбором статических координат, иначе говоря,
карта (12.22) покрывает лишь часть г > гд пространственно-временного
многообразия.
Для внешнего наблюдателя приближение к гравитационному
радиусу сопровождается «почернением» звезды: лучи света, испускаемые
раднально с поверхности коллапсирующего тела в момент
пересечения им гравитационного радиуса, будут распространяться бесконечно
долго. Действительно, для световых сигналов ds2 = 0 и для времени
распространения At из точки г в точку го находим
»■<>
f dr
cAt = / г,
J 1-Гд/Г
г
этот интеграл расходится при г —> гд. Более того, трехмерная
гиперповерхность г = гд (горизонт событий) является изотропной,
испускаемые на горизонте направленные наружу световые лучи не покидают
ее вовсе. Разумеется, никакие сигналы не могут выходить и из
внутренней области под горизонтом событий.
Таким образом, коллапсирующая звезда с точки зрения
удаленного наблюдателя застывает на гравитационном радиусе, однако для
наблюдателя, находящегося на ее поверхности, сжатие не
останавливается при г — гд, а продолжается и дальше, причем истинная
сингулярность г = 0 достигается за конечное собственное время (порядка
гд/с). Такое на первый взгляд парадоксальное поведение объясняется
бесконечным замедлением времени при стремлении к нулю
компоненты метрики 000-
В реальных астрофизических условиях коллапсирующая звезда,
как правило, не является уединенным объектом, а окружена газом
и другими телами. В этом случае будет происходить падение
вещества в черную дыру, сопровождающееся его разогреванием (аккреция).
Аккрецирующее вещество светится, как и обычная звезда (хотя в его
спектре должны быть характерные особенности), и таким образом
черные дыры могут быть обнаружены. Важнейшим параметром
является масса объекта; если она превышает три солнечных массы, то, по
всей вероятности, мы имеем дело с черной дырой. Такие объекты в
последнее время были действительно обнаружены. Не исключена
также возможность гравитационного коллапса ядер галактик, при этом
огромное число звезд (~ 108 — 109) может оказаться под
гравитационным радиусом, соответствующим их суммарной массе. Средняя
плотность вещества при этом остается невысокой, не выше плотности газа в
обычной звезде. Существуют основания полагать, что в центре нашей
Галактики имеется подобная черная дыра, хотя полной ясности в этом
12.5. Модели Фридмана и инфляция
135
вопросе пока нет. Имеются более определенные данные о наличии
черных дыр в ядрах других галактик. Третий тип черных дыр, которые не
запрещены теоретически, правда, экспериментальных указаний на их
существование пока нет — это реликтовые черные дыры
относительно малой массы и микроскопических размеров. Такие черные дыры
могли образовыватья на ранних стадиях космологического
расширения. Согласно квантовой теории, черная дыра испускает частицы с
тепловым спектром (квантовое испарение Хокинга),
преимущественно гравитоны, фотоны и нейтрино. Черная дыра с массой порядка
массы астероида (~ 1015 г), образовавшаяся на начальной стадии
космологического расширения, к настоящему моменту должна почти
полностью испариться, при этом заключительная фаза испарения будет
иметь взрывной характер. Поиски взрывающихся реликтовых черных
дыр пока не увенчались успехом. В заключение заметим, что
квантовое испарение не противоречит классическому свойству горизонта
событий как односторонней мембраны, поскольку квантовые частицы
подчиняются соотношению неопределенностей и не являются строго
локализованными. Можно считать, что черная дыра рождает
частицы вне горизонта, такие частицы могут уходить на бесконечность, если
они обладают достаточной энергией.
12.5. Модели Фридмана и инфляция
Если распределение вещества во Вселенной усреднить по
масштабам самых крупных неоднородностей, то в этом приближении
ее можно будет считать однородной и изотропной.
Соответствующее трехмерное пространство описывается одной из метрик (10.23), а
пространство-время — интервалом (10.24). Космологическая система
отсчета, в которой д00 = 1, называется сопутствующей. В
сопутствующей системе (10.24) вещество покоится, движение нарушало бы
изотропию, поэтому (усредненное) поведение материи описывается лишь
двумя функциями времени t: плотностью энергии е и давлением Р.
Удобно ввести конформное время г), полагая cdt = adrj, тогда (10.24)
можно переписать в виде
ds2 = a2(v)(dr)2 - dr2 - Sf. dil), (12.25)
где к = 0, ±1 и
Si — sin r, So = r, S-i = sh г
136
Глава 12. Динамика гравитационного поля
соответственно для замкнутой (трехмерное пространство S3, к = 1),
пространственно плоской (К3, к = 0) и открытой модели
(гиперболоид, к = —1).
Тензор энергии-импульса, в соответствии со сказанным выше,
имеет отличные от нуля компоненты
2^ = 6, Т] = -5)Р,
а нетривиальные уравнения Эйнштейна имеют вид
а'2 к 8irG
-oJ + aJ = "Зс^' <12-26)
Ы =—з?-(е+зр)' (122?)
где штрихом обозначена производная по п (первое сотношение
является уравнением связи). Отсюда нетрудно получить соотношение
t? = -3—(е + Р), (12.28)
которое можно интерпретировать как закон изменения энергии при
космологическом расширении.
Для дальнейшего анализа удобно воспользоваться уравнением
связи (12.26) совместно с уравнением (12.28). Величина
_ S3l _ 1^
a2 a dt
получила название «постоянной» Хэббла, она входит в виде
эффективной постоянной в формулу для красного смещения спектральных
линий разбегающихся галактик. Действительно, уравнение
изотропных геодезических, направленных вдоль (против) х в конформном
времени (12.25) есть х = ±»7 + const. Поскольку cdt = adn, изменение
частоты света вдоль геодезической будет определяться соотношением
aw = const. Бели свет распространяется из точки, удаленной от нас
на расстояние I, т. е. в конформных координатах xi = Va> гДе *
предполагается малым по сравнению с а, то он попадает к нам в момент
конформного времени п = п + al, если п — момент испускания.
Начальное значение частоты wo тогда связано с наблюдаемой частотой и>
соотношением и0а(п) = ша(п + xi), или, в предположении малости хи
w-wo» —ujqHI.
с
12.5. Модели Фридмана и инфляция
137
Значение постоянной Хэббла определяется из наблюдательных
данных. Из (12.26) видно, что существует критическая плотность энергии
кр ~ 8тгС '
при которой к = 0, т. е. трехмерное пространство плоское. Если е > екр,
то уравнение (12.26) может выполняться только при А; = 1 (закрытая
модель), если е < бкр — при к = — 1 (открытая модель). Существующие
в настоящее время данные говорят о том, что плотность энергии
близка к критической. Точное заключение пока сделать затруднительно
из-за проблемы скрытой массы. Установлено, что подавляющая часть
вещества во Вселенной не находится в барионной форме и невидима.
Существуют различные гипотезы о характере скрытой массы, но
однозначного решения эта проблема пока не имеет.
Чтобы замкнуть систему (12.26), (12.27), необходимо соотношение
между € и Р, которое является характеристикой вещества: уравнение
состояния. В современную эпоху (после рекомбинации, т.е.
образования нейтральных атомов из первичной плазмы) давлением можно
пренебречь, Р — 0, а плотность энергии определяется энергией покоя
тел с = fie2 (пиль). Тогда из (12.28) получаем
const
Пространственный объем замкнутой Вселенной конечен, V = 2ir2a3,
поэтому при к = 1
2n2(ia3 = М.
Проинтегрировав с учетом этого уравнение (12.26), получаем:
2GM ., п пп.
а = ао(1 - cos 77), а0 = ^ , (12.29)
при этом из условия cdt — adn находим
ct = a0(n — suin).
Таким образом, замкнутая Вселенная, заполненная пылью,
расширяется до максимального значения радиуса a = 2a<> при t = irao/c и снова
сжимается в точку при ct = 2-koq.
Для открытой Вселенной, заполненной пылью, величина oq уже
не определяется формулой (12.29), а является заданным параметром
(объем Вселенной и ее масса бесконечны). Закон расширения имеет
вид
а = ao(cb.T7 — 1), ct = ао(вЗат) — п),
138
Глава 12. Динамика гравитационного поля
причем
з Зс2
В пространственно-плоском случае получаем
fia3 = const, a = const t2/3.
Эти формулы, однако, не описывают реальной Вселенной в эпоху
до рекомбинации, когда давлением пренебречь нельзя. В ранней
горячей Вселенной вещество сначала находилось в состоянии, близком к
состоянию фотонного газа:
В этом случае из (12.28) находим
Зс4а? 1
с =
8nG a4'
где а\ — постоянная. Тогда для замкнутой модели получаем
a = aisin?7, ct = а\(1 — costj),
что следует применять при достаточно малых п, при этом
Зс2 1
В открытой модели
а = ахзЪт), ct = a\{cbn — 1),
при малых т] поведение совпадает с (12.30). Наконец, в
пространственно плоском случае
еа = const, a = const Vr.
До момента рекомбинации уравнение состояния имело вид Р = с/3
и фотоны находились в тепловом равновесии с плазмой. После
рекомбинации фотоны выходят из теплового равновесия с веществом и
«запоминают» тот тепловой спектр, который они имели в момент
рекомбинации. В результате последующего расширения температура
фотонного газа адиабатически падает, в настоящее время значение
температуры этого реликтового излучения составляет около трех
градусов Кельвина. Излучение с такой температурой наблюдается из всех
доступных участков Вселенной.
22.5. Модели Фридмана и инфляция
139
Более детальный анализ однако показывает, что описанные выше
модели приводят к парадоксам, известным как проблемы горизонта и
плоскостности. Оказывается, что наблюдаемая сейчас часть
Вселенной, обнаруживающая одинаковую температуру реликтового
излучения, образовалась из огромного числа областей, которые были
причинно не связанными в ранней Вселенной, если ее расширение
действительно описывалось уравнением Р = е/3 вплоть до t = 0.
Непонятно, каким образом установилось тепловое равновесие между
областями, которые не могли успеть обменяться световыми сигналами за все
время от начала расширения (проблема горизонта). Проблема
плоскостности состоит в том, что наблюдаемая сейчас близость плотности
вещества к критической отвечает оценке
е-е.
кр
< 10~55 (12.31)
на так называемый «момент Великого объединения» (при энергии
частиц космической плазмы порядка 1016 ГэВ), т. е. равенства плотности
энергии ее критическому значению с колоссальной точностью. Неясно,
почему Вселенная была «изготовлена» точно в критическом
состоянии. Другие проблемы связаны с поведением возмущений во фридма-
новской модели, которые призваны объяснить происхождение
галактик и наблюдаемые закономерности крупномасштабной структуры.
Продвинуться в понимании этих вопросов позволяет модель
инфляционной Вселенной, в которой предполагается, что при очень малых t
давление было отрицательным и экстремально большим по величине:
Р = -е
(к такому уравнению состояния приводят некоторые квантово-полевые
модели). Уравнение (12.28) при этом теряет смысл, и нужно вернуться
к полной системе уравнений Эйнштейна. В результате оказывается,
что на ранней стадии закон расширения был экспоненциальным:
а ~ ен°\
где Но — постоянная Хэббла на момент инфляции. Столь быстрое
расширение объясняет, почему оказались причинно связанными
отдаленные участки Вселенной, а также объясняет малость отношения (12.31).
Инфляционный сценарий также способен объяснить причину
космологического расширения. Дело в том, что источником космологического
гравитационного поля является не только масса (энергия), но и
давление, в этом нетрудно убедиться из соотношения (12.27), опредеяющего
140
Глава 12. Динамика гравитационного поля
ускорение космологического расширения. Для вещества,
находящегося в обычных агрегатных состояниях (пыль, газ, плазма, жидкость,
твердое тело) давление не отрицательно, поэтому гравитация носит
характер притяжения, и соответствующее космологическое ускорение
будет отрицательным: с течением времени расширение Вселенной
будет замедляться, и в случае закрытой модели сменится сжатием.
Первоначальный толчок, вызвавший расширение, получил название
большого взрыва, однако его физическая природа долгое время оставалась
неясной. Отрицательное давление, превышающее по абсолютной
величине е/3, соответствует положительному космологическому
ускорению, гравитация при этом приобретает характер отталкивания. Таким
образом, если Вселенная в самом начале была заполнена веществом с
отрицательным давлением, таким, что е + ЗР < 0, то, как следует из
(12.27), гравитация носила характер отталкивания. Именно
гравитационное отталкивание и было причиной первоначального ускоренного
расширения по экспоненциальному закону.
Наконец, представляет проблему и научное объяснение
возникновение Вселенной. Имеются модели, объясняющие это как процесс
квантового рождения пространства-времени из «ничего» . Подобные
представления являются прерогативой пока не созданной в
окончательном виде квантовой теории гравитации. При этом Вселенная
вероятно должна рождаться как замкнутая, только в этом случае энергия
материи полностью компенсируется отрицательным вкладом
притяжения. В последние годы достигнут некоторый прогресс в понимании
ранней Вселенной в теории суперструн, которая в настоящее время
является основным претендентом на роль квантовой теории гравитации,
однако говорить о последовательной теории происхождения Вселенной
пока рано.
Часть II
Квантовая механика
и основы
статистической физики
140
Глава 12. Динамика гравитационного поля
ускорение космологического расширения. Для вещества,
находящегося в обычных агрегатных состояниях (пыль, газ, плазма, жидкость,
твердое тело) давление не отрицательно, поэтому гравитация носит
характер притяжения, и соответствующее космологическое ускорение
будет отрицательным: с течением времени расширение Вселенной
будет замедляться, и в случае закрытой модели сменится сжатием.
Первоначальный толчок, вызвавший расширение, получил название
большого взрыва, однако его физическая природа долгое время оставалась
неясной. Отрицательное давление, превышающее по абсолютной
величине е/3, соответствует положительному космологическому
ускорению, гравитация при этом приобретает характер отталкивания. Таким
образом, если Вселенная в самом начале была заполнена веществом с
отрицательным давлением, таким, что е + ЗР < 0, то, как следует из
(12.27), гравитация носила характер отталкивания. Именно
гравитационное отталкивание и было причиной первоначального ускоренного
расширения по экспоненциальному закону.
Наконец, представляет проблему и научное объяснение
возникновение Вселенной. Имеются модели, объясняющие это как процесс
квантового рождения пространства-времени из «ничего» . Подобные
представления являются прерогативой пока не созданной в
окончательном виде квантовой теории гравитации. При этом Вселенная
вероятно должна рождаться как замкнутая, только в этом случае энергия
материи полностью компенсируется отрицательным вкладом
притяжения. В последние годы достигнут некоторый прогресс в понимании
ранней Вселенной в теории суперструн, которая в настоящее время
является основным претендентом на роль квантовой теории гравитации,
однако говорить о последовательной теории происхождения Вселенной
пока рано.
Часть II
Квантовая механика
и основы
статистической физики
Глава 13
Физические основы
квантовой теории
13.1. Постоянная Планка. Фотон
К началу XX в. в физике утвердились принципы классической
теории, согласно которой в природе существуют объекты двух
принципиально различных типов: частицы и поля. Частицы подчиняются
законам механики, которые наиболее просто формулируются на языке
методов Лагранжа и Гамильтона. Закон движения частиц
определяется стационарностью функционала действия, заданного в
конфигурационном пространстве. Точечные частицы движутся по траекториям,
движение характеризуется определенными в каждый момент
времени значениями координат и скоростей частиц. Поля же представляют
собой материю, непрерывно распределенную в пространстве; они
выполняют роль переносчика взаимодействия между частицами. Поле
может существовать как свободное и в отсутствие частиц, при этом
его распространение в пространстве носит волновой характер.
Известными в эпоху классической физики были электромагнитное и
гравитационное поля.
Между тем целый ряд экспериментальных фактов, накопленных
при исследовании явлений микромира, оказалось невозможно
объяснить с позиций классической теории. Одним из таких фактов
является характер спектра электромагнитного излучения, находящегося в
тепловом равновесии с веществом (черного излучения). Согласно
теории, основанной на принципах электродинамики и классической
статистической термодинамики, спектральная плотность энергии излуче-
13.1. Постоянная Планка
143
ния р(и>), определяемая соотношением
оо
Е2 + В2
= j РклИ<^>
8тг
о
зависит только от температуры Т и выражается формулой Рэлея-
Джинса
РклИ = ^ (13-1)
(здесь ш — частота, с — скорость света, температура измеряется в
энергетических единицах). Эта формула находится в резком противоречии
с экспериментом в области частот
>Т
~ ft'
где ft — новая физическая константа — постоянная Планка. Численное
значение ft = 1.055 -Ю-27 эрг-сек этой постоянной, имеющей
размерность действия, было определено после того, как М. Планк в 1900 г.
предложил другое выражение для p(oj), которое находилось в
согласии с экспериментальными данными для всех доступных наблюдению
частот:
и которое совпадает с ркл при Нш <С Т. В области высоких частот
спектральное распределение Планка экспоненциально спадает:
р(ш)
ЬиУ
з
~ о „е
7Г
2сЗ"
-Нш/Т
2.8 T/ft, линейно
возрастающую с увеличением температуры (закон смещения Вина).
Формула (13.2) позволила преодолеть парадокс классической
теории, известный как ультрафиолетовая катастрофа: классическое
распределение (13.1) приводит к бесконечной полной энергии
излучения. Интегрирование планковского распределения (13.2) приводит
к конечному результату:
7Г2Г4
~ is^/i3
(закон Стефана-Больцмана), который хорошо согласуется с
астрофизическими данными для излучения звезд. Теоретические
предпосылки, на основании которых Планком была выведена носящая его имя
144
Глава 23. Физические основы квантовой теории
формула (13.2), состояли в замене классического описания процесса
излучения как непрерывной передачи энергии от осциллирующих
зарядов электромагнитному полю на «квантовое» описание, в котором
предполагалось, что энергия осцилляторов может принимать лишь
дискретный ряд значений.
Между тем, другие эксперименты свидетельствовали о том, что
само электромагнитное поле в ряде случаев следует рассматривать как
совокупность частиц — фотонов, энергия е которых связана с частотой
электромагнитных волн соотношением Эйнштейна
б = Пш, (13.3)
предложенным им в 1905 г. для объяснения порогового характера
фотоэффекта. Фотоэффект состоит в испускании некоторыми
веществами электронов под действием светового облучения. Особенностью
фотоэффекта, которую не удавалось объяснить с помощью классической
теории, было существование минимальной частоты света ш0, ниже
которой эмиссия не возникает, как бы велика ни была интенсивность
облучения. Гипотеза Эйнштейна состояла в том, что излучение
представляет собой поток фотонов с энергией (13.3), а испускание
свободного электрона является результатом соударения фотона с одним из
связанных электронов в веществе. Тогда величина Ьы должна быть
не меньше работы выхода электрона Авых — величины, равной
разности энергий связанного и свободного электронов. Действительно, если
Ни/ > Авых, то электрон массы т вылетает с отличной от нуля
скоростью v, определяемой из закона сохранения энергии
mv2
+ А.ых = Я"-
Если яке Ни < Лвых, то баланс энергий невозможен, что и объясняет
существование пороговой частоты фотоэффекта.
Представление о фотонах как о квантах электромагнитного поля
открыло возможность более глубокого обоснования формулы Планка,
связав дискретность изменения энергии излучающего осциллятора с
дискретностью энергии поля излучения. Именно таким образом
формула Планка и выводится в современной квантовой статистической
физике (см. п. 21.4).
Еще одно явление, в котором электромагнитные волны ведут
себя как совокупность фотонов — это эффект Комптона, открытый в
1923 г. При рассеянии рентгеновских лучей свободными электронами
наблюдается изменение частоты на величину, зависящую от угла
рассеяния. Между тем в классической электродинамике рассеяние на сво-
13.2. Дискретность в атомной физике
145
бодном электроне описывается формулой Томсона и (в
нерелятивистском пределе) не зависит от частоты. Наблюдаемые в комптоновском
рассеянии закономерности получают естественную интерпретацию,
если предположить, что процесс столкновения удовлетворяет закону
сохранения 4-импульса
*£ + &*"= К"+ й*"\
где р% и pfj* — 4-импульсы электрона до и после столкновения, а км
и fc'M — четырехмерные волновые векторы (А;*1 = (ш, к), \к\ = cj/c)
падающей и рассеянной воли. Таким образом, фотон имеет энергию
Нш, а также обладает импульсом
р7 = hk,
что находится в полном согласии с принципами специальной теории
относительности. Действительно, поскольку частота и волновой
вектор волны преобразуются при переходе от одной инерциальной
системы отсчета к другой как 4-вектор, причем его временная компонента
отождествляется с деленной на Й энергией фотона, то
пространственная компонента должна быть равна деленному на ft импульсу.
13.2. Дискретность в атомной физике.
Правила Бора
Неадекватность классической теории явлениям микромира
проявляется уже в самом факте устойчивости основного состояния атомов.
Из экспериментов Резерфорда по рассеянию альфа-частиц атомами
однозначно следовало, что размеры атомных ядер ничтожно малы
по сравнению с размерами самих атомов. В результате стала
общепринятой планетарная модель атома, в которой точечные электроны
движутся по эллиптическим орбитам в поле точечного ядра.
Однако, согласно классической электродинамике, ускоренно движущийся
электрон должен терять энергию на излучение, и время жизни атома
оказывается ничтожно малым. Таким образом, излучение электронов
в атомах не может подчиняться законам классической физики.
Помимо этого, наблюдения свидетельствовали о дискретности
спектральных линий излучения атомов, частоты которых
определялись двухпараметрической формулой
W-'=^(^-^)' (13"4)
146
Глава 13. Физические основы квантовой теории
где Z — заряд ядра в единицах абсолютной величины заряда
электрона, И — постоянная Ридберга, п и п' — натуральные числа.
Согласно же классической теории, излучение при (квази)периодическом
движении заряда должно происходить на частотах, кратных основным
частотам движения. Наблюдаемые частоты (13.4) имеют совершенно
иной характер.
Для объяснения формулы (13.4) Нильсом Бором в 1913 г. была
предложена модель, основанная на двух постулатах. Первый постулат
гласил, что механическая система, совершающая условно
периодическое движение, может находиться лишь в дискретных стационарных
состояниях, определяемых квантованием фазовых интегралов
Ф Рк d°k = 27r/infc (суммирования по к нет), (13.5)
где рк — обобщенные импульсы, отвечающие координатам qk, а пк —
натуральные квантовые числа. Для классической системы с не
зависящим от времени гамильтонианом, допускающей разделение
переменных в уравнении Гамильтона-Якоби, действие имеет вид
S=-Et + ^2Sk(qk),
к
при этом рк = dSk/dqk, a E — полная энергия. Если движение
является условно периодическим, то для каждой из координат можно
определить фазовый интеграл (13.5) (адиабатический инвариант),
который будет зависеть от энергии и других констант разделения. Условие
квантования (13.5) означает, что все эти интегралы принимают
дискретные значения, поэтому энергия и прочие константы разделения
переменных оказываются квантованными. Согласно Бору, электрон
в атоме, находящийся в одном из таких дискретных состояний,
классически не излучает вовсе. Однако если данное состояние является
возбужденным, то возможны скачкообразные переходы в другие
дискретные состояния с меньшей энергией. Основное же состояние атома,
имеющее минимальную энергию, является абсолютно устойчивым.
Второй постулат состоял в том, что при переходе из состояния с
энергией Еп (здесь п означает всю совокупность квантовых чисел пк) в
состояние Еп, может излучаться фотон с частотой, пропорциональной
разности энергий
На основании этого соотношения Бору удалось объяснить
существование спектральных серий (13.4). Наиболее просто осуществляется кван-
13.2. Дискретность в атомной физике 147
тование круговых орбит, для которых (в полярных координатах)
S=-Et + pvV>,
где pv = const — момент количества движения, р = mvr (г —
радиус орбиты, v — скорость частицы). Квантование по формуле (13.5)
приводит к соотношению
mvr = fin. (13.7)
Если выразить скорость электрона через через радиус орбиты исходя
из равенства центростремительной силы кулоновской силе
притяжения
mv2 Ze2
— = ^Г (13-8)
и результат подставить в (13.7), будем иметь
г = Z-\n2, (13.9)
где гв = h2/me2 — боровский радиус (численное значение rg ~ 0.5 •
Ю-8 см). Полная энергия электрона на круговой орбите есть сумма
кинетической и потенциальной энергий, причем, при учете
соотношения (13.8), последняя по абсолютной величине вдвое больше первой:
_ mv2 Ze2 Ze2
С учетом (13.9) окончательно получим:
Z2e2
*« = -^- (13Л0)
В случае эллиптических орбит квантованию подвергаются два
фазовых интеграла, связанные с радиальным и угловым движением, что
приводит появлению двух квантовых чисел п и пг. Оказывается, что
формула (13.10) остается справедливой и в этом случае, так как
квантовые числа п и пг входят в выражение для энергии в виде суммы
n = nv+nT.
Подстановка (13.10) в (13.6) приводит в точности к формуле (13.4)
для частот спектральных линий, причем постоянная Ридберга
оказывается равной
П =
9 4
е те
2Нг_ 2П3
Таким образом, модель Бора дала блестящее совпадение с
экспериментом. С точки зрения современной квантовой теории, правила Бора
148
Глава 13. Физические основы квантовой теории
соответствуют большим значениям квантовых чисел пк ;» 1. Однако
формула (13.10) совпадает с точным результатом квантовой механики
при всех п, что связано с особой симметрией присущей кулоновской
задаче. Это понимание, однако, пришло значительно позже, так что
успех теории Бора, которая проверялась именно для низших
значений п, был до известной степени случайной удачей, стимулировавшей
дальнейшие теоретические построения, увенчавшиеся созданием
квантовой механики. Заметим, что для гармонического осциллятора в
теории Бора получается спектр энергий Еп = Ншп, что также совпадает с
формулой квантовой механики при всех п с точностью до аддитивной
постоянной, равной энергии осциллятора при п = 0.
? ? 1 i » *
13.3. Волны де Бройля
и их статистическая интерпретация
В то время как электромагнитные волны обнаруживают
корпускулярное поведение в фотоэффекте и эффекте Комптона, электроны
проявляют волновое поведение в опытах по рассеянию на кристаллах.
Именно, облучение кристалла потоком электронов некоторой
фиксированной энергии приводит к возникновению дифракционной
картины. Напомним, что дифракция
представляет собой типично волновое
явление, которое схематически можно
изобразить, как показано на рис. 13.1.
Поток монохроматических волн падает на
непрозрачный экран А, в котором
проделаны две узкие щели, ширина
которых много меньше длины волны.
Щели 1 и 2 действуют как когерентные
источники вторичных волн,
порождающие некоторое распределение
интенсивности на экране В. Это распределение
имеет характер периодического
чередования полос освещенности, между которыми находятся тени.
Главный максимум освещенности соответствует точке 0, расположенной
симметрично относительно точек 1 и 2. Два соседних минимума т1
определяются из условия деструктивной интерференции воля,
приходящих от двух щелей с разностью хода, равной половине длины
волны. Следующие побочные максимумы соответствуют разности хода
лучей, кратной длине волны, и т. д. Для наблюдения четкой
дифракционной картины источник должен быть монохроматическим, а длина
Рис. 13.1. Дифракционная
картина
13.3. Волны де Бройля
149
волны — сравнима по величине с расстоянием между щелями.
Аналогичным образом возникает дифракционная картина при рассеянии
рентгеновских лучей на кристалле. В этом случае роль щелей
играют периодически расположенные кристаллографические плоскости, и
дифракционная картина возникает, если длина волны имеет порядок
межатомных расстояний.
При рассеянии на кристаллах пучка электронов с фиксированным
значением импульса также обнаруживается дифракционная картина,
причем длина волны, определяемая из условия интерференции,
связана с импульсом р соотношением де Бройля
XDB = *£. (13.11)
Р
Нетрудно видеть, что это соотношение аналогично соотношению
Эйнштейна р = Нк для фотонов, поскольку А = 27г/|&|, где fe —
волновой вектор. Возникновение интерференционной картины при
рассеянии электронов можно объяснить, связав с движением электрона
распространение некоторой волны (волны де Бройля), если считать, что
число электронов, попадающих на экран, зависит от амплитуды
волны квадратично. Возникает вопрос о физическом смысле этих волн.
Более тонкие эксперименты показывают, что электроны хотя и
проявляют волновые свойства, все же являются частицами, которые можно
обнаружить в том или ином месте на экране. Рассмотрим
упрощенную картину дифракции на двух щелях (рис. 13.1). Будем уменьшать
интенсивность потока электронов до тех пор, пока в каждый момент
через щель будет проходить не более одной частицы. Тогда
оказывается, что при многократном повторении опыта можно зафиксировать
электрон в определенных (и различных) точках на экране, однако
суммарное распределение электронов по-прежнему будет иметь характер
дифракционной картины. Анализ этого и множества других
экспериментов привел Макса Борна в 1926 г. к статистической
интерпретации волн де Бройля: квадрат модуля комплексной волновой функции
ip(r,t) определяет плотность вероятности обнаружения электрона в
точке г в момент времени t. Тем самым провозглашается, что
движение электронов принципиально имеет недетерминистический
характер. Невозможно точно предсказать, в какую точку попадет электрон
при заданных начальных условиях движения, можно лишь определить
вероятность попадания в ту или иную точку. Таким образом,
соединение волновой и корпускулярной картин движения воедино приводит
к теории, принципиально отличающейся от классической механики и
имеющей существенно недетерминистическую с классической точки
зрения природу.
150
Глава 13. Физические основы квантовой теории
Покажем, что квантование по Вору круговых орбит электрона в
атоме (13.9) можно интерпретировать как результат формирования
стоячей волны де Вройля на классической орбите. Потребуем, чтобы
на окружности радиуса г укладывалось целое число волн де Бройля:
2nr = nXDB. (13.12)
Тогда, используя соотношение (13.11), приходим к формуле
гр = mvT = hn,
совпадающей с (13.7). Заметим, что с точки зрения современной
квантовой механики эти соображения имеют не более чем эвристический
характер: реальная волновая функция в атоме имеет более сложную
зависимость от трех пространственных координат, хотя верным
является предположение о том, что стационарному состоянию электрона в
атоме должна соответствовать стоячая волна де Бройля. Напомним,
что в отличие от бегущих волн, для которых поверхность постоянной
фазы перемещается в пространстве, для стоячей волны характерно
периодическое пространственное распределение, осциллирующее во
времени как целое: rl>{r,t) = <p(r)x(t).
Рассмотрим подробнее распространение волн де Бройля,
отвечающих одномерному движению частицы. Оказывается, что в общем
случае волновая функция ф(х, t) должна быть комплекснозначной,
необходимость этого станет ясной позлее, когда будет развит
математический аппарат квантовой механики в окончательной форме.
Комплексная монохроматическая волна, отвечающая соотношению де
Бройля (13.11) и эйнштейновскому соотношению между энергией и
частотой (13.3), имеет вид
^(*,*) = ^е«*—**>, (13.13)
где А; = p/h, шк = p2/(2mh) = Нк2/(2т) и Ск —- произвольная
комплексная постоянная. Величина кх — wkt представляет собой фазу
волны, точка постоянной фазы кх — cjkt = const движется с фазовой
скоростью
_ и>к _ hk _ р
Ьф~ ~к~ ~ Ъп~~ 2т'
Это соотношение может показаться неудовлетворительным: фаза
волны де Бройля движется с половинной скоростью механического
движения. Однако, ввиду статистической интерпретации волновой функции,
такое заключение было бы преждевременным. Монохроматическая
волна (13.13) имеет постоянную по модулю амплитуду IV'fcl2 = | Сл |2,
23.3. Волны де Бройля
151
поэтому в состоянии (13.13) частица может быть с равной
вероятностью обнаружена в любой точке. Строго говоря, волновая
функция (13.13) вообще не допускает вероятностной интерпретации, так
как полная вероятность расходится. Выход из положения состоит в
рассмотрении не монохроматической волны, а волнового пакета
i>{x,t)= ftPk(x,t)dk = IC{k)Skx-"ht)dk
R R
с некоторой функцией Cfc = С (к), выбранной так, чтобы интеграл,
представляющий полную вероятность найти частицу где-либо, был
равен единице:
f\1>\2dx = l,
R
т.е. чтобы волновая функция принадлежала L2(R). Простейший
волновой пакет отвечает выбору
С (к) = С {9{к -к0 + Ак/2) - 9{к -к0- Ак/2)},
где А;0 — средний волновой вектор, а ДА; — ширина распределения в
пространстве волновых векторов. Представим частоту в виде
разложения в ряд Тейлора
1 д2Шк
^(* *о) + 2 дк2
(к - к0)2, (13.14)
*0
которое в данном случае является точным, поскольку шк —
квадратичная функция А:. Если ДА: <С А:0, то при достаточно малых t можно
сохранить лишь первый линейный член по (А: — А^), в результате
находим
sin Г^(х - v-t)]
tP(x,t) = 2C l— !I_J.e<(fcox-a,0*)) (13.15)
где ш0 = шко и введена групповая скорость пакета
_ Щ _ Ро
v = —-
гр дк
ь m тп
«о
Функция (13.15) сосредоточена вокруг точки х = v t, движущейся со
скоростью «гр. Как видно, групповая скорость распространения пакета
действительно совпадает с классической скоростью частицы.
Помимо перемещения в целом волновой пакет с течением
времени также испытывает расширение (расплывается). Искажение формы
152
Глава 13. Физические основы квантовой теории
пакета (13.15) будет происходить за счет неучтенного квадратичного
члена в (13.14). Время расплывания можно оценить исходя из условия,
что отброшенный квадратичный член в (13.14) дает дополнительное
изменение фазы порядка единицы:
/ А 1 \2 92Шк
t ~ 1.
распл *■ ■
ко
Учитывая, что шк = hk2/(2m), находим по порядку величины
m
t ~
распл
Н(Ак)*
т.е. расплывание происходит тем быстрее, чем больше величина ДА;.
Это нетрудно понять и с физической точки зрения: каждое значение
к в волновом пакете соответствует движению с определенным
импульсом р = hk. Чем больше разброс по импульсам, тем больше
искажается первоначальная форма волнового пакета. В окончательной
формулировке квантовой механики функция С (к), нормированная
надлежащим образом, интерпретируется как амплитуда вероятности
обнаружить частицу имеющей импульс р = Нк. Как видно из
формулы (13.15), ширина главного максимума Ах модуля волновой функции
в момент времени t связана с ДА: соотношением ДА: • Ах ~ 1, или
Ар • Ах ~ Н.
Поэтому чем точнее локализован волновой пакет в пространстве, тем
больше соответствующая неопределенность импульса. В пределе
точной локализации Ах = 0 будем иметь Ар = оо, т. е. импульс не
определен вовсе. Напротив, монохроматическая волна де Бройля
соответствует Ар = 0, при этом координата вовсе не определена.
Для успешного объяснения интерференции электронных волн в
опытах по рассеянию электронов на кристаллах необходимо, чтобы
амплитуды вероятности складывались линейно. Это условие
формулируется как принцип суперпозиции: если возможно состояние,
описываемое волновыми функциями ф1 ж ф2, то возможна и линейная
суперпозиция
ф = С^фх + С2ф2,
где Cj и С2 — комплексные числа. Бели два слагаемых в этом
выражении соответствуют прохождению электрона через две щели, то
полная плотность вероятности \ф\2 будет содержать
интерференционные члены фгф2 и ф2ф\, что и объясняет возникновение максимумов
и минимумов вероятности.
13.3. Волны де Еройля
153
Принцип суперпозиции означает, что уравнение для ф должно быть
линейным. Нетрудно написать линейное дифференциальное уравнение
в переменных x,t, решением которого является монохроматическая
волна де Бройля (13.13). Заметим, что etkx есть собственная функция
оператора дифференцирования, именно
?iLe«. = ftJfce*to
г ах
Поскольку р = Нк, можно сказать, что монохроматическая волна де
Бройля является собственной функцией оператора импульса
^ h d
г ах
с собственным значением р. Одновременно эта величина является
собственной функцией оператора Гамильтона
*_£.**, (13.i6)
2m 2mdx2' v '
отвечающей собственному значению Е = huik:
Heikx = hwkeikx.
Дифференцируя (13.13) по времени, находим, что волновая функция
$k(x,t) удовлетворяет уравнению Шредингера
гП^ = Нф. (13.17)
Уравнение (13.17) является волновым уравнением, будучи вместе с
тем уравнением первого порядка по времени, в отличие от
уравнения Д'Аламбера в электродинамике. Очевидно, что волновой
характер этого уравнения связан с наличием мнимой единицы в левой
части (13.17). Поэтому волновая функция должна быть, вообще говоря,
комплекснозначной функцией координат и времени.
Уравнение (13.17) было предложено Эрвином Шредингером в
1926 г. Как мы увидим далее, оно сохраняет свой вид и для
движения в потенциальном поле, при этом в оператор Гамильтона (13.16)
следует включить еще и потенциальную энергию
Н = £- + U{x). (13.18)
1т
154 Глава 13. Физические основы квантовой теории
Стоячие волны де Вройля отвечают собственным функциям
оператора Гамильтона: Нфв{х) = ЕфЕ(х). При этом зависимость от времени
будет определяться экспоненциальным множителем
i,{x,t)=xl>E{x)e-iEt'h,
по модулю равным единице. В этом случае вероятность обнаружить
частицу в точке х не будет зависеть от времени. В свете
соотношений (13.17), (13.18) условие (13.12) формирования стоячей волны де
Вройля на круговой орбите электрона в атоме является чрезмерно
упрощенным. Однако оно действительно приводит к правильной
формуле квантовой механики для уровней энергии (13.10). Это еще одно
«чудесное совпадение», которое наряду с успехом формулы Бора
содействовало дальнейшему развитию квантовых представлений и
появлению окончательной формулировки принципов квантовой механики
уже в более абстрактной форме.
Глава 14
Основные принципы
14.1. Состояния и наблюдаемые
В отличие от классической теории, законы которой
формулируются непосредственно в терминах экспериментально измеримых величин
(таких, как координата, импульс, энергия, момент количества
движения и т.д.), в квантовой теории вводятся два типа объектов: состояния
и наблюдаемые. Наблюдаемые являются величинами, доступными
измерению, однако их значения предсказываются лишь вероятностным
образом, причем вероятности различных значений зависят от
квантового состояния физической системы. Если производится множество
измерений некоторой наблюдаемой в одном и том лее квантовом
состоянии (для этого необходимо множество экземпляров данной системы),
то могут обнаруживаться различные значения измеряемой величины,
причем результат каждого измерения в отдельности, вообще говоря,
предсказать нельзя. Однако при большом числе измерений
начинают выявляться вероятностные распределения измеряемой величины,
и именно они предсказываются теорией однозначно.
Состояния описываются нормированными лучами в гильбертовом
пространстве состояний И. Напомним, что гильбертовым
называется бесконечномерное линейное, нормированное, комплексное
пространство, полное относительно сходимости по норме, порождаемой
скалярным произведением со свойствами
i) <V»|V> = (vlV»)* »
ii) {■ф\с1<р1+с2<р2) = с1{-ф\<р1) + с2{гр\<р2), (14.1)
iii) {ф | ф) ^ 0 (=0 тогда и только тогда, когда \ф) = 0),
156
Глава 14. Основные принципы
где Cj, с2 — комплексные числа. Здесь и далее используются
скобочные обозначения Дирака: вектор состояния (кет-вектор) обозначается
скобкой \ф), сопряженный вектор (бра-вектор) — {ф\, а скалярное
произведение (ф,р) = (ф\<р)- В этих обозначениях скалярное
произведение образуется всякий раз когда бра-вектор стоит слева от кет-вектора.
Норма вектора есть |[^|[ = ({ф\ф)) . Нуль-вектор и число нуль
обозначаются одинаково. Предполагается, что пространство состояний се-
парабельно, т. е. содержит счетное, всюду плотное в И множество.
Вектор состояния должен быть нормирован на единицу: ||^>|[ = 1, при этом
умножение на комплексное число, по модулю равное единице, не
изменяет состояния.
Линейность пространства состояний означает, что выполняется
принцип суперпозиции: если система может находиться в
состояниях \фг) и \ф2), то она может также находиться в состоянии
где са и с2 — комплексные числа. Если при этом \фх) и \ф2)
нормированы и ортогональны, т.е. (ф1 \ф2) = 0, то необходимо, чтобы
выполнялось равенство |сх |2 + l&jl2 = 1. Основная идея физической
интерпретации формализма состоит в том, что если система находится в
состоянии \ф), то с вероятностью \сг\2 ее можно обнаружить в
состоянии |Vi^ и с вероятностью Ic^2 — в состоянии \ф2). Лля возможности
такой интерпретации строго говоря необходимо, чтобы все три
вектора состояний были нормируемы. Однако в квантовой теории часто
используются и ненормируемые (обобщенные) векторы, не
принадлежащие И, которые можно строить как предельные элементы
бесконечных последовательностей векторов из ti. Для обобщенных состояний
можно определить только относительные вероятности.
В релятивистской квантовой теории рассматриваются более
широкие пространства состояний, которые разбиваются в сумму
ортогональных подпространств, таких, что суперпозиция векторов из
различных подпространств не является физически реализуемым
состоянием (правила суперотбора). Это связано с существованием
абсолютных законов сохранения, например, сохранения электрического
заряда: невозможно состояние системы, в котором заряд принимал бы с
некоторой вероятностью различные значения. Целесообразность
введения столь широких пространств состояний в релятивистском случае
связана с возможностью рождения и исчезновения частиц; при этом
правила суперотбора ограничивают применимость принципа
суперпозиции. В нерелятивистской теории рождения частиц не происходит, и
как правило имеют дело с одним из секторов полного пространства, в
котором принцип суперпозиции выполняется.
14.1. Состояния и наблюдаемые
157
Наблюдаемые в квантовой теории являются линейными
самосопряженными операторами, действующими в пространстве состояний.
Действие оператора F на некоторый вектор состояния \ф) дает другой
вектор \(р) = F\xp) = \Fip)- Для ограниченных операторов F \ф) e У.
для всякого \ф) € %, иначе говоря, область определения F совпадает с
Н. Для неограниченных операторов это не так. Чтобы гарантировать
принадлежность вектора \Fxp\ гильбертову пространству, вообще
говоря, необходимо выбрать более узкую область определения DF С У..
По определению, под оператором понимают задание правила его
действия на вектор, а также указание области определения (F,DF).
Каждому оператору можно сопоставить сопряженный оператор по
правилу
(<р\рф} = (р+<р\ф) , (14.2)
при этом область определения сопряженного оператора DF+
состоит из всех \<р) € Н, таких, что существует скалярное произведение
/у»LfV/ со всеми \ф) € DF. Вообще говоря, DF+ D DF. Заметим, что,
как видно из (14.2), для двух операторов (FXF2)+ = F£f£, т.е. при
сопряжении меняется порядок сомножителей.
Важнейшее значение в квантовой механике имеет определение
самосопряженного (эрмитова) оператора, именно таковым должен
быть оператор наблюдаемой. Самосопряженность оператора F
означает, что для всех \ф), \ф) € DF имеет место равенство
(*>|.Fv) = (*V|tf), (14.3)
причем области определения прямого и сопряженного операторов
совпадают: DF = DF+ С М. Свойство самосопряженности будем кратко
обозначать как F+ = F, где F+ — сопряженный оператор.
Следует иметь в виду, что операторы основных наблюдаемых механики —
координаты и импульса, являются неограниченными, для таких
операторов область определения не совпадает с "Н. Оператор, для которого
выполняется (14.3), но DF+ ф DF, называется симметрическим.
Построение неограниченных самосопряженных операторов .как правило
начинается с введения соответствующих симметрических операторов
и последующего построения их самосопряженных расширений.
Решение этой задачи (если существует) не всегда однозначно. В последнем
случае могут возникать дополнительные параметры, которые следует
определять из независимых физических соображений.
158 .Глава 14. Основные принципы
Требование самосопряженности операторов наблюдаемых
необходимо, чтобы гарантировать вещественность их собственных
значений /
F\f)=f\f),
где |/) — собственный вектор, принадлежащий собственному
значению /. Вещественность собственных значений непосредственно
вытекает из соотношения (14.3), откуда также следует, что собственные
векторы, отвечающие различным собственным значениям Д, /2,
ортогональны между собой: (Д \ /2) = 0.
Спектр собственных значений {/} самосопряженного оператора в
общем случае состоит из точечного (дискретного) Pa(F) и
непрерывного Ca{F) спектров (операторы, имеющие также остаточный спектр,
рассматриваться не будут):
m = ^(^)ucff(F).
Напомним, что точечным спектром называется множество
собственных значений /, для которых оператор F — f имеет ядро.
Соответствующие собственные векторы принадлежат "Н и могут быть
нормированы: |[/|| = 1. Для участков непрерывного спектра оператор F — /
имеет неограниченный обратный оператор с плотной в И областью
определения. Для / е Са собственные векторы являются обобщенными
элементами гильбертова пространства. Для них скалярное
произведение может быть продолжено в смысле обобщенных функций, при этом
обобщенные собственные векторы удобно нормировать на 5-функцию,
так что общее выражение для (обобщенного) скалярного
произведения собственных векторов самосопряженного оператора будет иметь
вид
€ Pa(F),
€ Ca{F).
Имеет место спектральная теорема, утверждающая, что для
всякого самосопряженного оператора его собственные векторы образуют
базис в гильбертовом пространстве, т. е. система собственных векторов
полна. Это свойство удобно записывать в виде разложения единицы,
которое в дираковских обозначениях выглядит так
i= £|/></1+/|/></|#.
Для сокращения обозначений в квантовой механике принята запись
1 = £|/><Л, (14-4)
Ul/' \s(f-n /,/'
14.1. Состояния и наблюдаемые 159
где обобщенное суммирование (интеграл Стилтьеса) включает
сумму по дискретному и интеграл по непрерывному участкам спектра.
В этих формулах символ |/) (/| является проекционным оператором
на |/), действительно, учитывая правило, по которому сочетание бра
и кет векторов является скалярным произведением, применение |/) (/|
к вектору \ф) дает величину
(|/> </!)№> = </№>1/> = с*(/)1/>>
являющуюся проекцией с^,(/) = {/\"Ф) вектора \ф) на собственный
вектор |/). Сам оператор F очевидно также можно представить в виде
разложения по проекторам на собственные векторы
£ = £л/></|, (14-5)
где обобщенная сумма определена в том же смысле, что и в (14.4).
Основной физический постулат состоит в том, что при измерении
наблюдаемой F могут быть получены лишь значения из ее спектра
{/}, причем вероятности различных значений в состоянии |^>) равны
«v(/) = K/WI2. /£РАП
dwi,(f) = \(f\rP)\2df, f€C0(F).
Величина (/1 ф), являющаяся проекцией \ф) на базисный вектор,
отвечающий выбранному собственному значению, называется амплитудой
вероятности. Помимо вероятностей, в квантовой механике часто ра<>
сматриваются средние значения наблюдаемых. Средним значением F
в состоянии \тр) называется математическое ожидание
<*% = !>*</>•
Эта величина может быть также представлена в виде
(£)=£/№ !/></№> = М^Ь (14-6)
где использовано разложение (14.5) и свойство (14.li). Последняя
форма записи математического ожидания особенно удобна, в дальнейшем
под средним значением наблюдаемой будет подразумеваться именно
такое представление.
Для любой пары операторов F1, F2 можно ввести их коммутатор
[F-l, F2] = FXF2 - F2F^. Коммутатор двух самосопряженых операторов
160
Глава 14. Основные принципы
(наблюдаемых) Ff — Ёг, F2 = F2 образует третий самосопряженный
оператор умноженный на мнимую единицу:
[Р1гР2]=Фа, (14.7)
действительно, учитывая что при сопряжении произведения
операторов изменяется их порядок, будем иметь F^~ = F3. Таким образом,
коммутаторы наблюдаемых образуют алгебру наблюдаемых
(С*-алгебру), свойства которой характеризуют рассматриваемую
физическую систему.
Построение операторов наблюдаемых для систем, имеющих
классический аналог, основано на следующем принципе соответствия. На
множестве классических наблюдаемых {F(p, q)} (где (р, q) — точка
фазового пространства) определена лиевская структура скобок Пуассона
/р F,_dF1dF2 8F1dF2_
{F»F*} ~ -др—dq- ~ -dq-bV ~ 3-
Аналогичную структуру имеет алгебра наблюдаемых квантовой
теории, представленная их коммутаторами (14.7). Требуется, чтобы эти
структуры совпадали в классическом пределе h —¥ 0, где ft —
постоянная Планка, с точностью до коэффициента, а именно
При этом для основной пары канонически сопряженных
наблюдаемых — обобщенных импульсов и координат, для которых {р{, q3} = 5?,
постулируется точное равенство
й,?''] = ?**'. (14'8)
именно это равенство, называемое каноническими
перестановочными соотношениями вводит в теорию постоянную Планка и является
основным постулатом квантования механической системы.
Построение операторов наблюдаемых, являющихся функциями р и
q, сводится к замене функций классических переменных на
соответствующие функции от операторов, причем произведения некомму-
тирующих величин pzg, если таковые имеются, должны быть
предварительно симметризованы, чтобы обеспечить самосопряженность
операторных функций. Например, произведению ptq3 следует сопоставить
оператор
PiQJ = TjiPiQ* + 4jPi) -> ^(Pi4j + 4jPi),
14.2. Представления
161
который будет самосопряженным для всех i,j, если р±~ = pt, q3+ = q3.
В квантовой механике рассматриваются также и системы, не
имеющие классического аналога, для них операторы наблюдаемых
должны быть построены на основании физических соображений
непосредственно (примером является спин — внутренний момент количества
движения частицы).
В дальнейшем там, где это не вызывает недоразумений, акцент
«шляпка» над символами операторов мы будем опускать.
14.2. Представления
Вместо абстрактного гильбертова пространства состояний можно
рассматривать совокупность всех амплитуд вероятности
Ф(Л = {/\Ф) (14-9)
для любого выбранного базиса {|/)}- Если спектр {/} чисто
непрерывный и заполняет всю вещественную ось, то
ф(/) € L2(R,df),
причем нормировочное условие |[^»|[ = 1 отвечает соотношению
fm)\2df = i. (14.Ю)
R
В таком подходе ф(/) также называют волновой функцией в
/-представлении. Действие оператора К на вектор \гр), К\ф) = \<р),
порождает в выбранном представлении его действие на волновую функцию:
кф(!) = ?(/),
откуда оператор К в данном представлении может быть найден
явно. (Мы используем тот же символ для оператора в заданном
представлении, более последовательной была бы запись в матричном виде
(f'\K\f).) Из (14.9) следует, что в собственном представлении
оператор любой наблюдаемой сводится к оператору умножения на аргумент
волновой функции:
Ни) = т/)-
Рассмотрим одномерное движение материальной точки, выбирая в
качестве F оператор координаты х. Имеем
х|х)=ж|х), ф(х) = (х\ф), (14.11)
6 - 8210
162
Глава 14. Основные принципы
так что вероятность обнаружения частицы на интервале dx в
окрестности точки х равна
dw^{x) = \rp(x)\2dx,
где волновая функция нормирована условием (14.10):
/
\ф(х)\2 dx = 1.
В соответствии со сказанным выше оператор координаты в
координатном представлении является оператором умножения на х: хгр(х) =
хф{х). Исходя из перестановочных соотношений (14.8) легко видеть,
что оператор импульса в координатном представлении будет
пропорционален производной по х, именно
Оператор Гамильтона тогда приобретает вид (ср. с (13.18)):
В трехмерном случае координаты частицы образуют радиус-вектор
^ = х, у, г; построение координатного представления означает
введение в качестве базиса собственных векторов операторов х, у, z. Тогда
для оператора импульса р и гамильтониана будем иметь
РФ(г) = -rVV(r),
Нф(г) = ~ А ф(г) + и(т)ф(г),
где V = дх, dy,dz, Д — оператор Лапласа.
Построим теперь импульсное представление, вводя базис и
волновую функцию (в одномерном случае) согласно
р\р)=р\р), Ф(р) = (р\Ф)-
Волновая функция в ^-представлении определяет вероятность найти
частицу имеющей импульс р:
d«V(p) = \i>(p)\2dp.
Заметим, что в принятых обозначениях ф(р) и ф(х) соответствуют
различным функциям. Чтобы связать их между собой, вставим в
определение (14.11) разложение единицы по базису \р):
1 = J \P) <p| dp,
14.2. Представления
163
тогда получим
ф{х) = J (x\p) (р\ф) dp = f {х\р)ф(р)4р. (14.12)
Входящая сюда скобка (х\р) является (обобщенной) собственной
функцией оператора импульса в координатном представлении
^(х\р)=р(х\р). (14.13)
С учетом условия нормировки в непрерывном спектре на
дельта-функцию находим
№> = (2^^ <14Л4>
и в результате соотношение (14.12) приобретает вид
Аналогично можно построить обратное преобразование
Таким образом, амплитуды вероятностей координат и импульса
связаны между собой преобразованием Фурье.
В импульсном представлении оператор имульса является
оператором умножения на аргумент волновой функции, а оператор
координаты, как следует из перестановочных соотношений (14.8), является
оператором дифференцирования с коэффициентом гН; так:
р=Р, х = гН-.
Соответственно в трехмерном случае будем иметь
Р = Р, r = ihVp,
Другое часто используемое представление — энергетическое.
Спектр оператора Гамильтона в типичном случае состоит из
дискретного участка, соответствующего финитному движению, и
непрерывного, отвечающего инфинитному движению. Рассмотрим случай чисто
дискретного спектра
H\n)=En\n).
6*
164
Глава 14. Основные принципы
Тогда соответствующая «волновая функция» будет представлять
собой последовательность {сп} € £2, где
с„ = (п\ф)
(здесь принята несколько отличная система обозначений: сп = ф{п)).
В дискретном энергетическом представлении все операторы являются
эрмитовыми матрицами размерности, равной числу собственных
векторов гамильтониана и могут быть бесконечными матрицами.
Например, операторы координаты и импульса принимают вид
*п'п = {П'\Х \п) , Рп,п = (п'\р\п),
именно такое представление использовалось Гейзенбергом в его
матричной механике — еще одной из первоначальных версий
квантовой механики. Матрица гамильтониана в собственном базисе диаго-
нальна:
Яп'п = EnSn'n-
Переход от координатного представления к энергетическому
осуществляется с помощью разложения
п
где функция координат
Фп(х) = (х\п)
есть собственная функция оператора Гамильтона в координатном
представлении:
Нфп = Епфп. (14.15)
Уравнение (14.15) называется стационарным уравнением Шредингера.
14.3. Картины Гейзенберга и Шредингера
В классической механике Гамильтона зависимость от времени
наблюдаемой F(p, q) определяется ее скобкой Пуассона с
гамильтонианом:
dt t > / Qp dq dq dp dq dt~*~ dPdf ^4-io;
На основании сформулированного в 14.1 принципа соответствия для
соответствующих операторов следует написать
14.3. Картины Гейзенберга и Шредингера
165
где F(t) есть оператор физической величины F в момент времени t. В
качестве начала отсчета времени выберем t = О, полагая .F(O) = F, где
F — ранее введенный оператор наблюдаемой, заданный в
фиксированный момент времени. Будем предполагать для простоты, что Н не
зависит от времени явно. Тогда операторное уравнение (14.17) можно
проинтегрировать:
F(t) = U+FU, (14.18)
где оператор
U = exp(-%-^\ (14.19)
называется оператором эволюции и F = F(0). В силу
самосопряженности гамильтониана Н оператор эволюции является унитарным:
Если классическая величина F{jp,q,t) зависит от времени явно, то
в (14.16) и соответственно в (14.17) появится дополнительное
слагаемое dF/dt:
^-% + fc.wb
Бели гамильтониан зависит от времени явно, то оператор эволюции
определяется из уравнения
ih^- = HU, (14.20)
at
в этом случае выражение (14.19) заменяется на хронологически
упорядоченную экспоненту:
Hdt I , (14.21)
где символ Т означает, что в тейлоровском разложении оператора в
правой части следует производить упорядочение по значениям
аргумента, например, во втором порядке
T{H{tjH(t2)) = н(^)н(г2)в{^ -t2) + H{t2)H(tx)e{t2 - tj
и аналогично для высших членов разложения (операторы доллсны
быть расположены справа налево в порядке возрастания времен). Для
проверки следует подставить (14.21) в уравнение (14.20) и записать
интеграл по времени в n-м члене разложения экспоненты в виде
многократного интеграла с упорядоченной последовательностью пределов.
166
Глава 14. Основные принципы
Описанная картина эволюции называется гейзенберговской. В ней
зависимость от времени сосредоточена в операторах наблюдаемых, в
то время как вектор состояния остается неизменным: \ф) — |^>(0)).
Математическое ожидание величины F в момент t определяется
формулой (14.6):
(F)t = №)№)№<>))■
Подставляя выражение (14.18) для F(t), можно, однако, переписать
эту формулу в эквивалентном виде:
(F)t = {4,{0)\U+F(0)li |V(0)> = (fl>(t)\F(0) №)) ,
где зависимость от времени отнесена к вектору состояния:
№(*)>= М№(0)>.
Тогда для |VK*)) получаем уравнение Шредингера
ih£t\4>(t))=H\rP(t)) (14.22)
с начальным условием V(')lt=o = Ф(Р)- Такое альтернативное
представление зависимости физических величин от времени называется
картиной Шредингера . В картине Шредингера операторы
наблюдаемых остаются неизменными, в то время как вектор состояния
эволюционирует. Выбирая координатное представление, получим уравнение
Шредингера для точечной частицы, движущейся в поле U(r,t):
ih^dT~ = -^*4>(r,t) + U(r,t)4>(r,t), (14.23)
где гр(г, t) = (r\ip(t)). (Чтобы отличить от стационарного
уравнения (14.15), уравнение (14.23) часто называют полним уравнением
Шредингера.)
Если вектор состояния при t = 0 является собственным вектором
оператора Гамильтона:
Н \фЕ) = Е \гРЕ), (14.24)
то зависимость от времени в соответствии с (14.22) особенно проста:
№(*)>= e-*Bt/ft|VB>. (14.25)
В этом случае среднее значение любой наблюдаемой F не зависит от
времени:
(F) = №)\*Ч0) №)) = Ш ПО) \гРЕ),
14.3. Картины Гейзенберга и Шредингера
167
поэтому такое состояние называют стационарным. Уединенная
квантовая система может находиться в стационарном состоянии сколь
угодно долго. Чтобы вывести систему из такого состояния, необходимо
внешнее воздействие, что выражается в изменении исходного
гамильтониана. Для нового гамильтониана соотношение (14.24), вообще
говоря, перестает выполняться, и состояние уже не будет стационарным.
Целесообразность использования той или иной картины эволюции
зависит от специфики задачи. Так, для определения изменения
математических ожиданий наблюдаемых в общем случае более подходящей
является картина Гейзенберга. Для операторов импульса и
координаты точечной частицы уравнения (14.17) принимают вид
p(t)=l-[H(t),p(t)], (14.26)
r(t) = j.[H(t),r(t)}. (14.27)
Здесь в правых частях стоят коммутаторы гамильтониана с
неизвестными операторами pit), r(t), для вычисления которых заметим, что
преобразование (14.18) является унитарным и потому не изменяет
коммутатора. Действительно, если [F1(0),i;,2(0)] = iF3(0), то
[*i(t),Fa(i)] = [U+FMUM+F2(!m = U+[FX(Q),F2(Q)]U = iF3(t).
Учитывая значения коммутаторов
[p,/(r)] = -ifcVr/,
[r,f(P)] = ihVpf,
которые легко получить в координатном и импульсном
представлениях соответственно, из формул (14.26) и (14.27) находим
p{t) = -VU, (14.28)
r(t) = £Ф. (14.29)
m
Операторные соотношения (14.28) и (14.29) совпадают по форме с
уравнениями Гамильтона классической механики. Усредняя их по
состоянию \ф(0)), получаем для средних классические уравнения
движения (теоремы Эренфеста):
±(p) = -(4U), (14.30)
l<r> = i<p). (14.31)
at m
168
Глава 14. Основные принципы
Следует подчеркнуть, что совпадение уравнений для средних значений
импульса и координаты с соответствующими классическими
уравнениями не означает совпадения правой и левой частей (14.30), (14.31) в
отдельности с классическими величинами. Так, нетрудно показать, что
в стационарных состояниях средние значения коммутаторов в (14.26)
и (14.27) равны нулю, поэтому средние значения производных
координаты и импульса также обращаются в нуль. Для классических величин
это, разумеется, не так.
14.4. Одновременная измеримость и
соотношение неопределенностей
Бели система находится в одном из собственных состояний |/)
наблюдаемой F, то измерение данной величины с достоверностью
покажет соответствующее собственное значение /. Возникает вопрос:
существуют ли состояния, в которых несколько наблюдаемых J^, F2, • ■ •
имеют с достоверностью определенные значения, или, как говорят,
одновременно измеримы? Если это так, то будет ли таких состояний
достаточно много, иными словами, возможно ли для нескольких
наблюдаемых существование общих собственных векторов, образующих
полную систему
Fl\fl,f2,---) = fl\fl,f2,---),
F2 1Л, /а, ■ • •) = /а |Л, /2, - -.), (14.32)
Можно показать, что необходимым и достаточным условием является
коммутативность операторов наблюдаемых:
[Fi>Fj}=0> Для всех i,j.
Рассмотрим для простоты случай двух наблюдаемых. Необходимость
сразу очевидна из (14.32), если применить к первому соотношению
оператор F2, ко второму Fx и произвести вычитание. Идея доказательства
достаточности состоит в следующем. Предположим, что спектр
оператора Fx простой, т. е. каждому собственному значению отвечает
единственный собственный вектор. Применяя к первому из равенств (14.32)
оператор F2 и учитывая коммутативность Ft, F2, получим
^atal/i. Л» = fiF2\A,f2) = ^(FalA./a)),
14.4. Одновременная измеримость 169
откуда ясно, что F2\f1,f2) является собственным вектором оператора
.Р\ с тем же собственным значением Д. В силу предположения о
простоте спектра Fx это означает, что
*al/i. /2) = const |A, /2). (14.33)
Полагая в (14.33) const = /2, получаем, что выбранный вектор
также является собственным вектором F2. Поскольку система
собственных векторов -Fj полна, полной будет и система общих собственных
векторов F^F^ В случае если среди собственнных значений Fx есть
совпадающие, приведенное построение необходимо дополнить
построением определенной линейной комбинации векторов, принадлежащих
одному собственному значению.
Легко видеть, что максимальное число независимых наблюдаемых,
которые могут одновременно иметь определенные значения, равно
числу степеней свободы системы. Рассмотрим, например, систему из
N материальных точек, описываемую 3N координатами д* и 3N
импульсами р4, i = 1,..., 3N. Поскольку классические скобки Пуассона
для любых пар qx и любых пар pt равны нулю, соответствующие
коммутаторы также должны быть равны нулю:
[<?'V] = 0, \Pi,Pj}=0, i,j = l,...,3N.
Из сказанного выше следует, что существует система общих
собственных векторов 3N операторов координат
?|g\...,93"> = *kV-->0>
а также аналогичная система для pt. Однако операторы координат и
импульсов, отвечающих одной и той же степени свободы, не
коммутируют между собой, поэтому построить более 3N независимых величин
не удается. Справедливо также утверждение: если имеется более чем
3N одновременно измеримых наблюдаемых, то не более 3N из них
являются функционально независимыми.
Для точечной частицы в трехмерном пространстве важной
наблюдаемой является момент количества движения, которому отвечает
оператор
L = [г х р].
Компоненты Li вектора L образуют алгебру so(3):
[Li> Lj] = iheijkLki
где ciik — символ Леви-Чивита. В силу сказанного выше, не
существует состояний, в которых все три (или хотя бы две) компоненты момента
170
Глава 14. Основные принципы
имели бы одновременно определенные значения. Таким образом,
направление момента импульса в квантовой механике принципиально не
определено. Можно, однако, построить общую систему собственных
векторов для одной из компонент момента, скажем, Lz, и оператора
квадрата момента
L*=Ll+Ll+L2„
коммутирующего со всеми проекциями:
[£2,А1 = о
(более общее утверждение: вектор L коммутирует с любой
скалярной функцией координат и импульсов, поскольку компоненты
момента являются генераторами группы вращений, оставляющих скаляры
инвариантными). Поэтому существуют общие собственные векторы у
пары операторов L2 и Lz. В качестве третьего независимого оператора,
коммутирующего с этой парой, можно выбрать р2. Заметим, что при
вычислении коммутаторов от произведений операторов удобно
пользоваться правилом Лейбница
[А, ВС] = [А, В]С + В[А, С].
Максимальную систему коммутирующих величин называют полным
набором наблюдаемых. Примерами полных наборов для частицы в
трехмерном пространстве являются {д*}, {р4}, {L2,Lz,p2/(2m)},
другие примеры будут даны при рассмотрении конкретных задач. Общие
собственные векторы полного набора наблюдаемых образуют удобный
базис в гильбертовом пространстве состояний.
В силу принципа соответствия между классическими скобками
Пуассона и коммутаторами операторов физических величин никакая
пара канонически сопряженных переменных не может иметь
одновременно определенные значения. Для таких величин молено получить
неравенство на соответствующие дисперсии, называемое
соотношением неопределенностей. Рассмотрим пару некоммутирующих
самосопряженных операторов А+ = А, В+ = В. Тогда
[А,В] = гС,
где С+ = С. Определим дисперсии величин равенствами
{5А)2 = {{А-(А))2), {6В)2 = ((В-(В))2), (6С)2 = ((С-(С))2),
где усреднение проводится по выбранному состоянию \ф). Построим
однопараметрическое семейство векторов
\<р) = {А-'{А)-ЩВ-(В))}\1>),
14.5. Переход к классической механике 171
где £ € R — параметр. Вектор \<р) € И, и, следовательно, {(fi\(p) ^ 0,
поэтому
(tp\V) = {5А)2 + е(5В)2 + t(C) > 0.
Отсюда следует соотношение неопределенностей
В частности, для операторов координаты и импульса, входящих в
канонически сопряженную пару, С = ft, поэтому
SxSp > -.
Для компонент момента количества движения находим
8LJLy > йЩ^-
14.5. Предельный переход к классической
механике
Уравнение Шредингера (14.23) для волновой функции в
координатном представлении в пределе ft —> 0 порождает уравнение
Гамильтона—Якоби. Представим волновую функцию в виде
iP(r,t) = A{r,t)exp (js(r,t)) , (14.34)
где А (модуль) и S (фаза) — вещественнозначные функции. (В
дальнейшем результаты будут распространены и на случай комплексных
S, А путем аналитического продолжения.) Отделяя в (14.23)
вещественную и мнимую части, получаем два уравнения:
йЛ 1 А
™ + ±VA-VS+f-AS = 0. (14.36)
ot m 2m
В пределе ft —>• 0 последнее слагаемое в (14.35) можно опустить, и тогда
первое уравнение переходит в уравнение Гамильтона-Якоби для
фазы S, которая, очевидно, становится классической функцией действия.
Таким образом, фаза волновой функции в координатном
представлении переходит при ft —> 0 в классическое действие.
172
Глава 14. Основные принципы
Уравнение (14.36) молено переписать в виде уравнения
непрерывности:
мЛ'+НЛ^)=0- (ш,7)"
Величина А2, представляющая собой квадрат модуля волновой
функции (14.34), является плотностью вероятности обнаружить частицу в
точке г в момент t. Тогда, очевидно, вектор под знаком дивергенции
следует понимать как плотность тока вероятности
3 = А2^- = ~^(Ф^ф - W). (14.38)
Поток этого вектора через площадку dS есть вероятность того, что
частица пересекает площадку в течение единичного интервала
времени. Переписанное в терминах комплексных величин уравнение (14.37)
принимает вид
^|V(r,*)|2 + divi(r,*) = 0, (14.39)
или, в интегральной форме,
^yW,i)|2d3*4- JjdS = 0,
v av
где dV — граница выделенной области V. Это уравнение выражает
«сохранение вероятности»: если вероятность обнаружить частицу в
объеме V уменьшается (увеличивается), то возникает отличная от
нуля вероятность пересечения частицей границы области в направлении
наружу (внутрь) области. Подчеркнем, что уравнение (14.39)
является точным следствием уравнения Шредингера, при его выводе мы не
переходили к пределу Й —> 0. Величины \ф\ и j аналогичны плотности
заряда и плотности тока в электродинамике.
Вернемся теперь к пределу ft —► 0 и рассмотрим подробнее
одномерное движение. Поскольку в этом пределе функция S становится
классическим действием, ее градиент равен классическому
импульсу частицы как функции времени и координат, производная dS/dt —
функции Гамильтона со знаком минус, а уравнение Гамильтона-Якоби
повторяет классическое соотношение
Нетрудно проверить, что в стационарном состоянии, когда волновая
функция удовлетворяет уравнению
Нф = Еф,
14.5. Переход к классической механике
173
в уравнении (14.40) будем иметь Н = Е, и из него можно получить
классическую функцию
р(х) = ±у/2т(Е-Щх)), (14.41)
при этом
S(x, t) = -Et + / p(x)dx.
В стационарном состоянии dA2/dt = 0), поэтому из (14.37) следует,
что
A2VS/m = const,
а поскольку V5 = р(х), то с точностью до постоянной получаем:
А = (р(х)У1/2 = [2т{Е - Щх))] '*'*.
В результате волновая функция (14.34) при ft —¥ 0 принимает вид
^ = ^еХР(Ы' (1442)
где SKJ1 — классическое действие. Такое приближение для волновой
функции называется квазиклассинеским. В системе (14.35,14.36)
можно проводить итерации по ft, улучшая это приближение.
Полученное представление справедливо в области классического
движения вдали от точек поворота, т.е. корней функции р(х), в
которых выражение (14.42) расходится. В дальнейшем будет показано,
что с помощью аналитического продолжения можно получить
аналогичное представление и в области, где р(х) становится мнимой
величиной. В окрестности точек поворота уравнение Шредингера нужно
рассматривать более аккуратно. Мы вернемся к этому вопросу в п. 15.6
при обсуждении одномерного уравнения Шредингера.
С физической точки зрения квазиклассическое приближение
аналогично приближению геометрической оптики для световых волн,
распространяющихся в неоднородной среде. Траектории частиц
являются аналогами световых лучей, ортогональных поверхностям волновых
фронтов. До тех пор, пока длина волны мала по сравнению с
размерами неоднородностей среды, геометрическая оптика дает
адекватное описание распространения волн. В противном случае дифракция
на неоднородностях становится определяющей и нужно пользоваться
волновой теорией. Необходимо подчеркнуть, однако, что в квантовой
механике речь идет о волнах, ассоциируемых с амплитудой
вероятности, а не о величинах, которые могут быть непосредственно
наблюдаемы.
Глава 15
Одномерное движение
15.1. Свободная частица
Полный набор одновременно измеримых наблюдаемых для
свободной точечной частицы, совершающей одномерное движение, состоит
из единственного оператора, в качестве которого удобно выбрать
оператор импульса. Гамильтониан является квадратичной функцией
импульса и в координатном представлении равен
2тп 2тп dx2'
поэтому обобщенная собственная функция оператора
импульса (14.14), удовлетворяющая уравнению (14.13),
ФЛх) = (х\р) = Jvx/n
является также (обобщенной) собственной функцией гамильтониана:
2
Н%(х) = |^р(*) (15.1)
и описывает стационарное состояние. Решения уравнения (15.1)
существуют при всехр G К и, как и следует ожидать в случае непрерывного
спектра, нормируемы на дельта-функцию
/v£(*hM*)dx = <J(p-P')-
R
15.1. Свободная частица
175
Удобно положить р = Кк, тогда стационарное уравнение Шредин-
гера Нф ■=■ Еф принимает вид
ф"{х) + к2ф(х)=0,
где Е = Н2к2/(2тп); его общее решение будет суперпозицией
собственных функций оператора импульса с собственными значениями
р = ±Пк:
фк{х) = Схе>к* + С2е-*х.
Зависимость от времени в стационарном состоянии дается фазовым
множителем eTtEt/h (см. (14.25)), поэтому соответствующее решение
полного уравнения Шредингера (14.23) имеет вид
фк(х,г) = c1eiV"c-u"t'> + C2e-i(fcx+u"'*), (15.2)
где шк = hk2/(2m). Отсюда видно, что первое слагаемое описывает
движение в положительном, а второе — в отрицательном направлении
оси х.
Наиболее общее решение полного уравнения Шредингера (14.23)
является суперпозицией стационарных состояний (15.2) со всеми к:
со
ф(х,г) = -±= f C(k)ei(-kx-Ukt)dk.
—оо
Такое состояние (волновой пакет) будет иметь конечную норму в
гильбертовом пространстве, если С(к) — произвольная комплекснозначная
функция из L2(TSL), и можно выбрать |[^>|| = 1. В соответствии со
сказанным в 14.2, С(к) является амплитудой вероятности обнаружить
частицу имеющей импульс р = Нк. Частный случай такого состояния был
рассмотрен в 13.3, где мы убедились в том, что волновой пакет
расплывается (т. е. дисперсия координаты растет) тем быстрее, чем шире
распределение по импульсам С (к).
Общие закономерности распространения волнового пакета проще
всего проанализировать, используя картину Гейзенберга. В этой
картине волновая функция сохраняет свое начальное значение ф(х, 0),
задаваемое набором амплитуд С (к), а операторы наблюдаемых зависят
от времени. Поскольку оператор импульса коммутирует с
гамильтонианом свободной частицы, из (14.17) сразу находим (в координатном
представлении)
p(t)=p(0) = ?-* (15.3)
176
Глава 15. Одномерное движение
а для оператора координаты будем иметь
x(t) = х(0) + ^-Ч = х + — —.
тп тпг ах
(15.4)
Усредняя (15.4) по начальному состоянию, получаем, что центр
волнового пакета движется со скоростью, отвечающей среднему значению
импульса:
<*>« = (*>о + ^ <Р)о •
Чтобы исследовать расплывание пакета, вычислим дисперсии
координаты и импульса с помощью (15.3), (15.4):
(5tx)2 = ((х - (х))2\ = (60х)2 + (5оР)2^ + ((хр + рх)0 - 2 <х)0 <р)0)-*-,
тп'
тп
(W = «p-<p»2>, = (W
Таким образом, дисперсия импульса при свободном движении не
изменяется, а квадрат дисперсии координаты при больших t растет
квадратично со временем. Заметим, что состояние покоящейся
частицы ((р)о = 0) не является статическим, если 60р ф 0: соответствующий
волновой пакет расплывается. Расплывание тем быстрее, чем больше
дисперсия импульса.
15.2. Потенциальная яма
Рассмотрим теперь финитное движение частицы в силовом
поле. Простейшим случаем такого
движения является свободное движение на ко-
Щ нечном отрезке [—а/2, а/2] с
отражением от потенциальных стенок х = —а/2 и
х = а/2. Соответствующий гамильтони-
ан равен
-а/2 а/2
Рис. 15.1. Прямоугольная Н = £— + U0(e(x-a/2) + 9(-a/2 -х)),
потенциальная яма 2то ,Л _ _,
(15.5)
где U0 — высота стенки. Бели энергия
классической частицы Е > Щ, то она не испытывает отражения в
точках ±а/2, хотя ее скорость скачкообразно меняется, если же Е <
U0, то частица совершает финитное движение внутри потенциальной
ямы 15.1.
15.2. Потенциальная яма
177
Построим квантовые стационарные состояния этой системы. Из
уравнения Шредингера Нф — Еф имеем
ф" -иф = -к2ф, (15.6)
где u = 2mU/h2, к2 = 2mE/h2. Поскольку при х = ±а/2 потенциал
U имеет конечные разрывы, ясно, что в этих точках функции ф и
ф' должны быть непрерывны, причем первая производная ф' должна
иметь излом, с тем чтобы вторая производная ф" имела конечный
разрыв. Общее решение уравнения (15.6) легко построить, склеивая
решения свободного уравнения на отрезке [—а/2, а/2] с решениями вне
классической области. Предполагая, что 0 < Е < U0, и обозначая
х2 = 2m(UQ — Е)/К2, будем иметь
Cje-** + С2е*х, х<-а/2,
С3 sin kx + C4 cos fcx, |x| < а/2, (!5-7)
С5ехх + Сбе-~х, х>а/2.
Чтобы выяснить характер спектра энергий, необходимо установить,
существует ли такой выбор коэффициентов С1г..., С6, при котором
решения принадлежат i2(M) для некоторых значений спектрального
параметра к (дискретный спектр) либо допускают разложение
единицы в виде интеграла по спектральному параметру (непрерывный
спектр). В обоих случаях функции не могут иметь на бесконечности
экспоненциальный рост, поэтому необходимо положить С-у = С5 = 0, так
что остаются четыре неопределенные комплексные постоянные.
Отсюда следует, что непрерывный спектр в области энергий 0 < Е < U0
отсутствует. Действительно, непрерывность ф и ф' в точках х = ±а/2
налагает четыре условия на постоянные (72,С3,С4, Се, причем эти
условия представляют собой линейную однородную систему
алгебраических уравнений. Нетривиальные решения такой системы существуют
лишь при обращении в нуль соответствующего определителя, который
зависит от к. Поэтому решения, вообще говоря, могут существовать
только при некоторых дискретных к.
Склейку решений и отыскание дискретных к можно упростить,
используя соображения четности. Поскольку потенциал в (15.5) является
четной функцией, то оператор инверсии Р,
Рф(х) = ф(-х),
коммутирует с гамильтонианом, [Р, Н] = 0, и потому можно выбрать
собственные векторы Н имеющими определенную четность. В
обоих случаях достаточно провести склейку в одной из точек
разрыва потенциала, причем для исключения коэффициентов достаточно
ф(х) =
178
Глава 15. Одномерное движение
Рис. 15.2. tgJfca/2 = х/к
Рис. 15.3. ctgAa/2 = -х/к
склеить логарифмическую производную ф'/ф. Для четных состояний
(С2 = С6, С3 = 0) склейка в точке х = а/2 дает следующее уравнение
на собственные значения:
tg ka/2 = х/к,
графическое решение которого выглядит, как показано на рис. 15.2.
Финитному движению отвечают значения 0 < к < xG, х2 = 2mU0/h2,
при этом х = у/xq — к2. Имеется конечное число точек пересечения
кп+, п+ = 0,1,2,..., п™ах графиков правой и левой частей уравнения
в рассматриваемой области энергий Е = (Нк)2/(2т) < U0, причем
минимальный корень к0 удовлетворяет неравенству к0а < 7Г и существует
при всех U0. Для нечетных решений (С2 = — С6, С4 = 0) условие
непрерывности логарифмической производной при х — а/2 дает уравнение
ctg ка/2 = —х/к,
графическое решение которого к = кп_, п_ = 1,2,..., п™ах
получается, как показано на рис. 15.3. Легко видеть, что минимальный корень
нечетного решения больше минимального корня четного решения, так
что основное состояние является четным. При достаточно малой
глубине ямы нет ни одного нечетного уровня.
Итак, мы получили, что спектр энергий частицы, совершающей
финитное движение в потенциальной яме, является дискретным, Еп =
(hkn) /(2m), где теперь индекс п нумерует все корни в порядке их
возрастания начиная сп = 0. Внутри ямы волновая функция
осциллирует и имеет там ровно п нулей. Волновая функция отлична от
нуля также и в классически недоступной области вне ямы, где она
экспоненциально спадает. Таким образом, имеется малая, но
отличная от нуля вероятность обнаружить частицу вне области
классического движения. Все коэффициенты Cf в (15.7) могут быть выбраны
15.2. Потенциальная яма
179
вещественными (с учетом условий склейки); таким образом, волновые
функции дискретного спектра вещественны (с точностью до
умножения на комплексный фазовый множитель). Нетрудно видеть, что для
вещественных волновых функций плотность тока вероятности (14.38)
обращается в нуль. Это соответствует тому факту, что плотность
вероятности в таких состояниях не зависит от времени и в силу уравнения
непрерывности (14.39) плотность тока вероятности не должна зависеть
от х. Но поскольку для стационарных состояний финитного движения
направления вдоль и против оси равноправны, плотность тока должна
обращаться в нуль.
Особенно простая формула для спектра энергий получается в
пределе UQ —¥ со, Е конечно. При этом в областях вне ямы, |х| > а/2,
в (15.7) х —> со и ф —»• 0. Такое решение уже не может иметь
непрерывную производную ф' на границах, в то время как функция ф
по-прежнему непрерывна и, следовательно,
ф{-а/2) = ф(а/2) = 0.
Отсюда при |х| ^ а/2 получаем
ф = Csin[k(x +а/2)], ка = яп, п = 0,±1,±2,...,
и, следовательно,
1 /Йтгп\"
m \ а )
Е
п 2тп
Такая потенциальная яма отвечает «непробиваемым» стенкам:
отражение имеет место при любых значениях энергии. Волновая
функция при этом тождественно равна нулю вне ямы. Число нулей
волновой функции внутри ямы (не считая нулевых значений на границах)
по-прежнему равно п, и волновая функция также вещественна.
Другой простой предельный случай представляет бесконечно
узкая и бесконечно глубокая яма: UQ —> со, a —¥ 0, причем в пределе
aU0 = а = const (предварительно к потенциалу (15.5) следует
добавить константу — U0). Это эквивалентно потенциалу
U(x) = -а5(х).
Уравнение Шредингера теперь следует решать при i^Oh склеивать
решения в точке х = 0. Волновая функция по-прежнему непрерывна,
а производная ф' имеет скачок, который нетрудно определить,
интегрируя уравнение Шредингера (15.6) в окрестности точки х — 0:
^'С + ^^(0)=0. (15.8)
180
Глава 15. Одномерное движение
Если Е < 0 (частица в яме), то ограниченное и непрерывное при х = 0
решение будет иметь вид
Ч
№) ~ 1 j,
е-**, х > 0,
е**, х < 0,
где Л:2 = 2т\Е\/Н2. Из условия склейки (15.8) находим единственное
допустимое значение волнового числа
ma
*= Ж
(дискретный спектр, состоящий из одной точки), а постоянная С
определяется из условия нормировки. Итак, дельтаобразная
потенциальная яма может удерживать частицу лишь с фиксированным
значением энергии. Заметим, что в этом случае интегральная вероятность
обнаружить частицу вне ямы равна единице, поскольку волновая
функция конечна в точке х = 0, а ширина «классической» области равна
нулю.
Вернемся теперь к гамильтониану (15.5) при конечных U0 и
рассмотрим случай энергий Е > UQ. Тогда вместо (15.7) будем иметь
'Схе**х + С2е-*х, х < -а/2,
V-(s) = < C3eik* + C4e~ikx, \x\ < а/2,
С5е*'9х + Све-*«*, х > а/2,
где h2q2 = 2тп(Е — U0). Это решение заведомо не принадлежит Ь2(Щ,
но является ограниченным и состоит из «плоских волн», которые
являются обобщенными собственными функциями оператора импульса,
принадлежащими непрерывному спектру. Склейка ф и ф' в точках
±а/2 дает четыре условия, которые могут быть удовлетворены при
любых к, т. е. спектр энергий Е — (Нк)2/(2тп) также непрерывен.
Более того, для каждого А; имеются два линейно независимых решения,
которые удобно выбрать, полагая С6 = 0 либо Сг = 0. Вспоминая, что
временная зависимость стационарного состояния определяется
множителем е—' *' , легко видеть, что в первом случае справа от точки а/2
имеется только волна, движущаяся в положительном направлении оси
х, а во втором случае слева от точки —а/2 имеется только волна,
распространяющаяся против оси х. Поэтому решение с С6 = 0 описывает
движение слева направо с частичным отражением назад, а решение с
Сх — 0 — движение справа налево также с частичным отражением.
Поскольку уравнение Шредингера (15.6) вещественно, то ф* также
является решением. Из постоянства вронскиана
1¥(ф,ф*) =ф'ф* -ф*'ф
15.2. Потенциальная яма
181
(что эквивалентно сохранению тока (14.38) в стационарном состоянии)
находим
|C2|2 + |C5|2 = |Ci|2- (15.9)
Вводя коэффициенты отражения г = \С2/СХ\* и прохождения d =
l^/Cil2 Ках отношение плотностей тока вероятности (14.38) для
соответствующих частей волновой функции (при С6 = 0), из (15.9)
получаем
r + d = l.
Аналогичным образом можно рассмотреть второе решение Сг = 0,
отвечающее исходному движению против оси х. Переопределяя
коэффициенты прохождения и отражения как г = \CS/Ce\2, d = \С2/С6\2,
мы получим для них те же значения, что и выше; в этом нетрудно
убедиться, приравнивая значения вронскиана от первого и второго
решений при х < —а/2 и х > а/2. Таким образом, в случае непрерывного
спектра удается определить лишь вероятности прохождения и
отражения, рассматривая плотность тока вероятности для двух слагаемых в
волновой функции, описывающих движение вдоль и против оси х.
Разумеется, в случае ненормируемых состояний невозможно говорить о
плотности вероятности обнаружения частицы в той или иной точке,
для этого следовало бы рассмотреть движение волнового пакета.
Частичное отражение при движении частицы над потенциальной
ямой представляет собой чисто квантовое явление. Действительно,
классическая частица испытывает ускорение в момент пересечения
первой границы ямы и замедление в момент выхода из области над ямой,
но продолжает двигаться в исходном направлении. Квантовая
частица в общем случае будет испытывать отражение, что можно считать
результатом интерференции волн де Б рой ля, модулируемых
потенциалом. В следующем разделе мы покажем, что при этом может возникать
волновой резонансный эффект.
Описанные закономерности сохраняются и для одномерного
движения в потенциальном поле более общего вида. В диапазоне энергий,
в котором частица не может уходить на бесконечность, совершая
финитное движение, спектр энергий дискретный, при этом число нулей
волновой функции внутри ямы равно номеру уровня, если основному
состоянию присвоить номер нуль (осцилляционная теорема).
Волновые функции дискретного спектра могут быть выбраны
вещественными. Для четного потенциала волновая функция основного состояния
четна.
182
Глава 15. Одномерное движение
15.3. Потенциальный барьер
Рассмотрим потенциал в виде ступеньки, как показано на рис. 15.4,
U{x) = и0в{х).
(15.10)
Е
Щ
Тогда при Е > U0 спектр непрерывен и двукратен, как и в
предыдущем случае движения над
потенциальной ямой. При Е < U0 имеется одна
точка поворота, в которой классическая
частица претерпевает отражение и уходит
назад на бесконечность. Посмотрим,
каков спектр гамильтониана в этом
случае. Соответствующее решение
уравнения Шредингера (15.6) можно предста-
Рис. 15.4. Потенциальная
ступенька
вить в форме
ф(х) =
Cj sm(fcx + 6),
С*~
х<0,
х>0,
где 5 — вещественная постоянная, a fc и >с имеют тот же смысл, что
и в предыдущем разделе. Функция ф и ее производная должны быть
непрерывны в точке х = 0; ясно, что склейку можно осуществить,
считая Сх и С2 вещественными. Поэтому и в данном случае плотность
тока вероятности равна нулю. Физически это связано с тем, что и для
квантовой частицы имеет место полное отражение на границе, поэтому
направления движения вправо и влево равновероятны. Полное
отражение имеет место для всех Е < U0, но дополнительная фаза 5 зависит
от энергии. Действительно, из условия непрерывности
логарифмической производной находим
kctgS = —х.
Это условие не накладывает ограничений на к, поэтому спектр энергий
непрерывный. Соответствующее решение полного уравнения
Шредингера представляет собой стоячую волну:
ф(х, t) = sin(fcx + S)e~
ш = hk2/(2m), x < 0,
которая может рассматриваться как суперпозиция падающей eikx~twt
и отраженной e~xkx~xwt волн одинаковой по модулю амплитуды. При
этом фаза 8 зависит от высоты потенциальной ступеньки и энергии
частицы. Аналогичные свойства будут иметь асимптотики волновой
функции и для потенциала U{x) общего вида, стабилизирующегося на
15.3. Потенциальный барьер
183
значениях U = 0 при х = —оо и U = U0 > 0 при х = со, для
собственных значений Е < U0. Таким образом, в случае полного отражения с
возможностью ухода частицы на бесконечность в одну сторону спектр
энергий непрерывный и однократный.
Рассмотрим теперь прямоугольный потенциальный барьер
конечной ширины (рис. 15.5)
U(x) = U0(в(х + а/2) - 9{х - а/2)).
При Е < U0 классическое движение
происходит либо в области х < —а/2,
либо в области х > а/2, причем
частица не может перейти из одной
области в другую. Покажем, что
квантовая частица с отличной от нуля
вероятностью может проходить сквозь
потенциальный барьер (туннельный
эффект). Стационарное состояние, отвеча-
Е
,
.
Do
-а/2
а/2
Рис. 15.5. Потенциальный
барьер
ющее прохождению в положительном направлении оси х, имеет вид
'ae^ + Gje-'**,
ф{х) = <
С3е-жх
С5е**,
+ С4е"*,
х < -а/2,
|х| < а/2,
х > а/2,
где Н2*? = 2m(U0 — Е), Н2к2 = 2тпЕ. Здесь имеются пять
комплексных коэффициентов, которые должны быть определены из четырех
условий склейки функции и ее первой производной в точках
поворота х = ±а/2. Поэтому решение существует при всех к (спектр энергий
непрерывен), а общая нормировочная постоянная может быть
найдена из условия нормировки на дельта-функцию. В результате склейки
находим следующее значение для коэффициента прохождения:
Ci
1+(*££) *V«)
Эта величина существенно зависит от произведения на, имеющего
смысл (с точностью до коэффициента) отношения ширины барьера
к модулю дебройлевской длины волны, которая под барьером
является чисто мнимой величиной. Коэффициент прохождения
экспоненциально убывает с увеличением этого отношения, т. е. с ростом U0 при
фиксированной энергии Е.
184
Глава 15. Одномерное движение
Приведем также значение коэффициента отражения
(к2 + м?)2 sh2(aH)
~ (к2 + х2)2 sh2{ax) + 4*2к2'
В полученных формулах можно совершить аналитическое
продолжение от UQ к — U0 (при этом ус —)■ iq, h2q2 = 2тп(Е + U0), это означает
переход от барьера к потенциальной яме; коэффициент отражения
частицы, движущейся над ямой, будет иметь вид
(fc2-g2)2sin2(gg)
T~(k2-q2)2 sin2(aq) + 4q2k2 '
Это выражение обращается в нуль при qa = пп, п = ±1, ±2,...
Физически это условие соответствует ситуации, когда в яме укладывается
целое число дебройлевских волн. При этом возникает полное
резонансное прохождение, так что d = 1, т = 0.
15.4. Периодический потенциал
Особый случай представляет периодический потенциал U(x) =
U(x + а), заданный на всей оси. Такой потенциал можно
рассматривать как бесконечную последовательность либо потенциальных ям,
либо потенциальных барьеров. Оказывается, соответствующий
спектр энергий занимает промежуточное положение между дискретным и
непрерывным.
Докажем, что систему решений стационарного уравнения Шредин-
гера в периодическом поле можно подчинить условию
ф(х + па) = Хпф(х), n€Z, (15.11)
причем |А| = 1. Действительно, если фх я ф2 — два линейно
независимых решения, то функции фх (х+а) и ф2(х+а) должны быть
линейными комбинациями фг(х) и ф2(х), и ^ез ограничения общности можно
выбрать фх(х+а) = Ххфх(х), ф2(х+а) = Х2ф2(х). Из постоянства
вронскиана ТУ(ф1,ф2) — Ф1Ф2 ~ Ф'гФ\ следует, что АгА2 = 1. Условие
ограниченности решений при всех х тогда означает, что Хг = Х2 = е*а, где
а — вещественный параметр. Принято полагать а — Ка, считая, что
параметр К принимает значения на интервале \К\ ^ тг/а. Итак,
волновая функция частицы в периодическом потенциальном поле должна
удовлетворять соотношению (15.11) с А = е'^°. Это означает, что
собственные функции гамильтониана можно искать в виде
Ф(х) = е'к'рк(х),
15.4. Периодический потенциал
185
где <рк{х) — некоторая периодическая функция: <f>K(x + о) = <рк(х)
(теорема Блоха).
Покажем, что спектр энергии частицы в периодическом поле
имеет зонную структуру, т. е. состоит из интервалов непрерывного
спектра, разделенных пустыми запрещенными зонами. Пусть фх и ф2 —
два линейно независимых решения уравнения Шредингера на
интервале х € [0,а] и ф = Схфх + С2ф2. Тогда для соседнего
интервала х € [а, 2а] будем иметь
ф(х) = е<Ка(Схфх(х - а) + С2ф2(х - а)).
Из условий непрерывности ф(х) и ф'{х) в точке х = а получаем
однородную линейную систему для Сх, С2, которая имеет нетривиальные
решения, если ее определитель обращается в нуль:
фх (а) - eiK°фх (0) ф2 (а) - е*к*ф2 (0)
фх(а) - e^oVi(0) Ф'2(а) - е*к°ф'2(0)
Входящие в это уравнение значения функций фх, ф2 и их производных
в точках 0 и а зависят от собственных значений энергии Е в
стационарном уравнении Шредингера, поэтому условие (15.12) является
уравнением на Е. В отличие от квантования в потенциальной яме теперь
в задаче имеется непрерывно изменяющийся параметр К е [— J, f ]•
Раскрытие определителя дает уравнение вида
cos Ка = f(E),
где через f(E) обозначено отношение квадратичных комбинаций,
составленных из фх 2(0), фх 2(°)i ^1,2(0) и Ф'\ г(а)> зависящих от Е как от
параметра. В результате получаем условие |/| < 1, из которого вообще
говоря следует существование энергетических зон.
В качестве примера рассмотрим бесконечную последовательность
5-функций:
U(x) = У^ 5(х + па).
т *—'
п=—оо
Линейно независимые решения на интервале х € [0, а] молено выбрать
в виде
фх = eikx, ф2 = e-ikx, h2k2 = 2mE.
Склейку с решением на соседнем интервале следует проводить
согласно (15.8). Тогда вместо (15.12) будем иметь
giJfa р»*° е*^° е—*"ев
= 0,
= 0. (15.12)
186
.Глава 15. Одномерное движение
откуда находим, что значения к ограничены условием
| cos ка + — sin ka\ < 1,
к
т. е. разрешенные значения к образуют бесконечную
последовательность интервалов, расширяющихся с ростом к. При этом энергия
внутри каждой из энергетических зон зависит от А; так же, как и для
свободной частицы: Е = h2k2/2m. Величина р — hk поэтому называется
квазиимпульсом.
15.5. Гармонический осциллятор
Задача о гармоническом осцилляторе имеет многочисленные
приложения в теории твердого тела, радиофизике, оптике, квантовой
теории поля и других разделах физики. Существуют различные методы
описания осциллятора в квантовой теории, одним из которых
является алгебраическое построение пространства состояний (пространства
Фока). Основной идеей этого подхода (некоторые обобщения которого
описаны в Дополнении) является представление гамильтониана
осциллятора
*-£ + =^ <—>
в виде произведения пары взаимно сопряженных операторов. При
этом существенную роль играет положительная определенность
гамильтониана (15.13) и вытекающая отсюда ограниченность спектра
энергий снизу. Выделив размерный множитель х0 = у/К/тш,
представим гамильтониан в виде
*-т[®,+®'
где р0 — Н/х0, и произведем следующую факторизацию:
Н = Пы(а+а + 1/2), (15.14)
вводя операторы уничтожения и рождения
V2 \z0 p0J V2 \х0 p0J
Появление постоянной в (15.14) связано с некоммутативностью р л х.
Новые операторы подчиняются перестановочному соотношению
[о,а+] = 1.
15.5. Гармонический осциллятор
187
Покажем, что эти операторы действуют в качестве лестничных
операторов в пространстве собственных векторов \п), п = 0,1,2,...
гамильтониана
Н\п)=Еп\п),
где Еп — собственное значение (поскольку частица в квадратично
растущем поле не уходит на ±оо, спектр энергий дискретен). Нетрудно
установить следующие перестановочные соотношения операторов а,
а+ с гамильтонианом:
[Н, а] = —Нша, [Н, а+] = Нша+.
Отсюда следует, что состояния а \п) и а+ \п) также являются
собственными векторами оператора Н. Действительно,
Н{а |п» = а(Н |п» + [Н,а] |п> = {Еп - Пш)(а |п»,
т. е. а \п) отвечает собственному значению Еп — Нш. Аналогично для
оператора рождения имеем
Н(а+ |п)) = а+(Н |п» + [Н,а+] \п) = (Еп + Пш)(а+ |п».
Таким образом, последовательное применение оператора а+
порождает бесконечную последовательность собственных векторов
гамильтониана с возрастающими собственными значениями энергии.
Многократное применение оператора уничтожения а, напротив, должно
приводить лишь к конечной последовательности собственных
векторов ввиду ограниченности спектра снизу. Как только достигается
собственное значение энергии, меньшее ftw, которому присвоено значение
индекса п = 0, то соответствующий вектор |0) должен быть
последним в этой последовательности и дальнейшее применение оператора а
должно давать нуль-вектор:
а |0) = 0. (15.15)
Это соотношение является определяющим уравнением для основного
состояния осциллятора с минимальной энергией Е0. Применяя
оператор Гамильтона к вектору |0) и используя (15.15), находим
н\о) = ±1ш\о),
т. е. минимальное собственное значение равно Е0 = \ftw. Действуя
оператором а+ на вектор основного состояния, получим первое
возбужденное состояние с энергией Е1 — |йа> и т. д., в результате возникает
188
Глава 15. Одномерное движение
бесконечная последовательность векторов \п), отвечающих
собственным значениям
Еп = Ни (п + 1/2). (15.16)
Если состояния \п) и \п — 1) нормированы, (п|п) = 1,
(п — 11 п — 1) = 1, то в связывающем их рекуррентном соотношении
появляется коэффициент:
а \п) = л/^ \п - 1). (15.17)
Аналогично если (п+1)-й вектор также нормирован, (п + 11 п + 1) = 1,
то будем иметь
а+ \п) = \/п + 1 |п + 1). (15.18)
Эти соотношения легко проверить, применяя а+ к (15.17) и а к (15.18)
и учитывая, что в силу (15.14) и (15.16)
а+а \п) = п\п).
Повторное применение формулы (15.18) дает следующее выражение
для нормированного вектора \п) через нормированный вектор
основного состояния:
Н = ^£|0). (15.19)
Построенные векторы ортонормированы
{п'\п)=5пп„ (15.20)
и нам остается доказать, что других собственных векторов
гамильтониан не имеет, т.е. что система полна:
г»
Для этого перейдем к координатному представлению грп(х) = (х\п).
Волновые функции можно получить с помощью формул (15.15)
и (15.19) непосредственно, минуя процедуру отыскания решений
стационарного уравнения Шредингера. Действительно, в координатном
представлении
где q = x/x0, и из уравнения (15.15) получаем
(«+£)*,<*)= о:
15.5. Гармонический осциллятор
189
Нормированным (с мерой dq) решением является
Для rj)n{q) с помощью (15.19) получаем
Фп = Nn (g - £) " е-«2/2 = NnHn(q) е"^, (15.22)
где нормировочная постоянная равна
1
JV„ =
а функции
Я„(,)=е^ (,_|)"e-,V»
являются полиномами n-й степени (полиномами Эрмита). В си-
2
лу (15.20) полиномы Эрмита ортогональны с весом e~q :
оо
/
Hn,(q)Hn(q)e-0 dq = 2nn!VtSnn„
более того, известно что они образуют полную систему в L2(R).
Собственные функции (15.22) можно было бы получить и в
результате непосредственного решения уравнения Шредингера
при этом мы обнаружили бы, что нормируемые решения существуют
только при Е = Ьы(п +1/2). Заметим, что полиномы Эрмита и,
следовательно, функции грп четны для четных п и нечетны для нечетных:
*Л-я) = (-!)>„(«)■
Основное состояние является четной функцией координаты.
Полиномы Эрмита Hn(q) имеют те вещественных нулей, таким образом, п-е
возбужденное состояние имеет п нулей, что является общим свойством
состояний дискретного спектра одномерного уравнения Шредингера.
В силу определенной четности фп средние значения как оператора
координаты, так и оператора импульса в состояниях фп равны нулю. Это
190
Глава 15. Одномерное движение
можно получить и алгебраически, учитывая формулы (15.17), (15.18),
(15.20), (15.21):
1
(n\q\n) = -={п\а+а+\п) = -r= «n | n - 1) y/n + (n | n + 1) y/n + 1) =0.
Аналогично для pq = p/p0 = —id/dq имеем
(n\pq \n) = -гд {n\ a-a+ \n) = 0.
Построим теперь такие нестационарные состояния (волновые
пакеты), в которых координата и импульс в среднем принимают
классические значения. Уравнение для таких состояний, называемых
когерентными, можно найти, минимизируя соотношение
неопределенностей. Заметим, что в безразмерных переменных q,pq
гамильтониан симметричен относительно замены импульса на координату и
наоборот. Будем искать состояния, в которых дисперсии координаты и
импульса одинаковы (5q = dp ) и минимизируют соотношение
неопределенностей, т.е. (Sq)2 = 1/2. Нетрудно показать, что эти свойства
будут удовлетворены в состояниях |а), подчиняющихся соотношению
Aq\a) =-iApq\a), (15.23)
где Aq = q—{q), Ар =Pq — \РЯ )• Для этого достаточно применить это
соотношение повторно и использовать коммутатор [q,pq] = *•
Уравнение (15.23) эквивалентно следующему:
а \а) = а \а), (15.24)
где \/2а = (q) + i\Pqf- Мы получили уравнение на собственные
значения для оператора уничтожения, причем собственные значения
а должны быть комплексными. Существование нормированных
собственных функций несамосопряженного оператора, каковым является
а, заранее не гарантировано, например, таких решений для
сопряженного оператора а+ не существует. Однако решения уравнения (15.24)
с требуемыми свойствами нетрудно построить. Действительно, сдвиг
q1 = q—y/2a превращает (15.24) в координатном представлении в
уравнение для TpQ^), и мы находим
где i/>a(q) = (q\oc) и Na — нормировочная постоянная, которая будет
конкретизирована в дальнейшем. Решение существует при всех а € С.
25.5. Гармонический осциллятор 191
Построим теперь решения уравнения (15.24) в фоковском
представлении. Для этого представим \а) в виде разложения по полной системе
векторов \п):
1«> = £сп|п). (15.25)
п=0
Подставляя это разложение в (15.24) и воспользовавшись
рекуррентной формулой (15.17), нетрудно получить, что
откуда
Сп ~ vjc°-
Подставляя это в (15.25), с учетом (15.19) находим
^ Vn! £J n!
Постоянную С0 определим из условия нормировки {а | а) = 1. Хотя это
нетрудно сделать и непосредственно, покажем, как можно
воспользоваться формулой Бейкера-Хаусдорфа для операторов X, Y, таких, что
[Z, X] = [Z, Y] = 0, где Z = [X, Y):
exeY = e^.^e*-^.
Полагая X = аа+, Y = —at*а, будем иметь
еао+-а-в |0) = е-НWe"Ve*e |0) = е-|а|2/2еаа+ |Q) = ^М*/^1 \а) ,
где учтено, что е_аа |0) = |0). Поскольку оператор еао а ° является
унитарным, то для нормировки \а) следует положить С0 = е~1а1 I2.
Итак, получаем для нормированных векторов |а) представление
|а> = e-aQ*/2eao+ |0).
Система векторов \а) не является ортогональной. Действительно,
скалярное произведение пары таких векторов равно
00 ™'*тп_,п
mT^lo Vm!n!
= exp(a'a*-i(|a|2 + |"'|2)). (15.26)
192
Глава 15. Одномерное движение
Отсюда следует, что модуль скалярного произведения
|<a'|o:>l=e-*|Q-aT
никогда не обращается в нуль. Тем не менее система когерентных
состояний обладает свойствами, аналогичными свойствам
собственных векторов самосопряженных операторов. Любой вектор \ф) можно
представить в виде следующего разложения по состояниям |а):
\tP) = JB{a)\a)d2a,
где d2a — dRe a dim a и интегрирование ведется по всей
комплексной плоскости переменной а. Для доказательства достаточно получить
разложение единицы по проекторам |а) (а|. Имеем
d2a|a)<a|=/e-H2 £ \п) (т\ ^== d2a.
J JrTLa vn! m!
{-. q m,n=0
Переходя к полярным координатам a = pe~%v, находим
fe-^2ana*md2a= f еГ"2pn+m+x dp j' e-«»-*»)<p dtp = n6nmnl,
С 0 0
откуда получаем искомое разложение единицы
1 = I Г \a) (a\ d2a.
Можно показать, что уже подмножество когерентных
состояний \а1т), соответствующее последовательности а1т = ч/п (I 4- im),
где I и т — целые числа, образует базис в гильбертовом пространстве.
Таким образом, система векторов \а) с непрерывно меняющимся a € С
является переполненной.
Рассмотрим теперь изменение во времени средних значений
координаты и импульса, если в начальный момент t = 0 система
находилась в состоянии |а). Проще всего воспользоваться гейзенберговской
картиной. Из уравнения (14.17) для операторов a(t) и o+(t) получаем
da(t) . da+(t) . +
—^- = -uoa(t), dtv = uja+(t),
откуда следует
a(t) = ae"*"*, a+(t) = a+eiut.
15.6. Склейка квазиклассических решений
193
Теперь нетрудно построить гейзенберговские операторы координаты
и импульса
*(*) = ^L («(*) + a+(t)) = ^ («е"*"* + aV*) ,
p{t) = -^ (a(t) - a+(t)) = -^ (ее"*-* - e+e*"*) .
При усреднении по когерентным состояниям имеем (а| а |а) = а,
(а| а+|а) = а*, поэтому, вводя модуль и фазу комплексного числа
a = pexp(i^j), будем иметь
{x)t = V2x0pcos(u>t — tp), {p)t = —V2p0psin(u>t — ip).
Легко видеть, что эти величины являются классическими решениями
уравнений для осциллятора, причем у/2рх0 играет роль амплитуды, а
<р — начальной фазы колебаний. Поскольку тшх0 = р0, то
выполняется соотношение
<P>t = m-(z)t.
Аналогичным образом можно проверить, что дисперсии
координат и импульсов в когерентных состояниях не зависят от времени и,
следовательно, минимизируют соотношение неопределенностей в
произвольный момент времени. Вычисления, аналогичные проведенным
выше, для величин
stx = V (x2)t ~ (x)t. StP = y<P2)t ~ <P)ti
приводят к результату
* sfr ** л/2'
так что
15.6. Склейка квазиклассических
решений в точках поворота
В квазиклассическом случае удается получить уравнение для
спектра энергий частицы в потенциальной яме, а также коэффициент
прохождения через потенциальный барьер в терминах чисто классических
7 - 8210
194
Глава 15. Одномерное движение
величин. Для этого необходимо произвести склейку решений
типа (14.42) в окрестности точек поворота.
Рассмотрим окрестность «правой> точки
поворота, как показано на рис. 15.6.
Классическое движение происходит в области
х ^ х0. Соответствующая волновая
функция была построена в п. 14.5, причем
следует учесть возможность обоих знаков при
извлечении корня в (14.41), что
соответствует волнам, бегущим вправо и влево:
Рис. 15.6. Правая точка
поворота
Ф:
Х<Хо
I . х°
dx +
Vp
exp
(15.27)
Здесь учтено, что укороченное действие в одномерном случае является
первообразной от импульса р = р(х), под которым в (15.27)
подразумевается положительное значение корня
р{х) = yj2m(E-U(x)).
(15.28)
Рассуждения, которые привели к формуле (14.42) для
квазиклассической волновой функции в классически доступной области движения,
могут быть повторены и для области U(x) > Е, в которой
классический импульс (15.28) становится чисто мнимой величиной. Оставляя
лишь экспоненциально затухающее решение, будем иметь
ф:
Х>Хо
D
ехр
\1»
dx
(15.29)
Хо
где символом |р| обозначена абсолютная величина (15.28) при х > х0,
т. е. \р\ = J2m (U(x) - Е). Оба выражения (15.27) и (15.29)
справедливы на достаточном удалении от точки поворота х0, и для того, чтобы
склеить их между собой, необходимы дополнительные соображения.
Одним из способов склейки является аналитическое продолжение
в комплексную плоскость координаты £ = х — х0. Квазиклассическое
приближение остается справедливым и при комплексных х вдали от
точки поворота, поэтому, обходя точку поворота £ = 0 в
комплексной области, можно перейти от решения (15.29) к решению (15.27) на
15.6. Склейка квазиклассических решений
195
вещественной оси. В правой линейной окрестности точки £ = 0 имеем
\p\=PZ
1/2
/3
[эй
= Vfe"
Полная комплексная плоскость переменной р соответствует
двулистной римановой поверхности переменной £, которую можно
параметризовать как £ = |£|eiv при -27г ^ ср ^ 27г. Вещественные значения
импульса слева от точки поворота отвечают <р = ±п, причем обход
точки £ = 0 в комплексной плоскости сверху (переход от ср = 0 к <р = 7г)
соответствует \р\ -»• £|f I^V*/2, а обход снизу — |р| ->■ Р\£\1/2е~™/2. С
учетом множителя А= получаем формулы склейки
Сг = De'*'*, С2 = De-™l*.
Заметим, что при обходе точки поворота в верхней полуплоскости
мы получаем лишь одно слагаемое в сумме (15.27). Потеря
информации о другом слагаемом связана с тем, что в верхней полуплоскости
оно становится экспоненциально малым. Чтобы обнаружить его
присутствие, необходим обход также в нижней полуплоскости.
Итак, получаем склеенную пару квазиклассических решений в виде
ф[х) = <
x<xQ,
X > Xq,
(15.30)
где нормировочный коэффициент перед косинусом выбран равным
единице.
Аналогичным образом можно
построить склеенную пару для левой точки
поворота, как показано на рис. 15.7. Оставляя в
области х < х0 лишь экспоненциально за-
\Щх)
тухающее решение, будем иметь
^COS(*I0Pdx ~«)'
ф(х) = <
х>х0,
X < Х„
(15.31)
Рис. 15.7. Левая
точка поворота
7*
196
Глава 15. Одномерное движение
Следует подчеркнуть, что склейку указанным методом
аналитического продолжения удается осуществить лишь для решений,
экспоненциально затухающих вне области классического движения; при этом в
классической области мы имеем полное отражение (амплитуды Сх и С2
по абсолютной величине равны). Аналитическое продолжение
экспоненциально растущего решения требует большей аккуратности, и мы
получим ниже соответствующие формулы с помощью другого приема.
Рассмотрим теперь движение частицы в потенциальной
яме (рис. 15.8). Бели внутри ямы
укладывается большое число дебройлевских
волн, то на достаточном удалении от
точек поворота решения (15.30) с х0 = х2
и решения (15.31) с х0 = х1 должны
[ [ совпадать внутри ямы с точностью до
xi х2 х знака, поскольку экспоненциальные «хво-
г>„„ 1 с о гг ™™„ _ сты» волновой функции вне классической
г"ис. 15.0. Потенциальная z,J ^^
области могут быть выбраны как с оди-
наковым, так и с различным знаком.
Отметим еще раз, что в состояниях дискретного спектра
одномерной задачи можно всегда выбрать волновую функцию вещественной.
Это следует из постоянства вронскиана, построенного из ф и ф*:
поскольку на ±оо вронскиан обращается в нуль, фиф* должны быть
пропорциональны, и, выбирая коэффициент пропорциональности
действительным, получаем искомый результат.
Приравнивая выражения (15.30) с х0 = х2 и (15.31) с х0 = хг
внутри ямы с точностью до знака, получаем условие квантования Во-
ра-Заммерфелъда:
fpdx = nh(n+^\, (15.32)
где п = 0,1,2,... Левая часть этого равенства равна половине
площади, ограниченной фазовой траекторией классического движения на
плоскости (р, х), поэтому соотношение (15.32) отличается от
формулы Бора (13.5) лишь добавкой 1/2. Поскольку при выводе (15.32)
использовано квазиклассическое приближение, справедливое вдали от
точек поворота, причем масштабом длины является дебройлевская
длина волны ~ h/p, легко понять, что условием применимости
формулы (15.32) является п » 1. Фактически квазиклассическое
приближение часто дает хороший результат и при относительно малых п.
В частности, для гармонического осциллятора U = тш2х2/2, х12 =
15.6. Склейка квазиклассических решений
197
±у/2Е/(тш2)
р{х) = ты{х\ - х2У2,
Щх)
и из (15.32) следует Еп = hu>(n + 1/2), что является точным
результатом при всех п.
Получим теперь формулу для
прохождения через потенциальный
барьер в квазиклассическом
приближении (рис. 15.9). Для этого нам необходимо
решение, склеенное в точках хг и х2,
которое в области х > х2 имеет вид чисто
прошедшей волны
Ф:
Х>Х2
D
ехр
pdx
(15.33)
Рис. 15.9. Потенциальный
барьер в
квазиклассическом приближении
В этом случае склеенных пар (15.30), (15.31) оказывается
недостаточно, поскольку решение (15.33) в подбарьерной области будет
содержать как экспоненциально убывающее, так и экспоненциально
растущее слагаемые. Необходимо поэтому построить вторые пары линейно
независимых решений, склеенных в окрестностях правой и левой
точек поворота. Рассмотрим случай_правой точки поворота, как
показано на рис. 15.6. Ищем решение ф в виде, аналогичном (15.30),
подбирая _фазу косинуса так, чтобы вронскиан, составленный из ф и ф,
\\Г(ф,ф) = фф' — фф' был постоянным при х < х0:
ф
^cosU J pdx + ж/А,
^«ф(*/1р1«ь),
В области х < х0 W = Й-1, а в области х > х0 W = А/Н, откуда
А = 1. Аналогичным образом можно построить второе решение для
левой точки поворота (рис. 15.7):
х < х.
х > хп
Ф=<
V5
cos
.л/bi
Ufpdx+n/A,
X > X,
0'
(15.34)
X \ Xn
Для решения задачи о прохождении через барьер необходимо взять
справа от барьера х > х2 соответствующую линейную комбинацию
198
Глава 15. Одномерное движение
(15.31) и (15.34), сводящуюся к (15.33). Далее решение следует
продолжить из подбарьерной области в область слева от точки ж15 где
оно будет иметь вид линейной комбинации
^»<»i
1
ехр I —- / pdx 1 -1-Сехр I - / pdx
(15.35)
где нормировочный коэффициент перед первым слагаемым для
удобства выбран равным единице, а С — постоянная, определяемая из
условий склейки. Первое слагаемое в (15.35) представляет собой волну,
движущуюся слева направо (падающую), второе — отраженную.
Результирующий коэффициент прохождения через барьер равен d = \D\2.
Опуская промежуточные вычисления, приведем окончательный
результат, справедливый с точностью до экспоненциально малых
членов:
Условие применимости квазиклассического приближения требует,
чтобы показатель экспоненты по абсолютной величине был велик. Таким
образом, в квазиклассическом пределе прохождение через
потенциальный барьер экспоненциально мало.
Глава 16
Трехмерные задачи
16.1. Момент количества движения
В классической механике момент импульса материальной точки
определяют как векторное произведение радиус-вектора на импульс:
L = [г х р]. (16.1)
Соответствующее произведение операторов координат и импульса
дает самосопряженный оператор, который в координатном
представлении имеет вид:
I = -(rxV].
г
Заметим, что в векторное произведение входят коммутирующие
между собой компоненты радиус-вектора и импульса, поэтому
произведение является самосопряженным оператором без дополнительной
симметризации:
Lx = -Aydz-zdy),
%
Ly = ^{zdx-xdz), (16.2)
Lz = ^(xdy-ydx).
Вычислив коммутаторы, нетрудно убедиться в том, что
компоненты момента образуют алгебру 50(3):
[Li>Lj] =ifieijkLk'
(16.3)
198
Глава 15. Одномерное движение
(15.31) и (15.34), сводящуюся к (15.33). Далее решение следует
продолжить из подбарьерной области в область слева от точки х1} где
оно будет иметь вид линейной комбинации
*
Х<Х\
Vp
ехр
pdx I + С ехр
pdx
(15.35)
где нормировочный коэффициент перед первым слагаемым для
удобства выбран равным единице, а С — постоянная, определяемая из
условий склейки. Первое слагаемое в (15.35) представляет собой волну,
движущуюся слева направо (падающую), второе — отраженную.
Результирующий коэффициент прохождения через барьер равен d = \D\2.
Опуская промежуточные вычисления, приведем окончательный
результат, справедливый с точностью до экспоненциально малых
членов:
■■ ехр
-\f\p\**
Условие применимости квазиклассического приближения требует,
чтобы показатель экспоненты по абсолютной величине был велик. Таким
образом, в квазиклассическом пределе прохождение через
потенциальный барьер экспоненциально мало.
Глава 16
Трехмерные задачи
16.1. Момент количества движения
В классической механике момент импульса материальной точки
определяют как векторное произведение радиус-вектора на импульс:
L = [г х р]. (16.1)
Соответствующее произведение операторов координат и импульса
дает самосопряясенный оператор, который в координатном
представлении имеет вид:
£=?[г х V].
г
Заметим, что в векторное произведение входят коммутирующие
между собой компоненты радиус-вектора и импульса, поэтому
произведение является самосопряженным оператором без дополнительной
симметризации:
Lx = -Aydx-zdy),
Ly = *(zdx-xdz), (16.2)
L, = *{x6y-vda).
Вычислив коммутаторы, нетрудно убедиться в том, что
компоненты момента образуют алгебру SO(3):
[Li>Lj}=ifcijkLk'
(16.3)
200 Глава 16. Трехмерные задачи
где etjk — символ Леви-Чивита, и, следовательно, являются
генераторами 50(3)-преобразований в пространстве волновых функций.
Действительно, при повороте системы на бесконечно малый угол Stp
координаты частиц изменяются следующим образом:
г ^>-г' = г + [6<р х г].
Тогда волновая функция испытывает преобразование
^(г') = гр(г) + [6<р х г] ■ W = Ф(г) + S(p[r х V]ip = (l + ^{S(p ■ Ь))ф.
В сферических координатах (г, 9, <р), определяемых соотношениями
х = г sin 9 cos (р, у = г sin 9 sin <p, z = rcosfl, удобно рассматривать
комплексные комбинации компонент Lx и L и проекцию на ось z:
L± = LX± iLy = He±i^(±de + ictg9 dj,
L, = %
Квадрат момента импульса
L2=L2x + L2y + L^-n2(^8eSin9ae + ^o%) (16.4)
представляет собой (с точностью до множителя — h2) оператор
Лапласа на единичной сфере. Будучи инвариантным относительно
вращений, этот оператор коммутирует со всеми компонентами момента и,
как отмечалось в 14.4, имеет общие собственные функции с одной из
компонент, в качестве которой удобно выбрать Lz. Чтобы определить
спектр операторов L2 и Lz, можно воспользоваться алгебраическим
построением, аналогичным использованному в 15.5 для
гармонического осциллятора.
Представим L2 в виде
L? = L_L+ + L2Z + KLZ (16.5)
и покажем, что величины L± являются лестничными операторами в
пространстве общих собственных векторов операторов L2, Ьг,
удовлетворяющих уравнениям
£2|A,m,) = Aft2|A,m,),
Lz |A, 77lj) = hmi |A, T7lj) ,
16.1. Момент количества движения 201
где ml и А — безразмерные собственные значения. В силу
коммутационных соотношений
[Lz,L±] = ±hL±
состояния L± |A, щ) также являются собственными векторами
оператора Lz с собственными значениями ft(mj ± 1):
LZ(L± |A,m,» = L±La |A,m,> + [LZ,L±] |A,m,> = ft(m, ± l)(i± |A,m,».
Таким образом, начав с некоторого щ, будем получать
последовательность возрастающих и убывающих собственных значений с единичным
шагом. Однако, как следует из равенства
L2Z = L2-(L2X+L2y), (16.6)
при фиксированном А спектр Lz ограничен сверху и снизу, так что
существует некоторое максимальное положительное значение mlmax =
I, такое, что
Ь+|А,/) = 0.
Применяя к вектору |А, I) оператор L2, представленный в виде (16.5),
получаем
Х = 1(1 + 1).
В силу симметрии (16.6) относительно инверсии Lz —>■ — Lz существует
также минимальное значение т,, равное —/, при котором
L_ |A, -/) = 0.
Состояние |А, —I) достигается повторным применением оператора L_ к
состоянию |А, /) через 21 единичных шагов. Таким образом, число 21+1
целое, и, значит, I может быть целым или полуцелым. Для векторов
\Щ + 1), mj) принята также более краткая запись \1, тп():
L2|J,m,)=ft2/(J + l)|J,m,).
Итак, мы показали, что из коммутационных соотношений для
компонент момента количества движения следует, что собственные
значения оператора Ьг — целые либо полуцелые числа; при получении
этого результата не использовалось явное координатное
представление (16.2). Однако требование однозначности собственных функций
оператора Lz в координатном представлении (9,<р\1,щ) = Ylmi(9,<p),
удовлетворяющих уравнению
L.Ylmi (9, <р) = jd¥Ylmi (9, V) = hmiYlmi (9, <р), (16.7)
202 Глава 16. Трехмерные задачи
приводит к заключению о целочисленности собственных значений т{.
Действительно, из (16.7) следует, что
где азимутальный угол <р € [0, 27г]. Из равенства Ylmi (в,<р + 2тт) =
Ylm (в, ф) вытекает, что щ = 0, ±1, ±2,...
В координатном представлении функции Ylmi (в, tp) в (16.8)
удовлетворяют уравнению на собственные значения для оператора L2,
записанного в виде (16.4), откуда находим для 6Jm((0) уравнение
^6 Hoaeelmi) + -£Lelmi = -i(i + i)eJmi.
Регулярные на сфере решения этого уравнения называются
присоединенными полиномами Лежандра:
^lm,W = NlmiPr(coSe),
где Nlm — нормировочный коэффициент, а для Р/"' (cos в) при тп, ^ 0
имеет место производящее выражение
Т(-*) = ^(-*)Г (j^e)l+m' С-»')*-
Нормировочный коэффициент выбирается так, чтобы выполнялось
соотношение ортонормированности Ylmi (в, <р) на единичной сфере:
/:
*ft»{ («, 4>)Ylmi (e, <р) sine d6d<p = 5u,Smim,.
Для этого при ml ^ 0 можно положить
W. ч>) = (-Dr*^^1} [{ЩрГ(™*Ут", (16-9)
используя для распространения на отрицательные mt соотношение
n-mi=(-l)'-m'l?m,- (16Л°)
Функции Ylm , определенные таким образом, называются шаровыми
функциями или сферическими гармониками. Приведем явные
выражения для низших гармоник:
16.2. Движение в центральном поле
203
Заметим, что выбор фазового множителя в (16.9) не является
однозначным, данное определение принято в курсе Ландау-Лифшица.
Шаровые функции Ylmi при фиксированном I = 0,1,2,... и \тп,\ < I
образуют неприводимые представления группы вращений SO(3).
Исходя из алгебраических соотношений между операторами компонент
момента, мы нашли, что возможны также полуцелые / и т..
С математической точки зрения соответствующие векторы \l, mt)
образуют неприводимые представления SU(2) — универсальной
накрывающей группы вращений (напомним, что SO(3) = SU{2)/X2).
Далее мы увидим, что эти представления также физически реализуются,
описывая состояния частиц, обладающих полуцелым внутренним
моментом количества движения — спином. Для спинового момента уже
не существует координатного представления в виде
дифференциальными операторами. Оператор момента, задаваемый формулой (16.1),
принято называть орбитальным.
16.2. Движение в центральном поле
Если потенциальная энергия U(r) зависит только от абсолютной
величины вектора г = |г|, то гамильтониан Н коммутирует с
операторами проекций орбитального момента: [Н, L4] = 0, т. е. момент
является интегралом движения (см. 14.3). Удобный базис в пространстве
состояний может быть построен из обпщх собственных векторов трех
коммутирующих наблюдаемых Н, L2, Lz. В координатном
представлении соответствующие волновые функции представимы в виде
произведения сферических гармоник Ylm (в, ср) на. функции радиальной
координаты R(r):
i>Elmi(r) = REl(r)Ylmi(9,<p).
Эти функции удовлетворяют соотношениям
L24>Elmt = Я*1(1 + 1)1*Я1т|, (16.11)
Lz^Elm, = ЬЩФттг (16.12)
HrPElmi = ЕфЕ1т1, (16.13)
последнее из которых (уравнение Шредингера) превращается в
уравнение для радиальной функции REl (г). Действительно, записывая
оператор Лапласа в выражении для Н
204 Глава 16. Трехмерные задачи
в сферических координатах:
а=£аг(гЧ)+^(^(-»*ад+-^*) = %+2-дг
с учетом (16.11) из (16.13) получаем
K2i
R'k + -rRm + f?(^ - и9фф)ИВ1 = 0, (16.14)
где эффективная потенциальная энергия равна
9фф 2mr2 K '
Заметим, что азимутальное квантовое число щ не входит в
радиальное уравнение, поэтому собственные значения энергии одинаковы
для всех rrij, т.е. имеет место вырождение энергии по т^ Это
вырождение можно связать с существованием некоммутирующих между
собой интегралов движения. Полезно остановиться на этом подробнее.
Пусть две наблюдаемые А, В коммутируют с гамильтонианом, но не
коммутируют между собой:
[Н,А) = 0 = [Н,В],
[А,В]фО.
Тогда существует полная сстема общих собственных функций двух
операторов Н, А: Н<раВ = Е<раЕ, А<раЕ = а<раЕ. Построим теперь
множество состояний В<раЕ. Поскольку В коммутирует с Н, имеем
Н{В<раЕ) = ВН<раЕ = Е(В<раВ),
т. е. BtpaE также является собственной функцией оператора Н с тем
же собственным значением Е. Поскольку А и В не коммутируют, то
они не имеют достаточного числа общих собственных функций,
откуда следует, что В<раЕ и <раЕ — различные собственные функции Н.
В налаем случае в качестве А я В можно взять Lz и L+ либо Lz и
L_. Тогда, действуя многократно операторами L+ (L_) на общие
собственные функции Н и Lz, получим все функции с различными щ,
допустимыми при заданном значении числа I: |т41 ^ /. Таким образом,
в центральном поле уровни энергии дискретного спектра вырождены
по крайней мере с кратностью 21 + 1.
Уравнение (16.14) называется радиальным уравнением Шрединге-
ра. С помощью подстановки R = xlT оно приводится к виду
одномерного уравнения Шредингера с эффективной потенциальной
энергией (16.15):
х»+^(Е-иэфф)Х = 0, (16.16)
16.2. Движение в центральном поле
205
которое, однако, теперь определено на полупрямой г е [0, оо).
Исходная радиальная функция в состояниях дискретного спектра R е
L2([0,оо),г2dr), поскольку скалярное произведение трехмерных
волновых функций из L2 (М3, d3x) приводит в сферических координатах
к интегралу от радиальных функций R(r) с весом г2. Функции х(г)
интегрируются без веса, т. е. х € L2([0, оо),dr).
Второе слагаемое (16.15) представляет собой центробежный
барьер, возникающий при отличном от нуля значении орбитального
момента. Бели
lim r2U(r) = 0, (16.17)
то это слагаемое доминирует при малых г, и в уравнении (16.16) для х
имеется точка поворота, препятствующая «классическому»
проникновению частицы в точку г = 0. Бели U(oo) = 0 (что обычно
предполагается), то эффективная потенциальная энергия имеет характерный вид,
показанный на рис. 16.1. При Е < 0 имеем две точки поворота, спектр
энергий дискретный и ограничен снизу (либо пуст). При Е > 0
имеется одна точка поворота, частица может уходить на бесконечность,
этот участок спектра непрерывный.
Если U{r) —> —оо при г —> 0 быстрее, чем (минус) обратный
квадрат радиуса, то эффективный потенциал также стремится к —оо,
и левой точки поворота нет — в
классической механике происходит падение
на центр. Спектр энергии оператора
Гамильтона при этом будет не ограничен
снизу. Такая ситуация означает падение
на центр. Промежуточный случай
представляет собой стремление U{r) к —оо
как —г-2. Тогда введем параметр
v 2тг2тт
Рис. 16.1. Связанные
состояния в центральном поле
Если 7 < 1/4, то при г —> 0 два линейно
независимых решения уравнения (16.16) имеют степенной характер:
X~rs±, s± = \ (l ± y/T=*fy ,
при этом х(0) =0 Для обоих решений, поэтому симметрический
оператор Н может быть определен как самосопряженный. Если 7 > 1/4,
то характеристические числа s± становятся комплексными, так что
вещественное решение является осциллирующим:
X ~ \/rsm (1/7 — 1/4 lnr + qJ ,
i
206
Глава 16. Трехмерные задачи
где a = const. Эта функция имеет бесконечное число нулей, в то время
как волновая функция основного состояния не должна иметь нулей
вовсе. Таким образом, спектр энергии не может быть ограничен снизу.
Критическое значение 7> отделяющее область падения на центр, есть
7 = 1/4.
Для «хороших» потенциалов, удовлетворяющих условию (16.17) в
начале координат, доминирующим при г —► 0 является центробежный
потенциал, и общее асимптотическое решение уравнения (16.16) имеет
вид
X ~ Сгг1+1 + С2г~1. (16.18)
Квадратично интегрируемые функции с I Ф 1 должны иметь С2 — 0.
При I = 1 второе слагаемое также следует отбросить, поскольку
R ~ 1/г, и действие оператора Лапласа на эту функцию приводило
бы к сингулярности S3(r), поэтому такая функция не входит в
область определения гамильтониана как самосопряженного оператора.
Итак, правильное поведение радиальной функции в начале координат
есть R ~ г' при всех /.
Рассмотрим простейший случай свободного движения U = 0.
Уравнение для радиальной функции принимает вид
R'M + ~R'kl + ( *2 ^2 J Rkl = °>
где к2 = 2тЕ/Н2. Его решением являются сферические функции
Бесселя и Неймана
Вы = CJiikr) + Сяп,{кг),
связанные с функциями Бесселя полуцелого индекса:
Л(*) = у Jj|+i/a(«).
n,W = y^J-i-1/2(*)(-l)l+1.
Эти функции выражаются через элементарные следующим образом:
„<•) = (-.)<«,' (!£)'=*. (16.20,
При малых z
Ш-z1, n{(z)~z-('+1),
26.2. Движение в центральном поле
207
поэтому ограниченное решение соответствует С2 = 0. При г>! имеем
j,(z)~icoe[z-J(* + l)], n,(x) ~ I яш[* - J(/ + 1)]. (16.21)
Итак, общее решение стационарного уравнения Шредингера для
свободной частицы, представленное в виде разложения по
сферическим гармоникам (по состояниям с определенным значением квадрата
орбитального момента и одной из его проекций), имеет вид
оо
^И = £ £ CirnMWimtf'V)' (16-22)
где к,г — длины векторов к,г. В частности, в таком виде можно
представить и плоскую волну:
е«" = 4тг £ £ ilMkr)Y:mi (k)Ylmi (f), (16.23)
1=0 |m,|<J
где к = fe/|fc|, г = **/|г|. Это выражение с учетом соотношения (16.10)
симметрично относительно векторов /гиг.
Рассмотрим теперь простейший случай сферической
потенциальной ямы с бесконечными стенками:
и= |0' Г<а'
^оо, г > а.
Так же как и в одномерном случае, в точке г = а должно выполняться
граничное условие Д(а) = 0 (и далее R = 0 при г > а). Решение внутри
ямы имеет вид (16.22), учитывая граничное условие, получаем
Ji(ka)=0,
откуда А; = znl/a, где гы — n-й нуль сферической функции Бесселя
jj. Таким образом, дискретный спектр энергий Е^ = ft2z2j/(2ma2)
образует двулараметрическое семейство. Основное состояние отвечает
I = 0 и является сферически- симметричным. Из формулы (16.19)
имеем
. ., . sinfcr
*>(**•) = -ТГ,
причем к является минимальным корнем уравнения sin ka = 0: к =
7r/a. Таким образом, основное состояние имеет ту же энергию, что и в
соответствующей одномерной задаче.
i
208
Глава 16. Трехмерные задачи
Рассмотрим теперь связанные состояния в потенциальной яме
конечной высоты:
U(r) = -Uo0(a-r), U0>0,
ограничиваясь нулевым значением орбитального момента 1=0. Для
радиальной функции, склеенной в точке а, получаем
R = с (^^в(а - г) + e-*fr->fl(r - а)) ,
\smxa /
где Е = -h2k2/(2m), Щ + Е = К2*2/(2т). Спшвание производной в
точке г = а дает условие квантования
ctgxa =
(16.24)
Нетрудно показать, что при
(16.25)
уравнение (16.24) не имеет решений, т. е. связанных состояний нет. Уже
из физических соображений ясно, что состояние с минимальной
энергией соответствует I = 0, поэтому при условии (16.25) дискретный
спектр энергий вовсе пуст. Условие (16.25) можно истолковать с
позиций соотношения неопределенностей так: неопределенность
кинетической энергии частицы в очень мелкой сферической яме
оказывается больше ее глубины, и частица не может удерживаться в яме. Для
сравнения заметим, что в одномерной яме всегда имеется хотя бы один
уровень.
Для обозначения состояний с различными значениями
орбитального квантового числа I принята следующая символика:
/ =
S
0
Р
1
d
2
f
3
g
4
Радиальное уравнение Шредингера (16.16) формально не
отличается от одномерного уравнения Шредингера, поэтому к нему также
можно попытаться применить квазиклассическое приближение описанное
в п. 15.6. Однако в данном случае левая точка поворота, определяемая
центробежным членом 1(1 + 1)/г2, лежит вблизи особенности г = 0,
поэтому формулы сшивания нельзя использовать непосредственно. Для
разрешения особенности можно воспользоваться заменой независимой
переменной г = ехрр, а также положить х = у/ти(р). В результате
получим одномерное уравнение Шредингера на полной оси, к которому
16.3. Рассеяние
209
можно применить квазиклассическое приближение в стандартном
виде. Явное вычисление показывает, что при этом центробежный член в
эффективном потенциале изменяется следующим образом
1(1 + 1) -> (J + 1/2)2. (16.26)
После такой замены формулу Бора—Зоммерфельда для связанных
состояний можно применять и к радиальному движению.
16.3. Рассеяние
Рассеянием в классической механике называют отклонение частиц
от первоначального направления при столкновении с мишенью.
Если взаимодействие осуществляется посредством потенциала, то
задача сводится к определению инфинитных траекторий в поле
рассеивающего центра. В квантовой механике задача рассеяния может быть
поставлена двумя способами. Наиболее близким к классическому
является описание рассеяния на языке движения волновых пакетов.
Более просто, однако, рассматривать стационарную картину рассеяния.
В этом случае речь идет о построении решения стационарного
уравнения Шредингера в поле рассеивающего центра U(r), которое
предполагается убывающим на бесконечности, U(oo) = 0 (более точно
условие убывания U (г) при г^оо будет сформулировано ниже), такого,
что при \г\ —> со волновая функция имеет вид
фп(г) » eifc<nr> + -f(n,n')eikr. (16.27)
Здесь к — волновое число (Е = К2к2/(2т)), n — единичный
вектор вдоль исходного направления движения частицы (падающая
волна), п' — единичный вектор вдоль направления рассеянной частицы,
г = п'т (рассеянная волна). Решение (16.27) является суперпозицией
плоской падающей волны и сферических рассеянных волн, комплекс-
нозначная функция f(n, п') называется амплитудой рассеяния. Она
удовлетворяет свободному уравнению Шредингера, для второго
слагаемого это следует из асимптотического представления решения с
помощью формул (16.21), (16.22).
Отношение потока вероятности через площадку r2dSln, в
направлении п' к падающему потоку через единичную площадку
называется дифференциальным сечением рассеяния, соответствующие потоки
следует вычислять при |г| —¥ оо. Воспользовавшись формулой (14.38)
для плотности тока вероятности, получим
do-=\f(n,n')\2dnn,.
210 Глава 16. Трехмерные задачи
Полное сечение рассеяния является интегралом от этой величины:
<r = J\f(n,n')\2diln,. (16.28)
Рассмотрим далее случай центрального поля. Если выбрать
направление падающей волны в качестве оси z, п = (0,0,1), то
рассеянная волна будет зависеть только от полярного угла 9 (z = г cos 9) и
вместо (16.27) будем иметь в асимптотической области
г
а дифференциальное сечение для рассеяния в интервал углов сШ
примет вид
da = 2тг sin 9\/(в)\2сШ. (16.30)
Решения уравнения Шредингера, не зависящие от азимутального угла
tp, выражаются в виде разложения по полиномам Лежандра
^^ = ^0-
удовлетворяющим соотношению ортогональности
/ P,(cos0)P,,(cos0)sin0d0 = -—-5W. (16.31)
о
Рассмотрим суперпозицию общего вида
оо
Яг,в) = £ОДы(г)Р,(сов0), (16.32)
1=1
где Rkl{r) — радиальные функции непрерывного спектра,
удовлетворяющие уравнению (16.14). При г —> оо движение становится
свободным, поэтому асимптотически Rkl ведут себя, как суперпозиция
решений jiikr) и щ(кг) свободного уравнения Шредингера. С учетом
формул (16.21) можем написать при г —> оо
Rkl (г) ри - sin (кг - у + бЛ . (16.33)
Величины St называются фазами рассеяния. Разлагая падающую
волну по полиномам Лежандра с помощью (16.23), получаем
асимптотическое разложение, справедливое при г —> 0:
e»'fcz
" 2ikr ,
1=0
1 °°
~ 5^(2/ + 1) [eikr + е-<(*'+'('+1))] Рг(сов0).
16.3. Рассеяние
211
Подставляя (16.33) в (16.32) и сравнивая с асимптотической
формулой (16.29), находим
При этом амплитуда рассеяния в (16.29) приобретает следующий вид:
/(*) = 2lk £(2i + 1)(е2"' ~ 1)Pi(cos^)- (16-34)
Подставляя (16.34) в (16.30) и производя интегрирование с помощью
(16.31), находим следующее выражение для полного сечения рассеяния
через фазы St:
as"s X)(2Z + *)sin2 *«■ <16-35)
1=0
Поскольку РД1) = 1, для амплитуды рассеяния из (16.34) получаем
/(0)=2^£(2/ + 1)(е2"'_1)'
откуда легко проверить выполнение соотношения
Im/(n,n) = ^-<r, (16.36)
47Г
называемого оптической теоремой, которое выполняется и в поле, не
имеющем сферической симметрии.
Если потенциал имеет малый радиус действия (быстро
убывает при г > а), то в разложении амплитуды рассеяния по
парциальным волнам (16.34) будут участвовать в основном малые /.
Действительно, центробежный потенциал выталкивает частицу в область
г, > Нл/1(1 + 1)/(2т). Если радиус действия меньше г,, то
соответствующая парциальная волна экспоненциально мала в области влияния
потенциала. Поэтому парциальные волны с номером /,
удовлетворяющим неравенству ка < у/1(1 + 1), практически не дают вклада в
рассеяние (здесь учтено, что Е » И2к2/(2т) при г > а). В это соотношение
входит также волновое число к, поэтому при малых энергиях А; —>• 0
эти соотношения также справедливы. При к —> 0 основной вклад дает
сферическая волна 1 — 0: если записать
50 = —kb,
212
Глава 16. Трехмерные задачи
где Ь — длина рассеяния, то будем иметь
а « 47гЬ2.
Можно показать, что при малых энергиях 5l ~ А;2'"1"1. В случае
рассеяния на потенциальной яме (рис. 16.1) получаем
b = Jth^a_ \
V. ^оа /
Если, напротив, потенциал имеет очень большой радиус действия,
иначе говоря, убывает на бесконечности недостаточно быстро, то
фазы St также могут убывать с ростом / недостаточно быстро и
полное сечение рассеяния будет расходиться. Можно показать, что если
lira г U(г) = 0 при г —> со, то полное сечение конечно, а если убывание
более медленное, то бесконечно. Это связано с тем, что при медленном
убывании поля становится большой вероятность рассеяния вперед (ср.
с (16.36)). В частности, это имеет место для кулонова поля U ~ 1/г.
В реальных физических ситуациях кулоновский потенциал
экранируется на больших расстояниях другими зарядами.
16.4. Кулоново поле
Особый интерес представляет движение в кулоновом поле
г
где a > 0 отвечает притяжению, а а < 0 — отталкиванию.
Классификация состояний электрона в кулоновом поле имеет решающее
значение для понимания структуры многоэлектронных атомов (подробнее
это будет обсуждаться в 19.3). Состояния непрерывного спектра
описывают рассеяние заряженных частиц атомными ядрами.
Радиальное уравнение Шредингера (16.14) в кулоновом поле
притяжения для случая связанных состояний (Е < 0) может быть
записано в виде
я» + ^к + (1 _ <СЩ>) 5* _ k*Rkl = о, (1б.37)
где k2 = —2mE/h2 игв= ft2/(та) — боровский радиус. Удобно
перейти к безразмерной переменной х = 2кт, а также ввести новую функцию
Ф(х), выделив регулярные асимптотики при малых (xJ) и при больпшх
(е~х/2) значениях аргумента х:
R = ЛГх'е-х/2Ф(х). (16.38)
16.4. Кулоново поле
213
В состояниях дискретного спектра функция Ф должна быть регулярна
в начале координат и не должна возрастать на бесконечности быстрее,
чем ех/2. Подстановка (16.38) в (16.37) приводит к уравнению Куммера
для функции Ф:
хФ" + (/3 - х)Ф' - 7* = 0, (16.39)
где штрихом обозначены производные по х и введены постоянные
параметры
0 = 2(Z + 1), 1 = l + l--^r.
Регулярным при х = 0 решением уравнения (16.39) является
вырожденный гипергеометрический ряд
Ф = Ф{ъМ = 1 + 1х + ^±^^ + ... (16.40)
Это решение в случае общих значений параметров 7, P не имеет
требуемого вида на бесконечности, а именно Ф ~ ех. Однако из
формулы (16.40) видно, что если у является отрицательным целым числом
или нулем, 7 = -пг, пг = 0,1,2,..., то ряд (16.40) обрывается на пг-й
степени х. Результирующая функция R будет квадратично
интегрируемой на полуоси с весом г2, что и требуется от функций дискретного
спектра. Условие обрыва ряда
7 = J + l-J- = -nr (16.41)
ктв
(п называется радиальным квантовым числом) приводит к
квантованию энергии:
Е» = ~2^'
где
„ = nr+Z + l (16-42)
— главное квантовое число, принимающее натуральные значения п =
1,2,3,... Поскольку два целых числа пг и I входят в выражение для
п в виде суммы, возникает дополнительное вырождение уровней
энергии, помимо общего для любого центрального поля вырождения по
азимутальному квантовому числу т,. При заданном п орбитальное
квантовое число I может изменяться от нуля до п - 1, поэтому полная
кратность вырождения дп уровня с заданным п равна
п-1
з„ = Е(2'+1) = п2-
1=0
214
Глава 16. Трехмерные задачи
Вырожденная гипергеометрическая функция (16.40) при условии
обрыва ряда становится полиномом, принадлежащим семейству
обобщенных полиномов Лагерра
где (р — q) — положительное целое число или нуль. Таким образом,
радиальную функцию дискретного спектра можно записать в виде
где нормировочная постоянная, определяемая из условия
/■
>2 _2
KiSdr = l,
равна
_ 2 [(n-f-l)l]V
,п П2 [(п + /)!]3/2 •
Аргумент х в силу условий квантования (16.41), (16.42) равен
2г
х = ,
птв
поэтому экспоненциальное убывание волновой функции при больших
х означает, что г < пгв. Известны интегралы от квадрата
вырожденной гипергеометрической функции со степенью х, с их помощью
можно вычислить математическое ожидание радиальной координаты:
<*•> = /r^dr =Tf (3n2 -1(1 + 1)) ,
о
что на первый взгляд противоречит квазиклассической интерпретации
уровней энергии. Однако, математическое ожидание обратного
радиуса в точности воспроизводит желаемый результат:
\г/ гп2
Таким образом, среднее значение потенциальной энергии а/г равно
удвоенному собственному значению энергии, как и в классической
теории.
16.4. Кулоново поле
215
Представляет интерес выяснить природу дополнительного
вырождения уровней энергии в кулоновом поле, называемого «случайным».
Как мы видели в 16.2, вырождение собственных значений
гамильтониана связано с существованием не коммутирующих между собой
интегралов движения. Случайное вырождение можно связать с
дополнительным векторным интегралом движения в кулоновом поле,
известным в классической механике как вектор Лапласа-Рунге-Ленца:
р х L — L х р аг
2m r
где в первом слагаемом проведена симметризация в порядке
следования операторов импульса и орбитального момента для обеспечения
самосопряженности оператора А. В квантовой механике сохранение
этой величины означает ее коммутативность с гамильтонианом
n- p2 a
я-2^"7'
что может быть проверено непосредственно. Коммутаторы компонент
А с компонентами момента L соответствуют векторной природе
величины А:
[Ь^Ак\=1ПешАи (16.43)
а коммутаторы их между собой имеют вид
\.^Ak\ = ^eiklLlH. (16.44)
Кроме того, поскольку обращаются в нуль скалярные произведения
р • L = 0, г • L = 0, имеем L • А = 0. В результате получаем, что на
множестве собственных векторов гамильтониана Н с собственными
значениями Е = —ft2к2/(2т)) операторы
л<« = 1(£±^)
имеют одинаковые квадраты
^-f-.-H^cs)"*)-
Подстановка явных значений операторов приводит к формуле
■*♦.--*>-*((£)'-*)• <m45)
216
Глава 16. Трехмерные задачи
Далее, с помощью коммутационных соотношений (16.43), (16.44)
находим
[J(±)i'J(±)fc] = itUjklJ{±)U
[J(+)j'J(-)fc] = 0-
Отсюда следует, что кулоновская задача имеет симметрию более
широкую, чем so(3): операторы J^ и J(_) порождают две независимые
алгебры so(3), так что полная симметрия есть so(3) x so(3) ~ so(4).
Собственные значения J?±> одинаковы я равны h2j(j + l), где j = 0,1,2,...
Подставляя их в (16.45), находим соответствующие значения энергии
Е =
ft2*2
та
.2
2т 2h2(2j + 1)2'
Таким образом, главное квантовое число п связано с j соотношением
п = 2j + 1.
Обратимся теперь к состояниям непрерывного спектра. В
радиальном уравнении (16.37) при этом следует изменить знак перед
последним слагаемым, полагая к2 = 2тЕ/Н2. Комплексная замена
независимой переменной у = —2ikr и радиальной функции R = N(2kr)leikr&(y)
приводит снова к уравнению Куммера (16.39) со значениями
параметров
7 = ' + 1 + т^-, 0 = 2(1+1).
Необходимо, как и ранее, выбрать решение уравнения (16.39),
регулярное в начале координат, т.е. вырожденный гипергеометрический
ряд (16.40). Теперь, однако, условие на бесконечности не накладывает
каких-либо ограничений на параметры: радиальная функция
остается ограниченной при всех вещественных к. Таким образом, искомая
радиальная функция есть
Д*« = ЛГы(2*г)'е*Ф (1 + 1 + i/(krj, 2(1 + 1); -2tfcr) .
Вычислим фазы рассеяния в кулоновом поле, представив
асимптотику радиальной функции при больших г в виде (16.33). Для этого
воспользуемся асимптотической формулой, справедливой при |х| » |/3|,
М>Ы,0/-п, п = 0,1,2,...:
В результате находим
^-Т-^М2*г)+«8г(1+1+]^)].
х, 2 .
R » -8Ш
г
16.4. Кулошово поле
217
Заметим, что переход к свободному движению осуществляется при
г —>■ со. При всех конечных тв «фазы рассеяния» в кулоновом
поле оказываются логарифмическими функциями радиальной
переменной, т. е. фактически St —> со. Из формулы (16.35) следует, что при
этом полное сечение и, следовательно, амплитуда рассеяния вперед
будут бесконечны. Однако при всех ненулевых 9 амплитуда
рассеяния конечна и может быть вычислена с помощью следующего приема.
В выражении (16.34) при 9 ф 0 можно опустить единицу в разности
е2**' — 1, используя условие полноты для полиномов Лежандра
1 °°
- ^(21 + l)P,(cosO) = S(l - cos 0),
4«=о
где справа стоит дельта-функция равная нулю при cos 9 ф 1. Далее,
не изменяя |/(0)|, можно заменить 5{ —*• 5г — 50, при этом f(9) лишь
умножится на фазовый множитель. Так как зависящее от г слагаемое
в выражении для кулоновской фазы не зависит от I, то
логарифмический член исчезнет и мы будем иметь
*z-*0=argr(*+l+^)-argr(l + ^).
Поскольку второе слагаемое здесь не зависит от I, оно также может
быть опущено в силу аналогичных рассуждений. Итак, для амплитуды
рассеяния при 9 ф0 находим
1 ~ rfz + l + jgi-)
"•> " sS<" + 1)r(, + .-,£)i№-')-
1 r(1+*fc) ( 2г , . в\
= ~ ) 2-fexp --—msin- ,
2fc2 sin2 0/2 Г (l-^) V Ч V
где использованы формулы суммирования для полиномов Лежандра.
Соответствующее дифференциальное сечение рассеяния
da _ a2m2
dYi ~ 4р4 sin4 0/2'
где р = hk — асимптотическое значение импульса, не зависит от ft и
совпадает с классической формулой Резерфорда.
В заключение отметим, что уравнение Шредингера в кулоновом
поле допускает разделение переменных также в параболических
координатах £ = г + z, т] = г — z, (р (где г — сферический радиус), в
218
Глава 16. Трехмерные задачи
которых волновая функция также выражается через вырожденные
гипергеометрические ряды. Это решение более удобно для описания
рассеяния.
16.5. Заряд в электромагнитном поле
Функция Гамильтона нерелятивистского заряда е, движущегося в
электромагнитном поле Е, В, задаваемом скалярным <р и векторным
А потенциалами (В = rot А, Е = —V<p - \j£), имеет вид
H=L(p-1A+^
где Р — обобщенный (канонический) импульс, с — скорость света.
Для построения соответствующего оператора в координатном
представлении необходимо записать гамильтониан в симметричной форме
относительно Р и А:
Н = 2b(-ft2A + V(VA+^ + ?A2)+^ =
= ^(-^A + f^AV + div^ + ^+e,,.
Выбором калибровки потенциалов div А можно обратить в нуль.
Следует иметь в виду, что в квантовой механике калибровочное
преобразование является преобразованием симметрии только при
одновременном преобразовании фазы волновой функции. А именно, если
А' = А + V/, iff = <р - I %, (16.46)
с at
ф' = фехр-£-, (16.47)
где f = f(r,t), то уравнения Шредингера для ф' и ф
где Н' гамильтониан в терминах штрихованных потенциалов,
эквивалентны. На самом деле логика этого утверждения несколько иная.
Умножение волновой функции на комплексное число е*а, по модулю
равное единице, как мы знаем, не изменяет состояния, и новая
волновая функция будет удовлетворять тому же уравнению Шредингера,
16.5. Заряд в электромагнитном поле
219
что и прежняя. Иначе можно сказать, что это преобразование
является (тривиальным) преобразованием симметрии гамильтониана. Если
считать, что фаза а лежит на интервале [0,2п], то подобные
преобразования будут образовывать группу U(l). Рассмотрим теперь
преобразования (16.47) с фазовым множителем /(г, t), зависящим от
координат и времени. При таком локальном действии С/(1)-преобразований
свободное уравнение Шредингера (при А = 0 = <р) уже не остается
инвариантным. Можно, однако, восстановить инвариантность, вводя
взаимодействие с электромагнитным полем посредством потенциалов
А, <р, подчиняющихся при преобразовании (16.47) волновой функции
калибровочным преобразованиям (16.46). Этот принцип введения
взаимодействия называется калибровочным.
Уравнение Шредингера для заряда в электромагнитном поле
приводит к уравнению непрерывности (14.39) для плотности и тока
вероятности, причем выражение для плотности вероятности не изменяется,
а плотность тока будет иметь вид
j = 7^-\ф*{Чф--Аф)-ф{Чф* + -Аф*)] = ^ + —Аф*ф, (16.48)
2тп%L с с тс
где j0 — прежнее выражение (14.38). Плотность тока (16.48) не
изменяется при калибровочном преобразовании (16.46), (16.47).
Рассмотрим более подробно стационарные состояния электрона в
однородном магнитном поле. Вектор-потенциал можно выбрать
различными способами, при этом уравнение Шредингера будет допускать
разделение переменных в разных системах координат. Если выбрать
ось z вдоль направления магнитного поля В и положить
А- (0,Вж,0),
то возможно разделение переменных в декартовых координатах.
Гамильтониан
коммутирует 'с операторами Р и Pz и, следовательно, имеет
одновременно с ними определенные собственные значения. Ищем волновую
функцию в виде произведения собственных функций операторов Ру,
Pz на некоторую функцию от переменной х:
Ф(х, у, z) = — е^+^/^х), (16.49)
тогда из стационарного уравнения Шредингера Нф — Еф находим
2тХ 2т V у с ) К \ 2т)Х
220 Глава 16. Трехмерные задачи
Это уравнение после замены аргумента х' = х — -^ приводится к
уравнению для одномерного гармонического осциллятора,
нормируемое решение которого имеет вид
Хп(х') = Y e-*"^Hn (£) ,
где х0 = \lh/{mwB), шв = еВ/тс — циклотронная частота, п =
0,1,2,... Собственные значения энергии равны
Ер^=^+^в(п+1/2).
Таким образом, энергия состоит из непрерывно изменяющейся энергии
продольного движения и дискретной части, отвечающей вращению в
поперечной плоскости.
Стационарные состояния (16.49) не обладают цилиндрической
симметрией, поскольку вектор-потенциал и, следовательно, гамильтониан
выбраны явно асимметричным образом относительно перестановки х и
у. Альтернативная калибровка
А=^(-у,х,0) (16.50)
приводит к другой классификации стационарных состояний. В этом
случае задача допускает разделение переменных в цилиндрических
координатах. Выражение (16.50) эквивалентно
\ = ~2-> АР = Az = °' гДе Р = V*2 + У2,
при этом координаты <р и z циклические. Поэтому решение
стационарного уравнения Шредингера можно представить в виде
произведения собственных функций операторов Pz и Lz = —ihd на некоторые
функции радиальной переменной
■ф .= —!-=eim"<'+iP'z/hR(p).
27rvfe
Дня радиальной функции из уравнения Нф = Еф получаем
"•♦HS(*-£)-(S)'-
еВт1 гщ
ch р2
R = 0.
16.5. Заряд в электромагнитном поле 221
Вводя новую независимую переменную £ = еВр2/(2cti), а также
выделяя регулярные при р —> 0 и р —»• со асимптотики
R = е-«/2£|т,|/2Ф(£),
получаем для Ф(£) уравнение Куммера (16.39) с параметрами
т, + |т,1 + 1 1 / Р2\
7 2 Пшв V 2m J '
Квантование осуществляется наложением требования у = —п, откуда
Глава 17
Теория возмущений
17.1. Стационарная теория возмущений
Нахождение стационарных состояний (собственных векторов
оператора Гамильтона, не зависящего от времени явно), а также
решение нестационарного уравнения Шредингера имеют важное значение
для получения физических предсказаний в квантовой механике.
Между тем лишь весьма ограниченный круг задач этого рода допускает
точное решение в терминах известных функций. Поэтому в
квантовой механике широко применяются приближенные методы решения
задач, такие, как метод итераций, вариационный метод и др. Здесь
мы рассмотрим итерационное построение собственных векторов и
собственных значений дискретного спектра для некоторой наблюдаемой,
в определенном смысле близкой к другой наблюдаемой, для которой
решение спектральной задачи известно. Чаще всего этот метод
применяется к оператору Гамильтона, т. е. речь идет о решении
стационарного уравнения Шредингера, поэтому он носит название стационарной
теории возмущений.
Предположим, что оператор Гамильтона Я можно представить в
виде суммы двух самосопряженных операторов
я = я0 + v;
где возмущение V «мало» (т.е. формальный ряд по степеням V
если и не сходится во всей спектральной области, то имеет смысл хотя
бы на ограниченном спектральном интервале, представляющем
интерес в задаче). По определению Н = Я+, при этом важно, что условие
самосопряженности выполняется и для невозмущенного
гамильтониана: Я0 = Hq~. Это последнее условие означает, что существует полная
17.1. Стационарная теория возмущений
223
ортонормированная система собственных векторов
Н0ф°п=Е°ф°п, (ф°п1\ф°п)=6пп„ (17-1)
которые предполагаются известными. Спектр Н0 предполагается
имеющим дискретный участок, для которого и будет применяться теория
возмущений. Как правило, V представляет собой часть потенциальной
энергии. Например, если частица совершает малые колебания
относительно положения равновесия х = х0, то потенциальную энергию U(x)
можно разложить в окрестности х0:
Щх) = Щх0) + {X~2Xo)2U"(x0) + i^lp)V(x0) + ... (17.2)
Принимая U(xQ) за начало отсчета энергии, можно считать оператор
р2 W(x-x0)2 , U"{x0)
Н°~^ + 2 ' Ш ~~^~ (17'3)
невозмущенным гамильтонианом, а кубический и более высокие
члены разложения — возмущением. В классической механике
разложение имеет смысл в достаточно малой окрестности положения
равновесия х0. В соответствующей спектральной задаче квантовой
механики, очевидно, следует говорить о поправках к собственным
значениям энергии Е% = Нш(п +1/2) гармонического осциллятора (17.3) при
не слишком больших п. Иногда в качестве возмущения можно
рассматривать и весь потенциал, например в задаче рассеяния, если этот
потенциал достаточно быстро убывает на бесконечности и не имеет
слишком сильных сингулярностей.
Будем искать решение стационарного уравнения Шредингера для
полного гамильтониана
Нфп = Епфп, (17.4)
считая, что собственное значение Еп мало отличается от Е% и может
быть представлено в виде ряда по степеням возмущения
Еп = Е°+Е*+Е% + ... (17.5)
В общем случае это не означает, что фп близко к ф„, однако это
действительно так, если среди собственных значений Е% нет
совпадающих, т. е. если спектр невозмущенного гамильтониана Я0 не
вырожден. В этом случае фп можно также представить в виде ряда
Фп = Ф0п+ф\+ф2п + ... (17-6)
224
Глава 17. Теория возмущений
Подстановка (17.5) и (17.6) в (17.4) приводит к системе уравнений во
всех порядках разложения. В нулевом приближении имеем (17.1), в
первом получаем уравнение
ЩФп+уф°п = Кф\+Кф°п (17.7)
(величина V предполагается имеющей первый порядок малости,
произведение двух величин первого порядка дает величину второго
порядка и т. д.). Удобно считать, что ф% и грп нормированы:
(ФЖ) = 1 = (ФпШ, (17-8)
откуда следует, что первая поправка ортогональна невозмущенному
вектору:
(Фп\Ф°п) = 0. (17.9)
Поправку первого порядка к энергии Еп можно получить,
умножая (17.7) скалярно на {ф„\- Учитывая, что
(в силу самосопряженности Н0 можно рассматривать его действие на
вектор слева), и принимая во внимание условие нормировки (17.8),
находим
Итак, первая поправка к собственному значению энергии равна
математическому ожиданию возмущения в невозмущенном состоянии.
Чтобы найти поправку к вектору состояния, умножим (17.7)
скалярно на (V'ml) считая т фп. Получим
EZ-E&
В силу полноты системы jV'm) можно написать
К) = Е №ЮК) = Е /Vlffiv (17Л°)
где введены матричные элементы оператора возмущения
Vmn = {<\V№) (17-11)
и учтено соотношение (17.9). Поправка к вектору \Фп) выражается в
виде линейной комбинации всех остальных векторов, при этом условие
17.1. Стационарная теория возмущений
225
невырожденности спектра Н0 существенно для отсутствия нулей в
знаменателе выражения под знаком суммы в (17.10). Условием малости
первой поправки является малость матричных элементов оператора
возмущения по сравнению с разностью невозмущенных собственных
значений энергии:
Формула (17.10) обобщается и на случай наличия у невозмущенного
гамильтониана участков непрерывного спектра: сумма по m
заменяется на интеграл по непрерывным собственным значениям. При этом
вычисляется поправка к дискретным уровням, которые не лежат в
непрерывном спектре или на его границе.
Аналогичным образом можно построить высшие приближения. Во
втором порядке из (17.4) получаем
ЩФ1 + Уфп = Е°пФ1 + КФ1 + Е2пф°п. (17.12)
Ограничимся вычислением Е%, для чего умножим (17.12) скалярно
на (Фт\ и учтем (17.10). Находим
Е* = Е w^w- (17-13)
тфп п т
Заметим, что вторая поправка к энергии основного состояния
(минимальное из всех Е%) всегда отрицательна.
В качестве примера вычислим поправку к энергии гармонического
осциллятора за счет кубического члена в разложении (17.2):
V = a(x-x0)\ *=\u"'{x0).
Используя рекуррентные соотношения (15.17) и (15.18) для состояний
гармонического осциллятора и представляя оператор координаты в
виде
X°~\2mw
(а + а+),
2тш
находим, что отличными от нуля матричными элементами являются
/ ft \s/a
Vn'n~3 = \Ш}) aVn(n-l)(n-2) = Vn_3>n,
f h \3/2
n—l,n*
8 - 8210
226
Глава 17. Теория возмущений
Поскольку диагональные матричные элементы равны нулю,
поправка первого порядка к энергии исчезает, а во втором порядке с
помощью (17.13) получаем
~ 15 Л2 / 2 11\
Поправка растет с номером уровня п быстрее, чем невозмущенная
энергия, поэтому теория возмущений справедлива лишь при
достаточно малых п. Этого и следовало ожидать, поскольку при больших
энергиях частица может отклоняться далеко от положения
равновесия и приближение малых колебаний несправедливо. Более того,
гамильтониан Н = Н0 + V, строго говоря, вообще не имеет дискретного
спектра: при х —¥ — оо потенциал стремится к —со и частица может
туннелировать из ямы на минус бесконечность. Этот эффект не может
быть описан в рамках теории возмущений.
Рассмотрим теперь случай, когда среди собственных значений
невозмущенного спектра есть совпадающие. В этом случае можно
занумеровать все различные собственные значения по-прежнему как Е%,
но собственные векторы будут иметь двойную нумерацию ip^a, at =
1,..., А, где А — кратность вырождения. Чтобы избежать появления
нулей в знаменателе, необходимо перестроить ряд теории возмущений.
Бели нас интересует поправка к уровню Е%, то в качестве
невозмущенного вектора следует выбрать некоторую суперпозицию вырожденных
состояний с энергией Е„
K) = XXK,>, (17Л4)
сг=1
где Са — подлежащие определению комплексные коэффициенты.
Выбор Са следует подчинить условию, гарантирующему малость
поправки к невозмущенному вектору состояния. Таких наборов Са,
вообще говоря, может быть несколько (но не больше А), и им будут
отвечать различные поправки к энергии. Иначе говоря, под действием
возмущения вырождение спектра может исчезать (снятие
вырождения), причем каждому собственному значению энергии будет отвечать
своя суперпозиция невозмущенных векторов. Чтобы найти поправку к
энергии, умножаем (17.7) на (ф^ , при этом члены нулевого порядка
справа и слева сокращаются, и в первом порядке получаем
Y^V^-KSffJC^O, (17.15)
а
17.1. Стационарная теория возмущений
227
где
v>a = №|v|vL>-
Система (17.15) имеет нетривиальное решение, если
det(V0a-E^a)=O. (17.16)
Поскольку Vpa — эрмитова матрица, ее собственные значения
вещественны и их число равно А, поэтому поправки к энергии Е^д следует
нумеровать индексом /3 = 1,...,А. Если среди значений Е^* нет
совпадающих, то вырождение снимается полностью, в противном случае —
частично. Каждому значению Е\в будет соответствовать свой набор
коэффициентов Св в суперпозиции (17.14).
Рассмотрим эффект Штарка — изменение энергии электрона в
атоме водорода под действием слабого внешнего однородного
электрического поля напряженности £. Выбирая ось z вдоль
направления электрического поля, получим следующий оператор возмущения
в сферических координатах
V = -e£rcos0. (17.17)
Основное состояние электрона п = 1, I = т1 — 0 не вырождено и
сферически-симметрично. Поскольку оператор V — нечетная
функция переменной z = r cos в, первая неисчезающая поправка к энергии
основного состояния возникает только во втором порядке теории
возмущений (квадратичный эффект Штарка). Рассмотрим теперь
первый возбужденный уровень п = 2, который четырехкратно вырожден
по значениям орбитального момента и его проекций 1 = 0, т, = 0 и
/ = 1, т, = ±1,0. Оператор возмущения (17.17) коммутирует с Lz,
поэтому вырождение по mt не будет сниматься: соответствующие
матричные элементы диагональны по т(. Поэтому в первом приближении
поправка к энергии состояний с т1 = ±1 также равна нулю, и
остается рассмотреть два состояния 1 = 0, т = 0 и I = 1, т, = 0, которые
будут образовывать нетривиальную суперпозицию типа (17.14).
Нормированные волновые функции этих состояний равны
где индексы означают п, I, mj. Матрица Vap, входящая в
уравнение (17.16), будет иметь вид
8*
228
Глава 17. Теория возмущений
ее собственные значения равны ±3е£гд. Вычисляя коэффициенты Са
для каждого из собственных значений, находим, что суперпозициям
Ф\ = -/=(^200^210)
будут отвечать поправки к энергии
££ = ТЗе£гв.
Таким образом, первый возбужденный уровень атома водорода п — 2
расщепляется на два, причем расщепление линейно по Е (линейный
эффект Штарка).
17.2. Квантовые переходы
Применим теперь метод возмущений к нестационарному
уравнению Шредингера (нестационарная теория возмущений). Будем
по-прежнему считать, что гамильтониан Н0 не зависит от времени,
а возмущение, вообще говоря, от времени зависит: V = V(t). (Здесь и
далее зависимость от координат не указываем явно.) Ищем решение
уравнения Шредингера
гК^ = {Н0 + У)ф (17.18)
в виде разложения по собственным функциям оператора Н0 с учетом
временябго фактора:
iB"t
V^^W^e-^, (17.19)
n
где сумма по п включает суммирование по состояниям дискретного и
интегрирование по состояниям непрерывного участков спектра.
Подставляя (17.19) в (17.18), учитывая соотношение (17.1) и проектируя
на {фк\, получаем для коэффициентов разложения следующее
уравнение:
^^E^nC')*-^*, (17-2°)
п
где Vkn — матричные элементы оператора возмущения, определенные
согласно (17.11), а
17.2. Квантовые переходы
229
— частоты переходов. Система уравнений (17.20) эквивалентна
исходному уравнению Шредингера (17.18) и является точной. Будем теперь
решать ее методом итераций, разлагая Ск в формальный ряд по
степеням возмущения
ck = c°k + cl + ...
Тогда, учитывая, что правая часть (17.20) содержит величины Vkn
первого порядка малости, из (17.20) находим
t
п о
где предполагается, что при t — 0 система находилась в
невозмущенном состоянии
<7fc(0) = С°к(0).
Если это состояние является одним из стационарных состояний
невозмущенной задачи
С°п = 1, С°к = 0, к ф п,
то имеем
t
Cl{t) = 1 f nn(f)e---t'dt'. (17.21)
о
Полученное соотношение показывает, что к моменту t система
может находиться во всех состояниях ф®, для которых матричный
элемент Vkn перехода из начального состояния ф% отличен от нуля. Таким
образом, нестационарная теория возмущений приводит к
представлению о квантовых переходах между состояниями невозмущенного
спектра под действием возмущения. Квантовые переходы могут
происходить как между состояниями дискретного спектра, так и между
состояниями непрерывного спектра, а также из дискретного в
непрерывный спектр и наоборот.
Представляет интерес рассмотреть предел выражения (17.21) при
больших t, когда переход «уже произошел». Результат будет
зависеть от того, к какому участку спектра принадлежит конечное
состояние фк. Если это состояние дискретного спектра, то
коэффициенты Ск должны представлять собой суммируемую последовательность;
если фк принадлежит непрерывному спектру, то эти коэффициенты
следует понимать в смысле обобщенных функций. Рассмотрим случай
периодического возмущения:
V(t) = 2Wcoscjt,
230
Глава 17. Теория возмущений
где W — некоторый оператор, не зависящий от времени. В результате
интегрирования по времени в (17.21) находим
Cj(t) = 2ta
e»(u»—b/„k)t _ j g—i(w+w„k)t _ j
Wnk -U ШПк+Ш
(17.22)
Коэффициенты имеют резонансный характер; наиболее существенные
переходы будут происходить, когда частота возмущения совпадает с
абсолютной величиной разности энергий невозмущенного спектра Н0:
Е°к = Е°п±Ни.
Рассмотрим один из таких переходов, отвечающий первому
слагаемому в (17.22), предполагая, что Е° и Е% принадлежат дискретному
спектру. В точном резонансе ш = шпк числитель и знаменатель
обращаются в нуль. Раскрывая неопределенность по правилу Лопиталя,
находим
Cl(t) = -^Wknt, (17.23)
т.е. амплитуда перехода линейно растет со временем. Здесь, строго
говоря, нельзя переходить к пределу t —> со, поскольку в рамках
теории возмущений коэффициенты Ск должны оставаться малыми,
однако при условии малости матричных элементов Wkn можно
рассматривать достаточно большие t. Ясно, что при этом первое слагаемое
в (17.22) будет доминировать (второе не имеет резонансного
характера при ш = шкп), и результат с хорошей точностью будет описываться
формулой (17.23). Вероятность того, что в момент t система будет
находиться в состоянии |^2)) моясно интерпретировать как вероятность
перехода \tp„) —> \Ф*к) П°Д действием возмущения, эта величина равна
квадрату модуля коэффициента Ск. Квантовые переходы более
удобно описывать с помощью скорости перехода (вероятности перехода в
единицу времени)
«W^IC*1!2- (17.24)
В точном резонансе и при больших t справедливо выражение (17.23),
поэтому
h2
',.-* = V—g-, (17.25)
т. е. скорость перехода линейно нарастает со временем.
Бели Е% принадлежит непрерывному участку спектра, то
независимо от того, какому участку спектра отвечает начальное состоя-
17.2. Квантовые переходы
231
ние, Ск следует понимать в смысле обобщенных функций, а
вероятность (17.24) следует заменить дифференциальной вероятностью
при этом конечное состояние должно быть нормировано на (J-функцию
от энергии:
Г(ф0к'У^^ = 5(Е°к-Е0к,).
Г
В этом случае резонансное поведение амплитуды (17.22) будет
отвечать появлению дельта-функции в выражении для скорости перехода
при t —> со. Действительно, рассматривая по-прежнему первое
резонансное слагаемое в (17.22), из формулы (17.26) получим
.. яп(ц/- w_fc)* 2IW.J2 ~
*"-* = & 1-Шпк НГ~ dE%-
Применив формулу преобразования Фурье дельта-функции
smxt
5{х) = -!- lim [ eixTdr = - lim
27Г t-Юо J я- t-Уоо
получаем
2тг
dwn^k = -\Wkn\2S(E°n -Е°к- Нш)<1Е°, (17.27)
где мы перешли от частоты к энергии в аргументе
дельта-функции. В отличие от (17.25) скорость перехода в состояния
непрерывного спектра (при больших t) не зависит от времени. Дельта-функция
в (17.27) выражает закон сохранения энергии при квантовых
переходах под действием монохроматического возмущения частоты ш.
Аналогичным образом если в невозмущенном спектре найдется такое Е%,
что Е% = Е% + Нш, то будет происходить переход, обусловленный
вторым слагаемым в (17.22).
Изложенная теория имеет в качестве важнейшего приложения
индуцированное излучение заряженных квантовых систем. При
воздействии на такую систему (например, атом) монохроматической
электромагнитной волны могут происходить квантовые переходы с
уменьшением энергии системы, которая передается полю излучения, либо с ее
увеличением за счет поглощения энергии волны. Бели же учесть, что
само электромагнитное поле также следует описывать в рамках
квантовой теории, то оказывается, что даже при отсутствии классического
232
Глава 17. Теория возмущений
поля волны взаимодействие квантовой системы с так называемыми
вакуумными флуктуациями электромагнитного поля не исчезает и
приводит к спонтанному излучению, представляющему собой квантовый
аналог классического излучения ускоренного заряда.
17.3. Рассеяние в борновском
приближении
В задаче о рассеянии квантовой частицы силовым центром
можно получить простое и достаточно общее выражение для амплитуды
рассеяния, рассматривая потенциал как возмущение. В этом случае
начальное состояние имеет вид плоской волны, отвечающей
импульсу р падающей частицы:
,/,0 _ ^ \ eipr/R
Vn V* (2тгЙ)з/2е
а конечное — импульсу р' рассеянной частицы:
*-**-&&*+"*•
Потенциал считаем постоянным, т. е. в формулах предыдущего
раздела полагаем ш = 0. При этом мы сохраняем представление о
«включении» взаимодействия при t = 0, что необходимо для получения
выражения типа (17.27) (в принципе момент включения можно выбрать
произвольным или отодвинуть на —со). Поскольку грр, нормированы
на дельта-функцию от импульса, соответствующая
дифференциальная вероятность будет отнесена к интервалу dp' конечных состояний.
В результате вместо (17.27) получаем следующее выражение для
скорости перехода:
где матричный элемент оператора потенциальной энергии V(r) имеет
вид
VP = <P'I У \Р) = (2^)3 / «^"Ч) d3x. (17.29)
Таким образом, амплитуда рассеяния в первом приближении теории
возмущений пропорциональна Фурье-образу потенциала.
17.3. Рассеяние в борновском приближении 233
Дифференциальное сечение рассеяния равно отношению скорости
перехода к абсолютной величине плотности тока вероятности,
ассоциируемого с падающей частицей:
i = -^-(V£VV>„ -tZ>„Vt/£) = — , г ,„.
J 2miKVp Wp *Py^v> т(2тгЙ)3
Вводя волновой вектор q, отвечающий переданному импульсу
Hq = p' -p,
переходя к Фурье-образу потенциала вместо матричного
элемента (17.29),
Vq = {2nKfVppl = j^TV{r)dzx
и полагая dp' = р'2 dp'dQ ,, в результате интегрирования в (17.28)
по абсолютной величине конечного импульса \р'\ с помощью дельта-
функции, окончательно находим для дифференциального сечения
следующее выражение:
^^(^У^2^'- (17-зо)
Формула (17.30) была получена М. Борном и носит его имя. Она имеет
то преимущество перед формулами п.16.3, что потенциал не
предполагается сферически-симметричным. Бели же сферическая симметрия
имеет место, то, разложив е*,г по шаровым функциям и выполнив
интегрирование по углам, можно получить для фаз рассеяния <J{
следующее выражение в борновском приближении:
со
Si = -^fv{r)Jl+x,2{kr)rdr.
о
Здесь к = p/tL, и условием применимости приближения является
малость фаз рассеяния, J{ <g 1. Интересно отметить, что применение
борновского приближения к кулонову полю приводит к точной
формуле Резерфорда.
Глава 18
Спин
18.1. Спин в нерелятивистской теории
Опыт показывает, что элементарные частицы могут обладать
собственным моментом количества движения, спином. По определению,
элементарные частицы не имеют внутренней структуры, поэтому было
бы ошибочным искать причину возникновения собственного момента
в каком-либо вращении. Объяснение наличия спина, скорее, следует
искать в теории поля. С точки зрения квантовой теории поля частицы
представляют собой элементарные возбуждения релятивистских
квантовых полей. Релятивистские поля могут быть ассоциированы с
представлениями группы Пуанкаре, объединяющей пространственные
вращения, преобразования Лоренца и сдвиги координат и времени в
четырехмерном пространстве событий. Каждое неприводимое
представление характеризуется определенными значениями операторов
Казимира этой группы. Группа Пуанкаре имеет два оператора Казимира,
собственные значения которых интерпретируются как квадрат массы
частицы и квадрат спина.
Согласно современным представлениям, в природе реально
существуют элементарные частицы со спином 0, 1/2, 1, 2 и (возможно) 3/2.
Частицы с более высокими значениями спина (резонансы),
наблюдающиеся при столкновениях протонов высоких энергий, являются
составными. Спин нуль имеют бозоны Хиггса, спин 1/2 — лептони
(электрон, /х-мезон и r-лептон и соответствующие им нейтрино ve, и , vT)
и кварки — элементарные составляющие адротюв, а также их
античастицы. Спин единица имеют векторные ноля, являющиеся
переносчиками сильных (глюоны), слабых (W и Z бозоны) и электромагнитных
(фотон) взаимодействий. Спин 2 имеет квант гравитационного поля
18.1. Спин в нерелятивистской теории
235
(гравитон), спин 3/2 его (гипотетический) партнер — гравитино.
В нерелятивистской квантовой механике спин описывается
векторным оператором S, компоненты которого удовлетворяют тем яке
коммутационным соотношениям, что и компоненты орбитального
момента (16.3):
[S^SJ^iHbkSk* (18-1)
квадрат оператора спина
коммутирует со всеми его проекциями и имеет собственные значения
s(s + l) (в единицах ft), где s — целые либо полуцелые числа (см. 16.1):
S2 \s, m.) = h2s(s + 1) |*, то.), s = 0,1/2,1,3/2,...
Как и в случае орбитального момента, в пространстве состояний
выбирается базис из собственных векторов проекции спина Sz:
sz\s>ma) = ft™, h ™a> >
причем \ma\ ^ s. Пространство спиновых состояний, таким образом,
(2s + 1)-мерно и представляет собой C2e+1. Полное гильбертово
пространство волновых функций частицы со спином является тензорным
произведением Пя = L^R3) ® С2"-1"1.
Рассмотрим наименьшее ненулевое значение спина s = 1/2. В
спиновом пространстве С2 можно ввести двухкомпонентные векторы —
нормированные спиноры:
х=(Й' *+*=i*ii2+i*2i2=i' (i8-2)
где х+ = (ХъХа) ~~ сопряженный спинор; тогда операторы проекций
спина будут эрмитовыми матрицами 2 х 2. В представлении, в
котором оператор Sz диагоналей, из перестановочных соотношений (18.1)
нетрудно получить, что
S = ^,
где а = (<тх, o-y,crz) — матрицы Паули:
a* = (i о)' °"»=(! о')' ^ = (о -О'
236
Глава 18. Спин
образующие базис алгебры su(2). Векторы состояний |1/2, ±1/2) будут
изображаться спинорами
являющимися собственными функциями оператора <rz:
°ZX* = X1", <TzXl = -ХХ
(квадрат любой из матриц Паули равен единичной 2 х 2-матрице,
поэтому собственные значения равны ±1). В состояниях х^^ спин с
достоверностью ориентирован вдоль (против) оси z.
Построим более общие состояния, отвечающие ориентации спина
вдоль и против произвольно выбранного направления
n = (sin в cos tp, sin в sin tp, cos в). (18.3)
Соответствующие спиноры являются собственными функциями
эрмитовой матрицы с единичным квадратом
n ^sinAe»* -cos6» J* ^n^*» -^X» •
Нормированные решения имеют вид
t _ /cos(0/2) e-Wn /_ ^„(в/г) e~^2\
Xn ~ \ sin(0/2) e»>/2 J ' *» "Д cos(0/2) e^/2 ,/ ' ^ ;
Вероятность того, что в состоянии Xn проекция спина на ось z
имеет значение ft/2, согласно общим правилам, излаженным в 14.1, есть
квадрат модуля скалярного произведения (х^, Xn) = Х*+Хп:
W = \xt+xl\2 = cos2(0/2),
аналогично вероятность значения —ft/2 равна sin2{9/2). Для состояния
общего вида (18.2) вероятности значений проекции на ось z ±ft/2 будут
равны \xi |2 и |х2|2 соответственно. Среднее значение спина в состоянии
xj,, как и следовало ожидать, равно
(S)xt = 1х1+<гх1 = I».
В классической электродинамике заряженная частица,
обладающая орбитальным моментом количества движения L, во внешнем
магнитном поле В приобретает магнитный момент
18.1. Спин в нерелятивистской теории
237
По определению система, имеющая магнитный момент, в однородном
магнитном поле напряженности В обладает потенциальной энергией,
линейно зависящей от В:
U = -(льВ. (18.6)
Чтобы убедиться, что это действительно так, разложим гамильтониан
заряда в поле, описываемом вектор-потенциалом А = [В х г]/2, по
степеням В:
2тп 2тп тпс 2ТПС2
Линейный по В член в этом выражении молено преобразовать к виду
и - ~^в * '1 •» - -шР *р]в=-^£В-
что при учете (18.5) совпадает с выражением (18.6).
Собственный момент количества движения S также порождает
магнитный момент /лв, но коэффициент пропорциональности,
называемый гиромагнитным отношением, оказывается ровно в два раза
больше:
Это соотношение обосновывается в релятивистской теории поля
спина 1/2, основанной на уравнении Дирака. В нерелятивистском
пределе из уравнения Дирака следует уравнение Паули. Уравнение Паули
является аналогом уравнения Шредингера, в котором дополнительно
присутствует потенциальная энергия спинового магнитного момента в
магнитном поле:
•2?
= (я«* - ш°в) *■ (18-7>
Здесь гамильтониан Шредингера
(Р - *А)2
(<р — скалярный потенциал), умножается на единичную матрицу, не
обозначенную явно, и
Ф
238
Глава 18. Спин
— двухкомпонентная волновая функция. Спиновый член в (18.7)
пропорционален недиагональной матрице
/ В В -гВ \
Величина eft/(2mc) носит название магнетона Бора.
Двухкомпонентная волновая функция принадлежит пространству L2(R3) ® С2,
соответствующее скалярное произведение имеет вид
{■ф,ф) = ]{Ф1Фх + Ф1Ф2)а*х.
Магнитное поле в (18.7) может произвольным образом зависеть от
координат и времени. В общем случае уравнение Паули не
допускает разделения координатных и спиновых переменных. В однородном
магнитном поле, зависящем только от времени, такое разделение
возможно. Тогда двухкомпонентная волновая функция, зависящая от
координат и времени, может быть представлена в виде произведения
однокомпонентной функции ф(г, t) на спиновую (двухкомпонентную)
функцию, зависящую только от времени:
ф{г, t) = ф(г, t)X(t), X(t) = (£g) . (18.8)
Подставляя (18.8) в уравнение Паули (18.7), получим два независимых
уравнения: уравнение Шредингера для ф
М
и уравнение для спиновой функции
*Й"5Г = нЗснФ
iSf = -5=<»*>* <18-9>
В постоянном однородном магнитном поле спин прецессирует
вокруг направления поля. Действительно, в этом случае уравнение (18.9)
имеет решение
X(t) = е**-*»-/2х(0),
где ось z выбрана вдоль направления магнитного поля и шв = еВ/(тс)
— частота вращения заряда в магнитном поле В.
Выбирая в качестве начального состояния спиновую функцию xj»>
находим из (18.4)
m _ /cos(0/2) e-«(*-o.Bt)/2\
X(l > ~ \ sin(0/2) ei(<P-<*Bt)/2 J >
18.2. Электрон в центральном поле
239
т. е. спин направлен вдоль вектора (18.3) с азимутальным углом <р —
u>Bt. При раскрытии экспоненты от матрицы Паули удобно
воспользоваться тем, что квадрат матрицы iaz (как и любой другой матрицы
Паули, умноженной на мнимую единицу) равен —1, поэтому iaz
можно понимать как матричную мнимую единицу. Матричная формула
Эйлера дает (единичная матрица здесь и далее не показана)
ьга"х = cos a + iaz sin a.
В этом соотношении iaz можно заменить на <х • п для любого
направления, заданного единичным вектором п.
В заключение этого раздела остановимся на некоторых других
свойствах матриц Паули. Нетрудно проверить, что различные
матрицы антикоммутируют между собой, поэтому имеем
o-iO-j+<т^=25^
иначе говоря, матрицы Паули образуют трехмерную евклидову
алгебру Клиффорда. Комбинируя это соотношение с коммутатором
[<Ti,o-j]=2ieijk<rk,
находим общее выражение для произведения
aiaj = 5tj + itijkak.
Отсюда следует, в частности, что
(cr-a)(<r-b) = a-b + i[ax b]er (18.10)
для любых двух векторов о, Ь.
18.2. Электрон в центральном поле
Рассмотрим подробнее роль спина электрона в задаче о движении
в центральном поле, и в частности в кулоновом. Прежде всего
следует обратиться к классификации состояний с различными значениями
орбитального и спинового моментов. Если поле не оказывает прямого
воздействия на спин, то можно рассматривать состояния, представи-
мые в виде произведения орбитальной (скалярной) и спиновой (двух-
компонентной) функций. Можно, однако, построить и альтернативную
систему базисных функций, рассматривая определенные значения
оператора полного момента
J = L + S.
240
Глава 18. Спин
В этой формуле J является эрмитовой матрицей 2x2, причем L —
оператор орбитального момента (16.1) — умножается на единичную
матрицу, которую для сокращения записи будем опускать. Выбирая
три коммутирующих оператора
J2 = (L + S)2, JZ=LZ + SZ, L2,
поставим задачу об отыскании их общих собственных функций.
Прежде всего заметим, что компоненты полного момента также образуют
алгебру su(2) ~ so(3):
[Ji,Jj]=ih€ijkJk,
откуда следует, что оператор J2 имеет собственные значения h2j(J+l),
где j — целое или полуцелое число, a Jz имеет собственные значения
rrij, изменяющиеся через единицу на интервале -j ^ m^ ^j.
Поскольку оператор Jz представляется в виде диагональной матрицы
j -ННд* + У2 ° ^
г V ° -4av-i/2)*
то искомые общие собственные функции можно искать в виде
Х ~ \В(е)е*<т*+1Юч') ' (18.11)
при этом
JZX = ftm^X-
Оператор квадрата полного момента имеет вид матрицы
2 _ (L2 + 3ft2/4 + HLZ HL_ \
где L± — Lx ± iLy. Учитывая рекуррентные формулы для
сферических гармоник Ylm, которые являются собственными функциями L2 с
собственными значениями h2l(l +1):
Ь+Ът, = ^y/(l + rnj + l)(l-mj)Yltm.+1,
L_Yim. = Пу/(1+m^l-mj + l)Ylt
mj — l>
а также сопоставляя зависимость от <р в (18.11) с зависимостью Ylm ~
еип*', будем искать решения уравнения
^2X = fi2J(j + l)x (18.12)
18.2. Электрон в центральном поле
241
в виде
'£5"ч-1/Л , (18.13)
где А, В — постоянные коэффициенты. Подстановка (18.13) в (18.12)
дает систему линейных однородных уравнений для коэффициентов
«-G
\PmiA + a_m.B = 0,
где am = 1(1 +1) - j(j + 1) + m +1/4, $^ = {l +1/2)2 - m2. Из условия
совместности получаем
j=l± 1/2. (18.14)
Таким образом, квантовое число полного момента может принимать
два значения, равные сумме и разности орбитального и спинового
квантовых чисел. Это правило является частным случаем общего
правила сложения моментов в квантовой механике. Если j1 и j2 —
квантовые числа каждого из моментов, то суммарный момент может
принимать все значения с шагом единица на интервале \j2 — j\ | ^ j ^ |j2 +Ji I
(теорема Вигнера — Эккарта). Для доказательства нужно рассмотреть
разложение тензорного произведения представлений группы 5(7(2)
на неприводимые представления. Определяя для двух значений j из
(18.14) коэффициенты А и 23, окончательно находим нормированные
решения \ = «У,=,±1/21 гДе
'y/l+mj + 1/2 Ylm._1/2^
V2T+Ty^l-m. + l/2 yJm.+1/2,
»7=W = ^W I V ' .'.. _ ' ' 1 • («.15)
** 1/2 - -^= I ^-mj+V2 Yl">-A . (18.16)
Напомним, что в состояниях (18.16) имеют определенное значение
квадрат орбитального момента /(/ + 1), квадрат полного момента
j(j + 1) и его проекция |тпл| < j. При этом в состоянии (18.15)
j = I + 1/2, что можно наглядно интерпретировать как
«параллельность» орбитального момента и спина, а в состоянии (18.16) j =1 —1/2
— как «антипараллельность». Разумеется, этой терминологии нельзя
придать строгий смысл, поскольку направление момента в квантовой
механике вообще не определено в силу некоммутативности операторов
проекций момента на оси координат.
242
Глава 18. Спин
Заметим, что спиновый член в уравнении Паули (18.7) содержит
в знаменателе скорость света и является релятивистской поправкой.
Релятивистское уравнение Дирака также предсказывает ряд других
поправок порядка с-2, одной из которых является спин-орбитальное
взаимодействие. Строгий вывод этого взаимодействия из уравнения
Дирака выходит за рамки настоящего курса, однако можно дать
следующее качественное пояснение. Рассмотрим классическое движение
электрона по окружности в центральном поле U{r) с некоторым
значением момента количества движения L. В среднем такое движение
эквивалентно круговому току, лежащему в плоскости, ортогональной
L. Круговой ток порождает магнитное поле, силовые линии
которого пересекают плоскость орбиты ортогонально к ней. Таким образом,
орбитальное движение электрона служит источником вторичного
магнитного поля. При этом собственный магнитный момент будет
взаимодействовать с магнитным полем, что в результате приводит к
эффективному потенциалу, пропорциональному скалярному произведению
S • L. Точный вид этого потенциала спин-орбитального
взаимодействия, вытекающий из теории Дирака, таков:
V" = 2^f <*•*>» <18Л7>
где т — масса электрона.
Оценим поправку к уровням энергии электрона, находящегося в
стационарном состоянии в центральном поле, описываемом волновой
функцией
Фвцт, = КВ1(г)Ур(в, <р), (18.18)
где У™* — одна из угловых функций (18.15), (18.16), a REl(r) —
соответствующая радиальная функция. Поскольку спин-орбитальное
взаимодействие является малой релятивистской поправкой порядка с-2,
можно воспользоваться аппаратом теории возмущений. Поправка к
энергии будет выражаться диагональным матричным элементом
оператора (18.17). (Хотя невозмущенные уровни вырождены по проекции
момента тп7-, оператор возмущения не снимает этого вырождения,
будучи сам сферически-симметричным. Поэтому можно
воспользоваться формулой теории возмущений в невырожденном спектре). Выразим
скалярное произведение S ■ L через квадраты операторов:
S-L = hj2-L2-S2),
которые все имеют определенные значения в состояниях (18.18). В ре-
18.2. Электрон в центральном поле
243
зультате поправка к энергии принимает вид
^ = 0-,«1 Vm U.0 = ^ b'(J+ l)-'(' + D-3/4] (~),
где среднее значение вычисляется по радиальным функциям. При
этом оказывается, что уровни с одинаковым I, но разными j = I ± 1/2
будут иметь различные поправки, т. е. происходит дублетное
расщепление уровней с разностью энергий
Таким образом, спин-орбитальное взаимодействие порождает тонкую
структуру атомных спектров.
Обсудим вырождение уровней энергии электрона в центральном
поле при учете спина. Если пренебречь тонкой структурой, то к
вырождению по азимутальному квантовому числу добавляется
вырождение по проекции спина, и полная кратность вырождения в
центральном поле общего вида будет равна 2(2/ +1). В кулоновом поле имеется
дополнительное вырождение по /, теперь к нему следует добавить
вырождение по проекции спина. Таким образом, в пренебрежении тонкой
структурой, уровню энергии с главным квантовым числом п будет
соответствовать полное число различных состояний
п-1
5„ = 2^(2/ + 1)-2п2,
1=0
которое для последовательности целых чисел п = 1,2,3,... принимает
значения 2,8,18,... Эти числа совпадают с длиной периодов в таблице
Менделеева, что будет объяснено подробнее в п. 19.3.
Глава 19
Многочастичные
системы
19.1. Принцип Паули
До сих пор мы рассматривали поведение отдельных частиц в
квантовой механике. При переходе к системам многих частиц
проявляются новые закономерности, связанные с неразличимостью одинаковых
частиц. В то время как в классической теории молено проследить за
движением двух одинаковых частиц, так как каждая следует
определенной траектории, то в квантовой теории это становится
затруднительным, поскольку понятия траектории не существует. Если задана
волновая функция ф(х1,х2) двух частиц, координаты которых есть
хг, х2 (здесь и далее под х понимается совокупность всех координат,
включая проекцию спина), то перестановка частиц приводит к
волновой функции ф(х2,х1), которая в случае их неразличимости должна
соответствовать тому же лучу в гильбертовом пространстве
состояний. Таким образом, ф(х2,х1) может отличаться от ф(х1,х2) не более
чем на фазовый множитель:
ф{х2,хх) = еюф(х1гх2).
Поскольку двукратная перестановка приводит к тому же состоянию,
то ега = ±1, иначе говоря, волновая функция должна быть либо
симметричной, либо антисимметричной:
ф(х2,хг) = ±ф{хх,х2).
19.1. Принцип Паули 245
В случае большего числа одинаковых частиц это правило может
применяться к любой паре частиц, причем в силу неразличимости всех
частиц полная волновая функция должна быть либо полностью
симметричной, либо полностью антисимметричной относительно
перестановок частиц.
Как правило, взаимодействие частиц между собой приходится
рассматривать с помощью теория возмущений. Для N
невзаимодействующих частиц полный гамильтониан имеет вид суммы:
N
где каждый оператор Нк действует только на к-ю частицу. Тогда
полная волновая функция может быть представлена в виде
произведения собственных функций фп{х) одночастичного гамильтониана (п —
полная совокупность квантовых чисел), причем необходимо провести
симметризацию по всем различным индексам п, либо полную
антисимметризацию (в последнем случае среди индексов п, очевидно, не может
быть одинаковых). Итак, удовлетворяющая принципу
тождественности симметричная волновая функция N невзаимодействующих частиц
должна иметь вид
где JV^iVjj,... — числа одинаковых индексов среди множества
(п15..., nN). При этом iVj+iV2-|-... = N, и сумма берется по всем
перестановкам Р различных индексов. (При вычислении нормировочного
интеграла в силу ортогональности одночастичных состояний вклад
дают только квадраты модулей каждого из членов суммы, отсюда ясно
происхождение нормировочного множителя.)
Антисимметричная по всем перестановкам волновая функция
строится из альтернированного произведения одночастичных состояний с
различными индексами и может быть представлена в виде
определителя
фА{х1,...,хы) =
у/т
ФП1(ХЛ ^П1(я;2) ... фП1{х„)
Vv,2(*i) ФпЛх2) ■■■ ФпЛхы)
^„„(*i) ^„„(*2) ••• ФП„М
Перестановка любой пары частиц эквивалентна перестановке двух
столбцов определителя, при этом его знак изменится. При
совпадении любой пары индексов пк определитель обращается в нуль.
246
.Глава 19. Многочастичные системы
В квантовой теории поля доказывается (теорема Людерса —
Паули), что эти две возможности определяются спином частиц, именно
частицы целого спина — бозоны — описываются симметричными
волновыми функциями, а частицы полуцелого спина — фермионы —
антисимметричными. В последнем случае в системе невзаимодействующих
частиц все они должны находиться в различных одночастичных
состояниях. В этом состоит принцип Паули, сформулированный им в 1925 г.
Ясно, что статистические закономерности в системах большого числа
бозонов и большого числа фермионов будут существенно
различаться. Этому будет посвящена гл. 21, а здесь мы рассмотрим подробнее
некоторые эффекты, связанные с принципом Паули в системах,
содержащих относительно небольшое число электронов, таких, как атомы
и молекулы.
19.2. Обменное взаимодействие
Принцип Паули приводит к существенно квантовому явлению
зависимости эффективного кулоновского взаимодействия между двумя
электронами от ориентации их спинов. Этот эффект обусловлен
характером симметрии координатной части волновой функции и не
имеет отношения ни х спин-орбитальному взаимодействию, ни к
прямому магнитному взаимодействию спиновых магнитных моментов,
которые, как правило, значительно слабее. Рассмотрим систему двух
электронов, находящихся в центральном поле U(r), r = |г|. Гамильтониан
электронов представим в виде
н=~£(Ai+Лз)+u{ri)+и^+F(|ri -Гз|)' (19л)
где гг — радиус-вектор первого электрона, а г2 — второго. Потенциал
кулоновского взаимодействия между электронами
V(K-r2\) = ]-^~r = f (19.2)
lrl-r2l Г12
будем считать малым по сравнению с и(гг) и U{r2), и для
нахождения собственных значений энергии воспользуемся теорией
возмущений, представив
H = H0 + V, Н0 = Нг+Н2.
Пусть еп — спектр энергий связанных состояний каждого из
электронов в центральном поле, т. е.
19.2. Обменное взаимодействие
247
который считаем ограниченным снизу значением е0. Тогда волновая
функция двух электронов в «невозмущенном» состоянии (т.е. в
пренебрежении кулоновским взаимодействием между электронами) будет
строиться из произведений координатных функций вида
*s,A = ^(Vm(*•>„,(r2) ± ^(^^(г,)) (19.3)
на спиновые функции, которые также могут быть симметричными и
антисимметричными. Мы не предполагаем присутствия магнитного
поля, и пренебрегаем динамическими взаимодействиями,
обусловленными спином. Поэтому спиновые функции строятся в виде тензорных
произведений спиноров, относящихся к первому и второму
электронам. Как нетрудно проверить, антисимметризованное тензорное
произведение
— _L.f t l f 4-л
Ха ~ ~^WiX2 XiX\)
является собственным состоянием оператора квадрата полного спина
S = S1 + S2, S2 = Sl + S* + 2S1 ■ S,
i
с собственным значением нуль. Здесь оператор Sx действует на первый
спин, & S2 — на второй, т. е., строго говоря, следовало бы писать
К
S=-[_ax®l2 + l1® <т2),
где <тх 2 — наборы матриц Паули, действующие на %х и Хг
соответственно. Спиновая функция %а является собственной функцией
оператора Sz с собственным значением нуль. Таким образом, Ха описывает
бесспиновое состояние системы двух электронов, или, как часто
говорят, состояние с «антипараллельными» спинами. Имеются также три
симметричных спиновых состояния:
Xs=Xixl, Xs1=xixi, X°s = -^(XiX2+xixl), (19-4)
которые являются собственными векторами S2 с собственным
значением H2s(s + 1), для а = 1. Верхний индекс представляет (в единицах
ft) проекцию спина Sz: ms = 0, ±1. Состояния (19.4) отвечают
«параллельным» спинам.
Согласно принципу Паули, полная волновая функция должна быть
антисимметрична относительно перестановок частиц, поэтому
правильные комбинации имеют вид Ф3Ха и ^aXs- Иными словами, в
248
Глава 19. Многочастичные системы
состоянии с антипараллельными спинами координатная функция
симметрична, а в состоянии с параллельными — антисимметрична.
Отсюда, в частности, следует, что основное состояние, в котором каждый
из электронов имеет минимальную энергию е0 (предполагаем, что
собственное значение е0 не вырождено), соответствует антипараллельным
спинам. В центральном поле £q = 0 соответствует нулевому
орбитальному моменту 1 = 0, поскольку полный спин электронов также равен
нулю, основной уровень не расщепляется в магнитном поле, т. е.
является сингл етным.
Рассмотрим теперь поправку, обусловленную взаимодействием
между электронами в рамках первого приближения теории
возмущений:
где V дается формулой (19.2), а Ф5 А — одна из координатных
функций (19.3). Скалярное произведение представляет собой интеграл по гг
и г2; в силу ортонормированности одночастичных волновых функций
<рп{г) двухчастичные функции ФЗА также нормированы. Поскольку
V не изменяется при замене г1 «-> г2, матричный элемент разбивается
на два слагаемых:
Е™=С±А, (19.5)
C = e2J\<p
S,A
„^х)1>„>2)|21?^> (19-6)
^^/^(^KW^W^W^. (19.7)
Первый интеграл представляет кулоновское взаимодействие двух
«размазанных» электронов. Второй описывает существенно
квантовую часть кулоновского взаимодействия, обусловленную
неразличимостью одинаковых частиц. Первый электрон находится не только в
состоянии <рП1, но также частично и в состоянии <рп^. Можно
истолковать величину ¥'ni(ri)¥'na(ri) как «обменную плотность заряда»
первого электрона, а ¥'П2(**2)^п1(г2) как аналогичную плотность для
второго электрона. Тогда интеграл А можно назвать обменной энергией.
Заметим, что величина А может входить в энергию (19.5) со знаком
«плюс» или «минус» в зависимости от полного спина: плюс для
антипараллельных спинов (полный спин нуль) и минус для параллельных
(полный спин единица).
Величина С, очевидно, является положительной. Подынтегральное
выражение в (19.7) не является всюду положительно определенным,
однако основной вклад вносит область гг ~ г2, в которой
положительная определенность имеет место. В простых случаях интеграл удается
29.2. Обменное взаимодействие
249
вычислить явно, для кулоновских волновых функций он
действительно оказывается положительным. В этом случае обменная энергия
положительна для антипараллельных спинов и отрицательна для
параллельных. Расщепление уровней, обусловленное обменным
взаимодействием, схематически показано на рис. 19.1. Символом S обозначено
состояние s = 0 полного спина, а символом Р — состояние а = 1
(расщепление уровней триплета происходит только при наличии внешнего
магнитного поля). Основное состояние отвечает пх = п2 = 0, оно с
необходимостью является синглетным.
Изложенная теория может быть
формально применена к двухэлек- / S
тронному атому Не. В этом случае /
щг) = -?* \:::::::::р
т
Рис. 19.1. Расщепление уров-
и энергия взаимодействия V являет- яей за счет обменного взанмо-
ся величиной того же порядка. По- действия
этому применение теории возмущений
пригодно лишь для качественного описания спектра гамильтониана.
Основное состояние атома гелия является синглетным («парагелий»).
Что же касается возбужденных состояний, то энергия парагелия,
согласно выводу теории возмущений, должна быть выше энергии три-
плетного состояния («ортогелия»); на самом деле это верно не для
всех возбужденных состояний. Чтобы улучшить приближение,
можно воспользоваться вариационным методом, суть которого в том, что
искомая волновая функция моделируется некоторым выражением,
содержащим подлежащие определению параметры. Эти параметры
затем находятся из условия миимальности фукнционала энергии.
Хотя представление об обменном взаимодействии, основанное на
теории возмущений, в задачах атомной и молекулярной физики
является довольно грубым, все же оно позволяет качественно понять
природу таких загадочных с точки зрения классической физики
явлений, как ковалентпная (гомеополярная) связь в молекулах и
свойство валентности. Напомним, что известно два основных механизма
образования молекул. Некоторые молекулы можно рассматривать как
связанные состояния ионов (ионная или гетерополярная связь),
типичным примером является молекула Na+Cl~. Этот механизм нетрудно
понять и с классической точки зрения. Другие молекулы, такие, как
молекула водорода Н2, состоят из двух нейтральных атомов. В этом
случае механизм возникновения притяжения между атомами
существенно квантовый, и в основе его лежит обменное взаимодействие.
Такая теория была построена Гайтлером и Лондоном в 1927 г., она да-
250
Глава 19. Многочастичные системы
ет описание ковалентной связи на качественном уровне. В дальнейшем
теория была доведена до согласия с экспериментом с помощью
вариационных методов.
Рассмотрим подробнее молекулу водорода Н2. Пусть ядра двух
атомов водорода находятся в точках о, о. Тогда в потенциал U в формуле
(19.1) целесообразно включить взаимодействие электронов со
«своими» ядрами, а взаимодействие электронов с «чужими» ядрами, их
взаимодействие между собой, а также взаимодействие ядер считать
возмущением. Одночастичными функциями невозмущенной задачи будут
кулоновские функции (pa (r), ipb (г), построенные в 16.4. Индексы а,
Ь указывают на принадлежность электрона атому а или Ь.
Соответствующие двухэлектронные функции будут строиться как симметри-
зованная и антисимметризованная комбинации
t
S,A
v^V
-(<Pa(ri ~ *)¥>ь(.г2 -Ь)± <pa(r2 - а)<рь(гх - 6)), (19.8)
они отличаются от (19.3) лишь нормировочным множителем. Теперь
перекрестные члены в квадрате модуля rps A не ортогональны и потому
нормировочный множитель равен
NS,A =
1 ± / ¥>a(ri - a)Vb(r-i. ~ ъ) drx
При вычислении поправки к энергии за счет возмущения
следует учитывать, что для квадрата модуля первого слагаемого в (19.8)
потенциал возмущения есть
V(rllr2) = e3
1 '21 I'l "I I'2 "
а для квадрата модуля второго слагаемого следует взять V =
У(г2,г1), при этом в перекрестных членах можно брать V либо V,
поскольку соответствующее подынтегральное выражение не
изменяется. В результате получаем поправку в виде
С±А
bs,A -
N,
S,A
где кулоновский вклад соответствует (одинаковым) интегралам от
квадрата первого слагаемого с потенциалом V и квадрата второго
слагаемого с потенциалом V':
С = f V(rx,r2)\<pa(rx - *)\2\<Рь(г2 - b)\2drx dr2,
19.2. Обменное взаимодействие
251
а обменная энергия есть
А = J V^r^<p^Vl ~ a)Vb(r2 ~ b)<p*a{r2 - a)ip*b{rx - b)drxdr2.
Кулоновский интеграл по-прежнему может быть истолкован квази-
классически как взаимодействие двух «размазанных» атомов. Если
бы мы попытались построить полуклассическую теорию молекулы, то
это был бы единственный потенциал, и теория потерпела бы крах.
Возникновение притяжения между атомами обязано обменному
интегралу и имеет место в случае антипараллельных спинов, т. е.
симметричной координатной функции. Чтобы оценить интегралы и
определить их знаки, рассмотрим сначала предел больших расстояний между
ядрами \а — Ъ\ -> со. Тогда обменная плотность заряда равна нулю,
поскольку одночастичные волновые функции не перекрываются. При
этом также \гх — Ь\ —> со и оба интеграла С и А стремятся к нулю.
На средних расстояниях \а — Ь\ порядка радиуса каждого из атомов
возникает существенное перекрытие волновых функций, поэтому
обменная плотность заряда не мгла. Основной вклад дают области
обменного заряда вблизи ядер, что приводит к большим отрицательным
вкладам в А, в то время как отталкивание электронных плотностей
и ядер между собой дает положительный вклад, меньший но
абсолютной величине. Из аналогичных рассуждений можно вывести, что
вклад С для промеисуточных расстояний имеет меньшую абсолютную
величину, чем А. В результате находим, что Eg < 0, а ЕАХ > 0, т. е.
в случае антипараллельных спинов возникает притяжение за счет
обменного взаимодействия, а для параллельных спинов — отталкивание.
Наконец, в пределе очень малых |а — Ь\ главный вклад ъС и. А будет
давать кулоновское отталкивание ядер, т. е. Es' > 0, и имеет место
отталкивание. Из сказанного можно заключить, что имеется некоторое
равновесное положение ядер, на котором обменное притяжение
уравновешивает кулоновское отталкивание ядер.
Важным предсказанием теории Гайтлера-Лондона является
равенство нулю полного спина электронов молекулы водорода. Это
подтверждается экспериментами по расщеплению спектральных линий в
магнитном поле. Другое предсказание состоит в том, что при
столкновении двух атомов водорода вероятность образования молекулы равна
1/4. Это связано с тем, что если сталкиваются атомы с различной
ориентацией электронных спинов, то существует три спиновых состояния
суммарного спина при s = 1 («параллельные» спины) и одно
состояние при s = 0 (антипараллельные спины). Это также подтверждается
экспериментально.
252
Глава 19. Многочастичные системы
19.3. Периодическая система элементов
Известные в природе, а также произведенные искусственно
элементы образуют периодическую систему, открытую Менделеевым, в
которой различные элементы классифицируются по атомным номерам и
химической валентности. Квантовая механика дает простое
качественное истолкование периодической таблицы, хотя количественное
описание структуры и спектров многоэлектронных атомов представляет
собой крайне сложную задачу. Атомы различных элементов состоят из
ядра с зарядом Z\e\, где Z — атомный номер (число протонов в ядре),
и Z электронов. Естественные элементы имеют 1 < Z < 92 (Z = 92
для ядра урана), искусственно были получены элементы вплоть до
Z = 118.
Простейшая модель атома является обобщением теории атома
водорода на произвольный заряд ядра, при этом считается, что все
электроны движутся в поле
U=-^r- (19.9)
Кроме того, при заполнении электронных оболочек следует учитывать
принцип Паули. В кулоновом поле (19.9) уровни энергии электрона
S» = -m2/№ n=1'2'-"
вырождены с кратностью 2п2, где п — главное квантовое число.
Таким образом, имеется два состояния с п = 1 (s-состояния, 1 = 0),
восемь состояний с п = 2 (шесть р-состояний, I = 1, и два s-состояния),
далее имеется восемнадцать состояний сп = 3 (десять d-состояний,
I = 2, шесть р-состояний и два s-состояния), тридцать два состояния
с п = 4 (/, d,p, s) и т. д. Это правильно воспроизводит длину периодов
таблицы Менделеева, но последовательность самих периодов
выглядит несколько иначе.
Фактически внешние электроны в многоэлектронных атомах
движутся в поле, создаваемом не только ядром, но и всеми другими
электронами, поэтому результирующий спектр энергии будет отличаться
от кулоновского и вырождение но I будет сниматься. Например, это
происходит для сильно возбужденных состояний атомов, в которых
один из электронов имеет большое главное квантовое число и,
следовательно, с наибольшей вероятностью находится на большом
расстоянии от остова атома, который в целом будет иметь единичный
положительный заряд. Тогда снятие вырождения по I качественно можно
понять как изменение граничного условия на волновую функцию в
19.3. Периодическая система элементов
253
начале координат, что дает добавочную постоянную в формуле
Бора — Зоммерфельда для радиального движения. В результате
квантовое число будет сдвигаться на некоторую постоянную 8t, зависящую
от I (поправка Ридберга):
me4Z2
S_, = --
Jnl 2fc2(n + <*,)2"
Поправка Ридберга зависит также от полного орбитального L и
спинового 5 моментов всего атома в целом: она быстро убывает с
увеличением I, поскольку с ростом I электрон во все меньшей степени
приближается к ядру.
Для отыскания эффективного потенциала, в котором движутся
электроны в невозбужденных атомах, можно воспользоваться
приближением самосогласованного поля, в котором электронная плотность
описывается статистически. Результирующее распределение
потенциала, включающее потенциал ядра,
V(r) = ^Х(«), х = f-ZV* (±У3 , (19.10)
определяется уравнением Томаса — Ферми (его вывод будет дан в
п. 21.2):
у/*~х"=Х3/\ (19-П)
с граничными условиями х(0) = 1> х(°°) = 0-
Эффективный потенциал в квазиклассическом радиальном
уравнении имеет вид
«W0-•*) + *&**•
Его глобальное поведение существенно зависит от Z. Можно показать,
что с ростом Z при постоянном I потенциал утрачивает характер
потенциальной ямы. Момент исчезновения ямы определяется условием
касания кривой Ц,фф оси абсцисс:
Оэфф = 0, ^фф = 0. (19.12)
Воспользовавшись уравнениями (19.10), (19.11), получаем следующее
уравнение для точки касания х:
(Ьх)'-4
254
Глава 19. Много частичные системы
В результате численного интегрирования получаем значение Z = Zt
при котором происходит исчезновение потенциальной ямы при
заданном I:
Zl = 0,155(2/ + I)3.
Определяемое этой формулой число Zx есть значение атомного номера,
при котором в атоме впервые появляются электроны с данным
значением орбитального квантового числа I. Хотя при выводе этой формулы
использовались статистические закономерности, свойственные очень
большому числу частиц, соответствующая эмпирическая формула
отличается от нее лишь значением численного коэффициента
гг = О,17(2/ + I)3. (19.13)
Отсюда находим, что d-состояния (/ = 2) впервые могут появиться в
атомах с номером Z не ранее Z = 21, а f-состояния — при Z = 58.
Более высокие значения I вообще не реализуются, 1=4 отвечало бы
Z = 124.
На основании этих соображений заполнение электронных оболочек
сложных атомов можно понять следующим образом. Первый период
соответствует заполнению состояний с п = 1 и состоит из водорода
и гелия. Как мы уже отмечали, атом Не в основном состоянии имеет
полный спин электронов, равный нулю. Второй период отвечает
заполнению состояний п=1ип=2и состоит из атомов с полностью
заполненной внутренней оболочкой Is. Первым в этом ряду стоит
литий Li (Z = 3, внешний электрон 2s), затем следуют бериллий Be
(Z = 4, внешние электроны 2s), бор В (Z = 5), углерод С (Z = 6), азот
N (Z = 7), кислород О (Z = 8), фтор F (Z = 9) и неон Ne (Z = 10), для
которых внешние электроны последовательно заполняют состояния 2s
и 2р. Третий период соответствует полностью заполненным
внутренним оболочкам Is, 2s, 2р и содержит снова 8 элементов Na, Mg, Al,
Si, P, S, CI, Ar, для которых последовательно заполняется оболочка
п = 3, именно состояния 3s и Зр. При п = 3 в кулоновом поле
возможно также 1 = 2, однако из (19.13) следует, что / = 3 мажет появиться
не ранее атомного номера Z = 58. Физически это означает, что
энергия состояний 3d в самосогласованном поле оказывается выше энергии
состояний 3s и Зр, на самом деле эта энергия ближе к энергиям
состояний 4s и 4р. Поэтому в третьем периоде снова содержится лишь 8
элементов, а не 18, как можно было ожидать.
Можно заметить следующую закономерность: последний элемент
каждого периода (VIII группа) имеет одинаковое число электронных
спинов, направленных вверх и вниз, суммарный спин внешней
оболочки равен нулю. Такие заполненные оболочки соответствуют инертным
19.3. Периодическая система элементов
255
газам Ne, Аг, которые в основном состоянии не вступают в
химические реакции. Это свойство можно объяснить так. Для образования
гомеополярной молекулы необходимо, чтобы электрон
присоединяемого атома мог быть обменен с электроном наружной оболочки атома
инертного газа. Поскольку все спиновые состояния в последнем
заполнены, в таком обмене может участвовать лишь электрон с тем лее
направлением спина, т. е. спиновая функция двухэлектронной системы
должна быть симметрична. Как мы видели в предыдущем разделе,
в этом случае обменное взаимодействие является отталкиванием,
поэтому молекула образовываться не может. Если же внешняя оболочка
не заполнена полностью, то образование ковалентной связи возможно,
причем, как и в случае молекулы водорода, присоединение электронов
происходит так, чтобы спины скомпенсировались. При этом в
образовании молекулы может принимать участие атом как в основном, так
и в возбужденных состояниях, если энергии возбуждения невелики.
Полный спин атома, таким образом, равен половине числа
присоединяемых электронов, иначе говоря, валентность является удвоенным
значением полного спина. Так, элементы первой группы (щелочные
металлы) имеют в нормальном состоянии спин S = |, их валентность
равна единице. Элементы второй группы должны были бы проявлять
в основном состоянии нулевую валентность, поскольку спин 5 = 0.
Однако имеется низколежащее возбужденное состояние с конфигурацией
на внешней оболочке (s, р) и полным спином S = 1. В этом состоянии
атом двухвалентен. Максимальная валентность 7 проявляется в
седьмой группе за счет возбужденного состояния со спином 7/2.
При образовании ковалентной связи, как мы видели на примере
молекулы Н2, атомы остаются в целом нейтральными. Между тем в
других случаях может происходить более существенное
перераспределение электронной плотности во внешних оболочках, в предельном
случае атом отдает все внешние электроны другому, становясь ионом,
в этом случае мы имеем дело с ионными молекулами. В сущности,
различие между двумя типами связи заключается лишь в степени
деформации электронных оболочек.
Продолжим теперь обсуждение горизонтального заполнения
последующих периодов таблицы Менделеева. Элементы четвертого периода
имеют полностью заполненные состояния Is, 2s, 2p, 3s, Зр, а
внешняя оболочка содержит состояния 4s, 3d (перешедшее в силу
правила (19.13) во внешний слой) и 4р. Не реализуются в силу (19.13)
возможные состояния 4d и 4f. В совокупности конфигурации 4s, 3d и 4р
содержат 18 состояний, последнее из которых отвечает криптону Кг и
имеет полный спин 0, поэтому Кг является инертным газом.
Заполнение терма 3d приводит к особым ферромагнитным свойствам (группа
256
Глава 19. Многочастичные системы
железа): эти термы энергетически выгодны при образовании
кристаллической решетки. Пятая группа (палладия) имеет внешние оболочки
из термов 5s, 4d и 5р (также 18 элементов). Наконец, следующая,
шестая группа платины вместе с лантаноидами содержит 32 элемента, в
которых заполняются термы 6s, 4f, 5d и 6р. Последняя группа
соответствует термам 7s, 6d, 5f во внешнем слое, она не заполнена полностью.
Глава 20
Квантовая статистика
20.1. Смешанные состояния
В предыдущей главе мы рассматривали системы многих частиц на
основе полного динамического описания с помощью волновой
функции. Между тем в системах очень большого числа частиц начинают
проявляться коллективные закономерности, которые можно изучать,
не прибегая к столь детальному описанию состояний всех частиц.
Изучение коллективных свойств является предметом статистической
физики, возникшей еще в XIX в. на базе классической механики и
электродинамики. Однако более глубокий смысл статистических
закономерностей был раскрыт лишь с появлением квантовой теории.
В основе статистического метода лежит представление о
незамкнутой системе. Предположим, что интересующая нас физическая
система является частью некоторой полной квантовой системы,
описываемой волновой функцией ф{х,у), где х обозначает множество
всех координат выделенной части (для N бесспиновых частиц {х} =
{га,..., rN}, для частиц со спином необходимо включить и значения
проекций спина), а у — совокупность координат остальной части
полной системы. Будем считать, что части х и у взаимодействуют между
собой и могут обмениваться энергией и другими характеризующими
их величинами. Тогда волновую функцию tp(x,y), вообще говоря,
будет невозможно представить в виде произведения волновых функций,
зависящих только от х и у, т. е. в виде ■ф(х)ф(у). Тем не менее мы хотим
описывать незамкнутую систему х отдельно, рассматривая
наблюдаемые F{x), действующие только на переменные х. Средние значения
9 - 8210
258 Глава 20. Квантовая статистика
таких наблюдаемых можно представить в виде
(F) = / rp*(x,y)F(x)ip(x,y)dxdy= / F(x',x)p(x,x')dxdx',
где введена двухточечная функция
р(х,х') = / xl)*{x',y)\p(x,y)dy
называемая матрицей плотности подсистемы х, а величина
F(x',x) = S(x' -x)F(x)
представляет исходный оператор наблюдаемой в матричном виде.
Оба введенные здесь объекты F(x',x) и р(х,х') являются
матрицами с непрерывно изменяющимися индексами, поэтому возможна более
краткая запись среднего значения как следа
(F) = Tr(Fp). (20.1)
Таким образом, для описания незамкнутой системы необходимо
использовать не вектор состояния, а оператор (матрицу плотности).
Состояние, описываемое матрицей плотности, называется смешанным, в
отличие от чистого состояния, описываемого волновой функцией.
В случае, когда системы х и у не взаимодействуют между собой,
состояние может быть приготовлено так, что полная волновая функция
ф(х,у) факторизуется:
ф(х,у) = ф(х)ф(у).
Тогда матрица плотности будет иметь вид
р(х,х') = j ф*(х')ф*{у)ф{х)ф{у)а:у = ф*(х')ф(х),
если волновая функция ф(у) нормирована: \\ф\\ = 1. Ясно, что
диагональные элементы матрицы плотности определяют плотность
вероятности обнаружить значения х координат физической подсистемы. При
этом условие нормировки \\ф\\ = 1 принимает вид
Тг р = / р(х, х) dx = 1,
а выражение для среднего значения {F) сводится к стандартному
(F)= ^'WFixtyWdx.
20.1. Смешанные состояния
259
Предположим, что спектр гамильтониана подсистемы х дискретный
(что характерно для системы, занимающей конечный объем). Тогда,
разлагая ф(х) по собственным функциям гамильтониана, можно
перейти к дискретному базису:
Ф(*) = £сп*п(*), №„|[ = i, £k„i2 = i.
п п
В случае чистого состояния (6) будем иметь
р(х,х') = Y^<cm<p^(x')(pm(x) = ^ртпср^(х')<рт(х),
где введена матрица плотности в энергетическом представлении
Ртп = <ст, (20.2)
представляющая собой эрмитову матрицу с дискретными индексами.
Наблюдаемая F задается матрицей
а формула для среднего значения (20.1) принимает вид
<V>|F|V>> = £Fnm/w
тп
В смешанном состоянии факторизация (20.2) уже не имеет места,
однако матрица плотности смешанного состояния общего вида также
должна быть эрмитовой матрицей pj^n = pnm с единичным следом
Тгр=$>п„ = 1, (20-3)
п
где все рпп ^ 0, и удовлетворяющей условию
РппРтт > 1РтпГ, (20-4)
которое следует из положительности квадратичной формы pmnq!^qn
для любых комплексных последовательностей qn из I2. В чистом
состоянии выполняется точное равенство. Простым критерием чистого
состояния является равенство
\Р )тп = Pmni
9*
260
Глава 20. Квантовая статистика
которое легко проверяется с помощью (20.2) с учетом того, что
£„|eja = l.
Рассмотрим эволюцию смешанного состояния во времени. В
частном случае чистого состояния, когда ртп факторизуется, имеем
Рт»(*) = <(*)ст(*),
где в силу уравнения Шредингера cOT(t) = сот(0)е~,£,т*/Л, отсюда
дРтп _ д<. , ^?Sm.-L(rr -ТР \п -
at ~ at m + n m ~ п> п Лт)Ртп ~
= £ {(РпаЩп - HmiPiJ = £l>. Л1™.> (20-5)
где Hln = 5lnEn, Hml = SmlEm. Соответствующее уравнение для
матрицы плотности как оператора имеет вид
f = ifcH). (же)
Это уравнение эволюции отличается знаком от соответствующего
уравнения для гейзенберговских операторов. Переход к матрице
плотности смешанного состояния производится заменой произведений
с„ст на величины рпт более общего вида, удовлетворяющие
условиям (20.3)-(20.4), при этом уравнение (20.6) сохраняет свой вид.
20.2. Энтропия и температура
Из соотношения (20.5) ясно, что стационарная (не зависящая от
времени) матрица плотности в энергетическом представлении должна
быть диагональной:
Ртп = 5mnwn-
В этом случае величины и>п можно интерпретировать как вероятности
нахождения незамкнутой системы в состояниях |п). Следует
подчеркнуть, что усреднение с помощью матрицы плотности в общем случае
включает и статистическое и квантовомеханическое усреднения,
которые не разделяются между собой. В случае диагональной матрицы
Ртп такое разделение представляется возможным:
<i^ = Tx(Fp) = 5>» <"!*>>■
С физической точки зрения стационарность матрицы плотности
незамкнутой системы означает, что она находится в равновесии как внутри
20.2. Энтропия и температура
261
себя, так и с остальной частью полной замкнутой системы. Равновесие
системы характеризуется максимальным значением некоторой
макроскопической величины, называемой энтропией. Энтропия 5
определяется как среднее значение логарифма In uin, взятое со знаком «минус»:
S = - (]nwn) = -£)«;„ In tun (20.7)
и является макроскопической величиной. В рамках чисто равновесной
статистики (которая только и будет рассматриваться далее)
максимальность энтропии является физическим постулатом. Более общая
формулировка этого принципа, называемого вторым началом
термодинамики, гласит, что выведенная из равновесия незамкнутая система
с течением времени приходит в равновесное состояние, в ходе этого
процесса энтропия может только возрасти:
dS ^n
причем знак равенства отвечает процессам, не выводящим систему из
статистического (термодинамического) равновесия.
Чтобы лучше понять смысл второго начала термодинамики,
полезно дать несколько иное определение энтропии. Рассмотрим функцию
распределения по энергии W{E), представляющую собой плотность
вероятности того, что энергия системы находится в интервале между
Е и Е + dE, и нормированную условием
/
W{E)dE = \.
В системе очень большого числа частиц функция W(E) будет иметь
резкий максимум вокруг среднего значения
(Е) = f\V(E)EdE.
Чтобы доказать это, достаточно предположить, что при дроблении
системы на все более мелкие части, остающиеся тем не менее
макроскопическими, т. е. состоящими из большого числа частиц, все эти части
являются статистически независимыми. При разбиении на N частей
средняя энергия
<£> = £<£.)
262
Глава 20. Квантовая статистика
будет расти с увеличением N примерно пропорционально N.
Среднеквадратичное отклонение в общем случае равно
({Е-(Е))2) = ( 5>!«-<25,»
однако в предположении статистической независимости среднее от
недиагональных произведений i\ф к будет равно нулю:
{(Е, - (Е,))(Ек - (Ek))) = ((Et - (Е{))) ■ {(Ек - (Ек))) = О,
и потому
((Е-(Е))2)^((Е,~(Е,))2),
t=i
что также растет пропорционально N. Следовательно, относительная
флуктуация убывает с ростом N, как
V((E-(Em 1
(-^
{е) VN'
Итак, функция распределения по энергиям W(E) имеет резкий
максимум в точке (Е) с шириной АЕ, которую удобно задать
соотношением
W({E)) АЕ = 1.
Рассмотрим теперь квантовомеханическую величину Т{Е),
представляющую собой число квантовых состояний с энергией, меньшей или
равной Е. Ясно, что спектр энергий системы большого числа частиц
должен быть очень густым, поскольку существует огромное число
вариантов распределения энергии между различными состояниями.
Поэтому число состояний, приходящихся на интервал энергий АЕ
макроскопической системы,
ДГ = АЕ |^
дЕ
Е=(Е)
будет очень велико; оно называется статистическим весом
макроскопического состояния с энергией (Е). Логарифм статистического веса
совпадает с энтропией:
5 = 1пДГ.
Действительно, для ДГ молено также написать
«,„«£» ДГ = 1,
20.2. Энтропия и температура
263
где wn({E)) — значение величины гоп в точке спектра,
соответствующей среднему значению (Е) (в силу большой густоты спектра значение
Еп, близкое к {Е), всегда найдется). Если предположить, что
lnwn({E)) = (In wn (£?)>,. (20.8)
то мы возвращаемся к исходному определению (20.7).
Предположение (20.8) фактически означает, что шгоп является линейной
функцией энергии, оно является одним из основных свойств
равновесного состояния и эквивалентно предположению о статистической
независимости подсистем. Последнее означает, что при разбиении на две
подсистемы суммарное распределение w12 будет представлять собой
произведение распределений w1 и w2:
w12 = w1 w2,
и, следовательно,
Into12 = haw1 + Into2.
Поскольку полная энергия также аддитивна, J512 = Е1 + Е2, то
логарифм распределения wn должен быть линейной функцией энергии.
Строго говоря, эти рассуждения имеют смысл лишь для
равновесных состояний, когда подсчет квантовомеханических состояний,
приходящихся на интервал АЕ, имеет смысл. Можно, однако,
рассматривать последовательность квазиравновесных состояний, так что
статистический вес будет адиабатически зависеть от времени. Тогда
приближение к состоянию теплового равновесия будет характеризоваться все
бблыпим числом макроскопических конфигураций, отвечающих
стандартной ширине АЕ энергетического распределения. Поэтому
статистический вес ДГ и, следовательно, энтропия должны возрастать при
приближении к тепловому равновесию. Более глубокое обоснование
второго начала термодинамики дается в рамках неравновесной
статистики или физической кинетики, которая выходит за рамки этого
курса.
Рассмотрим некоторую макроскопическую систему (тлело),
состоящую из двух равновесных подсистем, не находящихся в равновесии
друг с другом. Тогда, будучи приведенными в соприкосновение, эти
подсистемы будут обмениваться энергией, причем полная энергия
будет оставаться постоянной:
Е = Ег+Е2, (20.9)
а энтропия будет расти, пока не достигнет максимального значения.
Максимум энтропии отвечает установлению полного равновесия
между двумя подсистемами. Это можно выразить в виде равенства нулю
264
Глава 20. Квантовая статистика
производной от полной энтропии по энергии одной из подсистем:
J-=0; 5 = 51 + 52,
где мы учли, что энтропия аддитивна вследствие принципа
статистической независимости подсистем. Тогда в силу (20.9) будем иметь
^ = ^, (20.10)
dE^ dE2
т. е. производная от энтропии по энергии должна быть одинакова для
обеих частей системы после установления равновесия. Эта
производная определяет обратную температуру тела
т - §• (20П)
и равенство (20.10) можно теперь интерпретировать как равенство
температур Тг = Т2. Разбивая тело на произвольное число частей,
аналогичным образом можно убедиться в том, что температура для всех
частей в состоянии термодинамического равновесия будет одинакова.
Можно убедиться и в том, что в процессе установления
равновесия энергия переходит от тела с более высокой температурой к телу,
имеющему более низкую температуру. Действительно, пусть 2\ ф Т2
и теплового равновесия нет. При установлении равновесия энтропия
должна возрастать:
0<ds = d_sx + ds± = (±_ i\^ (20Л2)
* АЛ \Тг Т2) dt ' v '
где учтено, что 5а = SY{E^), S2 = S2{E2) и Е = Е1 + Е2 = const.
Отсюда видно, что при Тг > Т2 имеем dE1/dt < 0, т.е. более горячее
тело передает энергию более холодному. Итак, равновесное состояние
некоторой макроскопической системы характеризуется максимально
возможным значением ее энтропии и постоянством температуры по
всему объему системы.
Температура должна быть неотрицательной, в противном случае
возрастание энтропии сопровождалось бы понижением энергии, что
представляет собой абсолютную неустойчивость.
В формулах (20.9), (20.12) в качестве энергии выступает
среднее значение (Е) по микроскопическим состояниям, которое является
макроскопической величиной, называемой внутренней энергией тела.
Внутренняя энергия, как правило, обозначается символом Е без знака
20.3. Первое начало термодинамики
265
усреднения во всех формулах, связывающих макроскопические
величины.
Температура в вышеприведенном определении (20.11) измеряется в
энергетических единицах. Переводным множителем в градусы
(Кельвина) является постоянная Больцмана к:
Г(эрг) = кТ(грлд), к = 1,38 • Ю-16 эрг/град.
20.3. Первое начало термодинамики
Основными объектами статистической физики
являются газы, жидкости, твердые тела, плазма
и т.д., которые помимо энергии и энтропии
характеризуются рядом других макроскопических
величин. Одной из таких величин является давление
Р. Давление характеризует способность системы
совершать механическую работу. Например, в случае
газов молекулы могут передавать импульс стенкам
сосуда, в котором находится газ, либо поршню,
который может двигаться в цилиндре, заполненном
газом (рис. 20.1). При этом на стенки сосуда или
поршень будет действовать сила, а при
перемещении поршня будет совершаться механическая рабо-
Рис. 20.1.
Расширение газа
сопровождается
работой
та. Как видно из рис. 20.1, при перемещении порпшя площади 5П на
расстояние dl газом совершается работа
dA = F ■ dl = Р ■ Sn, dl = Р dV,
(20.13)
где Р — давление (сила, действующая на единицу площади в
ортогональном направлении). Источником работы является внутренняя
энергия газа.
Другим способом передачи энергии является теплообмен. Если
процесс теплообмена происходит квазиравновесным образом, когда
температуру всего тела в каждый момент времени можно считать
постоянной по всему объему и не происходит других процессов, которые могли
бы повлечь изменение энтропии (например, химических реакций), то
получаемое телом тепло пропорционально изменению энтропии тела:
(см. (20.11))
dQ = TdS.
Объединяя соотношения (20.11) и (20.13), получаем равенство
dE = TdS-PdV,
(20.14)
266 Глава 20. Квантовая статистика
выражающее закон изменения энергии и называемое первым началом
термодинамики. Если система теплоизолирована, то dS = О, такой
процесс является обратимым и называется адиабатическим. Заметим,
что количество тепла не является полным дифференциалом, поэтому
передачу тепловой энергии нельзя понимать как переливание
«тепловой жидкости». Тепло может передаваться системе от нагревателя
(тела с более высокой температурой) либо отбираться холодильником
(телом с более низкой температурой). В первом случае внутренняя
энергия увеличивается, во втором — уменьшается. Второе слагаемое
в (20.14) также не является полным дифференциалом. Внутренняя
энергия является функцией от 5 и V, соотношение (20.14) можно
представить в виде
\ds)v' у \dv)s'
где дифференцирование выполняется при постоянных V и S
соответственно.
Аналогично постоянству температуры можно доказать
постоянство давления по всему объему тела, находящегося в
термодинамическом равновесии. Пусть две части тела, имеющие объемы V, и У2,
приведены в соприкосновение. Бели тело в целом находится в
равновесии, то энтропия S = S1+S2 должна быть максимальна по отношению
к изменению Vx при постоянном полном объеме V = Vx + V2. Таким
образом, имеем
_ 9S _ e?Sx dS2
Переписав первое начало термодинамики (20.14) в виде
dS=^ + ^dV, (20.15)
находим
тг т2'
откуда с учетом равенства температур Тг = Т2 имеем Рх = Р2.
Давление газа неотрицательно. Для других сред возможны и состояния,
характеризующиеся отрицательным значением величины Р, в этом
случае можно говорить о натяжениях в среде.
Из соотношения (20.15) следует, что при Р < 0 равновесное
состояние неустойчиво. Действительно, при отрицательном давлении
возрастание энтропии сопровождалось бы самопроизвольным сжатием тела.
20.3. Первое начало термодинамики
267
Однако в течение достаточно коротких промежутков времени тела с
отрицательным давлением могут реально существовать.
Суть первого начала термодинамики можно продемонстрировать
на примере различных термодинамических процессов. Пусть тело
расширяется, будучи теплоизолированным от среды. Тогда dS = 0, и
расширение сопровождается убыванием внутренней энергии. Внутренняя
энергия зависит от температуры тела, при ее убывании температура
будет падать (адиабатическое расширение). Чтобы расширение
происходило при постоянной температуре (изотермически), необходимо
подводить тепло; при этом оба слагаемых в правой части (20.14) отличны
от нуля. Можно создать условия, при которых расширение происходит
при постоянном давлении (создаваемом, например, собственным весом
поршня); такой процесс называется изобарическим. В этом случае
также оба слагаемых в правой части (20.14) (тепло и работа) отличны от
нуля.
Бели же процесс теплообмена
происходит неравновесным образом, или же
происходят иные изменения состояния
системы, влекущие за собой изменение
энтропии, то имеет место неравенство
*Р
dQ < TdS.
(20.16)
5S =
4V ^ JS = 0
T\ = const^^v_o
Рис. 20.2. Цикл Карно
Чтобы заставить систему совершать
механическую работу за счет тепловой
энергии, необходимо осуществить
циклическое изменение ее состояния так, чтобы
не происходило необратимого увеличения
энтропии и система возвращалась бы в
исходное состояние в конце каждого цикла.
Назовем коэффициентом полезного действия (КПД) отношение
совершенной механической работы к количеству тепла, полученного от
нагревателя. Можно показать, что максимальный КПД получается если
цикл состоит из последовательности двух изотерм и двух адиабат, как
показано на рис. 20.2. На участке 1 —> 2 происходит изотермическое
нагревание рабочего тела при его контакте с нагревателем, находящимся
при температуре Т2. Приобретаемая энергия (предполагается, что
процесс носит квазиравновесный характер) будет равна 8Е2 = T2SS2, где
SS2 — увеличение энтропии тела. На участке 2 —> 3 тело адиабатически
расширяется, совершая механическую работу, при этом оно
охлаждается до температуры Тг. Участок 3 —> 4 отвечает контакту с
холодильником, находящимся при температуре Тг, происходит изотермическое
сжатие. Наконец, возвращение в исходное состояние (участок 4 —> 1)
268
Глава 20. Квантовая статистика
снова происходит адиабатически. Энергия, переданная холодильнику,
равна 5Е1 = T^JSj, поскольку энтропия SS2, приобретаемая при
нагревании, должна уменьшиться на такую же величину, чтобы полное
изменение энтропии равнялось нулю (на двух других участках цикла
изменения энтропии не происходит). Производимая телом
механическая работа равна разности 6Е2 — 8ЕХ = (Т2 — T1)SS2, при этом
расходуемая тепловая энергия нагревателя есть 6Е2 (тепло, передаваемое
холодильнику, является неизбежной потерей). В результате для КПД
цикла Карно находим
■Пк
т2-т,
т2 -
Эта величина является предельной для любой реальной тепловой
машины, в которой процесс не удается осуществить строго обратимым
образом и имеется дополнительное возрастание энтропии. Рассмотрим
круговой процесс более общего типа, обозначая через Т2
максимальную температуру нагревателя, а через Тх — минимальную температуру
холодильника, которые более не предполагаются постоянными в ходе
процесса. Интегрируя неравенство (20.16) вдоль замкнутого цикла,
получаем неравенство Клаузиуса
dQ
I
т - '
где строгое равенство отвечает обратимому процессу. Тогда при
нагревании будем иметь
а при охлаждении
!4>-kh=
SQ2
т2
SQX
2\
В результате из неравенства Клаузиуса находим
SQ2 5QX
<0
Г2 7\ -
и, следовательно, КПД равен
SQ2-SQ1 Т2-Тх
V SQ2 ~ T2 ■
Точное равенство осуществляется только для обратимого процесса,
причем такого, что температура холодильника Тг постоянна, т. е. для
цикла Карно.
20.3. Первое начало термодинамики
269
Покажем, что работа, совершаемая телом при изотермическом
расширении, равна изменению его свободной энергии
F = E-TS. (20.17)
Действительно, дифференцируя (20.17) и учитывая (20.14), находим
dF = -SdT-P dV, (20.18)
откуда и следует сказанное. Свободная энергия F, как и внутренняя
энергия Е, является функцией состояния, и в термодинамические
соотношения входит ее полный дифференциал. Заметим, что
математически эта величина связана с Е преобразованием Лежандра по
переменным Т, S. Из формулы (20.18) находим следующее представление
для энтропии и давления:
5=-(e)v' р=-{ш)т
Преобразование Лежандра внутренней энергии по переменным Р,
V приводит к тепловой функции W:
W = E + PV.
Для дифференциала этой величины, используя (20.14), находим
dW = TdS + VdP.
Таким образом, изменение тепловой функции представляет собой
количество тепла, передаваемого телу изобарически.
Наконец, аналогичное преобразование свободной энергии (20.17)
приводит к так называемому термодинамическому потенциалу Ф
(иногда называемому свободной энергией Гиббса, в отличие от
свободной энергии Гельмгольца F):
Ф = F + PV = Е -TS + PV.
Бе дифференциал равен
dФ = -SdT + VdP.
Особое значение этой величины в том, что она зависит от
дифференциалов неаддитивных величин — температуры и давления. Мы
называем аддитивными те величины, которые при разбиении тела на части
представляют собой сумму соответствующих величин для отдельных
270
Глава 20. Квантовая статистика
частей. Такими величинами являются энтропия, внутренняя энергия
и объем. Температура и давление одинаковы по всему телу
(находящемуся в тепловом равновесии) и, следовательно, неаддитивны.
Особая роль потенциала Ф становится ясной, если число N частиц
в системе переменно. Тогда в выражения для дифференциалов
термодинамических потенциалов Е, F, W, Ф должны быть добавлены
члены, пропорциональные dN. При этом добавление такого члена в Е
влечет за собой появление точно таких же членов для всех остальных
потенциалов. Итак, для системы с переменным числом частиц будем
иметь
dE = TdS-PdV + fidN,
dF = -SdT-PdV + lidN,
dW = TdS + VdP + fidN,
d$ = -SdT + VdP + iidN,
где химический потенциал ц определяет изменение внутренней
энергии (при постоянных S, V) при добавлении еще одной частицы или
изменение свободной энергии, если добавление частицы происходит
при постоянных Т и V и т. д.:
_ (8Е\ _ (dF\ = f8W\ = (дФ\
^~\дм)зу ~ \дм)Т>у " \8n)s>p ~ \дм)Ту
В этой цепочке последнее представление особенно полезно,
поскольку Т и Р — величины неаддитивные, и поэтому Ф может зависеть
от N только линейно; иначе говоря,
Таким образом, химический потенциал фактически является
потенциалом Ф, отнесенным к одной частице.
Для дальнейшего нам понадобится еще один термодинамический
потенциал, который получается, если провести преобразование Лежан-
дра во второй строчке в (20.19) по переменным ц, N:
Q = F-nN, dQ = -SdT-PdV-Ndn.
Если учесть соотношения Ф = fiN и Ф = F + PV, то получим
Q = -PV,
т. е. новый потенциал не является независимой величиной и равен
произведению давления на объем, взятому с обратным знаком. Его
введение, однако, позволит выразить число частиц как частную
производную:
\dfi)TV \дц)Ту
20.4. Каноническое распределение Гиббса
271
Количество тепла, которое необходимо затратить на нагревание
тела на единицу температуры, называется теплоемкостью. Из
сказанного ясно, что теплоемкость зависит от способа осуществления
нагревания. Если тело удерживается при постоянном объеме, то из (20.14)
получаем теплоемкость при постоянном объеме:
*-(£),■
Если же нагревание происходит при постоянном давлении, то будем
иметь
Ср=(^)р'
откуда становится ясным физический смысл тепловой функции.
Можно показать, что СР > Cv.
Итак, первое начало термодинамики, представляющее собой
термодинамическую форму закона сохранения энергии, наряду с законом
возрастания энтропии (второе начало) позволяет понять суть
основных тепловых процессов. Существует еще третье начало, иначе
известное как теорема Нернста. Суть его в утверждении, что энтропия
макроскопического тела должна стремиться к нулю при Т -» 0.
Действительно, в силу принципов квантовой теории при абсолютном нуле
температуры все части системы должны приходить в основное
состояние, статистический вес которого равен единице. Отсюда можно
показать, что теплоемкости Cv и СР стремятся к нулю при Т —»• 0:
c-TdS= dS
dT dhiT'
20.4. Каноническое распределение Гиббса
Как было замечено в п. 20.2, статистическая независимость
подсистем находящихся в термодинамическом равновесии, означает, что
логарифм диагональных элементов матрицы плотности в
энергетическом представлении является линейной функцией энергии:
lnwn = 0{F-En).
Здесь величина F необходима для правильной нормировки
вероятности:
5>п = 1 = е^5>-^", (20.20)
п п
272
Глава 20. Квантовая статистика
а множитель /3, как нетрудно показать, совпадает с обратной
температурой. Действительно, выражение для энтропии (20.7) принимает
вид
S = - ]Г p(F - En)e^F~En) = -pF +/3 (Е) =/3(Е - F), (20.21)
n
где среднее значение (Е) обозначено как внутренняя энергия Е.
Поскольку dS/dE = 1/Т, ясно, что /3 = 1/Т. Сопоставим теперь (20.21)
с (20.17). Легко видеть, что введенная из соображений нормировки
величина F есть не что иное, как свободная энергия системы.
Итак, в термодинамически равновесном состоянии при
температуре Т вероятность квантового состояния с энергией Еп определяется
формулой
wn = е^-в")/т, (20.22)
где F — свободная энергия (распределение Гиббса или каноническое
распределение). Удобно ввести новую величину, называемую
статистической суммой:
Z = 5>-B"/T. (20.23)
п
Тогда из нормировочного условия (20.20) получаем свободную энергию
в виде
F=-TmZ. (20.24)
Соотношение (20.24) осуществляет связь между квантовой
статистикой и термодинамикой: после того как свободная энергия найдена,
другие термодинамические величины могут быть рассчитаны по
формулам предыдущего раздела. Каноническая матрица плотности может
быть записана и в более общем операторном виде, не связанном с
энергетическим представлением:
?=е(^-я)/г (2025)
Статистическая сумма представляет собой след ненормированной
матрицы плотности
Z = lre~5/T.
С помощью (20.25) можно получить матрицу плотности в любом
интересующем нас представлении. Например, гамильтониан для N
невзаимодействующих точечных частиц есть
*=i fc=i
20.4. Каноническое распределение Гиббса
273
Матрица плотности в координатном представлении будет иметь вид
3N г 1 г 1
Мх,х') = <*'|е^|х) = П ~ U^-Xi),h-p^mT)dPi e*.
»=i ■-
где учтено, что
™ e-i(PiXi)/h
(здесь индекс г = 1,..., 3iV нумерует координаты в конфигурационном
пространстве N частиц). Вычисление интеграла дает
рт(х,х') = <Р* (|§) * Пехр (-=£(,< - xtf) . (20.27)
При Т —)■ со матрица плотности переходит в произведение 5-функций.
Используя представление J-функции в виде
5(х)= lim ,Ь"м2
a—юо у 7Г
находим
3JV
Ит^ (рт(х,х')е-^т) = Цб(х, - *<)•
Можно получить выражение (20.27) и иначе, воспользовавшись
уравнением для ненормированной матрицы плотности
р = е~Й'т.
В случае гамильтониана вида (20.26) в координатном представлении
получим произведение
3N
?(*,х,) = Пй(х1>*{), (20.28)
»=i
где одночастичные величины р(х{, xj) удовлетворяют уравнению
(суммирования нет)
dp, = fi2 d%
9/3 2m дх?
и /3 = 1/Т. Это уравнение аналогично уравнению Шредингера с
заменой t —У —Шр. При /3 —» 0 оператор р становится единичным, поэтому
будем искать решение уравнения (20.28) с «начальным» условием
Pi\/3=o = s(xi-x'i)-
274
Глава 20. Квантовая статистика
В результате находим
что возвращает нас к формуле (20.27).
В этом примере матрица плотности системы N частиц фактори-
зуется в произведение одночастичных матриц, что является
следствием отсутствия взаимодействия между частицами. Поэтому формально
можно говорить о тепловом распределении и для отдельной частицы.
Разумеется, установление термодинамического равновесия
подразумевает, что фактически система состоит из большого числа частиц.
Альтернативный вывод распределения Гиббса состоит в
рассмотрении физической системы как части полной системы, включающей
термостат. Термостат предполагается достаточно большой
равновесной системой, такой, что рассматриваемая физическая система
представляет собой лишь малую часть полной системы. Все
микроскопические конфигурации полной системы, имеющей фиксированную
энергию Etot, считаются равновероятными (микроканоническое
распределение). Тогда вероятность того, что физическая система находится в
квантовом состоянии с энергией Еп, будет определяться числом
конфигураций АГ^^ термостата, на долю которого приходится
энергия ^term = &ua ~ Еп- Поскольку Arterm = exp[Stenn(.Eterm)], то,
предполагая, что Еп «С Etot и производя разложение
''terml-^ternJ = "termV^totJ ~ n ЛЕ '
находим, что wn ~ ехр(-£?п/Т), где Т-1 = dSterm/dE. Добавляя
нормировочный фактор exp(F/T), получаем распределение
Гиббса (20.22). Таким образом, статистическая система, находящаяся в
термодинамическом равновесии, может рассматриваться, как система в
термостате.
В качестве второго примера рассмотрим гармонический
осциллятор в термостате. Поскольку спектр энергий еп — ftu>(n + 1/2), для
диагональных элементов ненормированной матрицы получаем
p(x,x) = £e-ft-("+1/2)/TV)2(a;)i
п=0
где фп — нормированная волновая функция одномерного
гармонического осциллятора. Удобно перейти к дифференциальному уравнению
20.4. Каноническое распределение Гиббса
275
для р, рассматривая действие операторов уничтожения и рождения
ар = ^ехр (~^) (2VW„_i1&n - *^п)>
П
а+р = £ехр(-^) {2у/^+1гРп+1фп-хх1>2п).
п
Используя переобозначение индекса суммирования, для суммы и
разности этих выражений получаем дифференциальное уравнение
-f- = -2Xxp, A=-th—-,
dx H ft 2T
решение которого имеет вид
р = Се~Хх\
Определяя постоянную из условия нормировки, получаем
диагональную часть нормированной матрицы плотности
р(х,х) = ^е-**'. (20.29)
В случае высоких температур Нш -С Т, А и ш2/2Т, и мы получаем
. , / о,2*2\
где в показателе экспоненты стоит отношение потенциальной энергии
к температуре. Это распределение не содержит постоянной Планка и,
по существу, является классическим. В существенно квантовом случае
Нш^-Т формула (20.29) переходит в
p(x'l) = V^^(~^r)'
при этом колебания осциллятора практически не возбуждены.
В классическом пределе статистическая сумма может
вычисляться с помощью квазиклассических представлений. Согласно
формуле Вора—Зоммерфельда, одномерная система имеет по одному
квантовому состоянию на «клетку» фазового пространства 27rft. Полное
число квантовых состояний, приходящихся на элемент объема Д7 =
Yli=i ^P{^4i B фазовом пространстве, будет равно
(2тгЙ)"
276
Глава 20. Квантовая' статистика
При интегрировании по фазовому пространству N одинаковых частиц
(атомов, молекул) необходимо учесть, что перестановка двух частиц
не порождает новой конфигурации (в квантовой теории это
учитывается автоматически в силу симметрии или антисимметрии волновой
функции относительно перестановок). Поэтому при вычислении
статистической суммы интеграл по фазовому пространству необходимо
разделить на N\. Итак, в классическом пределе будем иметь
Z = ЩМ?» / е_£(Р")/Т*1 ■ • • ** *Ь • • ■ **н- (20-30)
20.5. Большое каноническое
распределение
При выводе распределения Гиббса предполагалось, что матрица
плотности незамкнутой системы зависит только от энергии. В
частности, число частиц в ней предполагалось фиксированным. Между
тем, как правило, число частиц в рассматриваемой системе также
может флуктуировать за счет обмена частицами с термостатом. Бели
исходить из принципа равных вероятностей макроскопических
состояний системы и термостата вместе, то вероятность того, что
система имеет N частиц и находится в состоянии с полной энергией EnN,
будет пропорциональна числу конфигураций термостата с
энергией -Eterm = -^tot - EnN и числом частиц JVterm = JVtot - N. Это число
конфигураций равно
Artot = exp [Sterm(Stot - EnN,Ntot - N)} =
^const-exp^^-*^),
где при переходе ко второму равенству сделано предположение, что
EnN < ^tof N < ^tot- Заметим, что
95 _ ! dS _ ц
дЕ~ ' dN ~~ Г'
где и — химический потенциал, а Т — температура, одинаковые для
термостата и выделенной системы. Это следует из первого
соотношения в (20.19), представимого в виде
dS = ^(dE + PdV - udN).
20.5. Большое каноническое распределение
277
В результате получаем вероятность микросостояния системы с
энергией EnN и числом частиц N в виде
wnN = Cexp (^N~TEnN^j , (20.31)
где С — нормировочная постоянная, определяемая условием
EE^ = i^E-p (*£) Е«р (-%0 • (20.32)
N п ЛГ ^ ' г» ^ '
Распределение (20.31) называется большим каноническим
распределением. Обозначая уровни энергии через EnN, мы хотим подчеркнуть
зависимость спектра гамильтониана от числа частиц. Суммирование
в (20.32) сначала выполняется по всем квантовым состояниям при
заданном N, и далее по всем N.
Энтропия физической системы или тела теперь может быть
вычислена по формуле (20.7):
-ЕЕ^1»^ = -ье- q£> + *р>, (2о.зз)
Т Т
где средние значения числа частиц и энергии равны
w = EE№w^> w = EE^«,n^
N п N п
Эти величины следует отождествить с термодинамическими
величинами: числом частиц и внутренней энергией тела. Опуская символы
средних значений в термодинамических соотношениях, оперирующих
только с такими средними, из (20.33) находим
ТЫС = E-nN-TS = F-fiN = fl,
откуда следует, что нормировочная постоянная в большом
каноническом распределении выражается через потенциал Я, так что
вместо (20.31) можем записать
/Tl + uN -
= ехр(^ -
^~^;П + ^~^Ь (20.34)
По аналогии со статистической суммой (20.23), введенной для
распределения Гиббса, можно определить большую статистическую сумму
278
Глава 20. Квантовая статистика
которая связана с П соотношением
П = -TlnZ.
В квазистатическом пределе вычисление Z сводится к интегрированию
по фазовому пространству согласно (20.30), и последующему
суммированию по N.
Рассмотрим идеальный газ — систему невзаимодействующих
между собой частиц. Отсутствие взаимодействия следует понимать как
возможность представления полного гамильтониана в матрице
плотности в виде суммы одночастичных гамильтонианов. Однако сам факт
применения равновесного канонического распределения означает, что
частицы могут обмениваться энергией при столкновениях, что и
приводит к установлению термодинамического равновесия. Поэтому при
рассмотрении процесса установления теплового равновесия
взаимодействием частиц пренебречь было бы нельзя. Но, ограничиваясь
описанием равновесного газа при заданной температуре, можно пренебречь
взаимодействием, если газ достаточно разрежен.
Для идеального газа можно говорить об одночастичных
состояниях к отдельной частицы (молекулы) с энергией ек н числах
заполнения пк, т.е. количестве частиц в состоянии к. Очевидно, что для газа
в целом
к к
Будем рассматривать частицы, находящиеся в состоянии к, как
незамкнутую подсистему с переменным числом частиц и применим к
ней большое каноническое распределение. Тогда вместо (20.34) будем
иметь
^-«p(n>+VgfcK)'
где Пк — потенциал Q для данной подсистемы. Для получения
термодинамических величин газа в целом нужно просуммировать Пк по
всем квантовым состояниям частиц:
к к
где парциальная статистическая сумма равна
Zfc=£exp(^>*). (20.35)
20.5. Большое каноническое распределение
279
Микроскопическое число частиц nk в состоянии А; флуктуирует около
среднего значения чисел заполнения
K> = Enfeexp(^±^b).
При этом полное число частиц газа, находящегося в замкнутом объеме,
может быть фиксированным:
N = J^{nk). (20.36)
к
В других случаях полное число частиц является переменной
величиной, тогда вместо (20.36) необходимо задать иное физическое условие.
Аналогично тому как было установлено постоянство температуры
и давления в термодинамически равновесной системе, можно
убедиться в постоянстве химического потенциала по всему объему
равновесной системы. Для этого достаточно представить энтропию с
помощью (20.33)
-txN + E + PV
S=- {\nwnN) = - ,
где в правой части стоят термодинамические (средние) величины N и
Е. Максимальность энтропии системы, разбитой на две подсистемы с
числом частиц Nx и N2, приводит к равенству
(Н _ /£2
Г, Т2'
откуда в силу равенства Тг = Т2 следует цг = fi2.
I
Глава 21
Квантовые газы
21.1. Статистики Ферми, Бозе и
Больцмана
Если частицы идеального газа являются фермионами, т. е. имеют
полуцелый спин, то, согласно принципу Паули, микроскопические
числа заполнения пк могут принимать лишь два значения: пк = 0,1.
(Здесь и далее символом <к» обозначаются квантовые состояния с
учетом проекции спина.) Поэтому в сумме (20.35) отличны от нуля лишь
два слагаемых:
Zfc=l + exp(^^,
и соответственно
= _Tb(l + «p(£-^)). (21.1)
Средние числа заполнения могут быть вычислены непосредственно
либо найдены дифференцированием Пк по химическому потенциалу
<nfc)-|>fcexp^ J--^r-exp(^i) + 1-
(21.2)
Формула (21.2) носит название распределения Ферми. Если идеальный
ферми-газ находится в замкнутом объеме, то сумма величины (21.2) по
всем квантовым состояниям должна равняться полному числу частиц:
21.1. Статистики Ферми, Бозе и Больцмана 281
Это соотношение определяет химический потенциал как функцию
температуры и числа частиц. Термодинамические величины всего газа в
целом получаются суммированием по одночастичным состояниям:
р = У^ efc
n = £«* = -Erb(l + exp(^)).
Для частиц целого спина — бозонов, микроскопические числа
заполнения могут быть любыми, поэтому Zj. представляет собой сумму
геометрической прогрессии:
*"|Н^)-т^Р?Т-
(21.3)
Теперь вместо (21.1) получаем
ilk = Tin (l - exp (fLrft)) ' <21-4)
откуда среднее значение чисел заполнения равно
^—^--р^)-! <215)
(распределение Бозе). Заметим, что для сходимости ряда (21.3) при
всех ек ^ 0 необходимо, чтобы ц < 0. Мы увидим далее, что случай
fj, = 0, ек = 0 также является допустимым, но требует особого
рассмотрения.
Химический потенциал бозе-газа в случае фиксированного полного
числа частиц газа определяется из условия
*-p*>-E=^ij-
Термодинамический потенциал Г2 всего газа в целом получается
суммированием Пк по квантовым состояниям:
П = £Гш(1-ехр(^))
Различие в поведении ферми- и бозе-газа отчетливо проявляется
при низких температурах; мы вернемся к этому вопросу ниже. При
282
Глава 21. Квантовые газы
высоких температурах, напротив, различие между двумя
статистиками стирается. С увеличением температуры заполняются все более
высокие уровни энергии, и в конце концов в каждом состоянии к в
среднем окажется значительно меньше одной частицы (пк) -С 1. Это
соответствует условию
ехр (^-^) < 1. (21-6)
при котором различие между выражениями (21.2) и (21.5) исчезает, и
можно положить
<nfc)=exp(^=^). (21-7)
Распределение (21.7) называется распределением Вольцмана. Оно
соответствует близкой к единице вероятности отсутствия частиц в А;-м
состоянии
W0 = еПк/т si 1
и малой вероятности одночастичного заполнения
^=^0ехр(^).ехр(^),
всеми остальными вероятностями можно пренебречь. Условие (21.6)
означает, что для больцмановского газа ц < 0, причем |д| ;» Т.
Получим химический потенциал атомного или молекулярного
идеального газа. Энергия одночастичного состояния имеет вид
Р2
где е± — внутренние энергетические уровни атомов или молекул,
вырожденные с кратностью gt. Вычислим статистическую сумму для
распределения Гиббса, описывая поступательное движение атомов квази-
классически:
_1_ / /• dpdr pV(2mr)\N
N\ \J (2тгЙ)з^е ) '
где ^н — статистическая сумма по внутренним состояниям:
21.1. Статистики Ферми, Бозе и Больцмана
283
Интегрирование по пространственным переменным дает объем V,
занимаемый газом, а в результате интегрирования по импульсам
находим
Z= —
N)
\2nh2)
3/2
\»у
N
Статсумма по внутренним состояниям зависит от природы частиц
газа. Если газ состоит из атомов и рассматриваются температуры, при
которых подавляющая часть атомов находится в основном состоянии,
то
Z.H « 50е-ео/Т,
где д0 — кратность вырождения основного состояния (например, если
спин атома равен 5, то д0 = 25 -f 1). При более высоких температурах
необходимо учитывать возбуждения; при этом в случае атомов речь
идет о суммировании по электронным состояниям, а в случае
молекул — еще и по колебательным и вращательным степеням свободы.
Поскольку N :» 1, для N\ можно воспользоваться формулой Стир-
линга
шЛП~ЛПп —,
е
где е — основание натуральных логарифмов. В результате находим
свободную энергию газа
Дифференцирование по объему дает давление газа
_9F _ NT
dv~~v~'
откуда получаем уравнение состояния Менделеева-Клапейрона
PV = NT. (21.8)
Чтобы вычислить химический потенциал, воспользуемся формулами
Nn = ^ = F + PV = F + NT,
откуда находим
ь2\3/2
"—И^Г*
(21.9)
284 Глава 21. Квантовые газы
Для применимости статистики Больцмана выражение под знаком
логарифма должно быть мало. Поскольку 2^н ^ 1, достаточным
условием является малость плотности газа:
* « Щ^. (21.10)
V ft3 К }
Здесь у/тпТ — характерное значение импульса частиц газа, поэтому
фазовый объем, занимаемый частицами, равен V(mT)3'2.
Соотношение (21.10) означает, что число квантовых состояний, приходящихся
на этот фазовый объем, существенно больше числа частиц.
Получим также уравнение состояния для квантовых газов,
подчиняющихся статистике Бозе или Ферми. Поскольку, как было показано
в п. 20.3, потенциал Г1 равен произведению давления на объем,
взятому с обратным знаком, то наиболее прямым способом получения
уравнения состояния является вычисление полного потенциала £1:
к
Будем рассматривать газы элементарных частиц, для которых
суммирование по внутренним состояниям сводится к умножению
статистических сумм на число спиновых состояний: 7Lfsa — gg, где да = 2s + 1
для частиц ненулевой массы и да = 2 для частиц массы нуль.
Суммирование по поступательным степеням свободы по-прежнему будем
производить квазиклассически:
Ef dpdr Уда f
„ ^9»/(W = (W./ *•
Подставляя выражения (21.1) и (21.4) в (21.11), находим
оо
Т -(2тгЙ)3
о
/ln(l±exp(^^))4V^
где мы перешли к сферическим координатам в импульсном
пространстве и проинтегрировали по углам. Здесь верхний знак соответствует
статистике Ферми, нижний — Бозе. Обозначив х2 = р2/(2тпТ) и
проинтегрировав по частям, получаем
PV - V9° i2mT^2 1 ХЫХ (21 121
о
21.1. Статистики Ферми, Бозе и Больцмана 285
В это уравнение входит химический потенциал ц, который должен
быть найден независимо. Другое полезное представление уравнения
состояния получается, если вычислить внутреннюю энергию газа:
о
Сравнивая с (21.12), получаем
PV = \е. (21.14)
о
Это соотношение справедливо и в предельном случае статистики
Больцмана, когда уравнение состояния имеет вид (21.8). Таким
образом, внутренняя энергия больцмановского газа, обусловленная только
поступательными степенями свободы, равна
Е = |iVT, (21.15)
а теплоемкость при постоянном объеме есть
Cv - &Г - 2N-
(Нетрудно также построить тепловую функцию: W — E + PV = |JVT,
откуда для теплоемкости при постоянном давлении получим СР =
Дальнейшее преобразование выражения (21.12) проведем в
приближении, когда отклонение распределения от больцмановского мало.
Для этого разлагаем подынтегральное выражение по степеням ех -*/т
и вычисляем явно интегралы по х. Основной член дает потенциал Г2
больцмановского газа, а поправочный член имеет различные знаки для
ферми- (—) и бозе- (+) статистики:
В этом выражении химический потенциал /i следует брать в больцма-
новском приближении (21.9), в котором он был получен ранее с
помощью распределения Гиббса. Приведем альтернативный вывод, исходя
286
Глава 21. Квантовые газы
из большого канонического распределения. Как отмечалось ранее, ц
в этом случае определяется из нормировочного соотношения для
полного числа частиц:
fe fc 0
Вычислив интеграл (он равен у/п/4), получаем снова
выражение (21.9). Потенциал Пв может быть найден непосредственным
интегрированием, либо из сопоставления с формулами (21.14), (21.15):
Пв = —NT. В результате из равенства il = —PV получаем уравнение
состояния больцмановского газа с квантовыми поправками
„ NT Л , 7Г3/2ЛГП3 \
r—T^WWry (21Л6)
где верхний знак отвечает статистике Ферми, а нижний —
статистике Бозе. Таким образом, давление ферми-газа несколько выше, чем
больцмановского газа. Это является прямым следствием принципа
Паули: если объем газа, и следовательно, и объем фазового пространства
уменьшается, то часть частиц будет переходить в состояния с большей
энергией и, следовательно, с большими значениями импульса, это
ведет к дополнительному росту давления при сжатии газа. Для бозе-газа
нет запрета на заполнение любых энергетических состояний,
поэтому сопротивляемость сжатию меньше, чем в больцмановском случае,
занимающем, в некотором смысле, промежуточное положение.
Заметим, что поправочный член в (21.16) представляет собой (по порядку
величины) отношение числа частиц к числу клеток в фазовом
пространстве, соответствующих различным квантовым состояниям.
Применимость сделанного приближения означает, что этот член мал, т. е.
клетки заполнены неплотно.
21.2. Вырожденный ферми-газ
С понижением температуры частицы ферми-газа все более плотно
заселяют низколежащие энергетические уровни, и в конце концов газ
оказывается в вырожденном состоянии, когда полностью заполнены
все клетки фазового пространства, соответствующие энергии,
меньшей граничной энергии Ферми eF. В случае нерелятивистских
скоростей частиц газа можно записать:
_ Pf
6f ~ 2m'
21.2. Вырожденный ферми-газ
287
где pF — импульс Ферми, определяемый из условия равенства полного
числа частиц числу квантовых состояний в фазовом объеме р < pF:
N=^L7p2dP=^^
2я*ГР J P «P- 6^2ft3 '
О
откуда находим
Нетрудно видеть, что граничная энергия Ферми совпадает с
предельным значением химического потенциала /г при низких температурах.
Действительно, распределение Ферми при Т —> 0 имеет вид
«-*
е(еР-м)/г + 1- 9^о 6р)'
где в — функция Хевисайда, а /х0 = /х|т=о- Таким образом, химический
потенциал ферми-газа при низких температурах положителен и
стремится к граничной энергии Ферми и0 = eF. Фактически распределение
по энергии близко к ступенчатому уже при температурах порядка
самой энергии Ферми; соответствующая температура называется
температурой вырождения. Температура вырождения
& (
Зтг2ЛГ\2/3
9aV )
(21.18)
зависит от плотности газа N/V и может быть весьма велика. Так,
для электронного газа в металлах Т0 ~ 105 градусов, что заведомо
превышает температуру плавления, поэтому в металлах электронный
газ находится в вырожденном состоянии. Как правило, электронный
газ сосуществует с системой положительно заряженных частиц (ионов
кристаллической решетки, положительных зарядов в плазме и т.д.),
компенсирующих пространственный заряд. Энергия кулоновского
взаимодействия между электронами, а также с положительными
зарядами обратно пропорциональна среднему расстоянию между ними, т. е.
это величина порядка (JV/V)1/3. Поскольку характерная кинетическая
энергия (21.18) пропорциональна квадрату этой величины, то с ее
увеличением (возрастанием плотности) относительный вклад
кулоновского взаимодействия в энергию становится все более малым. Таким
образом, ферми-газ с кулоновским взаимодействием с ростом плотности
становится все более идеальным.
288
. Глава 21. Квантовые газы
Чтобы найти уравнение состояния нерелятивистского
вырожденного ферми-газа, можно воспользоваться соотношением (21.14).
Внутренняя энергия при Т < Т0 газа получается интегрированием:
2тг2& J 2т Р Р Ют \ ge ) \V)
о
Таким образом, уравнение состояния имеет вид
Отметим, что уравнение PV5/3 = const является также уравнением
адиабаты больцмановского газа.
Выражение для энергии, полученное в пределе Т «С Т0, не зависит
от температуры. Можно показать, что тейлоровские разложения
термодинамических потенциалов ферми-газа при низких температурах не
содержат линейных по Т членов, откуда, в частности, следует, что
теплоемкость стремится к нулю при Т -> 0. Для этого нужно вычислить
интеграл
У2даУтпУ2 7 ^2de
Зтг2&3 J е(*-м)/т + 1
о
более точно. Переходя к переменной z = (e—fj.)/T, перепишем интеграл
в форме
и/Т
1 J e* + i J e* + l J e— + l
-и/Т О 0
5M J e* + l
о
где при переходе к последней форме записи было использовано
равенство
(е— + I)-1 = 1 - (е2 + I)"1
и верхний предел интегрирования (J./T заменен на бесконечность, что
эквивалентно пренебрежению экспоненциально малыми при Т —> 0
членами. Далее, разлагая подынтегральное выражение в ряд по Т, с
точностью до квадратичных по Т членов получаем
п gam^2^2VT2
о о — — —
П~П° 6л/2й3 '
21.2. Вырожденный ферми-газ
289
Cv = Т^ = S,
где через П0 обозначен потенциал при Т = 0. Напомним, что потенциал
П является функцией (V, Г, ц)\ чтобы вычислить энтропию при
постоянном N следует перейти к свободной энергии и выразить ц в нулевом
приближении с помощью (21.9) полагая ^н = gs. Далее,
дифференцируя по температуре, находим энтропию ферми-газа при низких
температурах:
&Г V 6 J Н2
При Г = 0 энтропия обращается в нуль в согласии с теоремой Нернста.
Ввиду линейности энтропии по температуре, эта величина совпадает
с теплоемкостью
&Г
она также обращается в нуль при Г —> 0. При этом молено показать,
что разность теплоемкостей при постоянном объеме и постоянном
давлении стремится к нулю еще быстрее — пропорционально Т3.
Представляет интерес вычисление термодинамических величин
для релятивистского вырожденного ферми-газа. Энергия каждой
частицы (включая энергию покоя) тогда равна с = су/т2с2 + р2, где с —
скорость света. Повторение вычислений для этого случая приводит к
формуле
П - PV - A + (shA-8sn(A/2))/3
~Е~ Е ~ shX^A ' <ЛЛЯ>
где
4 тс
и рр дается прежним выралсением (21.17). В улыпрарелятпивистпском
случае рр ~^> тс приближенно имеем е = ср и функция от А в правой
части (21.19) стремится к 1/3. Таким образом, для
ультрарелятивистского ферми-газа получаем соотношение
PV = 1-Е (21.20)
с коэффициентом в правой части, в два раза меньшим, чем в
нерелятивистском случае. Здесь это соотношение было найдено в
пределе Т —> 0, однако вычисление, аналогичное проведенному в п. 21.1,
показывает, что оно справедливо при любой температуре. Такое
соотношение между плотностью энергии и давлением характерно для
тензора энергии-импульса безмассового поля (см. ч. I): его след
равен нулю. В частности, именно такое соотношение используется в
теории горячей Вселенной при температурах, значительно превьппающих
энергию поля частиц.
10 - 8210
290
Глава 21. Квантовые газы
Энергия вырожденного ультрарелятивистского ферми-газа равна
о
поэтому с помощью (21.20) находим уравнение состояния
РУ4/з = const. (21.21)
Релятивистский вырожденный ферми-газ оказывает, таким образом,
меньшее сопротивление сжатию, чем нерелятивистский.
Это различие играет чрезвычайно важную роль в астрофизике.
С ним связан механизм потери устойчивости белых карликов и
нейтронных звезд, давление в которых создается вырожденным ферми-
газом электронов и нейтронов соответственно. Согласно
существующим представлениям, при остывании звезды, израсходовавшей запас
ядерного горючего, происходит ее гравитационное сжатие до
металлической плотности, когда основным фактором, препятствующим
дальнейшему коллапсу, становится давление электронного газа. Пока
электронный газ (находящийся в вырожденном состоянии) является
нерелятивистским, его сопротивления сжатию по закону Р ~ V~ '
достаточно, чтобы обеспечить равновесие звезды, которая и будет
представлять собой белый карлик. Однако если масса звезды превышает
некоторое предельное значение — чандрасекаровский предел
(порядка 1.4 М0), то плотность звезды и средняя энергия электронов будут
столь велики, что электронный газ становится релятивистским. В этом
случае имеет место уравнение состояния (21.21), и сопротивление
гравитационному сжатию уже недостаточно для удержания звезды в
равновесном состоянии.
При гравитационном сжатии белого карлика становится
энергетически выгодным обратный бета-распад: превращение протонов в
нейтроны в результате реакции р + е —> п + ve, где символы р, е, п, ve
обозначают протон, электрон, нейтрон и электронное нейтрино. В
обычных условиях такая реакция энергетически запрещена, поскольку
суммарная масса протона и электрона меньше массы нейтрона. Однако
гравитационное притяжение делает ее возможной: недостаток массы
компенсируется увеличением по абсолютной величине отрицательного
гравитационного потенциала звезды. Поглощение электронов
устраняет препятствие дальнейшему сжатию, которое будет происходить до
тех пор, пока все вещество не превратится в нейтроны. Поскольку
нейтроны также подчиняются статистике Ферми, то ситуация
повторяется на уровне более тяжелых нейтронов. Нейтроны также оказываются
21.2. Вырожденный ферми-газ
291
в нерелятивистском вырожденном состоянии, если полная масса
звезды не превышает некоторое критическое значение, оцениваемое в 2-3
массы Солнца. В результате возникают нейтронные звезды, давление
в которых создается вырожденной нерелятивистской нейтронной
жидкостью и плотность которых имеет порядок плотности тяжелых
атомных ядер. При значениях массы, превышающих критическую,
нейтроны становятся релятивистскими и равновесие невозможно.
Гравитационный коллапс дальше не может сдерживаться никакими известными
физическими механизмами, при этом должны образовываться черные
дыры. Заметим, что типичный радиус нейтронной звезды (с массой
порядка массы Солнца) имеет порядок 10 км, что всего в три раза
превышает ее гравитационный радиус.
В заключение этого раздела дадим обоснование модели Томаса-
Ферми, применявшейся в п. 19.3 для описания многоэлектронных
атомов. В этой модели принимается, что электроны, движущиеся в
самосогласованном центральном поле tp(г), создаваемом ими самими, а
также в поле ядра, образуют вырожденный ферми-газ. Все состояния
с кинетической энергией, меньшей абсолютной величины
потенциальной энергии,
заполнены (это неравенство является условием удержания электронов
в связанном состоянии), что соответствует полному числу электронов
внутри сферы радиуса г, равному
4п7р> dp V(r).*=VWW
о
где V(r) = 4тгг3/3, p(r) = y/2m\etp\. Таким образом, плотность
электронов в атоме оказывается равной
n(r) = (2m|e^(r)|)3/2(37r2ft3)-1.
С другой стороны, потенциал ^з(г) должен удовлетворять уравнению
Пуассона
2
Д <р = dl<p + -dr<p = -4тгеп(г)
г
с граничным условием
Um лр(г) = Z\e\,
учитывающим присутствие ядра с зарядом Z\e\. В результате замены
переменных получаем уравнение Томаса-Ферми (19.11).
ю*
292
Глава 21. Квантовые газы
21.3. Бозе-газ при низких температурах
Идеальный газ, состоящий из частиц целого спина, с понижением
температуры проявляет совершенно иные свойства. Бели полное число
частиц в рассматриваемом объеме фиксировано, то до тех пор, пока
движение (нерелятивистских) частиц можно считать
квазиклассическим, должно выполняться нормировочное соотношение
Химический потенциал ц бозе-газа, как было отмечено в п. 21.1,
не может быть положительным. Между тем из соотношения (21.22)
следует, что при уменьшении
температуры функция ft(T) растет и при
некоторой конечной температуре Т0
химический потенциал должен обратиться в
нуль (рис. 21.1). При Т < Т0 нулевое
значение р, должно сохраняться и,
таким образом, формула (21.22) перестает
быть справедливой. Вспомним, что
соотношение (21.22) является квазиклас-
_ „„ н _, сическим пределом общего нормировоч-
Рис. 21.1. Химический
попито соотношения
тенциал бозе-газа
"=X>t>-E^,[(Et-,)/rl-r Р"Ч
где суммирование ведется по всем квантовым состояниям. Замена
суммирования интегрированием по импульсу р при Т < Т0 становится
неправомерной, поскольку в основном состоянии с нулевой
энергией может аккумулироваться большое число частиц, в то время как
вклад этого состояние в интеграл (21.22) равен нулю. Если
по-прежнему вклад состояний с ненулевыми значениями импульса определять по
формуле (21.22) (что является хорошим приближением), то при Г ^ Г0
из (21.23) получим
оо
p2dp
«^(wf)
Замена неременной интегрирования р = zs/lmT приводит к
соотношению
N = N0 + AT3/2, (21.24)
21.3. Бозе-газ при низких температурах
293
где постоянная равна
А= VgaV2m3/2 °[ z2dz
I
ж2Н3
о
Температура бозе-конденсации Т0 определяется из условия
*о(Т0) = О,
означающего, что эффективное заполнение основного состояния еще
не началось. Поэтому из формулы (21.24) при Г = Г„ находим N =
AT*'2, и, следовательно,
А = NT~3'2. (21.25)
Подставляя (21.25) в (21.24), получаем функцию NQ(T) при Т < Т0 в
виде
N,
°(T,=wN£n
Таким образом, при Т <Т0 происходит накопление частиц в основном
состоянии с нулевой энергией, так что при абсолютном нуле
температуры все частицы переходят в это состояние. Этот процесс называется
бозе-конденсацией.
Итак, мы нашли, что нормировочное соотношение (21.23) при
произвольных значениях Г должно быть представлено в форме
N = N[1- (1\3/2\ 9(Т _т)+ V9a 7 P^dp
(, UJ ) '• ) + *-»/«,[(£-,)/*■]-I'
(21.26)
где в(Т0 — Т) — функция Хевисайда. Из этого равенства обращение в
нуль химического потенциала р. при Т < Т0 следует автоматически.
Для вычисления термодинамических величин воспользуемся тем
обстоятельством, что частицы бозе-конденсата не дают вклада во
внутреннюю энергию газа, поэтому при всех Г справедливо
соотношение (21.13) (с нижним знаком). В частности, при Т < Т0 будем
иметь
E = AlVT5/2, л g.V2m3/2 7 xUx
1 х n2ha J e*2 -1"
о
Дифференцируя по Г, находим теплоемкость при постоянном объеме
Cv = b-AJfT*l2.
294
Глава 21. Квантовые тазы
С другой стороны, Cv = TdS/dT, где S — энтропия, откуда с учетом
равенства нулю энтропии при Т = 0 находим
S = -A.VT3/2.
3 а
Получим теперь выражение для свободной энергии:
F = E-TS = —АтУТ5'2, (21.27)
о
которая в силу равенства \i = 0 совпадает с термодинамическим
потенциалом П. Дифференцируя (21.27) по объему, находим давление
Р--(**} -2-АТ*'2
р~ \dv)T~3AlT '
при этом нетрудно проверить выполнение соотношения PV = -^Е.
Давление бозе-газа в области конденсации с уменьшением
температуры убывает и при Т = 0, когда все частицы переходят в состояние с
нулевой энергией, обращается в нуль. При этом во всей области Т <Т0
давление не зависит от объема.
Обсудим поведение бозе-газа в правой окрестности точки Т = Т0.
Справа от этой точки /х ф О, поэтому для внутренней энергии следует
использовать выражение (21.13). Химический потенциал при Т > Т0
определяем из нормировочного условия (21.26), которое, добавляя и
вычитая величину AT3/2, можно переписать в виде
N ~АТ + *2h3 J ^ехр(гз - £) - 1 е*2 - \) **'
(21.28)
Детальный анализ этого соотношения показывает, что при Т = Т0
происходит фазовый переход второго рода: теплоемкость Cv при Т =
Т0 непрерывна но ее производная dCv/&T испытывает разрыв. Сама
теплоемкость в точке Т0 максимальна и имеет излом.
21.4. Фотоны и фононы в равновесии
с веществом
В предыдущем разделе мы рассматривали свойства идеального
бозе-газа, полное число частиц которого фиксировано. Другой важный
случай статистического распределения Возе представляет система, в
21.4. Фотоны и фононы
295
которой число частиц зависит от температуры таким образом, что
химический потенциал тождественно равен нулю. Подобная ситуация
имеет место, например, для фотонного газа, находящегося в
термодинамическом равновесии с нагретым веществом — плазмой, твердым
телом и т. д. Излучение, находящееся в динамическом равновесии с
излучающим веществом, называется черным. Именно анализируя спектр
черного излучения, Плате открыл существование квантовых
закономерностей, управляющих его свойствами (см. 13.1). Теперь мы
можем получить выражение (13.2), последовательно применяя
формализм квантовой статистики.
Термодинамическое равновесие между фотонным газом и
излучающим веществом устанавливается в результате баланса процессов
излучения и поглощения квантов. С увеличением температуры этот баланс
изменяется в сторону увеличения числа квантов, причем добавление
каждого нового фотона не должно изменять свободную энергию,
которая в термодинамическом равновесии, устанавливающемся при
постоянных Т и V, должна быть максимальна (20.3), |^ = 0. Таким
образом, условием динамического равновесия фотонов с излучающим
веществом является равенство
(H)TiV=" = °-
Полное число фотонов, таким образом, будет определяться
распределением Бозе при /i = 0:
fc к еХр\ Т ) L
где суммирование производится по всем квантовым состояниям.
Состояния фотонов определяются волновым вектором fc и поляризацией
(проекцией спина на импульс). Для безмассовых частиц со спином, в
отличие от массивных, имеются всего два спиновых состояния,
независимо от величины спина: спин может быть ориентирован либо вдоль,
либо против импульса. В случае фотонов, спин которых равен единице,
два независимых спиновых состояния однозначно соответствуют двум
независимым направлениям вектора Е электрического поля
электромагнитной волны в плоскости, ортогональной fc. Фотоны в конечном
объеме обладают дискретными значениями волнового вектора к,
проекции которого на координатные оси равны Li//2n, где v — целое
число, L — размер области. В результате суммирование по состояниям
фотонов в (21.29) можно заменить интегрированием по fe согласно со-
296
Глава 21. Квантовые газы
отношению
V
где V = L3 и множитель 2 отвечает суммированию по проекциям
спина. Переходя к сферическим координатам в пространстве к и
учитывая, что шк = с\к\, получаем для термодинамического потенциала П,
совпадающего в силу равенства /* = 0 со свободной энергией,
следующее выражение:
о
Интегрируя по частям и учитывая значение интеграла
оо
/
X3dx _ 7Г4
е* -1 ~~ 15'
о
находим
J^-^VT4, ст =
Зс ' ' ' " бОс2^3'
Дифференцирование по Т дает энтропию черного излучения
S = Ц^УТ3, (21.30)
о С
откуда по формуле 22 = F + Т5 вычисляем внутреннюю энергию
E=—VT4
с
(закон Стефана — Больцмана). Дифференцирование свободной
энергии по объему дает
из этих формул видно, что для фотонного газа имеет место
ультрарелятивистское соотношение
PV = \е.
3
Теплоемкость Cv пропорциональна кубу температуры; так же как и
энтропия, она обращается в нуль при Т —> 0.
21.4. Фотоны и фонолы
297
Получим выражение для спектрального распределения излучения.
Для этого перейдем от суммирования по состояниям к
интегрированию по к в выражении для внутренней энергии
к
В результате для энергии излучения, приходящейся на интервал
частот dw, получаем формулу Планка
dE _ V hw3
dw~ ~ 7Г2сзея«/т_1- (21-32)
Максимум в спектре черного излучения приходится на частоту
'винтах — **.\j j. ,
которая линейно растет с увеличением Т (закон смещения Вина). В
пределе малых частот hu <tC T из (21.32) находим не зависящее от h
распределение Рэлея — Джинса
dw я^с3
которое может быть получено методами классической статистики. В
пределе fiw ;» Т имеем экспоненциальное обрезание спектра:
dw я^с3
Число фотонов, приходящееся на интервал частот dw, получается
переходом к интегрированию в формуле (21.29):
dN V и2
dw т^с3 е""/7" - 1
и отличается от спектральной плотности энергии отсутствием
множителя Hw. Полное число фотонов в объеме V получается
интегрированием:
где дзета-функция представляет значение интеграла
2,
«3Ч/Й
298
.Глава 21. Квантовые газы
Адиабатическое сжатие фотонного газа (процесс при постоянной
энтропии), как следует из формулы (21.30), характеризуется
постоянством величины VT3. С учетом выражения (21.31) находим связь
между давлением и объемом:
РУ4/з = const)
что совпадает с уравнением состояния вырожденного
ультрарелятивистского ферми-газа. Поэтому, так же как и в последнем случае,
равновесных гравитирующих фотонных конфигураций существовать не
может. Заметим, что болъцмановский газ в обычных звездах имеет
уравнение адиабаты PV5'3 = const, при котором газ может
противостоять гравитационному коллапсу. Фотонная компонента вещества
звезды не играет роли в установлении механического равновесия, но
имеет важнейшее значение для общего теплового баланса звезды,
поскольку излучение звезды приводит к ее остыванию.
Другой важный пример бозе-системы с у. = 0 представляет собой
фононный газ в твердых телах. Тепловые свойства твердых тел (для
определенности будем говорить о кристаллах) обусловлены
колебаниями атомов кристаллической решетки около равновесных положений.
Малые колебания имеют характерный для данной решетки спектр
частот и могут распространяться в виде звуковых волн. Хотя здесь речь
идет о классических колебаниях, более точное описание решетки на
основе квантовой механики приводит к выводу, что эти колебания
квантованы, т. е. представляют систему квантовых гармонических
осцилляторов. Рассматривая операторы рождения и уничтожения в фо-
ковском пространстве соответствующих гармонических осцилляторов
как порождающие и уничтожающие квазичастицы — фонты,
получаем квантовую статистическую систему фононов как квазичастиц.
Описание фононного газа, находящегося в равновесии с
кристаллической решеткой, отличается от предыдущего лишь тем, что скорость
распространения фононов имеет другое значение, и, имеются как два
поперечных, так и одно продольное состояния поляризации. Скорости
распространения поперечных vx и продольных v» волн различаются
между собой, но можно ввести усредненную скорость v согласно
соотношению
3 2 1
тогда переход от суммирования по состояниям к интегрированию по
волновому вектору будет осуществляться так:
у> У4жк2 dk _ 3 Уы2 du
2f^ (2тг)3 ~ 2 7Г2и3 '
21.4. Фотоны и фононы
299
В результате для свободной энергии газа фононов находим
тг2 VT4
30 (Йг;)3'
откуда энтропия равна
а внутренняя энергия имеет вид
7T2VT4
J v 15 (hv)3 '
E =
10(ftu)3'
Дифференцирование этого выражения дает формулу Дебая для
теплоемкости:
_ 2ж2УТ3
Су ~ 5(fi«)3 •
Представление о фононах справедливо лишь при низких
температурах. При высоких температурах непосредственно рассматривают
колебания решетки как систему гармонических осцилляторов со
частотами шк, отвечающими J\f нормальным колебаниям. Вычисление
статистической суммы системы осцилляторов приводит к
следующему выражению для свободной энергии
^кол=Т]Гш(1-е-^)
При высоких температурах Т :» fkjv можно разложить экспоненту и
ввести усредненную частоту колебаний согласно
ЛГЫы = ^> ^ In шк.
к
В результате получим
FKoa=MTln(^y
Соответствующая внутренняя энергия равна
-'-'кол — 'v л >
а теплоемкость принимает постоянное значение, равное полному
числу колебательных степеней свободы. В этом предельном случае
теплоемкости различных веществ, приведенные на одну степень свободы,
одинаковы (закон Дюлонга и Пти).
Дополнение
Суперсимметрия и метод
факторизации
Д.1. Суперсимметричный осциллятор
Рассмотрим двумерный изотропный гармонический осциллятор,
полагая для простоты Й = т = ш = 1:
H=-{p\+pl+x\+xl).
Введем лестничные операторы ак = -js{xk + ipk), ак = тт^1* — V*)>
к — 1,2. Имеем
поэтому
Гильбертово пространство состояний имеет базис, состоящий из
собственных векторов операторов а^аг и а^а^:
\п1,п2) = Щ^Щ^1\0,0), (Д.1)
/П,! \/П
302 Дополнение. Суперсимметрия и метод факторизации
где |0,0) — основное состояние, имеющее энергию Е = 1.
Спектр гамильтониана вырожден с кратностью щ + п2 + 1:
н lnnn2) = (ni +n2 + l) In^na). (Д.2)
Это вырождение можно связать с симметрией гамильтониана
относительно поворотов в плоскости x1,i2. Генератор вращений имеет вид
L — {х2рх ~х1р2),
и является интегралом движения: [Н, L] = 0. Выразив L через
лестничные операторы
L = г{а^ах - afa2), (Д.З)
можно заметить, что сохраняется не только L, но и каждое из
слагаемых в отдельности: L = i(Q+ — Q), где
Q = a+a2, Q+ = ofo (Д-4)
(здесь учтено, что операторы, относящиеся к разным степеням
свободы, коммутируют). Оператор Q превращает квант возбуждения вдоль
хг в квант возбуждения вдоль х2:
<Э|«1>«2> = Vnl(n2 + 1) К -1,"2 + 1).
при этом, поскольку частоты равны, энергия не изменяется.
Перейдем теперь к системе двух осцилляторов, один из которых
является «фермиевским», т.е. соответствующие лестничные операторы
с, с+ нильпотентпны, с2 = 0, с+ = 0, и удовлетворяют соотношению
антикоммутации
{с,с+} = сс+ + с+с = 1.
В этом случае гамильтониан, симметричный относительно замены
кванта типа а («бозон») на квант типа с («фермион»), имеет вид
Н = a+a+ - + С+С- - = a+a + c+c. (Д.5)
it dt
Собственные векторы могут по-прежнему быть записаны в виде (Д.1)
с af = a+, a2 = с+, однако в силу нильпотентности с+ фермиевские
состояния могут иметь пс = 0,1. Таким образом, базис в гильбертовом
пространстве образован следующими векторами:
|по,0), |па;1), па = 0,1,2,... (Д.6)
Д.1. Суперсимметричный осциллятор 303
Аналогом операторов (Д. 4) будут величины
Q = a+c, Q+ = с+а. (Д.7)
Оператор Q превращает фермион в бозон, a Q+ — бозон в фермион:
Q\naA) = y/n~±\\na + l,Q),
причем действие Q на |пв, 0) и действие Q+ на \па, 1) дает нуль-вектор.
Эти операторы коммутируют с гамильтонианом:
[H,Q] = [H,Q+]=0, (д.8)
а их антикоммутатор снова квадратичен по операторам рождения и
уничтожения
{Q,Q+} = QQ+ + Q+Q = a+a + c+c. (Д.9)
Поскольку Q содержит нильпотентный оператор с, то Q и Q+ также
нильпотентны:
Q2 = Q+2 = 0.
Выделяя эрмитову и антиэрмитову части
Q = Q1 + iQ2, Qt^Qv Qt=Q2, (ДЛО)
получим, что QY и Q2 антикоммутативны:
{Qi,Q2}=o,
а их квадраты равны между собой:
Ql = Q22 = {Q+,Q}- (Д.П)
Наконец, в силу (Д.9) гамильтониан (Д.5) совпадает с (Д.П):
H={Q+,Q}. (Д.12)
Из этого представления очевидно сохранение операторов Q и Q+ (Д. 8).
Совместно величины Н, Qx, Q2 образуют следующую простейшую
^-градуированную алгебру — супералгебру, состоящую из
коммутаторов и антикоммутаторов:
{Qi, Qj} = 2StjH, г, j = 1, 2, (Д.13)
304
Дополнение. Суперсимметрия и метод факторизации
[Qi,H} = 0. (Д.14)
Супералгебра общего вида состоит из четных (Ч) и нечетных (Н)
операторов и имеет структуру
[Ч,Ч]~Ч,
[Ч,Н]~Н, (Д.15)
{Н,Н}~Ч,
причем структурные константы должны удовлетворять
соответствующим условиям антисимметрии (для первых двух строк) и симметрии
(для последней). Кроме того, должно выполняться обобщенное
тождество Якоби
£>{Л,{В,С]] = 0,
цикл
где скобки { ] означают коммутатор или антикоммутатор в
соответствии с правилами (Д.15), а п = ±1 в зависимости от порядка
следования нечетных элементов (плюс, если этот порядок получается
циклической перестановкой их порядка в первом члене).
В супералгебре (Д. 13), (Д-14) нечетными элементами являются Qt,
а четным — гамильтониан Н. Гамильтониан коммутирует с Qt, что
является выражением его суперсимметрии. С физической точки
зрения условие суперсимметрии, очевидно, сводится к совпадению числа
бозонных и фермионных осцилляторов и совпадению энергий
элементарных бозе- и ферми-возбуждений.
Следует обратить внимание на сокращение «половинок» в (Д.5):
основное состояние, в отличие от чисто бозонного случая (Д.2), будет
иметь нулевую энергию:
Н |0,0) = 0.
Важным свойством суперсимметричных систем является
неотрицательность энергии. Неотрицательность спектра рассматриваемого
гамильтониана следует из возможности его записи в виде Н = Q\ = Q\,
где Qx и Q2 эрмитовы. Далее, для базисных состояний (Д.6), очевидно,
будем иметь
Д>о,0)=по|па,0),
Я|па,1> = (па + 1)|п0,1),
откуда видно, что основное состояние имеет нулевую энергию и не
вырождено, а все возбужденные состояния двукратно вырождены. Это
вырождение можно понять и не прибегая к конкретному построению
базиса, что позволяет обобщить утверждение на гамильтонианы более
Д.1. Суперсимметричный осциллятор 305
общего вида. А именно: выберем общий собственный вектор
коммутирующих эрмитовых операторов Q1 и Н:
Gi№i>=«i№i>. Н\ф1)=а\\ф1)
и построим новый вектор \ф2) = Q2 \Ф\)- Покажем, что он также
является собственным вектором оператора Qx с собственным значением
Qx Ш = Q1Q2 Ш = -Q2Q1 K> = -<?iQ2 \Фг) = -<h IV>2> •
Далее, поскольку [H, Q2] = 0, имеем
H \ф2) = HQ2 \фх) = Q2H \фг) = q\Q2 \фх) = q\ \ф2) ,
т.е. новый вектор является собственным вектором гамильтониана с
тем же самым собственным значением энергии. Заметим, что \ф^) и
\ф2) совпадают тогда и только тогда, когда qx = 0. Отсюда следует, что
все положительные собственные значения гамильтониана двукратно
вырождены.
Величина Q, называемая суперзарядом, генерирует преобразования
суперсимметрии. Посмотрим, какой вид будут иметь конечные
преобразования. В чисто бозонном случае, когда аналогичные
преобразования порождаются оператором L (Д-3), конечные преобразования
векторов состояния имеют вид
ф -+ е^ьф,
где <р € R — параметр преобразования. Операторы при этом
испытывают унитарное преобразование, например
что при бесконечно малом <р отвечает вариации
8а2 = i[<pL, a2\ = <ра^. (ДА6)
В случае преобразования суперсимметрии, генерируемого оператором
Q, мы также должны иметь
SB = i[eQ,B],
где е — параметр преобразования. Если В — фермионный оператор
(например, В = с+), то будем иметь
8с+ — г[еа+с, с+] = ia+[ec,c+].
306 Дополнение. Суперсимметрия и метод факторизации
Но эта величина не имеет ожидаемого вида (Д. 16), если е —
обычное число, и потому бесконечно малые преобразования не могут быть
экспоненциированы. В то же время для преобразования бозонных
переменных противоречия не возникает:
5а = i[ea+c,a] = iec[a+,a] = —ice. (Д-17)
Выход состоит в том, чтобы считать с величиной, коммутирующей со
всеми бозонными переменными, но антпикоммутпирующей с фермион-
ными. В этом случае
<£с+ = г(ба+сс+ — с+еа+с) = iea+(cc+ + с+с) = iea+,
в то время как равенства (Д. 17) не изменятся. Итак, параметрами
преобразований суперсимметрии должны быть элементы алгебры
Гроссмана, удовлетворяющие соотношениям антикоммутации как между
собой
{с1,б2} = 0,
так и со всеми фермионными операторами:
{е,с} = 0, {е,с+} = 0,
но коммутирующие с бозонными операторами:
[е,о]=0, [е,о+]=0.
Экспоненциирование супералгебры с помощью набора грассмановых
параметров для нечетных элементов и числовых параметров для
четных элементов порождает супергруппу.
Д. 2. Суперсимметричная квантовая
механика и метод факторизации
Суперсимметрия может иметь место и для более сложных
нелинейных систем. Будем по-прежнему исходить из формы
гамильтониана (Д.12), однако не предполагая для операторов Q и Q+ формы (Д.7).
В силу нильпотентности оператора с оператор Q должен снова быть
линейной функцией с, но может зависеть отоио+ нелинейным
образом:
Q = А+с,
где А+ — некоторая функция от операторов а и а+, и соответственно
Q+ = с+А.
Д. 2. Метод факторизации 307
Введенный таким образом оператор суперзаряда и сопряженный к
нему по-прежнему нильпотентны:
Q2 = Q+2 = 0
и коммутируют с Н:
[Н, Q] = [QQ+ + Q+Q, Q] = QQ+Q + Q+Q2 - Q2Q+ - QQ+Q = 0.
Поскольку «фермионное» пространство состояний двумерно
(подчеркнем, что речь идет не обязательно о ферми-частицах, суперсимметрия
может иметь место в самых разных физических системах), то удобно
ввести матричное представление, такое же, как для спина 1/2,
записывая состояния с пс = 1,0 в виде
Тогда операторы с и с+ будут матрицами:
"ш ~ iav _ [0 0\
2 ~ V1 О) '
-{о о)-
с =
<тх+ го-„
ст =
(Д-18)
где
2
Гамильтониан приобретает вид диагональной матрицы
н=(%+ £_)=hA>A+}+T[A>A~*]> (дл9)
Н_ = А+А, Н+ = АА+, (Д.20)
откуда видно, что «фермионная» степень свободы появляется, когда
оператор А не перестановочен с А+. В этом случае операторы А и А+
имеют разные спектры; в частности, один из них может иметь ядро:
Аф = 0, а другой — нет. Именно такова ситуация в случае
гармонического осциллятора: оператор а имеет ядро аф0 = 0, ф0 является
основным состоянием, а оператор а+ ядра не имеет. В дальнейшем
будем предполагать, что существует состояние ф0, такое, что Аф0 = 0,
при этом Н_ф0 = 0 и вектор
*-=Ш
308 Дополнение. Суперсимметрия и метод факторизации
будет собственным вектором гамильтониана, соответствующим
нулевому собственному значению
Уравнение Н_ф0 = 0 является однокомпонентным уравнением Шре-
дингера, и мы будем предполагать, что оператор Н_ имеет
стандартный вид одномерного оператора Шредингера
Покажем, что представления гамильтониана в факторизованном
виде (Д.20) можно построить, если известна функция ф0, отвечающая
нулевому собственному значению
-\ф'о+У_ф0 = 0.
Выражая отсюда потенциал V_ и подставляя его в (Д.21), будем иметь
2 \dxj ^ 2ф0
Это выражение представимо в виде Н_ = А+А, где
Л = h (s " ^оУ), л- = -±= (А + МоУ). w.22)
Соответственно суперсимметричный партнер Я+ будет иметь вид
где
V+ = V_ - (Ъхф0)" = -V_ + [(In V0)f ■
Покажем, что оба оператора Н± имеют идентичные спектры с
точностью до отсутствия у Н+ ядра. Пусть ф~ — собственные векторы
оператора Н_:
Н_ф~ = Е-ф~.
Построим вектор Аф~ и подействуем на него оператором Н+:
Н+{Аф~) = АА+(Аф~) = АН_ф~ = Е~{Аф-) (Д.23)
Д. 2. Метод факторизации
309
(заметим, что соотношение Н+А = АН_ является операторным
тождеством). Из (Д.23) видно, что Аф~ является собственным вектором
Н+, если только Е~ ф 0 , т. е. п Ф 0. Если условиться нумеровать
собственные векторы Н+ в уравнении Н+ф+ = Е+ф+ также от п = 0, то
можем написать
V-+ = -т^=Аф-+1.
Это соотношение является рекуррентной формулой, аналогичной
соотношению фп = (п + 1)-1/2£Ц^п+1 для гармонического осциллятора.
В этом последнем случае имеем
х2 1
и соответственно
Е~=п, Е+=п+\, п = 0,1,2,...,
что находится в полном соответствии с анализом, проведенным выше.
Рассмотрим простую задачу с ^-образным потенциалом. Как мы
видели ранее, дискретный спектр состоит из единственного собственного
значения. Построим лестничные операторы для этой задачи. Пусть
К. = -!<*(*) +у, А>0.
Из условия склейки ф'{+0) - ф'(-0) = -Хф(0) находим
^ = Vr"A|I|/2'
отсюда получаем лестничные операторы (Д. 22):
Отсюда Н, = АА+, и соответствующий потенциал равен
"+-!*<•>+£.
Этот потенциал имеет характер барьера, поэтому у оператора Н+
связанные состояния вообще отсутствуют.
310 Дополнение. Суперсимметрия и метод факторизации
Рассмотрим теперь потенциал в виде суммы двух дельта-функций
(одномерная модель молекулярных сил):
V =
2а
(8{х - а) + 5{х + а)).
В этом случае гамильтониан имеет два состояния дискретного спектра,
отличающиеся четностью: основное (четное) и возбужденное
(нечетное). Четное имеет вид
Фо = <
(Секх, х < -а,
Bckkx, \x\ < а,
Се
-кх
х > a
с условием склейки логарифмической производной
А = ka(thka + l).
Нечетное состояние есть
(-Секх, х<-а,
i>i = \ В sh кх, \х\ < а,
Се
-кх
(Д-24)
(Д.25)
(Д-26)
х > а
при условии
А = fta(cth ka + 1).
В суперсимметричной форме записи будем иметь пару потенциалов
h2
(Д-27)
(Д-28)
где к0 — решение уравнения (Д.25), и дополнительный потенциал V
имеет вид
fl,
х < —a,
V = [(In Vo)f = k*{ 1 - ch"2 k0x, \x\ < a,
IL
x > a.
Потенциал (Д.27) имеет основное состояние вида (Д.24) с нулевой
энергией и возбужденное состояние вида (Д-26). Для потенциала (Д.28)
должно быть одно состояние, причем дельта-функция теперь
соответствует отталкиванию. Однако появляется дополнительный потенциал
Д. 2. Метод факторизации
311
V, который и приводит к появлению связанного состояния. Это
состояние является четным и имеет энергию нечетного состояния в поле
V_. Преобразование суперсимметрии связывает четное и нечетное
состояния.
Изложенная схема на самом деле была известна значительно
раньше открытия суперсимметрии1. Она была переоткрыта Виттеном в
1981 г. в связи с суперсимметрией как «суперсимметричная квантовая
механика» 2. Вернемся к исходному представлению (Д.19),(Д.20) и
будем рассуждать иначе. Чтобы получить гамильтониан, квадратичный
по оператору импульса, операторы А и А+ следует выбрать в виде
A=-j=(ip + W), A+ = -j=(-ip + W), (Д.29)
где W — произвольная функция координаты х («суперпотенциал»).
В случае гармонического осциллятора W = х и мы возвращаемся к
обычным операторам рождения и уничтожения. В общем случае из
формулы (Д.19) получаем матричный гамильтониан
Существенно, что один и тот же суперпотенциал W определяет «бозон-
ную» часть гамильтониана (пропорциональную единичной матрице) и
«фермионную».
Как мы видели выше, важнейшим условием суперсимметрии
является существование невырожденного основного состояния с нулевой
энергией. В общем случае произвольного W это не так, и если нулевого
уровня нет, то мы получаем ситуацию, известную как спонтанное
нарушение суперсимметрии. Покажем, что наличие или отсутствие
невырожденного уровня с энергией Е = 0 определяется глобальными
свойствами функции W(x) и не зависит от ее конкретного вида. Заметим,
что в представлении (Д.19) заранее не известно, какой из операторов,
А или А+, имеет ядро, выше мы предполагали, что А+ не имеет ядра.
Это соглашение также можно отменить для общности. Итак, задача
сводится к нахождению решения уравнений Аф — 0 или А+ф = 0,
откуда автоматически будет следовать Н_ф = 0 или Н+ф = 0
соответственно. Верно и обратное: если Н_ф = 0, то отсюда Аф = 0, так
ТСАТС
(ф\А+А\ф) = 0=\\Аф\\2.
1Инфелъд Л., Холл Т. Rev. Mod. Phys. 1951, 23, 21; Грин X. Матричная
квантовая механика. М.: Мир, 1968.
2 Witten E. Nucl. Phys. 1981, В185, 513; 1982, В202, 253.
312 Дополнение. Суперсимметрия и метод факторизации
Воспользовавшись представлением (Д.29), находим, что необходимо
выполнение одного из уравнений
решение которых можно представить в виде
ф± = Сехр I т f W{x') dx' 1 .
Эти решения должны быть квадратично интегрируемы. Случай ос-
циллирующих ф± при х —> ±оо здесь рассматривать не будем. Тогда
для квадратичной интегрируемости ф+ нужно, чтобы при х —> ±оо
интеграл от суперпотенциала стремился к бесконечности
х
( W{x') dx' -4 +оо, (Д.30)
о
а для случая rf>_ — к минус-бесконечности
х
f W{x') dx' -+ -оо. (Д.31)
о
Поскольку эти условия несовместны, только одна из функций ф±
может принадлежать спектру. Значит, если состояние с нулевой энергией
существует, то оно не вырождено, ему будет отвечать та функция из
ф±, которая нормируема. В случае, когда ни одно из условий (Д.30),
(Д.31) не выполнено, основное состояние будет иметь положительную
энергию. Это соответствует спонтанному нарушению суперсимметрии.
Условия на W имеют особенно простой вид, если функция W(x)
при х —¥ ±ос является знакоопределенной. Например, если знаки W{x)
при х —► ±оо одинаковы, то ни одно из условий (Д.30), (Д.31) не
может быть выполнено. Бели знаки различны, причем W не стремится
к нулю, то одно из условий обязательно выполняется независимо от
частного вида W{x). Этому условию, в частности, удовлетворяет
гармонический осциллятор, для которого W = х.
Итак, гамильтониан суперсимметричной квантовой механики
можно рассматривать как совокупность двух одномерных гамильтонианов
H±=±(p2 + W2±W'),
Д.2. Метод факторизации 313
которые, в силу сказанного, имеют совпадающие спектры при любом
выборе суперпотенциала W(x), за исключением уровня нулевой
энергии. Используя эти свойства, часто удается построить спектр явно, что
и является целью метода факторизации.
Рассмотрим пример суперпотенциала
W = W(X,x) = Xthx.
При Л > 0 нулевым уровнем обладает оператор
Его суперпартнером будет оператор
-♦<*>-Н('-ад+4
Обозначая Хг = А — 1, приводим Н+ к виду
Я+(Л) = Я_(Аг) + 1(Л2-А?).
Бели Х1 > 0, то низший уровень оператора ff_(Ax) снова имеет
нулевую энергию, и, следовательно, низшее собственное значение
оператора Н+(Х) равно
*.+ = ^-
Поскольку оно должно совпадать с первым возбужденным уровнем
гамильтониана Н_, будем иметь Е^ = (А2 — А2)/2. Эту процедуру
можно продолжать до тех пор, пока А„ = Ап_х — 1 ^ 0. В результате
получаем спектр оператора Н_(Х) в следующем виде:
^п=^[(А2-А2) + (А2-А1) + ... + (АД_1-А2)] =
А2-А2
Наконец, добавив к оператору Н_(Х) аддитивную постоянную —А2/2,
чтобы привести потенциал к виду
ch2i
получаем соответствующий спектр
в *= (А~п)2
"2 2 *
314 Дополнение. Суперсимметрия и метод факторизации
Число уровней равно [А]+1. Этим методом молено вычислить
собственные значения и для радиального оператора Шредингера, например, в
кулоновской задаче3.
Д.З. Суперсимметрия в задаче
об электроне в магнитном поле
Гамильтониан Паули для двухкомпонентной волновой функции
электрона может быть приведен к точному квадрату (в этом
разделе для наглядности масса электрона m и скорость света с не равны
единице):
(<rp)2 e
Н=^-> Р = Р-\А, P=-iV. (Д.32)
Действительно, воспользовавшись соотношениями (18.10), находим
(ар)2 = (Р - -с А)2 - I* ■ rot А, (Д.ЗЗ)
и мы возвращаемся к формуле (18.7). Подчеркнем, что новая форма
записи (Д.32) гамильтониана Паули возможна в силу того, что
гиромагнитное отношение для спина равно е/(тпс), а для орбитального
момента е/(2тс); последнее свойство заложено в форме кинетического
члена в (Д.ЗЗ).
Вводя новое обозначение
Q = erp=_a. (iV + t a) , (Д.34)
получим Н = Q2/2m, это совпадает с представлением (Д.12) для
суперсимметричной системы. «Суперзаряд» Q, очевидно, является
интегралом движения, [Н, Q] = 0. Физический смысл закона сохранения
величины (Д.34) состоит в сохранении угла между импульсом и спином
в магнитном поле. В случае однородного поля ранее было показано,
что скорость прецессии спина равна циклотронной частоте шв = —,
с такой же частотой вращается и сам электрон вокруг силовых линий
поля, так что угол между спином и импульсом действительно
сохраняется.
Однако одного оператора Q для выявления суперсимметрии
задачи недостаточно. Другой оператор удалось бы построить, если бы
нашелся «квадратный корень» из единицы (т. е. оператор Р, такой, что
Подробности см. в Грин X. Матричная квантовая механика.
Д.З. Суперсимметрия в задаче об электроне в магнитном поле 315
Р2 = 1), который антикоммутировал бы с Q, {P, Q} = 0. В этом
случае в качестве второго оператора можно было бы взять iQP, при этом
(iQP)2 = Q2 и мы могли бы положить QY = Q, Q2 = iQP. В общем
случае произвольного магнитного поля этого сделать не удается,
однако для цилиндрически симметричного поля В = (0,0,Bz(x,y)),
соответствующая двумерная задача действительно обладает
суперсимметрией. В однородном магнитном поле, как мы видели в 16.5, уровни
поперечной энергии равны
Е = ыв(п+±\±^, п = 0,1,2,...,
где первое слагаемое обусловлено орбитальным моментом, а второе —
спином. Это выражение можно переписать в виде
B = »B[(nu + \) + (n0-\)
(Д.35)
где па = п, пс = 0,1. Итак, «фермионная» часть спектра попросту
обусловлена взаимодействием спина с магнитным полем. При
преобразовании суперсимметрии электрон меняет направление спина и
одновременно переходит на орбиту с соседним га, его энергия остается
прежней. Здесь мы имеем сочетание дискретных спиновых
преобразований и непрерывных преобразований, поскольку орбитальное
движение описывается в терминах координат и импульсов.
Рассмотрим теперь неоднородное поле Bz(x,у), выбирая вектор-
потенциал так, чтобы Az = 0, Ах = Ах(х, у), Ау = Ау(х, у), так что
задача становится чисто двумерной (одновременно вычитаем из
гамильтониана энергию продольного движения: Н -> Н — p2z/(2m)).
Представление для гамильтониана в виде квадрата оператора Q сохраняется,
причем
Q = "хРх + ауРу
Видно, что в качестве оператора Р можно использовать az. В
результате для эрмитовых генераторов суперсимметрии находим
Qx =Q, Q2 = *(<V» ~ °хРу)-
Объединяя их в комбинации вида (Д. 10), будем иметь
Q = \{Яг +iQ2) = ЗгЦ^ =Р-е+,
Q+ = \ (Qi ~ iQJ = «i Ц^ = Р+с>
316 Дополнение. Суперсимметрия и метод факторизации
где р± = рх ± ipy, а операторы с и с+ представляют собой
матрицы (Д. 18). Полная аналогия с суперсимметричным гармоническим
осциллятором имеет место для электрона в однородном магнитном поле.
В общем случае коммутатор [р_,р+] равен
\p_,p+}=2\e\Bz(x,y),
где учтено, что для электрона е = —|е|. Если Bz = const > 0, то можно
ввести операторы, аналогичные операторам уничтожения и рождения
Р- + Р+
a = —. , сг = —. ,
у/Щв у/Щв
подчиняющиеся стандартному соотношению коммутации [а, а+] = 1.
Напомним, что матрицы с и с+ также удовлетворяют нужному
соотношению антикоммутации {с,с+} = 1. В этом случае мы имели в
точности спектр суперсимметричного осциллятора (Д.35). Заметим, что
при изменении знака Bz операторы а и а+ меняются местами.
В неоднородном поле мы имеем уже более общую ситуацию
суперсимметричной квантовой механики. Гамильтониан Паули распадается
в сумму
Н+ = р+р_, Н_ = р_р+,
причем Н± действует на однокомпонентные функции, отвечающие
проекциям спина вдоль и против оси z. Волновая функция
основного состояния удовлетворяет одному из дифференциальных уравнений
первого порядка
Р+Ф = 0, р_ф = О
в зависимости от знака полного магнитного потока. В
рассматриваемом двумерном случае имеется, однако, важное отличие от
одномерного, рассмотренного в предыдущем разделе. Теперь основное состояние
может быть вырождено, причем кратность вырождения также
определяется глобальными характеристиками — в данном случае величиной
полного магнитного потока
Ф= I Bzdxdy.
Кратность вырождения равна целой части отношения Ф/Ф0, где Ф0 =
27г/|е| — квант магнитного потока (Ааронов, Кашер, 1979). В
случае бесконечного потока кратность вырождения бесконечна, с чем мы
Д.З. Суперсимметрия в задаче об электроне в магнитном поле 317
столкнулись в 16.5 для однородного поля (вырождение по положению
центра орбиты).
Итак, в двумерном случае роль суперзаряда играет проекция
спина. Суперсимметрия имеет место и в трехмерной задаче, если вектор -
потенциал обладает определенной четностью А(—г) = ±А(т). В этом
случае роль суперзаряда играет четность.