Текст
                    Т. П. Шестакова
Лекции по теоретической физике
Электродинамика
Термодинамика и статистическая физика
Допущено УМО по классическому университетскому образованию РФ
в качестве учебного пособия для студентов высших учебных заведений,
обучающихся по направлению подготовки ВО 03.03.02 — Физика
Москва ♦ Ижевск
2014


УДК 537.8 ББК 22.313 Ш514 Шестакова Т. IL Лекции по теоретической физике. Электродинамика. Термодинамика и статистическая физика. — М.-Ижевск: НИЦ «Регулярная и хаотическая динамика», 2014. — 300 с. Книга содержит материал двух разделов базового университетского курса теоретической физики — электродинамики, а также термодинамики и статистической физики. Материал представлен в виде лекций, что определяет краткость изложения, в то же время математические выкладки приведены достаточно подробно. В разделе «Электродинамика» обсуждается вывод уравнений электромагнитного поля, законы сохранения, роль потенциалов электромагнитного поля, четырехмерная формулировка электродинамики, электродинамика как калибровочная теория, эффект Ааронова-Бома, свободное электромагнитное поле, запаздывающие потенциалы, поля зарядов и токов на больших расстояниях, излучение электромагнитных волн, основы электродинамики сплошных сред, электромагнитное поле в среде с пространственной и временной дисперсией. В разделе «Термодинамика и статистическая физика» излагаются основы статистической физики (включая интегрируемые и эргодические системы, эргодиче- скую гипотезу, статистическое описание квантовых систем), основы термодинамики, распределения Гиббса, Максвелла, Больцмана, термодинамика идеального газа, распределения Ферми и Бозе, твердые тела, фазовые переходы первого и второго рода (включая примеры фазовых переходов в сегнетоэлектриках и ферромагнетиках, модели Изинга и Гейзенберга). В книге приведена обширная дополнительная литература. Книга адресована в первую очередь студентам-физикам и может быть полезна также научным работникам и преподавателям теоретической физики. ISBN 978-5-93972-992-5 ББК 22.313 © Т. П. Шестакова, 2014 © НИЦ «Регулярная и хаотическая динамика», 2014 http://shop.rcd.ru http://ics.org.ru
Содержание Часть I. Электродинамика 9 Глава I. Уравнения Максвелла 9 1. Вывод уравнений электромагнитного поля в вакууме 9 1.1. Начало изучения электромагнитных явлений. Работы Фарадея и Максвелла 9 1.2. Представление об электрическом поле. Уравнения электростатики 11 1.3. Уравнения магнитостатики 13 1.4. Связь электрических и магнитных явлений. Закон электромагнитной индукции 16 1.5. Закон сохранения электрического заряда 18 1.6. Окончательная форма уравнений поля. Физический смысл уравнений Максвелла 20 1.7. Закон сохранения энергии для электромагнитного поля 21 1.8. Закон сохранения импульса для электромагнитного поля 24 2. Потенциалы электромагнитного поля 26 2.1. Связь между потенциалами и напряженностями электромагнитного поля 26 2.2. Неоднозначность определения потенциалов. Калибровочные преобразования 27 2.3. Четырехмерная формулировка электродинамики. Тензор электромагнитного поля 27 2.4. Теорема единственности для системы уравнений Максвелла 35 2.5. Уравнения движения заряженных частиц 36 2.6. Присутствие уравнения связи в числе уравнений поля и калибровочная нвариантность 41 2.7. Калибровочные условия. Калибровки Кулона и Лоренца 43 2.8. Эффект Ааронова-Бома 45
4 Содержание Глава П. Решения уравнений Максвелла 49 3. Свободное электромагнитное поле 49 3.1. Уравнения поля в отсутствие источников 49 3.2. Решение уравнения д'Аламбера для плоских волн 50 3.3. Свойство поперечности электромагнитных волн 51 3.4. Монохроматическая волна. Поляризация волн 53 3.5. Частично поляризованные волны. Тензор поляризации 56 4. Запаздывающие потенциалы 58 4.1. Функция Грина неоднородного уравнения д'Аламбера 59 4.2. Общее решение уравнений поля с источником. Физический смысл запаздывающих потенциалов 61 4.3. Потенциалы Лиенара-Вихерта 62 Глава Ш. Электромагнитные поля на больших расстояниях 65 5. Поля статических систем зарядов и токов 65 5.1. Разложение скалярного потенциала в ряд по малым параметрам 65 5.2. Дипольный момент системы зарядов 66 5.3. Тензор квадрупольного момента системы зарядов 61 5.4. Разложение векторного потенциала в ряд по малым параметрам 69 5.5. Магнитный момент системы зарядов 70 6. Излучение электромагнитных волн 71 6.1. Разложение запаздывающих потенциалов в ряды по малым параметрам 71 6.2. Интенсивность излучения 75 6.3. Дипольное излучение 75 6.4. Квадрупольное и магнитодипольное излучение 77 6.5. Краткая характеристика других видов излучения 79 Глава IV. Электромагнитное поле в сплошных средах 81 7. Уравнения электродинамики сплошных сред 81 7.1. Особенности описания электромагнитного поля в веществе. Необходимость усреднения уравнений Максвелла 81 7.2. Вектор электрической поляризации 82 7.3. Вектор магнитной поляризации 84 7.4. Система уравнений Максвелла в сплошной среде 86 7.5. Уравнения Максвелла в линейных средах. Классификация сред 87 7.6. Закон сохранения энергии в сплошной среде 88 7.7. Закон сохранения импульса в сплошной среде 90 7.8. Принцип взаимности Лоренца 92 7.9. Принцип взаимности Грина 95 7.10. Условия на границе раздела двух сред 96
Содержание 5 8. Краткий обзор физических свойств сплошных сред 99 8.1. Электропроводность среды. Закон Ома. Закон Джоуля-Ленца 99 8.2. Электростатика проводников. Емкость. Емкостные и потенциальные коэффициенты 100 8.3. Электростатическая энергия проводников 101 8.4. Электрострикция и электрокалорический эффект 103 8.5. Механизмы поляризации диэлектриков 103 8.6. Вещества со спонтанной поляризацией (пироэлектрики). Прямой и обратный пьезоэффект 104 8.7. Сегнетоэлектрики и их основные свойства 105 8.8. Магнитные свойства веществ. Парамагнетики и диамагнетики 106 8.9. Ферромагнетики и антиферромагнетики 107 9. Электромагнитное поле в среде с пространственной и временной дисперсией 108 9.1. Общая связь между напряженностью электрического поля и электрической индукцией. Пространственно-временная дисперсия 108 9.2. Дисперсионное уравнение 110 Литература к части 1 114 Часть II. Термодинамика и статистическая физика 115 1. Введение в статистическую физику 115 1.1. Необходимые сведения из теоретической механики. Лагранжева и гамильтонова формы динамических уравнений. Конфигурационное и фазовое пространства 115 1.2. Функция распределения и статистический ансамбль 120 1.3. Теорема Лиувилля 122 1.4. Средние значения. Микропараметры и макропараметры 125 1.5. Обратимые и необратимые процессы 126 1.6. Микроканоническое распределение 129 1.7. Интегрируемые системы 132 1.8. Эргодическая гипотеза и эргодические системы 136 1.9. Статистическое описание квантовых систем 138 1.10. Уравнение Лиувилля в квантовой статистике 144 1.11. Статистический вес и энтропия 146 1.12. Закон возрастания энтропии 151
6 Содержание 2. Введение в термодинамику 155 2.1. Тепловое равновесие. Температура 155 2.2. Энергия как функция энтропии и объема. Дифференциал энергии 157 2.3. Адиабатический процесс 159 2.4. Работа, производимая над системой. Давление 160 2.5. Термодинамическое определение энтропии. Основное термодинамическое неравенство 161 2.6. Механическое равновесие 162 2.7. Теплоемкость, сжимаемость, коэффициент теплового расширения 162 2.8. Термодинамические функции 163 2.9. Соотношения между производными термодинамических величин 169 2.10. Термодинамические неравенства. Принцип Ле Шателье 175 2.11. Теорема Нернста. Поведение термодинамических величин при Г—»0 178 2.12. Построение термодинамической шкалы температур 180 2.13. Процесс Джоуля-Томсона как пример необратимого процесса 181 2.14. Максимальная и минимальная работа 183 2.15. Зависимость термодинамических величин от числа частиц.. 188 3. Распределение Гиббса 192 3.1. Вывод распределения Гиббса 192 3.2. Классический канонический ансамбль 197 3.3. Термодинамика канонического ансамбля Гиббса 199 3.4. Большой канонический ансамбль 201 3.5. Термодинамика большого канонического ансамбля 202 3.6. Распределение Максвелла 203 3.7. Распределение Больцмана 208 3.8. Энтропия больцмановского идеального газа 213 4. Идеальный газ 214 4.1. Термодинамика идеального газа 214 4.2. Идеальный газ с постоянной теплоемкостью 217 4.3. Классический идеальный газ 218 4.4. Учет квантовых степеней свободы. Одноатомный идеальный газ 221 4.5. Двухатомный идеальный газ 224 4.6. Многоатомный идеальный газ 231
Содержание 7 5. Распределения Ферми и Бозе 233 5.1. Распределение Ферми 233 5.2. Распределение Бозе 234 5.3. Энтропия ферми- и бозе-газов 235 5.4. Уравнение состояния ферми- и бозе-газов 237 5.5. Вырожденный электронный газ 240 5.6. Уравнение состояния релятивистского ферми- ибозе-газа 242 5.7. Релятивистский вырожденный электронный газ 243 5.8. Вырожденный бозе-газ 244 5.9. Черное равновесное излучение 247 6. Твердые тела 251 6.1. Случай низких температур 251 6.2. Случай высоких температур 255 6.3. Формула Дебая 256 6.4. Колебания атомов в кристаллической решетке с классической точки зрения 260 6.5. Представление о фононах 262 7. Фазовые переходы 264 7.1. Фазовые переходы I рода. Равновесие фаз 264 7.2. Уравнение Клапейрона-Клаузиуса 269 7.3. Критическая точка 270 7.4. Фазовые переходы II рода 272 7.5. Основы теории Ландау 274 7.6. Изменение симметрии при фазовом переходе в более общем случае 278 7.7. Фазовый переход второго рода в сегнетоэлектриках 281 7.8. Фазовый переход второго рода в ферромагнетиках 287 7.9. Роль обменного взаимодействия. Модели Изинга иГейзенберга 291 7.10. Ограниченность применимости теории Ландау. Конденсация Бозе-Эйнштейна как пример фазового перехода второго рода 296 Литература к части II 299
Часть I. Электродинамика Глава!. Уравнения Максвелла 1. Вывод уравнений электромагнитного поля в вакууме Весь круг электромагнитных явлений, по крайней мере, в классических проявлениях полностью описывается системой уравнений Максвелла: , ч 1ЭН(г,Л divH(r,0 = 0; , v (11) rotH(r, /) = L_^ + _j(r, /); с at с divE(r,t) = 4np(r,t). Принято говорить, что уравнения Максвелла есть результат обобщения опытных данных. Попробуем, однако, разобраться, как анализ результатов экспериментов мог привести к такой достаточно сложной с математической точки зрения системе уравнений, как система уравнений Максвелла. 1.1. Начало изучения электромагнитных явлений. Работы Фарадея и Максвелла. Пожалуй, первым опытным фактом, касающимся электромагнитных явлений, является закон Кулона (1785 г.), определяющий величину силы притяжения между двумя зарядами qx, q2 противоположных знаков (либо силы отталкивания между зарядами одинаковых знаков), находящихся на расстоянии г друг от друга: F=sJtft&.I. (1.2) г г (Английский физик Генри Кавендиш установил этот закон еще в 1773 году, но он не публиковал свои работы). В гауссовой системе единиц, которой мы будем пользоваться, коэффициент к = 1. Конец XVIII и первая треть XIX века характеризуется интенсивным изучением различных явлений, связанных с прохождением электрического тока. В 1799 году Алессандро Вольта создает первый источник электрического тока (гальванический элемент). К этому времени относятся исследования Ома, Джоуля, Ампера. В 1820 году Ханс Эрстед обнаруживает действие электрического тока на магнитную стрелку.
10 Часть! В 1834 году Майкл Фарадей вводит понятие о силовых линиях. Так возникает первоначальная форма теории поля. Необходимо отметить, что до этого времени, в том числе при изучении гравитационных явлений, понятие поля не возникало. Предполагалось, что одно тело воздействует на другое непосредственно, без участия какой-либо промежуточной среды (дальнодействие). Передача взаимодействия при этом происходит мгновенно. По мнению Альберта Эйнштейна, идея поля была самым важным открытием со времен Ньютона. Он писал: «...надо иметь могучий дар научного предвидения, чтобы распознать, что в описании электрических явлений не заряды и не частицы описывают суть явлений, а скорее пространство между зарядами и частицами». Судьба Фарадея, как и его идей, весьма поучительна. Он родился в 1791 году. Отец его был кузнецом, мать — горничной. Он получил только начальное образование. Затем он работает подмастерьем переплетчика в книжной лавке. В это время он получает возможность много читать и сам повторяет многие из опытов, описанных в книгах. Лавку посещало большое число образованных людей того времени. Один из них, заметив увлеченно читающего серьезную научную литературу молодого переплетчика, пригласил его послушать цикл лекций сэра Гэмфри Дэви, известного физика и химика, члена Лондонского королевского общества. В 22 года Фарадей становится ассистентом Дэви, а через 11 лет, в 1824 году сам становится членом Лондонского королевского общества. Позднее Дэви говорил, что самое большое из его открытий — это открытие Фарадея. Результаты исследований Фарадея изложены в серия его докладов, которые Фарадей представлял в Лондонское королевское общество на протяжении двадцати четырех лет— «Экспериментальные исследования по электричеству». В его докладах тщательно описаны проведенные им опыты. Однако Фарадей не владел языком математики, и в его работах отсутствовали формулы, которые в огромном количестве присутствовали в статьях других ученых. Это вызвало упреки в «нематематичности» в адрес Фарадея и в определенной степени затруднило восприятие его идей, в том числе идеи о существовании электрического и магнитного полей, которые он считал безусловной реальностью. Совершенно по-иному сложилась судьба Джеймса Клерка Максвелла. Он родился в 1831 году в семье шотландского землевладельца, получил прекрасное образование— сначала школа (она называлась Эдинбургская академия), затем Эдинбургский, а позднее и Кембриджский университеты, где математика преподавалась на самом высоком уровне. И тем не менее на Максвелла, который получил такую сильную математическую подготовку, особое впечатление производит именно книга Фарадея «Экспери-
1. ВЫВОД УРАВНЕНИЙ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ В ВАКУУМЕ 11 ментальные исследования по электричеству». Максвелл увидел, что упреки Фарадея в «нематематичности» были несправедливыми. Максвелл писал: «Когда я стал углубляться в изучение работ Фарадея, я заметил, что метод его понимания тоже математичен, хотя и не представлен в условной форме математических символов. Я также заметил, что метод может быть выражен в обычной математической форме...». Максвелл указывал, что на силовые линии Фарадея не следует смотреть только как на абстракцию. Он дал следующее определение: «Электромагнитное поле — это та часть пространства, которая содержит в себе и окружает тела, находящиеся в электрическом или магнитном состоянии». Постараемся понять, как представление об электромагнитном поле приводит к математической формулировке уравнений, описывающих его динамику. 1.2. Представление об электрическом поле. Уравнения электростатики. Представление об электрическом поле позволяет ввести понятие напряженности поля как отношения силы, действующей электрический заряд, к величине этого заряда: F = ?E; E = -. (1.3) Ч Из закона Кулона Е(г) = %-. (1.4) Г Г (Здесь поле Е(г) создается точечным источником q0 ). Важную роль играет принцип суперпозиции полей, согласно которому поле, создаваемое несколькими источниками, равно геометрической сумме полей, создаваемых каждым из объектов в отдельности, независимо от наличия других источников поля: Е = Е1+Е2+---. (1.5) Воспользуемся принципом суперпозиции для описания статического электрического поля. Введем пространственную плотность заряда р(г). Если у нас имеется п зарядов е1, е2, е3, ..., находящихся в точках с радиус-векторами г,, г2, г3, ..., то p(r) = ieaS{r-ra). (1.6) а=\ При этом заряд p(r')</F(r'), сосредоточенный в малом элементе объема dV(r')9 создает в точке с радиус-вектором г напряженность электрическо-
12 Часть! го поля М(г)=± , L К • (1.7) |г-г| Проинтегрировав по всему распределению зарядов, получим , . ((r-r')p(r')dV(r') E(rW" jr_r| * • (1.8) Используя аппарат векторного анализа, можно показать, что При этом формулу (1.8) можно переписать в виде E(r) =-grader), (1.10) где совершенно формально был введен скалярный потенциал электрического поля p(rH Y-ri const- (1Л1> Действительно, г-г / \ (1-12) (здесь операция взятия градиента предполагает дифференцирование по переменной г). Используя известное тождество векторного анализа rot grad/(r) = 0, (1.13) мы получаем rotE(r) = 0. (1.14) Применим операцию взятия дивергенции к обеим сторонам (1.10), получим divE(r) = -div gradp(r)=-A?>, (1.15)
1. ВЫВОД УРАВНЕНИЙ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ В ВАКУУМЕ 13 Используя формулу 1 = -4я£(г-г'), (1.16) г-г получаем, что Действительно, divE(r)=4^>(r), (1.17) А<р(г)=-4лр(г). (1Л8) =-4л\ д(г - т')р(г) dV(r)=-4яр(г). (1.19) Уравнения (1.14), (1.17) совпадают с первым и четвертым уравнениями Максвелла в случае стационарного электрического поля. 1.3. Уравнения магнитостатики. Обратимся теперь к магнитным явлениям. Одно из уравнений можно получить, принимая во внимание тот факт, что в природе отсутствуют магнитные заряды. В некоторых современных теориях поля предполагается существование магнитных зарядов, в частности, Дирак выдвигал гипотезу об их существовании (так называемые монополи Дирака). Однако достоверные факты, свидетельствующие об их существовании, на сегодняшний день отсутствуют. Поэтому линии напряженности магнитного поля Н должны быть замкнуты, не иметь ни начала, ни конца. Поэтому поток вектора Н через замкнутую поверхность должен быть равен 0: Ф = (|)1М8 = 0. (1.20) Преобразуя интеграл по теореме Остроградского-Гаусса, получаем <j)H</S = Jdiva/F = 0, (1.21) S V divH = 0. (1.22) Мы получили еще одно из уравнений Максвелла. Так как для любого векторного поля а справедливо, что div rota = 0, (1.23) мы можем представить напряженности магнитного поля Н как H = rotA, (1.24)
14 Часть! чисто формально введя векторный потенциал А, так же, как выше мы ввели скалярный потенциал (р. Рассмотрим теперь напряженность магнитного поля, создаваемую частицей с зарядом е, движущейся с постоянной скоростью v: Если у нас имеется п зарядов е1, е2, е3, ..., движущихся со скоростями vp v2, v3, ..., тогда ,.£&1Ь£=Ь]. (1.26) с<* 1г-ч или, введя плотность электрического тока lf[j(rQ.r-r-] н J lr-rf dv ■ <128> Последнее соотношение — одна из форм закона Био-Савара-Лапласа, результат проведенного Лапласом обобщения данных исследования магнитных полей, создаваемых токами, текущими по тонким проводникам различной формы, которое предприняли Био и Савар в 1820 году. Можно убедиться, что векторный потенциал, определенный как удовлетворяет уравнению (1.24). Воспользуемся этим выражением для того, чтобы получить еще одно уравнение для магнитного поля. Покажем, что для А(г) (1.29) divA(r) = 0. (1.30) Внесем дивергенцию под знак интеграла: divA(r) = -|divTi^4,</F'. (1.31) сJ |г — г | Воспользуемся формулой div(/a) = (a, grad/)+/diva. (1.32)
1. ВЫВОД УРАВНЕНИЙ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ В ВАКУУМЕ 15 В (1.31) операция дивергенции берется по переменной г, но не г'. Поэтому dhJfcWjM. r-d^ Как легко убедиться, 1 grad r-r w w'\ I 'I3 r-r r-r -grad' , 1 7/ 1 r-r r-r где штрих обозначает, что градиент берется по переменной г'. div^-UrO.v' 1 r-r r-r J J(Q , v'j(r') ' iJ k-ri • r-r (1.33) (1.34) (1.35) Если распределение зарядов и токов ограничено в пространстве, т. е. линии токов не уходят на бесконечность, что соответствует реальной физической ситуации, то Vj(r) = divj(r) = 0. (1.36) Действительно, рассмотрим замкнутую поверхность, окружающую распределение зарядов и токов (такая поверхность может мыслится как удаленная на бесконечность). Полный ток через эту поверхность должен быть равен 0: j>}dS = 0. (1.37) Вновь преобразуя интеграл по теореме Остроградского-Гаусса, получаем jjdS = jdwidV = 0, (1.38) S V divj = 0. Таким образом, мы приходим к выводу, что diV7ii4=-div'i(4 |Г-Г| Вернемся к формуле (1.31). r-r (1.39) (1.40) itA-^Ж)^ divA(r) = --fdiv'^4r^'. с1 r-r (1.41) Так как теперь дивергенция берется по переменной г', мы можем вновь преобразовать интеграл в интеграл по замкнутой поверхности, охваты-
16 Часть! вающии распределение зарядов и токов: divA(r)eJ-fdi^rfr = -^if^ = 0. (1.42) с* |r-r| cJs |r-r| Утверждение (1.30) доказано. Теперь применим к обеим частям соотношения H = rotA операцию взятия ротора. Получим rotH = rot rotA. (1.43) Согласно формулам векторного анализа, rot rota = grad diva-Aa. (144) Поскольку divA(r) = 0, rotH = -AA. (1.45) Внесем оператор Лапласа под знак интеграла в (1.29): AA(r)=ijA|^^'. (1.46) Снова воспользуемся формулой (1.16). Тогда ^(r)=^A(li^?f)J(rVr=~T^(r>(r~rVr="Tj(r)' (147) rotH =—j(r). (1.48) с Мы получили еще одно уравнение, которое в отсутствие переменного электрического поля совпадает с третьим уравнением Максвелла. 1.4. Связь электрических и магнитных явлений. Закон электромагнитной индукции. До сих пор мы рассматривали по отдельности электрические и магнитные явления. Даже из соображений симметрии можно предположить, что если электрический ток (движущиеся заряды, переменное электрическое поле) создает магнитное поле, то перемещение магнита (переменное магнитное поле) должно создавать электрическое поле. Первым, кто осознал единство электрического и магнитного полей, был Майкл Фарадей. В 1821 году Фарадей впервые осуществил вращение магнита вокруг проводника с током и проводника с током вокруг магнита, создав лабораторную модель электрогенератора. После этого Фарадей поставил перед собой задачу «превратить магнетизм в электричество». Пожалуй, наиболее известное открытие Фарадея— явление электромагнитной индукции (1831 год)— возникновение электрического тока в проводнике при изменении потока магнитного поля через контур проводника.
1. ВЫВОД УРАВНЕНИЙ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ В ВАКУУМЕ 17 Рассмотрим неподвижный контур в изменяющемся магнитном поле. Изменение магнитного поля вызывает изменение магнитного потока через контур и возникновение индукционного тока. Последнее свидетельствует о том, что изменение магнитного поля вызывает появление в контуре сторонних сил, действующих на носители тока, которые не связаны ни с химическими, ни с тепловыми процессами в проводнике. Мы приходим к вьшоду, что индукционный ток обусловлен возникающим в проводнике электрическим полем. Пусть Е — напряженность этого поля. Напомним, что электродвижущей силой (ЭДС) называется работа сторонних сил F над единичным положительным зарядом на каком-либо участке цепи или в замкнутом контуре: таким образом, возникающая в контуре ЭДС есть A = j>Fdi = qj>Edi, (149) L туре ЭДС есть <j)Ed. (1.50) С другой стороны, согласно открытому Фарадеем закону электромагнитной шщукции, е=-1-^. (1.5D с dt Тогда $Ш = -с-аТ- (1-Я) Левую часть преобразуем по теореме Стокса: <j)E<fl = JrotEdS. ,j 53ч L S Преобразовывая так же правую часть, получим: с dt cdt[ c{ dt V ' i(rotE4f)^=0> <i55> 1 ЭН rotE + —— = 0. (1.56) с at Уравнение (1.55) представляет собой интегральную форму закона Фарадея, которая непосредственно приводит к первому из уравнений Максвелла (1.56).
18 Часть! Уравнение (1.56) устанавливает глубокую связь между электрическим и магнитным полем и показывает, что рассмотрение этих полей по отдельности друг от друга возможно лишь в частных случаях. Действительно, электрическое поле создается системой неподвижных зарядов. Но если заряды неподвижны относительно некоторой системы отсчета, то относительно других систем отсчета эти заряды движутся и порождают не только электрическое, но и магнитное поле. Аналогично, неподвижный проводник с постоянным током создает в пространстве постоянное магнитное поле. Однако относительно некоторых других систем отсчета тот же проводник должен рассматриваться как движущийся. Поэтому создаваемое им магнитное поле будет меняться и порождать электрическое поле. Как мы видим, наблюдатели в различных системах отсчета будут наблюдать разные физические явления — это очень важная идея, воплотившаяся в теории относительности. Другая важная идея — это идея объединения взаимодействий, согласно которой все силы (взаимодействия) в природе являются различными проявлениями единого поля. Эта идея сыграла очень важную роль в развитии теоретической физики в XX веке. В 1960-х годах Стивеном Вайнбергом и Абдусом Саламом была создана теория электрослабых взаимодействий, объединяющая электромагнитные и слабые взаимодействия. В принятой на сегодняшний день Стандартной модели предполагается объединение электрослабых и сильных взаимодействий. Попытки объединить гравитацию с остальными взаимодействиями пока вызывают значительные трудности. Тем не менее идея объединения взаимодействий остается одной из тех идей, которые определяют развитие современной теоретической физики, и осознание единства электрического и магнитного полей было первым шагом в этом направлении. 1.5. Закон сохранения электрического заряда. Итак, нам пока удалось получить уравнения электромагнитного поля в форме , ч 1ЭН(г,0 rotE(r,0 = ~; с от divH(r,0 = 0; (1.57) п>Ш(г,/) = —j(r,/); С divE(r, *) = 4яр(г, t). Эти уравнения отличаются от системы уравнений Максвелла (1.1) лишь отсутствием в третьем из них члена, содержащего производную напряженности электрического поля по времени. В такой форме они были первоначально записаны Максвеллом. Однако уравнения электромагнитного поля
1. ВЫВОД УРАВНЕНИЙ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ В ВАКУУМЕ 19 должны согласовываться с законом сохранения электрического заряда и непосредственно с ним связанным уравнением непрерывности. Напомним, как выводится уравнение непрерывности. Рассмотрим произвольный объем V, ограниченный поверхностью S. Внутри этого объема сосредоточен заряд ■jp(r,t)dV. (1.58) Изменение заряда внутри объема V может происходить только вследствие того, что заряды покидают данный объем или, наоборот, входят в него, пересекая поверхность S. Изменение заряда в объеме в единицу времени есть ^ = -j>j(r,t)dS. (1.59) Заметим, что силой тока называется именно количество заряда, переносимого через рассматриваемую поверхность в единицу времени. С одной стороны, она может быть определена как производная заряда по времени, с другой стороны, — как интеграл по рассматриваемой поверхности от плотности тока j. Тогда j-jp(r,t)dV = -j>i(r,t)dS. (1.60) at v s Используя теорему Остроградского-Гаусса, получаем уравнение непрерывности: j^M^.-jdivjlr.O^; (1.61) у Ot у ^^l + divj(r,0 = 0. (1.62) Статическому распределению зарядов соответствует p{r,t) = const; j(r,*) = 0. (1.63) Постоянному во времени магнитному полю соответствует постоянное распределение зарядов в пространстве и отличный от нуля постоянный во времени электрический ток: /?(r, t) = const; j(r, t) = const *0. (164) Поэтому в данном случае divj(M) = 0. (1.65)
20 Часть I —div—. (i.67) Применим теперь операцию взятия дивергенции к третьему из уравнений (1.57): 4л div rotH(r,f)=—divj(r,f). (j 66) Поскольку, как уже указывалось выше, для любого векторного поля а справедливо соотношение (1.23), мы получаем, что уравнение (1.65) должно выполняться всегда, а не только в случае постоянного магнитного поля, что противоречит уравнению непрерывности. Таким образом, третье из уравнений (1.57) должно быть модифицировано. Беря производную по времени от обеих частей последнего уравнения (1.57), имеем др 1 .. ЭЕ dt 4л dt С другой стороны, должно выполняться уравнение (1.62). Это показывает, что мы получим правильный результат, если добавим в третье уравнение 1 ЭЕ „ „ * - член ——. Действительно, взятие дивергенции от обеих частей уравнения с at в этом случае дает 1.. ЭЕ 4л л. . Л -div—+—divj = 0 (1.68) с at с в согласии с уравнением непрерывности (1.62). Член —— был введен с at в уравнения Максвеллом, который называл его плотностью «тока смещения». Однако это условное название. Новое слагаемое соответствует изменяющемуся во времени электрическому полю и восстанавливает симметрию между электрическим и магнитным полями (до введения этого слагаемого существование переменного электрического поля никак не было учтено в системе уравнений). 1.6. Окончательная форма уравнений поля. Физический смысл уравнений Максвелла. Итак, мы приходим к полной системе уравнений Максвелла (1.1). Первое уравнение связывает напряженность электрического поля с изменением во времени напряженности магнитного поля и является, по существу, выражением закона электромагнитной индукции. Второе уравнение утверждает отсутствие источников магнитного поля (магнитных зарядов). Третье уравнение устанавливает связь между изменяющимся электрическим полем, током проводимости и напряженностью порождаемого ими магнитного поля. Четвертое уравнение показывает, что заряды являются источниками электрического поля (линии электрического поля начинаются и заканчиваются на электрических зарядах).
1. ВЫВОД УРАВНЕНИЙ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ В ВАКУУМЕ 21 Первое и третье уравнения представляют собой векторные уравнения, т. е. каждое из них эквивалентно трем скалярным уравнениям. Таким образом, система уравнений Максвелла содержит всего 8 уравнений. Уравнения Максвелла могут быть представлены в интегральной форме. Для этого первое и третье уравнения проинтегрируем по произвольной поверхности S и преобразуем левые части в соответствии с теоремой Стокса в интеграл по замкнутому контуру L, ограничивающему поверхность S. Второе и четвертое уравнения проинтегрируем по произвольному объему V и преобразуем левые части в соответствии с теоремой Остроградского- Гаусса в интеграл по замкнутой поверхности ST, ограничивающей этот объем. J (1.69) * (1.70) с Js dt divHrfF = 0; Ji0tHaS=lAs+^JjdS; s c s °* c s ldivEdV = 4K$pdV; V V j>EA=--—Jews; , с at s EWS = 0; L c Ul S c S j>EdS = 4xjpdV. s* v 1.7. Закон сохранения энергии для электромагнитного поля. Из уравнений Максвелла вытекают законы сохранения энергии и импульса для системы заряженных частиц в электромагнитном поле. Для получения закона сохранения энергии третье из уравнений Максвелла (1.1) умножим скалярно на Е, первое уравнение — на Н, после чего первое уравнение вычитается из третьего: (E,rotH)-(H,rotE) = iffE,^j + ^H,^jj + ^(j,E). (1.71) В соответствии с еще одной формулой векторного анализа, (b,rota)-(a,rotb) = div[a,b]. (1.72)
22 Часть! Деля уравнение на 4л* и умножая на с, получим J_ 4ж Введем обозначения w=— {E2+H2), (1-75) Р = ^[Е'Н]. (1-76) так что уравнение (1.74) примет вид ^%divP = -(jE). (1.77) ot Проинтегрируем его по объему V, ограниченному поверхностью 5: Эй ~Э> j^-dV + jdivV dV = -j(]E) dV, (1.78) V V -\WdV = -$VdS-\{\E)dV. (179) ai v s v Для интерпретации последнего члена в (1.79) подставим в это вьфажение плотность тока в виде (1.27): J(J,E) dV = jheayaS(r-ra),E) dV = &.(*.*). (1.80) V Д a J a Используем еще один экспериментальный факт— вьфажение для силы Лоренца, которая действует на частицу с зарядом е, движущуюся в электромагнитном полк со скоростью v: F = eE + -[v,H]. (1.81) с Как известно, магнитная составляющая силы Лоренца не совершает работы над частицей, поскольку она всегда направлена перпендикулярно к скорости движения частицы. Работу совершает только электрическая составляющая, F = eE (см. (1.49)). Следовательно, efl(vfl,E) есть работа, совершаемая электромагнитным полем над заряженной частицей в единицу времени. По закону сохранения энергии, эта работа должна производиться
1. ВЬЮОД УРАВНЕНИЙ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ В ВАКУУМЕ 23 за счет убыли энергии поля. Соответственно, произведение (j,E) представляет собой работу электромагнитного поля над заряженными частицами в единице объема в единицу времени. Для каждой заряженной частицы справедливы уравнения движения (1.82) Рассмотрим изменение кинетической энергии частицы Та: dt dt\ 2m.) W dt) Р»*-> (1.83) = e.K,E) + -j(v.,[v„H]) = ee(v.,E). Совершение работы над заряженной частицей приводит к изменению ее кинетической энергии. Если в (1.78) интегрирование ведется по всему пространству, то интеграл по поверхности S в (1.79) равен нулю (поверхность S в таком случае является бесконечно удаленной, поля на бесконечности обращаются в нуль). Тогда уравнение (1.79) с учетом (1.80) и (1.83) примет вид d( Л [jwdV^Ta dt \v :0. (1.84) Для замкнутой системы, состоящей из электромагнитного поля и находящихся в нем частиц, сохраняется величина в скобках в (1.84). Второй член в скобках представляет собой кинетическую энергию частиц, следовательно, первый член следует интерпретировать как энергию электромагнитного поля. Изменение кинетической энергии частиц должно компенсироваться изменением энергии электромагнитного поля. Выражение (1.75) является плотностью энергии электромагнитного поля. При интегрировании по конечному объему интеграл по поверхности в (1.79), вообще говоря, не равен нулю. Уравнение можно записать в виде d( Л J-\l"dV + Y,Ta \ = -j>VdS. (1.85) ™\V a J S Интеграл в правой части следует рассматривать как поток энергии поля через поверхность, ограничивающую данный объем, а выражение (1.76) — как вектор плотности потока энергии электромагнитного поля, также называемый вектором Пойнтинга. Уравнение (1.77), выражающее закон сохранения энергии, иногда называют уравнением баланса энергии или
24 Часть! теоремой Поинтинга. По своей структуре это уравнение непрерывности с источником. Если источник (плотность тока j) в уравнении (1.79) равен нулю, мы получаем, что изменение энергии может происходить только за счет ее вытекания или втекания через поверхность S (уравнение непрерывности без источника). 1.8. Закон сохранения импульса для электромагнитного поля. Наряду с законом сохранения энергии должен выполняться закон сохранения импульса электромагнитного поля. Умножим третье из уравнений Максвелла векторно на Н, первое уравнение — векторно на Е, второе уравнение умножим скалярно на Н, четвертое — скалярно на Е. Сложим первое и третье уравнения и вычтем из них второе и четвертое: [H,rotH] + [E,rotE] - HdivH - EdivE = ЭЕ Е, ЭН dt + — [Н„|]-4ярЕ; С + ±[j,H] + /?E + 1 Але +—([H,rotH]-HdivH + [E,rotE]-EdivE) = 0. (1.86) (1.87) Попытаемся разобраться, какой смысл имеют отдельные члены в (1.87). Начнем с членов, содержащих плотность тока j и заряда р частиц. Проинтегрируем (1.87) по объему Уи, используя формулы а j=Ze«v.^(r_r«)' (1.88) (1.89) преобразуем: J^[j,H] + pEJrfK = -Я2л'-*-о) ,н + £•.*('-'.) Е dV- (1.90) а \С у у ) ■2Wb['--"W])-2>.-S*-*.
1. Вывод уравнений электромагнитного поля в вакууме 25 Интеграл по объему от этих членов сводится к сумме сил, действующих на каждую частицу со стороны электромагнитного поля (сил Лоренца). В свою очередь, сила, действующая на частицу, представляет собой изменение ее импульса в единицу времени. Суммируя по всем частицам, мы получаем изменение полного импульса системы частиц в единицу времени. В электродинамике мы делим физические объекты на поля и источники. Наряду с изменением полного импульса частиц в законе сохранения импульса должно присутствовать также изменение импульса поля. В первых двух членах в (1.87) может быть выделена полная производная от величины, 1 которая с точностью до множителя — совпадает с вектором плотности по- с тока энергии электромагнитного поля (вектором Пойнтинга (1.76)): У\ 4лс Г^ зн! Е, L э* J + ГЗЕ „1 —,н La* J }}г-ЦШе-н]У- (,91) 4жс с (1.92) Таким образом, величина (1.92) должна быть отождествлена с плотностью импульса электромагнитного поля. Одновременно мы выявили связь между плотностью импульса и плотностью потока энергии электромагнитного поля. Рассмотрим оставшиеся члены. [E,rotE]-EdivE = е,{еикЕ^ыУ,Ет -£,Уу£,) = = е,((*Л. -6тд,)Ер,Ея -£,V .£.) = = eifel{EJEJ)-VJ(ElEJ)yelVj^E>SiJ-EiEj Аналогично, (1.93) [H,rot Н] - HdivH =e,V, (^Нг8ц - EiHj \ [E,rotE]-EdivE + [H,rotH]-HdivH = (1.94) (1.95) (1.96)
26 Часть! — тензор плотности потока импульса, его компоненты (взятые с противоположным знаком) составляют так называемый тензор напряжений. Соотношение (1.87) после интегрирования по объему принимает вид L + Jn,rfH + IVj<T9dV = 0. (1.97) Вводя плотность импульса частиц nt, запишем закон сохранения импульса в дифференциальной форме: -I dt\ -f J(*i +U,)dV j + JV/ty*K = 0; (1.98) -(xt+n,) + Vj(T9=0 (1.99) Последний интеграл в (1.98) может быть преобразован в интеграл по поверхности S, ограничивающей объем V: М \{щ +n,)rfF | + $<vff, =0. (1.100) Он представляет собой поток импульса через поверхность S. Уравнение (1.100) представляет собой интегральную форму закона сохранения импульса. 2. Потенциалы электромагнитного поля 2.1. Связь между потенциалами и напряженностями электромагнитного поля. Ранее при отдельном рассмотрении электрических и магнитных явлений нами были введены скалярный и векторный потенциалы: E(r) = -gradp(r), (2.1) H = rotA. (2.2) Соотношение (2.2) справедливо и в общем случае, поскольку следует из второго уравнения Максвелла, div H = 0, и известной формулы векторного анализа (1.23). Соотношение (2.1) и еще одна формула векторного анализа, (1.13), привели нас к уравнению (1.14), справедливому в случае электростатики. В общем же случае rotE^O, согласно первому из уравнений Максвелла (1.56). Подставляя (2.2) в (1.56) и меняя порядок дифференциальных операций, получим rotfE + I|],0; ,2.3)
2. Потенциалы электромагнитного поля 27 Е + -—= -gradp; (2.4) с at E = -gradp--^. (2.5) с at 2.2. Неоднозначность определения потенциалов. Калибровочные преобразования. Отметим, что потенциалы <р и А определяются неоднозначно. В самом деле, значения напряженностей электрического и магнитного полей не изменятся, если выполнить преобразования •(r.OMr.O-1^^; <2-6) с at A'(r,0 = A(r,0 + grad^(r,/). (2.7) Проверим: , , 1 Эа' , 1 , Ъх 1 Эа 1 Э , Е = -gradp — = -gradp + -grad^f- —grad^r = с at с at с at cat = -gradp T" = E' с от (2.8) H' = rot A' = rot A + rot grader, t) = rot A = H. (2.9) Так как в уравнения Максвелла входят только напряженности электрического и магнитного полей, система уравнений Максвелла инвариантна относительно преобразований (2.6), (2.7). Преобразования (2.6), (2.7) называются калибровочными преобразованиями. 2.3. Четырехмерная формулировка электродинамики. Тензор электромагнитного поля. Для дальнейшего анализа роли потенциалов в электродинамике удобно использовать систему обозначений, принятую в специальной теории относительности, где пространство и время объединены в единый четырехмерный континуум с координатами {t, x, у, z]. Эти четыре координаты, включая временную, можно рассматривать как компоненты четырехмерного радиус-вектора хм: // = (0,1,2,3), x°=ct, x]=x, x2=y, x3=z. (2.10) В специальной теории относительности интервал (расстояние) между двумя бесконечно близкими точками (событиями) в пространстве-времени определяется как ds2 =c2dt2 -dx2 -dy2 -dz2. (2.11)
28 Часть! Соответственно, квадрат четырехмерного радиус-вектора есть cY-x2-y2-z2. (2.12) Для записи формул удобно ввести так называемые контравариантные (с индексами сверху) и ковариантные (с индексами снизу) компоненты 4-вектора: При этом = Ct, X def 3 xX=T^=c2t2-x' -У> хз 2 2 2 у - z . (2.13) (2.14) (В дальнейшем всюду предполагается суммирование по повторяющимся индексам.) Эти определения обобщаются для произвольного 4-вектора, который имеет одну временную и три пространственных компоненты: АМ9А": А,=А°, А,=-А\ A2=-A2, А,=-А\ (2.15) А«=(А\А), АМ=(А\ -А). (2Л6) Для двух 4-векторов А", В" определяется скалярное произведение: АМВ" =gMVA"Bv =A°B°-A'B1-A2B2 -А3В\ (2.17) где 8м (2.18) (\ О О (О 0-100 0 0-10 ^0 0 0 -1; — метрика пространства-времени Минковского. С помощью метрического тензора gMV производится поднятие и опускание индексов: AM=g/lvA", A^g^A,. (2.19) g^ — обратная метрика по отношению к метрике g : ^10 0 0^ 0-100 0 0-10 г 0 0 0 -1 S/ug * =5*„- (2.20) (2.21)
2. Потенциалы электромагнитного поля 29 Как мы увидим, скалярный и векторный потенциалы электромагнитно го поля могут быть объединены в четырехмерный вектор-потенциал: Л*=(р,А), Ам=(<р, -А). Далее, мы можем ввести тензор электромагнитного поля Очевидно, этот тензор является антисимметричным (2.22) (2.23) (2.24) (2.25) Действительно, все диагональные компоненты антисимметричного тензора равны 0. Имея в виду связь напряженностей электрического и магнитного полей с потенциалами (2.5), (2.2), найдем ненулевые компоненты тензора F : имеет следующие компоненты: F = ( 0 ~ЕХ 1-Е- Ех 0 -н, Еу 0 нх ЕЛ ну -нх 0 J ay dz (2.26) (2.27) (2.28) (2.29) (2.30) (2.31) Для нахождения тензора FMV можно использовать соотношение ^=г^%=г%г^ (2.32) При этом нахождение тензора FMV сводится к перемножению матриц (2.20) и (2.25). Это приводит к изменению знака у тех компонент FMV,
30 Часть! у которых один из индексов является временным (//, v = 0), а другой- пространственным (//, v = l, 2, 3): ГО Ех Еу 1Л ~ЕХ 0 я, -", -Еу -нж 0 я, ~£*1 ну -нх 0 J (2.33) Четырехмерная формулировка позволяет получить уравнения электромагнитного поля из принципа наименьшего действия и проанализировать их структуру, рассматривая в качестве полевых переменных не напряженности, а потенциалы поля, которые выполняют роль обобщенных координат. Вспомним, как формулируется принцип наименьшего действия в теоретической механике. Физическая система характеризуется некоторой функцией, называемой функцией Лагранжа, зависящей от обобщенных координат и скоростей: C{q{t),q{t),t), *(/) = {*'(')}. *={«'(')}• (2.34) Пусть в моменты времени Ц и t2 координаты системы принимают значения 9{*i) = 9i, 4(t2) = 42, (2.35) тогда в промежутке между моментами времени ^ и t2 система движется таким образом, чтобы интеграл S = jc{q(t),q(t),t)dt, (2.36) называемый интегралом действия, принимал наименьшее значение. Интеграл (2.36) является функционалом: в зависимости от того, какие функции q(t) мы подставим в интеграл, он будет принимать различные значения. Среди всех возможных функций q(t) только одна будет соответствовать минимальному значению интеграла, именно эта функция определяет классическую траекторию физической системы. Рассмотрим изменение интеграла действия при малых изменениях функций q(t): SS = s)c{q(t), q{t), t)A=)№sq+^8q dt:
2. Потенциалы электромагнитного поля 31 дС с дС d ( с ч '2 Э? * dt dq Ч) dt{dq) Ч dt = (2.37) [—6 d£_d_ dq dt {dq Sqdt. Поскольку принцип наименьшего действия формулируется в предположении, что моменты времени tx и t2 координаты системы фиксированы (см. (2.35)), то <M'i) = 0> <^('2) = 0> (2.38) и внеинтегральный член в (2.37) обращается в 0. Необходимым условием экстремальности функционала действия является обращение в 0 его первой вариации, откуда в силу произвольности вариации Sq(t) следуют уравнения Лагранжа: dq dtydq = 0. (2.39) В теории поля в качестве обобщенных координат выступают полевые переменные, зависящие не только от времени, но и от пространственных переменных. Покажем, что уравнения электромагнитного поля получаются в результате варьирования действия '-\dt\dv[^rWv+^A»J* i U&rc *" 2 М С J -{^tF"F" *WYx- *,*tw (2.40) Здесь интеграл берется по всему пространству и по отрезку времени, ограниченному моментами Ц и t2. Интеграл действия (2.40) состоит из двух частей: член, описьгаающий свободное электромагнитное поле (в отсутствие зарядов), " \6кс* и член, учитывающий взаимодействие с источником, 1 LlF-F""'' твие с ист (2.41) (2.42)
32 Часть! В последнее выражение входит четырехмерный вектор тока f={cp,i), JM={cp, -j). (2.43) Учитывая выражение (2.23) для тензора электромагнитного поля и тот факт, что FMVF^=F""FMV, (2.44) имеем SS^-i±-F"(3l,SAv-i,SA,)*^rSA}d\ = '\{-£г/"зм--7Г1!А'У" <2'45) В предпоследнюю строчку входит интеграл от четырехмерной дивергенции ldv(F<"SAM)d<x. (2.46) 1 Мы знаем, что интеграл по объему от дивергенции векторного поля в трехмерном пространстве может быть преобразован по теореме Остроградского-Гаусса в интеграл по поверхности, охватывающей этот объем. Теорема Остроградского-Гаусса может быть обобщена на случай четырехмерного пространства-времени: jdMAM d4x = j>AMdSM, (2.47) где dSM — элемент гиперповерхности в четырехмерном пространстве- времени. В нашем случае jdv(F"vSAM)d4x = j>F^SAM dSv . (2.48) Поверхность в пространстве-времени должна быть выбрана следующим образом. Она должна состоять из двух гиперплоскостей £, и S2, которые
2. Потенциалы электромагнитного поля 33 представляют все пространство в моменты времени tx и t2, и «боковой» поверхности четырехмерного цилиндра (см. рис. 1). Время Пространство Рис. 1 На поверхностях £, и S2 в моменты времени tx и t2 поля фиксированы, и их вариации равны нулю: И(0 = °> И('2) = °> (2.49) (аналогично тому, как это имело место для координат механической системы, см. (2.38)). Поскольку полная гиперповерхность должна охватывать все трехмерное пространство в моменты времени между tx и t2, «боковую» часть гиперповерхности следует отнести на бесконечность, где полевые функции обращаются в нуль. Следовательно, на «боковой» поверхности FMV = 0 и в целом интеграл (2.48) обращается в нуль. В силу произвольности вариаций 8АЦ из принципа наименьшего действия (2.45) следует уравнения поля: dyF"v=-—f. с (2.50) Последняя запись содержит четыре уравнения (// = 0, 1, 2, 3). Так, вспоминая явный вид тензора FMV (2.33), при ju = 1 получим \dF10 dFu dF12 dF13 с dt дх ду dz 4л , = J . с с dt dHz дНу ду dz 4л- . —л; с (2.51) (2.52)
34 Часты при /и = 2 при // = 3 1 dF20 { 3F21 | dF22 | 3F23 = Ал ш2 (253) с Э* Эх ду dz с 1 дЕу [ ЭЯ2 ЭЯ, = 4л- . . с 3/ Эх 3z с >" 1 3F30 | dF31 | 3F32 | dF33 = 4л: .3 с Э* Эх ду 3z с iae эяу эяг 4л- сЭ/ Эх ду cJz' (256) Уравнения (2.52), (2.54) и (2.56) можно переписать как 1ЭЕ rotH = -^j, (2.57) с at с что совпадает с третьим уравнением Максвелла, а уравнение с // = О 13F00 3F01 3F02 dF03 Ал .„ „ ,й, + + + = у0, (2.58) с dt Эх ду dz с dEz Щ dEz -^-t^^7* (259) совпадает с четвертым уравнением Максвелла (1.17). Таким образом, мы получили четыре уравнения для четырех компонент поля Ам. Что касается первого и второго уравнений Максвелла, их можно рассматривать как следствие связи между потенциалами и напря- женностями поля (2.5), (2.2). В самом деле, мы получили связь между напряженностью магнитного поля Н и векторным потенциалом А как следствие второго уравнения Максвелла, а связь между напряженностью электрического поля Е и скалярным и векторным потенциалами — как следствие первого уравнения Максвелла. Обратно, беря ротор от обеих частей уравнения (2.5), 1 Э rotE = -rot gmdtp— ;TrotA' (2.60) получаем первое уравнение Максвелла (1.56). Беря дивергенцию от обеих частей уравнения (2.2), divH = div rot A, (2.61) получаем второе уравнение Максвелла (1.22).
2. Потенциалы электромагнитного поля 35 В четырехмерной формулировке первое и второе уравнения Максвелла вытекают из свойств тензора FMV. Составим тензор третьего ранга \vx = дяГМу + Эк/^ + dMFvA. (2.62) Он является антисимметричным по всем своим индексам вследствие антисимметричности тензора FMV. Например, Л/Я = ^ХРуц + ^iiFXv + dvF/bl = ~^XFMv " Э/Лл " Эк^ = ~АцуХ • (2.63) Уравнения Эд^+Эк^+Э^=0 (2.64) содержат первое и второе уравнения Максвелла. В этом легко убедиться, расписав уравнения (2.64) по компонентам, как это было сделано выше для уравнений (2.50). В силу антисимметричности отличны от нуля только те компоненты тензора А х> у которых индексы //, v, Л принимают различные значения. Таких комбинаций индексов //, v, Л всего четыре, поэтому запись (2.64) содержит четыре скалярных уравнения. Уравнения (2.64) можно записать еще в одной форме, введя единичный абсолютно антисимметричный псевдотензор еМуЛр — четырехмерный аналог символа Ле- ви-Чивиты eijk : <W: *о,2з=*0123=1- (2.65) Тогда (2.64) эквивалентно записи «""4FV=0. (2.66) Последнее выражение имеет один свободный индекс, /I, что делает совершенно очевидным тот факт, что (2.66) содержит четыре независимых уравнения. 2.4. Теорема единственности для системы уравнений Максвелла. Итак, мы имеем два представления уравнений электромагнитного поля: либо через напряженности, либо через потенциалы поля. Система уравнений Максвелла (1.1)— система дифференциальных уравнений в частных производных первого порядка относительно полевых переменных (напря- женностей). Можно доказать так называемую теорему единственности для системы уравнений Максвелла. I Пусть заданы источники поля — функции /7(г, t) и j(r, t) в произ- I вольный момент времени. Пусть также заданы начальные условия — I значения Е(г, 0) и Н(г, 0) в начальный момент времени внутри
36 Часть! некоторого объема V, а на поверхности S этого объема заданы граничные условия — компоненты одного из векторов Е(г, *)| или Н(г, *)| в произвольный момент времени. При этих условиях решение уравнений Максвелла внутри объема V единственно. Доказательство теоремы проводится от противного и не представляет сложностей. Предположим, что существуют два различные решения системы уравнении: {Е„ Н,} и{Е2, Н2}.Тогда Е = Е,-Е2, Н = Н,-Н2 (2.67) также является решением уравнений Максвелла, в которых p(r,t) = 0, j(r,f) = 0, (2.68) с начальными условиями внутри объема V, Е(г,0) = 0, Н(г,0) = 0, (2.69) и граничными условиями на поверхности S, Е(г,01=0, Н(г,4=0. (2.70) Воспользуемся уравнением баланса энергии (1.77), которое, как указывалось ранее, является следствием уравнений Максвелла. Используем интегральную форму (1.79) этого уравнения. Учитывая равенство нулю источника j = 0 и определение плотности энергии w и вектора Пойнтинга Р, ±|р+Я-К = -^[Е,НИ. (2.71) Поскольку, согласно граничным условиям (2.70), на поверхности S напряженности полей обращаются в нуль, интеграл в правой части (2.71) также равен нулю. Мы получаем j(E2 +H2)dV = const. /2 72) v Но, согласно начальным условиям (2.69), напряженности полей в начальный момент времени равны нулю, постоянная в правой части (2.72) равна нулю. Это возможно, если только во всем объеме Кво все моменты времени Е(г,0 = 0, Н(м) = 0, (2.73) что доказывает теорему. 2.5. Уравнения движения заряженных частиц. Теорема утверждает, в частности, что единственное решение уравнений Максвелла существует, если известны источники поля — распределение зарядов и токов /?(r, t)
2. Потенциалы электромагнитного поля 37 и j(r, i). Поэтому, чтобы полностью определить распределение зарядов и конфигурацию полей в пространстве в произвольный момент времени, уравнения Максвелла следует дополнить уравнениями движения зарядов ^ = eE + ^[v,H]. (2.74) at с В правой части этого уравнения стоит выражение для силы Лоренца (1.81), действующей на заряд со стороны электромагнитного поля. Так же, как и уравнения электромагнитного поля, уравнения движения заряда могут быть получены из принципа наименьшего действия. При этом необходимо искать вариацию действия не по полевым переменным (потенциалам поля), а по координатам частицы. Нужно иметь в виду, что электродинамика является релятивисткой теорией, она должна согласовываться с требованиями специальной теорией относительности. На это указывает тот факт, что константа с— скорость света— входит в важнейшие уравнения электродинамики. При скоростях, близких к скорости света, проявляются релятивистские эффекты. Разумеется, когда Максвелл выводил свои уравнения, ни о каких релятивистских эффектах еще не было известно. В 1879 году, в год смерти Максвелла, родился Эйнштейн, который создал специальную теорию относительности в 1905 году. Однако в том и заключается гений великого ученого, чтобы предвидеть дальнейшее развитие теории. Уравнения Максвелла полностью согласуются со специальной теорией относительности, более того, именно развитие электродинамики, в частности установление экспериментального факта, что скорость света одинакова по отношению ко всем системам отсчета, привело в итоге к созданию специальной теории относительности. Не будем забывать, что работа Эйнштейна 1905 года, в которой формулировалась его теория, носила название «К электродинамике движущихся тел». Для того чтобы получить уравнения движения заряда из принципа наименьшего действия, нужно рассмотреть член, описывающий свободную релятивистскую частицу, и член, учитывающий взаимодействие частицы с электромагнитным полем. Действие для свободной релятивистской частицы должно быть инвариантно относительно преобразований специальной теории относительности— преобразований Лоренца. Известно, что инвариантной величиной является пространственно-временной интервал ds (2.11). Инвариантность интервала является следствием того экспериментально установленного факта, что скорость света одинакова во всех системах отсчета. Представим интервал следующим образом: *) +{dA 4- A) {dtj {dt = с«Й,|1~. (2.75)
38 Часть! Тогда действие для свободной частицы можно представить в виде '2 '2 | ~2~ *W = ~mc\ds = -mc2U\ - -dt. (2.76) »i '. v c v2 В классическом пределе (с—»°°) отношение — можно рассматривать как с малую величину. Воспользуемся формулой lim(l + x)g=l + orx+a^t"1^2+.... (2.77) Имеем ^S^e=-mc^-^y = -mc\t2-tl) + )^dt^dt. (2.78) tx \ J Г, Г, (Отбрасывая постоянную -тс1 (t2 -tx), не влияющую на уравнения движения, мы получаем в пределе при с —» °° известное выражение для свободной нерелятивистской частицы.) Напомним, что в теоретической механике импульс определяется как производная функции Лагранжа по обобщенной скорости: S = \c(q(t),q(t)9t)dt9 (2.79) _дС Р~^' (2.80) Соответственно, в релятивистской теории мы получаем новое вьфажение импульса через скорость частицы: С = -тс\\\-^, (2-81) с2' т\ {_S_ (2.82) Очевидно, при с —» °° р = т\. Член, учитывающий взаимодействие частицы с электромагнитным полем, уже был выписан ранее (см. (2.42)). Имея в виду определение четы-
2. Потенциалы электромагнитного поля 39 рехмерного тока (см. (2.43)), dxM f =P-JT = (CP> РУ) = (СР> J)> p = eS(r-r'), at это выражение можно преобразовать следующим образом: *— = -jrj^f^ = ~jlA^dV cdt = = --jpAMdx"dV = --lAMdx"S{r - r')dV = --JA^dx". Итак, мы должны рассмотреть действие S = -Umcds + -Attdx*\ Запишем вариацию действия (2.85): <И = -[Г«с S(ds) + -A/1S(dxM) + -SA/ldxM~\. Прежде всего выясним, что такое 8(ds). Поскольку ds2=c2dt2-dx2-dy2-dz2 = dx/1dxM, ds = Jdx/1dx", вводя четырехмерный вектор скорости частицы dxM ds dx" ds получаем Тогда dx„S[dxM) dx , > , > ijdxvdxv ds (2.83) (2.84) (2.85) (2.86) (2.87) (2.88) (2.89) Д5 = -|Гтс S(ds) + -AMS(dx") + -SAMdx>' = -j\mc uMd(Sx") + -AMd(SxM) + -SAMdxM = -J mc d^Sx^-mcduMSx> +-d(AMSx>')--dA/lSx'' +-SAtldx" (2.90)
40 Часть! Далее используем соотношения ЪА„ du dx" du„ = ——ds; dx? = uMds = ds. " ds ds (2.91) (2.92) С учетом этого SS = тс и„+—А„ \Sx' i- + \\ mc^ds Sx" + -^-dxvSx" --^-Sxvdx" ds с ох с ox -J ds с у ох охм (2.93) = J| mc^-ds Sxf-'-F^ds sAMc^-^ ds dsSx". (Как и раньше, внеинтегральный член обращается в ноль на пределах интегрирования.) Мы получаем уравнения движения зарядов в четырехмерной форме: тс- ds -■-Fuvu\ (2.94) Для того, чтобы убедиться, что уравнения (2.94) эквивалентны уравнениям (2.74), необходимо выписать в явном виде компоненты четырехмерного вектора скорости. В системе отсчета, относительно которой частица движется, ds - с dtJl —=- (см- (2.75)). Следовательно, dx" ds сЛ 1 dxM v2 dt 1 ■4 4-$, (2.95) Л
2. Потенциалы электромагнитного поля 41 Заметим в этой связи, что в системе отсчета, относительно которой частица покоится (v = 0), интервал ds = c dr, где dr — собственное время частицы. Поскольку интервал ds — инвариантная величина, с dr-c dtA\ (2.97) отсюда следует известное из специальной теории относительности сокращение времени, которое проявляется для объектов, движущихся с большими скоростями: dr dt- Возвращаясь к уравнениям (2.94), отметим, что в них содержится на одно уравнение больше, чем в (2.74). Уравнения (2.94) с // = 1, 2, 3 эквивалентны трем уравнениям (2.74), в то время как уравнение с // = 0 приводится к виду d_ dt тс '-*, KE,v). (2.99) Здесь Ек = 1- (2.100) — кинетическая энергия релятивистской частицы. Второй член, е(Е, v), представляет собой работу, произведенную над частицей электрической составляющей силы Лоренца в единицу времени. Таким образом, уравнение (2.94) с // = 0 выражает закон сохранения энергии для релятивистской частицы. 2.6. Присутствие уравнения связи в числе уравнений поля и калибровочная инвариантность. Можно сказать, что у нас есть две формулировки электродинамики. Во-первых, система уравнений Максвелла, которая имеет единственное решение для напряженностеи поля при условии, что заданы источники поля, плюс уравнения движения зарядов в электромагнитном поле. Во-вторых, мы можем записать уравнения для потенциа-
42 Часть! лов поля, и, хотя этих уравнений всего четыре, они полностью эквивалентны системе уравнений Максвелла (разумеется, источники поля в этих уравнениях также должны быть заданы, т. е. уравнения движения зарядов сохраняют свое значение). Формулировка электродинамики через потенциалы поля раскрывает одну важную особенность этой теории. Уравнения поля (2.50) содержат производные первого порядка от тензора FMV, т. е. производные второго порядка от функций поля. Однако только три из четырех уравнений содержат производные второго порядка по времени от функций поля. Действительно, уравнение с // = 0, которое совпадает с четвертым уравнением Максвелла (1.17), не содержит первых производных по времени от компонент напряженности электрического поля и, следовательно, вторых производных по времени от потенциалов. В то же время, уравнения (2.50) — это уравнения Лагранжа для электромагнитного поля. Если система уравнений Лагранжа разрешима относительно вторых производных по времени, т. е. представима в виде то для системы уравнений Лагранжа можно сформулировать так называемую задачу Коши: необходимо найти функции q(t) при заданных начальных условиях, т. е. известных значениях функций q(0) и их производных в начальный момент времени. Для системы обыкновенных дифференциальных уравнений (которая описывает поведение механической системы) задача Коши имеет единственное решение. Для системы уравнений в частных производных (какой является система уравнений Лагранжа в случае теории поля, в частности электродинамики) исследование существования и единственности задачи Коши более сложно. Однако известно, что, если не все уравнения Лагранжа содержат производные второго порядка по времени, задача Коши не имеет однозначного решения. Уравнения, которые содержат производные более низкого порядка по времени (производные первого порядка и сами полевые функции), называются уравнениями связей. Можно доказать, что в этом случае решение системы уравнений зависит от произвольных функций, причем число этих произвольных функций равно числу уравнений связи. Наличие связей также свидетельствует о том, что теория инвариантна относительно некоторого класса преобразований, называемых калибровочными, т. е. имеет место калибровочная инвариантность. Такие теории называют теориями со связями или калибровочными теориями. В случае электродинамики мы имеем одно уравнение связи (1.17), и решение уравнений для потенциалов должно зависеть от одной произ-
2. Потенциалы электромагнитного поля 43 вольной функции. И в самом деле, как нам уже известно, потенциалы можно подвергнуть калибровочным преобразованиям (2.6), (2.7), зависящим от произвольной функции %(r, t). В четырехмерном виде (A"'j=A^-d^z, (2103) */ э *f Э д" = МГ' д" = дГм- (2-104) Не составляет труда убедиться, что тензор FMV инвариантен относительно преобразований (2.102). Это не удивительно, так как мы знаем, что компонентами тензора FMV являются напряженности поля, которые инвариантны относительно (2.6), (2.7). 2.7. Калибровочные условия. Калибровки Кулона и Лоренца. Для того, чтобы ограничить свободу выбора произвольной функции ;tf(r, t), на потенциалы поля накладываются дополнительные условия, называемые калибровочными условиями. Примеры калибровочных условий: Калибровка Кулона: divA = 0. (2.105) Калибровка Лоренца: —^ + divA = 0, (2.106) с at или, в четырехмерной форме, дмАм=0. (2.107) Получим уравнения для потенциалов поля, подставив в третье уравнение Максвелла ,„ 1ЭЕ 4л-. соотношения (2.5), (2.2). Учитывая формулу (1.44), получаем rot rotA = -^-igrad^ + ^j, (2-109) с at с at с АА 1 Э2А /1Э(Р .. Л 4х. , ч АА—J-—1- = grad --^ + divA j. (2.110) с at \c at ) с
44 Часть! Подставляя (2.5) в четвертое уравнение Максвелла (1.17) и учитывая, что div grad<p = A<p, (2.111) получаем: A<p + -—divA = -4xp. (2.112) cat Уравнения (2.110), (2.112) могут быть записаны в четырехмерной форме: d2Av д2Ам = 4лг .м dxMdxv dxvdxv с 3 ' (2Л13) Уравнения для потенциалов (2,110), (2.112) будут иметь различный вид в различных калибровках. В кулоновской калибровке: AA--H^£g»d*—J. (2П4) с at cat с А<р = -4яр. (2.115) В калибровке Лоренца: ДА-J^-^j, (2-116) с2 dt2 с J А 1 ^V Л 9~7^F= лр- (2117> Заметим, что наложение калибровочных условий типа (2,105), (2.106) на фиксируют полностью произвол в выборе функции %(r, t). Действительно, проведем калибровочное преобразование потенциалов (2.6), (2.7) в уравнении, фиксирующем калибровку Лоренца (2.106): !Э£_ 1 a^+divA+div ^^=0, (2П8) с dt с2 Эг 1 да .. . . 1 Ь2Х п Калибровка Лоренца не будет нарушена, если функция х{т> 0 удовлетворяет уравнению Д*-Нгт=0- (2120) с2 Эг
2. Потенциалы электромагнитного поля 45 Получим то же уравнение в четырехмерной форме, выполнив в (2.107) преобразование (2.103) дмА"-дмд"% = 0, (2121) Э,Э"дг = 0. (2.122) Вообще, произвольное калибровочное условие f{A") = 0 (2.123) не нарушается, если функция ^(r, t) (параметр калибровочного преобразования) удовлетворяет уравнению jLsA«=o. (2.i24) Здесь SAM=-dMz (2.125) — изменение потенциалов вследствие калибровочного преобразования, Sf вариационная производная, которая, в частности, может быть салибровки Лоренца = дм. (2.126) 8А* оператором. Например, в случае калибровки Лоренца Sf SA" и (2.124)-(2.126) приводит к уравнению (2.122). Уравнение (2.124) называется уравнением для остаточных калибровочных преобразований. Иными словами, после наложения калибровочного условия (2.123) у нас еще есть возможность подвергать потенциалы остаточным преобразованиям, для которых параметр преобразования— функция ^(r, t) — удовлетворяет уравнению (2.124). 2.8. Эффект Ааронова-Бома. Возникает вопрос: потенциалы— это лишь математическая конструкция, не имеющая физического смысла, или же они отражают какую-то сторону физической реальности? Чтобы попытаться ответить на этот вопрос, обратимся к так называемому эффекту Ааронова-Бома (рис. 2). Рассмотрим известный квантовомеханический двухщелевой эксперимент. Пучок электронов проходит через щели в первом экране, на втором экране наблюдается интерференционная картина. Предположим, что за первым экраном между щелями находится соленоид бесконечной длины, расположенный параллельно плоскости экрана. Как известно, магнитное поле такого соленоида сосредоточено внутри него. Все электроны движут-
46 Часть! ся вне соленоида, в области, где магнитное поле отсутствует. Тем не менее пропускание электрического тока через соленоид приводит к смещению интерференционной картины на втором экране. источник электронов путь 1 путь 2 интерференция экран Рис.2 Попробуем разобраться, каким образом магнитное поле соленоида воздействует на пучок электронов. Вспомним, что уравнение Шредингера для свободной частицы —р2х¥ = ЕЧ/ 2т в присутствии магнитного поля запишется как 1' —|р--А| Ч = Е9. 1тп (2.127) (2.128) Соответственно, волновая функция частицы с импульсом р приобретает зависимость от векторного потенциала *F = hFexp I'--A (2.129) Разность фаз при движении электрона по траекториям L, и 1^: A^-^jAdr + fjAdr = fjMr = fjrotAdS = -fjBdS. (2Лщ Разность фаз определяется интегралом по замкнутому контуру L, состоящему из траекторий Ц и L2, который в соответствии с теоремой Стокса можно преобразовать в интеграл по поверхности S, охватываемой контуром L, и который представляет собой поток напряженности магнитного
2. Потенциалы электромагнитного поля 47 поля Н через поверхность S. Очевидно, поток магнитного поля Н не равен нулю, так как поверхность S включает в себя область внутри соленоида. Это подразумевает, что векторный потенциал А не может быть равен нулю во всех точках контура L. С другой стороны, во всех точках контура L H = rotA = 0, (2.131) откуда следует, что А = grader. (2.132) В области, где магнитное поле отсутствует, векторный потенциал является, как говорят, чистой калибровкой. Казалось бы, векторный потенциал можно подвергнуть калибровочному преобразованию (2.7) с функцией #(r, t), подобранной таким образом, чтобы потенциал А обратился в нуль. Однако это вступает в противоречие с уже сделанным выводом о том, что он не может быть равен нулю во всех точках контура L. Это ограничивает возможность подвергнуть потенциал произвольному калибровочному преобразованию. Может оказаться, что введение потенциалов — не просто математический трюк, и они несут более глубокую информацию о структуре электромагнитного поля, чем напряженности. Тот факт, что в реальных физических экспериментах мы пока не наблюдаем указаний на нарушение калибровочной инвариантности, не значит, что они не будут обнаружены на более глубоком уровне исследований структуры пространства-времени.
Глава II. Решения уравнений Максвелла 3. Свободное электромагнитное поле 3.1. Уравнения поля в отсутствие источников. Нашей следующей задачей является анализ наиболее важных решений уравнений Максвелла. Мы начнем с рассмотрения свободного электромагнитного поля, т. е. поля в отсутствие источников. При этом система уравнений Максвелла примет вид , ч 1ЭН(г,0 rotE(r,f = ^; v ' с dt divH(r,f) = 0; , , 1ЭЕ(г,0 (ЗЛ) divE(r, *) = 0. Применим операцию взятия ротора к первому из уравнений Максвелла. Используя соотношение (1.44), второе и третье уравнения, получим 1 Э rot rotE = ——rotH; (3.2) cat 1 Д2Е grad divE-AE = —T—r; (3.3) с ot «-£$-•• CM) Аналогично, применяя операцию взятия ротора к третьему уравнению Максвелла, получаем rot rotH=-—rotE; (3.5) cot grad divH-AH = ~^; (3.6) с ot
50 Часть! Таким образом, напряженности электрического и магнитного полей удовлетворяют уравнению д'Аламбера (волновому уравнению). Такому же уравнению удовлетворяют потенциалы поля при отсутствии источников в калибровке Лоренца (см. (2.116), (2.117)): 1 Э2А АА-44# = 0; (3.8) *-■§... (3.9) с- dt2 3.2. Решение уравнения д'Аламбера для плоских волн. Обратимся к частному случаю, когда поле зависит только от одной координаты х и от времени t. Рассмотрим уравнение dt2 аьс2 Его можно переписать следующим образом: Сделаем замену переменных :0. ■•ШЧу-0- X ■-t—, с X = '+-; с Тогда *=\{п+€), *=|(»7-£). Э£ d4dt + d£dx 2{dt Сдх А=А А+J^A=J/A+с А дт} drjdt дт}дх 2{dt дх Уравнение (3.11) принимает вид э2/ дфт. и. Общее решение этого уравнения есть V с) )+/2 + /2 t+— (3.10) (3.11) (3.12) (3.13) (3.14) (3.15) (3.16) (3.17) (3-18)
3. Свободное электромагнитное поле 51 Рассмотрим одно из решений, /At .В каждой плоскости х = const поле изменяется с течением времени, и в каждый момент времени поле различно для разных значений х. Поле имеет одинаковые значения для координат х и моментов времени t, связанных соотношением t — = const (3.19) с или x = x0 + ct. (3.20) Если в некоторый момент t = 0 в некоторой точке пространства х = х0 поле имело определенное значение, то через промежуток времени t поле будет иметь то же самое значение на расстоянии ct от точки х = х0 вдоль оси х. Таким образом, поле распространяется в пространстве вдоль оси х со скоростью, равной скорости света с. Решение fA t— представляет собой волну, распространяющуюся в положительном направлении оси х. Соответственно, /2 \t + — представляет собой волну, распространяющуюся в отрицательном направлении оси х. Напомним, что фазой называется состояние колебательного процесса в определенный момент времени. Из сказанного выше следует, что точки с координатами х и t, связанными соотношением (3.20), колеблются в одинаковой фазе. Геометрическое место точек, колеблющихся в одинаковой фазе, называется волновой поверхностью. В данном случае волновой поверхностью является вся бесконечная плоскость, перпендикулярная направлению распространения волны, поэтому волна называется плоской. Геометрическое место точек, которых достигают колебания к моменту времени t, называется фронтом волны. Очевидно, волновой фронт также является волновой поверхностью, Дифференцируя соотношение (3.20) по времени, найдем скорость перемещения в пространстве точки с определенным значением фазы — фазовую скорость волны: dx v,A=- = c (3.21) Как мы видим, фазовая скорость электромагнитной волны совпадает со скоростью света. 3.3. Свойство поперечности электромагнитных волн. Как обсуждалось ранее, дополнительное калибровочное условие не полностью фикси-
52 Часть! рует значения потенциалов поля. Так, калибровка Лоренца (2.106) не будет нарушена, если скалярный потенциал положить равным нулю, а векторный потенциал удовлетворяет калибровке Кулона (2.105): <р=0, (3.22) divA = 0. (3.23) В случае плоской волны, когда поле зависит только от t и jc, условие (3.23) сводится к уравнению Из уравнения (3.8) следует дх эЧ. ъе или ^4 dt = COnSt. (3.24) (3.25) (3.26) ЭА В соответствии с (2.5) при условии (3.22) производная —— определяет at электрическое поле. Если компонента Ах отлична от нуля, соотношение (3.26) подразумевает наличие постоянной составляющей электрического поля вдоль оси х— продольного электрического поля. Эта составляющая не имеет отношения к электромагнитной волне, и поэтому мы можем положить Ах = 0. (3.27) Таким образом, векторный потенциал всегда может быть выбран перпендикулярным к направлению распространения плоской волны. Покажем, что из этого следует свойство поперечности электромагнитных волн. Пусть а-а(,-£).а(Д. Тогда 1ЭА ЫА E = -gradp— — = — —. с at с ад Используя метод оператора набла, находим dA Н = rot А = [ V, А] = е.е^Д = е,^ -£ V,<f = VU-- dA Л, x \ dA grad| '~Mj dA 'dt\ (3.28) (3.29) (3.30) :K,E].
3. Свободное электромагнитное поле 53 Применяя оператор V к векторному потенциалу, мы учли правила дифференцирования сложной функции и тот факт, что grad t— имеет единственную составляющую вдоль направления распространения волны: gtad('"f):—с"*' (3-31) Из (3.29), (3.30) следует, что напряженности электрического и магнитного полей Е и Н перпендикулярны к направлению распространения волны (свойство поперечности электромагнитных волн). В самом деле, выше было показано (с учетом (3.26)), что продольная составляющая напряженности электрического поля может быть только постоянной и не имеет отношения к электромагнитной волне. Из (3.30) вытекает, что вектор напряженности магнитного поля является перпендикулярным не только к направлению распространения волны, но также к вектору напряженности электрического поля. Из (3.30) также видно, что |Е| = |Н|, (3.32) поэтому плотность энергии электромагнитной волны №=1(£'+Яг)^^, (3.33) 8*V ; Ал Ал К ' а вектор плотности потока энергии электромагнитной волны (вектор Пойнтинга) ^[ЬН]-^[Ые,.Е]]-^М'-Е(.,.Е)Ь (зм) =—Е ег = —Н er = cweY. 4л- х 4л- (Электромагнитное поле распространяется со скоростью света.) 3.4. Монохроматическая волна. Поляризация волн. Еще один важный частный случай электромагаитных волн — монохроматическая волна, в которой поле является периодической функцией времени. В этом случае зависимость от времени потенциалов и напряженностей поля имеет вид cos(tf* + ar), (3.35) где со — частота волны. Соответствующая длина волны лЛ~. (3.36) СО
54 Часть I В волновом уравнении Af- id2/. с2 dt2 имеем э2/. dt2 4T-°?f, (3.37) (3.38) так что распределение поля в пространстве определяется уравнением 7 ¥+—/=0. (3.39) с В монохроматической плоской волне, распространяющейся вдоль оси х, поле является периодической функцией от t —. Тогда можно записать с A = Re A0exp -ico\ t (3.40) Здесь А0 — постоянный комплексный вектор. Введем волновой вектор 1 ® к=—п, с (3.41) п — единичный вектор в направлении распространения волны, в частности в нашем случае п = ех. Учитывая, что х = (г, п), получим А = Re(A0 ехр[-/(й* - кг)]). (3.42) Такая форма записи не зависит от выбора осей координат. Фазу волны в данном случае определяет величина <p=ax-kr. (3.43) Часто, если над величинами производятся только линейные операции, бывает удобно оперировать с комплексными величинами, беря действительную часть только на заключительном этапе вычислений. До тех пор знак взятия действительной части можно опускать. Таким образом мы находим A = A0exp[-i(fflT-kr)], (3.44) Е = _А^ = ^А = /*А, (3.45) с at с H=[n,E] = i[Jtn,A] = i[k,A]. (3.46)
3. Свободное электромагнитное поле 55 Обратимся теперь к напряженности поля. Для определенности будем говорить о напряженности электрического поля, хотя то же самое справедливо по отношению к магнитному полю. Поскольку вектор напряженности совершает колебания в плоскости, перпендикулярной направлению распространения волны, его можно разложить на две взаимно перпендикулярные составляющие, лежащие в этой плоскости. Будем исходить из представления Е = Re(E0 exp[-i(fi* - kr)]). (3.47) Здесь Е0, вообще говоря, — некоторый комплексный вектор, и его квадрат также представляет собой комплексный вектор: Ej=|E^-2'\ (3.48) Тогда мы можем ввести комплексный вектор b такой, что Е0=Ье-а, (3.49) который имеет действительный квадрат. В самом деле, E^bV2'", (3.50) b2=|E2|. (3.51) С другой стороны, b = b,+/b2, (3.52) где bj, b2 — два действительных вектора. Ъ2=%-%+2л(Ъ19Ъ2) (3.53) — действительная величина. Следовательно, векторы b19 b2 взаимно перпендикулярны, (ЬРЬ2) = 0. (3.54) Возвращаясь к (3.47), мы можем записать E = Re([b1+ib2]exp[-i(fflT-kr + a)]). (3.55) Выбирая ось х вдоль направления распространения волны, мы теперь можем выбрать ось у по направлению вектора Ь,. Тогда направление оси z будет совпадать с направлением вектора Ь2 или будет противоположно ему: Ey=RQ^blQxp[^-i(cot-\ir + a)Jj = blcos(cot-kr + a), (3.56) £z = Re(±/Z72exp[-/(^-kr + ar)]) = ±Z72sin(tar-kr + ar). (3.57)
56 Часть! Знаки «±» соответствуют двум направлениям вращения волны. Из (3.56), (3.57) получим Е2 F2 -f + |- = l. (3.58) В каждой точке пространства вектор напряженности электрического поля вращается в плоскости, перпендикулярной направлению распространения волны, при этом его конец описывает эллипс (3.58). Волна называется эллиптически поляризованной. Если bx=b2, уравнение эллипса (3.58) становится уравнением окружности. Вектор Е вращается, оставаясь постоянным по модулю. В таком случае волна является поляризованной по кругу. Двум направлениям вращения соответствует левая и правая поляризации волны. Если Ьх = О или Ь2=0, вектора Е колеблется вдоль одной прямой, меняясь по направлению. Этот случай соответствует линейной поляризации волны. Эллиптически поляризованную волну можно рассматривать как суперпозицию двух линейно поляризованных волн. 3.5. Частично поляризованные волны. Тензор поляризации. Гораздо чаще, чем с монохроматическими волнами, приходится иметь дело с волнами, содержащими набор частот в некотором малом интервале. Рассмотрим волну, которая имеет набор частот в интервале (o)-Sco, 6)+So)), т. е. набор частот, близких к определенной частоте со. Такая электромагнитная волна называется частично поляризованной. Интенсивность электромагнитной волны характеризует плотность ее энергии. Более точно, интенсивность волны определяется как модуль усредненного по времени плотности потока энергии, переносимой волной: ^И-И~(^)~И- (3.59) Введем тензор поляризации Jafi={Ea(t)E;(t)). (3.60) Значения компонент поля берутся в определенной точке пространства, а усреднение производится по времени. Поскольку вектор Е всегда лежит в плоскости, перпендикулярной направлению распространения волны, он имеет всего две компоненты, поэтому индексы a, J5 пробегают значения 1, 2 (или у, z). Таким образом, тензор J^ имеет всего четыре компоненты. Сумма диагональных компонент тензора представляет собой среднее значение квадрата модуля вектора Е: Jm = (\E^t^Ez(t)\2y{E>) = *fl~I. (3.61)
3. Свободное электромагнитное поле 57 Для тензора J^ J„ -f (3.62) причем его диагональные компоненты действительны. В естественном, или полностью неполяризованном, свете присутствуют все частоты. В этом случае тензор поляризации будет иметь вид As. qP> (3.63) Действительно, поскольку проекции Ey(t), Ez(i) независимы, недиагональные компоненты тензора, которые получаются усреднением проекций Е (t)j Ez(t) по времени (или, что в данном случае то же самое, усреднением по всем направлениям вектора Е в пространстве) равны нулю. Диагональные компоненты равны по величине, и, поскольку их сумма рав- на —/, мы приходим к формуле (3.63). щъ2 В случае монохроматической волны, используя представление £y=^exp[-i(u*-lo- + a)], Ez = ±ib2 exp[-/( cot - кг + яг)], получаем Поскольку экспоненты сокращаются, усреднение по времени здесь не требуется. Тензор (3.66) описывает волны с эллиптической поляризацией и двумя возможными направлениями вращения, чему соответствуют знаки «±». Волнам с круговой поляризацией (ЬХ=Ь2) соответствует тензор < 1 ±Л (3.64) (3.65) (3.66) 2ж \+1 1 Линейно поляризованным волнам соответствует тензор 1 (Л J« <•% о или V .4*7|° О ' с 0 1 (3.67) (3.68) (3.69) Для поляризованных волн определитель тензора L/J = 0.
58 Часть! В случае частично поляризованных волн тензор J^ можно представить в виде суммы двух частей: тензора полностью неполяризованного света J $ и полностью поляризованного света J^: J« = J$+J$. (3.70) Степенью поляризации волны называется отношение интенсивности полностью поляризованной части волны 1р к полной интенсивности волны: Р = —^—. (3.71) р п (1п — интенсивность неполяризованной части волны). Аналогично можно определить степень деполяризации волны: р = —**— = \-Р. (3.72) Р « Поскольку вид тензора J^J известен (см. (3.64)), зная компоненты полного тензора J^ и принимая во внимание равенство нулю определителя тензо- Ар) « « pa Jqp , можно найти интенсивности поляризованной и неполяризованной частей волны, а также степень ее поляризации. 4. Запаздывающие потенциалы После рассмотрения свободного электромагнитного поля (электромагнитных волн) обратимся к решению уравнений поля с источниками. Как мы видели выше, если на потенциалы поля наложена калибровка Лоренца, они удовлетворяют неоднородным уравнениям д'Аламбера: .. 1 Э2А 4х. .... ^"Ta^T1' (4Л) !2„ dt2' А<Р~^Т = -4яр. (4.2) Поскольку уравнения (4.1) и (4.2) имеют одинаковую структуру, Достаточно рассмотреть уравнение для скалярного потенциала (4.2). Общее решение неоднородного уравнения (4.2), как известно, можно представить в виде суммы общего решения однородного уравнения для свободного поля и частного решения неоднородного уравнения. Следовательно, наша задача заключается в отыскании частного решения неоднородного уравнения.
4. Запаздывающие потенциалы 59 4.1. Функция Грина неоднородного уравнения д'Аламбера. Определим функцию Грина неоднородного уравнения д'Аламбера G(r, t\ r', t') как решение уравнения AG-^ = -AnS(r-r')S(t-t'). (4.3) Тогда решение уравнения (4.2) может быть представлено в виде p(r, t) = JG{r, t; г', t')p(r', t')dV dt'. (4.4) 1 Э2 Подействуем оператором А—j—у на (4.4). Поскольку мы дифференци- с ot руем по координатам г, t, оператор действует только на находящуюся под интегралом функцию Грина, и мы получаем: Др-4|? = j(AG-\^]p(r\ t')dV'dt' = с2 dt2 }{ с2 dt2 ) (4.5) = -4^jS(r-r')S(t-t')p(r, t')dVdt' = -Anp(r, t). He сложно доказать, что функция Грина G(r, t; т, t') зависит лишь от разностей R = r-r', r = t-t': G{r, t; r', t') = G{r-r',t-1') = G(R, r). (4.6) В самом деле, правая часть уравнения (4.3) зависит только от R, т. При постоянных г', t' производные по г, t будут равны производным по R, т. Уравнение (4.3) можно представить в виде AG-\?-§ = -4nS(R)S(T). (4.7) С ОТ Если заряд находится в точке с координатой г', то R = г - г' представляет собой радиус-вектор, проведенный из точки, где находится заряд, в точку наблюдения. Учитывая, что поле заряда обладает сферической симметрией, удобно переписать уравнение (4.7) в сферических координатах: А^ 1 d(n2dG} 1 Э ( . „oG\ 1 d2G AG = —— R — + —5 -г- sin0— + ——=—-—r. (4.8) R2dR[ dR R2sm0d0{ Ъв) R2sm20 Так как решение не должно зависеть от углов 0, ф, мы получаем уравнение R2dR{ Ш) с'дт2 к ' w Э G 2 Э(? 1 Э G . 0/_ % 0/ ч ,. . „ч ^яа/Г^э^"4^*^- (410)
60 Часть! Сделаем замену: G(R,r)=^, (4.11) К bG__\dx_ 1 dR~ RdR R ^-^lZ(R,r), (4.12) M*-RdR> RidR + RiX{R'r}- (413) Подставляя эти вьфажения в (4.10) и умножая на/?, получаем уравнение ^-^ = ^RS(R)S(r). (4.14) При R?K) правая часть равна 0 и мы получаем известное нам волновое уравнение вида (3.10), его общее решение Z(R, T) = 4T-f)+/2(T+f} (4Л5) Поскольку мы ищем частное решение, для нас достаточно выбрать одну из функций /t, /2. Итак, получаем 1 R R V с G{R,t) = -z \т— . (4.16) В этом решении функция х все е1Де не определена. Она должна быть выбрана таким образом, чтобы получить верное решение уравнения (4.7) также при R = 0. Заметим, что при R-+0 функция (4.16) обращается в бесконечность, так что ее производные по R растут быстрее, чем производные по т. Тогда при R—►О мы можем пренебречь в уравнении (4.7) членом 1 d2G 7 7 , и уравнение принимает вид с отг AG = -4nS(R)S(r). (4.17) Подставляя решение (4.16) при R—>0, получаем AjX{r) = ^7c5{R)S{t). (4.18) В соответствии с (1.16), A- = ~4xS(R) (4.19) R
4. Запаздывающие потенциалы 61 (напомним, что R = r-r/). Тогда, чтобы удовлетворить уравнению (4.18), мы можем положить Z{r) = S{r), (4.20) G{R,t)=±s(t-*\ (4.21) Попутно заметим, что, в соответствии с общим определением функции Грина, функция s(R) = J> (4-22) удовлетворяющая уравнению Д£ = -4л#(К), (4.23) является функцией Грина уравнения Пуассона (1.18). (В уравнении для функции Грина источник заменяется 8-функцией.) Подставим решение (4.21) в (4.4): <p(r, t) = JG(r, t; r', t')p(r', t')dV dt' = =fcb^'~''"^V(r''t,)dr dt'= (4-24) 4.2. Общее решение уравнений поля с источником. Физический смысл запаздывающих потенциалов. Общее решение можно записать как <p{r, t) = j\pU /-* W + fl,(r, t), (4.25) где <p0(r, t) — общее решение уравнения для свободного электромагнитного поля. Поскольку уравнение (4.1) содержит в себе три одинаковых уравнения для различных компонент векторного потенциала, каждое из которых совпадает с уравнением (4.2), мы можем сразу записать общее решение: Частные решения A(r,0 = ^j(r', t-^jdV'+A0(r,t). (4.26) <p(r,t) = \±p[r',t-^dV, (4.27)
62 Часть! A(r,t) = l-J±i(r',t-^jdV' (4.28) определяют поле в точке наблюдения с радиус-вектором г в момент наблюдения / через плотность заряда и плотность тока в предшествующий момент времени /' = /--. (4.29) с Если мы рассмотри поле одного точечного заряда, разница между моментами времени t и t' определяется временем распространения светового сигнала из точки с радиус-вектором г', где находится заряд, в точку наблюдения с радиус-вектором г. Потенциалы (4.27), (4.28) называются запаздывающими потенциалами. Запаздывающие потенциалы выражают асимметрию времени, заложенную в природе. В самом деле, при переходе к (4.16) мы выбрали из двух решений (4.15) решение fx, в то время как, казалось бы, ничто не препятствовала выбору решения /2. В таком случае потенциалы полей в точке наблюдения определялись бы плотностью заряда и тока в последующий момент времени. Это не соответствует реально наблюдаемым физическим явлениям. Видными учеными, в том числе Фейнманом и Уиле- ром, предпринимались попытки построить теорию, в которую решения /| и /2 входили бы равноправно. Предложенная ими теория получила название адсорбционной теории излучения. Однако она не внесла сколько- нибудь заметного вклада в понимание стрелы времени. 4.3. Потенциалы Лиенара-Вихерта. Определим потенциалы поля, создаваемого одним точечным зарядом, движущимся по заданной траектории г = г0 (/). Вернемся к формуле (4.24), в соответствии с которой ^r»'Hra*('~''~^W' 0^'*'- (4-30) Для точечного заряда, движущегося по заданной траектории, p(r',t') = eS{r'-r0(t')). (4.31) Проведя в (4.30) интегрирование по dV\ получим 9(r,t) = ej^sL-t'-^)s{r'-r0(t'))dV' dt' = f . Ir - , .(Oil (4.32)
4. Запаздьшающие потенциалы 63 f«> Здесь в качестве аргумента 8 -функции стоит некоторая функция от /', ^(//) = /-//-1Г"Го^^=/-//-1^(//). (4.33) с с Воспользуемся соотношением 3{ПП)=т^—А{'0- (4-34) Здесь t'0 — корень уравнения F(f) = 0, (4-35) можно показать, что этот корень является единственным. Производная функции (4.33) по переменной t' dF \dR — = -!——. (4.36) at c at Подставляя (4.34), (4.36) в (4.32), получаем «■'^фшр'-^-тгщ- <437) L cdt'J с dt' dt' 2dt' 2dt' \ dt') \ dt') v * " V ; v — скорость движения заряда. Окончательно, ^'^TW (4-39) с Аналогичные выкладки можно провести для векторного потенциала; учитывая, что i(r,t') = ev(t')S{r'-r0(t')), (4.40) приходим к результату /71/ А(г,/) = -у-—г. (4.41) v ' cR-(v,R) Потенциалы (4.39), (4.41) называются потенциалами Лиенара-Вихерта. При вычислении напряженностей электрического и магнитного полей по формулам (2.5), (2.2) мы должны учесть, что в результате интегрирова-
64 Часть! ния в (4.37) (после снятия 8-функции) все величины в (4.39), (4.41) стали формально зависеть от t'Q — корня уравнения (4.35), который, в свою очередь, зависит от /, а также от х, у, z, но лишь неявно. В результате вычислений получаются следующие выражения: Е = R- (v.R) 1-41 *) М*]4 v с ) г R, \U-1r) ,v Lv с ) jj н = [R.E] R ; (4-42) (4.43)
Глава III. Электромагнитные поля на больших расстояниях 5. Поля статических систем зарядов и токов 5.1. Разложение скалярного потенциала в ряд по малым параметрам. Рассмотрим поле, создаваемое статической системой зарядов на расстояниях, больших по сравнению с размерами системы. Пусть начало координат находится где-то внутри системы зарядов. Радиус-векторы отдельных зарядов обозначим та. Тогда скалярный потенциал, создаваемый всеми зарядами в точке с радиус-вектором г, равен *')=!■ r-rJ (5.1) Здесь, как обычно, Ra = г - та — радиус-вектор, проведенный из точки, где находится заряд, в точку наблюдения (рис. 3). Ra = г — ra Рис.3 Будем предполагать, что г » та. Рассматривая каждое слагаемое в потенциале ф(г) как функцию от r-rfl, разложим его в ряд по малым параметрам — в окрестности точки Rfl = г: г /(R.) = /(r-r.) = /(r) + ю Л (*ш-*,) + +- f Э>/ ^ 1 3!l ^о /Re=r (5.2) (**-x,){Rj.-Xj)(*t.-xk)- *.=
66 Часть! Здесь расписывая по компонентам, Имея в виду, что R„-r = -r<,> Ria~Xi=-Xia- №,)=Y: э/ _ К а*.~~*Г (Ю -Jb. г3' получаем с точностью до членов первого порядка: р(г)=Ее*-+ЕеЛ*и+"-=-Ее-+ЛЕеЛг*>г)+-" (5.3) (5.4) (5.5) (5.6) (5.7) (5.8) 5.2. Дипольный момент системы зарядов. Дипольным моментом системы зарядов называется сумма «1 = Е*А- (5.9) а Тогда *(г)=±2>.+М + ... (5.Ю) Г а ' Если сумма всех зарядов равна нулю, дипольный момент не зависит от выбора начала координат. Действительно, радиус-векторы rfl и га' в двух различных системах координат связаны между собой соотношением га' = га+а, (5.11) а — постоянный вектор. Поэтому d'=i>X =2>Л + *£е. = £«А =d С5-12) а а а а Пусть е*, г* и —е~ , г~ — положительные и отрицательные заряды системы и их радиус-векторы соответственно. При этом d=Z<r; -5>;r; =R^e; _R-^e;, (5.13)
5. ПОЛЯ СТАТИЧЕСКИХ СИСТЕМ ЗАРЯДОВ И ТОКОВ 67 где U+ а и- а к - v1 + ' ~ v - (5.14) — радиус векторы центров положительных и отрицательных зарядов (по аналогии с центром масс). Если сумма положительных зарядов равна по модулю сумме отрицательных зарядов, Е<=2>:=9. (5-15) а а Rm=r_r (5.16) — радиус вектор от центра отрицательных зарядов к центру положительных зарядов, то d = ?R(+_). (5.17) В частности, если система состоит из двух противоположных по знаку зарядов, то RM — радиус вектор, направленный от отрицательного заряда к положительному. 5.3. Тензор квадрупольного момента системы зарядов. Рассмотрим следующий член разложения. Э2/ _ Э 00 6Ч 3R,aRJa 1 Rl Rl ' Э2/ v*-/ dR^dR Э2/ S. 3x:x, j° J R.= = - +—-^ r> r5 \ZRZR I (**-*,){*>-*;) = 3 ' 5 \"ia"ja (5.18) (5.19) (5.20) ;Y,e° r У/ ч (K-*,){*m-*j) = 2 £^ a\ "> ja у a } 5 2 'J r5 Dy — тензор квадрупольного момента системы, Dil=Ye(3xiaxla-Silr?). ij ^^ a \ их ja ij a J (5.21) (5.22)
68 Часть! С точностью до членов второго порядка получаем р(г)=£+44+1д^+... г г 2 г Q = ^ea — суммарный заряд системы. (5.23) Из определения тензора квадрупольного момента следует, что сумма его диагональных компонент равна нулю: и ^^ а \ их их a J (5.24) Тензор является симметричным и поэтому имеет только пять независимых компонент. Если полный заряд системы и ее дипольный момент равны нулю, то тензор квадрупольного момента не зависит от выбора начала координат. Рассматривая последующие члены разложения, можно вычислить высшие мультипольные моменты. Вычислим напряженность электрического поля: E = -grao>; (5.25) дх, 2 \ r5 r5 r1 ) + ...= ID, (5.26) Напряженность электрического поля статической системы зарядов можно представить следующим образом: £. = £(1) + £<2)+£<3)+... я<'>=е4; Е(1)=е4 (5.27) (5.28) поле одиночного заряда; d г поле диполя; £f»4(3Vr^); E(2)=l(3(d,r)r-r2d) (5.29) ^=^-{5х1х1хк-г%хк-гг6лх]) (5.30) — поле квадруполя и т. д.
5. Поля статических систем зарядов и токов 69 5.4. Разложение векторного потенциала в ряд по малым параметрам. Аналогично можно рассмотреть разложение векторного потенциала в случае стационарного магнитного поля. Будем исходить из общего выражения (1.29) для векторного потенциала: A(r)=ifr^^'- <5-31> cJ |r-r| Используя выражение (1.27) для плотности тока системы зарядов, получим: (5.33) А(г) = 11тМЛ- (5-32) с г — г а \ а\ Используя разложение функции (5.5) -. г, получаем с точностью до lr-rJ членов первого порядка: А(г) = — 2>Л.+ЛХв. cr f сг ~ ьг а сг а Продолжим преобразование полученного выражения. В первом члене выделим полную производную по времени, второй разобьем на две одинаковые части, в одной из которых также выделим полную производную по времени. При этом необходимо учитывать, что радиус-вектор г, проведенный в точку наблюдения, зависит только от выбранной точки наблюдения, а не от времени, и поэтому должен рассматриваться как постоянный вектор. С другой стороны, магнитное поле создается движущимися зарядами, и, следовательно, радиус-вектор каждого заряда га меняется с течением времени. V } crdtVt ) 2сг3^ а Л а } ( \ 1 (5'34) Поскольку мы интересуемся стационарным магнитным полем на больших расстояниях от системы зарядов, мы предполагаем, что эти заряды совершают движение в ограниченной области пространства. Такое движение носит стационарный характер, и для получения окончательного выражения для векторного потенциала нужно усреднить по времени выражение (5.34).
70 Часть! Среднее значение производной по времени от всякой величины, изменяющейся в конечном интервале значений, равно нулю. Действительно, если/— такая функция, тогда среднее значение производной за некоторый интервал времени Т \л/ т[л т Поскольку / ограничена, при увеличении Т среднее значение (5.35) стремится к нулю: limp- =0. (5.36) r->~\dt/ В выражение (5.34) входят производные по времени от величин, изменяющихся в конечном интервале значений, которые при усреднении дают нулю. Опуская знак усреднения в дальнейших формулах, получим окончательно: A(r)=iX^Mr0,r)-re(ve)r))+...= 1° j (5.37) Мы видим, что в случае стационарного магнитного поля в разложении от- . 1 сутствует член, пропорциональный —, аналогичный кулоновскому потен- г циалу. 5.5. Магнитный момент системы зарядов. Введем вектор магнитного момента системы m = ^Le*V*>*X (5.38) первый член разложения векторного потенциала представим в виде А(2)=-[го,г]. (5.39) Используя методы векторного анализа, вычислим напряженность магнитного поля: Hw=ratA*' '=[V,A(2)], (5.40) (2) V7 j(2) V7 f 1 _ 1_„ л MV7 (X, H\ -<faVj4 =eijkVj\ —еШт1Хт \ = ^jkeklmm^J \ r'j (5.41)
6. Излучение электромагнитных волн 71 Проведем дальнейшие преобразования, используя формулу ^=(%-«ц(^-^)= = т, 8и 3xJxA -. (Ч Зх.х^Зх.х^. т. V .3 ,5 "«У (5.43) г3 г5 г5 г3 H(2)=^-(3(m,r)r-r2m). (5.44) Выражение для напряженности магнитного поля через магнитный момент в точности совпадает с выражением (5.29) для напряженности электрического поля через дипольный момент. Если у всех зарядов системы одинаково отношение заряда к массе, е е -*- = -, (5.45) /и т то магнитный момент где М = 2^[га,ра] — механический момент импульса системы зарядов. а В этом случае отношение магнитного момента к механическому постоянно и равно 1ш1 (5.47) |М| 2тс 6. Излучение электромагнитных волн 6.1. Разложение запаздывающих потенциалов в ряды по малым параметрам. Вновь рассмотрим поле, создаваемое системой зарядов на больших расстояниях, однако теперь откажемся от требования статичности системы. Начало координат по-прежнему находится где-то внутри системы зарядов, г — радиус-вектор точки наблюдения, п — единичный вектор в направлении г. Обозначим через г' радиус-вектор элементарного объема dV' с зарядом de = pdV. Радиус-вектор, проведенный от элементарного объема dV' в точку наблюдения, R = г - г' (рис. 4).
72 Часть! R-r Рис.4 (6.1) На больших расстояниях от системы г » /, поэтому НгЧ = У(г-гТ^2-2(г,г>(г')2 = Подставим это приближенное выражение вместо R в формулы (4.27), (4.28). В знаменателе подынтегральных выражений пренебрегаем величиной (п,г') по сравнению с г. При интегрировании по dV' r является постоянным и может быть вынесен за знак интеграла. В то же время мы должны учесть возможные изменения плотности заряда и тока за время -.Поэтому, вообще говоря, этой величиной нельзя пренебрегать в аргументах функций р г', / L j г', / . Таким образом, получаем x{r,t)=UL',t-r-^)dv. crJ \ с с J (6.2) (6.3) Создаваемое произвольно движущимся электрическим зарядом электромагнитное поле в общем случае является суммой сосредоточенного вблизи заряда и движущегося вместе с ним собственного поля и уходящего от заряда на бесконечно далекие расстояния поля излучения. Поля в малых участках пространства на больших расстояниях от системы можно рассматривать как плоскую волну при условии, что расстояние г велико не только по сравнению с размерами системы (г»/), но и по сравнению с длиной волны излучения. Существование излучения— следствие конечности скорости распространения электромагнитного поля. Так, например, после исчезновения электрона и позитрона в процессе аннигиляции их поле излучения продолжает существовать, что означает, что электромагнитное поле, как само-
6. Излучение электромагнитных волн 73 стоятельная сущность обладает энергией и импульсом, о чем уже говорилось выше. Зная векторный потенциал А, можно найти напряженности электрического и магнитного поля Е и Н в волне. Действительно, вычислим напряженность магнитного поля. Обозначим , г пг / =/—+— с с (6.4) тогда H = rotA = [V,A] = e1.^Vy4 = *'е*^{^\^г'> 0^) = (l Э flV •/ ' S\AV>Mk ЪЛ (6.5) Беря производную от —, получаем величину следующего порядка малости, г которая в данном приближении может не учитываться: dxjlr) г3' (6.6) Н = — е,е,,^ с п, ЭА dt (6.7) (6.8) Далее, dxj cdxj с г' С Последний результат в рамках данного приближения можно представить в виде Н = [п,Е]. (6.9) В самом деле, связь напряженности Е с потенциалами поля определяется формулой (2.5), [n,E] = -[n,gradp] — п, ЭА dt grad^e. (6.10) (6.П)
74 Часть! В данном приближении первый член в правой части (6.10) равен нулю, что доказывает (6.9). Как и в случае плоских волн, на векторный потенциал А может быть наложено дополнительное условие— калибровка Кулона (2.105) (см. также (3.23)), сГ3\ с с ) с г dt с\ dt) (6.12) Отсюда следует, что в данном случае калибровка Кулона равносильна условию -f''=°- (6.13) которое позволяет исключить направленную вдоль вектора п продольную ЭА составляющую вектора ——. ot Мы можем разложить поле Е на продольную Е|( и поперечную Е± составляющие в соответствии с (6.11), (6.13): 2_ЭА с dt E„=-grad?>, E± = ——. (6.14) Гп ! 1ГГ ЭА [Н,п] = — п,— В электромагнитную волну вносит вклад поперечная часть поля. Используя (6.8), получим: 1 f ЭА^ 1ЭА р ,,1СЧ vl*-*barE- (615) В дальнейшем мы будем интересоваться только поперечной составляющей поля, опуская знак «_1_», так как именно она описывает электромагнитную волну. Таким образом, напряженности полей в волне могут быть вычислены по формулам Г ЭА _|_ Э/. ,п _1 с п, ЭА] dt J_ 1 = — с ГЭА ] —,п [dt J E = [H,n] = - ЭА dt ,n ,n (6.16) Вектор плотности потока энергии волны (вектор Пойнтинга): Р = ^-[Е,Н] = -^-[Н,[Н)п]] = -^-(н(Н,п)-пЯ2) = ^-Я2п. (6.17) 4л 4л1 4л 4л
6. Излучение электромагнитных волн 75 6.2. Интенсивность излучения. Интенсивность излучения dl в элемент телесного угла dSl — это количество энергии, протекающей в единицу времени через элемент сферической поверхности dS с центром в начале координат и радиусом г, dS = r2dQ, = r2smOdOd(p, (6.18) dI =—H2r2d£l. (6.19) 4л Так как Н обратно пропорционально г, количество энергии, излучаемое системой в единицу времени в элемент телесного угла dQ., одинаково для всех расстояний г, что ожидаемо, поскольку электромагнитные волны распространяются в пространстве с постоянной скоростью с, не накапливаясь и не исчезая. 6.3. Дипольное излучение. Перейдем к рассмотрению различных видов излучения. Начнем со случая, когда мы можем пренебречь величиной пг ^ч ^ч пг в (6.2), (6.3). Это оправдано, если за время распределение зарядов с с мало изменяется. Если система имеет размеры порядка а, ^-~^. (6.20) С С Далее, Т— время, в течении которого распределение зарядов в системе существенно изменяется. Тогда излучение системы должно обладать периодом порядка Т. Чтобы распределение зарядов не успело значительно измениться за время —, необходимо, чтобы с — «Г или-«Г. (6.21) с с Длина волны излучения Л = сТ, так что искомое условие можно записать в виде а «А. (6.22) Размеры системы должны быть малы по сравнению с длиной волны излучения. С другой стороны, если v — скорость зарядов по порядку величины, то Г~- => Д~ —. (6.23) V V Из (6.22) следует v«cc. (6.24) Скорости зарядов должны быть малы по сравнению со скоростью света.
76 Часть! В этом случае формула (6.3) принимает вид A(r,0 = ^Jj(r',/-^F'. (6.25) Подставим в эту формулу j(r', t') = p(r', t') v(r', 0 = Z^ve(r', t')S{r'-ra). (6.26) a Тогда A(r'0 = -Z^(',<,.O (6-27) c* a (учитываем, что /' зависит от / и от г). Ze^=4ie-.r-.=a (6-28) а (*1 а — производная по времени дипольного момента системы. А = —d. (6.29) сг Используя формулы (6.16), находим: H = 4-[d,nl; (6.30) с rL J E=^[[d44 <6-31> Такое излучение называется дипольным вследствие того факта, что оно определяется второй производной дипольного момента системы. Это излучение зарядов, которые движутся с ускорением. Как известно, равномерно движущиеся заряды не излучают, как и покоящиеся заряды. В самом деле, в соответствии со специальной теорией относительности равномерно движущийся заряд можно рассмотреть в системе отсчета, в которой он покоится. Интенсивность дипольного излучения можно получить, подставив (6.30) в (6.19): dl = —]-гГй,п]2(Ю, = —^-jd2sm20dQ, (6.32) 4яс L J 4яс где в — угол между векторами d и п. Выбирая ось z в направлении вектора п и интегрируя по всем направлениям, получаем полное излучение: / = —Ц-J #Jd2 sin3 0 </£ = --^TJ(l-cos26»)</(cos6») = (6-33) = ~{со&в--cos" в\ =A<i2- 2cH 3 I Ъсг
6. Излучение электромагнитных волн 77 Пусть имеется только один движущийся заряд, тогда d = er и d = еа , где а — ускорение заряда. Полное излучение движущегося заряда определяется формулой Для замкнутой системы, состоящей из частиц, у которых отношения зарядов к массам одинаковы, интенсивность дипольного излучения равна нулю. В самом деле, дипольный момент системы Л = ^еага =^—тЛ =-2«А = -*о£*.. (6-35) R0 — радиус-вектор центра масс системы. Известно, что центр масс системы всегда движется прямолинейно и равномерно (это следует из его определения: полный импульс системы есть Ро = Х*А=*о2>.> (6.36) а а поскольку полный импульс замкнутой системы сохраняется, вторая производная по времени от радиус-вектора центра масс, т. е. ускорение системы как целого, равна нулю). Поэтому и вторая производная дипольного момента также равна нулю, а вместе с ней и интенсивность излучения. 6.4. Квадрупольное и магнитодипольное излучение. Рассмотрим следующий член разложения векторного потенциала по степеням малой величины (или, что то же самое, по степеням —). Этот член играет с Я существенную роль, если дипольный момент системы равен нулю, т. е. ди- польное излучение отсутствует. Выпишем два первых члена разложения подынтегрального выражения в (6.3): Следовательно, MM) = i;Jj(r-,,-i)^+-i;|j(.,r-)j(r',,-^K-. (6.38, Подставляем в полученное выражение (6.26): A(r,0=-Zeave(re,O+^Z^(».ra)va(r<„O. (6.39) сг а с г at a
78 Часть! Далее, 1 1 ^ 1 ^а(^а)=-^а{^а)+- — (Га{п,Га))--Га(п,Уа) = 2dt = 2Yt^n9Ta^~in9^ (6.40) Подставляем в (6.39): AC')-if+5^F?«(Mi)^&[J^..W.<«i) Используя выражение (5.38) для магнитного момента системы зарядов, запишем A(r,/) = ^d + -V|^X^a(n,ra) + -[m,n]. (6.42) сг 2c2r dt2' сг Заметим, что если мы прибавим к А произвольный вектор, пропорциональный п, то напряженности Е и Н не изменятся в силу формул (6.16). Воспользуемся этим свойством и перепишем (6.42) в виде A(r,/) = -!-d + -V^Xee(3r.(n.'-e)-nre2) + -!-[m,n]. (6.43) сг 6с г at а сг Рассмотрим свертку тензора квадрупольного момента системы D{j (5.22) и единичного вектора п. Свертка тензора второго ранга и вектора дает вектор с компонентами: А = Dijnj =Y,ea (3 V,^ - Stfltf ) = Yjea {**bPj.*J ~ ПгГа ) • (6-44) a a Запишем последний результат в векторном виде: ^Е'фгДп.О-пг,2). (6-45) а Для векторного потенциала А находим окончательно А(г,/)=—d + -^-D +—[m,n]. (6.46) сг 6с г сг Теперь мы можем вычислить Е и Н: Учтем, что [[m,n],n] = [n,[n,m]] = n(n,m)-m, (6.48) [[[m,n],n],n] = -[m,n] = [n,m]. (6.49) .. 1 н=- c ГЭА 1 —,n |_Э/ J
6. Излучение электромагнитных волн 79 Таким образом, Е = [H,n] = -U [[d,n],n] + ^[[6,n],n] + [n,mfj. (6.50) Подставляя (6.47) в (6.19), мы получим интенсивность излучения в элемент телесного угла d£l: Чтобы получить полное излучение, можно усреднить выражении (6.51) по всем направлениям п и затем умножить результат на 4л-. Соответствующие вычисления приводят к формуле / = -^-d2 +—^-тДД +Дгй2. (6.52) Ъсъ 180с5 ч ,j Ъсъ Первый член в (6.52) представляет собой интенсивность дипольного излучения (см. (6.33)). Второй член дает интенсивность квадрупольного излучения, третий — магнитодипольного излучения. Структура последнего члена полностью повторяет структуру первого, однако не будем забывать, что он получается в следующем порядке разложения. В самом деле, магнитный момент по определению (5.38) содержит множитель —. с Для замкнутой системы, состоящей из частиц, у которых отношения зарядов к массам одинаковы, интенсивность магнитодипольного излучения, так же, как и дипольного излучения, равна нулю. Согласно (5.46), магнитный момент такой системы пропорционален механическому моменту импульса, и, вследствие закона сохранения момента импульса, вторая производная по времени магнитного момента равна нулю. 6.5. Краткая характеристика других видов излучения. Излучение электромагнитных волн возникает во многих физических процессах, сопровождаемых ускорением заряженных частиц. В зависимости от природы процессов, вызывающих ускорение частиц, можно говорить о различных видах излучения. В частности, при столкновениях частиц, торможении частиц в веществе и их рассеянии кулоновским полем возникает тормозное излучение. Причиной излучения являются резкие изменения скорости частиц при столкновениях с другими частицами или рассеивании на ядрах атомов. Магнитотормозным называется излучение заряда, движущегося по окружности в постоянном однородном магнитном поле. Сила, действующая на заряд со стороны магнитного поля не изменяет абсолютного значения скорости частицы, но изменяет ее направление, следовательно, заряд
80 Часть! движется с ускорением и излучает. Магнитотормозное излучение, испускаемое ультрарелятивистскими частицами, движущимися со скоростями, близкими к скорости света, называется синхротронным. Название, естественно, связано с тем, что такое излучение наблюдается в циклических ускорителях (синхротронах). Такое излучение существенно отличается по своему спектральному составу от излучения нерелятивистских частиц. При движении ультрарелятивистской заряженной частицы с малыми поперечными периодическими отклонениями, возникающими, например, при ее пролете через конденсатор с переменным во времени электрическим полем, перпендикулярным к направлению средней скорости частицы, возникает так называемое ондуляторное излучение. Часто излучение возникает при движении заряда в среде. Так, при пересечении равномерно движущимся зарядом области пространства с неоднородными диэлектрическими свойствами, например, при пересечении им границы раздела двух сред или при движении в среде, содержащей неоднородности, возникает переходное излучение. Это излучение теоретически предсказано в 1945 году В. Л. Гинзбургом и И. М. Франком и экспериментально обнаружено в 1958 году. Причиной излучения здесь является изменение электромагнитного поля частицы вследствие изменения свойств среды. Переходному излучению родственно излучение Вавилова-Черенкова, которое возникает при равномерном движении заряда в среде со скоростью, превышающей фазовую скорость света в этой среде. Излучение появляется вследствие того, что частица «обгоняет» порождаемое ею поле. Обнаружено в 1934 году Черенковым в серии экспериментов, проведенным по инициативе И. О. Вавилова. Механизм излучения был объяснен в работе И. Е. Тамма и И. М. Франка 1937 года, основанной на уравнениях классической электродинамики. Квантовое рассмотрение этого явления, выполненное В. Л. Гинзбургом в 1940 году, приводит к тем же результатам.
Глава IV. Электромагнитное поле в сплошных средах 7. Уравнения электродинамики сплошных сред 7.1. Особенности описания электромагнитного поля в веществе. Необходимость усреднения уравнений Максвелла. Уравнения Максвелла (1.1) справедливы и на микроуровне, т. е. при наличии вещества. Однако любое вещество состоит из множества заряженных частиц — электронов и атомных ядер. Результирующее электромагнитное поле внутри вещества создается как сторонними зарядами и токами, не входящими в состав вещества, так и заряженными частицами самого вещества. Поле сторонних зарядов вызывает перераспределение зарядов и токов в веществе. Из-за огромного числа частиц в системе невозможно учесть реальную плотность зарядов и токов для расчета напряженностей электромагнитного поля. Поэтому изучение электромагнитных явлений в различных средах требует привлечения приближенных и феноменологических методов. Естественно провести усреднение напряженностей полей по времени и по физически бесконечно малым объемам. Как и в механике сплошных сред, под физически бесконечно малым объемом понимается объем, содержащий большое число частиц (в данном случае — элементарных зарядов). Необходимость усреднения вызвана тем, что микроскопическое поле в среде испытывает очень большие и нерегулярные флуктуации как во времени, так и в пространстве. Чтобы провести усреднение, начнем с того, что запишем точные уравнения Максвелла для микроскопических значений напряженностей полей, которые мы обозначим как е, h: , ч 1Эп(г,/) rote(r,,) = ___L_i; divh(r, /) = 0; roth(r,,)=i%iUi%^r, ,)+Ur,,)); с at с dive(r, /) = 4лг(д„, (г, /) + РаЛ (г, /)). Здесь /^(г, /), ^(г, /) — плотность заряда и тока внешних (сторонних) зарядов, рм(г, t), }м(г, t) — плотность заряда и тока частиц вещества. Внешние источники р^ (г, /), j^ (r, /) мы будем считать заданными.
82 Часть! Исходя из определения среднего значения физической величины/, (f) = Ud^]dt'f(r + r',t + t'), (7.2) у J т У v L о приходим к заключению, что производная от среднего значения равна среднему значению производной физической величины, например, э(/)_/э/ » W <гз) Усредненное значение напряженности микроскопического электрического поля принято называть напряэюенностью макроскопического электрического поля, а усредненное значение напряженности микроскопического магнитного поля — индукцией макроскопического магнитного поля: (е)=Е, (h)=B. (7.4) В результате усреднения уравнения Максвелла примут вид , ч 1ЭВ(г,/) rotE(r,f) = Ш; v ' с dt divB(r,/) = 0; divE(r, t) = 4x((pint{r, /)) + P«r(r, '))• Для дальнейшего преобразования уравнений Максвелла введем векторы электрической и магнитной поляризации вещества. 7.2. Вектор электрической поляризации. Вектор электрической поляризации определяется как электрический дипольныи момент, приходящийся на единицу объема: Г = ЬИеЛ- (76> * а В (7.6) суммирование ведется по всем частицам, находящимся в объеме V. Покажем, что плотность заряда частиц вещества связано с вектором электрической поляризации соотношением A,,=-divP. (7.7) Во-первых, заметим, что полный электрический дипольныи момент некоторого тела объема V можно представить в виде 'Py=jpiAr)rdV. (7.8)
7. Уравнения электродинамики сплошных сред 83 Действительно, подставляя вместо ^^(г) выражение (1.6), А» = 1".*(г-г.), (7-9) а получаем n=Z*A- (7-10) а С другой стороны, Vv=\v{r)dV, (7.11) V поэтому fpfcf(r)rrfF = JP(r)rfF. (7.12) К V Умножим обе части соотношения (7.12) на некоторый постоянный вектор а: f(a,r)p„,^ = J(a,P)^. (7.13) V V Поскольку (P,V)(a,r) = ^Vja,*y =aJP?ixJ=ajPiSiJ=aiPi =(*,?), (7.14) (a,P)=(P,V)(a,r)=V(P(a,r))-(a,r)(V,P), (7.15) подставляя (7.15) в (7.13) и преобразовывая первый интеграл в правой части в интеграл по поверхности, охватывающей объем V, будем иметь |(а,г)д„,^ = Jdiv(P(a,r))<^-J(a,r)divP dV, (7.16) V V V J(a,r)A„,^ = <j)P(a,r)JS-J(a,r)divP<fK. (7.17) V S V В силу произвольности поверхности S ее можно выбрать за пределами рассматриваемого тела, в области, где Р = 0. Таким образом, интеграл по поверхности в (7.17) равен нулю, J(a,r)pi,^F = -J(a,r)divP^. (7.18) V V В виду произвольности вектора а мы можем записать \х pintdV = -\r divP^F. (7.19) V V
84 Часть! Полученное интегральное соотношение позволяет отождествить плотность внутренних зарядов со взятой со знаком «-» дивергенцией вектора Р. Иными словами, мы приходим к формуле (7.7). Полученное соотношение относится к диэлектрикам, в которых внутренние заряды могут смещаться только на микроскопическое расстояние. В этом случае рш{т) можно назвать плотностью связанных зарядов. Внутри проводников заряды перемещаются свободно. Наложение внешнего поля приводит к возникновению электрического тока внутри проводника. В случае электростатики заряды распределяются на поверхности проводника таким образом, чтобы скомпенсировать внешнее электрическое поле. Тогда внутри проводника pint(r) = 0, Р = 0. 7.3. Вектор магнитной поляризации. Соответственно, вектор магнитной поляризации, называемый также вектором намагниченности, определяется как магегатный момент, приходящийся на единицу объема: ,=7^?e-[r"v-1- (720) В (7.20) суммирование ведется по всем частицам, находящимся в объеме V. Теперь покажем, что средняя плотность тока внутренних зарядов, также называемого током намагничения, связана с вектором магнитной поляризации соотношением \м=с rotJ. (7.21) Полный магнитный момент тела объема V: M=f J[r,Ur)]rfF, (7-22) U0=Ze.v.*('-'.)- (7-23) Подставляя (7.23) в (7.22), получаем: J^V=^LeaVa^a], (7.24) что согласуется с определением (7.20). С другой стороны. My=\i{r)dV, (7.25) V ^J[r,L(r)]«/r = Jj(r)rfF. (7.26)
7. Уравнения электродинамики сплошных сред 85 Умножаем на произвольный постоянный вектор а: fjHr,j,J)</K = J(a,J)</F. (7.27) 2с-г Воспользуемся тождеством rot[a,r] = 2a (7.28) (а — постоянный вектор). Tot[a,r] = [V,[a,r]]=eieiJkVJeUmalxm=eleIJ.keklmalVJxm = = e,(*Ai -«$Л)«Л. =е,(3«, -а,) = 2а. (a)J) = i(rot[a,r],j) = I(j,[V,[a,r]]) = l7I.^VAma,xn = (7.29) = 2 (V; {JieijkeumaiXm) ~ % (V/,) еИта,хп) = = 2 (~V^ {eJ*Jf*№m ) + aieMXme^jJi) = = I(_(V,[j,[a,r]]) + (a,[r,[V,J]])). (7-30) 2V Подставляем в (7.27): yU*>[r>L])dV =|j((a'[r'rot J])-div[j,[a,r]])^. (7.31) 2cjv - - — 2v Интеграл по объему от дивергенции преобразуем в интеграл по поверхности, на которой J = 0. В итоге получаем J(a,[r,jl,/])^=cJ(a,[r,rotJ])^, (7.32) V V что в силу произвольности вектора а позволяет отождествить плотность тока внутренних зарядов с ротором магнитной поляризации, умноженным на скорость света с. Соотношение (7.21) справедливо для случая стационарного магнитного поля (напомним, что выражение (5.38) для магнитного момента мы получили также для этого случая). Для того, чтобы обобщить это выражение для нестационарных полей, используем закон сохранения заряда, который в электродинамике сплошных сред должен выполняться в отдельности для внешних и внутренних зарядов. Для внутренних зарядов имеем ^^ + divUr,/) = 0. (7.33)
86 Часть! Подставляя в это уравнение соотношение (7.7), получаем div[j,„,-^] = 0. (7.34) Вспоминая, что для любого векторного поля дивергенция ротора равна ну- ЭР лю (см. (1.23)), мы можем отождествить j^——с ротором некоторого at вектора. Поскольку в стационарном случае выполняется соотношение (7.21), мы заключаем, что этим вектором является с J. Итак, г)Р *„-—= crotJ. (7.35) 7.4. Система уравнений Максвелла в сплошной среде. С помощью соотношений (7.7), (7.35) мы можем переписать систему уравнений Максвелла (7.5) следующим образом: *«■ 1ЭВ rotE = ——; с dt divB = 0; 1 а А„ (736) rot(B-4^J) = if(E + 4^P) + ^Jel; cot с div(E + 4^P) = 4^9ex/. В эти уравнения входит плотность заряда и тока только внешних (сторонних) зарядов. Помня об этом, мы будем в дальнейшем опускать соответствующие индексы у плотности заряда и тока. Введем вектор электрической индукции Б = Е + 4л-Р (7.37) и вектор напряженности магнитного поля H = B-4^J. (7.38) Тогда уравнения Максвелла принимают вид 1ЭВ rotE = ——; с dt *»-\ (7.39) «■-!£ + <£» с at с Таким образом, разделение зарядов на внешние и внутренние (свободные и связанные) позволило по-новому представить уравнения Максвелла.
7. Уравнения электродинамики сплошных сред 87 При отсутствии среды уравнения Максвелла (7.39) содержат только напряженности электрического и магнитного полей Е и Н и переходят в уравнения Максвелла в вакууме (1.1). Векторы D и В (7.37), (7.38) несут информацию о свойствах среды. Для решения уравнений Максвелла необходимо установить связь между Е и D, Н и В. 7.5. Уравнения Максвелла в линейных средах. Классификация сред. В линейных средах при отсутствии внешних полей равны нулю векторы электрической и магнитной поляризации Р и J. Если внепшие поля малы по сравнению с внутриатомными, то электрическая и магнитная поляризация являются линейными функциями соответствующих полей. Для изотропной среды можно записать Р = *Е, (7.40) J = *H. (7.41) к — диэлектрическая восприимчивость, X — магнитная восприимчивость. При этом В = (1 + 4ях-)Е = £Е, (7.42) е = 1 + Люс (7.43) — диэлектрическая проницаемость среды. B = H + 4;rJ = (l + 4/ar)H = //H, (7.44) // = l + 4^f (7.45) — магнитная проницаемость среды. J = aB = ajuH, (7.46) Х = Щ. (7.47) Уравнения Максвелла для линейных сред: ♦it 1ЭВ rotE = ——; с dt divB = 0; rot (7.48) (В) 1 Э, _v 4л:. - =-—(*Е)+—j; {juj сЭг с div(£E) = 4np. В анизотропных средах диэлектрическая и магнитная восприимчивость и проницаемость среды представляют собой тензоры второго ранга, а соотношения (7.43), (7.45) обобщаются следующим образом: е9=Яд+4яц, (7.49) ^=4 + 4^' (7-50>
88 Часть! Уравнения связи между D и Е, В и Н (7.42), (7.44) принимают вид 0, = евЕ]г (7.51) В,=/1уНг (7.52) В сильных внешних полях уравнения связи приобретают нелинейный характер. Неоднородность среды влияет на неоднородность электромагнитного поля и отражается на решениях уравнений Максвелла. Среды можно подразделить на пассивные (внутри среды нет свободных зарядов, при отсутствии внешних полей Р = 0 и J = 0), и активные. К пассивным средам относятся диэлектрики, парамагнетики (#>()), диа- магнетики (#<0). Активные среды подразделяются на среды со свободными зарядами (полупроводники, проводники, сверхпроводники) и среды со спонтанной поляризацией (сегнетоэлектрики, пьезоэлектрики, ферромагнетики, антиферромагнетики). 7.6. Закон сохранения энергии в сплошной среде. При рассмотрении уравнении Максвелла в вакууме мы получали уравнение баланса энергии (1.77), которое выражает закон сохранения энергии. Такое же уравнение баланса следует из уравнений Максвелла для микроскопических напря- женностей полей (7.1). Напомним, как оно получается. Третье уравнение Максвелла умножается скалярно на е, первое уравнение — на h, после чего первое уравнение вычитается из третьего. После простых преобразований с использованием формул векторного анализа мы получим уравнение баланса энергии |^+divP = -(j,e), (7.53) at в котором плотность энергии w и вектор Пойнтинга Р определяются через микроскопические напряженности полей аналогично (1.75), (1.76), i = iint + Jex, (7-54) — плотность тока на микроуровне, учитывающая токи как внутренних, так и внешних зарядов. Попробуем проделать аналогичные операции для уравнений (7.39). Умножаем третье из уравнений (7.39) на Е, первое— на Н, после чего первое вычитаем из третьего. Получаем 1 ff ъъ\ Г„эв^ с (E,rotH)-(H,rotE)=- Е,^- + Н,^- +— (j,E), (7.55) Ъг) \ Ъг 4ж * с В общем случае в этом уравнении невозможно выделить полную производную по времени, поскольку отсутствует симметрия между D и Е, В и Н.
7. Уравнения электродинамики сплошных сред 89 Обратимся к случаю линейных изотропных сред, когда D и Е, В и Н связаны соотношениями (7.42), (7.44). Тогда M^H+(HIH)4iH=-(i'E)' (7-57) ±|H4^) + div^[E)H])-^f^+^^)-(i,E), (7,8) ^ + divP = _J_f^+^tf2V(j,E). (7.59) dt Sx{dt dt ) Ki ' Здесь плотность энергии поля есть w = -±-(eE2+MH2)=±({E,D) + (H,B)). (7.60) Определение вектора Пойнтинга совпадает с определением (1.76), которое было дано в случае электромагнитных полей в вакууме. Произведение (j,E) представляет собой работу электромагнитного поля над сторонними зарядами в единице объема в единицу времени. Кроме того, появляется новый член, характерный для электродинамики сплошных сред, содержащий производные по времени от диэлектрической и магнитной проницаемостей среды: STT^dt dt J Появление нового вклада в уравнение баланса неудивительно, так как помимо работы над сторонними зарядами электромагнитное поле совершает работу и над зарядами внутри вещества, вызывая их перераспределение в проводнике или диэлектрике. Совершение этой работы может привести к выделению тепла, связанному с потерями энергии при поляризации и намагничивании. Для того, чтобы получить закон сохранения энергии в окончательном виде, необходимо учитывать термодинамические свойства вещества, в частности, зависимость е и fi от термодинамических параметров (давления, температуры и т. д.). Закон сохранения энергии (7.59) можно представить в интегральной форме: |jWr + Jdl»P„-J-0£. + fH.^-f(J,E)^.(762, jwdV + j>VdS + l{i,E)dV +—\{—E2+^-H2]dV = 0. (7.63) V S V V >■ ' d_ dt
90 Часть! 7.7. Закон сохранения импульса в сплошной среде. Обратимся теперь к закону сохранения импульса электромагнитного поля. Естественно, что закон сохранения импульса должен выполняться на микроуровне. Умножим третье из уравнений для микроскопических напряженностей полей (7.1) векторно на h, первое уравнение— векторно на е, второе уравнение умножим скалярно на h, четвертое — скалярно на е. Сложим первое и третье уравнения и вычтем из них второе и четвертое и после преобразований, повторяющих те, которые были проведены в конце раздела 1, получим закон сохранения импульса: ^fj(«i+n,)rfFJ + JV/v/K = 0; (7.64) Здесь я — плотность импульса частиц, П — плотность импульса электромагнитного поля, которая выражается через микроскопические напряженности полей аналогично (1.92), n = J-[e,h]=4-P, тс с (7.65) сг — тензор плотности потока импульса, следующая формула дает его выражение через напряженности микрополей: а=— \-(e1 + h1)S.-e.e.-hh. Ак\2 (7.66) Закон сохранения импульса (7.64) может быть представлен в дифференциальной форме, ^(*,+n,) + V#=0, (7.67) либо в интегральной форме, Л J(*,+II,)rfK +фсг.^.=0. (7.68) W ) s Перейдем к усредненным уравнениям (7.39). Умножим третье уравнение векторно на В, первое уравнение — векторно на D, второе уравнение умножим скалярно на Н, четвертое— скалярно на Е. Сложим первое и третье уравнения и вычтем из них второе и четвертое: [B,rotH] + [D,rotE]-HdivB-EdivD = dt dt Дуг +—[В,Ц-4ярЕ; С (7.69)
7. Уравнения электродинамики сплошных сред 91 1 4яс D, ЭВ dt 3D dt ,В + -[j,B] + /?E + +—([B,rotH]-HdivB + [D,rotE]-EdivD) = 0. (7.70) На движущуюся в среде частицу с зарядом е действует сила Лоренца F = eE + -[v,B]. (7.71) Учитывая это вьфажение и интегрируя по объему члены, содержащие плотность тока и заряда, приходим к выводу, что они определяют изменение полного импульса системы частиц в единицу времени: 0j,b]+pe)^ = -J 5>.v.*(r-r.),B + 2л*(г-г.) Е J ) dV = (7.72) = lJ-J[v.,B]*(r-rJ^ + jE*(r-r.)rfrl = а \Су у ) В первых двух членах в (7.70) выделяется полная производная: Ъг\Апс j) Вновь обратимся к случаю линейных изотропных сред и используем соотношения (7.42), (7.44). Тогда KsH-iteH-Kf')-* (7л4) 1 ( 4жс\ Г«эв1 D>^~ L dt] + Г 3D „1 ^~,в La» J (7.73) Але Але (7.75) выполняет роль плотности импульса электромагнитного поля в среде. Осталось преобразовать оставшиеся члены. [D.rotE] - EdivD = e, {e^e^V ,Em - £,V,Z).) = = е, {{SaSja - дш8,)орря - Е?р,) = = el{DWJ-DJVJEl-E,VJDJ)=el(eEJVlEJ-VJ(ElDJ)) = (7.76)
92 Часть I Аналогично, [B,rotH]-HdivB = е,fV,[±»Н% -Hfi^-jtf'V^j. [D,rotE]-EdivD + [B,rotH]-HdivB = = e,(v,(l(^2 + ЦН2)$ -EiDj -Hfij j-I(^V,£ +"%") Определим тензор напряжений: Теперь нужно собрать полученные выражения. (7.77) (7.78) (7.79) d_ dt 8 л: Jfa+nJrfH + JVfrdV-±-1(Е2У{£ + Н2У^)с1Г = 0. (7.80) \v ) v w В дифференциальной форме: Э ^(ж|.+П^ + УЛ.-^2У|^ + Я2У1.//) = 0. (7.81) В интегральной форме: j[\{ж, +ni)dv) + j>(7ijdSJ -±l(E2Vie+H2ViM)dV = 0. (7.82) Как и в законе сохранения энергии (7.63), здесь появляются дополнительные члены, феноменологически учитывающие силы, действующие на вещество в присутствии электромагнитного поля. 7.8. Принцип взаимности Лоренца. Получим соотношения, являющиеся следствием уравнений Максвелла и известные под названием принцип взаимности или теорема взаимности. Рассмотрим два расположенных в среде источника электромагнитного поля, генерирующие волны одинаковой частоты со. E=E0exp[-/(u*-kr)]. (7.83) Поля, генерируемые источниками 1 и 2, должны удовлетворять уравнениям rotE^— Bp с (7.84)
7. Уравнения электродинамики сплошных сред 93 АТТ ко- 4л". гоШ^ Dt+—jp с с rotE2=—В2; (7.84) с rotH2 = D2+—j2. с с Первое из этих уравнений умножим скалярно на Н2, второе — на Е2, третье — на Н{, четвертое — на Е{. Складывая первые два и вычитая из них третье и четвертое, получим: (H2,rotE1) + (E2,rotH1)-(H1,rotE2)-(E1,rotH2) = = ^((H2,Bj-(E2,DO-(H1,B2) + (E1,D2)) + ^((E2,jO-(E1,j2)). ^ Преобразуем: (H2,rotE1)-(E1,rotH2) = div[E1,H2]. (7.86) (E2,rotH1)-(H1,rotE2) = div[H1,E2]. (7.87) Далее необходимо использовать уравнения связи между Е и D, Н и В. В принципе, среда может быть достаточно неоднородна и анизотропна. Потребуем лишь, чтобы выполнялись линейные соотношения (7.51), (7.52). Тогда (e,,d2)=%%-=V#£(2i/=WW eZ)<А/=(ъМ- <7-88> Здесь мы воспользовались тем, что тензор диэлектрической проницаемости среды etj является симметричным. Для доказательства этого факта используются термодинамические соотношения для диэлектриков. Аналогично, (НРВ2) = (ВРН2). (7.89) Таким образом, (7.85) принимает вид div([E1)H2] + [H1)E2])=^((E2,j1)-(E1,j2)). (7.90) Проинтегрируем (7.90) по пространству и преобразуем, как обычно, интеграл по объему от дивергенции в интеграл по бесконечно удаленной поверхности, равный нулю: Jdiv([E1)H2] + [H1,E2])</F = ^J((E2,j1)-(E1)j2))</F; (7.91)
94 Часть! $([E„H2] + [H1,E2])dS = ^J((E2,J1)-(E1,J2))rfK; (7.92) 5 С V J(E2,jI)rfF=J(EI,j2)rfF. (7.93) К V Последнее соотношение устанавливает связь между двумя источниками и создаваемыми ими полями в местах расположения источников в одной и той же среде. Фактически интегрирование в (7.93) происходит по объему источников, т. е. по тем областям пространства, в которых плотность тока отлична от нуля. Если мы предположим, что источниками являются тонкие провода, влиянием каждого из них на поле другого провода можно пренебречь, и поэтому Е1 и Е2 в (7.93) можно рассматривать как поля излучения первого и второго источников, создаваемые каждым из них в месте нахождения другого источника, как если бы другого источника не было. Формула (7.93) выражает принцип взаимности (иногда также называемый принципом взаимности Лоренца). Он устанавливает соотношение между источниками и создаваемыми ими электрическими полями, причем это соотношение не изменится, если мы поменяем местами точки пространства, в которых находятся источники и в которых измеряются напряженности полей. Если размеры источников малы по сравнению с расстоянием между ними, а также по сравнению с длиной волны излучения, поле каждого источника слабо меняется внутри объема другого источника, и в данном приближении мы можем вынести Е{ и Е2 из под интегралов в (7.93): ( \ С \ (7.94) E2{l),jyV \= I^(2)fJj2</K ^ V ) \ V J (1) и (2) в (7.94) указывают на то, что напряженности полей берутся в местах расположения первого и второго источников, соответственно. Далее, \]dV=\pydV = — \pr dV = 4%-. (7.95) i у dt*v dt Согласно (7.8), интеграл, стоящий под знаком производной по времени в (7.95), представляет собой дипольный момент источника. Поскольку источник создает поле с частотой со, то dVv ^ = -iofPv (7.96) dt (это соотношение справедливо для каждого из источников). Тогда из (7.94) получаем принцип взаимности в форме (Е2(1),^) = (Е1(2),Р2). (7.97) В такой форме теорема применима только к дипольному излучению.
7. Уравнения электродинамики сплошных сред 95 7.9. Принцип взаимности Грина. Принцип взаимности существует также в электростатике (так называемый принцип взаимности Грина). Пусть имеются два источника поля с плотностью заряда р1 и р2. Поля, создаваемые этими источниками, удовлетворяют уравнениям divD, = 4ла; 1 Их (7.98) divD2 = 4np2. Источники находятся в неоднородной анизотропной среде, для которой справедливо соотношение (7.51). Напряженность электрического поля Е выразим через градиент скалярного потенциала так же, как она выражается для электростатического поля в вакууме: E = -grao>. (7.99) Тогда divD = (V,D) = V^=V|.(^7.) = V|.(£,V^). (7.100) Умножим первое из уравнений (7.98) на потенциал <р2, второе — на потенциал фх, вычтем второе из первого и проинтегрируем по объему: -J(ftV,KVy«)-^Vl(^V^))rfK = 4»J(A^-p&)dV. (7.101) V V В левой части выделим полную дивергенцию: -J (fcV, (e„Vyfl) - flV, {eeVjb))dV = V = -J(V,(^V7fl -^V,p2)-^(V,.^)V,.fl +*,(Vlfl)Vyfc)rfK= (7.102) V = -J V.(fl^V }q\ - wJJfa) dV = -j> (^V }q\ - tpfi^ j^)dSr V S Здесь мы вновь воспользовались симметричностью тензора £tJ. Выбирая поверхность S бесконечно удаленной, мы получаем, что левая часть (7.102) равна нулю. Это приводит нас к принципу взаимности Грина: \plq>1dV = \p1(PxdV. (7.103) V V Если у нас имеются точечные источники, д=е^(г-г,), P2=e2S(r-r2), (7.104) соотношение (7.103) может быть представлено в виде el(p2{rl) = e2(Pl{r2). (7.105)
96 Часть1 Подобно принципу взаимности Лоренца (7.93), принцип взаимности Грина (7.103) устанавливает связь между двумя зарядами и создаваемыми ими статическими полями в местах расположения зарядов в одной и той же среде. 7.10. Условия на границе раздела двух сред. В заключение этого раздела рассмотрим условия на границе двух сред. Граничные условия легко выводятся из уравнений Максвелла в интегральной форме: j>Edi = --—JBdS; $ cdt-s BuS = 0; * (7.106) j>Hdl = -—JDdS+—jjdS; L C "* S C S j>DdS = 47r$pdV. ^ V Пусть имеется граница двух сред с различными диэлектрическими и магнитными проницаемостями. Воспользуемся первым их уравнений Максвелла (7.106). Рассмотрим бесконечно малый замкнутый прямоугольный контур L, лежащий в плоскости, перпендикулярной границе раздела сред (рис. 5). 61'Mi fe ш ЮА Рис.5 Пусть /, — длина стороны контура, параллельной границе раздела сред, /2 — длина боковой стороны, перпендикулярной границе раздела. Циркуляция напряженности электрического поля по замкнутому контуру сложится из вкладов сторон, параллельных границе раздела сред, и боковых сторон. Устремляя к нулю длину боковой стороны, /2 -> 0, получаем: Jim j>Edi = (ElT-E2T)ll, (7.107) где Е1т, Е2т — тангенциальные составляющие напряженности электрического поля (касательные по отношению к границе раздела сред) в первой и второй средах соответственно. С другой стороны, интеграл по поверхности S, ограниченной контуром L, в правой части первого уравнения Мак-
7. Уравнения электродинамики сплошных сред 97 свелла также стремится к нулю, поскольку в рассматриваемом пределе стремится к нулю площадь контура. lim(j)BrfS = 0. (7.108) /2->о J 2 s Из (7.107) следует непрерывность тангенциальных составляющих напряженности электрического поля: Е1Т = Е2Т. (7.109) Из четвертого уравнения Максвелла вытекают соотношения для нормальных составляющих вектора электрической индукции. Чтобы их получить, рассмотрим бесконечно малый цилиндр, основания которого расположены параллельно границе раздела сред (рис. 6). ei.Mi , Рис.6 Пусть 5, — площадь основания цилиндра, S2 — площадь боковой поверхности, h— высота цилиндра. Если мы устремим высоту цилиндра к нулю, h —> 0, вклад в поток электрической индукции через поверхность цилиндра будут давать только его основания: lim|Dfi?S = (A„-D2„)5„ (7.110) ~* S' где Dln, D2n — нормальные составляющие вектора электрической индукции по отношению к границе раздела сред в первой и второй средах, соответственно. Интеграл по объему цилиндра от плотности заряда в правой части четвертого уравнения Максвелла стремится к нулю, за исключением случая, когда на границе раздела сред сосредоточена поверхностная плотность заряда (например, на поверхности проводника). Если /(г) = 0 — уравнение поверхности раздела сред, плотность заряда может иметь вид p(r)=p(r)+a(r)S{f(r)), (7.111) где р(г) — регулярная функция, <т(г) — поверхностная плотность заряда, определенная в каждой точке границы раздела сред. При интегрировании (7.111) по объему интеграл от р(г) стремится к нулю при h—>0, интеграл от второго слагаемого дает произведение поверхностной плотности
98 Часть! заряда на площадь основания цилиндра (мы пренебрегаем изменением поверхностной плотности внутри бесконечно малого цилиндра): lim jpdV = (7Sr (7.112) V В итоге получаем А.-А.=4яет. (7.113) При отсутствии заряда на границе нормальная составляющая вектора электрической индукции непрерывна, если же на границе сосредоточен заряд, она претерпевает скачок. Второе уравнение Максвелла позволяет выявить связь между нормальными составляющими вектора магнитной индукции. Вновь рассматривая бесконечно малый цилиндр на границе раздела сред (рис. 6) и рассуждая так же, как в предыдущем случае, приходим к вьшоду о непрерывности нормальных составляющих вектора магнитной индукции: В1п=В2п. (7.114) Третье уравнение Максвелла позволяет определить связь между тангенциальными составляющими напряженности магнитного поля, при этом необходимо учесть, что, в принципе, плотность тока может иметь особенность на границе раздела сред: j(r)=](r) + i(r)*(/(r)), (7.115) i(r) — плотность поверхностного тока, которая отлична от нуля в микроскопически малом слое вблизи границы. Тогда, рассматривая бесконечно малый прямоугольный контур в плоскости, перпендикулярной границе раздела сред (рис. 5), получаем lim JjdS = /,/,; (7.116) 2-> s Hlt-H2t=^iT. (7.117) С При отсутствии поверхностного тока тангенциальная составляющая напряженности магнитного поля непрерывна, если в микроскопически малом слое вблизи границы протекает ток, она претерпевает скачок. Электромагнитное поле в вакууме описывается системой уравнений Максвелла в интегральной форме (1.70). Из первого уравнения в (1.70) следует непрерывность тангенциальных составляющих напряженности электрического поля (7.109). Из второго уравнения следует непрерывность
8. Краткий обзор физических свойств сплошных сред 99 нормальных составляющих напряженности магнитного поля: Я,„=Я2л. (7.118) Из третьего уравнения вытекает соотношение (7.117) для тангенциальных составляющих напряженности магнитного поля, справедливое, наряду с (7.109), как в вакуумной электродинамике, так и в электродинамике сплошных сред. Наконец из четвертого уравнения следует соотношение для нормальных составляющих напряженности электрического поля: Еы-Е2„=4жа. (7.119) Как мы видим, в электродинамике сплошных сред уравнения Максвелла не дают нам соотношений между нормальными составляющими напря- женностей электрического и магнитного поля, а также между тангенциальными составляющими векторов электрической и магнитной индукции. Получить их можно лишь используя уравнения связи между Е и D, Н и В. При отсутствии поверхностных зарядов и токов в случае линейных изотропных сред, используя уравнения связи (7.42), (7.44) получаем (7.120) (7.121) (7.122) (7.123) 8. Краткий обзор физических свойств сплошных сред 8.1. Электропроводность среды. Закон Ома. Закон Джоуля-Ленца. Основными характеристиками сплошной среды в электродинамике являются ее диэлектрическая и магнитная проницаемость, введенные ранее (см. (7.42), (7.44), (7.51), (7.52)), а также проводимость (электропроводность) среды. Последняя величина входит в соотношение между напряженностью электрического поля и протекающим в проводнике током (закон Ома). Если проводник однороден и изотропен, а электрическое поле является достаточно малым, закон Ома выражен в простой форме j = <7E, (8.1) £Ап V*,.: В*. *1 *ь. Mi = £&п => = Mflln => =3* =* *2 = ^ => Mi Ни-Мг К _ *, D2r e2' JL-1L К Мг а — проводимость.
100 Часть! На границе раздела двух проводящих сред нормальная составляющая плотности тока должна быть непрерывной: Ju = Ju- (8-2) Как было показано выше, из уравнений Максвелла вытекает, что на границе раздела сред должна быть непрерывна также тангенциальная составляющая напряженности электрического поля (см. (7.109)). Для нормальной составляющей напряженности электрического поля будем иметь *&.=*&. => |^=5"- (8-3> Для тангенциальной составляющей плотности тока получим (8.4) Электрическое поле производит работу над заряженными частицами проводника. Работа, произведенная в единице объема проводника в единицу времени приводит к выделению количества тепла Q: е = 0,Е) = <т£2=Д (8.5) а Последняя формула выражает закон Джоуля-Леща. В анизотропной среде направления векторов j и Е могут не совпадать. Закон Ома обобщается следующим образом: 1=<т^, (8.6) сг — тензор проводимости (не путать с тензором напряжений). Как и тензор диэлектрической проницаемости е.., он является симметричным: <т~ = а... Важнейшими техническими задачами являются: расчет разветвленных электрических цепей с помощью законов Кирхгофа (законы Кирхгофа представляют собой прямые следствия закона Ома и закона сохранения электрического заряда); расчет потерь энергии вследствие выделения тепла при передаче электроэнергии на большие расстояния. 8.2. Электростатика проводников. Емкость. Емкостные и потенциальные коэффициенты. Отдельный предмет составляет электростатика проводников, изучающая электрические поля, создаваемые заряженными проводниками. Статическое распределение зарядов в проводниках возможно лишь в случае, когда напряженность электрического поля внутри проводника равна нулю, в противном случае по проводнику протекал бы электрический ток. Более того, свободные заряды внутри проводника мо-
8. Краткий обзор физических свойств сплошных сред 101 гут распределяться только на его поверхности. Действительно, если внутри проводника Е = 0, то из четвертого уравнения Максвелла divE = Акр следует, что плотность зарядов внутри проводника также равна нулю. В электростатике проводников важная роль отводится величинам, называемым емкостными коэффициентами. Поскольку распределение зарядов и потенциалов проводников подчиняется уравнениям электростатики, оно не может быть задано произвольным образом. В силу линейности уравнений поля связь между зарядами и потенциалами должна быть линейной: ?e=ZC*ft- (8-7) ь Емкостные коэффициенты СаЪ зависят от формы и взаимного расположения проводников. Емкостью уединенного проводника С называется отношение заряда проводника к его потенциалу (предполагается, что потенциал выбран таким образом, что он обращается в нуль на бесконечности): q = Cq>. (8.8) Емкость конденсатора (напомним, что конденсатором называется система из двух или более проводников — обкладок конденсатора, которые разделены диэлектрической средой,— способная накапливать электрический заряд) определяется отношением заряда на одной из его обкладок к разности потенциалов между обкладками: q = C{<p[-<p2). (8.9) Наряду с (8.7) можно записать соотношения Й=Х5**»- (8.10) ь Величины Sab называются потенциальными коэффициентами. Они составляют матрицу, обратную матрице СаЬ: S* = <2. (8.11) Обе матрицы являются симметричными. 83. Электростатическая энергия проводников. Емкостные коэффициенты используются для расчета электростатической энергии проводников: = --!-J((V,(E^))-^(V>E))rfF = ~Jdiv(E?»)rfF + J-J?»divErfK. 8я"*Л 8л-*, 8л-*,
102 Часть! Поскольку внутри проводников напряженность электрического поля равна нулю, мы интегрируем в (8.12) по всему объему пространства вне проводников. Предполагаем, что в пространстве вне проводников отсутствуют сторонние заряды (р = 0), и поэтому divE = 0. Таким образом, последний интеграл в (8.12) равен нулю. Первый интеграл в (8.12) может быть преобразован в интеграл по поверхности, которая складывается из поверхностей всех проводников и бесконечно удаленной поверхности. Воспользовавшись неопределенностью в выборе потенциала, потребуем, чтобы он обращался в нуль на бесконечности. Тогда первый интеграл в (8.12) сведется к сумме интегралов по поверхностям проводников: W = ~Y,§<pEdS = ~Y,<pa§EdS. (8.13) о/Г а £ о/Г а g Очевидно, потенциал одинаков в каждой точке поверхности проводника, поэтому его можно вынести из-под знака интеграла по поверхности. Далее, на границе раздела «проводник — диэлектрическая среда» нормальная составляющая вектора электрической индукции удовлетворяет граничному условию (7.113). Вновь учитывая, что внутри проводника Е = 0, условие (7.113) примет вид Dn=eEn=4x<j. (8.14) Будем считать, что диэлектрическая проницаемость окружающей проводники среды £ = 1 (проводники находятся в вакууме). Тогда имеем £„=4/г<7, (8.15) здесь о — поверхностная плотность заряда, Еп — составляющая электрического поля, определяемая по отношению ко внешней нормали к поверхности проводника. В то же время при интегрировании в (8.13) мы должны выбрать нормаль, внешнюю по отношению к области пространства вне проводников, по которой изначально проводилось интегрирование. Эта последняя направлена внутрь проводника. Учитывая это обстоятельство, мы должны изменить знак перед интегралом в (8.13). Интеграл от поверхностной плотности заряда по поверхности проводника даст полный заряд проводника: OK as a S а Используем теперь соотношения (8.7) и (8.10): W = ^ЦЧаФа = ТЕС^% = Т^аЬЯаЯь • ^ а ** а,Ь ** а,Ь (8.17)
8. Краткий обзор физических свойств сплошных сред 103^ Электростатическая энергия системы проводников может быть представлена в виде квадратичной формы потенциалов или зарядов проводников. В электростатике проводников используется ряд специальных методов решения задач: метод изображений, метод инверсии, метод конформного отображения, метод интегральных преобразований, метод разделения переменных в криволинейных координатах и другие. 8.4. Электрострикция и электрокалорический эффект. На проводники и диэлектрики, находящиеся в электрическом поле, со стороны поля действуют силы, которые могут приводить к деформации проводника или диэлектрика. Это явление называется электрострикцией. Действительно, как было показано раньше, электромагнитное поле обладает импульсом, плотность потока импульса определяется тензором напряжений сг (7.79). Сила, действующая на проводник со стороны электрического поля, получается интегрированием по всей поверхности проводника (см. (7.82)): F^-jcjydSj. (8.18) s Если полная сила, действующая на проводник, равна нулю, проводник остается неподвижным, а действие сил на поверхность проводника приводит к изменению его объема. Направление силы совпадает с внешней нормалью п к поверхности проводника и приводит к его растяжению. Это связано с тем, что внутри проводника напряженность электрического поля равна нулю, а у поверхности проводника направлено по нормали к поверхности. Если проводник находится в вакууме (е = 1), на элемент его поверхности dS будет действовать сила dF. = -<т„.dS. = -<т„.л.dS = -—Г-E2SU -E.EAn.dS =—n.dS. (8.19) 4 J ,J J 4Д2 y ' J) J Ы ' В отличие от электрострикции проводников изменение объема диэлектриков во внешнем электрическом поле может быть как положительным, так и отрицательным (электрострикция диэлектриков может приводить как к растяжению, так и к сжатию диэлектрика). В диэлектриках наблюдается также электрокалорический эффект - поглощение диэлектриком количества тепла Q при изотермическом включении внешнего электрического поля при постоянном внешнем давлении. Если же диэлектрик теплоизолирован, наложение внешнего электрического поля приводит к изменению его температуры. 8.5. Механизмы поляризации диэлектриков. Как мы знаем, наложение внешнего электрического поля приводит к перераспределению плотности электрического заряда внутри диэлектрика, т. е. к его поляризации. Поляризация диэлектриков может быть обусловлена различными меха-
104 Часть! низмами, в частности, ионная поляризация является результатом смещения ионов друг относительно друга в ионных кристаллах, электронная поляризация является результатом деформации электронных оболочек. В полярных диэлектриках молекулы представляют собой электрические диполи, которые в отсутствие электрического поля ориентированы хаотически, а при наложении поля приобретают преимущественную ориентацию. Такой механизм поляризации называется ориентационным и характерен для жидкостей и газов. 8.6. Вещества со спонтанной поляризацией (пироэлектрики). Прямой и обратный пьезоэффект. Рассмотренная выше (см. (7.51)) связь между электрической индукцией и напряженностью электрического поля в анизотропной диэлектрической среде не является самой общей. Наиболее общий вид такой зависимости есть Ц=П01+£уЕ;., (8.20) где D0 — постоянный вектор. Если D0 отличен от нуля, это означает, что диэлектрик спонтанно поляризован даже при отсутствии внешнего электрического поля. Вещества, обладающие этим свойством, называют пиро- электриками. Значения D0, характеризующие величину спонтанной поляризации, невелики, в противном случае внутри диэлектрика существовали бы сильные поля, что является энергетически невыгодным. В большинстве кристаллов D0 = 0 и зависимость (8.20) сводится к (7.51). Тензор диэлектрической проницаемости е{. может быть приведен к диагональному виду с помощью соответствующего преобразования координат и определяется тремя своими главными значениями. В кристаллических диэлектриках симметрия кристалла определяет, сколько различных главных значений имеет тензор etj. Так, например, в кристаллах кубической системы все три главных значения тензора etJ одинаковы, а направления главных осей произвольны. Тензор диэлектрической проницаемости имеет вид £tj = eSy, иными словами, в отношении своих диэлектрических свойств кристаллы кубической симметрии не отличаются от изотропных тел. Однако нужно отметить, что направления главных осей тензора не всегда однозначно связано с кристаллографическими направлениями. Пироэлектрическими свойствами может обладать лишь такой кристалл, в котором существует направление, остающееся неизменным при всех преобразованиях симметрии. В этом направлении лежит постоянный вектор D0. Кристаллические вещества, в которых при сжатии или растяжении в определенных направлениях возникает поляризация даже при отсутствии электрического поля, называются пъезоэлектриками, а возникнове-
8. Краткий обзор физических свойств сплошных сред 105 ние поляризации в этом случае называется прямым пьезоэффектом. Наблюдается также обратный пьезоэффект — появление механической деформации под действием электрического поля. Этот эффект следует отличать от явления электрострикции, которая наблюдается в ряде кристаллов. В случае электрострикции возникающие в диэлектрики силы квадратичны по полю, а в пьезоэлектриках вследствие определенной кристаллической структуры пропорциональны первой степени напряженности электрического поля. 8.7. Сегнетоэлектрики и их основные свойства. Особый класс пиро- электриков представляют собой сегнетоэлектрики— кристаллические вещества, у которых спонтанная поляризация наблюдается в определенном интервале температур. Название «сегнетоэлектрики» объясняется тем, что впервые характерные для них свойства были обнаружены у кристаллов сегнетовой соли. На спонтанную поляризацию сегнетоэлектриков оказывают существенное влияние внешние воздействия. Величина электрического дипольного момента достаточно легко изменяется при изменении температуры, наложении внешних электрических полей и упругих напряжений. Как правило, сегнетоэлектрик не поляризован однородно, но обладает доменной структурой. Различные области сегнетоэлектрика — домены — имеют различное направление поляризации (дипольного момента). Суммарный дипольный момент в обычных условиях может отсутствовать. Для понимания физических особенностей сегнетоэлектриков необходимо учитывать их термодинамические свойства. В состоянии равновесия доменная структура отвечает минимуму свободной энергии кристалла. Она определяется симметрией кристалла, расположением дефектов кристалла, а также тем, какие воздействия кристалл испытывал в прошлом (как говорится, «историей» образца). При наложении внешнего электрического поля происходит перестройка доменной структуры, сопровождающаяся увеличение объемов доменов, направление поляризации которых совпадает с направлением внешнего поля, за счет уменьшения объемов доменов, поляризованных против поля. В достаточно сильном поле в кристалле остается только один домен. Кристалл остается поляризованным и после выключения поля в течении длительного времени. Для того, чтобы суммарный дипольный момент снова стал равен нулю, необходимо подвергнуть кристалл действию достаточно сильного поля противоположного направления. Таким образом, в сегнето- электриках наблюдается явление гистерезиса— неоднозначная зависимость поляризации от значения внешнего электрического поля, проявляющаяся в том, что кристалл с опозданием реагирует на изменение внешнего поля (греческое слово «гистерезис» означает отставание, запаздыва-
106 Часть! ние). При включении и последующем возрастании внешнего поля поляризация сначала резко увеличивается, а затем достигает насыщения. Соответствующее отставание состояния поляризации наблюдается также при постепенном уменьшении внешнего поля. Поскольку поляризация сегнетоэлектриков сильно изменяется под воздействием внешних полей, для них характерна большая величина диэлектрической проницаемости. Возникновение спонтанной поляризации сегнетоэлектриков наблюдается в так называемой полярной фазе. В этом состоянии сегнетоэлектрики проявляют также пьезоэлектрические свойства. При повышении температуры происходит фазовый переход из полярной фазы в неполярную. Температура фазового перехода называется температурой Кюри. В точке фазового перехода спонтанная поляризация исчезает (в некоторых веществах — скачком, что соответствует фазовому переходу первого рода, в других веществах— непрерывно, при фазовом переходе второго рода). Для анализа явлений, происходящих при фазовом переходе второго рода, следует обратиться к теории фазовых переходов Ландау. К сегнетоэлектрикам эту теорию применил В. Л. Гинсбург в 1945 году. Поляризация выступает в роли параметра порядка, полярная фаза, в которой возникает спонтанная поляризация, является упорядоченной, неполярная — неупорядоченной фазой. 8.8. Магнитные свойства веществ. Парамагнетики и диамагнети- ки. Исходя из магнитных свойств, также можно выделить несколько характерных классов веществ. Парамагнетиками называются вещества, которые во внешнем магнитном поле приобретают магнитный момент, направление которого совпадает с направлением поля. Учитывая связь (7.41) между намагниченностью и напряженностью магнитного поля, можно сделать вывод, что для парамагнетиков магнитная восприимчивость % > 0. Термин «парамагнетизм» ввел в 1845 году Майкл Фарадей. Парамагнетизм характерен для веществ, частицы которых обладают собственным магнитным моментом. При отсутствии внешнего поля магнитные моменты частиц ориентированы хаотически, так что суммарный магнитный момент равен нулю. Во внешнем поле магнитные моменты частиц ориентируются преимущественно по направлению поля, чем и объясняется свойство парамагнетиков х> 0 • В сильном поле магнитные моменты ориентируются строго по направлению поля. Существование у атомов магнитных моментов обусловлено орбитальными и спиновыми моментами электронов, а также моментами ядер. В металлах существенный вклад в формирование магнитного момента вносят электроны проводимости. В тех веществах, в которых нет электронов проводимости, а моменты электронных оболочек атомов скомпенсированы, магнитными моментами обладают только ядра. В этом случае парамагнетизм очень мал и может наблюдаться при
8. Краткий обзор физических свойств сплошных сред 107_ сверхнизких температурах (порядка 0,1 К), при более высоких температурах тепловое движение частиц препятствует ориентации магнитных моментов по направлению поля. Диамагнетиками называются вещества, которые во внешнем магнитном поле приобретают магнитный момент, направление которого противоположно направлению поля. Соответственно, для диамагнетиков магнитная восприимчивость #<0. Механизм намагничивания здесь совершенно другой, чем в случае парамагнетизма. В магнитном поле в электронной оболочке каждого атома возникают индуцированные круговые токи (круговое движение электронов). Токи создают в каждом атоме индуцированный магнитный момент, направленный противоположно внешнему полю, независимо от того, обладает ли атом собственным магнитным моментом. Поэтому диамагнетизм свойственен всем веществам. Намагниченность, связанная с диамагнетизмом, значительно меньше, чем обусловленная электронным парамагнетизмом. 8.9. Ферромагнетики и антиферромагнетики. Ферромагнетиками называются вещества, в которых магнитные моменты атомов параллельны, так что ферромагнетик обладает спонтанной намагниченностью в отсутствие внешнего магнитного поля. Как и спонтанная поляризация сегнето- электриков, спонтанная намагниченность ферромагнетиков наблюдается в определенном интервале температур. Ферромагнетик может обладать доменной структурой, в чем также проявляется сходство с сегнетоэлектри- ками. Намагниченность нелинейно растет с увеличением напряженности внешнего поля, наблюдается явление гистерезиса. При намагничивании изменяются размеры и форма ферромагнетика, т. е. имеет место эффект, в определенной степени аналогичный пьезоэффекту в сегнетоэлектриках. Это явление называется магнитострикцией ферромагнетиков. При адиабатическом намагничивании и размагничивании наблюдается изменение температуры ферромагнетика (так называемый магнетокалорический эффект). Упорядочение магнитных моментов в ферромагнетике обусловлено обменным взаимодействием и требует привлечения квантовой теории. При этом необходимо учитывать взаимодействие спинов между собой, а также с внешним магнитным полем. При определенной температуре (температуре Кюри) происходит фазовый переход второго рода. Выше температуры Кюри ферромагнетик переходит в парамагнитное (неупорядоченное) состояние. В некоторых случаях ферромагнетик в результате фазового перехода оказывается в антиферромагнитном состоянии. В антиферромагнетике магнитные моменты атомов упорядочены таким образом, что полный магнитный момент равен нулю. В антиферро-
108 Часть! магнетике можно выделить несколько кристаллических подрешеток, причем магнитные моменты разных подрешеток имеют различные направления. Как и в случае ферромагнетика, формирование такой упорядоченной структуры обусловлено обменным взаимодействием. 9. Электромагнитное поле в среде с пространственной и временной дисперсией 9.1. Общая связь между напряженностью электрического поля и электрической индукцией. Пространственно-временная дисперсия. Уравнения Максвелла (7.39), описывающие электромагнитное поле в среде, были получены нами при некоторых допущениях. Основным допущением являлась возможность усреднения по физически бесконечно малым объемам, а также временам, большим по сравнению с характерным временем флуктуации микроскопического поля. Однако сделанные нами усреднения неправомерны в случае полей высокой частоты и в пространственно неоднородных средах. Сделанное усреднение предполагает, что изменение полей во времени и в пространстве должно быть достаточно плавным и происходить на расстояниях, больших по сравнению с размерами атомов и молекул. Если мы рассматриваем поля высокой частоты со с длиной волны Я, должно выполняться условие Л»а, (9.1) где а — характерный размер частиц вещества. Ему соответствует частотное ограничение &<£-. (9.2) а Кроме того, частота поля должна быть мала по сравнению с обратным временем релаксации, характерным для данного вещества, #«-. (9.3) т При выполнении этого условия поляризация Р в данной точке пространства в данный момент времени определяется напряженностью электрического поля (средним значением микроскопического поля), в соответствии с (7.40), что приводит к соотношению (7.42). Если же частота сравнима с обратным временем релаксации, изменения поляризации будут отставать от изменений поля и зависеть от истории процесса. Соотношение (7.42) необходимо заменить более общим: D{r,t)=\£{t,t')E(r,t')dt'. (9.4)
9. Электромагнитное поле в среде 109 Здесь интегрирование ведется по всем более ранним моментам времени. Функция e(t, /') несет информацию о поляризации среды в результате воздействия поля в предшествующие моменты времени. Поскольку все моменты времени равноправны, функция е(/, /') должна зависеть только от разности / -/', т. е. D(r,/)= J f(/-/')E(r,/')<//'. (9.5) Учтем теперь наличие в среде пространственных неоднородностей. Помимо условия (9.1) для того, чтобы проведенное ранее усреднение оставалось правомерным, необходимо потребовать выполнения более жесткого условия Я»/, (9.6) где / — характерный размер неоднородностей среды. Если же Я ~ /, то необходимо учитывать значение поля в соседних точках пространства, и соотношение (9.5) нуждается в дальнейшем обобщении: D(r, t)='jje(r, r', t-t')E(r\ t')dV'dt'. (9.7) Рассмотрим случай, когда е(г, г', t-t') зависит только от модуля расстояния между точками с радиус-векторами г и г', т. е. D(r,0= } Jf(|r-r1, t-t')E(r',t')dV'dt'. (9.8) Разложим E(r, /), D(r, /) в интегралы Фурье по трем пространственным координатам и времени: Е(г, /) = —L-fE(k, a>)ei{b-m)d3k da,; (9.9) (2л-) D(r, t) = —Ц- fD(k, а))е'{кт""^3к da. (9.10) (2л-) Подставим эти разложения в (9.8): -^td3k dcoe'^Dik, a>) = {2x)4i V ' = —^\d3k da>\dt'\dV'e{\r-T\ t-t')E{k, a>y(kr'-fl,') = \27T) i (9.11)
по Часть! :—l—jd3k dcoe'^Eik, a>)) dt'jdV'e(|r-r'|, ,_,')е-«'-''>-<*-0) = 1 Tjd3k d<oei{b-a)E(k, a>)e(k, a>). (9.11) {in)* Здесь e{k, <o)= \ dt'jdV'e(|r-r'|, t_ ф-'W'-'M.-O). (9.12) После введения новых переменных R = r-r', r = f-*' (9.13) f(k, со) представима в виде е{к, o>) = ]drjd3R e{R, ф4^-^. (9.14) О Подчеркнем, что е(к, со) не является фурье-образом функции е(R, т). Однако из (9.11) следует D(k, co) = £(к, соЩк, со). (9.15) Именно е(к, со) связывает фурье-образы векторов Е и D. Диэлектрическая проницаемость е в области высоких частот оказывается зависящей от частоты и волнового вектора. Это явление получило название пространственно-временной дисперсии. Если пространственными неоднородностями можно пренебречь, диэлектрическую проницаемость е можно считать функцией только от / -1'. В этом случае формулы упрощаются, в частности. (9.14), (9.15) принимают вид £(co) = jdtB(r)eiOK; (9.16) о D(co) = e(co)E(co). (9.17) 9.2. Дисперсионное уравнение. Один из методов решения уравнений Максвелла состоит в том, чтобы искать решения в виде разложений в интегралы Фурье. Выше мы уже использовали разложение E(r, t) , D(r, /) в интегралы Фурье (9.9), (9.10). Разложим также Н(г, /), B(r, t): Н(г, /) = —L-fH(k, co)e^-M)d'k dco; (9.18) (2л-)
9. Электромагнитное поле в среде 111 В(г, /) = —!—Гв(к, (оу{Ух-м)йък do). (9.19) [In) Подставим разложения (9.9), (9.10), (9.18), (9.19) в уравнения Максвелла (7.39). Запишем уравнения Максвелла для гармоник Фурье: [к,Е(к,а))] = -В{к,а)); с (к,В(М)=0; (9-20) [к,Н(к,а>)] = - -Щк,а>)-{—j(k,a>); С С (k,D(k,co)) = -4mp(k,a)). При этом задача об интегрировании системы уравнений в частных производных сводится к задаче о решении системы алгебраических уравнений и последующим применением формул обратного преобразования Фурье. Для решения этих уравнений необходим использовать связь между D(k,a)) и Е(к,со), B(k,fi>) и Н(к,*у). Выше было показано, что диэлектрическая проницаемость е(к, (О) в области высоких частот оказывается зависящей от частоты и волнового вектора. Вообще говоря, диэлектрическая проницаемость является не скалярной, а тензорной величиной, так что соотношение (9.15) допускает дальнейшее обобщение, и его следует записать в виде Di(k,a)) = £ij(k,a))Ej(k,co). (9.21) Умножим первое из уравнений (9.20) векторно на к: [к,[к,Е(к,«)]]=|[к,В(к,«)]. (9.22) В левой части раскроем двойное векторное произведение, [k,[k,E(k,a>)]] = k(k,E)-£2E, (9.23) кроме того, будем для простоты считать, что среда не обладает какими- либо магнитными свойствами (магнитная проницаемость среды // = 1 ) и в среде не протекает электрический ток (j(k,tf>) = 0). В этом случае можно считать, что B(k,fi>) = H(k,tf>), и воспользоваться третьим из уравнений (9.20): (От л (От л О? -k,B=-k,H] = -=rD. (9.24) С С С
112 Часть! В итоге )PE-k(k,E)=-^D. В тензорных обозначениях of (*ч-**,)*,=5-4 Воспользовавпшсь уравнением связи (9.21), получим уравнение at ^ к25,. ■*,.*, Ej = 0. Это уравнение будет иметь нетривиальные решения при условии С (9.25) (9.26) (9.27) (9.28) которое позволяет определить зависимость е.. (к, со) от к и а), иначе говоря, представляет собой дисперсионное уравнение. Для его решения необходимо учитывать симметрию среды. Рассмотрим среду, пространственно однородную и изотропную в больших (макроскопических) масштабах, что не исключает наличия не- однородностей на микроуровне. В такой среде направление вектора к является единственным выделенным направлением. Симметричный тензор второго ранга etJ (к, со) в среде с единственным выделенным направлением может быть выражен только через единичный тензор 8{. и компоненты вектора к. Из этих величин тензор etJ (к, со) может быть составлен единственным образом: ev(k, co) = £l(k, a>)lsy -фЧ + *2(к, о))-^-. (9.29) Выберем систему координат так, чтобы направление оси z совпадало с направлением вектора к. В этой системе координат тензор etJ (k, со) приводится к диагональному виду £и = О О О о о (9.30) Как мы видим, тензор является симметрическим (два из трех главных значений тензора совпадают), вектор к определяет одно из главных направле-
9. Электромагнитное поле в среде 113 ний тензора, в то время как два других лежат в плоскости, перпендикулярной вектору к, и могут быть выбраны произвольно. Это соответствует симметрии среды. Можно сказать, что при наличии пространственной дисперсии изотропная среда характеризуется поперечной (перпендикулярной) диэлектрической проницаемостью £, (к, й)) и продольной е2 (к, й)). Подстановка (9.30) в дисперсионное уравнение (9.28) дает —е,(к,а>)-к2=0, (9.31) С €2(к,О)) = 0. (9.32) Уравнение (9.27) предполагает, что при выполнении условия (9.31), соответствующего (1-1) и (2-2) компонентам (9.28), отличны от нуля поперечные компоненты электромагнитного поля £,и£2,а при выполнении условия (9.32), соответствующего (3-3) компоненте (9.28), отлична от нуля продольная компонента поля Еъ. Таким образом, в рассматриваемой среде возможно существование двух независимых процессов— поперечных и продольных волн, для которых справедливы различные законы дисперсии. Наличие продольных электромагнитных волн, также называемых волнами поляризации, является специфическим эффектом, связанным с пространственной дисперсией среды. Для понимания смысла продольных волн представим себе среду с неоднородным распределением заряда и предположим, что на нее действует электромагнитное поле, длина волны которого сравнима с размерами неоднородностей. Поле вызывает смещение зарядов (поляризацию), в результате чего в среде возникают колебания зарядов, сходные с упругими звуковыми волнами в изотропных средах. Зная явное выражение для £j(k, со) и £2(^> &), можно установить закон дисперсии щ(к) и 0)2{к) для поперечных и продольных волн. Если пространственная дисперсия отсутствует, диэлектрическая проницаемость зависит только от со. При этом вместо (9.29) мы можем записать е„{а>) = е{а>)5г (9.33) В такой среде все три главных значения тензора £^{о)) совпадают и отличны от нуля, следовательно, условие типа (9.32) для продольных волн не может быть выполнено, так что Е3=0 .В среде без пространственной дисперсии могут распространяться только поперечные волны. Для поперечных волн из дисперсионного уравнения (9.28) следует —е(а))-к2=0. (9.34)
114 Часть! Литература к части I 1. В. В. Батыгин, И. Н. Топтыгин. Современная электродинамика. Часть I. Микроскопическая теория. — Москва-Ижевск: НИЦ «Регулярная и хаотическая динамика», 2005. 2. И. Н. Топтыгин. Современная электродинамика. Часть II. Теория электромагнитных явлений в веществе. — Москва-Ижевск: НИЦ «Регулярная и хаотическая динамика», 2005. 3. Л. Д. Ландау, Е. М. Лифшиц. Теория поля. — Москва: «Наука», 1988. 4. Л. Д. Ландау, Е. М. Лифшиц. Электродинамика сплошных сред. — Москва: «Наука», 1982. 5. В. Г. Левич. Курс теоретической физики. Том I. — Москва: «Наука», 1969.
Часть II. Термодинамика и статистическая физика 1. Введение в статистическую физику Статистическая физика изучает закономерности, которым подчиняются поведение и свойства тел, состоящих из огромного числа частиц — атомов и молекул. Как известно, определение точных решений уравнений классической или квантовой механики для таких систем, хотя и считается принципиально возможным с теоретической точки зрения, практически, за исключением нескольких простых случаев, наталкивается на непреодолимые трудности. С другой стороны, именно наличие огромного числа частиц определяет возникновение новых, статистических, закономерностей, которые не могут быть сведены к чисто механическим. Для систем с небольшим числом степеней свободы эти закономерности теряют смысл. В этих лекциях мы в основном будем следовать классическому изложению статистической физики и термодинамики, принятому в курсе Ландау и Лифшица [1]. Рассмотрение некоторых специальных вопросов читатель может найти в книгах [2-6]. 1.1. Необходимые сведения из теоретической механики. Лагранже- ва и гамильтонова формы динамических уравнений. Конфигурационное и фазовое пространства. Прежде, чем обсуждать, каким образом мы можем придти к статистическому описанию больших систем, необходимо напомнить некоторые сведения из теоретической механики [7]. Как известно, в классической физике уравнения движения могут быть представлены либо в лагранжевой, либо в гамильтоновой форме. Уравнения движения в лагранжевой форме выводятся из принципа наименьшего действия. Вспомним, как формулируется принцип наименьшего действия в теоретической механике. Физическая система характеризуется некоторой функцией, называемой функцией Лагранжа, зависящей от обобщенных координат и скоростей: C{q{t),q{t),t), q(t)={g-(t)}, *(') = {*'(')}• 0-D Пусть в моменты времени tx и t2 координаты системы принимают значения Ч"{Ч) = Ч1, qa{h) = qa2, (1.2)
116 Часть II тогда в промежутке между моментами времени tx и t2 система движется таким образом, чтобы интеграл S = \C{q{t),q{t),t)dt, (1.3) называемый интегралом действия, принимал наименьшее значение. Интеграл (1.3) является функционалом: в зависимости от того, какие функции qa (t) мы подставим в интеграл, он будет принимать различные значения. Среди всех возможных функции qa (t) только одна будет соответствовать минимальному значению интеграла, именно эта функция определяет классическую траекторию физической системы. Рассмотрим изменение интеграла действия при малых изменениях функций qa(t): -li 'i ° bq° H bq0dr H >" Ы (1.4) •tw« 2 h + I/, \ a dC d 'ЪС^ dqa dt{dqa) Sqadt. Поскольку принцип наименьшего действия формулируется в предположении, что моменты времени ц и t2 координаты системы фиксированы (см. (1.2)), то 8q°{tx) = 0, Sq°{t2) = 0, (1.5) и внеинтегральный член в (1.4) обращается в 0. Необходимым условием экстремальности функционала действия является обращение в 0 его первой вариации, откуда, в силу произвольности вариации Sqa(t), следуют уравнения Лагранжа: SS = 0 => — dt 'Э/^ дС {dqa) dq = 0. (1.6) Функция Лагранжа для большинства достаточно простых систем представляет собой разность кинетической и потенциальной энергий системы.
1. Введение в статистическую физику 117 Для примера рассмотрим функцию Лагранжа частицы, находящейся в потенциальном поле U(x): С{х,х)=Щ--и{х). (1.7) Вычисление производных в (1.6) приводит к уравнению тх = -—. (1.8) dx Это ни что иное, как уравнение Ньютона, в левую часть которого входит произведение массы частицы на ее ускорение, а в правую — взятый с противоположным знаком градиент потенциальной энергии, т. е. сила, действующая на частицу. Если мы рассматриваем движение N частиц в трехмерном пространстве, для однозначного определения ее положения необходимо задать 3N величин. Говорят, что система имеет 3N степеней свободы. Эти 3N величин не обязательно должны быть декартовыми координатами частиц, например, в случае сферической симметрии задачи из соображений удобства можно пользоваться сферическими координатами. Вообще, поскольку уравнения Лагранжа являются дифференциальными уравнениями второго порядка, мы можем перейти в этих уравнениях к другим переменным, которые являются функциями исходных. Эти переменные также будут определять состояние движения системы. Они называются обобщенными координатами. Мы можем рассмотреть абстрактное пространство, которое имеет 3N измерений. В таком пространстве состоянию, или конфигурации, системы, определяемому 3N обобщенными координатами, соответствует точка. Это пространство называется конфигурационным пространством. Для определения движения механической системы в произвольный момент времени недостаточно знать все координаты системы в заданный момент времени, необходимо также знать все скорости (или импульсы) в этот заданный момент времени. Поэтому рядом преимуществ обладает другой способ описания физических систем в терминах обобщенных координат и импульсов, когда уравнения движения системы представлены в гамильтоновой форме. Прежде всего напомним, что обобщенным импульсом в теоретической механике называется производная функции Лагранжа по обобщенной скорости: дС А=-^7- (1-9) dq В случае частицы с функцией Лагранжа (1.7) обобщенный импульс совпадает с обычным импульсом частицы: р = тх. (1.10)
118 Часть II Поскольку функция Лагранжа зависит от координат и скоростей, ее полный дифференциал есть b\bq° bq° (1.11) (индекс а нумерует степени свободы системы). Согласно уравнениям движения Лагранжа (1.6), Э£ d Ъц" dt\bq дС 7\ = Ра- (1.12) Тогда dC = ^{pjq" + Padq° ) = Z(P*d<l° + d{pJ°) ~ 4°dP*) > (113) a a dW<P*<la-c\ = lliladpa-padqa\ (1-14) \ a ) a Величина, стоящая под знаком дифференциала в левой части (1.14), представляет собой функцию Гамильтона системы: H{p,q) = YPaq°-C{q,q). (1.15) Для подавляющего большинства физических систем она является суммой кинетической и потенциальной энергий, т. е. полной энергией системы, выраженной через координаты и импульсы. Чтобы получить ее явный вид, необходимо выразить обобщенные скорости через импульсы с помощью соотношений (1.9) и подставить в (1.15). Найдем функцию Гамильтона для частицы с функцией Лагранжа (1.7): H{p,x) = px-C{x,x)=^- + U{x). 2т Из дифференциального равенства (1.14), записанного в виде dH = Yi4°dPa-padqa), (1.16) (1.17) вытекают уравнения Гамильтона: дн Ч = Эр, р.-- (1.18) Это уравнения первого порядка, как и следовало ожидать, их число в два раза больше, чем число уравнений Лагранжа. Запишем уравнения Гамиль-
1. Введение в статистическую физику 119 (1.21) тона для рассматриваемой частицы: *-А Р = ~. (1-19) т ах Для большинства физических систем можно продемонстрировать прямым вычислением, что система уравнений Гамильтона полностью эквивалентна уравнениям Лагранжа. В случае частицы с функцией Лагранжа (1.7) достаточно продифференцировать по времени первое из уравнений (1.19) и подставить в него производную импульса по времени, выраженную из второго уравнения (1.19). Получим 1 dU * = ——. (1.20) т ах Это уравнение совпадает с (1.8). Уравнения Гамильтона можно записать в иной форме, если ввести скобку Пуассона. Для двух функций координат и импульсов F(q, p) и G(q, p) скобка Пуассона определяется следующим образом: (F G\ = y(—— -—— 1 ' ' ^{ддадРа дРадд° Тогда уравнения (1.18) можно представить следующим образом: q°={q°,H], ра={Ра,Н}. (1.22) Отметим также, чему равны скобки Пуассона канонических переменных (координат и сопряженных им импульсов): {q°,qb} = 0, {p.,pt}=0, {q°,p„} = 5°b. (1.23) Если в уравнениях Лагранжа мы можем подвергать координаты преобразованиям из достаточно широкого класса, переходя к новым обобщенным координатам, то в уравнениях Гамильтона мы можем преобразовывать как координаты, так и импульсы, выражая новые канонические переменные через старые координаты и импульсы, и наоборот. Преобразования, при которых уравнения Гамильтона сохраняют свой вид, называются каноническими. Скобки Пуассона не изменяются по отношению к каноническим преобразованиям, (q,p)-^(Q,P): {F,G\p={F,G}\Qp. (1.24) Отсюда следует, что необходимое условие того, что преобразование является каноническим, состоит в сохранении соотношений (1.23) для новых
120 Часть П переменных: {е-.еЧ^-о. te./tf^-Q. {e^L,"*- (L25) Заметим, что пока мы характеризуем состояние системы с помощью микроскопических величин— координат и импульсов всех частиц. Эти величины называются микропараметрами, а состояние физической системы, который детально, исчерпывающе определяют микропараметры — микросостоянием. Как известно, в классической механике координаты и импульсы всех частиц составляют полный набор физических величин, зная который можно определить все другие характеристики системы, например, ее энергию. В квантовой механике в качестве микропараметров также выступают полные наборы одновременно измеримых физических величин. Состояние системы из N частиц в трехмерном пространстве полностью определяется заданием 3N обобщенных координат и 3N обобщенных импульсов системы. Такому состоянию можно сопоставить точку в абстрактном пространстве, имеющем 6N измерений. Абстрактное многомерное пространство, в качестве координат которого выступают обобщенные координаты и импульсы системы, называется фазовым пространством. Число его измерений равно удвоенному числу степеней свободы системы. Как мы увидим, фазовое пространство играет важную роль в статистической физике, более значительную, чем конфигурационное пространство, которое мы обсуждали выше. С течением времени изменяются значения обобщенных координат и импульсов, соответственно, изменяется положение точки в фазовом пространстве, характеризующей состояние системы. Говорят, что фазовая точка описывает траекторию в фазовом пространстве, или просто фазовую траекторию. 1.2. Функция распределения и статистический ансамбль. Рассмотрим малую часть фазового пространства системы, соответствующий значениям ее координат и импульсов, лежащим в интервалах Aqa, Ара, объем которой есть № = AqLAq*...AqNAplAp2...ApN. (1.26) В зависимости от характера движения системы за достаточно большой промежуток времени Т фазовая траектория может многократно пройти через рассматриваемую часть фазового пространства (хотя, в принципе, может не пройти ни разу). Пусть At есть доля полного времени Т, в течение которого фазовая траектория системы находится в данной части фазового пространства AQ. Это подразумевает, что в течении времени At система
1. Введение в статистическую физику 121 находится в таких физических состояниях, которым соответствуют значения координат и импульсов, лежащие в интервалах Aqa, Ара. При неограниченном увеличении полного времени Т отношение — будет стремиться к некоторому пределу w = lim—, (1.27) который можно рассматривать как вероятность того, что при наблюдении системы в некоторый произвольный момент времени значения координат и импульсов будут обнаружены в интервалах Aqa, Ара, или, иначе говоря, система будет обнаружена в данной части фазового пространства AQ. Перейдем к бесконечно малому элементу фазового пространства d£l = dqldq2.. .dqNdpxdp2.. .dpN. (1.28) Введем вероятность того, что координаты и импульсы имеют значения, лежащие в бесконечно малых интервалах {qa, qa + dqa), (ра, ра + dpa): dw = p(q\ q2, ...,qN,pl9p2, ...,pN)dqldq2...dqNdpldp2...dpN = = p(q9 p)dqdp = p(q9 p)dQ. Функция p(q, p) играет роль плотности распределения вероятности в фазовом пространстве. Ее называют функцией распределения. Поскольку речь идет о вероятностях, функция распределения должна удовлетворять условию нормировки hp)dqdp = \ (1.30) и* (интеграл берется по всему фазовому пространству; условие нормировки просто выражает тот факт, что сумма вероятностей всех возможных состояний равна единице). Здесь мы переходим от динамического описания больших систем, характеризующихся огромным числом микропараметров, к вероятностному, или статистическому, описанию. Для того, чтобы определить функцию распределения, необходимо ввести понятие статистического ансамбля. Как мы помним, различным точкам фазовой траектории соответствуют определенные микросостояния системы, которые она проходит в последовательные моменты времени ^, t2, .... Обозначим соответствующие микросостояния системы Ах, А2, .... Вместо того, чтобы рассматривать последовательные состояния системы Ах, А2, ..., можно рассмотреть множество
122 Часть II одинаковых систем, находящихся в заданный момент времени в состояниях А19 А2, ... . Это множество представляет собой статистический ансамбль. Иными словами, статистический ансамбль— это множество элементов (физических систем), находящихся в определенных (физических) условиях. Эти системы отличаются значениями координат и импульсов. Если мы рассматриваем состояния выбранной системы в последовательные моменты времени, этим состояниям будут соответствовать точки фазового пространства, распределенные в фазовом пространстве с плотностью p(q, p). С такой же плотностью p(q, p) в фазовом пространстве будут распределены точки, соответствующие состояниям систем, составляющих статистический ансамбль. Также можно сказать, что элементы статистического ансамбля отличаются друг от друга выбором начальных условий. Действительно, поскольку элементы ансамбля исчерпывают все возможные состояния выбранной системы, она с течением времени пройдет все доступные ей в заданных физических условиях состояния, независимо от того, какое состояние выбрано в качестве начального. 1.3. Теорема Лиувилля. Будем следить за передвижением в фазовом пространстве точек, соответствующим различным элементам статистического ансамбля. Это передвижение определяется законами классической динамики, выраженными гамильтоновыми уравнениями движения. Пусть в начальный момент времени t0 фазовые точки fa, Pa} = {<ja (*о)> Ра(*о)} непрерывно заполняют область AQ0 в фазовом пространстве. В произвольный момент времени / эти фазовые точки будут иметь координаты {я°> Ра} = {яа (0> Ра (0} и заполнят область Ml. Теорема Лиувилля утверждает, что в процессе движения фазовых точек занимаемый ими объем остается постоянным: \dqudp«=\dqdp. (1.31) Для доказательства теоремы Лиувилля необходимо перейти в левой части (1.31) от переменных х° ={q°, р^] к переменным x = {qa,pa} (х— совокупность всех координат фазового пространства). Для этого необходимо вычислить якобиан преобразования *« = ^ = detfel; £-V (1.32) Щ*,Р) \?Xj) fy Очевидно, что D(t0) = l. Докажем, что якобиан (1.32) не изменяется с течением времени. Как и любой определитель, якобиан (1.32) можно пред-
1. Введение в статистическую физику 123 ставить в виде разложения по столбцу или строке: где Ад алгебраическое дополнение элемента atj вытекает, что (1.33) Отсюда, в частности, 4 = Для определителей справедливо также следующее свойство: (1.34) (1.35) к к Продифференцируем по времени якобиан (1.32): dt э*. Эх i Эх, =Z В силу уравнений движения (1.18) ij* OXk i* OXk S40 I, J VXj ydxt v Эх, dxt ij* Эх*Эх° (1.36) d2H W_ bq° bq'bpa (1.37) (1.36) обращается в нуль, что и доказывает теорему Лиувилля. Нужно отметить, что, хотя фазовый объем сохраняется в соответствии с теоремой Лиувилля, его форма с течением времени может меняться весьма сложным образом, поскольку фазовые траектории, близкие друг к другу в начальный момент времени, могут расходиться на значительное расстояние. Если расстояние между фазовыми точками двух траекторий растет экспоненциально с течением времени, говорят о динамической неустойчивости траекторий в фазовом пространстве. В таком случае о поведении системы говорят как о динамическом хаосе. В статистической физике важна другая формулировка теоремы Лиувилля, согласно которой функция распределения остается постоянной вдоль фазовых траекторий. В самом деле, при движении вдоль фазовых траектории число фазовых точек остается постоянным. В момент времени t0 они заполняют область AQ0, в которой распределены с плотностью p(q0,p°, t\. Вероятность того, что в последующий момент времени / координаты и импульсы
124 Часть П будут иметь значения, лежащие в бесконечно малых интервалах (qa9 qa + dqa), (ра, ра + фв), равна dw = p(q9p9 t)dqdp = p(q09p\ t0)dq0dp°. (1.38) В силу теоремы Лиувилля элемент фазового объема остается неизменным вдоль фазовой траектории, т. е. dqdp = dq0dp°, следовательно, остается постоянной и функция распределения Р(Я>Р> *) = р{Яо>Р°> 'о)- (1.39) (1.40) Собственно говоря, неизменность функция распределения точек в фазовом пространстве вытекает из нашего определения статистического ансамбля. Из (1.40) следует: dt bt ^\bq'4 dp/ Из уравнений Гамильтона (1.18): = 0. (1.41) dp dp dp эдз^з*-?♦? dp (dpdH dpdff)_ dq" dp„ dpa dq" ^|+{ля). (1.42) Мы получаем уравнение, известное как классическое уравнение Лиувилля: (1.43) f+{Atf}=0. В литературе нередко используется формальная аналогия между перемещением точек в фазовом пространстве и течением жидкости или газа в пространстве 6N измерений. Течение жидкости подчиняется уравнению непрерывности ^ + div(/7v) = 0, (1.44) где р — плотность, v— скорость жидкости. Под знаком дивергенции стоит плотность потока жидкости. Нам нужно записать операцию взятия дивергенции в бЛ^мерном пространстве, координатами которого являются 3Af обобщенных координат и 3N обобщенных импульсов, а в качестве скоростей частиц жидкости выступают производные по времени обобщенных
1. Введение в статистическую физику 125 координат и импульсов, которые можно выразить из уравнений Гамильтона 1+№|+?^)=|+? Эх, Эх, ' Эх, =£+zfer+^A dt W эЛ ^4° dp J (1.45) Вновь используя (1.37), получаем, что последняя сумма в (1.45) обращается в нуль. Таким образом, уравнение непрерывности (1.44) для фазовой жидкости совпадает с уравнением Лиувилля. Сохранение функции распределения вдоль фазовой траектории означает несжимаемость фазовой жидкости. В случае стационарного течения жидкости -^ = 0, div(/?v) = 0. (1.46) ш Беря интеграл от дивергенции плотности потока фазовой жидкости по некоторому объему фазового пространства, мы получаем, что поток через замкнутую поверхность, ограничивающую этот объем, равен нулю: | div(pv)dQ. = j>pvdS = 0. (1.47) Иными словами, в данный объем фазового пространства втекает столько же фазовой жидкости, сколько вытекает из него. 1.4. Средние значения. Микропараметры и макропараметры. Если известна функция распределения, становится возможным вычислить вероятности и средние значения любых физических величин, зависящих от состояния системы. Среднее значение величины f(q, p) дается формулой (f) = jf{^p)p(^p)dqdp. (1.48) В силу самого определения статистического ансамбля усреднение по ансамблю должно быть эквивалентно усреднению по времени. Иначе говоря, тот же результат (1.48) мы бы получили, если бы наблюдали за изменением величины /во времени, после чего провели соответствующее усреднение: (/HjkfJ/wa- (1.49) Таким образом, мы обосновали важное утверждение, что среднее по времени равно среднему по статистическому ансамблю.
126 Часть II Говоря о средних значениях, мы, как правило, имеем в виду величины, характеризующие физическую систему в целом, такие как ее энергия, давление, температура и т. д. Такие величины называются макропараметрами и определяют макросостояние системы. Их можно также назвать термодинамическими параметрами. При термодинамическом описании мы довольствуемся малым числом макропараметров, не ставя задачу детально проследить за поведением каждой из частиц, составляющих систему. Статистическая физика, которая дает вероятностное описание динамических процессов, является связующим звеном между динамикой и термодинамикой и дает возможность обоснования термодинамических соотношений. Макропараметры можно разделить на внутренние и внешние. Внутренние макропараметры характеризуют саму наблюдаемую систему (например, внутренняя энергия системы), а внешние — окружающую среду, физические условия, в которых находится система. Объем сосуда, в котором находится газ, или температура окружающей среды— это примеры внешних макропараметров. Газ может занимать только часть сосуда, и объем, который он реально занимает, характеризующий его макросостояние в данный момент времени, является его внутренним макропараметром. Подобным образом температура газа может отличаться от температуры окружающей среды, и температура газа также является его внутренним макропараметром. Если замкнутая система в физических условиях, определяемых внешними макропараметрами, находится в таком состоянии, в котором для любой макроскопической части системы внутренние макропараметры с большой точностью равны своим средним значениям, говорят, что система находится в состоянии термодинамического равновесия. В состоянии равновесия система может пребывать сколь угодно долго. Когда система находится в макросостоянии с заданными макропараметрами, она в то же время находится в одном из множества микросостояний, отвечающим этим макропараметрам. Между микро- и макросостояниями существует связь, которая обуславливает зависимость макроскопических свойств системы от ее микроскопических свойств. 1.5. Обратимые и необратимые процессы. Изменение микросостояния системы представляет собой процесс, протекающий на микроуровне, или микропроцесс. Соответственно, изменение макросостояния системы является макропроцессом. Микропроцессы происходят в соответствии с законами динамики, которые инвариантны относительно изменения знака времени, поэтому микропроцесс всегда обратим. Напомним, что обратимость означает возможность процесса, обратного данному, т. е. протекающему из конечного состояния в начальное через те же промежуточные состояния в обратном порядке. Макропроцесс может быть необратимым.
1. Введение в статистическую физику 127 Примером необратимого процесса является переход предоставленной самой себе изолированной системы из неравновесного состояния в равновесное. Так, газ, первоначально занимающий только часть сосуда, со временем заполнит весь сосуд; его температура станет равной температуре окружающей среды. В состоянии равновесия внутренние макропараметры становятся равными внешним. Промежуток времени, в течение которого система совершает переход в состояние термодинамического равновесия, называется временем релаксации. Если система находится в определенных физических условиях (определяемых объемом сосуда, температурой окружающей среды и т. д.), система предоставлена сама себе, в то время как эти условия остаются неизменными, мы можем с уверенностью ожидать, что по истечении времени релаксации система будет обнаружена в состоянии равновесия. Важной задачей статистической физики является понимание того, каким образом обратимые микропроцессы могут приводить к необратимым макропроцессам. Самопроизвольный переход предоставленной самой себе замкнутой системы в состояние равновесия нередко объясняют тем, что равновесное состояние является гораздо более вероятным по сравнению с неравновесными. Однако, чтобы говорить о более или менее вероятных состояниях, необходимо понять, что положено в основу определения вероятности. Для этого обсудим пример, который приводится в книге Рейфа «Статистическая физика» [4]. Рассмотрим газ, состоящий из N частиц, находящийся в ограниченном объеме, и будем упрощенно характеризовать микросостояние газа тем, в какой половине сосуда находится каждая из частиц, не указывая точные значения их координат. Так, для газа, состоящего всего из двух частиц, мы бы имели всего четыре микросостояния: 1) обе частицы находятся в левой половине сосуда; 2) первая частица находится в левой половине сосуда, а вторая — в правой половине; 3) первая частица находится в правой половине сосуда, а вторая — в левой половине; 4) обе частицы находятся в правой половине сосуда (рис. 7). ф <2> © Ф ф © Ф <2> Рис.7
128 Часть И При описании макросостояния мы интересуемся не положением каждой отдельной частицы, а тем, сосредоточен ли газ в той или иной половине сосуда или равномерно заполняет весь объем. Поэтому для системы, условно называемой газом из двух частиц, существуют всего три возможных микро состояния: 1) газ сосредоточен в левой половине сосуда; 2) газ равномерно заполняет весь объем сосуда; 3) газ сосредоточен в правой половине сосуда. Первому и третьему макросостоянию соответствуют только по одному из четырех возможных микросостояний, поэтому мы считаем вероятность данного макросостояния равной —. Второму макросостоянию соответст- Сумма вероятностей, как и следовало ожидать, равна 1. Для газа из N частиц число возможных микросостояний равно 2N. Вероятность макросостояния, в котором все частицы находятся в левой половине сосуда, равна —. С ростом N эта величина становится невообразимо малой. Чтобы оценить эту величину, предположим, что все возможные микросостояния (конфигурации) системы запечатлены в кадрах некоего фантастического фильма, причем каждой конфигурации соответствует только один кадр. Далее, мы просматриваем этот фильм со скоростью 1 000 000 кадров в секунду. Сколько времени понадобится, чтобы иметь реальную возможность хотя бы один раз увидеть конфигурацию, в котором все частицы находятся в левой половине сосуда? Это время равно 2^-10-6 с ЦрИ д^ = 80 (весьма малое число частиц, которое даже нельзя рассматривать как реальный газ) мы получим: 280 1,2 -1024 280-10^ 10*" С 106 °~ 60-60-24-365 t = — с «-^— с«^ ^ ^ ^ лет «3,8-1010 лет. (1.50) Эта величина порядка возраста Вселенной, который по современным научным данным, составляет ~ 1010 лет. Столь малая вероятность события, хотя и оставляет теоретическую возможность его наблюдения, однако делает его совершенно нереальным. Отметим также, что переход в равновесное состояние сопровождается сокращением числа макропараметров, необходимых для описания системы. В самом деле, как уже говорилось, в состоянии равновесия внутренние макропараметры становятся равными внешним. Для газа, занимающего часть сосуда, недостаточно указать объем сосуда (внешний параметр), но
1. Введение в статистическую физику 129 необходимо указать, какую часть сосуда занимает газ или же задать распределение плотности газа по объему сосуда. После того, как газ достигнет равновесного состояния, заполнив весь сосуд, с точки зрения термодинамического описания абсолютно не имеет значения, откуда началось расширение газа — из левой или правой части сосуда. Это говорит о том, что в определенном смысле система «забывает» свое начальное состояние. Конечно, на динамическом уровне никакого «забывания» не происходит: если бы мы имели возможность следить за каждой частицей газа, мы бы могли с помощью уравнений движения восстановить всю «историю» системы в предшествующие моменты времени. 1.6. Микроканоническое распределение. Наши оценки вероятности, однако, основываются на гипотезе, что все микросостояния рассматриваемой системы являются равновероятными. Более строго эту гипотезу можно сформулировать следующим образом: изолированную систему, макросостояние которой фиксировано только внешними параметрами, можно обнаружить с равной вероятностью в любом из доступных ей микросостояний. Какой вид должна иметь функция распределения для того, чтобы статистический ансамбль обладал таким свойством? Мы будем искать наиболее общий вид функции распределения. Система, функцию распределения которой мы ищем, может состоять, вообще говоря, из некоторого числа подсистем, имеющих макроскопические размеры, но малых по сравнению с рассматриваемой системой. Будем предполагать, что частицы, а вместе с ними и энергия, распределена по объему системы достаточно равномерно. Это соответствует достаточно общей ситуации. В таком случае взаимодействие ее подсистем между собой осуществляется преимущественно теми частицами, которые находятся в пограничном слое микроскопической толщины, разделяющем подсистемы. Количество частиц в пограничном слое мало по сравнению с количеством частиц в подсистеме макроскопических размеров, поэтому энергия взаимодействия подсистемы с окружающими частями будет малой по сравнению со внутренней энергией подсистемы. Такая подсистема в течении не слишком больших промежутков времени будет себя вести почти как замкнутая система. Такие подсистемы называются квазизамкнутыми. Равновесие внутри квазизамкнутой подсистемы может устанавливаться значительно быстрее, чем равновесие между подсистемами. В таком случае можно сказать, что система в целом находится в неполном равновесии. Если подсистемы слабо взаимодействуют друг с другом, из можно считать независимыми с точки зрения статистического описания. Более строго, статистическая независимость означает, что состояние, в котором находится одна из подсистем, никак не влияет на вероятности различных состояний других подсистем.
130 Часть II Пусть, для определенности наша система состоит из двух подсистем. Тогда вероятность обнаружить систему в элементе объема ее фазового пространства Л2 = Л1(1)Л1(2), (1.51) где dQ.^, dQr2' — элементы объема фазовых пространств подсистем, определяется произведением вероятностей обнаружить каждую из подсистем соответственно в элементах объема *Ш(1), dQr2'. При этом каждая из вероятностей зависит только от координат и импульсов соответствующей подсистемы. Таким образом, для функции распределения системы мы можем записать p(q,p)dQ = px(^,pm)dQ^p2(^\p^)d^\ (1.52) р(я,р) = Р^{1\рт)р2(ч{2\р{2)). (1-53) Справедливо и обратное: если функция распределения для некоторой системы представима в виде произведения функций, каждая из которых зависит только от координат и импульсов одной из частей системы, это подразумевает статистическую независимость частей системы. Из (1.53) непосредственно следует ]np(q,p) = ]nPl(qm,pm) + hip2(qU,/2)). (1.54) Таким образом, функция распределения обладает свойством мультипликативности, а ее логарифм — свойством аддитивности. (Напомним, что величина, соответствующая целостной системе, называется мультипликативной, если она равна произведению величин, соответствующих ее частям (подсистемам), и называется аддитивной, если она равна сумме величин, соответствующих ее частям.) Поскольку, как следует из теоремы Лиувилля, функция распределения остается постоянной вдоль фазовых траекторий, она должна выражаться через интегралы движения, т. е. такие функции координат и импульсов системы, которые сами остаются постоянными при движении системы. Можно сказать, что функция распределения, так же, как и ее логарифм, сама является интегралом движения. Аддитивность логарифма функции распределения говорит о том, что он должен выражаться через аддитивные интегралы движения. Таковыми в механики являются энергия, три компоненты вектора импульса Р и три компоненты вектора момента импульса L. Координаты и импульсы системы, полная энергия, импульс и момент импульса которой сохраняются, должны удовлетворять следующим урав-
1. Введение в статистическую физику 131 нениям: H(q,p) = E0; (1.55) р(*,р)=р.; О-56) L(q,p) = L0, (1.57) где H(q, p)9 F(q, p), L(#, p) — полные энергия, импульс и момент импульса как функции координат и импульсов системы. Для системы, обладающей s степенями свободы, фазовое пространство имеет 2s измерений. Точки фазового пространства, координаты которых удовлетворяют уравнениям (1.55)—(1.57), образуют подпространство, имеющее 2s-l измерений. Функция распределения должна быть отличной от нуля во всех точках подпространства, определяемого уравнениями (1.55)—(1.57), и равна нулю во всех остальных точках фазового пространства. Чтобы выделить в фазовом пространству указанное подпространство, обеспечив равенство нулю функции распределения во всех не принадлежащих ему точках и в то же время правильную нормировку функции распределения, она должна иметь вид p(q,p) = f(q,p)S(H(q,p)-E0)S(¥(q,p)-¥0)S(l,(q,p)-L0). (1.58) Полный импульс и полный момент импульса связаны с движением системы как целого (равномерного поступательного движения и равномерного вращения). Их можно исключить из рассмотрения, выбрав специальную систему координат. Можно представить себе, что система заключена в ящик, и выбрать систему координат, относительно которой ящик покоится. В таком случае можно сказать, что статистическое описание системы зависит только от ее энергии. Функция распределения системы приобретает более простой вид: p(q,p) = CS(H(q,p)-E0). (1.59) Мы ищем функцию распределения для системы с сохраняющейся энергией, все микросостояния которой являются равновероятными. Поэтому в (1.59) С = const. Распределение (1.59) называется микроканоническим. Это равновесное распределение для статистического ансамбля систем с заданной полной энергией Е0 при постоянном объеме V и постоянном числе частиц N. Оно было установлено Гиббсом (1901 год). Соответствующий статистический ансамблю называется микроканоническим. Однако здесь возникает существенная трудность, которая заключается в том, что некоторые динамические системы не могут иметь функцию рас-
132 Часть II пределения, которая постоянна на энергетической поверхности (1.55). К таким системам относятся прежде всего интегрируемые системы. 1.7. Интегрируемые системы. Обратимся к конкретным примерам. В качестве простейшего примера рассмотрим частицу массы т, движущуюся между двумя абсолютно упругими стенками со скоростью, перпендикулярной стенкам. Движение частицы можно рассматривать как одномерное, так что размерность фазового пространства равна 2. Потенциальную энергию в промежутках между соударениями можно считать равной нулю, и функция Гамильтона частицы будет иметь вид Н(р,х) = ^-. (1.60) 2т Уравнения Гамильтона (1.18): х = £} ^ = 0. (1.61) т Эти уравнения легко интегрируются, их решение x = ^t + x0, p = p09 (1.62) т р0, х0 = const. Фазовая траектория показана на рис. 8. Она состоит из двух отрезков, соответствующим двум значениям импульса, р0 и — р0. Точки 2 этих отрезков удовлетворяют уравнению (1.55) с Е0 =-^-, следовательно, 2т эти два отрезка представляют энергетическую «поверхность» в двумерном пространстве. Точки «поверхности» представляют состояния частицы, которые отличаются только выбором начальных условий. Их можно считать равновероятными. р Ро -Ро а х Рис.8
1. Введение в статистическую физику 133 Несколько усложним задачу, добавив одно пространственное измерение. Пусть теперь частица движется в двумерном ящике (рис. 9). Соударения со стенками ящика по-прежнему будем считать абсолютно упругими. У\ Рис.9 Функция Гамильтона частицы: H(Pl,py,x,y) = ^-(pl+pl). (1.63) Уравнения Гамильтона совпадают с (1.61) для каждой из координат. Фазовое пространство в данном случае имеет четыре измерения. Энергетическая поверхность определяется уравнением iw+*)-*- (1.64) В двумерном импульсном подпространстве фазового пространства это уравнение окружности радиуса ^2тЕ0 (рис. 10). Ру\ Рис. 10 В четырехмерном фазовом пространстве это аналог цилиндрической поверхности. Поскольку изобразить четырехмерное пространство мы не можем, ограничимся тремя измерениями, добавив к двум «импульсным» координатам одну пространственную (рис. 11).
134 Часть II Рис. 11 Фазовая траектория проходит по энергетической поверхности, но никогда не заполнит ее полностью. Фазовая траектория полностью определяется начальными условиями (значениями рх0, ру0), так что система не сможет «забыть» свои начальные условия. Чтобы данный пример не выглядел неким специальным случаем, рассмотрим еще один: линейный гармонический осциллятор. Для интегрируемых систем характерно, что канонические переменные для описания системы могут быть выбраны таким образом, чтобы исключить из полной энергии системы ее потенциальную составляющую и свести функцию Гамильтона системы и уравнения Гамильтона к виду, подобному (1.60), (1.61). Как известно, в случае гармонического осциллятора функция Гамильтона есть /Wi H(p,x)-Z- + Zffl Рассмотрим преобразование переменных \2Р • п q=\\—sing, \т(0 dx1 (1.65) (1.66) [р = yflmcoP cos Q. Обратное преобразование будет иметь вид 0 = arctg тщ Р р^тщ ( р1 2 2т(0 (1.67)
1. Введение в статистическую физику 135 Чтобы убедиться, что данное преобразование является каноническим, достаточно проверить соотношения {Q,Q}\gp=0, {ЛРЦм=0, Ш,/>}|„ = 1. (1-68) Первые два из соотношений (1.68), очевидно, выполняются, как это следует из определения скобки Пуассона (1.21). Проверим последнее из соотношений (1.68): dq dp dq dp mCO p 1 f m(0q | m(Oq= (1.69) m2a/q2 p mo) m2(&q2 P2 P2 _ P2 , rnWq2 _L p2 + m 26?q2 p2 + m2ofq2 Функция Гамильтона, выраженная через новые переменные, зависит только от нового импульса: H(P,Q) = 0)P. (1.70) Таким образом, зависимость от координат, характерная для потенциальной энергии исчезает из функции Гамильтона. Уравнения движения в новых переменных принимают вид Q = u), P = 0. (1.71) Решение уравнений: Q = ax + Q0, Р = Р0, (1.72) PQi Q0 = const. Обобщенный импульс вновь является сохраняющейся величиной. Физические переменные (1.66) являются периодическими функциями новой координаты Q, которая приобретает смысл угловой переменной. Можно считать, что координата Q принимает значения на отрезке [0, 2яг]. В случае одномерного гармонического осциллятора энергетическая поверхность совпадает с его фазовой траекторией (рис. 12). В случае двумерного гармонического осциллятора функция Гамильтона в новых переменных, очевидно, будет иметь вид H(PxiPyiX, ¥) = щРх + а>2Ру. (1.73)
136 Часть II р Q Рис. 12 Уравнение энергетической поверхности (0[РхЛ-(й1Ру =Е0 — это уравнение прямой в двумерном импульсном подпространстве фазового пространства; в четырехмерном фазовом пространстве — это аналог плоскости. Фазовым траекториям соответствуют линии на этой гиперплоскости, отвечающие сохраняющимся значениям Рх и Р . Фазовая траектория не покрывает всю энергетическую поверхность. В XIX веке ученые занимались поиском и исследованием интегрируемых систем, однако в конце XIX века Пуанкаре доказал теорему, в соответствии с которой большинство систем классической механики, начиная с системы трех тел, взаимодействующих друг с другом посредством гравитации, не являются интегрируемыми системами. Для таких систем было невозможно найти каноническое преобразование, которое бы приводило уравнения к виду, удобному для интегрирования. 1.8. Эргодическая гипотеза и эргодические системы. Практически в то же время, когда была доказана теорема Пуанкаре, Больцман и Максвелл предложили гипотезу, согласно которой предоставленная самой себе изолированная система рано или поздно пройдет через любую точку энергетической поверхности. Это предположение известно как эргодическая гипотеза. Существует математически более строгая формулировка этого предположения, которая утверждает, что предоставленная самой себе изолированная система рано или поздно побывает сколь угодно близко к любой точке энергетической поверхности (квазиэргодическая гипотеза). Системы, для которых эргодическая гипотеза справедлива, мы будем называть эргодическими системами. Вспомним, как мы пришли к понятию статистического ансамбля. Мы рассматривали множество систем, находящихся в состояниях А{, А2, ..., соответствующим тем микросостояниям, которые определенная система проходит в последовательные моменты времени. Такой ансамбль совпадает с микроканоническим (последний мы определили как множество систем
1. Введение в статистическую физику 137 с постоянной энергией, объемом и числом частиц) только в случае, если фазовая траектория покроет всю энергетическую поверхность. Поэтому иногда говорят, что эргодическая гипотеза эквивалентна утверждению, что предоставленная самой себе изолированная система описывается микроканоническим распределением Гиббса. Еще одна эквивалентная формулировка эргодической гипотезы — это утверждение, что средние по времени физических величин, взятые вдоль фазовой траектории, равны средним по микроканоническому ансамблю. Простейшим (хотя и несколько искусственным) примером эргодической системы может служить частица, движение которой в фазовом пространстве описывается уравнениями ? = 1, р = й) (1.74) с периодическими граничными условиями. Решение уравнений (1.74): # = ' + ?о> Р = «Х + р0 (modi). (1.75) Периодичность условий подразумевает, что частица движется по единичному квадрату (рис. 13). Чо q Рис. 13 Достигнув одной из сторон квадрата, частица «перескакивает» на его противоположную сторону. Можно представить, что противоположные стороны квадрата склеены, т. е. противоположные точки отождествлены. При этом, когда траектория в фазовом пространстве достигает какой-либо из сторон квадрата, мы должны вычесть из соответствующей координаты (q или р) единицу (сторона квадрата равна единице), поэтому координата и импульс частицы могут принимать лишь значения, равные остатку от целочисленного деления величин (1.75) на единицу (mod 1). Из (1.75) мы можем найти уравнение фазовой траектории Р = о>{я-Яо) + Ро- (1-76)
138 Часть II ^ т Если (О — рациональное число, то траектория является периодиче- п ской, она замыкается по прошествии периода времени Т = п. В этом случае рассматриваемая система не является эргодической. Если же CD — иррациональное число, траектория никогда не станет замкнутой, с течением времени она заполнит всю площадь квадрата, а рассматриваемая система удовлетворяет квазиэргодической гипотезе. В данном случае элемент фазового объема AqAp сохраняет свою форму с течением времени (это следует из уравнений движения). Возможны и другие типы поведения эргодических систем, когда фазовая жидкость растекается по всему фазовому пространству, при этом элементарный объем сильно деформируется, меняет свою форму. К такого типа системам относятся так называемые системы с перемешиванием. Поведение таких систем становится непредсказуемым. В теории эргодических систем остается еще много неясного, и остается главный вопрос: можно ли, изучая поведение таких систем, понять процесс приближения к равновесному состоянию и то, чем объясняется его необратимость. В процессе изучения эргодических систем выявились ее более сложные особенности их поведения, когда в системе, казалось бы, приближающейся к термодинамическому равновесию, поведение которой можно характеризовать как случайное и беспорядочное, спонтанно возникают вполне определенные устойчивые типы движения, можно сказать, что хаотическое поведение системы сменяется упорядоченным. Здесь мы соприкасаемся с проблемами, которые находятся на переднем крае научных исследований. 1.9. Статистическое описание квантовых систем. Перейдем теперь к вопросу о статистическом описании систем, подчиняющихся законам квантовой механики. Мы имеем в виду системы, состоящие из многих частиц, т. е. макроскопические системы. Особенностью таких систем является то, что их уровни энергии расположены очень близко друг к другу. Это объясняется тем, что с увеличением числа частиц чрезвычайно увеличивается число способов, которыми эта энергия может быть распределена по различным частицам. В качестве примера можно рассмотреть газ из N частиц в ящике, настолько разряженный, что частицы практически не взаимодействуют друг с другом. Можно считать, что энергия системы складывается из энергий отдельных частиц, энергия каждой частицы пробегает бесконечный ряд дискретных значений. Следовательно, во всяком конечном участке спектра (за исключением его начального участка) присутствует очень большое число уровней, которые будут отвечать различным комбинациям энергий отдельных частиц. Число уровней энергии в конечном участке спектра растет по экспоненциальному закону с увеличением числа частиц.
1. Введение в статистическую физику 139 Из-за того, что уровни энергии макроскопического тела расположены очень густо, оно не может находиться в строго стационарном состоянии. Одна из причин заключается в том, что в природе не существует полностью замкнутых систем. Взаимодействие системы с окружающей средой может быть пренебрежимо малым по сравнению с внутренней энергией системы, но оставаться большим по сравнению с расстоянием между уровнями. Другая причина связана с тем обстоятельством, что измерение любой величины в квантовой механике предполагает процесс взаимодействия с измерительным прибором, в результате которого энергия системы, вообще говоря, изменяется на величину АЕ. Чем точнее мы хотим измерить энергию системы (с точностью АЕ), тем большее время At должен занимать процесс измерения в соответствии с соотношением AE-At~h. Для того, чтобы состояние можно было считать стационарным, неопределенность в значении энергии АЕ должна быть меньше расстояний до соседних уровней. Соответственно, нам потребовалось бы чрезвычайно большое время At. С практической точки зрения невозможно получить полный набор данных о системе, необходимый для точного построения ее волновой функции. В случае, когда волновая функция системы нам неизвестна, обращаются к описанию квантовой системы с помощью матрицы плотности, которая играет в квантовой статистике ту же роль, что функция распределения — в классической. Начнем со случая, когда система может быть описана некоторой волновой функцией Ч*. Эту волновую функцию мы можем разложить по полному ортонормированному набору {у/п}: lP = Z^„. (1.77) л Нас интересует вычисление средних значений физических величин. Как известно, среднее значение физической величины/в состоянии Ч* дается формулой ТП/1 ТП,П ТП/1 где fmn=\¥mf¥ndq, pnm=cmcn. (1.79) Если \у/п} — собственные функции оператора /, матрица fmn становится диагональной: Л.=/А.. (1-80)
140 Часть II (/>=Zv./^=Z/.kl2=Z/^, (1.81) m/i n n где wn =\cn\ — вероятность обнаружить значение fn физической величины/ Напомним, что в квантовой механике волновая функция Ч* соответствует статистическому ансамблю определенным образом приготовленных квантовых систем. Действительно, вследствие того, что мы не можем пренебречь взаимодействием квантового объекта с макроскопическим прибором, прибор вместе с квантовым объектом формирует целостную систему. Поэтому для проведения эксперимента необходимо, как говорят, «приготовить» микрообъект в соответствующей макрообстановке. Так как некоторые физические величины нельзя измерить одновременно, для исчерпывающего исследования квантовой системы процесс приготовления и последующего измерения ее характеристик должен многократно повторяться. Это подразумевает приготовление копий системы в полностью идентичной макрообстановке. Множество копий можно рассматривать как статистический ансамбль, все элементы которого описываются одной и той же волновой функцией Ч/. Говорят, что каждый элемент ансамбля соответствует чистому состоянию, а сам ансамбль называется чистым ансамблем. Рассмотрим теперь различные ансамбли А^, состоящие их систем, находящихся в различных квантовых состояниях {Ч*А}. Выбрав некоторое количество систем из каждого ансамбля, можно организовать новый, смешанный ансамбль, статистические свойства которого будут определяться тем, какие ансамбли смешиваются, и какова доля систем ансамбля А" ' с волновой функцией Ч?к в смешанном ансамбле. Ясно, что смешанный ансамбль уже нельзя характеризовать определенной волновой функцией, а только матрицей плотности. Пусть рк — доля систем ансамбля А ' в смешанном ансамбле. При этом должно выполняться 0<А<1, £Л=1. (1.82) к Тогда вероятность обнаружить значение fn физической величины/в смешанном ансамбле определяется формулой 4=I/rf. (1-83) it w\' — вероятность обнаружить значение /л в ансамбле . В случае смешанного ансамбля формула (1.78) для среднего значения должна быть
1. Введение в статистическую физику 141 обобщена следующим образом: </>=Елj*;m^= iл4^jr:/r.*=Zp«./-. (1.84) к kjn/i m*n /»»=Хлс-с-»- с1-85) Покажем, что совокупность величин р^ представляет собой матрицу некоего оператора, называемого статистическим оператором. Для этого удобно использовать обозначения Дирака, в которых, например, среднее значение (1.78) запишется как (f) = (V\f\4). (1.86) Для удобства дальнейших преобразований введем оператор A=Ik.>tol> о-87) л где \l/fn) — векторы из полного ортонормированного набора, и продемонстрируем, что он является тождественным (единичным) оператором. Для этого подействуем оператором (1.87) на произвольный вектор |ф): А|ф>=Ек.)(^|ф)=Е(^|ф>к.)=1в.к.>=|ф>; а-88) л л л *„=(^1ф> О-89) — коэффициенты разложения вектора | Ф) по базисному набору. Поскольку оператор (1.87) единичный, его можно вставлять в любое место в формулах. Тогда (1.86) можно переписать следующим образом: (f)={v\ftv)=I,{4\rm){rJf\r.)(rM= т,п = Ъ(г.Шч\¥я)(¥т\}\¥.)= (1-90) /я, л =ZW£k«)KI/k)=ZA»x,- т,п т,п Здесь введен статистический оператор Р = \Щ^\ (1.91) и статистическая матрица Р~=(¥.\!>\¥я) = (¥.Шч\¥я). (1.92) Последнее выражение в (1.90) представляет собой сумму диагональных элементов произведения двух матриц р и fmn, т. е. след этого произве-
142 Часть II дения. С другой стороны, вынимая в последней строке в (1.90) полный набор, получим </>=ItolA?k.>=*(>*/)- d-93) л Как показывается в квантовой механике, операция взятия следа не зависит от выбора базисного набора. В этом можно убедиться непосредственно, используя дираковские обозначения и введя другой базисный набор (| <рк)}: Т,(Гп\р\¥п)= Е(^-1й.>(л.1^1й>(йкя>= л п,т,к n,mjc m,k mji m Диагональные элементы статистической матрицы, однако, зависят и от выбора базисного набора, и от состояния |Ч*). Из определений (1.92), (1.79) видно, что диагональные элементы представляют собой вероятности обнаружить значение fn физической величины / в состоянии | Ч*) в базисном наборе, состоящем из собственных векторов оператора /, т. е. в таком, в котором оператор / является диагональным. Сумма вероятностей должна быть равна единице, и, действительно, если вектор состояния 1Ч*) нормирован на единицу, мы имеем М = Е(^И^) = Е(^|Ч'}(Ч'к„) = Е(Ч'к„)(^|Ч') = (Ч'|Ч'> = 1. (1-95) л л л Нам остается обобщить полученные формулы на случай смешанных ансамблей. Статистический оператор будет иметь вид /^Ел^ОЫ (i-96) к (/> = ZA(^|/|lP*)=ZA(^k)(^|/K><^|^) = к к,т,п = Z рМч№к\¥т)(¥т\}\¥.)= (1-97) к,т,п = Y,{yfM\y/m){¥m\f\¥n) = Y.Pnn,fmn=^(pf), Pm = {¥n\{Y.P^k)^Лwm) = Y.PЛУfn\^k)^^¥m) = YJP^cnk. (1.98) V к J к к
1. Введение в статистическую физику 143 Если мы выбрали базисный набор, состоящий из собственных векторов оператора /, матрица fmn является диагональной (см. (1.80)), так что \J I L^r'nmJmn ^^rnmJn mn £^J пНпп "■•" '"•" " (1 99) п,к п к п где w„ =1^1 , a wn определяется формулой (1.83). След оператора (1.96) равен единице, если состояния |Ч^) нормированы: ^Р = Ъ{¥„\й\¥,) = ЪрМ\^^М = *'" (1.100) =Ел(^к)(^|^)=Ел(^|^)=ЕА=1- А,л к к (Здесь было использовано условие (1.82).) Рассмотрим, как с помощью статистического оператора найти распределение вероятностей для координат. В соответствии со сказанным выше, мы должны рассмотреть матричные элементы статистического оператора, используя базисный набор из собственных векторов оператора координаты, диагональные элементы дают искомые вероятности. Ня)=Шя)- 0-101) В случае чистого состояния (1.91) получаем W(q) = (q\4){4\q) = \V(q)\\ (1.102) поскольку волновая функция в координатном представлении Ч*(#) есть, по определению, коэффициент разложения вектора состояния 1Ч*) по полному набору собственных векторов оператора координаты: \4>) = j\q)(q\V)dq = j(q\4')\q)dq = J4'(q)\q)dq. (1.103) (Здесь мы учли то обстоятельство, что оператор координаты имеет непрерывный спектр.) trp = j{q\p\q)dq = l(q\4')(4>\q)dq = j[V(q)\2dq = l. (1.104) Таким образом, для чистых состояний мы получаем обычное квантовоме- ханическое распределение вероятностей координат частиц. В случае смешанного ансамбля распределение вероятностей будет определяться той же формулой (1.101), но уже не будет сводиться к выражению (1.102).
144 Часть II Как мы видим, статистическое описание квантовых систем включает в себя, с одной стороны, вероятностный характер самой квантовомехани- ческого описания, даже наиболее полного описания с помощью волновой функции, с другой стороны, присутствие вероятностей, связанных с неполнотой нашего знания о рассматриваемом объекте (отсутствие точного знания его волновой функции). В случае чистого состояния имеет место только вероятностньш характер квантовой теории, и описание с помощью статистической матрицы не дает ничего нового. В случае смешанного состояния присутствуют оба источника вероятностного описания. Формулу (1.101) можно представить в ином виде, если использовать полные наборы собственных векторов какого-либо оператора, например, оператора Гамильтона: ^(^) = <^|>&к> = Х<^1^т><^т|р|^л><^^^> = Х^т(^)^тЛ^Л^)' (1Л05) Мч)=(я\к) (1-106) — собственная функция указанного оператора в координатном представлении. Выпишем также распределение вероятностей для импульса: (1.107) i/fp{q) = (q\p) — собственная функция оператора импульса в координатном представлении, p(q, q') — статистическая матрица в координатном представлении. 1.10. Уравнение Лиувилля в квантовой статистике. Как известно из квантовой механики, вектор состояния в представлении Шредингера удовлетворяет временному уравнению Шредингера: m±\4(t))=H\v{t)). (1.Ю8) Его формальное решение для случая, когда оператор Гамильтона не зависит от времени, можно записать, используя оператор развития во времени U(t, t0): \4>(t)) = U(t,t0p(t0)) = exp(-±H(t-t0))\V(t0)). (1.109)
1. Введение в статистическую физику 145 Положим в дальнейшем /0=0. Исходя из определения (1.96), мы можем получить временную зависимость статистического оператора: = ехр(~Я/)/&(0)ехр^Я/). (1.110) Дифференцируя (1.110) по времени, получаем уравнение m^p{t)=Hp{t)-p{t)H. (l.iii) at В правой части (1.111) стоит коммутатор оператора Гамильтона и статистического оператора: т^=-[р,н\ (1.П2) Уравнение (1.112) совпадает по форме с уравнением Лиувилля (1.43), в котором функция распределения заменена статистическим оператором, а классические скобки Пуассона — деленным на /А коммутатором соответствующих операторов. Напомним, что, согласно принципу соответствия, соотношения между классическими физическими величинами заменяются в квантовой механике аналогичными соотношениями между операторами. При этом, в частности, должно соблюдаться правило, установленное еще Дираком, по которому классические скобки Пуассона должны заменяться деленными на /А коммутаторами соответствующих операторов: {А,В}^±[Щ (1.113) Уравнение (1.112) часто называют квантовым уравнением Лиувилля, или уравнением фон Неймана. Статистический оператор не зависит от времени в случае, если он коммутирует с оператором Гамильтона. Вообще, в квантовой механике операторы в представлении Гейзенберга удовлетворяют уравнениям dA /Й^ = [ЯЯ], (1.114) из которых вытекает, что оператор остается неизменным во времени, если он коммутирует с оператором Гамильтона. Таким образом, уравнение (1.112) выражает квантовый аналог теоремы Лиувилля: в классической физике следствие этой теоремы состоит в утверждении, что функция
146 Часть II распределения является интегралом движения, в квантовом случае оказывается возможным сформулировать условия, при которых статистический оператор сохраняется во времени. Заметим, что коммутатор в (1.112) имеет знак, противоположный знаку в уравнении Гейзенберга (1.114). Аналогично, знак перед скобкой Пуассона в классическом уравнении Лиувил- ля(1.43) противоположен знаку в уравнениях Гамильтона (1.22) (напомним, что уравнения Гейзенберга являются квантовым аналогом уравнений Гамильтона). 1.11. Статистический вес и энтропия. Статистическим весом Г называется число способов, которым можно реализовать заданное макроскопическое состояние системы. Если мы рассматриваем состояние квантовой системы и характеризуем его определенным значением энергии, статистический вес — это кратность вырождения данного значения энергии. Энтропию можно определить как логарифм статистического веса макросостояния системы: S = k\nT. (1.115) Связь между энтропией и статистическим весом (статистическое определение энтропии) была установлена Больцманом, к— универсальная постоянная, носящая имя Больцмана. Рассмотрим макроскопическую систему с позиций квантовой статистики. Имея в виду, что уровни энергии такой системы расположены очень густо, можно ввести число квантовых состояний dV, приходящихся на определенный бесконечно малый интервал значений энергии системы dE. Рассмотрим распределение вероятностей для различных значений энергии w(E) (его можно получить, скажем, с помощью статистического оператора). Определим вероятность того, что система имеет энергию в интервале (Е9 E + dE). Эту вероятность обозначим W(E)dE . Для этого мы должны умножить вероятность определенного значения энергии w(E) на число квантовых состояний с энергиями, лежащими в этом интервале, т. е. dT. Таким образом, W(E)dE = w(E)dT. (1.116) Обозначим через Г(£) число квантовых состояний с энергиями, меньшими или равными Е. Тогда dr(E) dT = K—^dE; (1.117) dE W(E) = w(E)^f-. (1.118)
1. Введение в статистическую физику 147 Функция W(E) должна удовлетворять условию нормировки: jW(E)dE = \. (1.119) Если рассматриваемая система находится в равновесии, функция W(E) должна иметь резкий максимум при Е = (Е}. Она отличны от нуля только вблизи этой точки. Пусть АЕ — ширина кривой W = W(E), которая определяется как ширина прямоугольника, высота которого равна значению функции W(E) в точке максимума, а площадь равна единице (рис. 14): W((E))AE = \. (1.120) Из (1.118) следует w((E))AT = \, где было введено обозначение dr((E)) дг = —vw/дд dE (1.121) (1.122) Можно сказать, что АГ — это число квантовых состояний, соответствующих интервалу значений энергии АЕ, это характеристика того, сколько микросостояний системы соответствуют макросостояние со средней энергией (е} , при этом интервал энергий АЕ по порядку величины равен средней флуктуации энергии. В рассматриваемом случае энтропия S = k\nAT. (1.123)
148 Часть II Из квантовой механики известно, что в квазиклассическом случае имеет место следующее соотношение между объемом какой-либо области фазового пространства и числом квантовых состояний, приходящихся на этот объем: ДГ = -^-, (1.124) (2жЛ)' s— число степеней свободы. Иными словами, на каждое квантовое состояние в фазовом пространстве приходится ячейка с объемом (inti)*. Таким образом, в квазиклассическом случае энтропию можно определить как Aft S = k\n . (1.125) (27th)s Число состояний, как и его логарифм, является безразмерной величиной. В классической статистике энтропия определяется с точностью до аддитивной постоянной, зависящей от выбора системы единиц. Например, S = S0+JfclnAft, S0=-sk]n(2xh). (1.126) При этом однозначно определенной величиной является лишь изменение энтропии AS в том или ином процессе, т. е. разность значений энтропии в конечном и начальном состояниях. Представление о числе квантовых состояний, которое появилось только с развитием квантовой статистики, позволяет дать более точное определение энтропии. Поскольку число состояний не может быть меньше единицы, энтропия не может быть отрицательной. Согласно (1.121), ЛГ=~77^' (1Л27) S = -k]nw((E)). (1.128) Напомним, что в классической статистике логарифм функции распределения, являясь аддитивной величиной, выражается через аддитивные интегралы движения, в частности, энергию, причем выражается линейно, т.е. можно записать как Ыр(Е) = а+0Е. (1.129) Исходя из принципа соответствия, мы предполагаем, что аналогичное соотношение должно иметь место и в квантовой статистике, \nw(E)=a+bE. (1.130)
1. Введение в статистическую физику 149 В частности, ]nw((E)) = a + b(E). (1.131) С другой стороны, усредняя обе части (1.130), получаем (lnw(E)) = a + b(E)9 (1.132) откуда следует, что ]nw({E)) = (]nw(E)). (1.133) Поэтому (1.128) можно переписать в виде S = -k(\nw(E)). (1.134) Если энергия имеет дискретный спектр, так что wn — вероятность обнаружить п-е значение энергии, S = -k^w„]nwn. (1.135) Л Последнее выражение можно записать в более общей форме, используя статистический оператор: S = -kti(p]np). (1.136) По определению, функция f\A) от оператора А представляет собой оператор, собственные векторы которого совпадают с собственными векторами оператора А , а собственные значения равны f(An), где 4, — собственные значения оператора А . Далее, из квантового варианта теоремы Лиувилля следует, что статистический оператор не зависит от времени в случае, когда он коммутирует с оператором Гамильтона. Тогда статистический оператор и оператор Гамильтона имеют общий набор собственных векторов. В этом наборе диагональные элементы статистического оператора представляют собой вероятности wn обнаружить собственные значения энергии Еп, в то же время диагональные элементы дают собственные значения самого статистического оператора. Используя этот набор, преобразуем: S = -kti(p\np) = -kY,(¥n\P^P\¥n) = п = -^(y/n\p\^m){wJ^M^) = -kl,w^K(wMmWM= (1-137) т,п т,п п п Таким образом, мы возвращаемся к формуле (1.134).
150 Часть И В классической статистике соотношение (1.121) следует представить в виде р((Е))АП = \; (1.138) тогда S = S0+k]nA£l = S0-k)np((E)) = S0-k()np(q9p)) = = S0-klp{q9p)\np{q,p)dqdp= (1.139) = -sk]n(27rh)-k\p(q, p)]np(q, p)dqdp. Если систему можно разделить на некоторое число подсистем, каждая из подсистем может находиться в одном из квантовых состояний, число которых (статистический вес) Г,, для подсистемы с номером /. Тогда для системы в целом Г = ПГ,; (1.140) 5=шПг,=Х*1пГ(=Е5(- (1.141) Мы продемонстрировали, что энтропия является аддитивной величиной. Важнейшим свойством энтропии является то, что энтропия изолированной системы не убывает, достигая максимума в равновесии. Этот вывод в значительной степени основан на представлении, что равновесное состояние является гораздо более вероятным по сравнению с неравновесными. Как мы знаем, это представление, в свою очередь, опирается на гипотезу, в соответствии с которой изолированную систему, макросостояние которой фиксировано только внешними параметрами, можно обнаружить с равной вероятностью в любом из доступных ей микросостояний, т. е. такая система должна описываться микроканоническим распределением. Учитывая, что макроскопическое тело не может находиться в строго стационарном состоянии, микроканоническое распределение в квантовой статистике следует записать следующим образом: aw=CS(E-E0)dr, (1.142) где, как и выше, dT — число квантовых состояний с энергией, лежащей в интервале (Е, E + dE) . В состоянии равновесия наиболее вероятным значением энергии системы является ее среднее значение (Е). Энтропия в состоянии равновесия может рассматриваться как функция только от энергии. Тогда dT = ехр (1.143)
1. Введение в статистическую физику 151 w=CS(E-(E))exp 4(E)) (1.144) Энтропия как функция энергии должна иметь при Е = (Е) максимальное значение. Это обосновывает вывод о том, что энтропия замкнутой системы в состоянии полного статистического равновесия достигает наибольшего возможного значения. Разделив интервал энергий dE на число квантовых состояний dV в этом интервале, мы получим среднее расстояние между соседними уровнями в данном участке спектра (вблизи значения Е): S(eY D(E) = ^ = exp dE. (1.145) Энтропия как функция энергии определяет густоту энергетических уровней макроскопического тела. Учитывая аддитивность энтропии, приходим к выводу, что среднее расстояние между уровнями экспоненциально убывает с увеличением размеров тела (числа частиц в системе). 1.12. Закон возрастания энтропии. Обсудим подробнее закон возрастания энтропии (сформулирован Клаузиусом (1865 год), статистическое обоснование было предложено Больцманом в 1870-х годах). Выше на примере газа, состоящего из N частиц, можно было видеть, что процессы перехода из неравновесного состояния в равновесное имеют подавляющую вероятность, связанную с тем, что число микросостояний, соответствующих равновесному состоянию, несопоставимо выше, чем соответствующих неравновесному состоянию. Если система проходит последовательный ряд все более вероятных состояний, ее энтропия монотонно возрастает. В природе практически не наблюдается процессов, сопровождающихся уменьшением энтропии (за исключением чрезвычайно малого уменьшения энтропии, связанного с флуктуациями физических величин). Закон возрастания энтропии, известный также как второе начало термодинамики, может быть сформулирован следующим образом. Если в некоторый момент времени энтропия замкнутой системы отлична от максимальной, то в последующие моменты времени энтропия не убывает, она увеличивается или остается постоянной. Однако второй закон термодинамики вступает в противоречие с тем, что законы физики инвариантны относительно изменения направления времени. Из инвариантности законов физики вытекает, что если возможен какой-либо процесс, сопровождающийся возрастанием энтропии замкнутой системы, должен быть возможен и обратный процесс, при котором энтропия системы убывает.
152 Часть II Обратимся к примеру необратимого расширения газа. Пусть в начальный момент времени t0 газ сосредоточен в малой части сосуда (скажем, удерживается там перегородкой, которая удаляется в момент /0). Через время А/, превышающее время релаксации, газ равномерно заполнит весь сосуд, достигнув равновесного состояния. В момент tx = t0 + At изменяем направление времени (при этом импульсы всех частиц должны быть изменены на противоположно направленные). В соответствии с законами механики в момент t2=t\+ At газ Должен сосредоточиться в малой части сосуда, при этом его энтропия уменьшится. Это происходит за счет того, что значения импульсов всех частиц в момент обращения времени оказываются специальным образом подобранными, имеет место корреляция. Рассматривая состояние в момент t2 как начальное состояние для последующей динамической эволюции при обратном течении хода времени, мы придем к выводу, что в последующие моменты времени газ вновь начнет расширение, проходя через ряд все более вероятных состояний, и это будет сопровождаться увеличением энтропии. Поскольку мы говорим об эволюции системы в обратном времени, получается, что, если мы начинаем с состояния с малым значением энтропии, она должна возрастать как по направлению в прошлое, так и по направлению в будущее. Состояние, которое мы выбрали в качестве начального, соответствовало бы локальному минимуму энтропии, что противоречит нашим представлениям о ее монотонном возрастании. Это противоречие известно как парадокс Лошмидта (по имени австрийского физика Йозефа Лошмидта (1821-1895)). Сказанное можно проиллюстрировать результатами численного эксперимента, на который ссылается Пригожий [8]. В эксперименте столкновения частиц моделировалось соударениями двумерных твердых дисков и вычислялась так называемая Я-функция Больцмана (рис. 15). Занимаясь разработкой кинетической теории газов, Больцман ввел Я-функцию как характеристику замкнутой системы и показал, что она не может возрастать с течением времени. Впоследствии выяснилось, что взятая с обратным знаком Я-функция Больцмана должна быть отождествлена с энтропией. Таким образом, закон возрастания энтропии не удается вывести на основании классической механики. Основное уравнение квантовой механики — уравнение Шредингера — также инвариантно относительно изменения направления времени при условии замены волновой функции комплексно- сопряженной. Однако, как указывал И. фон Нейман в фундаментальном труде «Математические основы квантовой механиюн» [9], изменение во времени состояния квантовой системы может происходить двумя путями: 1. (Процесс 7) Непрерывное изменение состояния с течением времени в соответствии с волновым уравнением (временным уравнением Шредингера (1.108)).
1. Введение в статистическую физику 153 Я эооо° о о о о ооо о о оо °ч >о о о о о • • • • • • • • • м • • • • •• •* • «• • • • •• 1 • ••• 1 • _• <Ъо 1 ••• ■ ••• х8 1 • • *°«Ъ . .«•• 1 оо •• •м • • • ••• • • •• • 9°о°<Ао мм— • • • • мм • ••• • ••• • S • •••• % N, равновесие l l l l l l l l l l l l Время Рис. 15 2. (Процесс II) Изменение состояния, вызванное производимым над системой измерением, в результате которого система может быть обнаружена с определенной вероятностью в одном из собственных состояний измеряемой величины (редукция волновой функции). Гладкое детерминистическое изменение волновой функции в соответствии с временным уравнением Шредингера сменяется скачкообразным изменением волновой функции во время проведения измерения над системой (рис. 16). состояние наблюдение наблюдение наблюдение Р Q R обычное время t Рис. 16 Фон Нейман показал, что процесс редукции волновой функции в результате проведения наблюдения над квантовой системой с помощью макроскопического измерительного прибора является необратимым и сопро-
154 Часть II вождается возрастанием энтропии. Поэтому в формализме квантовой механики присутствует физическая неэквивалентность обоих направлений времени. Однако квантовая теория измерений до сих пор не разработана, отсутствует детальное понимание того, что происходит в процессе редукции волновой функции. В своей статье «Сингулярности и асимметрия во времени» [10] Р. Пен- роуз перечисляет физические процессы, в которых содержатся указания на нарушение временной симметрии. Помимо упомянутого выше процесса редукции волновой функции, это распад А*0-мезона, за который ответственны слабые взаимодействия, ненаблюдаемость опережающего излучения в электродинамике (в отличие от запаздывающего) и другие. Направление возрастания энтропии иногда пытаются связать с направлением космологического расширения Вселенной. В настоящее время вопрос о физических основаниях второго закона термодинамики остается открытым. Несмотря на противоречия, связанные со вторым законом термодинамики, следует подчеркнуть его универсальность. В свое время справедливость второго закона термодинамики была поставлена под угрозу предположением о существовании черных дыр. Как известно, черная дыра — это область пространства-времени, в которой оно (пространство-время) искривлено настольно сильно, что ничто, даже свет, не может вырваться наружу из этой области. Поверхность, окружающая эту область пространства-времени, называется горизонтом событий черной дыры. Считается, что черные дыры образуются в результате гравитационного коллапса звезд очень большой массы, в результате чего звезда сжимается практически в точку. Существует мнение, что предсказание черных дыр — это дефект общей теории относительности, однако многочисленные наблюдения свидетельствуют в пользу их существования, и мы в действительности не знаем, какие силы могли бы остановить гравитационный коллапс тела достаточно большой массы. Поскольку черная дыра засасывает вещество и излучение, обладающие энтропией, второй закон термодинамики будет нарушен, если не приписать и черной дыре определенную энтропию. Но с чем может быть связана энтропия черной дыры? Поскольку речь идет о сжатии тела до чрезвычайно малых размеров, общая теория относительности выходит за рамки своей применимости, и необходимо привлекать квантовые представления о пространстве и времени. Черная дыра, как и «обычные» физические системы, участвует в установлении термодинамического равновесия, излучая частицы (излучение Хокинга). Процесс излучения является квантовым, а для детальных расчетов использовались достаточно сложные методы квантовой теории поля на фоне искривленного пространства-времени. Тем не менее физическую картину можно пояснить, не прибегая к математике.
2. Введение в термодинамику 155 Согласно квантовой теории, вакуум не является пустотой, но заполнен парами частица-античастица, которые рождаются из вакуума и тут же исчезают, аннигилируют спустя очень малое время. Если это происходит в окрестности черной дыры, в области сильного гравитационного поля, одна из пары частица-античастица может быть поглощена черной дырой, но имеется отличная от нуля, хотя и очень маленькая вероятность того, что вторая частица улетит на бесконечность, преодолев потенциальный барьер, созданный гравитационным полем черной дыры. Этот поток частиц будет восприниматься удаленным наблюдателем как излучение черной дыры. Поскольку черная дыра излучает, ей можно приписать определенную температуру и энтропию. В случае невращающейся черной дыры ее энтропия связана с площадью горизонта событий А простой формулой: S = -A. (1.146) В свою очередь, площадь горизонта событий однозначно связана с массой черной дыры. Представление о квантовом излучении черных дыр восстановило справедливость второго начала термодинамики, но поставило новые вопросы. По существу, появился новый «вид» энтропии — гравитационная энтропия. Поскольку, согласно статистическому определению, энтропия — это логарифм числа квантовых состояний, о каких состояниях идет речь? Разные теории, претендующие на объединение теории гравитации с квантовыми принципами, такие как теория суперструн, пытаются предложить свои ответы на этот вопрос. Достаточно очевидно, что проблема поднята на новый уровень. Приближает ли это нас к разрешению загадки неуклонного возрастания энтропии — пока не ясно. 2. Введение в термодинамику 2.1. Тепловое равновесие. Температура. Нашей ближайшей задачей будет установление соотношений между термодинамическими величинами, характеризующими макросостояние. Мы начнем с рассмотрения теплового равновесия между двумя подсистемами, составляющими замкнутую систему. В состоянии равновесия энтропия S всей системы должна иметь наибольшее возможное значение при заданной энергии системы Е. Здесь уместно подчеркнуть, что, говоря об энергии системы здесь и далее мы будем иметь в виду ее внутреннюю энергию. Под внутренней энергией подразумевается разность между полной энергией системы и кинетической энергией ее поступательного движения. Действительно, статистический вес (число доступных состояний), а, следовательно, и энтропия, не должны зависеть от того, совершает ли система как целое поступательное движение или покоится (принцип относительности).
156 Часть И Внутренняя энергия всей системы как величина аддитивная есть сумма энергий подсистем: Е = ЕХ+Е2. (2.1) То же самое можно сказать об энтропии системы, причем энтропия каждой из подсистем есть функция ее внутренней энергии: S(E) = S,{El) + S2{E2) = Sl{Ei) + S2(E-El). (2.2) Поскольку энергия всей системы сохраняется, полная энтропия фактически зависит от энергии только одной из подсистем, и необходимое условие максимума энтропии примет вид : лт? л? л? (2.3) (2.4) Величину, обратную производной энтропии тела по энергии, называют абсолютной температурой тела Т: dS 1 — = -. (2.5) dE T К ' Из (2.4) следует, что в состоянии равновесия температура всех частей системы одинакова. Температура, как и энтропия, имеет смысл только для макроскопических тел, иными словами, имеет статистическое происхождение. Предположим теперь, что подсистемы имеют различные температуры Тх и Т2, т. е. не находятся в состоянии теплового равновесия. С течением времени между подсистемами будет устанавливаться равновесие, что будет сопровождаться выравниваем температур подсистем. Энтропия в ходе этого процесса должна увеличиваться: dS dEx _ dSx dS2 dE2 _ dSx dEx dE2 dEx dEx dSx _ dS2 dEx ~ dE2 ' -^ = 0 dE2 dS^dS^ dS2 _ dSx dE2 dS2 dE2 dt dt dt dEx dt dE2 dt dE, dE2 dt dS_(dSx dS^ dt \dEx dE2) T2>TX => dt dE, _ dt dE, dt ~ 9 f±__Lte>0 U Tjdt 0; ^<0. dt (2.6) = 0; (2.7) (2.8) (2.9)
2. Введение в термодинамику 157 Энергия переходит от тел с более высокой температурой к телам с более низкой температурой. Учитывая определение энтропии (1.115), мы можем заключить, что постоянная Больцмана к выполняет роль коэффициента, переводящего температуру, измеренную в градусах Кельвина, в температуру, измеренную в энергетических единицах. Действительно, (2.5) можно переписать: ^Q = -L. (2.10) dE kT Обе части (2.10) имеют размерность обратной энергии. Численное значение постоянной Больцмана А: = 1,38-10-23^. (2.11) К V Согласно (2.10), температура всегда положительна, поскольку </(1пГ) 1 dT —К- ^ = -—>0. (2.12) dE TdE Статистический вес монотонно возрастает с ростом энергии. Это объясняется тем, что с ростом энергии растет число способов, которыми она может быть распределена в системе между степенями свободы. В квантовой механике с увеличением энергии растет кратность вырождения энергетических уровней. Наоборот, минимальной энергии, как правило, соответствует единственное (основное) состояние системы. 2.2. Энергия как функция энтропии и объема. Дифференциал энергии. Выше мы интересовались исключительно тепловым равновесием между подсистемами, которое устанавливается с помощью теплообмена, считая, что объемы подсистем и другие термодинамические параметры остаются постоянными, и потому рассматривая энтропию как функцию только от энергии. Вообще говоря, энтропия зависит также от других параметров. Энтропия, энергия и объем системы являются аддитивными величинами. Поэтому энтропию можно рассматривать как функцию энергии и объема, S = S(E, V). Через энергию и объем могут быть выражены и другие термодинамические параметры. Это возможно потому, что термодинамические параметры, характеризующие макросостояние тела, связаны функциональной зависимостью, называемой уравнением состояния. Действительно, изменение одного из параметров в каком-либо процессе неизбежно повлечет за собой изменение других. Аналогично, энергию можно рассматривать как функцию энтропии и объема, E = E(S, V). Соответственно, полный дифференциал энергии
158 Часть II будет иметь вид: \bS)r [dv)s (2.13) В термодинамике индекс внизу у частной производной указывает, какой параметр считается постоянным при взятии производной. Используя правила дифференцирования неявных функций, можно ус- (дЕЛ fdS" тановить связь между производными — и \dSJy \с ношение E-E(S9 V) = 0 (2.14) как уравнение, которое задает энтропию как неявную функцию энергии и объема: S = S(E, V). Дифференцируя (2.14) по Е, получим — | . Рассмотрим соот- dEj 1- i' ■•■ откуда Но, согласно (2.5), так что Ниже будет показано, что дЕ\ 1 dSjy (dS_ дЕ ЪЕ)у~Т' —1 =Т dSjy dVJs (2.15) (2.16) (2.17) (2.18) (2.19) (Р— давление). Тогда дифференциал энергии (2.13) может быть представлен в виде dE = TdS-PdV. (2.20) Последнее соотношение известно как основное термодинамическое тождество.
2. Введение в термодинамику 159 2.3. Адиабатический процесс. Среди различных процессов, изучаемых в термодинамике, важная роль отводится адиабатическим процессам. Адиабатическим называется процесс, при котором система является теплоизолированной (т. е. система не обменивается теплом с окружающей средой), а внешние условия, в которых находится система, меняются достаточно медленно. Изменение внешних условий для системы, находящейся в состоянии равновесия, всякий раз вызываем отклонение от равновесия. По прошествии времени релаксации система вновь окажется в состоянии равновесия, соответствующем изменившимся внешним условиям. Однако, если внешние условия будут изменяться настолько медленно, что за время порядка времени релаксации изменение внешних параметров не превысит погрешности их измерения, то внутренние параметры системы в каждый момент будут согласовываться с внешними, т. е. система будет успевать «подстраиваться» под изменяющиеся внешние условия. Мы помним, что равновесное состояние характеризуется равенством внешних и внутренних параметров. Таким образом, можно сказать, что в адиабатическом процессе система проходит через последовательность равновесных состояний. При обратном изменении внешних условий система пройдет через ту же последовательность равновесных состояний в обратном порядке, так что адиабатический процесс является обратимым. Классическим примером адиабатического процесса является расширение газа при медленном выдвижении поршня, причем поршень должен выдвигаться настолько медленно, чтобы занимаемый газом объем (внутренний параметр был в каждый момент времени равен доступному газу объему, определяемому положением поршня (внешнему параметру). Достаточно очевидно, что в обратимом процессе энтропия должна оставаться постоянной, поскольку, если бы она могла увеличиваться, при протекании процесса в обратном порядке, энтропия должна была бы уменьшаться, что противоречит второму началу термодинамики. Напротив, в необратимом процессе энтропия увеличивается, а обратный процесс невозможен. Можно привести и математические аргументы в пользу того, что энтропия должна оставаться постоянной в адиабатическом процессе. Изменяющиеся внешние условия можно описывать с помощью параметров (таких как объем), которые являются заданными функциями времени. Пусть X — такой параметр. Производная энтропии по времени бу- dX „ дет зависеть от скорости изменения этого параметра —. Поскольку эта скорость мала, производную энтропии по времени можно разложить в ряд dX по степеням —: dt ^ + *^ + c(^Y+... (2.21) dt dt {dt)
160 Часть II „ dX л dS _ . При — = 0 должно быть — = и (энтропия замкнутой системы в неизмен- dt dt ных внешних условиях должна оставаться постоянной), так что А = 0. Вто- dX рой член разложения меняет знак при изменении знака —, в то время как производная энтропии по времени должна оставаться положительной. Следовательно, В = 0. Разложение (2.21) начинается с члена второго порядка, т. е. dS _ГdX\ ,_ __ч — = С\ — + ... (2.22) dS dX > 0 при > 0, так что при достаточно медленном изменении пара- dt dt метра энтропия остается постоянной. 2.4. Работа, производимая над системой. Давление. В соответствии с законом сохранения энергии (в термодинамике он известен как первое начало термодинамики), внутренняя энергия системы может изменятся за счет теплообмена с окружающей средой либо за счет совершаемой над системой работы: dE = SQ + SA. (2.23) Здесь учтено, что получаемое телом количество тепла 5Q и совершаемая над телом работа 8А при бесконечно малом изменении его состояния не являются полными дифференциалами, так как не являются функциями состояния системы. Если мы рассматриваем адиабатический процесс, при котором система теплоизолирована, изменение ее внутренней энергии может происходить только за счет совершения над ней работы (или совершения работы самой системой). В термодинамике принято считать положительной работу, которая совершается над системой внешними силами. В соответствии с механическим определением, работа понимается как скалярное произведение силы, ее совершающей, на вызванное этой силой перемещение: SA = (Fdr). (2.24) В термодинамике основной интерес представляет не перемещение тела как целого, а изменение объема тела в результате действия внешних сил, при котором тело остается неподвижным. Силы, вызывающие изменение объема тела, действуют на его поверхности. Сила, действующая на единицу площади поверхности, как известно из механики, называется давлением. На элемент поверхности dS будет действовать сила ¥ = PdS. (2.25)
2. Введение в термодинамику 161 Эта сила вызывает перемещение элемента поверхности, которому соответствует изменение объема тела dV = (dS9 dr). (2.26) Так что работа SA = -PdV. (2.27) Здесь учитывается, что при сжатии тела dV < 0, так что работа оказывается положительной. В случае адиабатического процесса dS = 0, и выражение для дифференциала энергии (2.13) сводится к ■ — ) dV. (2.28) dE = С другой стороны, dE = SA = -PdV. (2.29) Сопоставляя (2.28) и (2.29), приходим к (2.19). 2.5. Термодинамическое определение энтропии. Основное термодинамическое неравенство. Из сопоставления (2.23), (2.27) и (2.20) мы получаем SQ = TdS (2.30) откуда S = ]f. (2.31) Формула (2.31) дает термодинамическое определение энтропии, введенное Клаузиусом в 1865 году. Интеграл берется по процессу, в течении которого система переходит из состояния 1 в состояние 2, получая (или отдавая) малые количества теплоты SQ при соответствующих значениях абсолютной температуры Г. Увеличение энтропии в системе может происходить не только вследствие получения системой количества тепла, но и за счет других происходящих в ней процессов, например, необратимой химической реакции. В таком случае справедливо неравенство dS> — . (2.32) Соотношение (2.20) следует в этом случае заменить основным термодинамическим неравенством dE<TdS-PdV. (2.33)
162 Часть И 2.6. Механическое равновесие. Перейдем теперь к рассмотрению механического равновесия между подсистемами. Механическое равновесие предполагает, что силы, с которыми различные части системы действуют друг на друга, скомпенсированы. Нас интересуют силы, действующие на границе между подсистемами (в тонком поверхностном слое). Сила, действующая на единицу площади поверхности, представляет собой давление. Поэтому уже из общих соображений можно заключить, что давления подсистем, находящихся в состоянии механического равновесия, должны быть равны друг другу. Нарушение механического равновесия сопровождается изменением объемов подсистем, в то время как полный объем замкнутой системы остается постоянным, v = v,+v2. (2.34) В состоянии механического равновесия энтропия имеет максимум по отношению к изменению объемов подсистем: dS dS, х_ dS2 dV2 _ dSx dSn ^ = 0; dVx dVx dV2 dVx dVx dV2 dSx _ dS2 dVx ~ dV2 ' Соотношение (2.20) можно переписать в виде dS = -dE+-dV, Т Т из которого следует dV Р_ (2.35) (2.36) (2.37) (2.38) При условии теплового равновесия (равенства температур подсистем) из (2.36) получается, что при механическом равновесии имеет место также равенство давлений. Давление, как и температура, является величиной положительной. Ес- fdS} ли Р < 0, то —— < 0 , так что было бы допустимо самопроизвольное \oVJe сжатие тел, сопровождаемое возрастанием энтропии. Из этого правила, однако, существуют исключения, соответствующие специфическим физическим условиям. 2.7. Теплоемкость, сжимаемость, коэффициент теплового расширения. Теплоемкостью называется количество тепла, при получении кото-
2. Введение в термодинамику 163 рого температура системы возрастает на 1 градус. Теплоемкость зависит от условий протекания процесс получения тепла. Соответственно, отличают теплоемкость при постоянном объеме с =т\М) J** ' \ьт)г \ьт (2.39) и теплоемкость при постоянном давлении Сжимаемость, или коэффициент объемного сжатия, характеризует свойства вещества изменять свой объем при изменении внешнего давления. В зависимости от условий протекания процесса отличают изотермическую сжимаемость и адиабатическую сжимаемость 1 (bVs \.»: (242) Коэффициент теплового расширения характеризует относительную величину изменения объема тела с увеличением температуры на 1 градус при постоянном давлении: -ЯП 2.8. Термодинамические функции. Энергия и энтропия предоставляют нам примеры термодинамических функций, которые используются для определения соотношений между термодинамическими величинами и, в конечном счете, — для определения термодинамического состояния системы. Можно сказать, что термодинамические функции обладают следующими свойствами: 1) являются функциями состояния, при этом разные термодинамические функции зависят от разных термодинамических параметров; 2) являются аддитивными; 3) при определенных условиях достигают экстремума в состоянии равновесия; 4) зная одну из термодинамических функций, можно восстановить все остальные. Выше уже было показано, что энергия и энтропия являются аддитивными функциями. Энтропия достигает максимума в равновесии. Энергия
164 Часть II же, напротив, достигает минимума. Это следует из основного термодинамического неравенства (2.33). При постоянных энтропии и объеме (S = const, V = const) из (2.33) следует dE<09 (2.44) иными словами, энергия имеет тенденцию уменьшаться, достигая минимума в равновесии (чему соответствует знак равенства в (2.44)). Из (2.20) вытекают соотношения (2.18), (2.19) для производных энергии по энтропии и объему, из (2.37) — соотношения (2.17), (2.38) для производных энтропии по энергии и объему. Таким образом, для энергии и энтропии выполняются первые три свойства, четвертое будет продемонстрировано в дальнейшем. Рассмотрим процесс, который происходит при постоянном объеме (изохорический процесс). Тогда, в соответствии с (2.23), dE = SQ. Если, кроме того, процесс происходит при постоянном давлении (изобарический процесс), SQ = dE = d(E + PV) = dW, (2.45) т. е. количество тепла, полученное системой в таком процессе, можно представить в виде полного дифференциала функции W = E + PV, (2.46) которую называют энтальпией, или тепловой функцией. Дифференциал энтальпии есть dW = dE + PdV + VdP = TdS + VdP. (2.47) Таким образом, энтальпия является функцией энтропии и давления: W = W (S, Р). Имеют место соотношения Ч-Т- ЭР = V. (2.49) s В состоянии равновесия (при равенстве давлений подсистем) аддитивность энтальпии следует из аддитивности энергии и объема. Основное термодинамическое неравенство (2.33) можно переписать как dE + PdV<TdS. (2.50) При постоянных энтропии и давлении (S = const, Р = const) получаем: dW = d(E + PV)<0. (2.51)
2. Введение в термодинамику 165 Энтальпия имеет тенденцию уменьшаться, достигая минимума в равновесии (чему соответствует знак равенства в (2.51)). Если тело теплоизолировано, SQ = 0, из (2.45) следует, что в процессах, протекающих при постоянном давлении, энтальпия сохраняется. Используя выражение для дифференциала энтальпии (2.47), можно получить следующее выражение для теплоемкости при постоянном давлении: Г; Можно провести аналогию между свойствами энергии при постоянном объеме и свойствами энтальпии при постоянном давлении. Рассмотрим процесс, который происходит при постоянной температуре (изотермический процесс). Работу, произведенную над системой, в этом случае можно представить в виде полного дифференциала SA = dE-SQ = dE-TdS = d(E-TS) = dF. (2.53) Функция F = E-TS (2.54) называется свободной энергией. Изменение свободной энергии равно работе, произведенной над системой в изотермическом процессе, или работе (с противоположным знаком), которую в таком же процессе может произвести сама система. Иными словами, изменение свободной энергии равно изменению той части внутренней энергии (за вычетом количества тепла), которую система может потратить на совершение работы. Это объясняет название «свободная энергия». Дифференциал свободной энергии dF = dE- TdS - SdT = -SdT - PdV. (2.55) Свободная энергия является функцией температуры и объема: F = F(T, V). Далее, dF_ дТ fdF_ = -S9 (2.56) V Из (2.54), (2.56) следует = -Р. (2.57) №} „г( Э F Е = Р + ТЗ-Р-Т\-]гГуш\. (2.58)
166 Часть II В состоянии равновесия (при равенстве температур подсистем) аддитивность свободной энергии следует из аддитивности энергии и энтропии. Перепишем основное термодинамическое неравенство (2.33) следующим образом: dE-TdS<-PdV. (2.59) При постоянных температуре и объеме ( Т = const, V = const) получаем: dF = d(E-TS)<0. (2.60) Свободная энергия имеет тенденцию уменьшаться, достигая минимума в равновесии (чему соответствует знак равенства в (2.60)). Можно ввести функцию, которая зависит от температуры и давления: Ф = Ф(Г, Р) . Для получения полного дифференциала этой функции к дифференциалу свободной энергии (2.55) прибавим d (PV): dO =d (F + PV) = dF + PdV + VdP = -SdT + VdP; (2.61) <b = E-TS + PV = F + PV = W-TS. (2.62) Функция Ф называется термодинамическим потенциалом (по другой терминологии — свободной энергией Гиббса). 'ЭФ ., , =S, (2.63) дТ)Р {дт)Р \ътт) (2.65) В состоянии равновесия (при равенстве температур и давлений подсистем) аддитивность термодинамического потенциала Ф следует из аддитивности остальных термодинамических функций и объема. При постоянных температуре и давлении ( Т = const, Р = const) из основного термодинамического неравенства следует dE-TdS + PdV<0, (2.66) dO = d(E-TS + PV)<0. (2.67) Термодинамический потенциал Ф имеет тенденцию уменьшаться, достигая минимума в равновесии (чему соответствует знак равенства в (2.67)). Можно заметить, что термодинамические параметры разбиваются на пары (S и Г, Р и V), в которых один из параметров выражается через производные термодинамических функций по другому параметру. Такие параметры называют термодинамически сопряженными. Равновесное состоя-
2. Введение в термодинамику 167 ние системы обычно описывается парой несопряженных параметров. В самом деле, вспомним, что в равновесном состоянии внутренние параметры равны внешним. Если задан такой внешний параметр, как объем, который, как правило, определяется стенками сосуда, нет смысла задавать внешнее давление, в то время как температура служит дополнительной характеристикой состояния. Подобным образом, если задана энтропия как параметр равновесного состояния, это подразумевает отсутствие теплообмена с окружающей средой, и задание температуры среды никак не повлияет на определение состояния системы, в отличие от давления или объема. Если при описании состояния системы мы хотим перейти к термодинамически сопряженному параметру, мы должны использовать другую термодинамическую функцию от соответствующих параметров. Покажем, что для термодинамических функций выполняется и четвертое из указанных выше свойств, а именно, что, зная явный вид одной из функции и используя соотношения, которые следуют из выражений для дифференциалов функций и связывают термодинамические параметры с производными функций по сопряженному параметру, можно выразить остальные термодинамические функции. Пусть задана энергия как функция энтропии и объема, E(S, V). Мы можем найти свободную энергию по формуле (2.54), но тогда она будет функцией трех переменных — энтропии, объема и температуры: F(S, V, T) = E(S, V)-TS. (2.68) Нам нужно исключить энтропию, и это можно сделать с помощью формулы (2.18). Взяв производную от известной нам функции E(S, V), мы получим уравнение, из которого, в принципе, можно выразить энтропию как функцию температуры и объема, S(T, V). Подстановка этой зависимости в (2.68) решает задачу об определении свободной энергии как функции температуры и объема, F (Т, V). Далее, по формуле (2.62) мы можем получить термодинамический потенциал Ф как функцию температуры, объема и давления: Ф (Т, V9P) = F(T, V) + PV . (2.69) Воспользовавшись формулой (2.57), можно выразить объем как функцию температуры и давления, V(T, Р). Таким образом будет определен термодинамический потенциал Ф (Г, Р). Наконец, из (2.62) можно найти энтальпию W (Г, Р, S) = Ф (Т, Р) + TS (2.70)
168 Часть II как функцию температуры, давления и энтропии, температура исключается с помощью (2.63), в результате чего получаем выражение для энтальпии как функции энтропии и давления, W(S, Р). Разумеется, переходить от одной термодинамической функции к другой можно и в ином порядке. Знание одной функции потенциально содержит информацию о всех остальных функциях, поэтому всех их (а не только потенциал Ф ) часто называют термодинамическими потенциалами. Необходимо отметить, что выше мы рассматривали наиболее простой случай, когда равновесное состояние определяется всего двумя параметрами. Такой случай характерен для газов, для которых давление является изотропной (не зависящей от направления) величиной, а работа выражается формулой (2.27). В твердых телах существуют анизотропные напряжения, которые описываются тензором напряжений aip а вызываемые ими деформации — тензором деформаций etj. Произведенная над телом работа выражается формулой SA = Z*gdetl. (2.71) и Основное термодинамическое тождество в этом случае следует переписать в виде dE = TdS^Y.aijdeij' (2-72) Формулы (2.18), (2.19) следует заменить на II =Т' (2-73) = ац. (2.74) Соответствующим образом изменятся выражения для остальных термодинамических функций и их дифференциалы. Если тело находится во внешнем электрическом или магнитном поле, следует учесть работу, производимую над телом этими полями. Состояние такого тела (диэлектрика или магнетика) определяется напряженностями электрического или магнитного полей. Появляются также новые параметры равновесия — для диэлектрика это вектор электрической поляризации, для магнетика— вектор магнитной поляризации, или намагниченность. Вообще, если существуют другие параметры Zt, определяющие состояние системы, и сопряженные им параметры Л,., которые, как правило, характеризуют внешние условия, то в выражение для дифференциала энергии
2. Введение в термодинамику 169 должен быть добавлен член вида ^A-dAj : dE = TdS-PdV + £Л.<Ц . (2.75) Поскольку переход от энергии к энтальпии связан с преобразованием от переменных S, V к переменным S, Р и не затрагивает переменных A,t, такой же член должен быть добавлен к дифференциалу энтальпии dW = TdS + VdP + ^A.dAt (2.76) у (и, соответственно, других термодинамических функций). В качестве параметра Xt может выступать, в частности, число частиц в подсистеме N, если мы учитываем процессы взаимодействия между подсистемам посредством обмена частицами. Этот случай будет более подробно рассмотрен в дальнейшем. Если значения параметров Л, изменяются на небольшую величину, это вызывает соответствующие небольшие изменения термодинамических функций. Если при этом остаются постоянными остальные термодинамические параметры, изменения термодинамических функций будут равны друг другу, точнее, {dE)sy = {dF)Ty = (d<b)TJ> = (dW)SJ> = £Л,.<Ц . (2.77) l В этом состоит содержание теоремы о малых добавках. 2.9. Соотношения между производными термодинамических величин. При решении различных задач часто бывает важно установить соотношения между различными термодинамическими величинами в широком смысле слова— термодинамическими функциями, параметрами, такими величинами, как теплоемкость, сжимаемость и т. д. Важная роль отводится уравнению состояния, если мы рассматриваем поведение газов, оно связывает давление, объем и температуру. Пусть, например, зная уравнение состояния в форме P(V, T), мы хотим определить зависимость теплоемкости Су от объема. Преобразуем производную теплоемкости по объему: 'дСЛ J±T(^S_) ) =т Э25 = V )т \bV \ЪТ)у)т дУдТ , N (2.78) dVdT2 dT2{dv)T [дТ2 Здесь мы воспользовались формулами (2.39), (2.56), (2.57). Поскольку зависимость давления от температуры и объема известна, из (2.78) можно получить искомую зависимость теплоемкости Сг от объема.
170 Часть II Аналогично, дСр дР £. - ЪР [дТ)р; = т d2S , дРдТ „ э3ф „ ъ2 (эф = -Т = -Т ЪРЪТ2 ЪТ21 ЪР =-т дт2 (2.79) Здесь использовались формулы (2.40), (2.63), (2.64). Так что, если известно уравнение состояние в форме V (Г, Р), из соотношения (2.79) можно восстановить зависимость теплоемкости СР от давления. Используя уравнение состояния, могут быть также вычислены производные энтропии: 'ЪБЛ d2F ГЭРЛ bv ЪУЪТ (2.80) (2.81) (использованы формулы (2.56), (2.57)); ГдБЛ Э2Ф = (дУ^ [др)т дРдТ [дт)Р (использованы формулы (2.63), (2.64)). Один из методов получения соотношений между производными термодинамических величин основывается на использовании выражений для дифференциалов термодинамических функций. Так, из основного термодинамического тождества (2.20) можно получить соотношения ЪЕ_ 1ЭГ. = т ™\-Р=Т 6V ЪТ ЪР .№ -Ж -тЩ\-^\ [ър)т ж {Ър)т dS\ {ът)Р [ът)Р f*n =Cp_P(*v {ът)Р {ът Из выражения для дифференциала энтальпии (2.47) следует = т т rdS" +v т (ЪР) = = т ЪТ ЪР_ ЪУ тгШ—-тШ; Щ=т Э5 , — +V ЪТ тЛ-с^ Р ар ът (2.82) (2.83) (2.84) (2.85) (2.86) (2.87)
2. Введение в термодинамику 171 Другой метод преобразования производных термодинамических величин получил название метод якобианов и часто применяется при необходимости перехода от одних термодинамических параметров к другим. Используя определение якобиана преобразования от переменных х, у к переменным и, v, ди дх dv дх ди ду dv ду д(и, у) можно доказать следующие формулы: Э(у, и) _ Э(ц, у) д(х,у) д(х,у)' д{и,у)(ди" д(х,у) [дх, д(и, у)=Э(ц, v) Э(д, t) д(х,у) d(s, t)d(x,y)' 'ди ду. (2.88) (2.89) (2.90) (2.91) (2.92) (Последним соотношением мы уже пользовались выше — см. (2.16).) Для того чтобы проиллюстрировать метод якобианов, рассмотрим следующую задачу: пусть известна теплоемкость Ср и уравнение состояние в виде зависимости V(T9 Р), необходимо вычислить теплоемкость Су. Для вычисления Су по определению (2.39) удобны переменные Г, V, поэтому речь идет о преобразовании от переменных Т, Ук переменным Т9 Р. с =rffl =T4s,v)=Td(s,v)d(T,p) = v [дт)у d(T,v) д(т,р)д(т,у) = т ds_ дт dv_ dp -лшлг ds\ (dv_ дР)т{дТур д£Л дт)Р_ дГ\ дР)т -1- [д~т)Р (2.93) = ср + т _ Up
172 ЧастьП UrJ, с,-сУ=-т (2.94) [дРУт Подобным образом, если известна теплоемкость Су и уравнение состояние в виде зависимости Р(Т, V), можно вычислить теплоемкость Ср: с =Т(Щ _ d(S,P) d(S,P)d(T,V)_ р l^l ъ{т,р) ъ{т,у)Ъ{т,р) = т ds_ дт -<!И£ дРЛ JdS\ СЬР_ dv)T [дгЦдТуу ЭР ът V- = CV-T СР-СГ=-Т -1 IdFJr 3/>Jr [эг [dv)T (2.95) (2.96) Для получения последующих результатов используем достаточное условие минимума энергии как функции энтропии и объема, E(S, V). Как известно, для того чтобы функция многих переменных имела минимум, достаточно, чтобы квадратичная форма, составленная из ее вторых производных, была положительно определена. Для функции двух переменных это приводит к следующим условиям: д2Е д2Е dS2 dSdV\ д2Е Ъ2Е bSdV dV2 д2Е >0; (2.97) dS2 ->0. (2.98) Условие (2.98) представим в виде
2. Введение в термодинамику 173 В силу положительности температуры отсюда следует, что теплоемкость при постоянном объеме всегда является положительной: Ск>0. (2.100) Раскрывая определитель в (2.97), мы увидим, что его можно представить в виде якобиана: д2Ед2Е Г Э2^ V _ ' dS2dV2 {dSdVj Э5 dv Э(5, V) д(Т, Р) "Э(5, V) >0. (2.101) Продолжим преобразования: д(Т,Р)_д(Т,Р)д(Т, У)_ d(S, V)~b{T, V)b{S, V) = Из (2.100) вытекает, что 'ЪР ЪР_ dV —) < dV J/ IT" <0- 0. (2.102) (2.103) Увеличение объема при постоянной температуре всегда сопровождается уменьшением давления. Тогда из формул (2.94), (2.96) следует СР>СУ. (2.104) Следовательно, выполняется также неравенство СР>0. (2.105) Из (2.39) следует, что энергия является монотонно возрастающей функцией температуры при постоянном объеме, а из (2.52)— что энтальпия — монотонно возрастающая функция температуры при постоянном давлении. Энтропия монотонно возрастает с ростом температуры как при постоянном объеме, так и при постоянном давлении. Рассмотрим теперь адиабатический процесс, при котором энтропия остается постоянной, и выведем соотношения, которые позволяют вычислить производные термодинамических параметров при постоянной энтропии, зная теплоемкость и уравнение состояния. дТ_\ _d(T,S)_d{T,S)d(V, T)_ bV)s d(V,S) d(V,T)d{V,S) {dv)\ds)y Cy[dv)T (2.106) Cv \oT)y
174 Часть II ЭГ ЭР d(T,S) = d(T,S)d{P,T) = s d{P,S) d{P,T)d{P,S) ър)т \bs)P cP [dp)T cy {дт (2.107) Если коэффициент теплового расширения а (2.43) является положительным, с учетом неравенства (2.100) приходим к выводу, что при адиабатическом расширении (сопровождаемом уменьшением давления) температура падает, если коэффициент теплового расширения отрицательный, температура возрастает. дуЛ J{V, S) _ Э(Г, S) д(У, Т) д(Р, Т) = dP)s д(Р, S) д{У, Т) д(Р, Т) Э(Р, S) dS\ (дУЛ (дТЛ _CV дТ )у{дР )T(dS )Р СР (дУЛ _СУ(ЬУЛ [dp)s СР{дР)т' (2.108) (2.109) Вспоминая определения (2.41), (2.42) для изотермической и адиабатической сжимаемости и учитывая (2.104), мы видим, что адиабатическая сжимаемость по абсолютной величине всегда меньше изотермической сжимаемости: IAMA-I- Выражая Су из (2.94) и подставляя в (2.109), получим (2.110) 'дУ_\ = JP)S СР + Т (дУ_ 1дР~1 2^\ -L(^L) =(<*K.) +JL(^L} СР\дР)т \.дР)т С У дТ) (2.111) ) Переворачивая формулу (2.109) и подставляя в нее Ср из (2.96), приходим к еще одному соотношению: (дР_ [дУ Су-Т (Щ (-1 1 (К) _ Су {дУ)т (др) [дУ)т т СР ЭР дт Ч^\ ■ (2-"2)
2. Введение в термодинамику 175 2.10. Термодинамические неравенства. Принцип Ле Шателье. Итак, мы вывели ряд термодинамических неравенств (см. (2.100), (2.103), (2.104), (2.105), (2.110)). Состояния, в которых данные неравенства нарушаются, являются неустойчивыми. Полученные неравенства следует рассматривать как условия равновесия, хотя их выполнение еще не гарантирует, что равновесие будет устойчивым. Как и в механике, могут существовать состояния неустойчивого равновесия, такие, что при небольшом отклонении параметров от равновесных значений энтропия уменьшается, и система стремится вернуться в состояние с большим значением энтропии, в то время как при значительном изменении параметров энтропия может оказаться больше, чем в исходном состоянии. В таком случае система не вернется в исходное состояние, которое соответствует только локальному максимуму энтропии. Состояние, соответствующее локальному максимуму энтропии, является метастабильным. При достаточно большом отклонении от метастабильного состояния система перейдет в другое устойчивое состояние. Если последнее соответствует глобальному максимуму энтропии, оно является стабильным, и при отклонении от такого состояния система рано или поздно вернется в него. Аналогия с механикой прослеживается еще яснее, если иметь в виду, что состоянию равновесия, наряду с максимумом энтропии, соответствует минимум энергии (а также свободной энергии). Представление о стабильных и метастабильных состояниях можно проиллюстрировать следующим графиком (рис. 17): и О* а> Я о 1 ю о « о наиболее метастабильное переменная устойчивое состояние состояния состояние Рис. 17 Выше, используя достаточное условие минимума энергии как функции энтропии и объема, мы получили ряд термодинамических неравенств. Получим более общий вид неравенств, вспоминая, что энергия может быть функцией и других параметров. Согласно (2.75), дифференциал энергии может быть представлен в виде dE = TdS-PdV + ^AidA,=^Yndy„, (2.113) I I
176 Часть П где введены обозначения Ю = {Т, "Л A,}, {y„} = {S, V, Л,}. Докажем неравенство >0. (2.114) (2.115) Воспользуемся методом якобианов №) J{Yn,Ym) J{Yn,Ym)d{yn,ya) = [dyjr d(ya,Ym) b{yn,ym)b{yn,Ym) r^v ^ ЭУ„ ЪУЛ (д¥. Учитывая, что tyn ),я I fym )Ущ I ЪУт ),щ У ЭУп )Ут (dY\ д2Е JdYA {дУп)Ут ЪупдУт 1^«Л„ (ЭО д2Е п — =—г>0 ^а.. л Ъ, (2.116) Л, (2.117) (2.118) (последнее следует из достаточного условия минимума энергии), получаем ч2 'ъуЛ (ъуА f*v\ I*'Jr. \dyJ у. \душ\ У^J у. ЭК (2.119) что доказывает (2.115). Пусть AYn — изменение величины Yn, связанное с изменением величины уп, которое можно представить в виде АК = О. ал- Тогда из (2.115) следует (AY) >(ДП (2.120) (2.121)
2. Введение в термодинамику 177 С помощью неравенств (2.115) можно проиллюстрировать принцип Ле Шателье, согласно которому внешнее воздействие, выводящее систему из равновесия, стимулирует в ней процессы, стремящиеся ослабить результаты этого воздействия. В качестве примера рассмотрим процесс, в котором вещество заключено в теплопроводящий цилиндр с поршнем (рис. 18). Поршень уравновешивается внешним давлением Р. Веществу в цилиндре сообщается некоторое количество тепла AQ, и равновесие нарушается. В результате температура вещества возрастет. Если бы поршень оставался неподвижным, температура изменилась бы на величину (АГ)^. Однако вследствие увеличения температуры возрастет также и давление, что вызовет смещение поршня и увеличение объема. Это можно назвать косвенной реакцией на внешнее воздействие, которая приведет к некоторому понижению температуры вещества. Расширение прекратится, когда установится равенство давлений на поршень изнутри и снаружи. AQ Т + АТ L Ш смещение Г Рис. 18 Воспользуемся неравенством (2.115). Поскольку в данном процессе изменяется температура и энтропия, положим Yn = Т, а сопряженный параметр уп = S. Далее, Ym=-P, ym =V. Тогда (2.115) дает 'ЪТЛ (дТ^ dS ds Соответственно, (2.120), (2.121) примут вид (ДГ)Г>(ДГ), (2.122) (2.123) (2.124) Полученное неравенство означает, что изменение температуры будет больше в том случае, когда фиксирован объем (положение поршня), т. е.
178 Часть II реакция на внешнее воздействие исключается, чем в случае, когда изменение объема возможно, причем поршень будет двигаться таким образом, чтобы уменьшить эффект, оказанный воздействием на систему. В данном примере энтропия S выступает в качестве параметра, характеризующего равновесие системы со средой, а объем V— в качестве параметра, характеризующего внутреннее равновесие системы. Изменение энтропии AS можно рассматривать как меру внешнего воздействия на систему, а А Г — как меру изменения свойств системы под влиянием этого воздействия. В результате того, что системе сообщается некоторое количество тепла (сопровождаемое изменением энтропии), нарушается внутреннее равновесие системы (характеризуемое постоянным объемом). Восстановление равновесия (чему соответствует постоянство давления) сопровождается ослаблением результатов внешнего воздействия. Отметим, что из неравенства (2.122) следует уже известное неравенство (2.104). Рассмотрим другой пример. Будем уменьшать объем тела, при этом объем будет выступать в роли параметра, характеризующего равновесие системы со средой. Если температура тела поддерживается постоянной (скажем, путем теплообмена системы со средой), давление возрастет на величину (АР)Г. Подцержание температуры постоянной исключает реакцию системы на внешнее воздействие. Наоборот, если система теплоизолирована, уменьшение объема приведет также к увеличению температуры. При этом останется постоянной энтропия системы. Воспользуемся неравенствами (2.115), (2.121), в которых положим Yn =-P, yn =V, Ym=T, ym =S. Тогда {dV)s [dVjT или (ДР)Г>(ДР),. (2.127) Уменьшение объема системы стимулирует в ней процессы, которые стремятся уменьшить его давление. Последнее неравенство в (2.126) уже было получено нами ранее (см. (2.103)). 2.11. Теорема Нернста. Поведение термодинамических величин при Г—»0. Как уже отмечалось, из (2.39) следует, что энергия является монотонно возрастающей функцией температуры при постоянном объеме. При Т —» 0 система должна оказаться в состоянии с наименьшей возмож-
2. Введение в термодинамику 179 ной энергией. С точки зрения квантовой механики система должна оказаться в основном состоянии, которое определяется однозначно и статистический вес которого равен единице. В таком случае S = k\nT->0 при Г->0. (2.128) С точки зрения классической статистики энтропия определена с точностью до аддитивной постоянной, которую, однако, ничто не запрещает положить равной нулю. Сделанное утверждение известно как теорема Нернста. Это утверждение было сформулировано Нернстом в 1906 году на основании анализа многочисленных экспериментальных данных и поэтому представляет собой эмпирически установленный принцип, подобно другим законам термодинамики. На теорему Нернста нередко ссылаются как на третье начало термодинамики. Теорема Нернста подразумевает, что никакими способами нельзя достигнуть абсолютного нуля температуры. Кроме того, существует ряд следствий из этой теоремы, определяющих поведение термодинамических величин при Т —» 0. Покажем, что при Т —> 0 обращаются в нуль теплоемкости при постоянном объеме и постоянном давлении: Су->0, Ср->0 при Г->0. (2.129) В самом деле, выразим теплоемкость через производную энтропии по новой переменной / = In T: „ „dS „dS dt dS dS C = T— = T—— = — = — (2.130) dT dtdT dt Э(1пГ) Поскольку S —> 0, a In T —> -«> при T —» 0, мы убеждаемся в справедливости (2.129). При Т —> 0 обращаются в нуль коэффициент теплового расширения: а->0 при Г->0. (2.131) В соответствии с (2.43), (2.81) дт)Р у\ър) ' Поскольку S—»0 при Т—»0 при произвольном давлении, убеждаемся в справедливости (2.131). Аналогично доказывается, что Ш£Ь°при г"° (2лзз)
180 Часть II Предположим, что при Т —» 0 энтропия обращается в нуль по степенному закону: S = f{P)Tn или S = f(V)T\ (2.134) В этом случае, как следует из (2.130), (2.132), (2.133), по тому же закону обращаются в нуль теплоемкости, коэффициент объемного расширения а и производная . Далее, можно показать, что ^-^-+0 при Т- >0. (2.135) Поскольку изотермическая сжимаемость (2.41) остается конечной величиной при Т —» 0, из (2.94) получаем (-Т г -г —t^LL " v~ (dv_ [dp Lsp ~^sy ^ rpn+l (2.136) (2.137) так что разность Cp—Cv обращается в нуль быстрее, чем теплоемкость Ср или Су. 2.12. Построение термодинамической шкалы температур. Предположим, что мы располагаем телом, которое можно рассматривать как произвольно градуированный термометр с некоторой шкалой температур т. Возникает вопрос, как установить зависимость Г (г) между этой шкалой температур и абсолютной шкалой температур. Запишем дР)т \ЪТ;Р ьр)т Up); (dv\ (ъуЛ *L. ldT)P~[dT)PdT; *U) =-т(—) —■ (2.138) (2.139) (2.140) (2.141)
2. Введение в термодинамику 181 d{hiT)_l dT dr T dT _ UtJ, ""(11 (2.142) Величины в правой части (2.142) могут быть непосредственно измерены: производную drjf можно определить, измеряя изменение объема тела при нагревании, а производную II- измеряя количество тепла, которое необходимо сообщить телу в процессе его расширения так, чтобы его температура оставалась постоянной. Таким образом определяется искомая зависимость Т = Т(т). Из формулы (2.142) In Г может быть определен с точностью до аддитивной постоянной, а сама температура Т определяется с точностью до произвольного постоянного множителя. 2.13. Процесс Джоуля-Томсона как пример необратимого процесса. Поговорим теперь об обратимых и необратимых процессах с точки зрения их термодинамического описания. Пусть газ, находящийся под давлением Рх, перетекает в сосуд, в котором давление газа Р2 < Рх, причем в течение всего процесса давления Рх и Р2 остаются постоянными (условие стационарности). Как осуществить перетекание газа из сосуда в сосуд, удовлетворяющее этому условию? Можно представить перетекание газа через пористую перегородку, по обе стороны от которой расположены подвижные поршни (рис. 19). Поршень слева от перегородки вдвигается, а поршень справа выдвигается, обеспечивая таким образом постоянство давлений. Если отверстия в перегородке малы, скорость течения газа близка к нулю. Предполагаем также, что система теплоизолирована от окружающей среды. Это процесс адиабатического расширения газа из состояния с давлением Рх до состояния с давлением Р2, он называется процессом Джоуля-Томсона. Рис. 19 Если газ, занимавший в левой части сосуда объем Vx и находящийся под давлением Р1, после перехода в правую часть занимает объем V2 под
182 Часть II давлением Р2, изменение его внутренней энергии вследствие теплоизоли- рованности процесса будет равно разности работы, произведенной над газом для того, чтобы вытеснить его из объема Vl (левый поршень сжимает газ), и работы самого газа, произведенной для того, чтобы занять объем V2 (газ выдавливает правый поршень): E2-E,=Pyx-P2V2. (2.143) Здесь учтено, что сжатие и расширение газа происходит при постоянном давлении; при сжатии изменение его объема АУ = —У1У при расширении AV = V2. Следовательно, в данном процессе сохраняется энтальпия: Wl=El +РУ=Е2 +P2V2=W2. (2.144) Из выражения для дифференциала энтальпии (2.47) следует 1 V dS = -dW--dP, Т Т откуда Э5 ЭР V_ т' (2.145) (2.146) Эта производная является отрицательной. Так как давление при переходе в конечное состояние уменьшается, это означает возрастание энтропии в процессе Джоуля-Томсона и показывает, что этот процесс является необратимым. Физической причиной необратимости является наличие большого трения при прохождении газа сквозь маленькие отверстия перегородки. Эффект Джоуля—Томсона может быть использован на практике для определения уравнения состояния газа. Вычислим производную дТЛ _d(T,W)_d(T,W)d(T,P) дР)т_ {dP)w Э(Л W) Э(7\ Р) д{Р, W) ,ЭТ)Р [дР (2.147) Здесь была использована формула (2.52). Подставляя (2.86), получаем \dP/w 1 "'&-' (2.148) Производная в левой части может быть измерена экспериментально. Измерив также теплоемкость газа, можно восстановить уравнение состояния, используя правую часть (2.148).
2. Введение в термодинамику 183 Другим примером необратимого процесса является свободное адиабатическое расширение газа от объема Vx до объема V2>VX. Свободное расширение подразумевает заполнение газом большего объема без совершения работы (расширение в пустоту). Такой процесс не является стационарным в указанном выше смысле, давление газа будет меняться, пока не достигнет равновесного значения. Поскольку газ теплоизолирован и не совершает работу, его внутренняя энергия сохраняется. Из основного термодинамического тождества (2.20) при dE = 0 имеем Э5Л Р 1 -. (2.149) Эта производная является положительной. Так как объем увеличивается, это означает возрастание энтропии. 2.14. Максимальная и минимальная работа. При переходе из определенного неравновесного состояния в равновесное система может совершать работу, причем полная работа, совершенная системой, будет зависеть от характера процесса и от того, в каком конечном состоянии окажется система. Поэтому может быть поставлен вопрос, каким образом система должна перейти в равновесное состояние, чтобы при этом совершить максимальную работу? Необходимо учесть, что находящаяся в состоянии равновесия система также может совершать работу, скажем, за счет расширения, которое может производится равновесным образом. Чтобы исключить такой вид работы, рассматриваются только процессы, при которых объем системы в конечном состоянии равен объему в начальном состоянии. Будем также предполагать, что система теплоизолирована, так что совершенная системой работа равна изменению ее внутренней энергии. В соответствии с принятой выше договоренностью работа, совершенная над системой, считается положительной, а работа, совершенная самой системой, — отрицательной. Абсолютная величина работы |4J = MS„ Г,)-£(£, Г.)- (2-150) В начальном состоянии считаются заданными энергия Е}, энтропия S, и объем Vx (равный объему в конечном состоянии). , =-Г<0. (2.151) Тот факт, что производная (2.151) отрицательна, подразумевает, что с увеличением энтропии произведенная работа уменьшается. Так как энтропия не может убывать, это означает, что наибольшая возможная работа могла
184 Часть II бы быть совершена системой в идеализированном обратимом процессе, в котором энтропия остается постоянной. Если система состоит из двух тел с температурами Тх и Т2 (7] > Т2), процесс установления равновесия, связанный с передачей тепла от более горячего тела к более холодному, является необратимым, в таком процессе система вообще не производит работы. Однако эффекта можно добиться, если ввести в систему третье тело, называемое рабочим телом, которое совершает круговой обратимый процесс, известный как цикл Карно (Карно впервые рассмотрел его в 1824 году). Цикл состоит из двух изотермических и двух адиабатических процессов (рис. 20). 1 2 4' '3 i i i i „ sx s2 s В изотермическом процессе 1-2 рабочее тело находится в контакте с телом, имеющем более высокую температуру Г,, которое принято называть нагревателем. Рабочее тело, имеющее в начальном состоянии объем Vl9 получает от нагревателя количество тепла Qx и расширяется, совершая работу. В адиабатическом процессе 2-3 рабочее тело продолжает расширяться и совершать работу, не получая при этом тепла, что приводит к уменьшению температуры тела до значения Т2. В изотермическом процессе 3-4 рабочее тело приводится в контакт с телом, имеющем низкую температуру Т2, которое принято называть холодильником. Рабочее тело отдает холодильнику количество тепла Q2, что сопровождается сжатием тела, над ним совершается работа. Наконец, в адиабатическом процессе 4-1 рабочее тело продолжает сжиматься, пока его объем не достигнет первоначального значения Vl, а температура не повысится до температуры нагревателя Тх, так что цикл замыкается. Поскольку рабочее тело возвращается в начальное состояние, его внутренняя энергия после прохождения цикла не изменяется. Произведенная им работа равна разности полученного и отданного тепла, Ql_-Q2. Тх Т2 Рис. 20
2. Введение в термодинамику 185 В процессе 1-2 рабочее тело получает количество тепла a^te-S,), (2.152) а в процессе 3-4 отдает количество тепла е2=-7,2(51-52); (2.153) §- = $- = *,-$. (2154) Рабочее тело получает большее количество тепла, чем отдает, Ql>Q2, за счет чего и совершается работа. |лт,|=е1-е2=(7;-7,2)(52-51). (2.155) Коэффициентом полезного действия тепловой машины называют отношение совершенной работы к количеству затраченной энергии. В описанном цикле затрачивается энергия, равная количеству тепла Ql, отдаваемому нагревателем рабочему телу. Поэтому „J4j = g.-g2_ а а =i-a=i- а (2.156) Если при переходе из первого состояния во второе тело производит работу над другим объектом, при обратном переходе из второго состояния в первое над данным телом должна быть совершена работа. Прямому процессу, в котором производимая телом работа максимальна, соответствует обратный процесс, осуществление которого требует затраты работы внешним источником, причем эта работа будет минимальной, и, кроме того, I4-H4J- (2-157) Т, — г, 4 1 3 2 Рис.21
186 Часть И Рассмотрим для примера обратный цикл Карно (рис. 21). Так же, как и прямой цикл, он состоит из двух изотермических и двух адиабатических процессов. В изотермическом процессе 1-2 рабочее тело находится в контакте с холодильником, имеющем более низкую температуру Тх. Оно отбирает от холодильника количество тепла Qx и расширяется, совершая работу. В адиабатическом процессе 2-3 рабочее тело сжимают, производя над ним работу, в результате чего его температура повышается от температуры холодильника Тх до температуры нагревателя Т2. В изотермическом процессе 3-4 рабочее тело находится в контакте с нагревателем и, продолжая сжиматься, отдает нагревателю количество тепла Q2. В адиабатическом процессе Ф-1 рабочее тело расширяется, пока его объем не примет первоначальное значение, а температура не понизится с Т2 до Тх. В процессе 1-2 рабочее тело получает количество тепла &=№-$), (2.158) а в процессе 3-4 отдает количество тепла Qi=-T2{Sx-S2). (2.159) Очевидно, рабочее тело отдает большее количество тепла, чем получает, Ql<Q2, поэтому обратный цикл Карно можно осуществить только за счет совершения работы над рабочим телом. Минимальная работа, которую необходимо произвести, 4m=Qi-Qi = (T2-Tl){s2-sl). (2.160) Вследствие того, что цикл идет а обратном направлении, начальное и конечное состояние меняются местами, и поэтому 4-=-k«i- (2-161) Рассмотрим теперь ситуацию, когда некоторое тело может обмениваться теплом и работой с другим телом, обладающим настолько большим объемом и энергией, что процессы взаимодействия между телами не приводит к физически значимому изменению температуры и давления последнего. Тело с такими свойствами принято называть термостатом. Как правило, в качестве термостата выступает окружающая среда. Температуру Т0 и давление Р0 термостата в силу сказанного выше можно считать постоянными. Взаимодействующее с термостатом тело имеет температуру Т и давление Р, которые отличаются от температуры и давления термостата. Рассматриваемое тело может совершать работу над третьим телом, которое будем считать теплоизолированным, вместе с термостатом эти три тела образуют замкнутую систему. Наличие среды (термостата) оказьшает
2. Введение в термодинамику 187 влияние на то, какую максимальную работу может совершить рассматриваемое тело над третьим телом. В обратном процессе, наоборот, работу совершает третье тело, которое мы будем называть теплоизолированным внешним источником. Это будет минимальная работа, которую необходимо произвести внешнему источнику в обратном процессе. Изменение внутренней энергии рассматриваемого тела в некотором процессе будет складываться из работы А, произведенной внешним источником, работы, произведенной окружающей средой, и количеством тепла, полученным из окружающей среды. Работа, произведенная средой, есть PQAVQ, где AVQ — изменение объема термостата (учитывается, что его давление при этом не меняется). Количество тепла, отданное термостатом, равно -T0AS0, где AS0 — изменение энтропии термостата (учитывается, что его температура при этом не меняется). Тогда АЕ = A + P0AV0 - T0AS0. (2.162) Изменение объема среды противоположно по знаку изменению объема тела: AF0 = -AF. Суммарное изменение энтропии среды и тела неотрицательно: ASq + AS^O (энтропия теплоизолированного внешнего источника не изменяется), AS0 > -AS. Отсюда A = AE-P0AV0 + T0AS0>AE + P0AV-TQAS. (2.163) Знак равенства в (2.163) соответствует обратимому процессу и минимальной работе, произведенной внешним источником. В обратном процессе рассматриваемое тело могло бы совершить максимальную работу, и вновь мы приходим к выводу, что максимальная работа может быть получена только в обратимом процессе. Поскольку TQ = const, P0 = const, Amn=A{E-T0S + P0V), (2.164) или |4j = -A(£-r0S + P0F). (2.165) Рассмотрим несколько частных случаев. Если в течении процесса тело находилось во внутреннем равновесии (хотя и не в равновесии со средой), из основного термодинамического тождества следует AE = TAS-PAV, (2.166) Amin={T-T0)AS-{P-P0)AV. (2.167) Если объем и температура тела остаются постоянными, и, кроме того, температура тела равна температуре среды, Т = Т0, Amin=A(E-TS) = AF, (2.168) минимальная работа равна изменению свободной энергии тела.
188 Часть II Если давление и температура тела остаются постоянными и равными давлению и температуре термостата, Т = Т0, Р = Р0, Amin=A{E-TS + PV) = AO, (2.169) минимальная работа равна изменению термодинамического потенциала Ф. При этом состояние тела должно определяться другими параметрами, помимо Г, V или Т, Р, в противном случае тело достигло бы уже равновесного состояния и не участвовало бы ни в каких процессах. Если над телом не совершается никакой работы, его состояние будет постепенно приближаться к состоянию равновесия. Из (2.163) при А = 0 следует A(E-T0S + P0V)<0. (2.170) В частности, при V = const и Т = Т0, A(E-TS) = AF<0, (2.171) свободная энергия тела убывает, достигая минимума в равновесии. ПриГ = Г0иР = Р0, Д(Я-73ЧРК) = ДФ<о, (2.172) термодинамический потенциал тела убывает, достигая минимума в равновесии. Эти результаты уже были получены ранее. 2.15. Зависимость термодинамических величин от числа частиц. В заключение этого раздела определим, каким образом термодинамические величины зависят от числа частиц N Для простоты мы будем предполагать, что исследуемая система состоит из одинаковых частиц. Заметим, что при изменении числа частиц в системе в несколько раз во столько же раз изменяются аддитивные величины. Энергия, будучи аддитивной величиной, зависит от энтропии и объема, которые также являются аддитивными. Поэтому наиболее общий вид зависимости энергии от энтропии, объема и числа частиц есть Е = М/^,^уЩ(5,*), (2.173) где * = ■£, (2.174) V v = — (2.175) N
2. Введение в термодинамику 189 — удельные энтропия и объем (отнесенные к одной молекуле). Соответственно, свободная энергия, энтальпия и термодинамический потенциал Ф могут быть представлены в виде F = m[jj, rj = ^2(v, T), (2.176) W = Nf,U-, p) = Nf3{s, P), (2.177) Ф = М/4{Т,Р). (2.178) Если мы рассматриваем взаимодействие между подсистемами посредством обмена частицами, мы должны рассматривать число частиц как переменную величину. Далее мы считаем число частиц термодинамическим параметром (т. е. макропараметром), хотя по существу число частиц является величиной, измеримой на микроуровне (так же, как и частица — понятие микроскопическое). С точки зрения термодинамики, этой величине можно придать иной смысл, например, понимать ее как массу системы (макроскопически измеримую величину), деленную на константу, равную массе одной частицы. Дифференциал энергии E(S9 V, N) в таком случае нужно записать следующим образом: dE = TdS-PdV + {idN, (2.179) где производные Ц1 =Т, (2.180) берутся при фиксированном значении параметра N, а также введено обозначение Величина (2.182) называется химическим потенциалом. Тогда для дифференциала энтальпии мы получаем dW = d (Е + PV) = dE + PdV + VdP = TdS + VdP + /idN. (2.183) Аналогично, dF = d (E -TS) = dE -TdS - SdT = -SdT - PdV + /idN; (2.184) dO = d (F + PV) = dF + PdV + VdP = -SdT + VdP + {idN. (2.185)
190 Часть II При этом М {dN]SJ, [дм)ту IdN)' (2Л86) Иными словами, химический потенциал можно получить дифференцированием любой из термодинамических функций Е, W, F, Ф по числу частиц, при этом он будет выражен через различные термодинамические параметры. При установившемся равновесии между подсистемами, которое включает в себя тепловое, механическое равновесие и равновесие, связанное с обменом частицами, химический потенциал всех частей системы одинаков. Это можно установить точно так же, как было доказано равенство температур различных подсистем при тепловом равновесии и равенство давлений при механическом равновесии. Считаем, что тепловое и механическое равновесие уже достигнуто, а полное число частиц в системе остается постоянным: N = N{+N2. (2.187) В состоянии равновесия, связанного с обменом частицами, энтропия имеет максимум по отношению к изменению числа частиц в подсистемах: Щ dNl dN2 <flV, Щ dN2 ' ^L = ^L. (2.189) «flV, dN2 Из (2.179) выразим дифференциал энтропии dS = -dE + -dV-^-dN, (2.190) rri rri rri ' >■ ' \dNjEtV T откуда и следует равенство химических потенциалов подсистем в равновесии. Используя (2.178), найдем НШ/мт-р)- <2192> Ф = Ы/и. (2.193) Химический потенциал тела представляет собой его термодинамический потенциал Ф, отнесенный к одной частице. Формула (2.192) выражает хи-
2. Введение в термодинамику 191 мический потенциал как функцию только температуры и давления, он не зависит от числа частиц. Из (2.185) вытекает, что dju = -sdT + vdP, (2.194) где s, v определяются формулами (2.174), (2.175). Химический потенциал и число частиц являются термодинамически сопряженными переменными. Это позволяет определить новые термодинамические функции, зависящие от химического потенциала как от параметра. В дальнейшем для нас будет представлять интерес термодинамический потенциал Q: Q, = E-TS-/uN = F-juN = (2 195) = W-PV-TS-juN = 0-PV-juN = -PV v " } dQ. = d(F-{iN) = dF-judN-Ndju = -SdT-PdV-Nd{i. (2.196) Термодинамический потенциал Q является функцией температуры, объема и химического потенциала: £l(T, F, //). дТ dV djU = -S; (2.197) = -Р; (2.198) = -N. (2.199) ту Из аддитивности энергии, энтальпии, свободной энергии, термодинамического потенциала Ф, а также энтропии, объема и числа частиц следует аддитивность термодинамического потенциала Q (см. (2.195)). Основное термодинамическое неравенство (2.33) при учете процессов с переменным числом частиц следует уточнить: dE < TdS - PdV + judN. (2.200) В состоянии равновесия при постоянных температуре, давлении и химическом потенциале (Т = const, Р = const, JU = const) из основного термодинамического неравенства следует dE-TdS + PdV-{idN<0, (2.201) dQ, = d(E-TS + PV-{iN)<0. (2.202) Термодинамический потенциал Q имеет тенденцию уменьшаться, достигая минимума в равновесии (чему соответствует знак равенства в (2.202)).
192 Часть II 3. Распределение Гиббса 3.1. Вывод распределения Гиббса. В статистической физике и термодинамике важную роль играет распределение Гиббса, которое позволяет определить вероятность состоянии с определенным значением энергии. Рассмотрим систему, которая является малой частью (подсистемой) большой замкнутой системы. Данная подсистема взаимодействует с остальной частью замкнутой системы, которая служит термостатом по отношению к малой подсистеме. В результате установления равновесия с термостатом малая подсистема имеет заданную температуру и объем. Пусть Е — энергия малой подсистемы, Е' — энергия термостата, Е0 — энергия замкнутой системы. Тогда для замкнутой системы мы можем записать микроканоническое распределение (1.142) в виде dw = CS(E + E'-E0)dTdT\ (3.1) где dT — число квантовых состояний с энергией, лежащей в интервале (Е, E + dE), dT' — число квантовых состояний с энергией в интервале (Е\ E'+dE'). Мы хотим определить вероятность состояния замкнутой системы, в котором рассматриваемая подсистема находится в определенном квантовом состоянии с заданным значением энергии. Вообще говоря, квантовое состояние определяется целым набором квантовых чисел. Одному и тому же уровню энергии (в случае вырождения) могут соответствовать разные квантовые состояния, т. е. разные наборы квантовых чисел. Значение уровня энергии в этом случае, как правило, определяется значением одного из квантовых чисел, называемого главным квантовым числом. Искомую вероятность мы обозначим wn, при этом индекс п (главное квантовое число) указывает на вероятность состояния подсистемы, в котором ее энергия равна Еп. При заданном значении энергии квантовые состояния, отличающиеся значениями остальных квантовых чисел, кроме главного, равновероятны. Это находится в полном согласии с предположением о том, что наша система описывается микроканоническим распределением, т. е. статистические распределением, соответствующем случаю, когда все состояния системы с заданным значением энергии равновероятны. Поскольку мы не интересуемся состоянием термостата, искомую вероятность мы можем получить, проинтегрировав по всем состояниям термостата с энергией в интервале (Е', E'+dE'): wn=CJS(En+E'-E0)dr. (3.2) Здесь мы будем рассматривать невырожденный случай, при этом можно считать, что dT = 1. Случай вырождения будет позже рассмотрен отдель-
3. Распределение Гиббса 193 но. Далее, Г'(Е') — это число квантовых состояний термостата с энергией, меньшей или равной Е'. Эта величина однозначно связана с энтропией термостата S(E'), которая в нашем случае зависит от только энергии подсистемы. Как уже говорилось, подсистема имеет заданный объем. Случай, когда подсистемы обмениваются частицами (тогда энтропия зависит также от числа частиц), будет рассмотрен позднее. -S(E') Г'(£*) = ехр dr dE 7 = ехр Тогда S(E'j dr 1 dS kdE' (3.3) (3.4) Vn=CJS(E„+E'-E0)—dE' = dE' = c\S{En+E'-E<s)exV exp S(E'j dS dE' xp )l №')] L * :'=e0-e„ X-^-dE' = kdE' (3.5) (3.6) В соответствии с (2.5), dS 1 dE'"Г' где Т— температура термостата, которая равна температуре малой подсистемы Т, находящейся в равновесии с термостатом. Поскольку En<z:E09 величина (3.6) практически не зависит от уровня энергии Еп, а определяется полной энергией системы Е0. Мы можем пренебречь слабой зависимостью величины (3.6) от Еп, тогда (3.5) запишется в виде 'S(E0-E„)' w„ = С, exp (3.7) Cj — новая постоянная. Далее, в силу малости Еп мы можем разложить энтропию, стоящую в показателе экспоненты в (3.7) в ряд по степеням Еп: S(E0-En) = S(E0)-E„(^j . (3.8)
194 Часть II Используя (3.6), получаем w-=Aexpi~b)' (3-9) А — не зависящая от Еп постоянная. Формула (3.9) определяет распределение Гиббса, также называемое каноническим распределением. Соответствующий статистический ансамбль называется каноническим ансамблем. Распределение Гиббса можно вывести иначе, опираясь на гипотезу о равнораспределении вероятностей микросостояний, из которой, собственно, и следует микроканоническое распределение (3.1). Исходя из этой гипотезы, мы можем считать, что вероятность обнаружить подсистему замкнутой системы в квантовом состоянии с определенным значением энергии Еп равна отношению числа Гп тех микросостояний замкнутой системы, в которых данная подсистема находится в указанном состоянии, к полному числу микросостояний замкнутой системы Г0: w„=^. (3.10) 1 о Учитывая свойство мультипликативности статистического веса (1.140), Г„=Г(Е„)Г(Е0-ЕП), (3.11) где Г(Еп) = \ — число микросостояний подсистемы, в которых она имеет энергию Еп, мы по-прежнему считаем, что имеется только одно такое микросостояние, т. е. уровень энергии не вырожден; Г'(Я0 -Еп) — число микросостояний остальной части системы (термостата). w„=Cor{E0-En), (3.12) где С0 — не зависящая от Еп постоянная. Поскольку Еп<кЕ0, можно было бы разложить Г'(Я0 -Еп) в ряд по степеням Еп. Однако Г'(Я0 -Еп) — очень быстро меняющаяся функция Еп, поэтому ее производные могут оказаться очень большими, так что будет неправильным пренебречь высшими членами разложения этой функции. Чтобы избежать ошибки, разложим в ряд не саму функцию Г'(Я0 - Еп), а ее логарифм, который меняется значительно медленнее: \пГ(Би-Бт) = ЫГ(Бп)-Бя(<!{ЫГ)> lS(E0)-Em dE' , (3.13) 1|„,„ч - f !&} k dE')E, £•=£„
3. Распределение Гиббса 195 Выражая из (3.13) Г'(Е0 -Еп), мы вновь приходим к распределению Гиббса (3.9). Константа А играет роль нормировочной постоянной и определяется из условия нормировки 2>*=1; (3.14) л Е„ Л^е *T=A-Z = 1. (3.15) л Выражение Е„ Z = ^ekT (3.16) л называется статистической суммой. Выше было показано, что вероятности обнаружить значение fn физической величины / представляют собой диагональные элементы статистической матицы в базисном наборе, состоящем из собственных векторов оператора /, т. е. в таком, в котором оператор / является диагональным. В данном случае речь идет о вероятностях обнаружить различные значения энергии Еп. Вероятности (3.9) представляют собой диагональные элементы статистической матицы в базисном наборе из собственных векторов оператора Гамильтона. Среднее значение физической величины g может быть вычислено с помощью распределения Гиббса по формуле, которая является частным случаем формулы (1.90): (#) = IX»S™ =ZW»3™&". =HwnS„„ =- ^—• (3.17) m/i m/i л x д £у л Заметим, что мы рассматриваем стационарное состояние системы, так что статистический оператор не должен зависеть от времени. Согласно квантовому уравнению Лиувилля (1.112), статистический оператор в этом случае коммутирует с оператором Гамильтона. Это означает, в свою очередь, что они имеют общий набор собственных функций. Диагональные элементы оператора в базисе, состоящем из его собственных функций, дают его собственные значения. Таким образом, вероятности различных значений энергии (3.9) представляют собой собственные значения статистического оператора. В литературе нередко встречается утверждение, что статистический оператор, соответствующий каноническому ансамблю, имеет вид (3.18) 1 кТ Н — оператор Гамильтона рассматриваемой подсистемы. /> = -ехр
196 Часть И Как уже говорилось, функция /Ы) от оператора А представляет собой оператор, собственные векторы которого совпадают с собственными векторами оператора А, а собственные значения равны f(An), где Ап — собственные значения оператора А . Следовательно, собственными векторами оператора (3.18) являются собственные векторы оператора Н , а его собственные значения даются формулой (3.9). Два оператора считаются равными, если они имеют одинаковый набор собственных значений и собственных векторов. Действительно, произвольный вектор может быть разложен по полному набору собственных векторов заданного оператора А : 1*>=Ес>.>; (ЗЛ9> эд=Хсй^>2сл>й>- (3.20) Точно такой же результат мы получим, если подействуем на вектор |*F) оператором В , собственные значения которого совпадают с собственными значениями Ап оператора А , а собственные векторы — с собственными векторами | цгп). Если два оператора при действии на произвольный вектор дают один и тот же результат, эти операторы равны. Итак, мы приходим к выводу, что в случае канонического ансамбля статистический оператор действительно может быть представлен в форме (3.18). Здесь следует заметить, что оператор (3.18) относится к малой части замкнутой системы. Статистический оператор системы в целом есть Л 1 ( # + #'+tfmt^ (3.21) Н' — оператор Гамильтона остальной части системы (термостата), Hmt — оператор взаимодействия между подсистемами. Если взаимодействием между подсистемами можно пренебречь, статистический оператор представляется в виде произведения статистических операторов подсистем: (3.22) 1 ( "1 1 «J 1 ехр Z' Г &'} 1кт) Ро=Р'Р' = -ыР Это соответствует статистической независимости квазизамкнутых подсистем (см. (1.53)). Векторы состояния, относящиеся к замкнутой системе, также представляются в виде произведений векторов состояний, относящихся к каждой из подсистем: |<0=Юк>- (3.23)
3. Распределение Гиббса 197 Для того, чтобы получить статистическую матрицу малой подсистемы, необходимо просуммировать по состояниям остальной части системы элементы статистической матрицы системы в целом: * * (3.24) = (Гш\Р\Гт)ЪР' = (Гш\Р\Гт). Здесь мы учли, что tr р' = 1. В нашем случае, хотя и предполагается взаимодействие малой части системы с термостатом, это взаимодействие достаточно мало, в противном случае было бы невозможно говорить о том, что малая подсистема находится в квантовом состоянии с определенным значением энергии. Роль взаимодействия заключается в установлении теплового равновесия между подсистемами, таким образом, термостат проявляет себя в том, что мы рассматриваем малую подсистему при определенной температуре. Распределение Гиббса относится к равновесным распределениям, т. е. к распределениям, описывающим систему уже после установления в ней равновесного состояния. Хотя, строго говоря, распределение Гиббса описывает подсистему, взаимодействующую с термостатом, оно также может использоваться для определения основных статистических свойств замкнутых систем. Большинство этих свойств не зависит от того, рассматриваем ли мы систему как замкнутую или как взаимодействующую с термостатом. Отличия проявляются лишь при рассмотрении флуктуации полной энергии системы. С другой стороны, мы помним, что представление о замкнутых системах вообще является идеализацией, поскольку любое реальное тело хотя бы слабо взаимодействует с окружающей средой. 3.2. Классический канонический ансамбль. В классической статистике малая подсистема, слабо взаимодействующая с термостатом, описывается распределением Гиббса, если ее функция распределения имеет вид н{ър) p(q,p) = Aexp kT (3.25) Н(ч* р) — функция Гамильтона подсистемы. Это распределение установлено Гиббсом для классической статистики в 1901 году. Функция (3.25) определяет плотность вероятности обнаружить подсистему в состоянии, энергия которого определяется значением функции Гамильтона, в окрестности данной точки фазового пространства. Распределение (3.25) может быть получено аналогично тому, как выводится распределение Гиббса в квантовом случае. Искомую плотность вероятности можно определить
198 Часть И как отношение объема той части фазового пространства Q,E (<?, р), которая охватывает все те состояния, в которых малая подсистема имеет заданное значение энергии, ко всему объему фазового пространства Q0, доступному замкнутой системы: р(я>р) = ав{я>р)_а{Е(я>р))'а'{Ео-Е(я>р)) An An (3.26) Здесь мы учли, что объем части фазового пространства £lE(q, p) равен произведению объемов частей фазовых пространств подсистемы и термостата, соответствующих состояниям с энергиями E(q,p) nE'(q,p) = E0-E(q,p). Объем фазового пространства подсистемы Q.(E(q, /?)) значительно меньше объема фазового пространства термостата Q.'(EQ-E(q, /7)). Последний можно выразить как функцию энтропии по формуле (1.126): n'(E0-E{q,p))~Qxp\±-S(E0-E{q,p)) (3.27) Считая E(q, р) малым параметром, мы можем разложить энтропию в ряд, подобно тому, как это было сделано в (3.13). Получаем E(q,p) p(q,p)~Gxp кТ (3.28) что согласуется с (3.25), где введен нормировочный множитель А, определяемый из условия \p{q,p)dqdp = \; (3.29) H{q,p) 4Jexp кТ dqdp- AZ-\\ Z = J exp H{q,p) kT dqdp (3.30) (3.31) — статистический интеграл. Если подсистема содержит тождественные (физически неразличимые) частицы, в случае перестановки таких частиц микросостоянию системы будет соответствовать уже другая фазовая точка, чем до перестановки, хотя обе точки соответствуют одному и тому же микросостоянию, в том смысле, что нет возможности их отличить с помощью физических измерений. Получается, что в случае тождественных час-
3. Распределение Гиббса 199 тиц одни и те же микросостояния учитываются многократно. Поскольку мы интересуемся плотностью вероятности микросостояний, необходимо внести поправку в определение статистического интеграла и разделить выражение (3.31) на число возможных перестановок тождественных частиц. Если система содержит N одинаковых частиц, число их перестановок равно ЛП, а статистический интеграл следует записать в виде Z = — | ехр кТ dqdp. Если имеется несколько видов одинаковых частиц, 1 Nl\N2\...Nk\ J ехр H{q9p) кТ dqdp. (3.32) (3.33) 3.3. Термодинамика канонического ансамбля Гиббса. Согласно формуле (1.135), энтропию квантового канонического ансамбля можно записать следующим образом: кТ кТ (3.35) Здесь мы учли, что в термодинамике под энергией понимается как раз ее среднее значение, и воспользовались формулой (2.54). Выразив постоянную А из (3.35) и подставив в (3.9), получим rF-Em w„=exp кТ (3.36) Поскольку А = — (см. (3.15)), *=!« F = -kThiZ; Еп кТ . :tT ехр кТ (3.37) (3.38) Если известен энергетический спектр рассматриваемой подсистемы, мы можем вычислить статистическую сумму, а затем по формуле (3.37) — свободную энергию. Зная свободную энергию, можно выразить остальные термодинамические функции и установить все необходимые термодинамические соотношения.
200 Часть И В случае классического канонического ансамбля воспользуемся формулой (1.139): S = S0-k(bp{q,p)) = S0-U]nA-^^\ = = Sn-kkiA ^H{q,p)) (3.39) Учитывая, что S0 =-skIn(2nti),s — число степеней свободы (см. (1.126)), (3.40) ЫА=^+(^1Л = -]п(27сПХ +— = -lnZ; к кТ у ' кТ {2кП),&ЛктУ F = -kT\n- {2xh)s (3.41) (3.42) Чтобы формулы имели точное соответствие с формулами, выведенными для случая квантовой статистики, мы можем переопределить статистический интеграл ехр H(q,pj кТ dqdp {1пЬ)5 (3.43) Имея в виду соотношение (1.124) между объемом какой-либо области фазового пространства и числом квантовых состояний, приходящихся на этот объем, в определенном смысле можно сказать, что в (3.43) мы интегрируем по квантовым состояниям, заполняющим объем фазового пространства. Это уточняет аналогию между статистическим интегралом и статистической суммой (3.38): в квазиклассическом пределе статистическая сумма должна переходить в статистический интеграл. После такого переопределения для F справедлива формула (3.37), соответственно, а для функции распределения (3.25) получим р{ч,р)- 1 (2тсП) 7ехр F-H(q,p) кТ (3.44) Среднее значение физической величины /(#, р) по-прежнему определяется формулой (1.48): {f) = \f{q,p)p{q,p)dqdp. (3.45)
3. Распределение Гиббса 201 3.4. Большой канонический ансамбль. Теперь мы обобщим распределение Гиббса таким образом, чтобы учесть возможный обмен частицами между подсистемами. Под подсистемой мы подразумеваем часть системы, заключенную в определенном объеме, тогда число частиц в подсистеме — это число частиц, находящихся в этом объеме. Для простоты будем предполагать, что наша система содержит частицы одного вида. В рассматриваемом случае от числа частиц должна зависеть не только функция распределения, но и значения энергии подсистемы. В квантовой статистике уровни энергии подсистемы будем обозначать двумя индексами: Е^. Нашей задачей является определение вероятности того, что подсистема содержит N частиц и при этом находится в квантовом состоянии с номером п. Искомую вероятность обозначим w^. При выводе распределения Гиббса (3.9) существенную роль играло разложение энтропии в ряд по малому параметру Еп (см. (3.8) или, что эквивалентно, (3.13)). Теперь необходимо учесть, что энтропия является функцией не только энергии, но и числа частиц. Число частиц в малой подсистеме много меньше полного числа частиц: N <zN0 = N + N4. По аналогии с (3.7) мы можем выразить искомую вероятность через энтропию термостата S(Е0 -EnN, N0-N): wnN =C2exp SiE.-E^N.-N) (3.46) Теперь разложим энтропию в ряд по малым параметрам Е^, N: S{E0-EnN,N0-N) = S{E„N0)-EnN[^ ~Ы[Щ QAV Используя соотношение (2.191), а также тот факт, что подсистемы находятся в равновесии и поэтому их химические потенциалы равны, приходим к выражению S(E0-EM,N0-N) = S(E0,N0)-^+^-, waN=Aaqp кТ (3.48) (3.49) Формула (3.49) определяет распределение Гиббса для подсистем с переменным числом частиц, также называемое большим каноническим распределением, а соответствующий статистический ансамбль называется боль- шим каноническим ансамблем.
202 Часть II Нормировочная постоянная А определяется из условия N п AHetTHe kT =A-Z = l; fit/ z=YjekTlLe" (3.50) (3.51) (3.52) — большая статистическая сумма. Вводя оператор числа частиц N, который коммутирует с оператором Гамильтона, поскольку число частиц в подсистеме может быть измерено одновременно с ее энергией, так что операторы Гамильтона и числа частиц имеют общий набор собственных векторов, мы можем записать выражение для статистического оператора: 1 juN-H ^=zexphr- (3.53) В классической статистике большой канонический ансамбль описывается функцией распределения ~HN-HN{q,p) Ры(я,р) = Аехр кТ (3.54) которая определяет плотность вероятности обнаружить подсистему в состоянии с числом частиц N, энергия которого определяется значением функции Гамильтона HN (q, p). А = - 1-^-9 (3.55) =ZJ ехр (2тгП)5 Z juN-HN(q,p) кТ dqdp (2тгП)5 (3.56) Обобщение формул на случай, когда система содержит частицы разных видов, проводится аналогично тому, как это было сделано выше для классического канонического ансамбля. 3.5. Термодинамика большого канонического ансамбля. В случае квантового большого канонического ансамбля, действуя так же, как в (3.34)-(3.38), получим S = -*<to^) = -(*to, + f-^) = -ШЛ-^ + а (3,7)
3. Распределение Гиббса 203 ЫА = - (3.58) i_(E)-M(N)-TS_Q кТ кТ Здесь Q. — термодинамический потенциал, определяемый по форму ле (2.195). 'a + MN-E^ wnN=exp кТ Q = -kT\nZ; flN z = Y>ekTlLe kT =tr exp kT (3.59) (3.60) (3.61) 8 = 50-к(ЫМд,Р)) = 30-(кЫА+^-^^у В случае классического большого канонического ансамбля по аналогии с (3.39Н3.43) имеем цМ Н„{д,р)\_ Т ' (3.62) \пА = -)п(2лНУ + ^~M^~TS =-\п(2жЛу + — = -ы[(2якУZ]; (3.63) (3.64) А = 1 — (2яПуеХР{кт}' Q = -kT\aZ. (3.65) Формулы (3.60) и (3.65) для квантового и классического больших канонических ансамблей совпадают благодаря определению (3.56) статистического интеграла. Для функции распределения получаем окончательно 1 рЛър)=——7ы? Q + tlN-HN{q,p) kT (3.66) Если мы не интересуемся флуктуациями числа частиц N с учетом соотношения Q. + juN = F (см. (2.195)), распределения (3.36) и (3.59), а также (3.44) и (3.66) эквивалентны. 3.6. Распределение Максвелла. Распределение Максвелла непосредственно вытекает из распределения Гиббса для классического канонического ансамбля (3.25). Как известно, для большинства физических систем функция Гамильтона может быть представлена как сумма кинетической и потенциальной энергии системы, причем кинетическая энергия является квадратичной функцией только импульсов частиц, а потенциальная энер-
204 Часть II гия — функция только координат: H(q.p) = K(p) + U(q). (3.67) Исключение составляет случай, когда система находится в магнитном поле, но мы будем предполагать отсутствие магнитных полей. Распределение (3.25) записывается в виде p(q,p) = Aexp *(Р) кТ ехр - кТ (3.68) Оно разбивается на произведение двух множителей, один из которых зависит только от координат, а другой — только от импульсов. Это означает, что импульсы частиц в классическом каноническом ансамбле статистически независимы от координат, в том смысле, что значения, которые принимают координаты частиц, никак не влияют на распределение вероятностей их импульсов. Таком образом, р(ч,р)=р(ч)р(р); (3.69) Р(р) = — ехр К(Р) кТ ■-J ехр Чр) кТ dp', />Ы=—ехР U{q) кТ Zg=jexp кТ dq. (3.70) (3.71) (3.72) (3.73) Определения Zp и Zq (3.71), (3.73) обеспечивают нормировку на единицу вероятностей значений импульсов и координат. В то время как распределение для координат определяется потенциальной энергией взаимодействия частиц, распределение для импульсов в силу его статистической независимости оказывается универсальным, на его форму не влияет характер взаимодействия частиц. Поскольку кинетическая энергия системы равна сумме кинетических энергий составляющих ее частиц, распределение (3.70) допускает дальнейшую факторизацию: Р{р) = —ыр ( 1 N п2 "\ ^ 1 __LyJb_ Ltt_L I kTJ-ЦтА \}Z. ехр 2m,kT = ГИр,)(3-74)
3. Распределение Гиббса 205 Это подразумевает, что импульсы различных частиц статистически независимы, т. е. значения импульсов одних частиц не влияют на распределение вероятностей импульсов других. Поэтому можно говорить о распределении вероятностей для импульсов отдельных частиц. Опуская далее индекс /, нумерующий частицы, запишем (3.75) PiP)=ipexp[-^¥ z>=H-2m*r .2 Л ехр - 2 Л d3p = j]Jexpf-^:,^ \dpxdPydPz = 2ткТ 2mkT dp (3.76) Для вычисления нормировочного множителя мы ввели декартовы координаты в пространстве импульсов. Используя известную формулу для интеграла Пуассона dx = (3.77) при а- 1 2ткТ , получаем окончательно Zp=(27rmkT)2; р(р) = (2тгткТ) 2 ехр 2тпкТ (3.78) (3.79) Из распределения для импульсов мы можем получить распределение для скоростей отдельных частиц. Учитывая связь р = тп\, запишем распределение (3.75) как функцию скорости: >м-зК-£} <з-8о> При этом нормировочный интеграл Zv будет иметь уже другое значение. Его можно вычислить аналогично (3.76), Zv=jexp a v = v 2кТ [ехр \dv J I 2кТ) (2nkt { m J (3.81)
206 Часть II либо просто сделать замену рх = mvx, р = mv , pz = mvz в интеграле (3.76): Zp=JJJexp = /и3|}|ехр f р1 + р>р1л 2ткТ dpxdpdpz = 2\Л ™(vx2+v*+vz2) 2кТ (3.82) dvxdvydvz -m Zv. Из (3.82) и (3.78) получаем для Zv то же значение (3.81). Распределение />М -f—1 exp Г 2\ 2*7 (3.83) называется распределением Максвелла по скоростям (установлено Максвеллом в 1860 году, заметим, гораздо раньше, чем распределение Гиббса, из которого мы выводим распределение Максвелла, следуя сложившийся традиции). Из него следует распределение вероятностей для отдельных компонент скорости: P(v)=p(v>(v>(vJ; (3.84) w-Щё exp mv. ~2kf (3.85) ] = х->У-> z- Используя это распределение, вычислим средний квадрат компоненты скорости частицы: (v;)=Jv>(v>,=^Jv,'exp ( mj} 2kT dv, Нам необходимо вычислить интеграл вида d_'~ ^ da I da{L j d 1л___}_ Ы da\a 2a\a (3.86) (3.87) При а- m 2kT «>- m kT \2nkT kT 2nkT m\m m (3.88) Отсюда средняя кинетическая энергия, приходящаяся на одну степень свободы <«,>-#-£• (3.89)
3. Распределение Гиббса 207 На каждую степень свободы приходится одинаковая средняя кинетическая энергия. Этот результат известен как теорема о равнораспределении кинетической энергии по степеням свободы. Поэтому среднее значение кинетической энергии частицы (атома), имеющей три степени свободы, равна —кТ, средняя кинетическая энергия системы из N частиц равна кТ. Кроме распределения вероятностей для отдельных компонент скорости, из (3.83) можно также получить распределение вероятностей для абсолютного значения (модуля) скорости. Если мы умножим плотность вероятности (3.83) на элемент объема в пространстве скоростей, то получим вероятность того, что компоненты скорости частицы лежат в интервалах (vx, vx+rfvx), (vy9 vy+dvy), (v2, v2+rfv2): dw(\) = з [brkTJ 6XP m my ~~2kT) 2 ^ ( dvdvdv, = m \lKkT ) exp *Ж2^ m\ d\. (3.90) Если мы не интересуемся направлением скорости, а только ее абсолютным значением, введем сферические координаты в пространстве скоростей. При этом элемент объема d3v = v2dvsmOdOd(p. Интегрирование по всем направлениям (по углам в и (р) дает дополнительный множитель 4тг: dw(v) -An m 7 Г ехР .л \ m\ v2dv. (3.91) \1ккТ j Таким образом, функция распределения вероятностей для абсолютных значений скоростей есть з rf-^T "W=4<WJ"" m\ 2 Л 2кТ ) (3.92) mv Делая замену е-'^— в (3.91), мы получим функцию распределения веро- 2 ятностей для кинетической энергии отдельной частицы: dw(e) = 4тг m 2ккТ ехр е \2е de кТ) m yjlme = -j=(kT) 2 ехр 2 Л ( p{e) = -r{kT)2QxV -S-Ve. kT) (3.93) (3.94)
208 Часть П 3.7. Распределение Больцмана. Применяя распределение Гиббса к такому объекту, как идеальный газ, можно прийти к распределению Больцмана. Напомним, что идеальным газом называется система частиц, энергией взаимодействия между которыми можно пренебречь по сравнению с их кинетической энергией. Возможность такого пренебрежения обуславливается либо малостью взаимодействия между частицами, либо разреженностью газа. В этом случае энергия системы в целом является суммой энергий отдельных частиц. Это приводит к тому, что распределение Гиббса системы представляется в виде произведения распределений для отдельной частицы. я. = 2>*; (3.95) "»=п^=п^ехр(-;|} (з-9б) е^ — энергия /-й частицы в к-м квантовом состоянии, N— число частиц. Опуская индекс г, получаем вероятность того, что частица находится в квантовом состоянии с номером к. *шЫти} (397) Введем среднее число частиц в квантовом состоянии к, (пк). Wt=&t, (3.98) откуда о {nt) = At*p\--fi;J; (3.99) N А = -. (3.100) Распределение частиц идеального газ по квантовым состояниям (3.99) называется распределением Больцмана. Оно справедливо в случае, когда (л,)«1. (3.101) Это условие подразумевает, что в каждый момент времени в каждом квантовом состоянии фактически находится не более одной частицы. Выполнение этого условия обеспечивает возможность пренебречь как непосредственным силовым взаимодействием между частицами, так и специфическим обменным взаимодействием частиц, находящихся в одинаковых квантовых состояниях. Мы рассматриваем частицы как отдельные квази-
3. Распределение Гиббса 209 замкнутые системы, хотя они являются микроскопическими. Как мы помним, мы можем рассматривать подсистему как квазизамкнутую, если энергия ее взаимодействия с остальными частями системы значительно меньше ее внутренней энергии. Как правило, это условие выполняется для макроскопических подсистем, но в данном случае оно выполнено именно в силу того, что мы рассматриваем идеальный газ. Распределение (3.99) удовлетворяет условию нормировки Z("*) = ^- (3.102) Для того, чтобы определить значение нормировочного множителя А в (3.99), мы можем рассмотреть замкнутую систему как совокупность подсистем, состоящих из частиц, находящихся в одном и том же к-и квантовом состоянии. Каждая такая подсистема также является квазизамкнутой (статистически квазинезависимой), поскольку энергия взаимодействия составляющих ее частиц с частицами из других подсистем пренебрежимо мала. Отсутствует также квантовомеханическое обменное взаимодействие между подсистемами, которое затрагивает только частицы, находящиеся в одном и том же квантовом состоянии. С другой стороны, имеют место квантовые переходы, которые приводят к изменению числа частиц в каждой подсистеме и служат фактором установления равновесия между подсистемами. Каждая из подсистем будет описываться большим каноническим распределением (3.59), учитывающим процессы с изменением числа частиц: ^.^ftlfepJb]. (3103) Здесь пк — число частиц в подсистеме, екпк — энергия подсистемы, £1к — термодинамический потенциал подсистемы. Условие (3.101) подразумевает, что в квантовом состоянии с энергией ек наиболее вероятно отсутствие частиц, иными словами, вероятность полного отсутствия частиц в данном состоянии близка к 1: w0=expf|tj«l. (3.104) Тогда вероятности того, что в квантовом состоянии с энергией ек содержится одна и более частиц много меньше единицы, причем l«w0»w, »w2»...; (3.105) ^explgOexpfe^ (3.106)
210 Часть II Ы = 1>4 ~Ч = «Ч>(^) (3.107) Таким образом, значение нормировочного множителя в (3.99) (3.108) В случае если ек = 0, условие (3.101) накладывает следующие ограничения на химический потенциал: (и,) = ехр(^«1; (3.109) ju<0, ^»1. (3.110) Обратимся теперь к классической статистике. Если частицы идеального газа обладают потенциальной энергией, то она может быть обусловлена только внешними полями, но не взаимодействием частиц друг с другом, так что потенциальная энергия газа представляет собой сумму потенциальных энергий отдельных частиц, каждая из которых зависит только от координат данной частицы. Поэтому функция Гамильтона для идеального газа распадается на сумму функций Гамильтона для отдельных частиц. Соответственно, функция распределения представляется в виде произведения функций распределения отдельных частиц: Р{я,р) = -ехр Ё*'(*'А) N 1 =Пуехр ,=1 А кТ eMi>Pi) кТ (3.111) =Па(*эа)- Опуская далее индекс /, запишем одночастичную функцию распределения Р(я,р) = -ехр £{<1,Р) кТ (3.112) Введем среднее число частиц dN, приходящихся на элемент объема фазового пространства частицы: dqdp dN(q, р) = Np(q, p)dqdp = n(q, p) (inh)5' (3.113)
3. Распределение Гиббса 211 s — число степеней свободы частицы. Тогда среднее число частиц получается интегрированием (3.113) по фазовому пространству: (N) = \n(q,p) dqdp {27th)s (3.114) В (3.113) введена функция п(д,р), которую можно назвать плотностью частиц в фазовом пространстве. n(q,p) = Aexp кТ (3.115) Действуя аналогично тому, как это было сделано в случае квантовой статистики, можно убедиться в том, что нормировочный множитель А в (3.115) дается формулой (3.108): n(q,p) = exp 1Л-е{д,р) кТ (3.116) В самом деле, по определению среднее число частиц в некотором объеме фазового пространства есть (N) = JN(q,p)p(q,p)dqdp, (3.117) где N(q,p) — число частиц в элементе объема фазового пространства в окрестности точки с координатами (д, р). Перейдем от интегрирования по фазовому пространству к интегрированию по энергиям: dO. (N) = JN(e)pAe)^de. de (3.118) Теперь мы можем условно разбить полную систему частиц на подсистемы, в каждой из которых частицы обладают энергией от некоторого значения е до е + de. Каждая из подсистем будет описываться большим каноническим распределением (3.66): Р»П = 1 (2Щ гехр Q{£) + (ju-£)N{£) кТ (3.119) Поскольку мы рассматриваем идеальный газ, должно выполняться условие (W(f))«l (3.120) (среднее число частиц с определенным значением энергии чрезвычайно мало). Это аналог условия (3.101). Оно подразумевает, что функция рас-
212 Часть II пределения (3.119) достигает максимального значения при N(e) = 0. При этом р0(е) = ехр 'Q(g) кТ *1. (3.121) Основной вклад в интеграл (3.118) дадут те значения энергии е, для которых N(e) = l: А(*) = 1 [ //-£ 7ехр' (2лгй)5 I *Г <"> = (2яй)' jexp //-£^ JQ £Г Jate -а£ = ехр М-€{9>Р)' кТ dqdp (2тгП)5 (3.122) .(3.123) Сравнивая с (3.114), приходим к формуле (3.116), которая представляет собой распределение Больцмана, установленное для классической статистики в 1877 году. Рассмотрим несколько частных случаев. Если отсутствуют внешние поля, энергия частицы, а вместе с ней и функция распределения (3.112) не зависит от координат q. Проведя интегрирование по координатам в (3.113), получим среднее число частиц, приходящихся на элемент объема импульсного пространства: dN{p) = Np(p)d3p=- N У(2тгткТ)2 -ехр ImkT d3p. (3.124) Это можно рассматривать как иную форму распределения Максвелла по N импульсам (3.79), нормированную на — частиц в единице объема. Формула, эквивалентная распределению Максвелла по скоростям (3.83): I \2 dN(\) = Np(\)d3v -ц-. VKlKkT ехр тп\ ^кТ d\. (3.125) Рассмотрим теперь идеальный газ, находящийся во внешнем поле, в котором потенциальная энергия зависит от координат частицы. Функция распределения (3.112) распадается на произведение распределения по импульсам (скоростям) и распределения по координатам. Функция распределения по координатам позволяет определить среднее число частиц в элементе пространственного объема: dN(r) = nQQxp кТ d3r = n{r)d3r. (3.126)
3. Распределение Гиббса 213 Здесь п (г) — пространственная плотность числа частиц, п0 — плотность частиц в точках, где потенциальная энергия равна нулю: U(r)' п(г) = п0ехр кТ (3.127) Формула (3.127) известна как формула Больцмана. В частности, в однородном гравитационном поле, направленном по оси z, распределение плотности числа частиц по оси z определяется так называемой барометрической формулой: n(z) = nQQxp U(z) = *0exp|-^J, (3.128) kT U(z) = mgz, nQ — плотность частиц на уровне z = 0. 3.8. Энтропия больцмановского идеального газа. В случае квантовой статистики можно выразить энтропию идеального газа, подчиняющегося распределению Больцмана, через средние числа частиц в к-м квантовом состоянии. Для этого условно разделим все квантовые состояния отдельной частицы на группы, которые можно пронумеровать индексом j = 1, 2, Каждая из групп объединяет близкие квантовые состояния, которым соответствуют близкие энергии. Число состояний в каждой группе обозначим g,, оно должно быть достаточно велико. Пусть N, — число частиц, находящихся в состояниях, принадлежащих группе j. Оно также должно быть велико. Набор чисел {лг} полностью характеризуют макросостояние идеального газа. Каждая группа из N} частиц образует независимую подсистему. Условие (3.101) подразумевает, что число частиц в каждой группе много меньше числа состояний, N,«: gj. Все частицы распределены по различным состояниям независимо друг от друга, при этом большинство состояний остается незаполненными. Поскольку каждая из N j частиц может занимать одно из g. квантовых состояний, всего имеется g-j способов распределить частицы изу-й группы по квантовым состояниям. При этом, однако, не учитывается тождественность частиц. Деля на число перестановок частиц N j!, получим число микросостояний, которые могут занимать частицы из каждой подсистемы, т. е. ее статистический вес Г : Nj Г,=^- (3.129) J Nj\
214 Часть И Поскольку каждая группа из N, частиц является независимой подсистемой, статистический вес системы в целом в соответствии с (1.140) есть г=Пг,- (злз°) j При этом энтропия Nj 5- = НпГ = Л:]Г1пГу=Л:£Ы^- = J J Nr (3.131) = kZ{Njhigj-hiNj\) = ky£{Njhigj-NjhiNj+NJ). j J Здесь мы воспользовались формулой Стирлинга, в соответствии с которой \nNl~N\nN-N. (3.132) Можно определить среднее число частиц, находящихся в каждом квантовом состоянии у-й группы: М=—• (злзз> Обратимся к частному случаю, когда каждая группа квантовых состояний содержит единственное квантовое состояние с энергией ек. Тогда для любого j gj = l- Мы должны заменить N j средним числом частиц, находящихся в к-м квантовом состоянии, (пк). Из (3.131) в этом случае следует 5=*£(("*)-W4"*»- с3-134) к Это и есть искомая формула, которая выражает энтропию идеального газа через средние числа частиц в квантовых состояниях. Далее при рассмотрении статистики ферми- и бозе-газов, учитывающем квантовые эффекты обменного взаимодействия частиц, мы увидим, что в пределе, соответствующем условию (3.101) для энтропии ферми- и бозе-газов справедлива формула (3.134). 4. Идеальный газ 4.1. Термодинамика идеального газа. Частицы идеального газа представляют собой молекулы, обладающие поступательными, колебательными и вращательными степенями свободы. Поступательное движение молекул носит квазиклассический характер. При этом из полной энергии частицы ек можно выделить часть, соответствующую поступательному дви-
4. Идеальный газ 215 жению, а остальная часть энергии ек в отсутствие внешнего поля не зависит от координат и импульсов центра инерции молекулы: (4.1) р 2т Чтобы посчитать нормировочный множитель в распределении Гиббса, который входит в выражение для свободной энергии (см. (3.37)), необходимо взять статистический интеграл по квазиклассическим степеням свободы каждой молекулы и просуммировать по квантовым: *Лр)~ :ZjexP = V {1кткТ) кТ dqdp (2яй) (2яЛ) Г I кТ) {2жП2) V I кГ, (4.2) С учетом тождественности частиц для газа, содержащего N частиц, получаем F = -kT In Z = -kT In Z=—Z?; ±г*(аи_у Zexp г / i\" ek kT. )\ Вновь используя формулу (3.132), запишем F = NkT\nN-NkT-NkT\n vt mkT\i yiKb1) Zexp kT (4.3) (4.4) (4.5) Без каких-либо предположений о свойствах молекул невозможно вычислить сумму в (4.5). Однако известно, что она зависит только от температуры, но не от объема. Наиболее общее выражение для свободной энергии идеального газа имеет вид F = NkTlnN -NkT -NkTXnV -MTln = NkT\nN-NkT-NkT\nV + Nf(T). Согласно (2.57), fSTz \27th1) ^eXPl kT, (4.6) (4.7)
216 Часть II Отсюда получаем уравнение состояния идеального газа PV = NkT. (4.8) Зная выражение для свободной энергии, можно определить другие термодинамические функции. Для термодинамического потенциала Ф из (2.62) получим Ф(Л T) = F + PV = F + NkT = NkT\n— + Nf(T) = = NkT]n— + Nf(T) = NkT]nP-NkT\nkT + Nf(T)= (4.9) = NkT\nP + Nx{T)\ Z{T) = f{T)-kT\nkT. (4.10) Энтропию можно выразить либо как функцию переменных V, Т, либо как функцию переменных Р, Т. Из (2.56) следует '<?.*-{£ из (2.63): = -Nk\n— + Nk-N^; (4.11) V dT V ' S(P, T) = -\^] =-NkhiP-N^-. (4.12) дТ)р dT Энергия в соответствии с (2.54) есть E = F + TS = Nf(T)-NT^. (4.13) dT Энтальпия в соответствии с (2.46) есть W = E + PV = E + NkT = Nf(T)-NT^+NkT. (4.14) dT Таким образом, энергия и энтальпия являются функциями только температуры и числа частиц. Поскольку частицы идеального газа не взаимодействуют друг с другом, изменение объема газа, которое влечет за собой изменение среднего расстояния между частицами, не влияет на значение энергии газа. В соответствии с формулами (2.39) и (2.52),
4. Идеальный газ 217 теплоемкости при постоянном объеме и при постоянном давлении есть также функции только от температуры и пропорциональны числу частиц. В соответствии с формулами (2.94), (2.96) для идеального газа cp-cv = m. (4.16) 4.2. Идеальный газ с постоянной теплоемкостью. Рассмотрим частный случай, когда теплоемкость идеального газа является постоянной величиной, не зависящей от температуры. Это имеет место в определенных интервалах температур. Дифференцируя (4.13) по температуре, найдем d2 f Cv=-NT—±r. (4.17) v dT2 Считая теплоемкость постоянной, проинтегрируем (4.17) и определим функцию f(T): ^ = _^Г^ = _^1пГ + Со. (4.18) dT NJ T N ° v ' f(T) = -^rj]nTdT + c0T + e0 = (4.19) = -^ТЫТ + \^ + с0 N [N ° Т + £0=-^ТЫТ-£Т + £0, N cQ, £Q, £ — постоянные; £ носит название химической постоянной газа. Подставим (4.19) в (4.6): F = NkT\bN-NkT-NkT\nV + Nf(T) = v ' (4.20) = NkT\nN-NkT-NkT]nV-CvT\nT-NCT + N£0. Подставляем в (4.13): E = Nf(T)-NT^ = JK } dT (4.21) = -CvT]nT-N£T + N£0+CvT]nT + CvT + N£T = N£0 + CvT. Термодинамический потенциал Ф получаем, подставляя (4.19) в (4.9) и используя (4.16): Ф = ЖТЫР-ЖТЫкТ + Ы/(Т) = = NkT]nP-NkT\nkT-CvT]nT-N£T + N£0= (4.22) = NkT\nP-CpT\nT-N£T + N£0. Выражение для энтальпии: W = E + PV = E + NkT = N£0+CvT + NkT = N£0+CpT. (4.23) Энергия и энтальпия оказываются линейными функциями температуры.
218 Часть II Наконец, для энтропии получаем следующие выражения в переменных У,ТиР, Г соответственно: S(V, T)=- — =-Nk\nN + Nk + Nk\nV + Cv]nT + Cv+NC = V } \ЪТ)у v (4.24) = -Nk]nN + Nk\nV + Cv]nT + Cp+N£; S(P, T) = -(— J = -NklnP+CplnT + Cp+N(;. (4.25) Поскольку в адиабатическом процессе энтропия не изменяется, приравнивая энтропию к нулю, можно получить уравнение адиабаты для идеального газа. Из (4.24) следует MlnF + C^ln7, = const; (4.26) Nk —In V + In T = const; (4.27) Су ^"^lnF + lnr^const; (4.28) Су (7-l)lnF + ln7, = const; r= — l (4-29) Cv TVM= const. (4.30) Аналогично, из (4.25) получаем -№ЫР + СРЫТ = const; (4.31) -—lnP+^-ln7, = const; (4.32) (l-^)lnP + ^lnr = const; (4.33) Pl~rTr = const. (4.34) 4.3. Классический идеальный газ. С классической точки зрения каждая молекула представляет собой конфигурацию атомов, совершающих малые колебания возле положений равновесия. Молекула, состоящая из п атомов, имеет Ъп степеней свободы, из которых 3 отвечают поступательному движению молекулы, и 3 — ее вращательному движению как целого. В общем случае л-атомная молекула имеет Ъп - 6 колебательных степеней свободы. Исключением является случай линейной молекулы, когда все атомы молекулы расположены на одной прямой. Примером такой молекулы является двухатомная молекула. У линейной молекулы только две вращательные степени свободы, соответственно, линейная л-атомная молекула имеет Ъп - 5 колебательных степеней свободы. При п = 1 частица газа
4. Идеальный газ 219 состоит из одного атома, который обладает тремя поступательными степенями свободы, в то время как вращательные и колебательные степени свободы отсутствуют. Поступательное и вращательное движение связано с наличием только кинетической энергии, которая является квадратичной функцией импульсов. Колебательное движение связано с наличием как кинетической, так и потенциальной энергии, последняя является квадратичной функцией координат. Соответственно, для описания поступательного и вращательного движения необходимы только переменные типа «импульс», тогда как для описания колебательного движения необходимы и импульсы, и координаты. Получается, что на каждую колебательную степень свободы приходится в два раза больше переменных, чем на каждую поступательную или вращательную. В полной энергии молекулы можно выделить части, соответствующие поступательному, вращательному и колебательному движению: ^Р) = е0+€пост{р) + €вращ{р) + €кол{д9р). (4.35) €0 отвечает квантовым степеням свободы. Полное число переменных в выражении (4.35): / = 3 (поступательное движение) + 3 (вращательное движение) + + 2(Зя — 6) (колебательноедвижение) = 6 + 6п — \2 = 6п — 6 • Для линейной молекулы полное число переменных будет / = 6л - 5, для одноатомного газа 1 = 3. Статистический интеграл будет иметь вид Zo=exp(-^7]fexp 5 (Я> Р) кТ \(2тгП) dqdp (4.37) £\ (я* р) — квадратичная функция своих переменных. Проведем в интеграле замену переменных: р = р'у1т, q = q'jT. (4.38) Поскольку £t(q, p) — квадратичная функция, то el{q9p) = Tel(q'9p'); (4.39) dp = y[Tdp\ dq = >lTdq\ (4.40) i_ i_ dqdp = dQ = T2dQ' = T2dq'dp'; (4.41) .A] kT) Z0=cap|-g:l^Jexp -те№>р') к '] (2/гй) dq'dp' (4.42)
220 Часть И Интеграл в (4.42) оказывается не зависящей от температуры постоянной. Учитывая, что интегрирование по координатам центра инерции молекулы, соответствующим ее поступательному движению, дает доступный частице объем V, получим Z0=AVT*exp(-j±). (4.43) Свободная энергия F = -kT]n(—^Z? ) = NkT]nN-NkT-NkT]n AVT2Qxp{-^- 1 кТ = NkT]nN-NkT-NkT]nA-NkT]nV--NkT)nT + FQ(T) (4.44) FQ(T) отвечает квантовым степеням свободы. Сопоставим (4.44) с формулой (4.20), полученной для газа с постоянной теплоемкостью, мы видим, что коэффициент при -Г In Г есть Сг=1-М. (4.45) Тот же результат можно получить из (4.44), последовательно вычисляя энтропию, а затем теплоемкость: S = -|t^| =-Nk]nN + Nk + Nk]nA + Nk]nV + (4.46) + -М1пГ+-М + 50(Г); ЪТ jv ft.rT^ ' "V ' \ът. = -Ж + С0{Т); (4.47) Cp = Cy+Nk =—Nk + C0(T). (4.48) Опуская зависимость от температуры, связанную с квантовыми степенями свободы, для теплоемкости при постоянном объеме получаем (4.45), и для теплоемкости при постоянном давлении — СР=^Ж. (4.49) Таким образом, классический идеальный газ обладает постоянной теплоемкостью. Энергия классического идеального газа: E = F + TS = -NkT. (4.50)
4. Идеальный газ 221 Для каждой молекулы, каждой из / переменных, которые входят в квадратичную функцию £x{q, р), соответствует равная доля — в выражении для кТ теплоемкости при постоянном объеме, и равная доля — в выражении для энергии. Этот вывод известен как закон равнораспределения. Когда мы рассматривали распределение Максвелла, мы уже показывали, что на каждую степень свободы приходится кинетическая энергия, равная — (см. (3.89)). Теперь мы можем уточнить этот результат, учитывая, что с каждой колебательной степенью свободы связана не только кинетическая, но и потенциальная энергия, поэтому каждая колебательная степень свободы классического идеального газа вносит вдвое больший вклад в его энергию и теплоемкость, чем поступательные и вращательные степени свободы. Из формул (4.46) — (4.48) следует, что ни энтропия, ни теплоемкость не обращаются в нуль при Т —> 0. Это кажется противоречащим теореме Нернста. Однако идеальный газ не может рассматриваться при достаточно низких температурах: понижение температуры приводит к его конденсации. Для газов, в которых учитывается взаимодействие частиц, в частности обменное взаимодействие, статистика Больцмана перестает быть справедливой. Такие газы подчиняются статистике Ферми или Бозе и, как мы увидим в дальнейшем, удовлетворяют теореме Нернста. 4.4. Учет квантовых степеней свободы. Одноатомный идеальный газ. Нашей дальнейшей задачей является учет квантовых степеней свободы молекулы для того, чтобы точно или приближенно вычислить статистическую сумму, которая входит в формулу (4.5). Прежде всего необходимо иметь в виду возможное вырождение уровней энергии, тогда соответствующий член в сумме должен быть учтен столько раз, какова кратность вырождения. Обозначим кратность вырождения k-то энергетического уровня gk, тогда статистическая сумма в (4.5) примет вид Начнем с рассмотрения наиболее простого случая, каким является одноатомный газ. По мере повышения температуры в газе растет число возбужденных и ионизированных атомов. Газ оказывается почти полностью ионизированным при температурах, сравнимых с энергией ионизации. Разность энергий первого возбужденного и основного уровней также сравнима с энергией ионизации. Поэтому при температурах, значительно
222 ЧАСТЫ! меньших энергии ионизации, в газе будут отсутствовать как ионизированные, так и возбужденные атомы, и газ можно рассматривать как состоящий из атомов в основном состоянии. Если атомы в основном состоянии не обладают ни орбитальным, ни спиновым моментом (L = S = 0), основное состояние не вырождено. Статистическая сумма сводится к единственному члену, соответствующему энергии основного состояния. Если энергию основного состояния выбрать за начало отсчета, е0 = 0, то (4.52) Z' = e"l-*?='• Подставляя (4.52) в (4.5), получим F = NkT\nN-NkT-NkT\n \2жП2) (4.53) = NkT]nN-NkT-NkT\nV--NkT\nT--NkT\n\-^r 2 2 \lnti1 Сопоставляя с (4.20), мы можем определить значения теплоемкости при постоянном объеме и химической постоянной: Cy=-Nk; У 2 г 3 ,, ( тк ^ С=-кЫ 2 12яЛ2 (4.54) (4.55) Учитывая, что частицы одноатомного газа обладают только тремя поступательными степенями свободы, (4.54) соответствует (4.45) при / = 3. При условии отсутствия возбужденных атомов квантовые степени свободы себя не проявляют, не оказывают влияние на значения термодинамических величин. Если атом обладает отличным от нуля спином S (примером являются атомы в парах щелочных металлов), кратность вырождения основного состояния есть 2S' + 1. Вместо (4.52), (4.53) будем иметь Z, = 25 + l; F = kTlnN - NkT - NkTkiV --МсТЫТ - 2 —МГ1п 2 mk \2жП2 (4.56) (4.57) -МГ1п(25Ч1).
4. Идеальный газ 223 Соответственно, для химической постоянной получаем (4.58) Атом может обладать тонкой структурой энергетических уровней, обусловленной спин-орбитальным взаимодействием. Каждый подуровень тонкой структуры характеризуется значением квантового числа J полного момента импульса электрона, J = L + S . При этом каждый подуровень имеет кратность вырождения 2J +1. Поэтому статистическая сумма запишется следующим образом: (4.59) f e Л ^-' = 1. Тогда В случае высоких температур, когда е3 <^ikT, ехр необходимо вычислить сумму кТ (4.60) Z'= X (2У + 1). J=\L-S\ Пусть для определенности L>S. При этом сумма (4.60) содержит 2S +1 слагаемое. L+S L+S Z'= £ (2J + 1) = 2 X / + 25 + 1 = J=L-S J=L-S = 2[(L-S) + (L-S + l) + ... + (L + S-l) + (L + S)] + 2S + \ = (4.61) = 2Z,(2S,+ 1) + 2S, + 1 = (2Z, + 1)(2S, + 1). При S > L сумма содержит 2L +1 слагаемое, ответ получается тот же самый. Этому случаю соответствует значение химической постоянной 2 тпк brh2 -*ln[(2I + l)(2S + l)]. (4.62) Напротив, в случае низких температур £у » AT. В сумме (4.59) можно пренебречь всеми членами, за исключением слагаемого, соответствующего минимальному значению энергии. Выбирая это минимальное значение за начало отсчета энергии, получим Z* = 2J + l; (4.63) C=hiJ-mk л \2пЬг + А1п(2У + 1). (4.64)
224 Часть И Теплоемкость газа при достаточно низких и достаточно высоких температурах имеет одинаковое постоянное значение. В промежуточном интервале температур теплоемкость, вообще говоря, зависит от температуры. Аналогично можно учесть наличие у атома ядерного спина /, которое приводит к сверхтонкому расщеплению уровней энергии. Интервалы между подуровнями крайне малы, так что при всех температурах, при которых вещество существует в газообразном состоянии, можно считать, что е1<^кТ. Разностью энергий между подуровнями можно пренебречь и считать, что сверхтонкая структура приводит к дополнительному вырождению всех уровней, кратному 21 +1 . Это приводит к дополнительному вкладу в химическую постоянную <Г0=*1п(2/ + 1), (4.65) а также в свободную энергию и энтропию. На теплоемкость газа учет сверхтонкой структуры не оказывает влияния. 4.5. Двухатомный идеальный газ. Перейдем к рассмотрению двухатомного газа. Его имеет смысл рассматривать при температурах, малых по сравнению с энергией диссоциации молекулы. Мы будем рассматривать основное состояние молекулы по тем же причинам, по которым рассматривалась основное состояние частиц одноатомного газа. Обратимся к случаю, когда молекула газа не имеет орбитального момента (Л = 0), так же, как и спинового момента (5 = 0). Энергию основного состояния такой молекулы можно представить в виде суммы энергии взаимодействия электронов и ядер, вращательной энергии молекулы и энергии колебаний ядер вблизи положения равновесия. Соответственно, статистическая сумма распадается на произведение сумм, отвечающих вращательной, колебательной и другим видам энергии. Начнем с рассмотрения вращательной энергии. Вращательная энергия является частью кинетической энергии. Как известно из механики, кинетическую энергию системы частиц можно представить в виде * = I^ = I^(V + hrJ)2 = (4.66) =Z*.T-+Z*.(v[-r.])+Z^er-l2' а *• а а *• \а = V + [сога ] — скорость а-й частицы, V — скорость поступательного движения центра масс, <о — угловая скорость вращения системы как целого, та — радиус-вектор а-й частицы. Раскрывая квадрат в (4.66), мы видим, что первый член представляет собой энергию поступательного движения системы частиц как целого, второй можно обратить в нуль, если выбрать
4. Идеальный газ 225 систему координат, начало которой совпадает с центром масс. В самом деле, радиус-вектор центра масс определяется формулой R = -^ (4.67) а и обращается в нуль в выбранной системе координат. Второй член в (4.66) можно преобразовать следующим образом: E^(VK]) = Z^(r<.[V«)]) = f[V«)],X^rl = 0. (4.68) а а \ а ) Преобразуем третье слагаемое в (4.66): а а = IX (ЗА- - 8j.Su)Цх^щх^ = ]Г/и, (амхъхы -CDjC^x^Xj,,) = V I * \ ' (469) а = &,Щ ^та (3**Л ~ XjaXka ) = IцЩЩ, а Здесь использована формула для свертки двух символов Леви-Чивиты еикеит = 8}18ы - SjmSkl, (4.70) а также определение тензора инерции '» = 5>. (*»**** "**.*>.)• (4-71) а Таким образом, энергия вращательного движения есть К^=^10ЩО)Г (4.72) С другой стороны, через тензор инерции может быть выражен момент импульса системы: M=Br.p>E*.fctaJ]=EM^-r>0); (4.73) а а а Mi=lLma{COiXkaXka -Xia^jXja) = ^jyZma{SijXkaXka ~ XiaXja) = Iij^j 'С4'74) a a Если выбрать ось z вдоль оси двухатомной молекулы, которая представляет собой линейную систему, частицы которой располагаются вдоль прямой
226 Часть II линии, ее тензор инерции примет диагональный вид, причем два главных значения тензора будут равны между собой, а третье главное значение равно нулю, т. е. тензор инерции линейной системы является симметрическим. Момент импульса такой системы будет иметь только две составляющих, направленных вдоль осей х и у: /,=diag(/,/, 0); (4.75) М,=1щ, М2=Щ. (4.76) Энергия вращательного движения линейной молекулы ^=±/(^+^) = ^(М?+М2)=^М2. (4.77) Переходя к квантовому рассмотрению, мы должны учесть, что собственные значения оператора квадрата момента импульса есть h2K(K+l), где К— это так называемое вращательное квантовое число, соответствующее полному моменту импульса молекулы, который складывается из орбитального момента электронов и момента вращения ядер. К может пробегать любые целочисленные значения. При заданном значении К энергетический уровень вырожден по направлению полного момента, кратность вырождения равна 2К +1. Поэтому часть статистической суммы для одной молекулы, связанная с вращательными степенями свободы имеет вид ^=£(2* + 1)ехр h2K(K+i) 2IkT (4.78) П2 Рассмотрим сначала случай высоких температур, когда Т»— .В силу Ik малости величины — основной вклад в сумму (4.78) вносят члены Ik с большим значением К. Тогда К велико по сравнению с единицей, и в этом приближении сумму (4.78) можно заменить интегралом Z4xm=2]KeJ-^]dK. (4.79) 2IkT Интеграл вида Ixe'^dx (4.80)
4. Идеальный газ 227 без труда вычисляется, если сделать замену переменной х2 = у, 2xdx = dy: = 1. (4.81) а 2Jxe-a'2dx = \eaydy = -—е п п I* h2 В (4.79) а = , так что 21кТ 21кТ Zepm=—T- (4.82) Заметим, что в точности такой же результат получается, если вместо статистической суммы (4.78) вычислить статистический интеграл по фазовому пространству, поскольку случай больших К соответствует квазиклассическому пределу. Роль обобщенных координат здесь играют углы поворота фх и ф2 вокруг осей х и у. Формулу (4.77) можно переписать как Kw=±l{tf+tf), (4-83) откуда видно, что обобщенные импульсы, сопряженные угловым координатам, — это составляющие момента импульса (см. (1.9)): Эй Эр, / = 1, 2. Таким образом, статистический интеграл будет иметь вид Z„ = JJrf^ft J JехРГ--1-(М1Ч^)1^^ 2IkT" (2тгП) (4.85) Интегрирование по углам поворота даст полный телесный угол, равный 4п. Оставшийся интеграл распадается на два интеграла типа интеграла Пуассона (3.77) с а = . В результате получаем что совпадает с (4.82). При высоких температурах вклад вращательных степеней свободы в свободную энергию газа из N молекул есть Кащ =-AftrinZ =-NkTbT-NJcT]n(^\ (4.87) вращ вращ Сопоставляя с общим выражением (4.20) для свободной энергии идеального газа с постоянной теплоемкостью, мы видим, что вращательные степени свободы дают вклад в теплоемкость при постоянном объеме, равный М:,
228 Часть II - м (21кЛ и вклад в химическую постоянную, равный кш\ —— . ступательных степеней свободы, получим Cv=-Nk; Cp=-Nk; F 2 Р 2 2 \1кП2) \П2 J Учитывая вклад по- (4.88) (4.89) В случае низких температур при Т <с — в статистической сумме (4.78) Ik основной вклад дают первые члены разложения. Оставляя только первые два слагаемых, будем иметь Z_=l + 3exp - Ь2 Л IkT FeDam=-NkT]n вращ 1 + Зехр IkT Используя формулу In (1+ *)=**, справедливую при малых значениях х, находим F^^-ЗМТехр { т\ (4.90) (4.91) (4.92) (4.93) Для того чтобы получить теплоемкость, необходимо сначала вычислить энтропию газа. dF °вращ jj, = ЗМехр вращ~ ~1т~ -- ЗМ ехр I от) + 3NkTexp IkT Ь.2 \ 1+- ТкТ ■ ЗМсТехр Ъ.2 \ IkT п2 f h IkT2 { IkT Ь.2 \ IkT 2 Л IkT2 (4.94) + ЗМГехр Ь2 Л -1 IkTj{ IkT2 h2 ■-3Nk\ [IkT exp - Ъ.2 \ (4.95) IkT В случае если молекула состоит из одинаковых атомов, существует ряд особенностей, которые необходимо учитывать при детальных вычислениях: возможные перестановки атомов, влияние их ядерного спина и другие.
4. Идеальный газ 229 Теперь поговорим о колебательной энергии. Двухатомная молекула имеет только одну колебательную степень свободы (поскольку число колебательных степеней свободы линейной молекулы равно Ъп - 5). Интервалы между колебательными уровнями значительно больше, чем между уровнями вращательной структуры молекулы, поэтому вклад в энергию колебаний проявляется при более высоких температурах. Если возбуждены не слишком высокие колебательные уровни, колебания можно рассматривать как малые колебания гармонического осциллятора. Как известно, спектр гармонического осциллятора имеет вид йт4г колебательное квантовое число, а соответствующая часть статистической суммы для отдельной молекулы I v + — I l = exDl — кТ z™=ZexP v ехр| ~ш)1>Л~~кТ (4.96) Сумма в (4.96) представляет собой геометрическую прогрессию с ?0=ехр так что кТ Яо ( Псо 1-ехр - Ьсо Вычислим термодинамические величины для газа из N молекул: Ьсо (4.97) (4.98) F =-NkT\n КОЛ ехр - 2кТ 1-ехр - Ьсо "кт = N—+NkT\n 2 l-exp|-f (4.99) dF dT 1-exp ha "kT + NkT- .ехрЫ ha) 1-exp - fl(Q kTj (4.100) = -Mfcln 1-exp fico "kT + N fico ехрШ~1
230 Часть II Е =F +TS =N—+- ^кол кол ^кол ■"« Nhco expBD_l с = dE™ = «. dT Nhco exp|f |-1 N_fno)X (tuo _ex (ha)) h0} - k v Г J eykT exp ■1 (4.101) (4.102) В низкотемпературном пределе (йй)»Г), используя формулу (4.92), получаем для свободной энергии Fm=N МГехр , "" 2 Ч *Г/ а теплоемкость обращается в нуль по экспоненциальному закону: Nfhu)']2 ( Псо с-=т{т)ехрЫ, В высокотемпературном пределе (haxzT), раскладывая экспоненту в ряд и ограничиваясь двумя первыми членами разложения, (4.103) (4.104) ехр Ь(0 Ь(0 кТ) ' кТ получаем f =ы-+тты(^)=м^+жт\п(^)- тЬсо ~2~ \кТ) 2 С =М. \ к (4.105) ЖТЫТ; (4.106) (4.107) Мы видим, что в пределе высоких температур теплоемкость постоянна. Сопоставление с общим выражением (4.20) показывает, что колебательные степени свободы дают вклад в теплоемкость, равный М:, и вклад в химическую постоянную, равный — к\п\ — . Учитывая вклад поступательных и вращательных степеней свободы (4.88), (4.89), получим Cv=-Nk; Cp=-Nk; F 2 ' 2 •Лш{. mk \2лЪг +к ifY ш Ьоо = *ln 21k2 (mk Ь(о\1л) (4.108) (4.109)
4. Идеальный газ 231 Выражения (4.108) согласуются с формулами (4.45), (4.49) для двухатомной молекулы, имеющей три поступательных, две вращательных и одну колебательную степень свободы. Выражение (4.106) для свободной энергии, справедливое в пределе вы- / ыПо) соких температур, можно получить (с точностью до члена N —, представляющего энергию нулевых колебаний), вычислив статистический интеграл для классического гармонического осциллятора: z-=i?exp ~2 ^ ~ ( -W-2 2ткТ) г J M 2кТ р г шбСГх *JH"^r= = yllKmkTA^—z- 2пЬ V mar 2я£7; = £7\ id fico (4.110) FKojl = NkT]n\—}-NkT]nT. (4.111) V к Учет не равного нулю орбитального и спинового моментов проводится аналогично тому, как это было сделано в случае одноатомного газа. Так, например, если двухатомная молекула обладает отличным от нуля спиновым моментом S, это приводит к расщеплению на 2S + 1 подуровней. Если при этом орбитальный момент равен нулю (Л = 0), интервалами энергий между подуровнями чрезвычайно мала, так что ими можно пренебречь и считать, как мы это уже делали ранее, что данная структура приводит к дополнительному вырождению, кратному 2S +1. Это приводит к дополнительному вкладу в химическую постоянную Cs=k\n{2S + \). (4.112) Если Л Ф 0, интервалы между подуровнями тонкой структуры уже достаточно велики, так что их учет требует дополнительного рассмотрения. 4.6. Многоатомный идеальный газ. Коротко рассмотрим многоатомный газ. Его энергия складывается из поступательной, вращательной, колебательной и энергии квантовых степеней свободы. Вклад энергии поступательного движения в теплоемкость при постоянном объеме и химическую постоянную определяется формулами (4.54), (4.55). Многоатомные молекулы, как правило, обладают тремя вращательными степенями свободы, а их моменты инерции (главные значения тензора инерции) достаточно велики, так что их вращательное движение можно рассматривать квази- классически. Энергия вращательного движения такой молекулы есть *_=^+^+^. (4.ПЗ) вращ 21, 212 21ъ
232 Часть II Это выражение записано в системе координат, оси которой совпадают с главными осями инерции молекулы. Статистический интеграл: вращ 1 а{2пЬ) xjjjexp -jjjd(pxd(p2d(p3x 2кт{ I, I2 /3 (4.114) dM,dM2dM3. Если молекула обладает осями симметрии, повороты вокруг этих осей приводят к перестановке атомов молекулы. Интеграл в (4.114) делится на число а — число возможных поворотов, которые приводят к физически неразличимым ориентациям молекулы. Интегрирование по углам поворота q\, <р2 дает полный телесный угол, равный 4ж. Интегрирование по третьему углу <р3 дает 2ж. В результате получаем Z = 8л-2 1 о\2кп) on Вклад вращательных степеней свободы в свободную энергию: Г L,, Л Fepm=-NkT\nZepaui=--NkT]nT-NkT\n ^кък1х121 (4.115) (4.116) Учитывая вклад поступательных степеней свободы, имеем Cv=3Nk; Cp=4Nk] г 3 ,, ( тпк С=-кЩ : 2 \2jth2 + к\п {^къж1х121 стП3 (4.117) (4.118) Если многоатомная молекула является линейной, она имеет две вращательные степени свободы, а ее тензор инерции определяется формулой (4.75). Для теплоемкости в этом случае справедливы соотношения (4.88), а химическая постоянная определяется выражением с 2 \2кпг) \ati-) (4.119) которое отличается от (4.89) только появлением фактора с, учитывающего возможные перестановки атомов. Многоатомная молекула имеет Зп—6 колебательных степеней свободы (Зя — 5 для линейной). Каждая степень свободы соответствует одному из нормальных колебаний молекулы с определенной частотой (Оа. При доста-
5. Распределения Ферми и Бозе 233 точно низких температурах колебания можно считать малыми, в этом приближении все нормальные колебания независимы, колебательная энергия представляет собой сумму энергий отдельных колебаний. Статистическая сумма распадается на произведение статистических сумм вида (4.98), соответствующих каждому колебанию, а свободная энергия определяется формулой -+МГ£1пР ( h<D" F =NY?0}" * кол -1 т j^ 1-ехр кТ (4.120) где проводится суммирование по всем нормальным колебаниям. 5. Распределения Ферми и Бозе 5.1. Распределение Ферми. Теперь мы займемся изучением свойств газа частиц при учете обменного взаимодействия. Как и при выводе распределения Больцмана, мы будем рассматривать систему частиц как совокупность подсистем, состоящих из частиц, находящихся в одном и том же к-м квантовом состоянии. Поскольку отсутствует обменное взаимодействие между подсистемами, которое затрагивает только частицы, находящиеся в одном и том же квантовом состоянии, каждая подсистема является квазинезависимой и описывается большим каноническим распределением (3.103): *Ч=ехр 0*+(//-£*К z*=Zexp кТ 1 =—ехр кТ кТ =ехр| "^ (5.1) (5.2) Как известно из квантовой механики, обменное взаимодействие носит различный характер для частиц с полуцелым и целым спином. Частицы с полуцелым спином подчиняются принципу запрета Паули, согласно которому в одном и том же квантовом состоянии не может одновременно находиться более одной частицы. Обменное взаимодействие частиц с полуцелым спином носит характер отталкивания. Напротив, обменное взаимодействие частиц с целым спином носит характер притяжения, что проявляется в том, что в одном и том же квантовом состоянии могут находиться сколько угодно частиц. Эти свойства определяют статистические распределения для тех и других частиц. Для частиц с полуцелым спином статистическая сумма (5.2) содержит всего два слагаемых: ~(м-£к)"к z* = Z exP л4=0,1 кТ = 1 + ехр кТ (5.3)
234 Часть II Термодинамический потенциал подсистемы: Clk=-kT\nZk -кТ\п 1 + ехр { кт у (5.4) Согласно формуле (2.199) среднее число частиц в подсистеме можно найти, взяв производную от (5.4) по химическому потенциалу JU с обратным знаком: \ez£l , i 3Q, 6ХР[ кТ 1 + ехр кТ ехр кТ (5.5) + 1 Последняя формула известна как распределение Ферми, также говорят, что частицы с полуцелым спином подчиняются статистике Ферми-Дирака. При одинаковой температуре среднее число частиц, определяемое распределением Ферми (5.5) меньше, чем среднее число частиц, определяемое распределением Больцмана (3.107). Этот факт является следствием обменного взаимодействия, выраженного в принципе запрета Паули. При условии ехр <cl, которое соответствует (3.101), распределение Ферми V кТ ) переходит в квантовое распределение Больцмана (3.107). Распределение Ферми удовлетворяет условию нормировки (3.102). Поскольку термодинамический потенциал Q есть величина аддитивная, термодинамический потенциал ферми-газа в целом есть сумма термодинамических потенциалов подсистем: 0 = £0,=-*Т]Г1п 1 + ехр кТ (5.6) 5.2. Распределение Бозе. Для частиц с целым спином статистическая сумма (5.2) имеет вид z* = ZexP пк=0 кТ (5.7) Она представляет собой геометрическую прогрессию с показателем #0=ехр , который заведомо меньше единицы при ju<0, в этом случае сумма (5.7) сходится при любых значениях ек, в том числе £к=0. Для газа, подчиняющегося статистике Больцмана, химический потенциал
5. Распределения Ферми и Бозе 235 всегда имеет отрицательные, но большие по абсолютной величине значения (см. (3.110)), в то время как для ферми-газа мы подобных ограничений не обнаружили. Используя формулу (4.97), получаем 1 **=- 1—ехр £lk=-kT\nZk=kT\n аг» ехР| - кТ 1-ехр M~et кТ dQt О кТ Ъц 1 —ехр кТ ехр кТ (5.8) (5.9) (5.10) -1 Эта формула определяет распределение Бозе, говорят, что частицы с целым спином подчиняются статистике Бозе—Эйнштейна. При одинаковой температуре среднее число частиц, определяемое распределением Бозе (5.10) больше, чем среднее число частиц, определяемое распределени- ем Больцмана (3.107). При условии ехр <cl распределение Бозе Л кТ переходит в квантовое распределение Больцмана (3.107). Распределение Бозе, так же, как и распределение Ферми удовлетворяет условию нормировки (3.102). Термодинамический потенциал бозе-газа в целом: 0 = ]Г04=*Т]Г1п 1-ехр кТ (5.11) 5.3. Энтропия ферми- и бозе-газов. В разделе 3.8 мы вывели формулу для энтропии больцмановского газа, выраженную через средние числа частиц в &-м квантовом состоянии (3.134). Теперь мы получим выражения для энтропии ферми- и бозе-газов через средние числа частиц и покажем, что при выполнении условия (3.101) они переходят в (3.134). Начнем с ферми- газа. Дифференцируя (5.6), находим 1 + ехр м-ь кТ -кТ^~ 1 1 + ехр (м-ъ { кТ ехр М-£к]М-е1 (5.12) кТ ) кТ
236 Часть II Из (5.5): eXPl кТ J <„,) (пк) ' 1+ехр1 *г J 1+i-(«t) i-(„4>' (5.13) (5.14) Подставляем в (5.12): s=-*E (".) h M 4H*>HH*>)^ri_WJ = -к^[ы{1-(пк)) + (пк)\п(пк)-(пк)Ы(1-(пк))] = (5.15) При (лЛ) «с 1 используем формулу (4.92). Пренебрегая членами второго порядка малости, приходим к выражению, которое совпадает с (3.134). Аналогичные выкладки можно провести и для бозе-газа. Дифференцируя (5.11), находим: 5= » ^2> 1 1-ехр -«•Z- 1-ехр кТ ехр кТ Ц-£к\Ц-£к кТ J кТ (5.16) Из (5.10): 1-ехр ехр1 кт J („t)+1 (пк) ' к) _ 1 М-Ь , = 1_. *г ; i+(«t) i+(„t)' 5-*sL(i+(»4))-(i+(»J»TM,b-M = к^[]П{1+(Пк))-(пк)]п{Пк)+{Пк)\п(1 + (пк))] = =*Z[(4"*>)44»*>)-('04'0} При (лА)«: 1 использование (4.92) вновь приводит к (3.134). (5.17) (5.18) (5.19)
5. Распределения Ферми и Бозе 237 5.4. Уравнение состояния ферми- и бозе-газов. Распределения Ферми и Бозе, как правило, применяются к совокупностям элементарных частиц, между которыми и проявляется обменное взаимодействие, в то время как одноатомные и молекулярные газы при обычных условиях (когда они существуют в газообразном состоянии) достаточно точно описываются распределением Больцмана, иными словами, для них справедливо условие (3.101). Энергетические уровни газа из элементарных частиц располагаются достаточно плотно, что позволяет в таких формулах, как (5.6), (5.11) перейти от суммирования по квантовым состояниям к интегрированию по энергиям. Однако для этого необходимо знать плотность состояний на каждом участке энергетического спектра. Каждый интервал энергий соответствует некоторому объему в фазовом пространстве частицы. Число состояний, соответствующих данному интервалу энергий, мы можем получить, деля объем фазового пространства на объем элементарной ячейки, т. е. используя формулу (1.124). Если частица обладает спином, то объем фазового пространства нужно умножить еще на число возможных проекций спина 2S +1: ^ (2S + l)d*qd3p dT=K } J F. (5.20) (2яЛ) Здесь мы учитываем только три поступательные степени свободы частицы, пренебрегая внутренними. В таком случае энергия частицы однозначно связана с абсолютным значением ее импульса, Интегрирование по координатам частицы дает доступный частице объем V. Элемент объема в импульсном пространстве в сферической системе координат есть d3p = p2dpsui0d0d<p, интегрирование по угловым переменным дает 4яг. В результате получаем (25 + l)4?^j25 + l)^ Используя связь между энергией и импульсом, найдем число состояний, приходящихся на интервал энергий от е до ел-de: ъ dr(e) = ± -j=-^ = D(e)de. (5.23)
238 Часть II Здесь D(e) = (2S + \)Vm2Je (5.24) л/2л-2Й3 определяет плотность одночастичных состояний. Полное число частиц N = ,£(nk)->]n(e)dr(e) = ]n(e)D(e)de, (5.25) к О О где п(е) — функция распределения частиц по энергиям— фактически определяется распределениями Ферми (5.5) и Бозе (5.10). Эти распределения отличаются только знаком, и их можно объединить в одной формуле, принимая, что ниже во всех формулах верхний знак будет относиться к статистике Ферми, а нижний — к статистике Бозе: п{е) = ,} ч—. (5.26) ехр|^|±1 кТ Учитывая (5.26) и (5.24), запишем: N = (2S + \)Vm~2 yf2^h3 «fedt (5.27) НН?У Полная энергия ферми- или бозе-газа может быть найдена по формуле: 7 , ^~, ^ (2S+l)Vm2~t e2de expl ^ |±1 кТ (5.28) В (5.6), (5.11) мы аналогичным образом переходим от суммирования к интегрированию: Q = +/trJln l±exp( о L v __{2S + \)Vm2kT кТ JTJln D{e)de- (5.29) 1±ехр кТ de. Это выражение можно представить в ином виде путем интегрирования по частям: « = 1п 1±ехр кТ (5.30)
5. Распределения Ферми и Бозе 239 du = +- *-<¥) Ъ ехр| —d£ = + F| kT )kT de kT Ач?У dv = yfede; v = —e2. 3 _(2S + l)Vm2kT >[in*ti При £—>°° ехр 2 - -f2ln 3 l±expf^T±^? Я кТ )\\ ЪкТ{ 2 e2de °ехр|У^1±1 ;(5.3i) (5.32) . (5.33) кТ является малой величиной. Вновь обращаясь к (4.92), имеем: limln 1±ехр кТ =±ii2exp(^)=!±exp(-^); (5-34) lim ( 1 г е2Ы 1±ехр кТ = ±lim хр1~~кт = 0. Поэтому П = - 2(2S + \)Vm2 з e2de Зл/^Й3 0 ехр кТ ±1 Сравнивая с (5.28), находим П=--Е. 3 Учитывая также, что Cl = -PV (см. (2.195)), получаем (5.35) (5.36) (5.37) PV=-E. 3 (5.38) Это уравнение состояние, справедливое как для ферми-, так и для бозе- газов. Оно должно быть справедливо также в предельном случае, соответствующем статистике Больцмана. Подставим в (5.38) выражение (4.50) для энергии идеального газа при 1 = 3, что соответствует учету только трех поступательных степеней свободы идеального газа, которые можно рассмат- 3 ривать квазиклассически. При E =—NkT мы приходим к уравнению со-
240 Часть II стояния идеального газа (4.8). Иногда уравнение состояния (5.38) записывается в виде Р = \ег, (5-39) где еу — плотность энергии газа, ev=j. (5.40) §.§. Вырожденный электронный газ. Рассмотрим свойства ферми- газа при температурах, близких к абсолютному нулю. Газ при этом называют вырожденным, имея в виду, что он имеет нестандартные свойства. При абсолютном нуле температуры частицы газа заполнят все доступные им уровни энергии таким образом, чтобы полная энергия газа имела наименьшее возможное значение. В соответствии с принципом запрета Паули, по которому в каждом квантовом состоянии не может находиться более одной частицы, будут заполнены все состояниями с энергиями от наименьшей до некоторой наибольшей, значение которой определяется числом частиц и физическими условиями, и которая называется энергией Ферми £F. Наиболее известным примером вырожденного ферми-газа является газ свободных электронов в металлах и полупроводниках при низких температурах. Поскольку спин электрона S = — , множитель, который входит в определение плотности одночастичных состояний (5.24), 2S +1 = 2. С учетом этого для электронного газа Не) = Щ^- (5-41) к п Рассмотрим функцию распределения частиц по энергиям (5.26) для ферми-газа при абсолютном нуле температуры. / ч ,. 1 fl, при£ <//; \\тп(е) = \\т 7 г— = \ * И (5.42) Мехр(^1 + 1 1°'ПРИ^>^ Иными словами, при Т = 0 п{е) представляет собой ступенчатую функцию (рис. 22). Из этого рассмотрения следует, что химический потенциал // при Т = 0 совпадает с энергией Ферми, M = eF. (5.43)
5. Распределения Ферми и Бозе 241 Рис. 22 Это подразумевает, что химический потенциал ферми-газа при низких температурах положителен: //>0. Определим число частиц ферми-газа: з N = \n(e)D(e)de = —I-^\^de= J о к п о Из последней формулы можно найти энергию Ферми: Ък2пъ (5.44) (5.45) £*=- (5.46) = h2 (3x2Ns 2т{ V С энергией Ферми однозначно связан импульс Ферми (точнее, имеется в виду абсолютное значение импульса), который также называется радиусом ферми-сферы: ГУ2 Pf 2т (5.47) Действительно, в импульсном пространстве электроны заполняют все состояния со значениями импульсов, лежащими внутри сферы с радиусом pF, pF = yJ2meF = h 3k2N (5.48) N Энергия и импульс Ферми зависят от плотности частиц —. Определим полную энергию электронного газа: 1 11 ЛУт1 Ч \ , 2j2Vm2e2F E = ]£n(£)D(£)d£= 2m \e2de F _ 2V2F/ 7WZ <h2 * Ъ7?ПЪ к2Пь 5 5 (Зяг2^ Ък2Ьъ (5.49) 2т) у V ъ 3(3x2Yh2NfN\l 3 --* '- ' —' =^£FN. Ют \ f
242 Часть II Уравнение состояния электронного газа 2 5 Р = -=- = ± }- — . (5.50) dV 5m {VJ Учитывая выражение для полной энергии (5.49), мы видим, что уравнение состояния (5.50) совпадает с (5.38). При температурах, близких к абсолютному нулю, некоторая часть частиц, которые занимают уровни немного ниже энергии Ферми, перейдет на более высокие уровни. На рис. 22 такому распределению частиц по энергиям соответствует пунктирная линия. Условием применимости полученных выше формул является малость температур по сравнению с энергией Ферми, г«ЭД!. ("О 5.6. Уравнение состояния релятивистского ферми- и бозе-газа. Когда энергии электронов становятся достаточно больпшми, классическое соотношение между энергией и импульсом (5.21) перестает быть справедливым и должно быть заменено соотношением € = ср, (5.52) справедливым для релятивистских частиц. В таком случае вместо (5.23) получаем , ч (2S+\)Ve2de 2ж п с Таким образом, плотность состояний: Вследствие того, что плотность состояний отличается от (5.24), уравнение состояния релятивистского газа также будет отличаться от (5.38). Однако его можно получить тем же способом, что и (5.38). Полное число частиц: N = ]n(e)D(e)Je = £^l fd\ . (5.55) J 2**V iexp е-м ±1 kT Полная энергия: г, г / \rw \ , (2S+l)Vc e*de E = jen(e)D(e)de^—-±rj . (5.56) 2*^ Joexpf^|±1
5. Распределения Ферми и Бозе 243 Запишем выражение для термодинамического потенциала Q: П = +кТ fhx 1 + ехр ju-e кТ __{2S+\)VkT ~+ 2я2Н3с3 ]е2Ы D(e)de = ц-е 1±ехр кТ (5.57) de. Это вьфажение проинтегрируем по частям, как это было сделано в (5.30)- (5.33). Вместо (5.32) имеем 1 ' (5.58) dv = e2de; v = -e3, 3 п _{2S+\)VkT 2я2П1с1 1 .з £3ln [+ех г^~£1Т+* ? "expl кт ){~зкт{ еЧе expl^lll (5.59) Внеинтегральный член обращается в нуль, что можно продемонстрировать так же, как это было сделано в (5.34)-(5.35). В итоге получаем (25 + 1) V "г elde Й = <*,*V Joexpf£^|±i кТ Сопоставляя с (5.56), находим а=--Е. 3 Учитьшая, что Q = —PV, получаем уравнение состояния 1 PV=-E. 3 (5.60) (5.61) (5.62) Вводя плотность энергии частиц газа (5.40), уравнение (5.62) может быть записано в виде P=-ev. (5.63) 5.7. Релятивистский вырожденный электронный газ. Рассмотрим релятивистский электронный газ при абсолютном нуле температуры. Плотность состояний при S = — есть Ve2 71 П С (5.64)
244 Часть И Полное число частиц: N = )n(e)D(e)de = -^j]e2de = п К П С л Vel ъпгпгг откуда sF=hc Pf=* (3k2N\ Ъп2Ы (5.65) (5.66) (5.67) Полная энергия релятивистского электронного газа: E = ]en(e)D(e)d£ = J^]e>de = -?$-r = V „4 a ЪпгИ ft Vм 4лг2йУ 4 2*Аз Ъ J ^ (5.68) Ък2ИУ \ N = -eFN. 4 F Уравнение состояния: Р = дЕ_ {Ък2)*Пс (5.69) Сопоставляя с (5.68), приходим к уравнению (5.62). 5.8. Вырожденный бозе-газ. При температурах, близких к абсолютному нулю, свойства бозе-газа качественно отличается от свойств ферми- газа. Это объясняется тем, что обменное взаимодействие между бозонами не препятствует, а, наоборот, способствует, нахождению большого количества частиц в состоянии с наименьшим значением энергии, которое можно принять равным нулю, в то время как ферми-газ при абсолютном нуле температуры обладает отличной от нуля энергией. Скопление частиц на нижнем энергетическом уровне при Т —> О называется конденсацией Бозе-Эйнштейна. При этом реальной конденсации частиц газа не происходит, термин «конденсация» употребляется в переносном смысле и указывает на то, что частицы скапливаются («конденсируются») в импульсном (энергетическом) пространстве в состоянии с р = 0 (е = 0). Поскольку большинство частиц находятся в состоянии с е = 0, использованный нами ранее переход от суммирования по состояниям к интегрированию по энергиям не является корректным. Действительно, частицы
5. Распределения Ферми и Бозе 245 с е = 0 не дают вклада в интегралы, такие, как (5.27), (5.28) т. к. плотность состояний D (е) ~ 4е . Как было установлено ранее, химический потенциал бозе-газа должен быть отрицательным. Этот результат мы получили как условие сходимости статистической суммы (5.7). Однако при этом условии limw(0) = lim , l N— = 0. (5.70) -1 Это противоречит тому, что при Т —> 0 все частицы скапливаются на одном энергетическом уровне € = 0. Из условия нормировки распределения Бозе (3.102), ^(пк) = N, следует, что должно выполняться limw(0) = lim- Г->0 v ' Г->0 1 ехр М{Т) кТ - = N. (5.71) -1 Учитывая то, что химический потенциал, вообще говоря, зависит от температуры, он должен обращаться в нуль при некоторой температуре Г0, близкой к абсолютному нулю, когда на самом низком энергетическом уровне скапливается достаточно много частиц, и нарушается (5.70). Тот факт, что химический потенциал должен обращаться в нуль при температуре несколько выше абсолютного нуля, говорит о том, что функция fi(T) должна стремиться к нулю быстрее, чем Г, иначе говоря, кТ — малая величина при Г—>0. Раскладывая в ряд экспоненту в знаменателе (5.71), получим limw (0) = lim т-т г_>о ч ' г-*о JU(T) 1-- кТ -1 - = lim кТ = N. (5.72) Соотношение (5.72) определяет закон, по которому функция ju(T) должна обращаться в нуль при малых температурах. Температуру Т0, при которой химический потенциал обращается в нуль, можно оценить, используя формулу (5.27), записанную для бозе-газа: N = (25 + 1)Ии5 72лг2Й3 yfede } ехр e-ju кТ (5.73) -1
246 Часть II В этой формуле положим /и = 0 и сделаем замену переменной интегрирования £ --Z. Тогда кТ Nj2S + \)V(mkT0)2~^dz JlTftf (5.74) (5.75) Интеграл в (5.75) не зависит от температуры, он является табличным интегралом, его значение выражается через Г-функцию и £ -функцию: л<к (5.76) (5.77) Искомая температура: тк 4ln2N (25 + 1)Г| f Ы| |К (5.78) При 0<Г<7|, мы можем воспользоваться формулой (5.75), чтобы определить число частиц с энергиями больше нуля: (2S + l)V(mkr)*}y£dz JT^ N(e>0) = - J2x2h3 -f- {e*-l = N\ = Число частиц в конденсате с равной нулю энергией: 1- - (5.79) (5.80) Энергия газа при 0 < Т < Т0 определяется только теми частицами, которые находятся в состояниях с е>0. Ее можно вычислить, положив в (5.28) ц=0 и сделав замену (5.74): Е = - (2S+l)Kii»|f еЧе _{2S+ \)Угп> (kTf } jdz JiTfh1 -\ °exp|--l л/2яг2Й3 р z*az (5.81)
5. Распределения Ферми и Бозе 247 Подставляя значение табличного интеграла (5.76) при V =—, получаем (2Б + 1)УтЦкТ)2 (5) (5 Зная энергию газа, мы можем вычислить теплоемкость /*дЕ\ 5 Е Сг = ЪТ)У 2 Г энтропию S = \^dT = 5(2S + l)Vm2k 2Ллг%ъ V5 <0^= _5(2S + \)V(mT)iki а также свободную энергию с а. ът' (5.82) (5.83) (5.84) F = E-TS = —Е. 3 Используя (5.85) и (5.82), выразим давление pfdF\ _ 2(2S + \)m> (кТ)2г {dVjT Зч/2я-2Й3 (5.85) (5.86) Сопоставление с (5.82) показывает, что бозе-газ при низких температурах удовлетворяет уравнению состояния (5.38). Из (5.86) следует, что при О < Т < Т0 давление не зависит от объема. Это объясняется тем фактом, что частицы в состоянии с£ = 0и/? = 0не вносят вклада в давление. 5.9. Черное равновесное излучение. В заключение этой главы мы рассмотрим электромагнитное излучение, находящееся в тепловом равновесии с веществом. Оно известно как черное равновесное излучение и представляет собой газ фотонов, подчиняющихся статистике Бозе. Фотоны движутся со скоростью света, поэтому газ фотов является релятивистским. Фотоны не взаимодействуют друг с другом, поэтому газ фотонов является идеальным. Для перехода электромагнитного излучения в состояние теплового равновесия необходимо взаимодействие с веществом. Механизм установления равновесия заключается в поглощении и испускании фотонов веществом. Взаимодействие с веществом должно быть малым, чтобы газ фотонов можно было тем не менее рассматривать как идеальный. Это
248 Часть И условие выполняется в разреженных газах и для веществ с большой плотностью при очень высоких температурах. Известной моделью черного излучения является полый ящик, в котором имеется небольшое отверстие для наблюдения излучения. Отверстие должно быть достаточно мало для того, чтобы фотон, который может вылететь из отверстия, испытал многократное взаимодействие со стенками ящика, как отражаясь от стенок, так и испытывая поглощение и последующее излучение стенками ящика. В силу того, что эффект упругого отражения фотона от стенок ящика фактически сведен к нулю, это излучение и назьшают излучением абсолютно черного тела или, коротко, черным излучением. Тепловое излучение многих тел можно считать равновесным, поскольку перед тем, как выйти наружу, оно многократно поглощается и переизлучается внутри тела. Другой известный пример— это космическое реликтовое излучение. На ранней стали эволюции Вселенной вещество в ней находилось в состоянии горячей плазмы, что обеспечивало высокую интенсивность излучения и его взаимодействия с веществом. После того, как плотность и температура вещества значительно уменьшилась, горячая плазма превратилась в газ из нейтральных атомов, и произошло то, что называется отделением излучения от вещества. Взаимодействие с веществом прекратилось, а излучение продолжало распространятся в пространстве, и сегодня является важным источником информации о процессах, происходивших во Вселенной во время отделения излучения от вещества. Поскольку равновесие устанавливается путем поглощения и излучения фотонов, число фотонов не сохраняется, и мы имеем дело с системой с переменным числом частиц. Свободная энергия фотонного газа является функцией температуры, объема и числа частиц. В равновесии должно выполняться условие Но, согласно (2.186), -— =//, откуда следует, что химический потен- \oNjTy циал газа фотонов равен нулю: // = 0. (5.88) Распределение фотонов по энергиям определяется формулой (5.26) с// = 0:
5. Распределения Ферми и Бозе 249 Учитывая соотношение между энергией и частотой фотона £ = ha), (5.90) получаем распределение Планка: ИИ = -ТЬГ7 (5-91) ехрЫ-1 Хотя фотон имеет спин 1, фотон имеет только два независимых направления поляризации колебаний, так что его кратность вырождения по спину равна 2, как и у электрона. Плотность состояний, как следует из (5.54), есть Ve2 D(*)=^v* (5-92) п п с Число фотонов в заданном объеме V: N = - e*de _V(kTf} z2dz _V(kT)3r(3)C(3) яг2Й3с3' °ехр1*г ,2fc3„3 1 /» н u q с x Tifl С В (5.93) была сделана замена (5.74) и использована формула (5.76). Полная энергия V 7 £У£ _F(*T)4?z3A К(^Г)4Г(4)^(4) »exp^-j-l Однако для характеристики равновесного излучения больший интерес представляет спектральное распределение энергии по частотам. Запишем энергию фотонов, которая приходится на интервал частот от со до co+dco: ехрЫт' Это — знаменитая формула Планка, полученная им в 1900 году и ознаменовавшая начало квантовой теории. В пределе малых частот, псо<кТ, формула (5.95) дает VkT dE(o)) = -Pjutda) (5.96) ЛГС — формула Рэлея—Джинса. Она не содержит постоянной Планка h и была получена, используя подход, основанный на классической статистике.
250 Часть II В пределе больших частот, Ъ.соу> Т, мы получим формулу Вина: <ffi(») = ^exp(-^)aAto. (5.97) Поскольку термодинамический потенциал £2 связан со свободной энергией соотношением (2.195), £l = F-juN, а химический потенциал равен нулю, для фотонного газа мы получаем: Q = F. В таком случае для вычисления свободной энергии мы можем воспользоваться формулой (5.60), выведенной для релятивистского газа. F = Q = ъкгьъг еъйе _ V{kT)Ao}z4z ЪкгПъсъ- °ехр|-|-1 г z dz _ У(кТ)4Г(4)С(4)_ 4оУТ* ЪпгПъсъ Ъс где а — постоянная Стефана—Больцмана, *4Г(4)^(4)_ *V G-- 4^Пъсг 60Й3с2 Здесь мы учли, что Энтропия: полная энергия: m-nww-b- S = - ВТ \6аУТъ Ъс 4<тУТ4 E = F+TS = — = -3F; (5.98) (5.99) (5.100) (5.101) (5.102) то же самое выражение следует из (5.94). Полная энергия черного излучения пропорциональна четвертой степени температуры {закон Больцмана). Поскольку F = C1 = -PV, имеем E = 3PV, (5.103) что совладает с уравнением состояния (5.62) для релятивистского газа. Давление Р = - = _(<ЯЛ =4<тТ* дГ)т Ъс (5.104)
6. Твердые тела 251 Теплоемкость при постоянном объеме есть Поскольку изобарический процесс (Р = const) является в то же время, в соответствии с (5.104), изотермическим (Т = const), теплоемкость черного излучения при постоянном давлении оказывается бесконечной: Ср = ©о. 6. Твердые тела 6.1. Случай низких температур. В твердом состоянии температура тела должна быть мала по сравнению с энергией взаимодействия атомов, т. к. при более высоких температурах твердые тела будут плавиться. Поэтому атомы твердого тела могут совершать лишь малые колебания около некоторых положений равновесия— узлов кристаллической решетки. В тепловом равновесии твердое тело имеет кристаллическую структуру, т. е. расположение узлов решетки строго определяется тем, что в состоянии теплового равновесия энергия, энтропия и другие термодинамические функции имеют экстремальные значения. Исключение составляют аморфные твердые тела, в которых атомы колеблются вокруг точек, расположенных хаотически. Считается, что аморфные тела находятся в метастабильном состоянии в процессе кристаллизации. Однако время релаксации в этом процессе настолько велико, что аморфные тела можно рассматривать как устойчивые и применять к ним, с некоторыми оговорками, те же закономерности, что и к кристаллическим твердым телам. С классической точки зрения, при абсолютном нуле температуры атомы неподвижны. Однако необходимо принимать во внимание квантовые эффекты. Именно благодаря им гелий остается жидким при абсолютном нуле и не слишком больших давлениях. Кристаллы называют вполне упорядоченными, если число узлов решетки, в которых могут находиться определенного типа атомы, совпадает с числом этих атомов, т. е. вероятность нахождения атома определенного типа вблизи каждого из узлов равна единице. Существуют также кристаллы, в которых число мест, вблизи которых может находиться атом, превышает число атомов. В этом случае вероятность нахождения атома вблизи любого узла меньше единицы. Примером является твердая окись углерода — молекулярный кристалл, в котором молекула СО может иметь две ориентации, получающиеся перестановкой атомов С и О. Число мест, в которых могут находиться атомы определенного типа (углерода или кислорода) вдвое больше числа атомов этого типа.
252 Часть II Кристалл, который не является вполне упорядоченным при высокой температуре, может оставаться таким и при низких температурах вследствие того, что процессы перестройки решетки идут медленно. Такая неупорядоченность кристалла при низких температурах приводит к появлению в выражении для энтропии дополнительного члена. Например, если мы принимаем, что в молекулярном кристалле СО обе ориентации молекулы равновероятны, число возможных способов расположения атомов вдвое больше, чем было бы во вполне упорядоченном кристалле, поэтому мы должны добавить к энтропии слагаемое S0 = к In 2. Если N— число элементарных ячеек в кристаллической решетке, a v — число атомов в каждой ячейке, то полное число атомов равно Nv, число степеней свободы — 3Nv. Из них три степени свободы соответствуют поступательному и три— вращательному движению тела как целого. Остается 3Nv - 6 колебательных степеней свободы; при этом 3Nv » 6, поэтому число колебательных степеней свободы можно считать приближенно равным 3Nv. Мы будем далее рассматривать тот вклад в термодинамические величины, который вносят колебания кристаллической решетки (так называемая решеточная часть). Колебания решетки можно рассматривать как совокупность 3Nv независимых осцилляторов, каждый из которых соответствует нормальному колебанию. Статистическая сумма для одной колебательной степени свободы была вычислена в разделе 4.5 и дается формулой (4.98), а свободная энергия, соответственно, F=x^+^ZH1-exPrT^lrfo+^Zln a=l * a=l a=\ 1 I h0)a 1-exp - 1 kT (6.1) INv ft£Q суммирование идет по всем нормальным колебаниям; €0 = ^—- пред- а=\ 2 ставляет энергию нулевых колебаний. В пределе низких температур во вторую сумму в (6.1) основной вклад дают члены с малыми частотами, для которых Ьсоа~кТ. Колебания малых частот в твердом теле представляют собой звуковые волны. Длина волны Я ~ —, где и — скорость звука. Длина волны велика по сравнению с посто- 0) и янной решетки а: Я^а, или 0)<к—. Поэтому малые колебания можно а * Пи рассматривать как звуковые волны при температуре Т<к —. ка Во второй сумме в (6.1) перейдем от суммирования к интегрированию по частотам. Для этого нам необходимо определить число колебаний, приходящееся на интервал частот (й), 0)+ dm).
6. Твердые тела 253 Для простоты рассмотрим случай, когда твердое тело изотропно (таковыми являются аморфные тела). Из механики сплошных сред известно, что в изотропной среде распространяются продольные и поперечные звуковые волны. Скорости продольных и поперечных волн, и1 и ut соответственно, выражаются через плотность среды, модуль Юнга и коэффициент Пуассона, которые полностью характеризуют свойства материала при упругих деформациях. Поперечные волны имеют две независимые поляризации. Частоты продольных и поперечных волн связаны с абсолютной величиной волнового вектора к соотношениями (0-ихк\ G)=utk. (6.2) Число колебаний в объеме V со значениями проекций волнового вектора в интервалах (&у, kj + dkj), j = x, у, z, для каждой поляризации есть vdk*f.. (б3) Если же мы интересуемся числом колебаний в объеме V со значениями абсолютного значения волнового вектора в интервале (&, k + dk), оно равно /м„ AnVk2dk Vk2dk „.. 8(k)dk = ——г- = ——. (6.4) (2л-) 2л- Суммируя число колебаний для каждой поляризации и принимая во внимание (6.2), получим число колебаний в интервале частот (со, со+ dco): * (6.5) , ч _, Va?dco( 1 2 {a,)da>=—r-\—+— 2п \и, и,, (мы учли, что имеется две независимые поперечные поляризации). Введем величину (и), которую назовем средней скоростью звука, с помощью соотношения _L-_L 1 («)3"",3 + Ц При этом (6.5) перепишется следующим образом: g(co)dco= , (6.7) 2ж (и) а формула (6.1) после перехода к интегрированию — ,=-+-. (6.6) ЪкТУ 7, Г, ( Ь°Л F = ea+ г- In 1-ехр ° 2жЧи)г\ I Р{ кТ) a?do), (6.8)
254 Часть II Эта формула применима не только к аморфным телам, но и к кристаллам, однако определение средней скорости звука (и) должно основываться на теории упругости и учитывать симметрию кристалла. Выполним в (6.8) интегрирование по частям: и = ш\ 1-ехр du = - 1 1-ехр _ПаА кТ) ехр кТ НсоЛМсо _ ~кт)~кТ~~ Ысо кТ ^Щ-\ 1 dv = a?dax, v = -of. 3 (6.9) (6.10) (6.11) Внеинтегральный член обращается в нуль аналогично тому, как было показано в (5.33)-(5.36). Окончательно получаем Vh 7 afdo) V П г \кТ (6.12) -1 Заметим, что, если сделать замену е-Ь(0 в выражении (5.98), определяющим свободную энергию черного равновесного излучения, получим ре- 3 зультат, от которого интеграл в (6.12) отличается только множителем — и заменой скорости света средней скоростью звука (и). Действительно, после выделения вклада нулевых колебаний мы можем считать, что энергия каждого колебания связана с его частотой той же формулой е = Нй), которая справедлива для фотонов. Связь частоты и волнового вектора также определяется соотношениями (6.2), аналогичными со-ск , которое справедливо для фотонов. Это дает основания рассматривать малые гармонические возбуждения в твердом теле как квазичастицы, так называе- 3 мые фононы, что мы обсудим несколько позже. Множитель — объясняется тем, что звуковые волны имеют три возможных направления поляризации, в то время как фотоны — только два. Делая в (6.12) замену tiQ) z = — (6.13) kT и используя (5.100), вычисляем F = en V(kT)A 7z3dz_ _л2У(кТ)4 (и) \е -1 2я2П3(иуЪ< ЗОЙ3 (к)3 (6.14)
6. Твердые тела 255 Теперь найдем энтропию S--&- 2я2Ук*Т3 энергию и теплоемкость ЪТ)У \5Пъ(ыУ ти2У(кТ)А Шъ{и)г E = F + TS = £n + у \дт 2я2Ук*Г 1 &(«У (6.15) (6.16) (6.17) Поскольку S-T3, в соответствии с (2.136), Cp-Cv ~Т\ иными словами, при низких температурах отличие между Ср и Cv пренебрежимо мало. Можно показать, что для твердых тел отличие между Ср и Q незначительно во всем интервале температур, поэтому далее мы будем опускать индекс у теплоемкости. 6.2. Случай высоких температур. Рассмотрим другой предельный Пи случай, когда Г»—. Обращаясь к выражению (6.1), имеем ка Ч-ж>-тНт^ In 1-ехр кТ = 1п Щ кТ " 2\кТ) \ \кТ\ кТ \ 2кТ {кТ) { 2кТ) {кТ) 2кТ где было использовано (4.92). «=i 2 а=, ^ кТ ) а=\ 2 = -3NvkT\n(kT)+3NvkT\nh + kT^n(0a. (6.19) (6.20) Введем следующее определение: 1пй> = - 3Nv ЁЬй)„, (6.21)
256 Часть II Тогда F = -3NvkT In (кТ) + 3NvkT In (Йй). (6.22) Энтропия: 5 = -— = 3Nvkhi(kT) + 3Nvk - 3Nvkhi(hd}). (6.23) оТ Энергия: E = F + TS = 3NvkT. (6.24) Последняя формула полностью согласуется с классическим законом равнораспределения (см. разд. 4.3): на каждую из 3Nv колебательных степеней свободы приходится одинаковая энергия, равная кТ. Предельное значение теплоемкости ?F C = — = 3Nvk = Nc0, (6.25) оТ где с0 = 3vk — теплоемкость, приходящаяся на одну ячейку. При высоких температурах теплоемкость тела постоянна и зависит только от числа атомов в теле. Поскольку 1 моль вещества содержит одно и то же количество атомов, молярная теплоемкость твердых тел должна быть одинаковой. Этот вывод известен как закон Дюлонга и Пти. Он справедлив для тел с простой кристаллической структурой, для более сложных соединений температура плавления ниже, чем температуры, при которых применимо данное приближение. 6.3. Формула Дебая. Получив значения термодинамических величин в предельных случаях низких и высоких температур, можно поставить задачу о нахождении общей интерполяционной формулы, которая бы позволяла воспроизвести экспериментально наблюдаемую зависимость теплоемкости от температуры и давала правильные результаты в обоих предельных случаях. Для вывода формулы необходимо было предложить некую модель. Такая модель была предложена в 1907 году Эйнштейном. Она основывалась на нескольких предположениях. Во-первых, атомы в кристаллической решетке ведут себя как невзаимодействующие друг с другом гармонические осцилляторы с энергией £ = nha), где п — целое число. Во- вторых, число осцилляторов с различной энергией определяется распределением Больцмана. В-третьих, частоты всех осцилляторов одинаковы. Основываясь на такой модели, Эйнштейн вычислил теплоемкость. При стремлении температуры к абсолютному нулю теплоемкость также стремилась к нулю, а при высоких температурах выполнялся закон Дюлонга и Пти. Тем не менее, зависимость теплоемкости от температуры не согласовывалась с экспериментальными данными в промежуточном интервале
6. Твердые тела 257 температур. Основной недостаток модели Эйнштейна состоял в его третьем предположении, согласно которому частоты всех осцилляторов одинаковы. Другая модель, которая показала лучшее согласие с экспериментом, была предложена Дебаем в 1912 году. Вернемся к формуле (6.7), которая определяет число колебаний в интервале частот (со, CQ+dco) в случае низких температур. Мы знаем, что полное число колебаний в твердом теле равно 3Nv. Однако, если мы вычислим полное число колебаний с помощью (6.7), получится бесконечность: W \g{0))dQ)= AofdQ) = (6.26) о 2к2 (и) о Дебай предположил, что спектр частот ограничен некоторым значением (частотой Дебая), которое можно определить, потребовав, чтобы интеграл (6.26) сходился и был равен 3Nv: ЗР ? J2j Vat \ a/dco= Q-T = 3Nv; 2tf»3J0 со, *> = <«> 2я-»3 6n2Nv При (0<<aD число колебаний в интервале частот (й>, co+dco) есть Wofdm 9Nva?da) g(w)da=- ti (6.27) (6.28) (6.29) 2яг»3 Теперь после перехода к интегрированию в формуле (6.1) мы также должны интегрировать не до бесконечности, а до значения coD: F = e0+ — Jin Щ> о 1-ехр кТ oida). Проинтегрируем по частям, используя (6.9) — (6.11): F = e0 + 3NvkT at u£ln 1-ехр . кТ )\ кТ{ afdco (hco CX,V. -1 Введем температуру Дебая к (6.30) (6.31) (6.32)
258 Часть II функцию Девая л/ ч 3 } zldz (6.33) а также сделаем замену переменных (6.13). Тогда / 3NvkT F=£°+ * = en+3NvkT a?D)n 1-exp - In (kT\ Tr z3dz UJ [e*-\ (6.34) = £0+NvkT 31n 1-exp - 0 -D 0 Теперь последовательно вычислим энтропию, энергию и теплоемкость. Для вычисления энтропии нам потребуется взять производную от функции Дебая, а для этого нужно использовать формулу d_ da* -jf(z)dz = f(a). Далее, 9 г z3dz V ; x4{ez-\ ex-\ x V ; ex-\ (6.35) (6.36) s=-¥L=-Nvk дт 31n l-exp(-f) 1-exp expl - (-fl -«?.♦ = -tfv* 31n 1-exp (-?H?)' tfv*0 exp( J H 0 lr «p(|)-1 / = -Nvk 31n V ■-4-?H?))+mmd{?) (6-37>
6. Твердые тела 259 E = F + TS = en + 3NvkTD C = — = 3Nvk дТ TJ T [T (6.38) (6.39) Предельный случай низких температур (Т —»0) соответствует большим значениям аргумента функции Дебая. В первом приближении верхний придел интегрирования в (6.33) можно заменить на бесконечность. Используя (5.100), получим 3 7 z'dz кА ~/\ э г z az л limD(jc) = —[ = —. -1 5jc3 Можно показать, что поправка к этому значению, экспоненциально малый вклад. ( 3 7zVz^ -?h »-~L v ' WJ 5x3 Ъхъ 5x3 (6.40) , дает лишь (6.41) используя (6.32) и (6.28), получаем \27UANvk(T^\ \27UANvkr С = \2nANvk(kT\ 5 £Г 2п2ПЛТъ (6.42) 5 UJ 6k2Nv(u)3 5h3(uf Это выражение совпадает с (6.17). Случай высоких температур (Т —»«>) соответствует малым значениям аргумента функции Дебая. Раскладывая в ряд экспоненту в подынтегральном вьфажении в (6.33) и ограничиваясь первыми членами разложения, ez * 1 + z, находим 3 г z3<fe limZ>(x) = lim—г f = lim—r \ z2dz = 1; x->0 V ' x->0 x3 J ez - J x->0 x3 J C = 3Nvk. (6.43) (6.44) Последнее выражение совпадает с (6.25). Формула Дебая правильно передает зависимость теплоемкости от температуры для тел с простой кристаллической решеткой. Однако она практически неприменима к телам с более сложной структурой, что связано со сложной структурой колебательного спектра.
260 Часть II 6.4. Колебания атомов в кристаллической решетке с классической точки зрения. Положение каждого атома в кристаллической решетке можно определить заданием элементарной ячейки, в которой находится атом, и номером атома в ячейке. Положение самой элементарной ячейки можно определить, задавая радиус-вектор определенной вершины этой ячейки, который будет иметь вид rn=w1a1+w2a2+w3a3, (6.45) где ах, а2, а3 — трансляционные периоды решетки (длины ребер элементарной ячейки), п{, п2, пъ — целые числа. С классической точки зрения тепловое движение атомов представляет собой гармонические и ангармонические колебания. Смещение атома с номером s при колебаниях обозначим как и,. При этом мы фактически учитываем лишь колебания ядер атомов, массивных по сравнению с окружающими их электронами. При этом потенциальная энергия решетки зависит только от координат ядер. Такой подход называется адиабатическим приближением в кристаллах. Гармонические колебания могут быть описаны плоскими волнами: «, (г.) = е, (k)fflq>[i (kr. - а»)], (6.46) где е^ — комплексная амплитуда колебаний, она зависит только от положения атома в элементарной ячейке, т. е. она различна для разных атомов в одной и той же ячейке, но одинакова для эквивалентных атомов в разных ячейках. Векторная величина е, наряду с амплитудой колебаний определяет также направление их поляризации. Поскольку в элементарной ячейке имеется v атомов, и каждый атом может колебаться в трех направлениях, решая классическую задачу о колебаниях атомов, нам необходимо определить 3v величин — компоненты смещений всех атомов в элементарной ячейке. Смещения и^ удовлетворяют системе 3v дифференциальных уравнений, которая после подстановки (6.46) сводится к системе 3v однородных алгебраических уравнений. Условие того, что эта система будет иметь отличные от нудя решения, есть условие равенства нулю определителя системы. Последнее условие используется для нахождения допустимых частот колебаний. Поскольку определитель имеет порядок 3v, это условие представляет собой алгебраическое уравнение степени 3v относительно квадрата частоты, о} . В общем случае это уравнение имеет 3v решений, определяюпщх зависимость частоты от волнового вектора к (закон дисперсии). Таким образом, частота является многозначной функцией волнового вектора, имеющая 3v ветвей.
6. Твердые тела 261 Среди всех ветвей колебательного спектра присутствуют три, которые соответствуют упругим (звуковым) волнам в кристалле. Длины звуковых волн достаточно велики по сравнению с размерами элементарной ячейки. При больших длинах волн (и малых значениях волнового вектора) решетка колеблется как сплошная среда. В пределе к —» О мы получаем параллельное смещение решетки в целом. Эти три ветви спектра соответствуют акустическим колебаниям. Если элементарная решетка содержит более одного атома, существует еще 3(v-l) типа колебаний, которые называют оптическими. В данном случае атомы в каждой элементарной ячейке движутся друг относительно друга, в пределе к —» О центр тяжести ячейки остается в покое. Теперь вспомним, как вводится представление об обратной решетке. Отправной точкой здесь является то, что все физические величины, характеризующие свойства кристаллического тела, должны быть периодичны, причем периоды их изменения должны совпадать с тремя трансляционными периодами решетки а{, а2, а3. Периодичность физической величины <р(г) в этом случае означает, что р(г + л1а1+л2а2+л3а3) = р(г), (6-47) где, как и в (6.45), п{, п2, пъ — целые числа. Разложим <р(г) в тройной ряд Фурье, ?(r) = 2>(b)exp(zbr), (6-48> ь суммирование происходит по всем допустимым значениям вектора Ь, которые определяются из условия периодичности (6.47). Подставляя (6.48) в (6.47), получим ехр [ЛЬ (пх&х + л2а2 + л3а3)] = 1; (6.49) (ар Ъ) = 2ят19 (а2, Ь) = 2яти2, (а3, Ь) = 2яти3, (6.50) где /ир /^2, тъ — целые числа. Решение уравнений (6.50) имеет вид b = m1b1 +/w2b2 Ч-т^Ьз, (6.51) bi = — [«2. аз]> b2 = — [аз> ai]> Ьз =—[»р а2]> (6-52) v v v v = (a„ [a2)a,]). (6.53) Смешанное произведение (6.53) есть объем параллелепипеда, построенного на векторах at, а2, а3, т. е. объем элементарной ячейки. Как известно, смешанное произведение равно нулю, если два из трех входящих в него
262 Часть И векторов совпадает. Поэтому (*i, Ь) = -^-(т1(л1, [а2, a3]) + /w2(al5 [a3, a1]) + m3(a19 [а,, а2])) = 2лгтг (6.54) Аналогично проверяются два других равенства в (6.50). Векторы Ъ{, Ъ2, Ь3 имеют размерность обратной длины. Решетка, построенная на векторах bj , b2, b3, называется обратной решеткой. Если к волновому вектору к прибавить вектор b вида (6.51), выражение в (6.46) не изменится. Поэтому волновой вектор определен неоднозначно: векторы к и к + b физически эквивалентны. Частота колебаний является периодической функцией в обратной решетке: <y(k + b) = <y(k), (6.55) или *у(к + тхЪх + т2Ъ2 + т3Ъ3) = ct)(k). (6.56) Эта формула является аналогом (6.47). В каждой ветви колебаний достаточно рассмотреть те значения к, которые попадают в одну ячейку обратной решетки. Когда к пробегает все возможные значения в этой области (в пределах одной ячейки), частота в каждой ветви спектра пробегает значения, заполняющие полосу, или зону, конечной ширины. 6.5. Представление о фононах. С квантовой точки зрения, каждой волне с частотой со соответствует квазичастица, энергия которой связана с частотой обычным квантовомеханическим соотношением £ = ha). (6.57) Как уже отмечалось, это согласуется с представлением о колеблющихся атомах как об осцилляторах с энергией, кратной Ни). Именно такое представление было положено Эйнштейном в основу одной из первых моделей для объяснения теплоемкости твердых тел. И. Е. Тамм назвал эту квазичастицу фононом по аналогии с фотоном — квантом электромагнитного поля. Свободному распространению волн в твердом теле в квантовом описании соответствует свободное движение фононов, которые не взаимодействуют друг с другом, т. е. представляют собой идеальный газ. В следующих приближениях необходимо учесть процессы взаимодействия фононов, которые приводят к установлению равновесия в твердом теле. Фонон является частным случаем элементарного возбуждения. Фактически, термин «квазичастица» употребляется как синоним понятия «элементарное возбуждение». С квантовой точки зрения, слабо возбужденное состояние макроскопического тела можно рассматривать как совокупность элементарных возбуждений. Если число таких элементарных возбуждений мало, энергия
6. Твердые тела 263 совокупности возбуждений равна сумме энергий отдельных возбуждений. В этом случае мы говорим, что из взаимодействием можно пренебречь и рассматривать их совокупность как идеальный газ квазичастиц. При более точном описании нужно принимать во внимание взаимодействие квазичастиц. Помимо энергии, квазичастица переносит квазиимпулъс, который связан с волновым вектором к: р = йк. (6.58) Скорость фонона можно определить той же формулой, с помощью которой определяется групповая скорость классического волнового пакета: до) v = —. (6.59) dk Учитывая (6.57), (6.58), эту формулу можно переписать как v = —. (6.60) Эр Последняя запись соответствует соотношению между энергией, импульсом и скоростью частицы в классической механике. Принимая во внимание неоднозначность определения волнового вектора, мы заключаем, что квазиимпульс определен не однозначно, а лишь с точностью до постоянного вектора ЙЬ, где b — вектор обратной решетки (6.51). Соответственно, закон сохранения квазиимпульса выполняется лишь с точностью до любого вектора вида НЪ. Не существует ограничений на то, сколько фононов, в том числе одинаковых, может быть возбуждено в решетке. В каждом квантовом состоянии может находится любое число фотонов. Это подразумевает, что газ фононов подчиняется статистике Бозе. Число фононов не постоянно, поэтому химический потенциал системы равен нулю, как это имеет место для черного излучения (см. (5.87), (5.88)), а число фононов в квантовом состоянии с энергией е и квазиимпульсом р определяется формулой (5.89), т. е. распределением Планка: п(£) = / ! чч ♦ (6-61) ехр При Г»£ Г£(Р) kT 1 кТ п[е)~ (6.62)
264 Часть II Для определения термодинамических функций мы можем исходить их формулы (6.1), в которой необходимо просуммировать по всем 3v ветвям колебательного спектра. Чтобы учесть все колебания атомов, можно перейти от суммирования по атомам элементарной ячейки к интегрированию по допустимым значениям волнового вектора фононов: kTV 3£fl 1-ехр ho>„(k) кТ d3k. (6.63) Фактически интегрирование ведется по значениям вектора к в одной ячейке обратной решетки. Если известна плотность числа колебаний ga (со) в каждой ветви спектра, формулу (6.63) можно представить в виде м. Г ( Псоа(к)^ F = f0+A:7y£jln а=\ 1-ехр кТ )\ ga(a>)da>. (6.64) 7. Фазовые переходы 7.1. Фазовые переходы I рода. Равновесие фаз. Система, находящаяся в термодинамическом равновесии, не обязательно должна быть однородной. Мы знаем, что при понижении температуры газ переходит в жидкое состояние. Это происходит потому, что при определенной температуре потенциальная энергия притяжения между молекулами становится сравнимой с их кинетической энергией. Силы притяжения способствуют образованию сгустков молекул, которые являются зародышами жидкой фазы. При определенных условиях жидкая и газообразная фазы вещества могут находится в равновесии. Более точно, фазами вещества называются такие состояния вещества, которые могут существовать в равновесии друг с другом при непосредственном соприкосновении. Если при переходе из одной фазы в другую скачкообразно изменяются параметры состояния, такие, как объем, энтропия и т. д., имеет место фазовый переход первого рода. Условием равновесия фаз является равенство температур, давлений и химических потенциалов: Т,=Т2; Р,=Р2; //,=//,. (7.1) Обозначив температуру и давление в равновесии как Т и Р, мы можем выразить химические потенциалы как функции от этих параметров. Тогда последнее равенство в (7.1) дает нм уравнение МТ,Р)=МТ,Р)- (7-2) Решая это уравнение, мы можем получить зависимость температуры от давления или, наоборот, давления от температуры. График этой зависимо-
7. Фазовые переходы 265 сти показан на рис. 23 и называется кривой равновесия фаз. Точки, которые находятся по одну и по другую сторону от этой кривой, соответствуют однородным состояниям тела. Если изменение состояния тела происходит вдоль линии, пересекающей кривую равновесия фаз, в точке пересечения наступает равновесие фаз, при продолжении изменения состояния тела вдоль этой линии происходит переход в другую фазу. Если изменение состояния тела осуществлять настолько медленно, чтобы внутри системы не возникало неоднородностей, служащих зародышами образования новой фазы, тело может оставаться однородным и после наступления условий равновесия фаз. Такое изменение состояния тела должно быть равновесным процессом, в результате которого тело оказывается в метастабильном (неустойчивом) состоянии. Так, при достаточно медленном изменении температуры можно получить переохлажденный пар или перегретую жидкость. Малейшее воздействие, нарушающее однородность системы, приводит к разрушению этого метастабильного состояния и переходу в более устойчивое (как правило, это сопровождается фазовым переходом). Р\ Рис. 23 Если на диаграмме Р-Т точки, соответствующие состояниям, в которых сосуществуют две фазы одновременно, ложатся на кривую равновесия фаз, на диаграмме T-V такие точки будут заполнять целую область (рис. 24). Это связано с тем, что объемы разных фаз различны. Точки а областях I и II соответствуют однородным состояниям тела в первой и второй фазах. Точки, заполняющие заштрихованную область, соответствует состояниям, в которых обе фазы находятся в равновесии. Рассмотрим некоторую точку С в этой области, причем полный объем системы в данном состоянии равен какому-то значению V. Справедливо так называемое правило рычага: количества частиц в фазах I и И, Nt и Nn , обратно пропорциональны длинам отрезков АС и СВ на рис. 24.
266 Часть П V V V V т nun r r гаах Рис. 24 Действительно, полное число частиц в точке С складывается из количества частиц вещества, находящегося в фазе I, и количества частиц вещества в фазе П: N = NI+NII. (7.3) Полный объем системы также складывается из объема вещества, находящегося в фазе I, и объема вещества в фазе И: V = V,+VU. (7.4) Введем удельный объем, отнесенный к одной частице вещества. Тогда V *-Ь- N, *-£ / "и vN = vIN,+vIINll. N' (7.5) (7.6) (7.3), (7.6) дают нам систему уравнений, решая которую, можно найти от- ношение —'-. Подставляя N из (7.3) в (7.6), получаем N, v(Nl+Nu) = vIN,+v„NlI; ^(v-vJ^K-v); N, _v„-v N„ v-v, (7.7) (7.8) (7.9) Точка А на рис. 24 соответствует состоянию, когда все вещество находится в фазе I и имеет минимальный объем V в области равновесия фаз
7. Фазовые переходы 267 при данной температуре. Точка В соответствует состоянию, когда все вещество находится в фазе II и имеет максимальный объем Vmax. При этом min 1 ' m = v„N. (7.10) Умножая числитель и знаменатель дроби в правой части (7.9) на N, имеем N V -V 1УI _ гтал г Nn V-Vm (7.11) В знаменателе дроби в правой части (7.11) стоит длина отрезка АС, в числителе— длина отрезка СВ. Поэтому (7.11) дает математическое выражение правила рычага. Переписывая (7.11) в форме N,(V-Vm) = Nn(V^-V) (7.12) мы видим, что Nj=0 при V = V^ (все вещество находится в фазе II, точка В), a Nn = 0 при V = V^ (все вещество находится в фазе I, точка А). Условия равновесия трех фаз вещества выражаются равенствами: Т{=Т2=Т3; Р,=Р2 = Р3; &=&=&■ (7.13) Равенства для химических потенциалов дает нам два уравнения, из которых можно определить неизвестные температуру и давление: Hl{T,P) = ti1{T,P) = th{T,P). (7.14) Найденные при решении этих уравнений значения Т и Р соответствуют состоянию, в котором три фазы вещества могут сосуществовать одновременно. На диаграмме Р-Т такое состояние изображается изолированной точкой, в которой пересекаются три кривые равновесия— между фазами I и II, II и III, Ш и I (рис. 25). Точка пересечения кривых носит название тройной точки. Р\
268 Часть II Тройная точка на диаграмме T-V показана на рис. 26. Заштрихованные области представляют собой области попарного равновесия фаз. Равновесие более чем трех фаз одного и того же вещества невозможно, так как для двух неизвестных — температуры и давления — мы имели бы более двух независимых уравнений. V Рис. 26 При переходе из одной фазы в другую выделяется или поглощается некоторое количество тепла. Количество тепла считается положительным, если при переходе из первой фазы во вторую тепло поглощается, и отрицательным, если тепло выделяется. Поскольку фазовый переход представляет собой обратимый процесс, мы можем применить здесь формулу (2.30). Имея в виду, что температура фазового перехода постоянна, получаем 2 Q = lTdS = T{S2-S{). (7.15) 1 Интегрирование ведется по процессу, в течение которого система переходит из состояния 1, когда вся система находится в фазе I, в состояние 2, когда система полностью перешла в фазу II. Если мы разделим (7.15) на число частиц N, то получим удельную теплоту перехода q = T{s2-Sl), (7.16) здесь s — удельная энтропия (2.174). Из (2.194) имеем —(#1 <7л7) Выражение (7.16) является положительным или отрицательным в зависимости от того, какой из химических потенциалов, соответствующих двум фазам вещества, быстрее изменяется с температурой. Рассмотрим зависимость химических потенциалов двух фаз от температуры при постоянном давлении, изображенную на рис. 27. Точка пересечения кривых определяет температуру фазового перехода Г0, при котором /^ - Ц^. При всех осталь-
7. Фазовые переходы 269 ных температурах вещество может находиться только в одной фазе. Напомним, что химический потенциал— это отнесенный к одной частице, т. е. удельный, термодинамический потенциал Ф. Как и потенциал Ф, химический потенциал должен быть минимальным в состоянии равновесия. При температурах, меньших Т0, ft < fa , поэтому устойчивой является первая фаза, при Т > Т0 ft<ft, так что устойчивой будет вторая фаза. Поэтому при повышении температуры система переходит из фазы I в фазу II, и наоборот. Из графиков также видно, что w) Ш ■ 6Т )р \ 6Т )р (7.18) (7.19) При фазовом переходе с повышением температуры теплота поглощается. Это еще одна иллюстрация рассмотренного нами ранее (раздел 2.10) принципа Ле Шателье. Если бы повышение температуры сопровождалось выделением тепла, это привело бы к дальнейшему самопроизвольному повышению температуры, а фазовое равновесие оказалось бы неустойчивым. Напротив, внешнее воздействие (повышение температуры) стимулирует в системе процесс (фазовый переход с поглощением тепла), стремящиеся ослабить результаты этого воздействия. 7.2. Уравнение Клапейрона-Клаузиуса. Продифференцируем уравнение (7.2) по температуре, учитывая, что давление Р есть функция температуры, а не независимая переменная: dft | dft дР = dft | dft дР дТ дР дТ дТ дР дТ' Из (2.194) наряду с формулой (7.17) следует, что v = ЬР) (7.20) (7.21)
270 Часть II Тогда ЭР —S, + V, -— = S, + V, 31 тк1 дт ЭР эг; Эр _ s2 — s{ дТ v2-v, Используя (7.16), найдем ЭР дТ r(v2-v,)' (7.22) (7.23) (7.24) Последнее соотношение известно как уравнение Клапейрона-Клаузиуса. Оно определяет изменение давления с температурой вдоль кривой равновесия фаз. Уравнению можно придать другой вид: ЭГ = Г(у2-у,) ЭР а (7-25) В этом случае оно определяет изменение температуры перехода между двумя фазами при изменении давления. Под температурой перехода имеется в виду, например, температура кипения или плавления. Переход жидкости в пар всегда сопровождается поглощением тепла, а удельный объем Э71 газа всегда больше объема жидкости. Из (7.25) следует, что —— > 0, так что температура кипения всегда повьппается при увеличении давления. Здесь опять можно сослаться на принцип Ле Шателье. Когда жидкость находится в равновесии с паром, увеличение давления является внешним воздействием, вызывающим увеличение температуры кипения. Вследствие этого часть пара превратится в жидкость, и давление уменьшится, что ослабит результаты внешнего воздействия, нарушающего состояние равновесия. 7.3. Критическая точка. Кривая фазового равновесия может заканчиваться в некоторой точке, называемой критической, ей соответствуют критическая температура и критическое давление (рис. 28). Р\ Рис. 28
7. Фазовые переходы 271 При температурах и давлениях, значение которых выше критических, исчезают различия в свойствах фаз, и вещество будет однородным. Применительно к переходу жидкость-пар это означает, что в критической точке плотность жидкости и ее насыщенного пара становятся равны, а поверхностное натяжение жидкости падает до нуля, потому исчезает граница раздела фаз. В окрестности критической точки нарушается фазовое равновесие и происходит потеря термодинамической устойчивости. При Т>Т вещество однородно, а при Т < Т^ разделяется на жидкость и пар. Критическая точка на диаграмме T-V показана на рис. 29. Т Т Ущ V Рис. 29 На рис. 30 представлена еще одна фазовая диаграмма, на которой присутствуют области твердой, жидкой и газообразной фаз. Наличие критической точки делает возможным переход между жидкой и газообразной фазами вдоль пунктирной кривой, не пересекающей кривую равновесия фаз. Состояние вещества при этом меняется непрерывным образом, без разбиения на две фазы. В этом случае представление о различных фазах становится условным, и говорить о них можно только в точках фазового перехода, когда обе фазы существуют одновременно. Т Рис.30 Непрерывный переход между жидким и газообразным состояниями возможен потому, что различие между ними является количественным, К / ' ^\- / ' ^L / | \^ / 1 ^L / . х. / ^V.
272 Часть II обусловленным интенсивностью взаимодействия между молекулами. У обоих этих состояний отсутствует анизотропия. Жидкое и твердое состояние, напротив, отличаются качественно, прежде всего своей внутренней симметрией. Подобным образом отличаются и различные кристаллические модификации вещества. Для фаз, отличающихся симметрией, критическая точка не может существовать. Кривая равновесия либо уходит на бесконечность, либо заканчивается в тройной точке, пересекаясь с кривыми равновесия других фаз. Диаграмма P-V с критической точкой выглядит подобно диаграмме T-V (рис. 29). На рис. 31 представлена диаграмма P-V и показаны изотермы жидкости и газа АС и DF. В соответствии с неравенством (2.103) давление является убывающей функцией объема при постоянной температуре. Изотермы можно продолжить на некоторое расстояние внутрь области равновесия фаз, чему соответствуют их участки ВС и DE. Все изотермы заканчиваются на кривой GKH, в точках которой нарушаются термодинамические неравенства, в частности, (2.103). Область между кривыми LK и GK соответствует перегретой жидкости, а между кривыми НК и МК — переохлажденному пару. В этих областях, соответствующим метастабильным состояниям, термодинамические неравенства сохраняют свою силу. Внутри области GKH вещество не может существовать в однородном состоянии. V Рис. 31 7.4. Фазовые переходы П рода. Наряду с фазовыми переходами первого рода, при которых описывающие систему термодинамические функции испытывают скачок, возможны и другие изменения состояния, когда термодинамические функции меняются непрерывно, но определенные свойства системы, в первую очередь симметрия, изменяются скачкообразно. Такие изменения относятся к фазовым переходам второго рода. Хотя термодинамические функции непрерывны, их производные могут терпеть разрыв. Это приводит к тому, что при фазовых переходах второго рода
7. Фазовые переходы 273 имеет место скачок теплоемкости и других величин, таких как коэффициент теплового расширения или изотермическая сжимаемость. Поскольку энтропия изменяется непрерывно, фазовый переход второго рода не сопровождается поглощением или выделением тепла и происходит сразу во всей системе без стадии сосуществования фаз. В точке фазового перехода параметры состояния обеих фаз совпадают, фазы отличаются наличием или отсутствием определенной симметрии, которая изменяется дискретным образом. Например, изотропия вещества нарушается, если появляется отличный от нуля вектор электрической поляризации (в сегнето- электриках) или вектор намагниченности (в ферромагнетиках). Появление такого вектора, даже сколь угодно малого, задает выделенное направление и разрушает исходную симметрию. Бесконечно малое смещение атомов в кристалле может нарушить симметрию кристаллической решетки. Таким образом, фазовые переходы второго рода сопровождаются повышением или понижением симметрии. Напомним, что с математической точки зрения симметрия означает инвариантность относительно некоторой группы преобразований. Понижение симметрии подразумевает что инвариантность нарушается полностью или частично, — в последнем случае сохраняется инвариантность относительно подгруппы исходной группы преобразований. При фазовом переходе система переходит из симметричной фазы, обладающей более высокой симметрией, в несимметричную, обладающую более низкой симметрией, или обратно. В большинстве случаев симметричная фаза соответствует более высоким температурам, а несимметричная — более низким. Введем параметр порядка //, который равен нулю в симметричной фазе и принимает отличные от нуля значение в несимметричной. Он характеризует степень отклонения системы от состояния с более высокой симметрией. В качестве такого параметра может выступать упомянутые выше вектор электрической поляризации или вектор намагниченности. В несимметричной фазе параметр порядка должен быть инвариантен относительно подгруппы преобразований симметрии, которая сохранилась в результате фазового перехода, и изменяться под действием тех преобразований, которые относятся к нарушенной симметрии. Например, вектор электрической поляризации не меняется при вращениях в перпендикулярной ему плоскости, которые входят в сохранившуюся подгруппу преобразований. Симметрия системы при переходе из несимметричной фазы в симметричную меняется в точности тогда, когда параметр порядка обращается в нуль. Каждая из фаз не может существовать по другую сторону от точки фазового перехода, т. е. несимметричная фаза не может существовать при 7] = О , а симметричная — при Т] Ф О . Поэтому при фазовых переходах
274 Часть И второго рода не могут иметь места явления, подобные перегреву жидкости или переохлаждению пара, встречающиеся при фазовых переходах первого рода. 7.5. Основы теории Ландау. Для описания фазовых переходов второго рода термодинамические функции рассматриваются как зависящие не только от основных термодинамических параметров, но также от параметра порядка. Если термодинамические параметры, такие как температура и давление, могут быть заданы произвольно, значение параметра порядка определяется условиями термодинамического равновесия— условиями экстремальности термодинамических функций. Поэтому параметр порядка не равноправен по отношению к основным термодинамическим параметрам. Тем не менее, учитывая малость параметра порядка вблизи точки фазового перехода, мы можем формально разложить термодинамические функции в ряд по степеням г/ в окрестности точки 7] = О. Традиционно рассматривается разложение в ряд термодинамического потенциала Ф: Ф(Т,Р,71) = Ф0(Т,Р) + а(Т,Р)т,+ (7.26) + Л(7\ P)rj2 + C(T, P)rf + B(T, Р)//4+... Мы сразу можем положить равными нулю коэффициенты при нечетных степенях 77, поскольку термодинамический потенциал Ф не должен зависеть от того, какой знак имеет 7] (например, если мы выбираем в качестве параметра порядка вектор электрической поляризации, он будет менять знак при обращении осей координат, но это не должно сказываться на значении Ф). Таким образом, а(Т, Р) = 0, С(Т,Р) = 0; (7.27) Ф(Г, Р, 7]) = Ф0(Т, Р) + А(Т, P)tj2+B(T, P)tj4+... (7.28) В симметричной фазе при т] = О термодинамический потенциал должен иметь минимум. Это подразумевает, что ЛФ\ =2А(Т,Р)>0. (7.29) 1/7=0 drf В несимметричной фазе drj </2Ф 7*0 drf = 2А(Т, P)tj+4B(T, Р)т}3=0; = 2А(Т, P) + 12B(T, P)tj2>0. (7.30) (7.31) 77*0
7. Фазовые переходы 275 При этом точка /7 = 0 является стационарной как в симметричной, так и в несимметричной фазе. Однако в несимметричной фазе она не может соответствовать минимуму термодинамического потенциала, который достигается при ненулевых значениях Т]. Поэтому в несимметричной фазе при 7] = 0 должен быть локальный максимум Ф, чему соответствует ^ =2А(Т, Р)<0. (7.32) Из (7.29) и (7.32) заключаем, что в точке перехода /7 = 0 коэффициент А(Т, Р) меняет знак: Ас(Т,Р) = 0. (7.33) Из (7.31) при условии (7.33) получаем: В(Т, Р)>0. (7.34) Обозначим Тс=Тс(Р) — температура перехода. В первом приближении можно считать, что А{Т,Р) = а{Р){Т-Те); (7.35) В(Т, Р) = В(Тс, Р) = В(Р). (7.36) Из (7.30) найдем связь 7] с коэффициентами А и В в несимметричной фазе: «2 . 7]2=-— =—(Тс-Т). 2В 2ВК с J (7.37) Ниже мы будем считать, что а(Р)>0, тогда несимметричной фазе соответствуют температуры Т <Тс. Как упоминалось выше, именно так и обстоит дело в большинстве случаев. Для термодинамического потенциала Ф получаем выражение Ф(7\ Р, 7]) = Ф0(Т, Р) + а(Р)(Т-Тс)7]2 + В(Р)7]4. (7.38) Высшими степенями параметра порядка мы в данном приближении пренебрегаем. Находим энтропию Здесь учтено, что в равновесии \ drj) = 0. В симметричной фазе --ФЬ (7.40)
276 Часть II В несимметричной фазе S = Sc + ^(T-Tc). (7.41) При Т —>Тс S—>SC,так что энтропия остается непрерывной. Вычислим теплоемкость Ср в симметричной фазе: СР = Т fbS' ' =C„; (7.42) ЬТ в несимметричной фазе: С'=С<*+1Г (7'43) а2Т При Т—>Тс Ср-*СсР+ -, таким образом, в точке фазового перехода 2В теплоемкость испытывает скачок, равный 2j, АСР=?-^. (7.44) Р 2В Так как В>0, теплоемкость возрастает при переходе из симметричной фазы в несимметричную. Определим, какова величина скачков коэффициента теплового расширения и изотермической сжимаемости. Прежде всего заметим, что обращение в нуль коэффициента А(Т, Р) в точке фазового перехода дает уравнение (7.33), которое определяет зависимость давления от температуры перехода. В некотором смысле здесь можно провести аналогию с уравнением (7.2), определяющим кривую равновесия фаз в случае фазового перехода первого рода. Учитывая такую зависимость, продифференцируем по температуре равенства АГ = 0, Д£ = 0, (7.45) выражающие непрерывность объема и энтропии в точке фазового перехода. Рассматривая энтропию как функцию температуры и давления, получаем: дУЛ dP a(^P\ +a(V| — = 0; (7.46) {дТ]Р [dPjTdT
7. Фазовые переходы 277 Учитывая определение теплоемкости (2.40), а также соотношение (2.81), (7.47) перепишется в виде АС, —-д. dv Jp dP_ dT = 0. (7.48) С использованием определений изотермической сжимаемости (2.41) и коэффициента теплового расширения (2.43) соотношения (7.46), (7.48) примут вид Аог-АД. —= 0; (7.49) dT АСР ... dP —--VAa— = 0. Т dT (7.50) Таким образом, определена связь между скачками теплоемкости при постоянном давлении Ср, коэффициента теплового расширения а и изотермической сжимаемости J3T. Из (7.46), (7.48) следует также Для того чтобы найти скачок теплоемкости при постоянном давлении Су, продифференцируем по температуре равенства ДР = 0, Д£ = 0, (7.52) вьфажающие непрерывность давления и энтропии, рассматривая энтропию как функцию температуры и объема: ♦Al'£l dZ-0: Jv dV)TdT dS , +A, ЪТ)у \bV dS dV Имея в виду (2.39), (2.80), преобразуем (7.54): А£.+А(Ю dV \ЬТ dT 0. (7.53) (7.54) (7.55) Из (7.53), (7.55) следует: —{^тАтг К\\М*$ые эр V\dT АЛ"'- (7-56)
278 Часть II 7.6. Изменение симметрии при фазовом переходе в более общем случае. Рассмотрим изменение структуры кристаллической решетки, сопровождаемое изменением симметрии расположения атомов в кристалле. Распределение вероятностей различных положений атомов задается функцией плотности р(х, у, z). Симметрия кристаллической решетки определяется группой преобразований координат, по отношению к которым функция р(х, у, z) инвариантна. Пусть в некоторой точке, которая, по нашему предположению, является точкой фазового перехода, кристалл обладает группой симметрии G0. В результате понижения симметрии кристалл будет иметь группу симметрии G, которая является подгруппой G0. Зададимся вопросом, может ли данное понижение симметрии произойти вследствие фазового перехода второго рода? Функцию плотности р(х, у, z) можно представить в виде линейной комбинации p=Z%%- (7-57) Функции <рк преобразуются друг через друга при всех преобразованиях группы симметрии G0. Матрицы преобразований реализуют некоторое представление группы G0. Все множество функций <рк можно разбить на ряд подмножеств таким образом, что функции в каждом из подмножеств преобразуются только друг через друга при всех преобразованиях групп- пы G0. Матрицы преобразований функций из каждого подмножества реализуют неприводимое представление группы G0, а сами функции из такого подмножества образуют базис неприводимого представления. Если п — номер неприводимого представления, a z— номер базисной функции, (7.57) может быть переписано следующим образом: Р = Е£Л(Л)- (7.58) п i Среди функций ф\п' существует такая, которая осуществляет единичное представление группы. Она инвариантна по отношению ко всем преобразованиям группы G0, далее мы будем ее обозначать р0. Остальная часть 8р обладает более низкой симметрией G, чем симметрия группы G0 : р = р0 + %>; (7.59) Ф=Е'ЕЛ!Л) (7.60)
7. Фазовые переходы 279 (сумма в (7.60) не включает единичное представление р0). Симметрия функции р совпадает с симметрией 8р. Наше предположение о том, что изменение симметрии происходит путем фазового перехода второго рода, подразумевает, что с одной стороны от точки перехода и в самой точке кристалл имеет симметрию G0, а с другой стороны от точки перехода — симметрию G. Для этого необходимо, чтобы в точке перехода выполнялось 8р = 0 , т. е. все величины rjf* в (7.60) обращались в нуль. Как и в предыдущем разделе, рассмотрим термодинамический потенциал Ф, который в нашем случае зависит от температуры, давления, а также от функции плотности р . Зависимость от р предполагает, что термодинамический потенциал Ф зависит как от вида функций щп\ так и от коэффициентов Щп' в разложении (7.60). Изменение состояния при фазовом переходе второго рода происходит непрерывным образом, поэтому и коэффициенты щп* должны обращаться в нуль в точке перехода, оставаясь непрерывными функциями состояния. В окрестности точки перехода цп' принимают сколь угодно малые значения. Рассматривая термодинамический потенциал Ф как функцию Щп', вблизи точки перехода можно разложить ФуТ, Р, 7]\пЛ в ряд по степеням Щп'. Как мы увидим, величины щп' выполняют роль параметров порядка, описывающих отклонение несимметричной фазы от симметричной. Так как термодинамический потенциал Ф должен оставаться инвариантным при преобразованиях координат и в то же время является функцией от р, он должен быть инвариантен по отношению к преобразованиям группы G0, которые не изменяют р. Следовательно, каждый член разложения Ф в ряд по степеням Щп' должен быть инвариантен по отношению к преобразованиям группы G0. Член, линейный по щп', не может быть инвариантом и должен быть исключен. Следующий член разложения представляет собой положительно определенную квадратичную форму по Щп', которая может быть приведена к диагональному виду и, даже более того, к сумме квадратов щп': Ф(Т, Р, ?7<"))-Ф0(Г) />)+£'Л(Л)(Г, Р)Х(77<Л))2+.... (7.61) л I Точка перехода должна соответствовать равновесному состоянию системы, так что термодинамический потенциал Ф должен иметь в ней минимум, при этом должно выполняться Tjjn' = 0 . Мы можем записать
280 Часть II аналогично (7.29): </2Ф *и 2А{п)(Т, Р)>0. (7.62) rf-u Для того чтобы имело место изменение симметрии, необходимо, чтобы хотя бы одна из величин щ , при п — m, стала отличной от нуля. Повторяя рассуждения после формул (7.29)-(7.31), мы заключаем, что в несимметричной фазе, когда величина щт' отлична от нуля, необходимо, чтобы </2Ф d[fiu)j _ о Лт) = 2А{т)(Т,Р)<0 (7.63) 77Г-НО (это аналог формулы (7.32)). Следовательно, хотя бы один из коэффициентов А^п' (Т, Р) должен изменить знак; в самой точке перехода он обращается в нуль: 4Я){Т,Р) = 0. (7.64) Таким образом, с одной стороны от точки перехода все А^ (Г, Р) > 0. При этом все /ft = 0, кристалл обладает более высокой симметрией G0. Эта симметрия имеет место и в самой точке перехода. С другой стороны от точки перехода хотя бы один из коэффициентов А^(Т, Р) отрицателен, А^(Т, Р)<0 , соответственно, одна из величин щп' отлична от нуля, Щ*' Ф 0, симметрия кристалла понижается до подгруппы G группы G0. Если изменяет знак только один из коэффициентов А^(Т, Р) при п = m, в несимметричной фазе могут быть отличны от нуля только величины щт , относящиеся к неприводимому представлению с номером т. Тогда в (7.61) сумма по индексу п может быть опущена: \2 Ф(Г, Р, *f ) = Ф0(Г, Р)+А^(Т, P)^(t]) i Введя обозначения (7.65) (7.66)
7. Фазовые переходы 281 дополним (7.65) последующими членами разложения Ф(Г, />, /7^) = Ф0(7\ Р) + А{т)(Т, Р)т]2 + + г?Ъ<?{Т, P^W + n^B^iT, />)/!%) + ... (7*67) а а Эти члены разложения представляют собой суммы инвариантов 1у (ft) третьего, четвертого и т. д. к-то порядка, которые могут быть построены из величин ft., c соответствующими коэффициентами. Так же, как это было сделано выше для одного параметра порядка, мы заключаем, что все коэффициенты С^т\т, Р) должны обращаться в нуль и все коэффициенты В^ (Г, Р) должны быть положительными: С[т)(Т, Р) = 0; (7.68) В{ат)(Т,Р)>0. (7.69) При этих условиях термодинамический потенциал Ф будет иметь минимум в точке фазового перехода. Таким образом, в разложении (7.67) должны отсутствовать инварианты третьего порядка г* (ft). Последнее предполагает невозможность составления инвариантов третьего порядка из величин щт', относящиеся к неприводимому представлению группы G0 с номером т. Окончательно Ф(Т, Р, 17,(,,)) = Фв(7\ P) + A<m)(T, P)ff+r/*'ZB!r)(T, /»)/<4,(и) + - (7-70) а Величины Yi определяются из требования, чтобы сумма в (7.70) (коэффициент при Tj4) была минимальна. После определения ft мы можем обозначить всю сумму как В (Г, Р) и тогда вернемся к разложению вида (7.28). Затем мы можем определить величину 7] (7.66) из условия минимальности термодинамического потенциала Ф, как это было сделано выше (см. (7.30), (7.37)). 7.7. Фазовый переход второго рода в сегнетоэлектриках. Приведем некоторые примеры фазовых переходов второго рода. Одним из наиболее известных примеров является фазовый переход в сегнетоэлектриках. Напомним, что сегнетоэлектриками называются кристаллические вещества, у которых в определенном интервале температур наблюдается спонтанная поляризация. У таких веществ даже в отсутствие внешнего электрического поля отличен от нуля вектор электрической поляризации Р (он определяется как электрический дипольный момент единицы объема). Как уже
282 Часть II было упомянуто в разделе 7.4, вектор электрической поляризации играет роль параметра порядка. В. Л. Гинзбург впервые применил теорию Ландау для описания фазового перехода в сегнетоэлектриках в 1945 году. Для дальнейшего рассмотрения нам понадобится термодинамический потенциал Ф, который должен быть определен с учетом наличия электрического поля в среде. Прежде всего, нам необходимо внести изменения в основные термодинамические соотношения. Для того, чтобы выяснить, как изменится дифференциал внутренней энергии тела, рассмотрим сначала работу, которую надо произвести для того, чтобы изменить заряд уединенного проводника, находящегося в диэлектрической среде, на бесконечно малую величину Sq. Эта работа, которую должно совершить электрическое поле для того, чтобы переместить заряд Sq из бесконечности, где скалярный потенциал принимается равным нулю, на поверхность проводника, где скалярный потенциал равен (р : SA = (pSq. (7.71) Выразим работу через значение поля в окружающей проводник диэлектрической среде. Из четвертого уравнения Максвелла, записанного в интегральной форме, j>Dd& = 4xfpdV9 (7.72) s v вытекает, что заряд на поверхности проводника есть q = -—&DdS. (7.73) В (7.73) мы интегрируем по поверхности проводника, выбирая нормаль, внешнюю по отношению к окружающей проводник диэлектрической среде (и внутреннюю по отношению к проводнику), поэтому в (7.73) появляется знак «-». Бесконечно малое изменение заряда на поверхности проводника вызывает бесконечно малое изменение вектора электрической индукции SD в окружающем проводник пространстве. Учитывая, что скалярный потенциал постоянен на поверхности проводника, получаем SA = -—&<pSDdS. {1.1 А) Ап\ Интеграл (7.74) преобразуем в интеграл по объему «охватываемому» поверхностью S (в данном случае это все пространство вне проводника: SA = -—jdiv(<p SD)dV; (7.75) div(p SD) = <pdiv(SD) + SDgrad<p. (7.76)
7. Фазовые переходы 283 Поскольку внутри объема диэлектрической среды отсутствуют сторонние заряды, из четвертого уравнения Максвелла divD = 4^9 следует, что div (<Я>) = 0. Используя связь между напряженностью электрического поля и скалярным потенциалом E = -gradp, (7.77) окончательно получаем SA = —\ESDdV. (7.78) 4л- v Работа, совершаемая в единице объема среды: SVA =—ESD. (7.79) Эта работа вносит вклад в изменение внутренней энергии среды. Если мы предполагаем, что диэлектрическая среда анизотропна и в среде возможны деформации, мы должны в дифференциале внутренней энергии заменить член -PdV , характерный для изотропных тел, выражением, стоящим в правой части (2.71). В таком случае для дифференциала внутренней энергии, отнесенной к единице объема среды, мы должны записать dEv = TdSv + Y ayd£ +judNv+—E dD. (7.80) Ev, Sv, Nv — энергия, энтропия и число частиц в единице объема; ст. - тензор напряжений, etj — тензор деформаций. Термодинамический потенциал Фу единицы объема: Фу =Ey-TSy-%<?&; (7.81) dФy=-SydT-^eijdaij + /JdNv +—EdD. (7.82) ij *П Энергия и термодинамический потенциал, определенные в соответствии с (7.80) — (7.82), являются функциями компонент вектора электрической индукции D: Ey(sv, ey, Ny, d), Фу(Т, aip Ny, d). Однако, можно ввести термодинамические функции, в которых роль независимых переменных играют компоненты напряженности электрического поля, а не вектора электрической индукции: Ey=Ey-^-{E,D); (7.83) 4я"
284 Часть П е^=ф * (E,D). (7.84) Е и D, таким образом, являются термодинамически сопряженными параметрами. Для дифференциалов величин (7.83), (7.84) имеем dEv=TdSv^YjGijd£ij + ^Nv D dE; (7.85) и *к d<bv=-SvdT-Yd£ijd(Tij +HdNv -—D dE. tj An (7.86) Таким образом, мы получаем функции Ёу (Sv, eip Nv, E) иФу(Т, aiJ9 Nv, e}. Аналогично можно определить и другие термодинамические функции. Из (7.86) следует (*tl =-J-D. (7.87) Это векторное равенство, которое эквивалентно трем равенствам для отдельных компонент: 1 /TJTy,<TJk Используя связь между векторами D и Е, получим В = Е+4лР; (7.89) ЭФ^' =-—Е-Р. (7.90) ЭЕ I 4л: / T,Ny ,0ц Интегрирование трех уравнений (7.90) дает ФУ(Т, а9, Nv, Р, Е) = ФК(Г, ад, Nv, P, 0)-(Р, Е)-|-. (7.91) Первый член в (7.91), не зависящий от напряженности электрического поля Е , разложим по степеням параметра порядка Р. Сегнетоэлектриче- ской, или полярной, осью называется прямая, параллельная направлению спонтанной поляризации. Таких осей у сегнетоэлектрика может быть одна иди несколько. Пусть для простоты в кристалле имеется одна сегнетоэлек- трическая ось, направленная по оси z. Это подразумевает, что в направлениях осей х и у кристалл не проявляет сегнетоэлектрических свойств. То-
7. Фазовые переходы 285 гда нам достаточно рассмотреть в качестве параметра порядка составляющую вектора электрической поляризации, направленную по оси z. По аналогии с (7.28) мы можем записать Фу=Ф<) + А(Т)Р?+В(Т)Р:-ЕхРг-£-. (7.92) Далее, в соответствии с теорией Ландау, А(Т) = а(Т-Тс), а>0; (7.93) В = В(Тс)>0. (7.94) Несимметричной фазе соответствуют температуры Т <Тс. Фу=Ф0+а{Т-Тс)Р? + ВР?-Е,Рг-^. (7.95) Условие минимума термодинамического потенциала определяет связь между напряженностью внешнего электрического поля и поляризацией сегнетоэлектрика: ^- = 2a(T-Tc)Pz+4BPz3-Ez=0; (7.96) 2a{T-Tc)Pz+4BP?=Ez. (7.97) Выпишем также выражение для второй производной: ^f = 2a(T-Tc) + 12BPz2. (7.98) °Pz В симметричной фазе (при Т >Тс) компонента Pz должна обращаться в нуль одновременно с Ez. Когда Pz и Ez малы, можно пренебречь членом 4BPZ в (7.97) и считать, что Pz и Ez связаны линейным законом РЖ=*ЕЖ, (7.99) к — диэлектрическая восприимчивость; лг=— г; (7.100) 2а(Т-Тс)' к-*оо при Т->Тс. (7.101) В несимметричной фазе (при Т<ТС) спонтанная поляризация существует и при отсутствии электрического поля, Ez = 0. В этом случае значение компоненты вектора электрической поляризации есть
286 Часть II Уравнение (7.97) определяет кубическую зависимость Ez(Pz), график (обратной) функции Pz (Ez) показан на рис. 32. Рис. 32 Продифференцируем обе части уравнения (7.97) по Ez: dP [2в(Г-Ге) + 12^]-?- = 1. dE. (7.103) Выражение в скобках представляет собой вторую производную термодинамического потенциала Фу по параметру порядка Pz (7.98), поэтому (7.103) можно представить следующим образом: dE. = 1. (7.104) dP На участке се' кривой, показанном пунктиром на рис. 32, —- < 0, следова- dE, тельно, также выполняется Э2Ф, ър! < 0, и термодинамический потенциал Фу будет на этом участке иметь максимум. Это подразумевает, что участок се' не соответствует устойчивым состояниям. Устойчивые состояния опреде- dP л Э2Ф, ляются условием dE, ->0, или ЭР.2 - > 0, тогда из (7.98) следует ев (7.105) Заданному значению напряженности поля Ez, лежащему в интервале между абсциссами точек сие', как видно из рис. 32, соответствуют два
7. Фазовые переходы 287 значения Рг. Например, точки а и а' кривой соответствуют состояниям, которые отличаются только знаком Pz и отвечают одному и тому же значению термодинамического потенциала. Это состояния в равной степени устойчивы и представляют собой две фазы, которые могут сосуществовать одновременно. Поскольку в сегнетоэлектрике могут сосуществовать две фазы, это приводит к возможности образования в нем отдельных областей — доменов, отличающихся направлением поляризации. Форма и размеры доменов определяются условиями равновесия, в том числе условием минимальности термодинамического потенциала тела [11]. Одному и тому же значению Ez соответствуют пары точек из отрезков ас и а'Ь', з. также а 'с' и аЪ. Можно показать, что значения термодинамического потенциала Фу в точках, отвечающих одному и тому же значению Е2, на отрезках ас и а 'с' больше, чем в точках на отрезках а Ъ' и ab, соответственно. Поэтому точки на участках ас и а 'с' отвечают метаста- бильным состояниям. Область метастабильных состояний легко определить, имея в виду, что точкам а и а' отвечают значения Pz (7.102). Ординаты точек сие' определяются формулой Р*=±ЧвВ^' (?Л06) которая следует из (7.105), так что область метастабильных состояний определяется неравенством ffczli^f&zll. (7.107) 6В z 2B 7.8. Фазовый переход второго рода в ферромагнетиках. Как известно, имеется аналогия между электрическими свойствами сегнетоэлектри- ков и магнитными свойствами ферромагнетиков: те и другие в определенном интервале температур обладают спонтанной поляризацией, причем возникновение или исчезновение этой поляризации при изменении температуры происходит путем фазового перехода второго рода. Основное различие между сегнетоэлектриками и ферромагнетиками связано с характером сил взаимодействия, которые приводят к спонтанной поляризации. Возникновение ферромагнитных свойств обусловлено обменным взаимодействием, которое имеет чисто квантовую природу. Для того чтобы разобраться в термодинамических свойствах ферромагнетика, поступим аналогично тому, как было сделано в предыдущем разделе. Начнем с вычисления изменения энергии среды при наложении магнитного поля. Изменение магнитного поля индуцирует электрические
288 Часть И поля, которые, в свою очередь, производят работу над токами — источниками магнитного поля. Из электродинамики известно, что работа, производимая электрическим полем Е над током j в единице объема в единицу времени есть (j,E). За время St поле совершает работу SAE=Stj(),E)dV. (7.108) Величина (7.108), взятая с обратным знаком, представляет собой работу, совершаемую над электрическим полем электродвижущей силой, благодаря которой и протекают токи. Ток j можно выразить из третьего уравнения Максвелла для электромагнитного поля в сплошной среде: rotH=I^+^j. (7.109) с at с В данном случае D = Е. Напомним, что Е есть усредненное значение напряженности микроскопического электрического поля. Его производной по времени в правой части (7.109) можно пренебречь (мы рассматриваем квазистационарный случай), и мы получаем ) =—гоШ. (7.110) Ал Работа, совершаемая над электрическим током, есть SA = -St\(i,E)dV = -St— f(E,rotH) dV. (7.111) Используем формулу векторного анализа (b,rota)-(a,rotb) = div[a,b]; (7.112) SA = St—jdiv[E,H] dV-St—j(H,rotE) dV. (7.113) Первый интеграл в (7.113) представляет собой интеграл по всему пространству и может быть преобразован в интеграл по бесконечно удаленной поверхности, который зануляется, поскольку поля на бесконечности всегда предполагаются равными нулю. Используем первое уравнение Максвелла 1ЭВ rotE = ——. (7.114) с at Тогда SA = -St— f(H,rotE) dV = —\H—StdV=—\HSBdV. (7.115)
7. Фазовые переходы 289 Работа, совершаемая в единице объема среды: 8VA =—Н<ЯВ. (7.116) 4л Этот результат мы должны добавить к дифференциалу внутренней энергии, как это было сделано выше в случае диэлектрической среды (см. (7.80)): dEy = TdSy+YaJle» + /idNY +—Н dB. (7.117) Соответственно дифференциалы термодинамических потенциалов Ф^ и Фу: (1Фу=-5у(1Т-^£д<1ад+М(Шу+—Н<т; (7.118) d% = -SydT - Yu£i£aa + №r -—В rfH. i.i "* (7.119) Далее, ^ =-—В. (7.120) ЭН )rjl An Используем соотношение между векторами В и Н, в которое входит вектор магнитной поляризации (намагниченности) J, B = H + 4tfJ; (7.121) |f*V| =__LH-J. (7.122) Интегрирование трех уравнений (7.122) дает я2 Ф,(Т, а0, Nv, J, И) = ФГ(Т, av Nv, J, 0)-(J, H)-—. (7.123) Вектор J играет роль параметра порядка в теории фазовых переходов Ландау. Если пренебречь магнитной анизотропией ферромагнетика (зависимостью его магнитных свойств от направления), направления векторов J и Н совпадают, и в (7.123) можно заменить векторы их абсолютными значениями: ФГ(Т, ац, Hv, J, Н) = ФУ(Т, ач, Nv, J, o)-JH~. (7.124) о7Г
290 Часть II Первый член в (7.124) разложим по степеням параметра порядка J (см. (7.92)): ФУ=Ф0 + А(Т)^+В{Т)Г-Л1-—. (7.125) Дальнейшее рассмотрение практически повторяет проведенное для сегнетоэлектриков в разделе 7.7 с заменой соответствующих обозначений. Температура перехода Тс носит название точки Кюри, поскольку именно Пьер Кюри впервые наблюдал фазовый переход из ферромагнитного (упорядоченного) состояния в парамагнитное (неупорядоченное) в 1895 году, однако это название для температуры перехода впоследствии стало использоваться при описании любых фазовых переходов второго рода. Коэффициент А(Т) обращается в нуль в точке Кюри Т = ТС, причем А>0 при Т>ТС (неупорядоченное состояние, симметричная фаза) и А<0 при Т <ТС (упорядоченное состояние, несимметричная фаза). Вблизи точки Кюри справедливо разложение (7.93). В симметричной фазе (выше точки Кюри) спонтанная намагниченность отсутствует, а намагниченность J должна обращаться в нуль одновременно с Н. Когда J и Н малы, можно считать, что они связаны линейным законом J = *H, (7.126) X — магнитная восприимчивость; она определяется формулой, аналогичной формуле (7.100) для диэлектрической восприимчивости: Х = —-А г- (7.127) Л 2а{Т-Тс) Магнитная восприимчивость обратно пропорциональна разности Т -Тс. Это закон Кюри-Вейсса. (Французский физик Вейсс сделал первую попытку построить теорию ферромагнетизма в 1907 году.) В ферромагнитной (несимметричной) фазе для абсолютного значения вектора намагниченности справедлива формула, аналогичная (7.102): Подобно тому, как это было в случае сегнетоэлектриков, при определенных условиях существуют равновесные состояния ферромагнетика, в которых термодинамический потенциал имеет одно и то же значение. Эти состояния в равной степени устойчивы, что приводит к возможности одновременного сосуществования двух фаз. В свою очередь, это приводит к разбиению ферромагнетика на ряд областей спонтанной намагниченно-
7. Фазовые переходы 291 сти, или доменов. В каждой из таких областей вектор намагниченности имеет одно из двух противоположных направлений. При формировании такой структуры термодинамический потенциал тела уменьшается. Определение доменной структуры, соответствующей термодинамическому равновесию, требует учитывать форму и размеры ферромагнетика [11]. 7.9. Роль обменного взаимодействия. Модели Изинга и Гейзенберга. Попытка Вейсса построить теорию ферромагнетизма была основана на предположении, что атомы ферромагнетика обладают магнитными моментами и взаимодействуют между собой с силами, зависящими от углов между магнитными моментами. Вейсс предположил, что существует внутреннее, так называемое молекулярное, поле, которое пропорционально намагниченности J, а коэффициент пропорциональности {постоянная Вейсса) определяется свойствами ферромагнетика. Силы взаимодействия стремятся установить магнитные моменты соседних атомов параллельно друг другу. Однако чтобы понять природу молекулярного поля Вейсса, необходимо обратиться к моделям, основанным на квантовомеханических представлениях о спине и существовании обменного взаимодействия. Рассмотрим модель, предложенную в 1927 году Гейзенбергом. Она обобщала некоторые более ранние модели, в частности модель Изинга, выдвинутую в 1925 году. Последняя модель, хотя и является более простой, до сих пор широко используется в статистической физике. Если магнитные моменты, связанные с кристаллической решеткой ферромагнетика, не взаимодействовали бы друг с другом, а только с внешним магнитным полем, энергия их взаимодействия была бы равна F = -£(m„H). (7.129) i т, — магнитный момент с номером /. Если же мы хотим учесть взаимодействие магнитных моментов между собой, следует записать F = 4X4,(m.'m;)-£K>H)- (7130> Матрица Яи описывает попарное взаимодействие магнитных моментов. При этом в рамках модели Гейзенберга учитывается взаимодействие с i-м магнитным моментом только его ближайшего окружения, иначе говоря, в сумме по индексу у в (7.130) учитываются его ближайшие «соседи», число которых обозначим через z. Вспомним, что каждый магнитный момент однозначно связан со спином S/ одного из электронов, локализованного в узле кристаллической решетки, eh Щ= 8,.=2дД, (7.131) тес
292 Часть II //q = магнетон Бора, те — масса электрона. Так как проекция 2тес спина на любую ось может принимать только два значения, ±—, возможные значения проекции магнитного момента на любую ось есть eh ±//о = ± . Тогда (7.130) можно представить в виде 2тес f=4^(s"^)"2//°s(s"h)- (7лз2) В (7.132) вместо Xi} мы ввели матрицу Iir элементы которой вьфажаются через обменные интегралы частиц с номерами / и у. Как известно, волновая функция пары электронов (которые являются фермионами) должна быть антисимметрична. Эта волновая функция — произведение координатной части волновой функции на спиновую часть. Если координатная часть симметрична, спиновая — антисимметрична, она описывает систему частиц с полным спином, равным нулю (спины антипа- раллельны). Наоборот, если координатная часть антисимметрична, спиновая часть симметрична и описывает систему частиц с полным спином, равным единице (спины параллельны). Координатная часть имеет вид (естественно, знак «+» соответствует симметричной, а знак «-»— антисимметричной координатной части волновой функции). Определим среднее значение оператора взаимодействия частиц: {и) = 1чГ{г„ г,)и(\г,-г,\)ч{г„ r,)d\ d\ = 4МК-г;1)ИО|2ЬЫ А А ± ^Мк-*ы(г>«(г>;(г>;w а а : + 2 ift/(|ri-rJ|)^;(rJ>/(rf)^;(rfy,(r,)AA+ (7Л34) ±М|г, -ф; ш (Ф] («•>, (r,)d\ d\=utj+iv
7. Фазовые переходы 293 При этом вклад в среднюю энергию взаимодействия и,=!и(\г>-гЛЫг>)\2ЫгЛ2 A d\ (7Л35> не зависит от ориентации спина частиц, в то время как знак второго слагаемого /j/=±ft/(|rl.-r.|)^(r/)^(r.)^;(ry>.(r/)Ad4 (7-136) зависит от того, параллельны или антипараллельны спины частиц. Поэтому именно обменные интегралы (7.136) следует учитывать в моделях, описывающих взаимодействие магнитных моментов, а интегралы (7.135) вносят вклад в полную энергию кристаллической решетки независимо от ориентации спинов. Так мы приходим к выражению (7.132), которое лежит в основе модели Гейзенберга. Знак «+» в (7.136) соответствует случаю ферромагнетика (спины параллельны), знак «-» — случаю антиферромагнетика (спины антипараллельны). Если мы считаем частицы тождественными, а их волновые функции y/i — одинаковыми, можно подвергнуть модель Гейзенберга дальнейшему упрощению, полагая, что 1у не зависит от i,j. Тогда вместо (7.132) получим ^=4z/(s.-'s,)-2^Z(s..h)' (7лз7) ij i />0 для ферромагнетика, и /<0 для антиферромагнетика. Преобразуем (7.137): /Ч 4А' / (7Л38) г V 8А) j J i В (7.138) мы ввели эффективное магнитное поле Не~, которое действует на /-й магнитный момент: H*r=H+^rZmr (7139) В соответствие со сказанным выше, число членов в сумме в (7.139) равно числу ближайших «соседей» /-го магнитного момента, то есть z. Выразим эту сумму через среднее значение магнитного момента /т) (в силу
294 Часть II трансляционной инвариантности (т) не зависит от номерау): 2>y=z(m). (7.140) J С другой стороны, намагниченность ферромагнетика J есть J=^Zm(=v(m)=n(m)' <7Л41> N — число магнитных моментов (спинов) в ферромагнетике объема V , п — их концентрация в единице объема ферромагнетика. / / \ „ Iz —Tz(m) = H + н^=н+ Iz 8//0V (7.142) (7.143) Hw — молекулярного поля Вейсса, Я — постоянная Вейсса. Как мы видим, постоянная Вейсса выражается через обменный интеграл, так что природа поля Вейсса действительно обусловлена обменным взаимодействием. Ориентация спинов в модели Гейзенберга (7.132), (7.137) может быть любой. Если же мы будем принимать во внимание только две возможные ориентации спинов — по направлению магнитного поля и противоположно ему, мы получим еще более упрощенную модель Изинга. Рассчитаем среднее значение магнитного момента в модели Изинга. Мы будем рассматривать проекции магнитного момента т, на направление эффективного поля Heff. Исходя из (7.138), (7.131) энергия взаимодействия отдельного магнитного момента будет принимать два значения: eh En=+£ = TH>Heff=+—H0. (7.144) Верхний знак «-» соответствует ориентации магнитного момента по направлению поля, нижний знак «+» — противоположно направлению поля. Для определения среднего значения проекции магнитного момента используем распределение Гиббса: Ю = ^ЕЮлехр(-^г)- (7-145) Поскольку возможных значений проекции магнитного момента и, соответственно, энергии, всего два, статистическая сумма Z = exp кТ + ехр "Fl=exp M»Heff кТ \ ( + ехр ) V kY (7.146)
7. Фазовые переходы 295 («.> = ■ А) ехр *"-W *"■ ^ *Г £У ехр ЯД-Л '<# + ехр АД «г =A.th ^(Я + вЯ(|яж)) кТ kY Z = M,th кТ При больших значениях температуры ехр кТ j + MsL; expf-Mc *Г J Д.Я- (*.>= /1(Я+лЯ(т,)) кТ Из последнего уравнения выразим (тг): <*.) = /<Я J=—(т) = - кТ-^пХ Nrf Vk\T- £пХ\ к ) я=хя Вводя температуру Кюри-Вейсса Т = _/4пЛ (7.147) 1 , АД*. Г1" кт ' (7.148) (7.149) (7.150) (7.151) (7.152) (7.153) мы получаем для магнитной проницаемости такую же зависимость от температуры, какую дает теория фазовых переходов Ландау (см. (7.127)): Ы Vk{T-Tc) (7.154) При Т>Тс %>0, что подразумевает, что в симметричной фазе ферромагнетик находится в парамагнитном состоянии. Таким образом, в рамках данной достаточно простой модели мы сумели прояснить природу поля Вейсса и воспроизвести результат теории Ландау, который в этой теории
296 ЧастьП получается из самых общих соображений, без конкретизации модели, описывающей взаимодействие в ферромагнетике. 7.10. Ограниченность применимости теории Ландау. Конденсация Бозе— Эйнштейна как пример фазового перехода второго рода. В разделах 7.5, 7.6 были изложены основные положения теории фазовых переходов Ландау, которые затем были использованы при рассмотрении фазовых переходов в сегнетоэлектриках и ферромагнетиках. Теория Ландау базируется на разложениях типа (7.26), (7.67), а также (7.35), (7.36). Эти разложения справедливы при условии малости флуктуации макропараметров, в частности малости флуктуации параметра порядка. В самой точке фазового перехода флуктуации не могут оставаться малыми. Действительно, как следует из (7.29)-(7.33), вторая производная термодинамического потенциала Ф по параметру порядка бесконечно мала в окрестности точки перехода и обращается в нуль в этой точке. Следовательно, термодинамический потенциал Ф не только имеет минимум в точке перехода, но этот минимум пологий, поскольку вторая производная Ф меняется медленно. В свою очередь, это говорит о том, что параметр порядка может испытывать сильные отклонения от равновесного значения. Поэтому теория Ландау не может быть применима в непосредственной близости от точки перехода, т. е. при малых [Г-Т^. Также она неприменима и вдали от точки перехода, где нельзя пользоваться разложениями типа (7.35). Таким образом, теория Ландау оказывается применимой лишь в достаточно узкой области значений l^-Tj, более того, для данного явления, которое является фазовым переходом второго рода, должен быть поставлен вопрос, существует ли такая область температур вблизи точки перехода, в которой мы можем использовать теорию Ландау? Результаты, полученные в рамках теории Ландау, строго говоря, следует относить не к самой точке перехода, а к границе области применимости, ближайшей к точке перехода. Так, например, скачок теплоемкости более правильно определять как разность значений теплоемкости на границах области применимости по разные стороны от точки перехода. Известно [12], что изотоп гелия Не4, состоящий из частиц, подчиняющихся статистике Бозе-Эйнштейна, при низких температурах представляет собой квантовую жидкость, которая при температуре Тс =2,172 К испытывает фазовый переход второго рода. При температурах ниже Тс гелий обладает свойством сверхтекучести (эта фаза называется гелий П), при температурах выше критической это свойство исчезает (фаза гелий I). Отсутствие трения в сверхтекучем гелии II было экспериментально установлено П. Л. Капицей в 1938 году (в 1978 году ему была присуждена Нобелевская премия за это открытие). Если построить график зависимости теп-
7. Фазовые переходы 297 лоемкости гелия от температуры (рис. 33), по форме он напоминает букву Л, поэтому точку фазового перехода в данном случае часто называют Я -точкой. 1 2 3 4 5 Г, К Рис. 33 Сверхтекучесть представляет собой свойство жидкости протекать без трения по узким сосудам (капиллярам). Трение предполагает, что в жидкости присутствуют элементарные возбуждения. При абсолютном нуле температуры квантовая жидкость находится в основном состоянии, а элементарные возбуждения отсутствуют, имеет место явление конденсации Бозе- Эйнштейна, которое мы рассматривали в разделе 5.8. При температурах, близких к абсолютному нулю, макроскопически большое число частиц оказываются в низшем энергетическом состоянии, иными словами, образуют бозе-эйнштейновский конденсат. При таких температурах в жидкости можно выделить две составляющие: сверхтекучую (бозе-эйнштейновский конденсат), не обладающую трением, и нормальную составляющую, вязкость которой обусловлена наличием элементарных возбуждений. Между этими составляющими отсутствует трение, так как не происходит передачи импульса от одной к другой составляющей. Таким образом, при понижении температуры ниже Тс становится существенной доля частиц, перешедших в бозе-эйнштейновский конденсат. При этом теплоемкость ведет себя необычным образом, что позволяет считать это явление фазовым переходом второго рода. Такой фазовый переход существенно отличается от рассмотренных выше примеров фазовых переходов в сегнетоэлектриках и ферромагнетиках. В качестве параметра порядка здесь выступает часть волновой функции системы, описывающей конденсат. Если ввести квантовомеханические операторы рождения и уничтожения частиц в состоянии с нулевым импульсом, dl и а0 (индекс 0 указывает на состояние с импульсом /7 = 0), волновую функцию конденсата можно представить следующим образом:
298 Часть II где TV — число частиц в конденсате (макроскопически большое), |0) — вакуумный вектор. Вектор состояния всей системы является суперпозицией вектора вида (7.155) и векторов состояний, в которых присутствуют элементарные возбуждения. Чем слабее взаимодействие между частицами и чем ближе к абсолютному нулю температура, тем больше частиц переходят в конденсат и с большей вероятностью состояние системы описывается вектором (7.155). Благодаря слабости взаимодействия вектор (7.155) можно считать ортогональным по отношению к другим векторам состояний, которые входят в суперпозицию. В случае фазового перехода второго рода в Не4 область применимости теории Ландау отсутствует, и для описания свойств этого перехода и получения зависимостей различных термодинамических величин от температуры необходимо обратиться к флуктуационной теории фазовых переходов [13]. Ее изложение, однако, выходит за рамки данного курса.
Литература к части II 299 Литература к части II 1. Л. Д. Ландау, Е. М. Лифшиц. Статистическая физика, Часть I. — Москва: «Физматлит», 2010. 2. Р. Кубо. Статистическая механика. — Москва: «Мир», 1967. 3. Р. Кубо. Термодинамика. — Москва: «Мир», 1970. 4. Ф. Рейф. Статистическая физика. — Москва: «Наука», 1972. 5. А. Исихара. Статистическая физика. — Москва: «Мир», 1973. 6. Р. Фейнман. Статистическая механика. — Москва: «Мир», 1975. 7. Л. Д. Ландау, Е. М. Лифшиц. Механика. — Москва: «Физматлит», 2013. 8. И. Пригожий. От существующего к возникающему: время и сложность в физических науках. — М., УРСС, 2002. 9. И. фон Нейман. Математические основы квантовой механики. — Москва: «Наука», 1964. 10. Р. Пенроуз. «Сингулярности и асимметрия во времени», Общая теория относительности, ред. С. Хокинг и В. Израэль. — Москва: «Мир», 1983. 11. Л. Д. Ландау, Е. М. Лифшиц. Электродинамика сплошных сред. — Москва: «Физматлит», 2003. 12. Л. Д. Ландау, Е. М. Лифшиц. Статистическая физика, Часть II. — Москва: «Физматлит», 2004. 13. А. 3. Паташинский, В. Л. Покровский. Флуктуационная теория фазовых переходов. — Москва: «Наука», 1982.
Полный ассортимент литературы издательств «Институт компьютерных исследований» и «Регулярная и хаотическая динамика» по самым доступным ценам представлен в отделах прямых продаж: /ЙйС; Россия, Ижевск Удмуртский государственный университет ул. Университетская, д. 1, корп. 4, оф. 201 а/207 телУфакс: +7 (3412) 50-02-95 e-mail: subscribe@rcd.ru, rhd-m@mail.ru Интерн ет-магази н http://shop.rcd.ru • Отправка заказов осуществляется почтой РФ из г. Ижевска • Цены на сайте указаны без учета стоимости доставки Книжные магазины и киоски: Ж Московский дом книги Москва, ул. Новый Арбат, д. 8 (м. «Арбатская») Тел.: +7 (495) 789-35-91 Дом технической книги Москва, Ленинский проспект, д. 40 (м. «Ленинский Проспект») Тел.: +7 (499) 137-60-19 Магазин научной книги URSS Москва, Нахимовский проспект, д. 56 Тел.:+7 (499) 724-25-45 Книжная сеть Буквоед www.bookvoed.ru Тел.:+7 (812) 601-0-601 На просторах интернета: О OZON.ru http://www.ozon.ru &Ь Московский дом книги http^/wwwjndk-arbatru EAGE Геомодель (fii\ Инфра-Инженерия http://www.eageju \vL) http^/wwwJnfra-ej4i р^иблион http://wwwJ>iblion.ru Каталог изданий для предприятий ЦемтрЛигНефге/аз httpzA^rifcru нефтегазового комплекса http://www.yagello.ru http://www.boolcvoed.ru Шестакова Татьяна Павловна Лекции по теоретической физике Электродинамика Термодинамика и статистическая физика Технический редактор А. В. Бакиев Компьютерный набор и верстка А. В. Моторин Корректор Т. К Якушева Подписано в печать 20.10.14. Формат 60x84Vi6. Усл. печ. л. 17,44. Уч. изд. л. 18,73. Гарнитура Тайме. Бумага офсетная №1. Печать офсетная. Заказ №14-77. АНО НИЦ «Регулярная и хаотическая динамика» 426000, г. Ижевск, ул. Родниковая, д. 56 http://shop.rcd.ru E-mail: mail@rcd.ru Тел./факс:+7 (3412) 50-02-95