Текст
                    В. Г. ЛЕВИЧ
КУРС
ТЕОРЕТИЧЕСКОЙ
ФИЗИКИ
Том I
ТЕОРИЯ
ЭЛЕКТРОМАГНИТНОГО ПОЛЯ
ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ
СТАТИСТИЧЕСКАЯ ФИЗИКА
ЭЛЕКТРОМАГНИТНЫЕ ПРОЦЕССЫ
В ВЕЩЕСТВЕ
ИЗДАНИЕ ВТОРОЕ, ПЕРЕРАБОТАННОЕ
Допущено Министерством высшего и среднего специального образования СССР
в качестве учебного пособия
для студентов физико-технических вузов и факультетов
ИЗДАТЕЛЬСТВО «ПАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТГРА ГУРЫ
МОСКВА 1969


530.1 Л 37 УДК 530.1 ¦J-3-2 22-66
'2 ОГЛАВЛЕНИЕ Предисловие ко второму изданию Предисловие к первому изданию ЧАСТЬ I ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ Глава I. Общая теория электромагнитного поля 17 § 1. Задачи теоретической физики 17 § 2. Нахождение векторного поля по его дифференциальным харак- характеристикам 1Я § 3. Заряды и частицы 24 § 4. Поле неподвижных зарядов 2<> § 5. Уравнение непрерывности 31 § 6. Электромагнитное поле зарядов, движущихся с постоянной скоростью 33 § 7. Электромагнитное поле движущихся зарядов. Общий случаи . . 37 § 8. Система уравнений Масквелла—Лоренца 41 § 9. Ток смещения 43 § 10. Потенциалы электромагнитного поля . . М §11. Калибровочная инвариантность потенциалов 49 § 12. Закон сохранения энергии в электромагнитном поле 52 § 13. Закон сохранения импульса в электромагнитном поле 53 Глава II. Электростатическое поле , 5'.) § 14. Электростатическое поле 5'J § 15. Электростатическое поле системы точечных зарядов .... (Я § 16. Квадрупольный момент 66 § 17. Работа и энергия во внешнем электростатическом поле 70 § 18. Энергия взаимодействия системы зарядов и энергия электро статического поля 73 Глава Ш. Квазистационарное магнитное поле , 7t> § 19. Поле системы зарядов, совершающих медленное квазистацио- квазистационарное движение 76 § 20. Поле одиночного заряда, совершающего медленное равномерное движение 8? § 21. Поле системы зарядов, совершающих квазистационарное дви- движение на больших расстояних от системы 84 § 22. Магнитный момент 86 1*
4 ог.плплпшг Глава IV. Электромагнитное поле произвольно движущихся зарядов 89 § 2.3. Электромагнитное поле системы произнольно движущихся зарядов 89 § 24*. Общее решение уравнения Даламбера в виде запаздывающих потенциалов 98 § 25*.Поле произвольно движущегося точечного заряда 104 Глава V. Теория излучения ..111 § 26. Потенциалы электромагнитного поля вдали от излучения в дн- полыюм приближении Ill § 27. Электромагнитное поле диполыюго излучения вдали от излучателя 116 § 28. Дигюльное излучение простейших систем 119 § 29. Реакция излучения , . 123 § 30. Ширина излучаемых лини» .127 § 31. Влияние магнитного и электрического полей н;> излучение (эффек- (эффекты Зсемапа и Штарка). Квадруполыюе и магнитное дипольное излучение 131 § 32*. Обший случай, излучения — спектральное разложение, волновая и квазистатическая зона, учет собственного запаздывания . . . 137 Глава VI. Электромагнитное поле в вакууме и рассеяние электромаг- электромагнитных волн 145 § 33. Распределение электромагнитных волн вдали от излучателя . . 145 § 34. Поляризация плоской волны 151 § 35. Интерференция и образование волновых пакетов 152 § 36. Рассеяние электромагнитных волн свободным и связанным зарядами 157 § 37. Поглощение излучения . . 161 § 38*. Каноническая форма уравнений поля 163 Глава VII. Движение частиц в электромагнитных полях 172 § 39. Движение заряженных частиц в постоянных электрическом и магнитном полях 172 § 40. Движение заряженных частиц в медленно изменяющихся маг- магнитных полях 179 § 41. Функции Лагранжа и функция Гамильтона частицы, движущейся в электромагнитном поле 182 § 42. Движение и излучение системы из двух заряженных частиц ... 184 § 43. Рассеяние частиц и излучение при рассеянии 190 ЧАСТЬ II ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ Глава I. Общие принципы теории относительное!и 204 § 1. Возникновение и значение теории относительности 204 § 2. Преобразования Галилея 205 § 3. Попытки определения абсолютной скорости 208 § 4. Постулаты теории относительности Эйнштейна 210 § 5. Преобразования Лоренца 213 § 6. Следствия из преобразований Лоренца. Пространственные и вре- временные промежутки 216 § 7. Закон сложения скоростей Эйнштейна и преобразование углов 222 § 8. Одновременность, близко- и дальнодействие 224 § 9. Абсолютные величины в теории относительности. Интервал и собственное время 226
ОГЛАВЛЕНИЕ 5 § 10. Ивариантность физических законов относительно преобразова- преобразований Лоренца. Четырехмерная формулировка теории относитель- относительности . . ... . . 229 § П. Четырехмерные векторы и тензоры. Четырехмерные скорость и ускорение . 235 Глава П. Механика теории относительности 242 5 12. Уравнения динамики материальной точки 242 iS 13. Импульс, энергия и масса в релятивистской механике 245 ? 14. Уравнения Лагранжа; функции Лагранжа и Гамильтона .... 251 5 Т5. Механика системы частиц в теории относительности 253 К 16. Закон сохранения энергии — импульса в ядерной физике .... 258 § 17. Теории столкновений релятивистских частик. Эффект Компюна 208 Глава III. Электродинамика теории относительности 273 § 18. Инвариантность заряда, четырехмерный ток и уравнение не- непрерывности 273 § 19. Релятивистски-инвариантная формулировка уравнений ,гпя по- потенциалов 274 § 20. Поле движущегося заряда 276 § 21. Тензор электромагнитного поля и уравнения Максвелла .... 282 § 22. Допплер эффект; эффект Мсссбауэра: наблюдение за быстро дви- движущимися телами; преобразование углов, интенсивности, сечения 285 § 23. Сила Лоренца; функции Лагранжа и Гамильтона, частицы, дви- движущейся в электромагнитном поле 299 $ 24. Движение частиц в постоянных электрическом и магнитном полях 304 § 25*.Система слабо взаимодействующих заряженных частиц . . , . 3[( § 26. Излучение движущегося заряда 319 ЧАСТЬ Ш СТАТИСТИЧГСКАЯ ФИЗИКА Г л а в а I. Основные понятия теории вероятностей 325 § I. Задачи статистической физики. Необходимые сведения из класси- классической квантовой механики 325 ¦$ 2. Необходимые сведения из теории вероятностей 342 § 3. Средние значения и флуктуации 343 § 4. Нормальное распределение и моменты 354 § 5. Коррелятивная функция 357 Глава II. Кинетическая теория газов 3GI § 6. Простейшая статистическая система — идеальный газ . , 361 § 7. Распределение Максвелла 365 § 8. Столкновения молекул со стенкой сосуда. Давление. Связь пара- параметра а с абсолютной температурой . , 3(>9 5 9. Свойства распределения Максвелла 372 § 10. Вычисление характерных величин 375 § 11. Столкновения молекул между собой .... ...... 378 § 12. Длина свободного пробега 381 Глава 111. Статистическое распределение 384 § 13. Квазинезависияые системы 384 § 14. Статистическое распределение 385 § 15. Вероятность состояний системы 388
6 ОГЛАВЛЕНИЕ § 1G. Распределение Гиббса 393 § 17. Статистическая температура 400 § 18. Свойства распределения Гиббса и статистическое равновесие . . 402 § 19. Переход к классической статистике 404 § 20. Одноатомный газ как целое 408- Глава IV. Статистическая и феноменологическая термодинамика . . 414 § 21. Внутренняя энергия макроскопической системы. Первое и второе начала термодинамики 414 § 22. Работа и давление 417 § 23. Изменение энергии системы в общем случае квазистатического процесса ......... 420 § 24. Энтропия и основное термодинамическое равенство 425 § 25. Закон возрастания энтропии 427 § 26. Основное термодинамическое неравенство 432 § 27. Максимальная работа процессов. Невозможность построения вечного двигателя второго рода и феноменологическое опреде- определение энтропии 434 § 28. Максимальная работа некруговых процессов и термодинамические потенциалы 439 § 29. Свойства термодинамических потенциалов 442 § 30. Некоторые термодинамические соотношения 444 § 31. Приемы преобразования термодинамических величин 446 § 32. Определение термодинамических величин методами статистиче- статистической физики 4,10 § 33. Определение термодинамических величин из опытных данных . , 454 § 34. Дросселирование 457 § 35. Третье начало термодинамики 459 § 36. Статистический характер второго начала термодинамики .... 466 Глава V. Идеальные газы 476 § 37. Функция распределения для идеальных га^ов 476 § 38. Распределение Максвелла—Больцмапа и распределение Больц- мана в однородном поле сил 484 § 39. Вычисление теплоемкости двухатомных молекул с помощью клас- классической статистики и закон равномерного распределения по сте- степеням свободы 490 § 40. Термодинамические функции системы, могущей находиться в двух квантовых состояниях 499 § 41. Двухатомные молекулы 503 5 42. Термодинамические функции двухатомных газов 508 § 43. Колебательная функция состояний и вклад колебаний в энергию и теплоемкость 5!О § 44. Вращательная функция состояний и вклад вращения в термо- термодинамические функции 515 § 45. Многоатомные молекулы . , 519" Глава VI. Системы взаимодействующих частиц ¦ . . . 525 § 46. Взаимодействие между молекулами в неидеальных газах .... 525 § 47. Уравнение состояния неидеалыюго газа 529- § 48*. Метод коррелятивных функций и его применение к теории плот- плотных газов и жидкостей 534 § 49* Уравнение состояния и энергия системы 53Я
ОГЛАВЛЕНИИ 7 Глава VII. Кристаллы 545 § 50. Строение кристаллов и тепловое движение 545 § 51. Длинные волны в трехмерном кристалле 557 § 52. Функция состояний кристалла 561 § 53. Термодинамические функции кристалла 563 § 54. Сравнение теории с экспериментом 565 Глава VI11. Теория флуктуации 570 § 55. Малые флуктуации в макроскопических системах 570 § 56. Броуновское движение 576 § 57. Флуктуации термодинамических величин в однородной системе 582 § 58. Влияние флуктуации на чувствительность измерительных при- приборов • 588 Г л а и а IX. Системы с переменным числом частиц 593 § 59. Большое каноническое распределение Гиббса 593 § 60. Основное термодинамическое равенство и вычисление парциаль- парциальных потенциалов , 603 § 61. Условия равновесия фаз 603 § 62. Уравнение кривой фазового равновесия 605 § 63. Теория фазовых переходов . 612 § 64. Кривые фазового равновесия 617 § 65. Поверхностное натяжение и поверхностное давление 621 § 66. Адсорбция газов 625 § 67. Химические равновесия в газовой фазе 629 § 68. Закон действующих масс 630 § 69. Тепловая диссоциация атомов 633 Глава X. Статистические распределения в квантовой статистике и не- некоторые их приложения 636 § 70. Последовательный учет тождественности элементарных частиц 636 § 71. Другом метод вывода статистического распределения 637 § 72. Квантовые распределения для идеального газа 641 § 73. Излучение черного тела 648 § 74. Классическая теория черного излучения 652 § 75. Формула Планка 654 § 76. Статистика фотонного газа 656 § 77. Свойства жидкого гелия II 662 § 78*. Статистическая теория жидкого гелия II . 666 § 79. Электронный газ в металле при абсолютном нуле 671 § 80. Электронный газ при низких температурах 676 ЧАСТЬ IV ЭЛЕКТРОМАГНИТНЫЕ ПРОЦЕССЫ В ВЕЩЕСТВЕ Глава I. Электромагнитные поля в веществе 681 § 1. Вывод основных уравнений поля 684 § 2. Поляризация среды в электрическом поле 687 § 3. Средняя плотность тока и средняя плотность заряда в среде 689
Система граничных условии Пределы применимости системы уравнении связи
Общая характеристика плазмы Равновесная щазма Плазма в стациона( ном этектромапштном поче Магнитная изоляция и пннч эффект Магнитное noie в движущейся п тлме Mai нитогидродинамкческне волны Плазма в высокочастотном электрическом поле Вещество в состоянии плазмы
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ Первое издание книги «Курс теоретической физики» A962 г.) использовалось в ряде высших учебных заведений в качестве учебного пособия. Полученные многочисленные замечания и пожелания ряда коллег, преподавателей и учащихся, были, по возможности, учтены в процессе подготовки книги к переизданию. Быстрое развитие физики и широкий интерес, который при- приобрели в физике неравновесные и нестационарные процессы, побудили существенно расширить раздел физической кинетики. При этом казалось целесообразным перенести раздел физиче- физической кинетики в конец второго тома. Излагать физическую кине- кинетику, не опираясь на сведения из квантовой механики, практи- практически невозможно. Существенной перереботке подверглась часть IV — «Элек- «Электромагнитные процессы в веществе». В самые последние годы в физике повысился интерес к электромагнитным процессам в веществе главным образом в связи с исследованиями плазмы и плазмоподобных сред. Мы сочли необходимым включить в книгу соответствующие разделы. Методы расчета электростатических полей, полей постоян- постоянных токов и другие задачи классической электродинамики в среде изложены более чем кратко. Хотя их практическая важ- важность очевидна, мы полагали, что учащиеся имеют возможность ознакомиться более подробно с этими вопросами в курсах общей физики, электро- и радиотехники и в курсе методов математической физики. Кроме того, этот круг проблем доста- достаточно подробно освещен в монографической и учебной лите- литературе. Среди других изменений и добавлений следует особо указать па введение тензорных обозначений и понятий в теорию отно- относительности и теорию электромагнитного поля; расширение введения в теорию вероятностей; краткое изложение метода коррелятивных функций в статистической физике; изложение термодинамической теории ферромагнетизма и теории распро* странения электромагнитных волн в плазме.
ПРЕДИСЛОВИИ КО ВТОРОМУ ИЗДАНИЮ П Ряд параграфов переписан заново. При этом мы стреми- стремились, по возможности, приблизить содержание книги к интере- интересам современной теоретической физики. Общий уровень книги во втором издании сохранен. Она по- прежнему предназначена для первоначального ознакомления с теоретической физикой. Поэтому те вопросы, которые требуют использования громоздкого или специального математического аппарата, в курс не были включены. В виде примера можно привести теорию фазовых переходов в модели Изинга. Наиболее сложные параграфы отмечены звездочкой. Они могут быть при желании опущены, поскольку в дальнейшем тексте ссылок на них не имеется. Май 1968 г. АвТ°Р
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Непрерывное развитие теоретической физики и постоянное расширение области ее приложений предъявляет все новые и новые требования к соответствующим учебникам и руководствам. Развитие и усложнение новейших экспериментальных мето- методов физического исследования, с одной стороны, и такое же раз- развитие и необычайное расширение расчетного аппарата теорети- теоретической физики, с другой стороны, привели к тому, что, как пра- правило, один человек не может совмещать в своей деятельности оба метода исследования. Отсюда — возникшее в конце XIX ве- века и особенно в XX веке разделение физиков на «эксперимента- «экспериментаторов», непосредственно осуществляющих опытные исследова- исследования в лабораториях, и «теоретиков», изучающих физические закономерности с помощью расчетных методов теоретической физики. Ясно, однако, что определенный круг сведений по теорети- теоретической физике является основой физического образования как теоретиков, так и экспериментаторов. Методы физического исследования — экспериментальные и теоретические, проникли в целый ряд смежных с физикой науч- научных дисциплин (физическая химия, биофизика, геофизика, астрофизика и т. д.) и в технику (металлофизика и металлове- металловедение, теплофизика, электро- и радиотехника, вычислительная техника, приборостроение и т. д.). Лицам, работающим в этих областях науки и техники, также необходим некоторый мини- минимум сведений по теоретической физике. Составление современного руководства по теоретической физике неизбежно связано с известными логическими и методи- методическими трудностями. В настоящее время невозможно разделить теоретическую физику на классическую и квантовую части и даже последовательно разбить ее на отдельные главы и раз- разделы. Например, изложение статистической физики без учета квантовых свойств атомных систем не представляется возмож- возможным, так как это означало бы, что общая теория осталась без практических приложений; в теории электромагнитных процес- процессов в веществе неизбежно приходится пользоваться понятиями
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ 13 статистической физики и т. д. Возможно, что предельно логиче- логическая последовательность построения была бы достигнута, если бы в основу книги была положена квантовая механика. Однако это представляется совершенно недопустимым в книге, предна- предназначенной для первоначального знакомства с предметом. Перво- Первоначальное изучение квантовой механики невозможно без не- некоторой «моральной» подготовки. Учащийся должен быть убежден в необходимости отказа от наглядных классических представлений. Поэтому неизбежны некоторые компромиссные решения, которые оправдали себя в многолетней практике пре- преподавания теоретической физики в Московском инженерно-" физическом институте. Книга разбита на следующие части: 1. Теория электромагнитного поля. 2. Теория относительности. 3. Статистическая физика. 4. Теория электромагнитного поля в веществе. 5. Квантовая механика. При изложении этих разделов мы исходили из следующих общих принципов: 1) Книга предназначена для систематического изучения предмета и представляет единое целое. Все сведения, необходи- необходимые для понимания последующих разделов, содержатся в пред- предшествующих им главах. 2) Было бы невозможно наряду с вопросами, относящимися собственно к теоретической физике, освещать и соответствующие опытные факты. С другой стороны, физика является единой наукой и попытка изложить теоретическую физику вне связи с экспериментом была бы глубоко ошибочной. Предполагается, однако, что читатель знаком с основными опытными фактами из вузовских курсов общей физики и атомной физики. Поэтому мы ограничивались лишь ссылками и в сравнительно немногих случаях — схематическим описанием основных экспериментов. 3) Предполагаемое знакомство с общим курсом физики и атомной физикой позволили в изложении статистической физики опираться на некоторые (хотя и весьма ограниченные) сведе- сведения из квантовой теории. 4) Поскольку обычно классическая механика является от- отдельным курсом, в книге нет соответствующего раздела, но имеются детальные ссылки на известные курсы механики. 5) По этой же причине в ьнигу не включено изложение гидро- и аэродинамики и теории теплопередачи, а также во- вопросы, смежные с электро- и радиотехникой. 6) В книге даны детальные ссылки на математические руко- руководства. Используемый математический аппарат, кроме пара- параграфов, отмеченных звездочкой, находится в соответствии с
14 ПРЕДИСЛОВИР К ПЕРВОМУ ИЗДАНИЮ обычной программой курса анализа в инженерно-физических вузах. В случае квантовой механики математический аппарат дан в самой книге, поскольку он имеет сцецифическии характер и не излагается в традиционных курсах математики. Однако и здесь математический аппарат излагается отдельно от основ- основного текста. 7) Поскольку книга предназначена для систематического изучения теоретической физики, то нет необходимости стре- стремиться к единому уровню доступности различных разделов. Курс теоретической физики обычно излагается в течение двух лет, на третьем и четвертом курсах физических вузов. Препо- Преподавателям теоретической физики хорошо известно, как повы- повышаются за это время возможности восприятия и усвоения более трудных вопросов курса. Существенно расширяется также мате- математический аппарат. Вместе с тем, следует иметь в виду, что физчкам-экспериментаторам постоянно приходится сталкивать- сталкиваться с новейшими вопросами квантовой механики, последователь- последовательное освещение которых требует использования сравнительно сложных расчетных методов. Поэтому в квантовой механике (ч. V книги) изложены некоторые вопросы, более сложные, чем в остальных разделах книги. По той же причине сравнительно широко представлен в книге разбор различных применений кинетического уравнения, связанный с выполнением громоздких вычислений. Целевая направленность книги отразилась на содержании отдельных разделов. В книгу включены те вопросы, которые связаны с актуаль- актуальными задачами современной физики, и сознательно сокращено при этом изложение некоторых традиционных проблем. Первая часть содержит основы теории электромагнитного поля в вакууме. В основу изложения положена система урав- уравнений Максвелла — Лоренца. Предполагается, что читатель знаком с основными фактами из области электромагнетизма по курсу общей физики. Основное внимание уделено теории излу- излучения и движению заряженных частиц во внешних полях. В части II, посвященной теории относительности, принята четырехмерная форма изложения, которая не только отвечает дулу теории, но и преобладает в современной литературе. Более пол1ю изложены вопросы динамики теории относительности. Освещен ряд новейших приложений теории относительности, в частности к вопросам ядерной физики. Некоторые из этих при- приложений еще не вошли в учебную литературу. В части III, которая представляет переработанный вариант книги В. Г. Левича «Введение в статистическую физику», изла- излагаются как вопросы статистической физики, так и основы ста- статистической термодинамики. Классическое изложение термодн-
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ 15 намики потребовало бы слишком много места и не представля- представлялось нам необходимым. Рассмотрены некоторые основные положения физической кинетики, которые в физических вузах излагаются обычно не в общем курсе теоретической физики, а в специальном курсе. Том второй содержит теорию электромагнитных процессов в веществе (ч. IV) и квантовую механику (ч. V). В четвертой части курса вопросам, смежным с теоретической электротехникой и радиотехникой (специальные задачи электро- электростатики, теория цепей переменного тока с сосредоточенными и распределенными постоянными, излучение антенн и т. п.), уде- уделено сравнительно мало внимания. Более подробно разобрана феноменологическая теория электропроводности, а также дано представление о физике плазменного состояния вещества. В квантовую механику кроме традиционных вопросов нереля- нерелятивистской теории включены основные представления совре- современной релятивистской квантовой механики. Относительно по- подробно представлены приложения квантовой механики к теории твердого тела. Опыт преподавания теоретической физики показывает, что при первоначальном знакомстве с предметом часто наибольшие трудности вызывает не восприятие новых физических идей, а проведение соответствующих вычислений. Поэтому все выкладки И расчеты приведены в возможно более полном виде. Звездочкой отмечены параграфы, посвяшенные более слож- сложным вопросам и основанные на разделах математики, выходя- выходящих за рамки программы III курса, а также параграфы, не имеющие самодовлеющего интереса, но необходимые для даль- дальнейших разделов книги. Их при первом чтении можно про- пропустить. Мы привели для удобства краткий вывод встречающихся формул векторного анализа, а также необходимые сведения по интегралам Фурье и теории б-функции, которой мы широко пользовались. Нумерация формул и параграфов проведена по каждой из частей. Ссылки на приложения снабжены римской нумерацией. Включение в книгу задач повлекло бы за собой непомерное уве- увеличение ее объема. Авторы надеются, что после ознакомления с основами тео- теоретической физики, изложенными в данной книге, читатели су- сумеют перейти к более глубокому ее изучению по фундаменталь- фундаментальному многотомному курсу Л. Д. Ландау и Е. М. Лифшица. Научные и педагогические идеи этого курса оказали большое влияние на авторов, которые являются учениками Л. Д. Ландау первого (В. Г. Левич) и второго (Ю. А. Вдовин, В. А. Мямлин> научных поколений.
16 ПРЕДИСЛОВИЕ К ППР1ЮМУ ИЗДАНИЮ Мы предполагаем, что с опытными фактами из области атомной и, частично, ядерной физики читатель может познако- познакомиться по курсу Э. В. Шпольского «Атомная физика», методи- методические и педагогические идеи которого также оказали влияние на содержание данной книги. Том I (части I—IV) написан В. Г. Лсвичем, кроме части § 22 ч. II и приложения III, написанных Ю. А. Вдовиным. В основу книги были положены программа и курс теоре- ти-геской физики, в течение ряда лет читавшийся в Московском инженерно-физическом институте. Авторы благодарят своих коллег — членов кафедры теорети- теоретической физики Московского инженерно-физического института, педагогический опыт которых способствовал появлению книги. Особая благодарность выражается товарищам, прочитавшим книгу в рукописи и сделавшим ряд ценных замечаний: Б. М. Графову, Р. Р. Догонадзе, В. А. Кирьянову, В. С. Кры- Крылову, В. П. Смилге, Ю. А. Чизмаджеву, Ю. И. Яламову, а также редакторам книги А. И. Алексееву и Б. Л. Лившицу. Мы ясно представляем, что сделанная нами попытка созда- создания курса теоретической физики, одновременно достаточно пол- iv го по содержанию и доступного по форме изложения, являет- является весьма сложной задачей. Несомненно, что в ряде случаев наше изложение не свободно от недостатков и промахов. По- Поэтому авторы заранее благодарны читателям и коллегам за возможные критические замечания, которые будут учтены в дальнейшей работе над книгой.
ЧАСТЬ I ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ ГЛАВА I ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ § 1. Задачи теоретической физики Физика — наука, в первую очередь экспериментальная. Од- Однако уже в работах Ньютона и других основоположников со- современной физики для получения количественных формулиро- формулировок физических — на первых порах главным образом механиче- механических— закономерностей успешно применялись математические приемы и методы. В последнее столетие применение математических методов в физике настолько расширилось и углубилось, что возникла особая отрасль физики — теоретическая физика. Перед теорети- теоретической физикой стоят задачи двоякого рода: \. Выражение физических закономерностей в виде количе- количественных соотношений и установление внутренних взаимосвязей между наблюдающимися опытными фактами. 2. Применение математических методов исследования к на- нахождению вювых физических закономерностей; предсказание но- новых, еще не обнаруженных на опыте взаимосвязей между физи- физическими явлениями. Таким образом, теоретическая физика является по своим ме- методам математической, а по содержанию — физической наукой. Из сказанного ясно, что именно в теоретической физике со- содержатся и окончательно отшлифовываются общие теоретиче- теоретические воззрения относительно сущности разнообразных физиче- физических процессов. Сказанное лучше всего пояснить на простом примере. Иссле- Исследователи, опытным путем установившие планетарную модель атома, наличие у атомов дискретных допустимых значений энер- энергии и т. п. факты, внесли важнейший вклад в физическую тео- теорию. Однако теоретическая физика не могла ограничиться каче- качественными, модельными представлениями о строении атома. Из этого вытекает, что теоретическая физика стремится сформулировать наиболее общие к;п,:тииР("гпдцчь1П фн*циеские 2 В. Г. Левич, том (
18 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл. Г законы, отражающие существо возможно более широкого круга явлений. Примерами подобных законов могут служить законы механики (законы Ньютона), законы электромагнитного поля (уравнения Максвелла — Лоренца), законы квантовой меха- механики и т. п. Основой общих физических законов не могут служить логи- логические рассуждения. Этой основой могут быть только опытные факты. Поэтому наиболее общие количественные соотношения теоретической физики не «выводятся», но представляют обоб- обобщенную формулировку наблюдавшихся физических закономер- закономерностей. С другой стороны, как мы увидим на конкретных при- примерах, в ряде случаев количественные выражения физических законов явились результатом научного предвидения. Располагая количественной формулировкой общих физиче- физических законов, теоретическая физика может перейти к выполне- выполнению второй части своей программы — установлению новых за- закономерностей и связей с помощью математических методов ис- исследования. На этом пути теоретическая физика добилась таких успехов, по сравнению с которыми бледнеют даже такие приме- примеры научного предвидения, как открытие астрономом Леверье планеты Нептун в XIX веке. В виде примеров можно указать открытие Максвеллом тока смещения и установление на этой основе электромагнитной при- природы света; создание Эйнштейном теории относительности и, в частности, установление связи между массой и энергией; пред- предсказание квантовой механикой (созданной де Бройлем, Шре- дингером и Гейзенбергом) существования волновых свойсгн у микрочастиц — электронов, протонов и др.; предсказание тео- теорией Дирака существования и свойств позитрона и других анти- античастиц и т. д. Роль теоретической физики в новейшем развитии ядерной физики и использовании атомной энергии общеизвестна. Необходимо подчеркнуть, что математические расчетные ме- методы теоретической физики имеют очень своеобразный характер. Теоретическая физика не является разделом математики. В теоретической физике не пытаются найти точные физические законы, определяющие поведение даже сравнительно простых систем. Точный учет всех возможных влияний и взаимосвязей сделал бы неразрешимыми уже самые простые задачи. Ни на одном этапе исследования в теоретической физике не упускают из виду необходимость учета главных, определяеющих связей и пренебрежения побочными, несущественными обстоятельствами. Соотношения и уравнения теоретической физики столь слож- сложны, что практически всегда приходится идти по пути приближен- приближенных расчетов. Для того чтобы уяснить, какие приближения воз- возможны и целесообразны, а какие незаконны и не имеют физи- физического смысла, очень часто приходится исходить из имеющихся
<§ 2] НАХОЖДЕНИЕ ВЕКТОРНОГО ПОЛЯ 19 опытных данных. Вместе с тем, формулы и соотношения, кото- которые принципиально не могут быть проверены на опыте, вообще не рассматриваются в теоретической физике. Все усилия теоре- теоретической физики, как и физики экспериментальной, направлены на выяснение объективно существующих связей, физических закономерностей природы. Физическая теория, объясняющая известные, но не способная предсказать новые факты, всегда считается неудовлетворитель- неудовлетворительной. С другой стороны, высшей оценкой правильности физиче- физической теории является экспериментальное подтверждение пред- предсказанных ею фактов. В свою очередь выяснение новых явлений, обнаруженных опытным путем, служит стимулом для дальнейшего развития теоретической физики. Таким образом, экспериментальная и теоретическая физика составляют единое и неразрывное целоо. § 2. Нахождение векторного поля ло его дифференциальным характеристикам Мы увидим в дальнейшем, что состояние электромагнитного поля .характеризуется заданием его векторных характеристик,— напряженностей электрического и магнитного полей. По этой причине при изложении общей теории и при решении конкрет- конкретных задач в теории электромагнитного поля широко исполь- используется специфический математический аппарат, так называемый векторный анализ. Описание электромагнитного поля, не опирающееся на аппа- аппарат векторного анализа, возможное в принципе, потребовало бы весьма громоздких выкладок и сложных преобразований. По- Поэтому дальнейшее изложение ведется исключительно на основе векторного анализа. Хотя мы предполагаем, что его основы из- известны читателю, в приложении I дан краткий вывод всех встре- встречающихся формул и преобразований. Мы разберем здесь один важный вопрос математической тео- теории произвольного векторного поля. Значение этого вопроса для теории электромагнитного поля заключается в том, что общая расчетная схема теории поля строится по образу и подобию приводимого ниже расчета произвольного векторного поля. Пусть во всем пространстве имеется векторное поле я (г). Относительно поведения вектора а(г) в бесконечно удаленных точках пространства будут сделаны некоторые допущения, о ко- которых будет сказано ниже. Предположим,, что заданы интегральные характеристики поля— поток векторах a dS и циркуляция вектора xadt в каж- Дой точке пространства. Мы увидим в дальнейшем, что в случае
20 ОПЩАЯ ТПОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ (Гл. I электромагнитных полей именно эти характеристики вектор- векторного поля содержат величины, непосредственно измеряемые на опыте. Покажем, что если заданы указанные характеристики ноля, то может быть найдено и само векторное поле й(г). Если kadS = I f(r)dV, где f(r) — известная функция координат, то на основании теоремы Гаусса — Остроградского §adS= J div adV= \f(r)dV, B,1) откуда, ввиду произвольного характера области интегрирования с объемом V, имеем iliv« = /(r). B,2) Таким образом, задание потока вектора через замкнутую по- поверхность в каждой точке пространства эквивалентно заданию дивергенции этого вектора. Далее, на основании теоремы Стокса, dl = J rotadS= j &{r)dS, B,3) где w(r)—известная векторная функция координат. Отсюда rota = ©(r). B,4) Задание циркуляции вектора эквивалентно заданию его ротора. Покажем, как можно найти векторное поле а(г), если изве- известны дивергенция и ротор вектора а по всем пространстве. Разложим поле а на два поля: а = п\ + а2, так, чтобы имели место соотношения: diva,=/(r), B,5) rota^ 0, B,5') diva2=0, B,6) rotaa = «e(r). B,6') Векторное поле а\ является безвихревым; линии векторного поля fli начинаются и заканчиваются в источниках и стоках, интенсивность которых определяется функцией /(г). Векторное поле п2 не имеет источников и стоков и является соленоидаль- ным полем. Начнем с рассмотрения поля С|. Поскольку ноле а, не имеет вихрей, вектор ах можно представить и виде градиента некото- некоторой вспомогательной скалярной функции at = gr ad ф (г), B,7) где (f(r) — функция, именуемая скалярным потенциалом.
.§ 2J НАХОЖДЕНИЕ ВЕКТОРНОГО ПОЛЯ 2t Подставляя уравнение B,7) в B,5), находим: divgradcp = /(r), или Аф = f(r), v'2,8) д2 д2 д2 где A = -^j- + -jts" + "aF" ~ оператор Лапласа. Уравнение в частных производных второго порядка B,8) называется урав- уравнением Пуассона. Его общее решение мы получим в § 24. Здесь мы приведем лишь конечный результат и убедимся в том, что написанное решение удовлетворяет уравнению B,8). Оказывается, что решение уравнения Пуассона имеет вид ф/г\ = L Г f(ro) rfVu |_ Г 44 4л J lr-ro| 4я J I (Хр, г/о, г0) dxp dtjc dza _ XoJ + {у - //0J + (г - zaY' B,9) где (x, у, г)—координаты точки наблюдения, т. с. той точки, в которой ищется значение функции <|>, а х0, у0, г0 — переменные интегрирования. Величина| г — г01= ^(л: — х0J + (у — г/0J + (z — 20J представляет расстояние от точки г0 до точки наблюдения г. Подставляя B,9) в B,8), можно легко убедиться, что напи- написанное выражение действительно удовлетворяет исходному уравнению А » I Г / (х0, !/а, г0) dxg dyv dz0 = - i J fl*o> уо> z<>) Ыо л = J f (xo, I/o. zn) б (x - лг0) 6 (у - y0) б (г - г0) dxQ dy(j dz0 = / (х, у, г). При этом мы воспользовались свойствами 6-функции и функции -: г (см. приложение III). Оператор Д означает дифферен- цирование по координатам г и может быть внесен пол знак ин- интегрирования по координатам г0. Если интегрирование ведется по всему пространству, для су- существования и сходимости интеграла B,9) необходимо, чтобы подынтегральная функция /(Го) удовлетворяла очевидному тре- требованию где А—конечная величина и К > 0. Иными словами, функция f(r0) должна убывать при г0-*-°о быстрее, чем функция -\г
22 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл. I При выполнении этого условия интеграл B,9) сходится, а функция ф(г) убывает при неограниченном возрастании своего аргумента по закону Bи> Если выполняется условие B,10), мы можем утверждать, что B,9) представляет решение уравнения B,8). Зная функцию ц>(г) и воспользовавшись определением B,7), находим п\\ ах{г) = grad Ф(г) - - ± grad J \{^ffi . B,12) Перейдем теперь к определению вектора ai{r). Векторное поле й2(г) имеет соленоидальный характер и, следовательно, вектор а2 может быть представлен в виде ротора некоторого вспомогательного вектора А(г): а2 = то[А(г). B,13) Векторная функция А(г) получила название векторного потен- потенциала, или вектора-потенциала. Из определения B,13) ясно, что уравнение B,6) удовлетво- удовлетворено автоматически: div rot Л (г) =0. Для полного определения вектора-потенциала А нужно еще задать значение его дивергенции div А, которая пока остается произвольной. Положим divA=0. B,14) Несколько ниже мы убедимся, что последнее допущение не огра- ограничивает общности наших рассуждений. Подставляя B,13) в B,6'), имеем rot rot А (г) = grad div А (г) — АА (г) =о>(г). Учитывая условие B,14), находим ДА(г)—ю(г) B,15) или в скалярном виде ААХ=—со* (г),
J 2] НАХОЖДЕНИЕ ВЕКТОРНОГО ПОЛЯ 23 Компоненты вектора-потенциала удовлетворяют тем же уравнениям, что и скалярный потенциал <р. Их решения гласят: BД6). BД60 B,16") Если функции (i)X) щ и шг удовлетворяют тем же условиям поведения на бесконечности, каким должна удовлетворять функ- функция f(r0) в B,9), интегралы в выражениях B,16) — B,16") схо- сходятся. При этом формулы B,16) — B,16") определяют вектор- потенциал А. Зная вектор-потенциал А, можно найти вектор а% простым дифференцированием: а2(г) = rot Л (г) = rot -L J -^L dV0. B,17) Также путем дифференцирования можно убедиться, что найден- найденный вектор-потенциал удовлетворяет условию B,14). Таким образом, векторное поле а(г) полностью определяется по заданным во всем пространстве значениям его дивергенции f(r0) и ротора «(/о): а (г) = с, + а2 = grad cp + rot A = Поскольку дивергенция и ротор вектора а однозначно свя- связаны с потоком и циркуляцией этого вектора, можно также утверждать, что векторное поле а(г) полностью определено по- потоком и циркуляцией этого вектора. Остановимся еще на важном вопросе о возможности выбора divd в виде B,14). Определением B,13) вектор-потенциал А задан неоднозначно. К нему можно прибавить градиент произ- произвольной функции ф, т. е. положить A' = A + gradf. B,19) Имеем, очевидно, ToiA' = rotA. Таким образом, прибавление к А градиента произвольной функ- функции t|) приводит к прежнему значению вектора а. Пусть, в отличие от условия B,14), div АФО. Тогда всегда можно перейти к новому вектору-потенциалу А' по формуле- ,B,19). Для него имеем div A' = di\' Л + div grad i|j = di
24 ОПЩАЯ ТГОРИЯ ЭЛСКТРОМАПГИТМОГО ПОЛЯ [Гл Г Не ограничивая общности рассуждении, всегда можно вы- выбрать произвольную функцию t|> так, чтобы при любом div Л^0 имело место равенство Ai|> =—div Л. Это значит, что всегда можно считать и, следовательно, условие B,14) имеет совершенно общий ха- характер. Легко показать, наконец, что найденное выражение для а является единственным решением уравнений B,2) — B,4)!). Найденное нами выражение для векторного поля о, в зави- зависимости от значений его дивергенции /(г) и ротора а(г), не связано с какими-либо допущениями о физическом смысле и характере рассматриваемых величин Оно, вместе с тем, яв- является прототипом тех вычислений, которые обычно приходится проделывать в теории электромагнитного поля для нахождения электрического и магнитного потей. § 3. Заряды и частицы Согласно современным представлениям, в природе суще- существуют так называемые элементарные частицы и системы, имею- имеющие сложную структуру, и построенные из элементарных ча- частиц— атомы и молекулы. Элементарные частицы и системы, состоящие из сравнительно небольшого числа элементарных частиц —отдельные атомы или молекулы, принято называть микрочастицами и микросистемами, тела, состоящие из боль- большого числа атомов — макросистемами В настоящее время известно достаточно большое число эле- элементарных частиц, более трех десятков. Взаимоотношения ме- между элементарными частицами весьма далеки от простой схемы, принимавшейся в физике еще сравнительно недавно, когда были известны лишь две элементарные частицы — протон и электрон. С основными свойствами микрочастиц и микросистем мы по- познакомимся в дальнейшем и главным образом в пятой части курса. Наиболее глубокие вопросы, касающиеся строения и слойств элементарных частиц, еще не выяснены в современной физике, а ряд установленных положений настолько сложен, что их изложение не может быть проведено в рамках этой книги В первой части книги будут рассмотрены некоторые свой- свойства микрочастиц и микросистем в приближении классической ') См, например, II F К о ч и и, Вектошгое исчисление и начала тензор- лого исчисления, Изд-во АН СССР, 1951, стр 213.
I 3] ЗАРЯДЫ И ЧАСТИЦЫ 25- физики. В чем оно заключается и каковы границы его приме- применимости, будет видно из дальнейшего Важнейшей характеристикой всех микрочастиц является закон взаимодействия между ними. Микрочастицы могут взаи- взаимодействовать, находясь на некотором расстоянии друг от друга В настоящее время известно, что между микрочастицами существует несколько различных видов взаимодействия — элек- электромагнитное, гравитационное, ядерное. Каждый вид взаимо- взаимодействия связывается с определенной характеристикой частицы. В первой части курса, включенной в эту книгу, мы будем инте- интересоваться только электромагнитным взаимодействием. Под электромагнитным взаимодействием понимают определенный вид силового взаимодействия между некоторыми частицами, характер которого будет рассмотрен ниже. Электромагнитное взаимодействие не зависит от масс частиц, которые определяют их гравитационное взаимодействие. Ока- Оказывается, что в простейшем случае неподвижных относительно друг друга и притом одинаковых частиц, сила взаимодействия определяется только расстоянием между ними и единственной характеристикой частиц, именуемой их зарядом. Закон взаимодействия неподвижных относительно друг друга частиц выражается известной формулой: где F — сила, г — расстояние между частицами и е, — их заряд. Это — так называемый закон Кулона. Заряд частицы данного типа является одной из основных, первичных ее характеристик. Сила взаимодействия между ча- частицами одного типа — электронами, протонами и т. д. — всегда сила отталкивания. Взаимодействие между частицами разных типов может иметь характер как отталкивания, так и притяже- притяжения. Условно принято считать электроны заряженными отрица- отрицательно, протоны — положительно. Знак заряда остальных заря- заряженных элементарных частиц — ц- и я-мезонов, К-мезонов и ги- гиперонов определяется по отношению к электронам и протонам так, чтобы он отвечал правилу — одноименно заряженные ча- частицы отталкиваются, разноименно заряженные частицы при- притягиваются друг к другу Нейтроны, нейтрино, нейтриальпие я-мезоны могут служить, примерами нейтральных частиц. Нейтральным частицам нельзя приписать какой-либо отличный от нуля заряд. Удивительной особенностью заряда является то, что у всех эле- элементарных частиц он имеет одно и то же абсолютное значение.
26 ОБЩАЯ ТПОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл. I В системе CGSE, которой мы будем пользоваться в дальней- дальнейшем, элементарный заряд равен \е\ =4,77-100 г'1г• см''*• сек~1. Второй особенностью заряда, выражающей его фундамен- фундаментальное значение как характеристики частиц, является свой- свойство сохранения. Во всех процессах, происходящих в природе, алгебраическая сумма зарядов не изменяется (закон сохранения заряда). Закон сохранения заряда является одним из самых важных законов природы. Большинство тел в земных условиях построено из атомов и молекул — квазинейтральных систем, у которых положительный заряд ядра равен отрицательному заряду электронной оболочки. При ионизации, т. е. при переходе в заряженное состояние, атом теряет один или несколько электронов. В силу закона сохране- сохранения заряда при ионизации возникает положительный ион с за- зарядом Л/^[еi и N электронов с зарядом —\е\, где N— целое число. При присоединении к атому лишнего электрона он может превращаться в отрицательный ион с зарядом —\е\. Таким об- образом, заряд всякой системы является целочисленным, кратным элементарному заряду е. В микроскопической классической теории поля мы будем изучать поведение систем, состоящих из сравнительно неболь- небольшого числа частиц, например, отдельных электронов или про- протонов, ионов и т. д. Будем считать отдельные элементарные ча- частицы не имеющими протяженности и движущимися по законам классической механики. Внутренней структурой элементарных частиц мы интересоваться не будем. Такая идеализация, как это будет ясно из дальнейшего, в ряде случаев является чрез- чрезмерно грубой. Законы классической физики имеют ограничен- ограниченную применимость к микросистемам, а иногда и вовсе не при- применимы к ним. В частности, они непригодны для рассмотрения явлений, происходящих в весьма малой области пространства вблизи заряда. Поэтому в ряде случаев, которые будут обсу- обсуждаться ниже, наши упрощающие предположения приведут к трудностям и противоречиям. В квантовой механике (часть пятая курса) представления о законах, определяющих движение и свойства микроскопических частиц, будут существенно развиты и усовершенствованы. Поскольку нас пока будут интересовать только свойства ча- частиц, связанные с их электромагнитным взаимодействием, мы будем просто говорить о взаимодействии зарядов. § 4. Поле неподвижных зарядов Пусть в некоторых точках пространства г{ закреплены заря- заряды <?,. Поместим в область пространства вблизи этой совокуп- совокупности зарядов некоторый заряд е, настолько малый, что изме-
§ 4] ПОЛИ НЕПОДВИЖНЫХ ЗАРЯДОВ 27 пением свойств системы, вызываемым внесением в него заря- заряда е, можно пренебречь. Такой заряд мы будем называть проб- пробным. Наблюдая за пробным зарядом, мы обнаружим, что в ка- каждой точке пространства г на него действует сила F, пропорцио- пропорциональная величине заряда е, т. е. F=BE(r). D,1) Строго говоря, сила F действует на пробный заряд, располо- расположенный на любом расстоянии от фиксированных зарядов. Одна- Однако, поскольку величина силы быстро уменьшается (см. ниже) с расстоянием, практически лишь вблизи зарядов проявляется действие силы F. Ту область пространства, в которой на проб- пробный заряд действует сила F, мы будем называть электрическим полем неподвижных зарядов или электростатическим полем. До- Достаточно удаленные области пространства, в которых сила F становится пренебрежимо малой, мы будем приближенно счи- считать бесконечно удаленными и считать, что в них иоле отсут- отсутствует. Поскольку пробный заряд не влияет на свойства поля си- системы зарядов, вектор Е характеризует свойства этого поля. Мы впредь будем именовать Е напряженностью электрического поли или, для краткости, электрическим полем. Исследуя силу F, действующую на пробный заряд, можно определить значение вектора Е в каждой точке поля и тем самым установить свойства электрического поля неподвижных зарядов. При этом оказывается возможным найти некоторые общие свойства полей неподвижных зарядов, не зависящие от конкретного характера расположения и величин зарядов, со- создающих поле. Опыт показывает, что электрическое поле системы неподвиж- неподвижных зарядов обладает аддитивными свойствами: напряженность суммарного электрического поля, образованного несколькими зарядами, равна векторной сумме полей ?,-, созданных каждым зарядом, т. е. ?=??*. D,2) Это важнейшее свойство электрических полей именуется обычно свойством суперпозиции. Изучая движение пробного заряда, можно найти векторные линии электростатического поля Ё. Зная распределение поля Е в пространстве, можно опреде- определить распределение и взаимодействие создающих его зарядов. Естественно, может показаться, что введение поля есть некото- некоторый математический прием, удобный способ описания взаимо- взаимодействия. Ниже мы увидим, что в действительности это не так и что поле обладает той же степенью реальности, что и частицы.
•28 ОСЩЛЯ ТЕОРИЯ ЭЛРКТРОМАГНИТЕЮГО ПОЛЯ [Гл I Полю можно приписать те же характеристики, что и частицам — энергию, импульс, массу и т. д. Более того, мы покажем, что пространственно разделенные частицы не могут действовать друг на друга непосредственно (нет так называемого дально- дальнодействия). Частица изменяет состояние поля в непосредствен- непосредственной близости от себя. Это изменение состояния поля — возму- возмущение— движется в пространстве от точки к точке и доходит до другой частицы. Такова концепция полевого взаимодей- взаимодействия, или теория близкодействия. Более подробно теория близ- кодействия будет рассмотрена в § 24 ч. I и § 8 ч. II. Оказывается, что работа, соврешаемая электростатическим полем над пробным зарядом при перемещении его из точки г, в точку г2, не зависит от пути, по которому происходило это перемещение. Это означает, что работа перемещения заряда по замкнутому контуру равна нулю, т. е. Таким образом, для линий электростатического поля всегда имеет место равенство " Е dl = 0 D,3) при интегрировании по произвольному замкнутому контуру. В соответствии со сказанным выше мы должны от равен- равенства D,3) перейти к дифференциальной характеристике поля. Для этого воспользуемся теоремой Стокса, которая дает = 0. D,4) Поскольку поверхность интегрирования в D,4) является про- произвольной, из D,4) следует rotE=0. D,5) Формула D,5) показывает, что электростатическое поле яв- является безвихревым. В электростатическом поле не существует замкнутых линий. Следовательно, должны существовать источ- источники и стоки, на которых начинаются и заканчиваются линии поля. Опыт показывает, что в электростатическом поле источни- источниками и стоками линий напряженности поля служат электриче- электрические заряды. Условно считают, что линии поля начинаются на положительных и оканчиваются на отрицательных зарядах. По- Поскольку заряды являются источниками и стоками, поток векто- вектора Е по любой замкнутой поверхности, окружающей каждый заряд, отличен от нуля. Если внутрь поверхности интегрирова-
$ 4] ПОЛГ НРПОДВИЖНЫХ ЗАРЯЛОВ 29 ния S попадает некоторый заряд 2^, где суммирование озна- означает алгебраическое суммирование по всем зарядам, то поток вектора Е должен быть пропорционален эгой сумме, т. е. ? tfS = const J]^. D,6) Это утверждение носит название теоремы Гаусса. Мы подчеркиваем, что в рамках нашего приближения заря- заряды имеют точечный харатер, а величина заряда любой системы кратна элементарному заряду. Для упрощения математических выкладок нам необходимо сделать важный шаг и перейти от дискретного, прерывного рас- распределения зарядов к непрерывному. Пусть в некотором малом объеме бV находится достаточно большое число зарядов. Поскольку заряды находятся на малых расстояниях друг от друга, для математического описания за- зарядов удобно заменить истинное распределение точечных ди- дискретных зарядов фиктивным непрерывным распределением. Именно, заменяя объем 6V бесконечно малым объемом dV и полагая, что в бесконечно малом обьеме заключен бесконечно малый заряд dc, можно написать tie где 9 = ~7\/~~ плотность заряда, т. е. заряд в данной точке про- пространства, отнесенный к единице объема. В случае неподвижных зарядов р является непрерывной функцией точки р(г). Подчеркнем, что переход к непрерывной плотности имеет чисто математический характер. Его не следует смешивать с аналогичной операцией, с которой мы познакомимся в ч. IV, посвященной электромагнитным процессам в веществе. Связь между математическим описанием дискретного рас- распределения точечных зарядов и непрерывной функцией р(г) мо- можно установить с помощью аппарата б-функции (см. приложе- приложение III). Именно, поскольку полный заряд в произвольном объе- объеме может быть выражен в виде где суммирование ведется по всем зарядам, находящимся в объеме V, мы можем написать Р (г)-21 в, в (г-г,),
30 ПГ.ППЯ ТГОРНЯ ЭЛГКТРОПАГПИТНОГО ПОЛЯ [Гл Г где г, радиус-вектор (-го заряда, Действительно, подпавляя это значение р(/"), имеем В частности, плотность заряда, отвечающая одному заряду, на- находящемуся в точке г0, может быть представлена в виде р(г)=е6(г — г0). Важно отметить, что введение непрерывной плотности зч- ряда позволяет как само поле, так и распределение зарядов описать непрерывными функциями точки. Пользуясь определением плотности заряда, можем предста- представить D,6) в виде <j; ?dS = const $pdV, D,7> где интеграл справа берется по объему, охватываемому поверк- нсстыо S. По теореме Гаусса—Остроградского §EdS=* Г d\v EdV. ^4,8) Поэтому из формул D.7) и D.8) получаем div? = const-р. D,9) Формула D,9) определяет дивергенцию поля в каждой точ- точке пространства. Значение коэффициента пропорциональности в формуле D,9) может быть определено только из опытных дан- данных (нарнмер, при опытной проверке закона Кулона). В системе CGSE эта постоянная равна 4л, так что сЖ'Е = 4лр. D,10) По причинам, которые будут пояснены ниже, уравнения D,5) и D,10) мы будем именовать уравнениями Максвелла для элек- электростатического поля или, кратко, уравнениями электростатики. Поскольку электростатическое поле является безвихревым, в соответствии с общими приемами описания векторного поля, можно ввести скаляр ф, именуемый электростатическим потеи- циалом и определяемый соотношением ? =—grad<p. D,11) Знак минус означает, что вектор Е направлен в сторону быст- быстрейшего убывания потенциала <р. Выбор такого направления является условным.
. 51 УРАВНЕНИЕ НЕПРЕРЫВНОСТИ 31 Величина 2 2 J*?d/ = — J* grad<pd/= ср,-<р2> D,12) 1 1 называемая электродвижущей силой или, кратко, э. д. с, будет часто встречаться в дальнейшем. (Подчеркнем, что электродви- электродвижущая сила не является силой ни по своей природе, ни но раз- размерности. Название э. д. с. имеет характер исторической тра- традиции.) В электростатическом поле электродвижущая сила равна разности электростатических потенциалов в соответствующих точках. Подставляя определение D,11) в уравнения электростатиче- электростатического поля D,5) и D,10), мы видим, что первое из них удовле- удовлетворяется тождественно, тогда как второе дает div grad ф =—4лр, или, на основании формулы A,49), дф = _4лр. D,13) Полученное нами уравнение Пуассона будет обсуждаться в § 14. § 5. Уравнение непрерывности В дальнейшем нам надо будет перейти к рассмотрению более сложного случая полей движущихся зарядов. Движение элек- электрических зарядов в пространстве приводит к переносу заряда, именуемому электрическим током, или, для кратности, просто током. Электрический ток мы будем характеризовать вектором плотности тока j(r,i), определяемым равенством J = 2 e,vtt где в( — величина заряда, а »*— вектор скорости i-ro заряда. Суммирование ведется по всем зарядам, находящимся в момент времени / в единичном объеме, окружающем точку г. При непрерывном распределении заряда плотность тока можно представить в виде /-Р* E,1) Вектор плотности тока представляет, очевидно, величину за- заряда, пересекающего за 1 сек воображаемую единичную пло- Щадку, находящуюся в момент времени / в точке г. Значения функции р и V, т. е. плотности заряда и скорости *го перемещения, не могут быть произвольными, по должны Удовлетворять требованиям закона сохранения заряда.
32 ОКЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл Г Рассмотрим замкнутую поверхность, внутри которой поме- помещен некоторый заряд е—\ pdV, и найдем производную —-?j-\pdV. Здесь интегрирование ведется по объему V, заклю- заключенному внутри поверхности 5. Величина производной (взятая ее знаком минус) представляет убыль заряда, заключенного вну- внутри поверхности S, в единицу времени. Поскольку электрические заряды не исчезают и не возникают вновь, убыль заряда в объеме V равна потоку заряла, выходящему за 1 сек через по- поверхность S, охватывающую этот объем. Следовательно, имеет место равенство $j §vclS. E,2) Переходя в последнем интеграле к интегрированию ло объему, получаем -^-Jprfl/ = j di Изменяя порядок независимых операций интегрирования по объему и дифференцирования по времени, имеем J dt dV Ввиду произвольности объема интегрирования, последнее равен- равенство дает ^ j или E,3) & j Формулы E,3), представляющие математическое выражение за- закона сохранения заряда, носят название уравнения непрерыв- непрерывности. При стационарных процессах, когда распределение плот- плотности заряда не изменяется во времени, уравнение непрерыв- непрерывности гласит: div divy или divy=0. j <5>4> Равенства E,4) показывают, что при стационарных процессах векторное поле плотности тока имеет соленоидальный характер.
§ 6] ПОЛЕ ЗАРЯДОВ, ДВИЖУЩИХСЯ С ПОСТОЯННОЙ СКОРОСТЬЮ 33 Траектории-движущихся зарядов являются замкнутыми, а век- векторные линии вектора / образуют замкнутые, не пересекающие- пересекающиеся между собой трубки тока1). В дальнейшем мы будем пользоваться понятием полного тока / через поверхность S. По определению, /= \jdS= f jndS, где интегрирование ведется по поверхности S. Ток / дает вели- величину полного заряда, проходящего за 1 сек через поверхность S. § 6. Электромагнитное поле зарядов, движущихся с постоянной скоростью Мы перейдем теперь к изучению поля движущихся зарядов. Поле движущихся зарядов мы будем именовать электромагнит- электромагнитным полем. Свойства электромагнитного поля существенно сложнее свойств электростатического поля. Установление основ- основных закономерностей, определяющих поведение электромагнит- электромагнитных нолей, явилось частично результатом экспериментального изучения электромагнитных явлений (Эрстед, Лмпер, Ом и Фа- радей), частично результатом теоретического предвидения (Максвелл), которое лишь позднее было подтверждено на опыте (Герц). Изложение истории развития электромагнетизма выходит за рамки этой книги. Подчеркнем, однако, что поскольку атоми- атомистический характер заряда был открыт лишь в конце XIX — начале XX века, все опыты и теоретическая их интерпретация относились к явлениям в материальных средах. Мы изложим результаты этих опытов на языке микроскопической физики, имеющей дело с зарядами, движущимися в пустоте. Иными словами, не останавливаясь на постановке самих опытов, мы представим их результат в некоторой обобщенной форме, в ко- которой исключено влияние среды и конкретных условий прове- проведения экспериментов. Основные законы электромагнитного поля, которые будут изложены ниже, в настоящее время опираются не только на многочисленные и разнообразные опытные данные, но состав- составляют основу современной электро- и радиотехники. Рассмотрим прежде всего движение некоторой совокупности зарядов вдоль трубки или контура /, происходящее с постоян- постоянной скоростью. Иными словами, предположим, что в некотором контуре идет электрический ток, плотность которого / не >) В частном случае системы растекающихся зарядов трубки тока не замкнуты, а уходят одним концом на бесконечность 3 В Г. Левич, том I
34 ОБЩАЯ ТЕОРИЯ ЭЛГ.КТРОМАГНИТНОГО ПОЛЯ !Гл I зависит от времени. На практике электрический ток проще всего осуществить с помощью металлических проводников. Однако, поскольку в этой главе мы fie будем касаться движения зарядо» в материальных средах, под контуром с током будем понимать не металлический проводник, но некоторую воображаемую по- поверхность— трубку, охватывающую совокупность кривых—• траекторий заряженных частиц, движущихся в пустоте. Поместим вблизи контура с постоянным током пробный за- заряд Мы не будем интересоваться воздействием контура с то- током на неподвижный пробный заряд е. Новые факты обнару- обнаруживаются, если пробный заряд движется по отношению к кон гуру тока с некоторой скоростью v. Именно, оказывается, то движущийся пробный заряд позволяет обнаружить поле, пера фьшно связанное с зарядами, движущимися в контура с током, и отличное по своему характеру от электростатиче- электростатическою поля Это поле получило название магнитного поля. На- зиание это связано с тем, что совершенно такое же поле создают постоянные магниты. Магнитное поле, как и электростатическое, имеет векторный характер Оно характеризуется некоторым вектором Н(г), име- именуемым напряженностью магнитного поля или, кратко, магнит- магнитным полем. Опыт показывает, что на пробный заряд действует сила FM = ±[vH\. F,1) Эта сила получила название силы Лоренца '). Как видно из формулы F,1), сила Лоренца перпендикуляр- перпендикулярна к скорости пробного заряда v и вектору Н, образуя с ними правовинтовую систему. Числовой множитель пропорциональности определится на опыте, если потребовать, чтобы вектор Н имел ту же размер- размерность, что и вектор Е. В системе CGSE числовой коэффициент с равен 3 • 1010 см/сек и численно совпадает со значением мировой постоянной — скоростью света в пустоте. Как и для всякого векторного поля, введем основную харак- характеристику магнитного поля — интеграл ф//d/, называемый маг- магнитодвижущей силой2). ') Часто мы будем называть силой Лоренца полную силу, действующую на заряженную частицу в электрическом и магнитном полях и равную сумме F,1) и D,1) 2) По аналогии с электродвижущей силой в электростатике Подчеркнем, что магнито1виж\щая ста, как и электродвижущая, — скаляр и называется силой лишь но традиции.
§ 6] ПОЛЕ ЗАРЯДОВ, ДВИЖУЩИХСЯ С ПОСТОЯННОЙ СКОРОСТЬЮ 35 Исследование магнитных полей постоянных токов показало, что величина магнитодвижущей силы равна dl = ^, F,2) где /= Г JdS0 представляет полный ток, проходящий за 1 се- секунду через сечение So контура (трубки) с током. Формула F,2) показывает, что магнитодвижущая сила от- отлична от нуля только в таком контуре, который охватывает трубку с током. В простейшем случае прямолинейного контура с током (или прямолинейного участка контура) векторные ли- линии магнитного ноля образуют систему концентрических окруж- окружностей, охватывающих контур (рис. 1). Величина магнитодвижу- магнитодвижущей силы пропорциональна полно- полному току / в контуре. Формула F,2) м—-j -т\ выражает закон Эрстеда, устано- \\ ij ¦ - .г VJ вившего в 1820—26 гг. связь между электрическим током и магнитными явлениями. Как и в электростатике, опыт pliC [ приводит к интегральному соотно- соотношению между характеристикой зарядов (током /) и полем И. Для получения дифференциальной характеристики поля заменим в выражении для полного тока поверхность интегрирования So произвольной поверхностью S, которая стягивается контуром с током. Плотность тока / отлична от нуля только при интегри- интегрировании по сечению трубки с током So. Вне этого сечения плот- плотность тока равна нулю, так что можно написать I=\jdS0=j/dS. Тогда Пользуясь теоремой Стокса, находим [ rot HdS=— [jdS, Щ1 С J откуда, ввиду произвольности поверхности S, следует rottf=ii/ F,3) Мы видим, что магнитное поле имеет вихревой характер. Урав- Уравнение F,3) определяет вихри магнитного поля в каждой точке 3*
36 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл I пространства в зависимости от значения плотности тока / в этой точке пространства. Уравнение F,3) согласуется со стационарным уравнением непрерывности E,4) и является поэтому внутренне непротиво- непротиворечивым. Действительно, вычислив дивергенцию от обеих ча- частей F,3), приходим к равенству div rot# = ^divy=0. F,4) Формула F,3) показывает, что движение электрических за- зарядов неразрывно связано с магнитным полем или, как не сов- совсем правильно говорят, движение зарядов порождает магнитное поле. Для однозначного определения магнитного поля необходимо знать вторую его дифференциальную характеристику —div Я. Для ее нахождения рассмотрим поток вектора Я через произ- произвольную замкнутую поверхность qp HdS. Экспериментальное изучение распределения магнитных полей постоянных токов показывает, что магнитные поля всегда имеют чисто солено- идальный характер и §HdS = 0. F,5) Следовательно, §HdS= J div#dl/ = 0 или ввиду произвольности объема интегрирования divtf=0. F,6) Таким образом, источники и стоки у магнитного поля отсут- отсутствуют. Линии магнитного поля всегда замкнуты или уходят на бесконечность'). Уравнения F,3) и F,6) полностью определяют магнитное поле постоянных токов. Магнитное поле постоянных токов, как и электростатическое поле, обладает аддитивными свействами. Это следует, в частности, из линейного характера уравнений поля F,3) и F,6). Магнитное и электростатическое поля яв- являются независимыми друг от друга. Любое электростатическое поле (при данном распределении движущихся зарядов) не вли- влияет на магнитное поле этих зарядов. В заключение отметим еще одну весьма важную особенность магнитного поля Я. В отличие от электростатического поля Е, ') Строго говоря, при сложных конфигурациях токов возможно еще су- существование линий поля не замкнутых, но плотно заполняющих поверхность. См. И. Е. 1 а м м, Основы теории электричества, «Наука», 1966.
4 71 ЭЛЕКТРОМАГНИТ-НОР ПОЛГ ДВИЖУЩИХСЯ ЗАРЯДОВ 37 которое характеризуется полярным вектором, вектор напряжен- напряженности магнитного поля И является аксиальным или псевдовек- псевдовектором. Это видно из формулы F,1) Для силы Лоренца Дейст- Действительно, из определения напряженности по формуле F,1) видно, что поведение вектора Я при отражении в начале коор- координат г—* (—г) определяется поведением полярных векторов F и v и свойствами их векторного произведения. При замене г—* (—г) направления векторов F и v изменяются на обратные; знак векторного произведения также изменяется на обратные. Следовательно, при замене г—» (—г) вектор Н должен оста- оставаться неизменным. Это свойство и является признаком ак- аксиального вектора. § 7. Электромагнитное поле движущихся зарядов. Общий случай Новые результаты получаются при рассмотрении нестацио- нестационарного дкижения зарядов или, что то же самое, нестационар- нестационарных tokor в некоторых контурах. Подчеркнем, прежде всего, что уравнение F,3) не можег оставаться справедливым для нестационарных токов (см. F 4)): при нестационарных процессах закон сохранения заряда выра- выражается формулой E,3). Таким образом, соотношение F,3) при нестационарных процессах противоречит закону сохранения заряда. Важнейшим обстоятельством, принципиально отличающим нестационарные магнитное и электрическое поля от стационар- стационарных, является существование взаимосвязи между ними. Фарадей обнаружил, что изменение во времени магнитного поля влечет за собой возникновение электрического поля (явле- (явление электромагнитной индукции). Максвелл теоретически пред- предсказал, что изменение во времени электрического поля приводит к появлению магнитного поля. Это предсказание теории впо- впоследствии нашло свое подтверждение в опытах Герца. Опытами Фарадея было установлено, что изменение во вре- времени потока вектора магнитного поля через произвольную по- поверхность S сопровождается появлением электродвижущей силы в контуре, стягивающем эту поверхность, т. е. G,1) Коэффициент пропорциональности с оказался численно равным 3 1010 см/сек, т. е. скорости света в пустоте. На рис. 2 схе- схематически представлена связь между изменением магнитного Поля ~дГ и электРодвижущей силой. Если линии поля вектора
38 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл. Г Рис. 2. дН , -jrr изображаются прямыми линиями, идущими слева направо, то линии электрического поля представляют концентрические окружности, охватывающие соответствующие прямые. Направ- Направления векторов электрического поля Е и дН п -qt показаны на рис. 2 стрелками. Формула G,1) представляет обобщенный ян закон индукции Фарадея A831 г.). Обобще- dl ние заключается в следующем: опытные данные Фарадея относились к контуру из про- проволочного (металлического) проводника. Воз- Возникновению в проводнике индуцированного электрического поля отвечает появление тока в контуре, который и измерялся непосред- непосредственно. В формуле G,1) интегрирование ве- ведется но совершенно произвольному контуру, никак не связан- связанному с наличием проводников. Это означает, что первичным фактором является появления поля в контуре. Электрический ток — некоторое вторичное явление, связанное с конкретной природой контура — наличием в нем металлических свойств. Обобщенный закон индукции Фарадея в фор- форме G,1) устанавливает взаимосвязь между магнитным и электрическим полями. Знак в формуле G,1) отвечает известному правилу Ленца. Максвеллом была высказана гипотеза, ^f впоследствии подтвердившаяся на опыте, что наряду с законом G,1) имеет место анало- аналогичное соотношение между изменением элек- электрического поля во времени и магнитным полем. Именно, при изменении потока электрического поля во вре- времени ~г?г EdS, в контуре, охватывающем поверхность S, воз- возникает магнитодвижущая сила, равная дй Рис. 3. T.dS, G,2) где коэффициент с имеет то же значение, что и в формуле G,1). Рис. 3 иллюстрирует связь между изменением электрического дЕ поля, характеризуемым вектором -щ-, и линиями магнитного поля. Если вектор -^- в каждой точке поля представлен семей- семейством прямых, то линии магнитного поля представляют кон- концентрические окружности, охватывающие эти прямые.
§ 7) ЭЛЕКТРОМАГНИТНОЙ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ 39 Мы отложим обсуждение соображений, которые приводят к установлению связи между изменением электрического поля и циркуляцией магнитного поля, до § 9. Что же касается связи закона G,2) с опытными данными, то, как мы увидим ниже, оказывается, что с G,2) связано существование электромагнит- электромагнитных волн. Если кривая L, по которой вычисляется циркуляция магнит- магнитного поля, охватывает контур с электрическим током, то полная магнитодвижущая сила выражается формулой (см. F,2) и G,2)) . G,3) От формул G,1) и G,3), содержащих интегральные характе- характеристики полей Е и Н, можно перейти к дифференциальным ха- характеристикам. Именно, с помощью теоремы Стокса можно переписать G,1) в виде ±§j±S%-dS. G,4) При этом мы переменили порядок выполнения независимых опера- операций дифференцирования по времени и интегрирования по фикси- фиксированной в пространстве поверхности (см., однако, ч. IV, § 23). Ввиду произвольности поверхности интегрирования в фор- формуле G,4), из равенства интегралов вытекает равенство под- подынтегральных выражений: Мы видим, что переменное во времени электрическое поле, » отличие от электростатического, имеет, вообще говоря, вихревой характер. Значение вихря вектора Е в данной точке опреде- определяется быстротой изменения во времени магнитного поля в той же точке. Преобразуя совершенно аналогично интегральное соотноше- соотношение G,3), имеем ^ l^. GN) Последнее соотношение показывает, что вихри магнитного поля в каждой точке пространства определяются плотностью тока зарядов / и изменением электрического поля во времени. Бросается в глаза симметрия уравнений для вихрей электри- электрического и магнитного полей, т. е. уравнений G,5) и G,6). Изме- Изменение магнитного ноля сопровождается появлением вихревого электрического- поля. Наоборот, изменение электрического поля связано с появлением вихревого магнитного поля. Однако,
40 ОПЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл ! наряду со сходством этих уравнений, между ними имеется и чрезвычайно важное различие; во-первых, уравнения G,5) и G,6) отличаются знаками перед производными по времени; во-вторых, в общем случае вихри магнитного поля зависят не только от быстроты изменения электрического поля, но и от плотности тока /. Между тем, не существует «магнитных заря- зарядов», которые могут двигаться в пространстве и создавать «ток магнитных зарядов». Уравнения G,3) и G,5) определяют вихри электрического и магнитного полей. Для однозначного определения полей должны быть заданы еще дивергенции электрического и магнитного полей. Для определения последних найдем дивергенции от обеих частей уравнений G,5) и G,6). Начнем с последнего уравнения. Имеем div rot И = 0 = -^ div/ + -~ div ~ - — div/ + -^[~ div Е). С помощью закона сохранения заряда E.3) последнее уравне- уравнение можно легко преобразовать к виду откуда divE где функция /(г)—любая функция, зависящая только от коор- координат, но не от времени. Допустим, что в произвольный момент времени, который можно считать начальным, заряды покоились Тогда в началь- начальный момент должно было удовлетворяться уравнение электро- электростатического поля D,10), и функция {(г) была равна нулю. Поскольку f(r) ие зависит от времени, это означает, что f(r) всегда равна нулю. Дивергенция электрического поля как в не- нестационарных, так и в стационарных полях определяется фор- формулой div E = 4лр. G,7) Аналогично, беря дивергенцию от G,5), находим divrot?=0=div-~ с at или div//-/, (г). Снова предполагая, что в начальный момент времени магнитное поле имело стационарный характер, и повторяя только что при- приведенное рассуждение, приходим к выводу: 0. G,8)
§ 8] СИСТЕМА УРАВНЕНИЙ МАКСВЕЛЛА — ЛОРЕНЦА 41 Магнитное поле как в стационарных, так и в нестационарных полях имеет число вихревой (соленоидальный) характер. Маг- китных зарядов, на которых начинаются и заканчиваются линии магнитного поля, не существует ни в стационарных, ни в пере- переменных полях. § 8. Система уравнений Максвелла — Лоренца Полученная нами система уравнений G,5) — G,8) электро- электромагнитного поля в вакууме носит название системы уравнений Максвелла—Лоренца. Она была установлена Максвеллом в 1873 г. для более общего случая электромагнитных полей в ма- материальных средах и Лоренцем в 1895 г. для системы зарядов, движущихся в вакууме. Хочется еще раз подчеркнуть, что урав- уравнения Максвелла—Лоренца не вытекают из каких-либо более общих теоретических положений, но являются обобщенной за- записью наблюдавшихся на опыте фактов. Выпишем еще раз уравнения Максвелла, объединив нч в две пары: Дифференциальная форма Интегральная форма I пара div//=0, §HdS = O. (8,2) II пара (8,4) Считая известными распределения токов и зарядов, можно с помощью уравнений Максвелла найти шесть неизвестных, компонент векторов поля Е и Н. Как мы видели в предыдущем параграфе, уравнения для дивергенции Е и Н следуют из урав- уравнений для ротора и начальных условий. Поэтому в системе из восьми скалярных дифференциальных уравнений Максвелла имеется только шесть независимых уравнений. Уравнение (8,1), представляющее обобщение закона индук- индукции Фарадея, устанавливает, что изменение во времени маг- магнитного поля порождает вихревое электрическое поле Урав- Уравнение (8,2) показывает, что магнитное поле имеет соленоидаль- соленоидальный характер и линии магнитного поля либо замкнуты, либо уходят на бесконечность Из уравнения (8,3) следует, что вихревое магнитное поле создается при движении зарядов и при изменении во времени электрического поля. По аналогии с электрическим током ве- величину — -j— называют током смещения, а сумму
42 ССЩАЯ ТЕОРИЯ ЭЛГ-КТРОМЛГНИТНОГО ПОЛЯ \Гя 1 обоих членов—полным током. Тогда можно сказать, что вих- вихревое магнитное поле порождается полным током, в который оба слагаемых входят на равных правах. Наконец, уравнение (8,4) показывает, что источниками электрического поля служат электрические заряды. При заданном распределении плотности зарядов и токов уравнения Максвелла полностью определяют электрическое E(r,t) и магнитное H(r,t) поля. Уравнения Максвелла представляют систему линейных диф- дифференциальных уравнений в частных производных. В силу ли- линейности уравнений Максвелла, имеет место принцип суперпо- суперпозиции электромагнитных полей. Если Ег и Я; являются реше- решениями уравнений Максвелла, то ?'=S^t и Н=^Н{ также решения этих уравнений. Задача об интегрировании уравнений в частных производ- производных становится определенной только в том случае, когда за- задана система граничных и начальных условий. Граничные и на- начальные дсловия будут разобраны нами ниже, в § 24 этой части. До сих пор мы ничего не говорили о распределении заря- зарядов и характере их движения в пространстве. Между тем, рас- распределение зарядов и скоростей их движения не может быть, задано совершенно произвольно. Плотность заряда и плотность тока (скорость движения зарядов) связаны между собой зако- заколом сохранения заряда: |f-f-divy = O. (8,5) На движущиеся в электромагнитном поле заряды действует сила Лоренца. Уравнения движения заряда можно написать в виде ijfc_e(E + i.[«,fl]). (8,6) где р— импульс частицы. Поле, которое нужно подставлять в (8,6), представляет пол- полное ноле, как внешнее, создаваемое другими зарядами, так и поле, создаваемое самим зарядом. Последнее также должно оказывать влияние на движение частицы. Однако в большин- большинстве случаев собственное поле можно считать слабым и ис учитывать его (см. § 29). В этом приближении векторы Е и Н в (8,6) означают внешнее поле, действующее на частицу. Закон движения (8,6) можно записать и для непрерывно распределен- распределенных зарядов, если под р0 понимать импульс частиц в единице объема, а силу Лоренца заменить плотностью силы (т. е. си- силой, отнесенной к единице объема). Тогда )V, (8,7)
3 9] ТОК СМЕЩЕНИЯ 43 ИЛИ (8,8) Мы упоминали уже, что уравнения поля были первоначально сформулированы Максвеллом для электромагнитных процессов в веществе. Лоренц установил их применимость к системе, со- состоящей из поля и зарядов, и дополнил уравнением движения последних. Поэтому полную систему уравнений (8,1) — (8,8) часто на- называют уравнениями Максвелла — Лоренца. Уравнения Макс- Максвелла— Лоренца заключают в себе полное описание поведения системы, состоящей из нолей и зарядов. Если задано значение функций р и v и начальное значение полей ? и Я, то интегри- интегрирование этих уравнений позволяет найти распределение элек- электрического и магнитного полей в пространстве в любой после- последующий момент времени. Таким образом, в электродинамике. как и в механике, задание состояния системы в начальный мо- момент времени и закона изменения состояния позволяет одно- однозначно определить ее состояние в последующие моменты времени. Заметим, что в рамках этой главы сила Лоренца, действую- действующая на движущийся заряд, должна быть принята как эмпири- эмпирическая формула. В ч. II будет показано, что выражение для силы Лоренца вытекает как следствие из некоторых, более общих законов физики. Область применимости уравнений Максвелла — Лоренца чрезвычайно широка. Они определяют характер электромагнит- электромагнитных процессов в космических масштабах, составляют основу современной электро- и радиотехники, позволяют исследовать электромагнитные явления, происходящие с отдельными заря- зарядами. Но, тем не менее, как мы увидим в дальнейшем, уравне- уравнения Максвелла — Лоренца и основанная на них классическая теория поля не являются выражением универсальных законов природы и имеют свою ограниченную область применимости. Целый ряд электромагнитных процессов, и прежде всего внутриатомных, лежит по ту сторону границ области примени- Мости уравнений Максвелла — Лоренца. Вопрос об установле- установлении этих границ мы будем неоднократно обсуждать в даль- дальнейшем. § 9. Ток смещения В отличие от электрического тока /, имеющего весьма про- стой и наглядный смысл, ток смещения -г—gr~ не связан с дви- движением каких-либо зарядов.
44 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ ГГл Г Ток смещения был введен Максвеллом и интерпретирован им в терминах общепринятой в то время, но оставленной сейчас как ошибочной, теории эфира. Нетрудно понять, почему в середине XIX века для получе- получения формулы G,6) нельзя было прибегнуть к данным экспери- эксперимента. Скорости движения электрических зарядов обычно очень велики. Поэтому ток р» всегда велик по сравнению с током смещения -г~-лт-> если только электрическое поле не изме- изменяется во времени очень быстро. Оценки показывают, что оба слагаемых в полном токе могут иметь одинаковый порядок величины при периодическом изменении вектора Е во времени с частотой порядка 106—107 сек~[ и выше. Это — область радиочастот, не- неизвестных физике середины XIX ве- ка Лишь d 1888 г. Г. Герц, впервые экспериментально установивший су- существование электромагнитных волн, доказал тем самым реаль- реальность тока смещения. Рнс 4- То обстоятельство, что ток / не всегда может быть ответственным за появление магнитного поля, очень ясно иллюстрируется сле- следующим рассуждением. Пусть в пространстве движется элек- тричекий заряд е. Будем искать напряженность магнитного поля, создаваемого этим зарядом в некотором контуре L (рис. 4). Согласно теореме Стокса, Н dl = | rot H dS = ~ J J dS, где поверхностью интегрирования является любая поверхность, опирающаяся на контур L. Рассмотрим в некоторый момент времени две поверхности S'i и $2, опирающиеся на контур L. Совершенно ясно, что с точки зрения проходящего через них электрического тока они неэкви- неэквивалентны. Через поверхность Si никакого тока в данный момент не проходит, поскольку заряд е ее еще не достиг. Наоборот, по- поверхность S2 пересекается зарядом, и ток через нее отличен от нуля. Мы приходим, таким образом, к явному противоречию: , = 0 и J хотя, согласно теореме Стокса, эти интегралы должны быть равны между собой. В действительности, движущийся заряд создает на поверхности Si некоторое электрическое поле, изме-
$ «1 ТОК СМЕЩПНИЯ 45 няющеееяво времени. Расчет, который будет выполнен в § 20 этой части, показывает, что производная от этого электрическою поля по времени, проинтегрированная по поверхности Si, даст точно такое же значение для ф Л/rf/ в контуре L, как и интеграл 4я \ JdS по поверхности S2 .Таким образом, с неизбежностью не- необходимо принять эквивалентность (в смысле создания цирку- циркуляции магнитного поля в некотором контуре) тока зарядов я изменения электрического поля для любого движущегося за- заряда. Введение тока смещения может быть сделано на основе сле- следующих формальных рассуждений: необходимо найти такое обобщение закона F,3), которое не противоречило бы закону сохранения заряда E,3) при нестационарном изменении поля. Написав F,3) в виде rot Л = -?•(/+С), (9,1) где С—неизвестный вектор, и взяв дивергенцию от обеих ча- частей (9,1), находим div rot // = 0 = -у- (div у + div С), или div(/+C) = 0. (9,2) Неизвестный вектор С дополняет плотность тока / так, чтобы суммарная величина (/ + С) обладала свойствами соленоидаль- ного вектора, имеющего замкнутые линии тока. Дивергенция вектора С может быть найдена из уравнений (9,2), E,3) и D,10). Имеем откуда следует, что сам вектор С равен где b(r,t)—любой вектор, удовлетворяющий условию divb(r, /) =0. Нет каких-либо оснований заранее полагать вектор Ь равным нулю. Гениальная идея Максвелла заключалась в том, что ме- жДу электрическим и магнитным полями существует глубокая
46 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл I симметрия и взаимосвязь. Эта симметрия была подчеркнута нами при рассмотрении свойств уравнений Максвелла. Для по- получения симметрии между полями необходимо положить Ь =s 0.. Тогда ^ i-g. (9,3) и, и частности, в той области пространства, где нет движущихся зарядов, / = 0 и уравнения для rot H имеет вид rot// = 57". с dt Ротор вектора Н определяется быстротой изменения вектора Е, тогда как, согласно закону индукции Фарадея G,5), ротор век- вектора Е определяется быстротой изменения вектора Н. Только в тех областях пространства, в которых плотность тока отлична от нуля, симметрия между электрическим и магнитным полем нарушается. Поскольку истинных магнитных зарядов не суще- существует и магнитное поле всегда имеет чисто соленоидальный характер, в уравнении для электромагнитной индукции G,5) ист члена, аналогичного —Ч/ в уравнении (9,3). Наоборот, если бы вектор Ь был отличен от нуля, никакой симметрии меж- между электрическим и магнитным полями не существовало бы. В заключение подчеркнем, что поскольку ток смещения 1 дЕ в пустоте -.—gr- не связан с перемещением или изменением состояния каких-либо частиц, ему нельзя сопоставить какую- либо механическую модель, позволяющую наглядно представить себе эту физическую величину. С понятиями «плотность заря- зарядов» или «плотность тока» мы для наглядности сопоставляем покоящиеся или движущиеся частицы — шарики или дробинки. Векторы ноля Е и Н изображались силовыми линиями или ли- линиями поля, которые раньше было принято наглядно представ- представлять в виде некоторых натяжений в упругой среде — электро- электромагнитном эфире. Такие механические модели были, несомненно, полезны, поскольку они помогали ясному пониманию смысла соответствующих величин. Ток смещения в пустоте — первая из встретившихся нам величин, которую невозможно описать при помощи механической аналогии, придав ей, тем самым, наглядный характер. В дальнейшем нам придется иметь дело с очень большим числом важных физических понятий и величин, не имеющих механических аналогов, которым, как и току сме- смешения в пустоте, нельзя сопоставить какую-либо наглядную модель.
$ IOJ ПОТЕНЦИАЛЫ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ 47 § 10. Потенциалы электромагнитного поля В § 2 мы видели, что для нахождения стационарного вектор- векторного поля по заданным в каждой точке пространства значениям дивергенции и ротора удобно ввести вспомогательные величины, определенные соотношениями B,7) и B,13). Оказывается, что точно таким же образом можно поступить и в более общом случае нестационарной системы векторных полей — электриче- электрического и магнитного. Вектор магнитного поля всегда является соленоидальным и его дивергенция равна нулю. Поэтому, как и в § 2, положим Я = rot Л, A0,1) где вспомогательный вектор А носит название вектора-потен- вектора-потенциала. Вектор-потенциал A(r,t) является функцией точки и времени. При этом уравнение (8,2) будет автоматически удов- удовлетворено, поскольку при любом A(r,t) имеет место div rot Л = 0. Подстановка соотношения A0,1) в (8,1) дает , р 1 дА или Последнее уравнение показывает, что вектор (?4 ^г) яв- является потенциальным вектором, т. е. может быть представлен в виде дА где ф — функция координат и времени, которую мы будем име- именовать скалярным потенциалом. В отличие от случая электростатики, вектор электрического поля, имеющего вихревой характер, уже не может быть пред- представлен в виде градиента какого-либо потенциала. Он выра- выражается через совокупность скалярного и векторного потенциа- потенциалов по формуле ?=-gradcp- -i-M, A0,2) причем второе слагаемое, связывающее электрическое поле с магнитными величинами, выражает закон электромагнитной индукции.
48 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл t Для определения А и ф у нас остаются еще уравнения (8,3) и (8,4). Первое из них дает ... 1 д2А I , д<р . 4я , или, по формуле A,50), Перепишем последнее уравнение в виде lf). A0,3) Уравнение (8,4) в свою очередь дает Дф= — 4яр — —-^-div A. A0,4) Потенциалы А и <р являются вспомогательными величинами, введенными для упрощения уравнений поля. Мы наложим на них такие условия, которые, не изменяя соотношений A0,1) и A0,2), позволят сделать уравнения A0,3) и A0,4) независи- независимыми. Соотношение A0,1) определяет ротор вектора-потен- вектора-потенциала А. Однако сам вектор-потенциал А еще не определен, поскольку его дивергенция не задана. Если задать диверген- дивергенцию А соотношением I- л , 1 5ф л /1 п r-v diVi4H иг = 0, A0,5) именуемым соотношением Лоренца, то A0,3) превратится в ЬА-\~=-— j. A0,6) Уравнение A0,4) получит совершенно аналогичную форму: A0,7) Найденные уравнения для электромагнитных потенциалов совершенно эквивалентны исходным уравнениям Максвелла. Если заданы распределения зарядов p(r,t) и токов j(r,l), удов- удовлетворяющие уравнению непрерывности, то интегрирование уравнений A0,6) и A0,7) позволяет найти векторный и ска- скалярный потенциалы. Векторы поля найдутся при этом путем дифференцирования по формулам A0,1) и A0,2). Уравнение типа
§ 11| КАЛИБРОВОЧНАЯ ИНВАРИАНТНОСТЬ ПОТЕНЦИАЛОВ 49 где ^(г, I) —заданная функция координат и времени, носит на- название уравнения Даламбера. Часто его записывают с помощью так называемого дифференциального оператора Даламбера: с2 dt2 дх2 ду2 dz2 с2 dt2 в более компактном виде: В частном случае однородного уравнения при ф(г, f) —0, из уравнения Даламберэ получается так называемое полнооое уравнение' В другом частном случае не зависящих от времени функций Ф (г) и \|з (г) уравнение Даламбера превращается в уже извест- известное (ср. B,8)) из электростатики уравнение Пуассона: С математической стороны уравнения второго порядка—¦ уравнение Пуассона, волновое уравнение и уравнение Далам- Даламбера— проще, чем исходные уравнения Максвелла в частных производных первого порядка. Как мы увидим в дальнейшем, можно получить общее решение уравнения Даламбера и вол- волнового уравнения в интегральной форме, как это сделано для уравнения Пуассона (ср. B,9)). Именно по этой причине при исследовании свойств электромагнитных полей, а также и при решении ряда конкретных задач использование потенциалов весьма целесообразно, и метод потенциалов представляет ос- основной расчетный аппарат теории поля. § 11. Калибровочная инвариантность потенциалов Мы подчеркивали уже, что потенциалы А и ф представляют вспомогательные величины, не имеющие непосредственного фи- физического смысла. Реальный смысл имеют напряженности поля Е и Н в каждой точке поля и в каждый момент времени. Эти величины могут быть определены по тем силам, которые дей- действуют на пробный заряд, движущийся в поле. Значения А и ф не могут быть измерены и потому сами по себе потенциалы не должны входить в какие-либо оконча- окончательные выражения теории поля. Действительно, определение потенциалов А и ф по формулам A0,1) и A0,2) является не- неоднозначным и допускает известный произвол. Сейчас мы должны обсудить вопрос о степени произвола, существующей в определении потенциалов в общем случае. 4 В Г Л>.-иич, том I
50 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл. I Из определения вектора-потенциала A0,1) следует, что если со- совершить преобразование Л-»Л' +grader,/), AU) где ty(r,t)—произвольная фукнция кооординат и времени, то. мы придем к тому же самому значению напряженности поля Н: H=rotA=rot(A' + gradi^(r, /)) =rot Л' + rot gradt|s = rot Л'. Рассмотрим теперь определение скалярного потенциала ср, за- заданное формулой A0,2). Преобразование A1,1) приводит к значению Производя замену мы приходим к прежнему выражению для напряженности элек- электрического поля. Таким образом, вектор-потенциал опеделен с точностью до вектора, представляющего градиент произвольной функции ко- координат и времени гр(г, t), скалярный потенциал — с точностью1 до производной по времени от той же функции. В частности, в случае электрического поля, не зависящего от времени, к по- потенциалу <р можно прибавить любую постоянную и прийти к прежнему значению напряженности поля? = —grad(cp + const) = = --grad ф. В общем случае можно сказать, что два поля, описываемых системой потенциалов А' и ф' и, соответственно, Л и ср, яв- являются физически тождественными, если Л и А', ф и <р' могут быть связаны между собой соотношениями A1,1) и A1,2). То же можно выразить следующими словами: уравнения электро- электромагнитного поля неизменны (инвариантны) по отношению к преобразованиям A1,1) и A1,2). Различные способы выбора потенциалов Л и ф, оставляю- оставляющие неизменными напряженности ноля Е и И, называются раз- разными калибровками потенциалов. Инвариантность полей Е и Н и всех остальных соотношений теории поля по отношению к разным калибровкам именуется калибровочной (или градиент- градиентной) инвариантностью. Свойство калибровочной инвариант- инвариантности позволяет, распоряжаясь до известной степени произ- произвольно выбором электромагнитных потенциалов, подбирать их так, чтобы соотношения теории поля приобретали максимально простой вид. Одним из примеров такого подбора может служить условие Лоренца, введенное в предыдущем параграфе.
$ И] КАЛИБРОВОЧНАЯ ИНВАРИАНТНОСТЬ ПОТЕНЦИАЛОВ 51 Мы можем теперь показать, что условие Лоренца отвечает определенной калибровке потенциалов (калибровка Лоренца). Действительно, пусть для некоторых Ао и <p0 условие Лоренца не выполняется, так что Произведем калибровочное преобразование A1,1) и A1,2): Тогда имеем diVi4 + |-^=x(r,0-A^ + ^r^. A1,3) Если потребовать, чтобы функция \|э удовлетворяла уравнению Даламбера ^--jr^ = %(r,t), A1,4) то для преобразованных потенциалов А и ср условие Лоренца будет выполняться. Мы упоминали уже, что уравнение Далам- Даламбера всегда имеет решение. Поэтому при заданном значении х всегда можно подобрать функцию ф, удовлетворяющую A1,4). Следует подчеркнуть, что произвольная функция -ф (г, t) не ¦определяется еще полностью уравнением A1,4). К ней можею прибавить функцию tyo{r,t), являющуюся решением однород- однородного уравнения При этом, совершая преобразования , 1 мы приходим снова к тем же значениям напряженностей Е и Н = rot A', -, \ дА' а потенциалы А' и q/ будут удовлетворять условию Лоренца?
52 ОЫНАЯ ТГ.ОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл. 1 Поэтому, оставаясь в рамках калибровки Лоренца, можно по- подобрать функцию ч|) так, чтобы выполнялось еще одно условие, налагаемое на одну из четырех величин: ср, As, Ay, Az. Наряду с калибровкой Лоренца, иногда (особенно в кванто- квантовой теории поля) пользуются другой, так называемой кулонов- ской калибровкой, при которой При эгой калибровке уравнение для потенциалоз {уравнения A0,3) и A0,4)) приобретают вид Л Л ' д%А ' grnd dtf - Ы 1 ЛА с2 dt с graa dt ~ с •>' Аф = _ 4яр. При кулоновской калибровке скалярный потенциал <р опреде- определяется распределением зарядов так, как будто бы они покои- покоились. Само собой разумеется, напряженности поля ? и Я, най- найденные из решений уравнений для потенциалов с кулоновской калибровкой и калибровкой Лоренца, совпадают. В рамках этой книги мы будем пользоваться, как правило, калибровкой Ло- Лоренца. § 12. Закон сохранения энергии в электромагнитном поле Первым важным общим следствием, которое вытекает из системы уравнений Максвелла, является существование энер- энергии электромагнитного поля. Для нахождения энергии электро- электромагнитного поля рассмотрим замкнутую систему, состоящую из поля и частиц. Найдем работу W, произведенную силами поля над частицами, находящимися в объеме V. Относя эту работу к единице времени и считая заряды непрерывно распределенны- распределенными в пространстве, пользуясь (8,8), мы можем написать dt = J FvdV = | q[e + ^[vHijvdV *= = j JEdV + -j $ pWdV =* jjEdV. A2,1) Работа силы магнитного поля равна нулю, поскольку эта сила перпендикулярна к скорости частицы. Преобразуем соотношение A2,1), используя уравнения Мак- Максвелла. Выражая плотность тока через векторы поля с помощью (8,3), имеем ^JE^dV. A2,2)
$ 121 ЗАКОН СОХРАНЕНИЯ ЭНЕРГИИ В ЭЛГКТРОМАГНИТНОМ ПОЛЕ 5* Как мы неоднократно подчеркивали, должна существовать сим- симметрия между электрическим и магнитным полями. Между тем, уравнение A2,2) асимметрично. Мы можем придать ему дол- должный вид, прибавив к правой его части выражение равное, в силу уравнения Максвелла (8,1), нулю. Это дает (Erot//-ffrot?)dV - J-t{S±f.)dV. A2,3) Первый интеграл в правой части уравнения A2,3) может быть преобразован к поверхностному. Именно, по формуле A,44) имеем — (ErotH-HrotE) = div [EH]. Поэтому j (ErotH-HrotE)dV=- f div [EH]dV = -§[EH]dS, и вместо A2,3) можно написать \V. A2,4) Рассмотрим случай, когда объем интегрирования V неогра- неограниченно возрастает и охватывает все пространство. Если век- векторы поля? и Н стремятся к нулю при г—>• оо быстрее, чем по закону —, то поверхностный интеграл обращается в нуль. Дей- Действительно, подынтегральное выражение убывает быстрее, чем -т, а величина поверхности растет, как г2. Тогда A2,4) пре- превращается в равенство где обозначено Цо = 8lt • A2,6) Поскольку в левой части A2,5) стоит работа, произведенная за 1 сек, правая часть представляет убыль энергии в единицу вре- времени. В замкнутой системе, состоящей из поля и частиц, работа, произведенная электромагнитным полем над частицами, раина убыли энергии самого поля. При этом электромагнитному полю
34 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл. I необходимо приписать энергию, плотность которой «о выра- Г р2 -4- /-/2 жается формулой A2,6). Выражение и— —^—dV не мо- может быть сведено к величинам, определяющимся только взаим- взаимным расположением и движением зарядоз. Поэтому его нельзя считать потенциальной энергией системы взаимодействующих частиц. Плотность энергии поля, в частности, отлична от нуля в той области пространства, которая свободна от частиц. Наличие у электромагнитного поля энергии наглядно пока- показывает, что оно никоим образом не может рассматриваться как математическая фикция, как нечто, делающее удобным расчет взаимодействия между заряженными частицами. Напротив, поле обладает той же степенью реальности, что и частицы. В реальности электромагнитного поля мы будем неоднократно убеждаться и на основании других фактов. При этом, однако, в рамках классической электродинамики остается не ясным взаимоотношение между полем и зарядами. Только квантовая электродинамика, которая будет кратко изложена в части V этой книги, позволила более глубоко проникнуть в сущность взаимосвязи между полем и частицами. Рассмотрим теперь область поля, имеющую конечный объем V и ограниченную поверхностью S. Тогда уравнение A2,4), вы- выражающее закон сохранения энергии, показывает, что убыль д f ?2-i-Я2 ... энергии поля в единицу времени -^-1 —^—dV в некотором ¦объеме V равна работе сил поля —тг в единицу времени над зарядами, заключенными в том же объеме, и потоку ¦j-x[EH]dS, вытекающему через замкнутую поверхность S, окружающую объем V. Очевидно, что этот поток должен быть интерпретирован как поток энергии, вытекающей наружу из объема V. Поток энергии является потоком энергии электро- электромагнитного поля, поскольку он отличен от нуля и тогда, когда никакие частицы не пересекают поверхность и не уносят с собой энергии. Поток энергии электромагнитного ноля характеризует- характеризуется вектором о, именуемым вектором Пойнтинга и равным or = ^ [?//]. A2,7) Вектор Пойнтинга а представляет поток энергии поля, вы- вытекающий через 1 см2 в направлении, перпендикулярном к век- векторам поля ? и Я, и образует с ними правовинтовую систему координат. В дальнейшем мы приведем ряд примеров вычисления век- вектора Пойнтинга. Здесь мы ограничимся лишь следующим заме-
§ 13] ЗАКОН СОХРАНЕНИЯ ИМПУЛЬСА В ЭЛЕКТРОМАГНИТНОМ ПОЛИ 55 чанием. Формально вектор а определен лишь с точностью до ротора некоторого вектора а. Положив c' = or+rota, имеем о' dS = <? о dS + ? rot a dS = I a dS, поскольку интеграл от ротора по замкнутой поверхности всегда равен нулю. В действительности, однако, как будет показано в ч. II, a следует интерпретировать как плотность потока энергии поля, положив rota=0. Иногда в качестве примера, опровергающего такую интерпретацию а, приводят случай скрещенных стати* ческих электрического и магнитного полей. Формально в этом случае афО, хотя никакого потока энергии нет. При этом, однако, забывают, что вектор а должен входить в закон со- сохранения энергии, выражаемый формулой A2,4), а последняя теряет смысл в статических полях, если считать а^-0. При выводе формулы A2,5) мы считали, что интеграл при интегрировании по замкнутой поверхности бесконечно боль- большого радиуса обращается в нуль. Мы увидим, что в проблемах теории излучения встречаются поля, убывающие с расстоянием по закону ]?j ~ \Н\ ~ —при г—> оо. При этом интеграл (fcadS, взятый по бесконечно удаленной поверхности, будет иметь ко- конечное значение. Физически это означает, что система, теряющая часть своей энергии, излучает. Записав закон сохранения энергии в дифференциальной форме обращаем внимание на аналогию его с уравнением непрерыв- непрерывности (8,5), выражающим закон сохранения заряда. В левой части формулы A2,8) стоит изменение энергии поля единицы объема (изменение сохраняющейся зеличины), в правой ча- части—работа, поризведенная над зарядами, находящимися в этом объеме, а также дивергенция потока сохраняющейся ве- величины (плотности энергии). § 13. Закон сохранения импульса в электромагнитном поле Наряду с плотностью энергии электромагнитное поле обла- обладает и плотностью имплуьса. Рассмотрим изменение импульса частиц, находящихся в объеме V. Вычисления производятся так же, как и при выводе закона сохранения энергии.
56 ОБЩАЯ ТЕОРИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ [Гл. I В силу уравнения (8,8), имеем A3,1) где РЧаст — полный импульс частиц. Выражая р и / через на- напряженности поля согласно (8,4) и (8,3), находим J_p _ dt част — м I Ж^ VI I V *-* КЛ> V . I I -к, Ж Ж t Ь* Г I А I [_* 1_« t- * Я 11 j МГ I \1О|А/ Симметризуем последнее уравнение, прибавив к правой части его равное нулю выражение Тогда имеем ~dt inrr ~~ 4яс д + ± | {EdivЕ + HA\vH-[ErotЕ]-[И rot И]}dV. A3,4) Второй интеграл может быть преобразован в поверхностный. Это преобразование мы проведем ниже. Ясно, что поверхностный интеграл, содержащий векторы поля во второй степени, будет стремиться к нулю при неограниченном возрастании поверх- поверхности, если только векторы поля убывают быстрее, чем функ- функция —. Тогда, переходя к бесконечно большому объему и от- отбрасывая в A3,4) второй интеграл, мы приходим к выражению *¦¦« + -^\[EH]dV = const. A3,5) Формула A3,5) показывает, что суммарный импульс замк- замкнутой системы, состоящий из поля и частиц, сохраняется. Ве- Величина ?-JL[E##] A3,6) представляет плотность импульса (импульс единицы объема) электромагнитного поля. При взаимодействии поля и частиц наряду с законом сохранения суммарной энергии имеет место закон сохранения суммарного импульса. Передача импульса частицам сопровождается уменьшением импульса поля. Потеря
$ 13] ЗАКОН СОХРАНЕНИЯ ИМПУЛЬСА В ЭЛЕКТРОМАГНИТНОМ ПОЛЕ 57 импульса частицами (например, при излучении) приводит к уве- увеличению импульса поля. Покажем теперь, что второй интеграл в форме A3,4) можно свести к поверхностному интегралу. Поскольку интеграл J {? div Е + #/div И - \Е rot Е] - [Н rot H)} dV симметричен относительно векторов Е и Н, рассмотрим только интеграл /= J{?div?-[?rot?]}dV. A3.7) Воспользовавшись векторными равенствами A,53) и A,48), можем написать {Egrad)EdV = §(En)EdS- j EdivEdV, A3,8) ){Egrad)EdV = Jgrad-J-dV - J [?rot ?]dV. Вычитая A3,9) из A3,8), находим j {EdivE-[ErotE\}dV = - J grad-J- dV + J (En)EdS. Учитывая A,23), получаем Аналогичное выражение можно написать для магнитной части интересующего нас интеграла. Таким образом, окончательно J {?div E- [Еrot Е] + //div И- [Яrot //]) dV = -nlg-\dS. A3,10) Устремив к бесконечности радиус поверхности интегрирова- интегрирования и считая, что поля ? и Я убывают на бесконечности бы- быстрее, чем —, приходим к высказанному ранее утверждению о ¦равенстве нулю всего поверхностного интеграла. Мы не будем останавливаться на рассмотрении более слож- сложного случая, когда интегрирование в A3,4) ведется по конеч- конечному объему ')• ') См. Р. Б е к к е р, Электронная теория, ОНТИ, 1936: И. Е Т а м м. Основы теории электричества. «Наука», 1966 и, особенно, Я. И. Френке л ъг Электродинамика, ГТТИ, 1934, стр. 235, где дан.1 более полная интерпретация выражения A3,6).
58 ОБЩАЯ ТЕОРИЯ ЭЛГ.КТРОМАГНИТНОГО ПОЛЯ [Гл I Укажем лишь результат такого рассмотрения; изменение полного импульса поля в некотором объеме gdV равно изме- изменению импульса частиц, находящихся в этом объеме, и потоку импульса через поверхность, ограничивающую выделенный объем. Предсказание теории о существовании импульса поля впер- впервые было обнаружено в 1901 г. П. Н. Лебедевым, наблюдав- наблюдавшим экспериментально световое давление. Импульс электро- электромагнитного поля в обычных условиях мал, и его величина часто лежит за пределами погрешностей измерений. Однако в области атомных явлений импульс электромагнитного поля становится сравнимым с импульсом частиц и играет первостепенную роль во всех процессах взаимодействия излучения с веществом. Давле- Давление излучения играет весьма существенную роль в процессах, происходящих внутри звезд и в звездных атмосферах, и других явлениях астрономического масштаба. Интересно отметить, что между вектором плотности импуль- импульса g и вектором Пойнтинга существует соотношение В главе, посвященной теории относительности, мы увидим, что между энергией и импульсом существует весьма общее соотно- соотношение, из которого формула A3,9) получается как следствие. Наряду с вектором плотности импульса поля g можно ввести в рассмотрение плотности момента импульса: Момент импульса поля в объеме V равен Можно показать, что для момента импульса, так же как для энергии и импульса, имеет место закон сохранения. Момент им- импульса электромагнитного поля играет большую роль в процес- процессах атомного масштаба. В явлениях макроскопического мас- масштаба момент импульса был измерен сравнительно недавно'). ') И. Е. Т а м м, Основы теории электричества, «Наука», 1966.
ГЛАВА II ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ § 14. Электростатическое поле Сформулировав общие уравнения электромагнитного полз и выяснив основные вытекающие из них следствия, можно пе- перейти к обсуждению различных частных случаев электромаг- электромагнитных полей. При этом мы будем последовательно переходить от простейших к более сложным случаям. Самым простым примером электромагнитного поля является поле неподвижных зарядов. Выпишем уравнения Максвелла для этого случая. Дифференциальная форма Интегральная форма div?=4jtp, A4,1) (J) EdS = 4я]? е„ A4,Г> rot?=0, A4,2) §Edl=O, A4,20 divtf = 0, A4,3) &HdS = 0, A4,3'> rottf=0, A4,4) <?//сГ/=О. A4,4'> Система уравнений электромагнитного поля в этом случае распадается на систему независимых уравнений для электри- электрического и магнитного полей. Решение системы уравнений для магнитного поля, не зависящего от времени, имеет тривиальный вид: //=0. A4,5> Это означает, что неподвижные заряды не окружены магнит- магнитным полем. Электрическое поле, связанное с неподвижными зарядами, имеет, как мы уже указывали, безвихревой характер. Его источниками и стоками служат заряды. На практике чаще всего требуется найти распределение электрического поля, если известно распределение • плотности
?0 ЭЛГКТРОСТЛТИЧЕСКОЕ ПОЛЕ [Гл 1Г заряда в пространстве р(г). Для этого необходимо проинтегри- проинтегрировать систему дифференциальных уравнений A4,1) и A4,2) при заданной функции р(г). Это — так называемая прямая за- задача электростатики. Несравненно более простой, но реже встречающейся, является обратная задача электростатики — нахождение плотности за- заряда р(г) по заданному распределению поля Е(г). Для реше- решения обратной задачи электростатики, согласно A4,1), доста- достаточно найти дивергенцию заданного поля. Как мы уже указывали в § 4, для нахождения общего ре- решения уравнений электростатического поля удобно воспользо- воспользоваться методом электростатического потенциала. Согласно D,11) или A0,2), можно положить Е = — gradcp. A4,6) При этом из A4,1) получаем уравнение Пуассона: Дф = —4лр. Уравнение A4,2) будет автоматически удовлетворено введе- введением потенциала по формуле A4,6), поскольку при произволь- произвольном виде функции ср(г) имеет место равенство rot grad ф=0. Следовательно, уравнения Максвелла для электростатического поля A4,1) и A4,2) полностью эквивалентны уравнению Пуас- Пуассона. Зная его решение — скалярный потенциал ф(г), можно путем дифференцирования определить напряженность поля Е. Подчеркнем, что физический смысл имеет только напряжен- напряженность поля Е. Скалярный потенциал является лишь вспомога- вспомогательной величиной, хотя и весьма удобной. Значение потенциа- потенциала определено з электростатике с точностью до произвольной постоянной: прибавляя к потенциалу ф любую постоянную а, мы приходим к потенциалу ф'=ф+а, который отвечает полю Е = —grad ф'=—gradф. Это преобразование является частным случаем преобразования калибровки, рассмотренного в § 11. В силу неполной определенности потенциала не имеет ни- никакого смысла говорить о численном значении потенциала ф е данной точке поля. В дальнейшем, рассматривая решения уравнения Пуассона, а также обсуждая другие свойства потенциала, мы будем пред- предполагать определенное поведение потенциала ф на бесконеч- иости. Если считать, что все заряды расположены в конечной области пространства, окружающей точку, условно выбранную за начало координат, то при/"-»-оо напряженность поля должна
§ 15] ПОЛЕ СИСТЕМЫ ТОЧЕЧНЫХ ЗАРЯДОВ 61 убывать не медленнее, чем —. Соответственно этому, решения уравнения Пуассона должны удовлетворять требованию: ф->-0 при г-+схз. A4,7) С математической стороны уравнение Пуассона, представ- представляющее уравнение в частных поризводных второго порядка, а некотором отношении удобнее и проще для расчета, чем урав- уравнения поля A4,1) и A4,2), представляющие уравнения в част- частных производных первого порядка. Если потенциал ф на бес- бесконечности удовлетворяет условию A4,7), то решение уравне- уравнения Пуассона может быть написано в общем виде. В § 2 было приведено без доказательства (оно будет дано в § 24) общее решение уравнения A4,6): ( \ — Г Р (*•') dV _ С p(r')dV _ * {П ~ J " R -} \r~f\~ ~ -Г Р <*'> ¦"'¦ г">d* аУ'dz' (н,8) Зная распределение плотности заряда в пространстве р(х', </', г') и интегрируя по всему пространству, можно найти значение ф в любой точке {х, у, z). Фактический расчет поля по формуле A4,8), требующий вы- вычисления трехкратного интеграла, часто оказывается практиче- практически невыполнимым. Ниже, в ч. IV, мы кратко обсудим основные методы решения задач электростатики с учетом особенностей физических тел — диэлектриков и металлоз. Здесь же мы огра- ограничимся лишь простейшей системой — системой точечных за- зарядов. § 15. Электростатическое поле системы точечных зарядов «Размазывание» зарядов по пространству и описание свойств системы зарядов при помощи непрерывной функции р(г) дало нам возможность перейти от интегрального соотношения A4,1') к дифференциальному уравнению A4,1). Важность такого пе- перехода ясна из того, что он позволил сформулировать диффе- дифференциальные уравнения поля. Тем не менее в некоторых слу- случаях недопустимо пренебрегать точечной структурой системы зарядов в реальных условиях. Кроме того, в ряде случаев ока- оказывается удобным производить выкладки для точечных, а не для распределенных систем.
62 ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ [Гл. IT Представим плотность заряда, характеризующую систему точечных зарядов, в виде где г'{ — радиус-вектор заряда еь Подставляя это выражение в A4,8), находим потенциал поля системы точечных зарядов Ьггл"=?^ A5Д> где N rj|, r—радиус-вектор точки наблюдения. При этом мы воспользовались основным свойством дельта-функции (см. III, 3). Таким образом, решением уравнения служит функция —f0) A5,2) Формула A5,3) представляет полезное соот- соотношение, которым мы будем пользоваться в ис" ' дальнейшем. Поле системы точечных зарядов дается формулой В случае одного заряда формула A5,4) дает ? = -|r*. A5,5) и для силы, действующей на пробный заряд е, помещенный в поле одиночного заряда, получается закон Кулона: F=-^R. A5,6) Если число зарядов в системе велико, суммы в формулах A5,1) и A5,4) содержат большое число членов и эти формулы становятся мало пригодными для практических расчетов. Одна- Однако формула A5,1) допускает существенное упрощение на таких расстояниях от системы, которые намного превышают ее соб- собственную пространственную протяженность. Расстояния, боль- большие по сравнению с размерами системы, в дальнейшем будем кратко называть большими расстояниями. Если точка наблюде- наблюдения /V находится на больших расстояниях от системы, то имеет место неравенство (рис. 5) \г\>\г\\.
<§ IS] ПОЛЕ СИСТЕМЫ ТОЧЕЧНЫХ ЗАРЯДОВ 63 Рассмотрим одно из слагаемых в формуле A5,1). Для того чтобы не загромождать дальнейших формул индексами, мы не будем выписывать знак суммы и напишем расстояние от t-ro заряда до точки наблюдения в виде , A5,7) 3 a=I где индексом а отмечены три компоненты соответствующих век- векторов. Поскольку Ka|<|*a|> разлагая A5,7) б ряд Тейлора, имеем I _ 1 _ *,~ \г-г',\~ Sxe х'Л———(—Н + П5 81 Подставляя разложение A5,8) в формулу A5,1), находим (*«)^(т) A5,9) где обозначено 4>o = -V = -7, 05,10) Щ «,И Суммирование по i ведется по всем зарядам системы. По- Поэтому ^е{ = е представляет полный заряд системы. Мы видим, что на больших расстояниях отношение двух по- последовательных членов разложения потенциала по порядку »е- размер системы _ личины равно отношению ! ; . Первый г расстояние до точки наблюдения F
64 ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ (Гл. II член разложения фо совпадает с потенциалом поля, создавае- создаваемым в данной точке N зарядом е, равным суммарному заряду системы. Каждый последующий член разложения содержит воз- возрастающую степень отношения величины, пропорциональной размерам системы (~-)дс'|), к расстоянию до точки наблюде- дения (jrj). В случае электронейтральной системы ее полный заряд е = 2 ?{ — 0, и первый член ряда A5,9) исчезает. С такими си- системами мы будем иметь дело очень часто. Достаточно указать, например, что все атомы и молекулы являются электроней- электронейтральными системами. Потенциал поля, создаваемогоэлектро- н( йтральной системой зарядов, дается разложением A5,9), ко- которое начинается со второго члена фь Рассмотрим его более подробно. Запишем ф! в векторном виде: Щ 'A5,13) где градиент берегся по координатам точки наблюдения. Вели- Величина d-^er'^ jpr'dV A5,14) носит название дипольного момента системы. В частном случае системы, состоящей из двух равных по величине и противопо- противоположных по знаку зарядов, именуемой диполем, диполыгый мо- момент равен d ' \\('$ г. е. равен произведению величины заряда на вектор l = (r[-r'2). Поле электронейтральной системы в первом приближении (именуемом дипольным приближением) запишется в виде -J =-рг « —р—, A5,15) где 0 — угол между дипольным моментом и радиусом-вектором, проведенным в точку наблюдения. Таким образом, потенциал поля электронейтральной системы убывает (на больших рас- расстояниях от системы) по закону ф-~ —рг- Подобно тому как от точечных зарядов мы перешли к за- заряду, непрерывно распределенному в пространстве с плот- плотностью р, можно ввести понятие плотности дипольного момен- момента р, непрерывно распределенной в пространстве. По опреде- определению, р представляет дипольный момент единицы объема. По-
§ 15] ПОЛЕ СИСТЕМЫ ТОЧЕЧНЫХ ЗАРЯДОВ 65 тенциал поля, создаваемого всей системой, можно, очевидно, написать в виде I 1 \ где \pdV'v— —потенциал, создаваемый в точке N дипольным моментом, заключенным в объеме dV, и интегрирование ве- ведется по всему объему системы. Заметим еще, что часто вместо дифференцирования по координатам точки наблюдения поль- пользуются дифференцированием по координатам источника. Тогда согласно A,18) имеем Wt") = ~ ^'(т) и вместо A5,15) мо- можем написать q> = dV'-J- A5,16) или Г W±rdV. A5,17) Последняя формула понадобится нам в дальнейшем (см. ч. IV). Рассмотрим вопрос о зависимости дипольного момента от выбора начала координат. Предположим, что мы сместим на- начало координат на произвольный постоянный вектор а, т. с. со- совершим преобразование: При этом дипольный момент будет равен где d' = 2e,r7* Если система в целом электронейтральна, то 2^ = 0 и d' = d. В этом случае величина дипольного момен- момента не изменяется при переносе начала координат. Если, на- наоборот, система обладает полным зарядом, то й'фй, следова- следовательно, дипольный момент системы зависит от выбора начала координат. При этом всегда можно найти такое значение а, что- чтобы дипольный момент обратился в нуль. Таким образом, ди- дипольный момент всякой системы, обладающей полным зарядом, следует считать равным нулю. Определим теперь поле электронейтральной системы в ди-< польном приближении: ?= — grad ф s» — grad Ф1 = — grad —г = - - -^ grad (dr) - (dr) grad -^. 5 В. Г. Левин, том I
66 ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛР [Гл. II Вычисление по формулам A,47) дает r'd. A5,18) Поле электронейтральной системы на далеких расстояниях убы- убывает по закону Е ~ -рг и обладает резко выраженной асиммет- асимметрией. В полярных координатах (г, 0) его слагающие (соглас- (согласно I, 71) имеют вид _ дю Id cos 9 Er = — -g^- = —^з радиальная слагающая, _ 1 dm d sin 6 ?е = — — -щ = —^ меридиональная слагающая. § 16. Квадрупольный момент Если дипольный момент электронейтральной системы заря- зарядов равен нулю, в разложении потенциала A5,9) следует учи- учитывать Член разложения q>2. Примером электронейтральной системы с дипольным мо- моментом, равным нулю, может служить система из двух равных по величине диполей, с противоположными направлениями ди- польных моментов, находящихся на бесконечно малом расстоя- расстоянии друг от друга. Такая система носит название квадруполя. Потенциал поля, создаваемого квадруполем, имеет вид * а, 3 Для получения ф следует вычислить выражение а2 \г 1 ~ дха \дх$ г} дха гг _ д I 1 \ 1 дх?1 Х) где баз — символ Кронекера, а, р" принимают значения 1, 2, 3; хы х& — сокращенная запись координат Х\ = х; х2 = у; х3 = г. Тогда имеем V V 2 Zi 2л а, Совокупность величин (e{x'iax'{?) является тензором второго ранга. Этот тензор называют квадрупольным моментом системы и обо- обозначают Da$: Оч = ^е.х'1ах'ф. A6,2)
§ 16] КВАДРУПОЛЬНЫИ МОМЕНТ 67 Если перейти к непрерывно распределенным зарядам, квадру- квадрупольныи момент можно записать так: ь $ t A6,2') При этом 1 V 2 1 V П /3*"*E M а, Р Опуская для краткости индекс суммирования по всем частицам, можем написать выражение для фг в координатном представ- представлении: -Щ. Прибавляя равную нулю величину (г'J 3 и перегруппировывая члены, это выражение записывают обычно в виде а. Р При этом квадрупольныи момент Dap определен как А*- Совокупность величин Da0 легко записать в явном виде:
68 ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ [Гл. II Все девять величин Da$, образующих квадруполышй момент, зависят, очевидно, только от расположения и величины зарядов в системе. Из определения A6,5) ясно, что тензор квадрупольного мо- момента является симметричным, так что Симметричный тензор второго ранга имеет шесть независимых компонент. Заметим, далее, что сумма всех диагональных компонент квадрупольного момента равна нулю: Dxx+Dyy + Dzt = 0. A6,6) Это снижает число независимых компонентов квадрупольного момента до пяти. Как и всякий симметричный тензор, Dag можно привести к главным осям. Эта процедура совершенно аналогична приве- приведению к главным осям тензора моментов инерции в механике. Именно, произведем поворот системы координат. При этом ко- координатам х\, у\, г\ будут отвечать новые координаты л;,-, Уи Zi. Коэффициенты соответствующего линейного преобразо- преобразования подберем так, чтобы компоненты Dap с разными значе- значениями индексов аир обратились в нуль. Можно показать, что такой подбор коэффициентов всегда возможен. В новых координатах: 2 = ? Ai в1 ( '2 ~ Xil ~ Х13) ~ ®2V Важным случаем является система зарядов, расположение которых симметрично относительно оси. Пусть осью симметрии служит ось х3. Условие симметрии относительно оси х3 позволяет написать 2*,*?, = 2 etx%, так что квадрупольный момент имеет компоненты: и\ 3 1л Л «1 W 2 ' Г) _iVe / v-2 _ Х2 \ ?_ 2 ~ 3 Л4 I \ »2 IV ~ 2 '
$ 16] КВАДРУПОЛЬНЫП МОМЕНТ 69 Знак величины D называют знаком квадрупольного момента. Потенциал поля квадруполя равен согласно A6,4) 3 г2 —Здг| _ 3 l-3cos2e где в — угол между осью симметрии jc3 и радиусом-вектором г точки наблюдения. Написанный закон убывания потенциала поля квадруполя с расстоянием г имеет вполне общий характер, так что всегда i Ч>2~ Та"' Соответственно, поле убывает по закону |Я|~7Г. Если система зарядов как целое не является электроней- электронейтральной, то величина дипольного момента зависит, как мы уже указывали в предыдущем параграфе, от выбора начала коор- координат. То же относится и к квадрупольному моменту. Для слу- случая системы с полным зарядом, отличным от нуля, удобно по- поместить начало координат в точку с координатой Эту точку можно назвать центром заряда системы. Если поме- поместить начало координат в центр заряда, то дипольный момент системы зарядов автоматически обращается в нуль. Это не относится, однако, к ее квадрупольному моменту. Именно, если расположение зарядов в системе не является сферически-сим- сферически-симметричным, то все или некоторые компоненты квадрупольного момента отличны от нуля. Поэтому наличие у системы зарядов квадрупольного момента позволяет судить о характере симмет- симметрии системы. Так, например, наличие осевой симметрии приво- приводит к написанному выше распределению поля. В связи с этим обстоятельством важное значение имело об- обнаружение квадрупольного момента у ряда атомных ядер. На- Наличие квадрупольного момента ядер показало, что форма их является несферической. Если расположение зарядов в системе обладает весьма вы- высокой симметрией, ее квадрупольный момент может оказаться равным нулю; как пример укажем на систему из восьми заря- зарядов, расположенных в вершинах бесконечно малого параллеле- параллелепипеда с правильным чередованием знаков зарядов. Такая си- система зарядов, носящая название октуполя, не имеет ни ди- дипольного, ни квадрупольного моментов. Потенциал поля
70 ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ [Гл. II октуполя получается при учете четвертого члена в разложе- разложении A5,9). Если учитывать последующие члены разложения A5,9), можно получить потенциал поля мультиполей любого порядка. § 17. Работа и энергия во внешнем электростатическом поле Согласно сказанному выше, работу перемещения пробного заряда из одной точки поля в другую можно выразить через изменение потенциала в виде 2 2 2 gradq>d/ = e[(p(ri)-cp(r2)] = -eA<p. i 1 1 A7,1) Если происходят перемещения зарядов системы, то работа перемещения на вектор dU равна В дальнейшем нам понадобится выражение для работы поля над системой зарядов, отнесенной к единице времени (мощ- (мощности). Для нее находим В случае распределенных зарядов ~-=\ pvEdV = \jEdV. A7,3) Зная работу перемещения пробного заряда, можно записать его потенциальную энергию в электростатическом поле: где U(г)—потенциальная энергия в точке г и ф(г)—электро- ф(г)—электростатический потенциал в той же точке. Вид потенциальной энер- энергии не зависит от выбора системы координат. Поэтому соот- соотношение и = щ A7,4) справедливо не только в декартовых, но и в любых обобщен- обобщенных координатах qt. Обобщенные силы, действующие на проб- пробный заряд, можно написать в виде <*«--•¦?:¦ A7,5)
§ 17) РАБОТА И ЭНЕРГИЯ ВО ВНЕШНЕМ ПОЛЕ 71 Формулы A7,4) и A7,5) легко перенести на случай, когда вместо пробного заряда во внешнее поле помещена произволь- произвольная система зарядов. При этом предполагается, что внешнее поле Е является сильным по сравнению с полем, создаваемым зарядами системы. Кроме того, считается, что потенциал внеш- внешнего поля достаточно медленно изменяется от точки к точке. Потенциальная энергия системы зарядов записывается следую- следующим образом: C/-Se|4>(rj), A7,6) где ф(/"С)—потенциал внешнего поля в точке г'г Выбрав на- начало координат внутри системы, можно написать потенциал в виде ф(г;) = ф(*', у', г'), где х\ у', г' — расстояния от начала координат до заряда. Вос- Воспользуемся теперь медленностью изменения потенциала внеш- внешнего поля в области пространства, занятой зарядами. Медленно изменяющуюся функцию ф можно разложить в ряд по величи- величинам х'', у', z', характеризующим протяженность системы, и огра- ограничиться первыми членами разложения. Это дает <Р(ГО~Ф(О. О, O) + *'|j J!j = Ф @) + г' grad ф = ф @) - г'Е @). Здесь ф@) и ?@) —соответственно потенциал и напряженность внешнего поля в начале координат. Подставляя последнее вы- выражение для ф(г') в A7,6), находим U = 2 е,Ф (г;) ~ 2 е,Ф @) - 2 etr'.E @) - A7,7) В персом приближении потенциальная энергия системы за- зарядов во внешнем поле равна энергии одного заряда величиной ? = 2е(. находящегося в начале координат. В случае электро- нейтралыюй системы е = 0 и f/=-?tf=-?tfcose, A7,8) где G — угол между дипольным моментом системы и вектором рцешнего поля.
72 ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ [Гл. II Найдем обобщенные силы, действующие на систему (считая последнюю недеформируемой, так что расположение зарядов в системе фиксировано). Обобщенная сила, отвечающая коор- координатам х, у, z, равна F = - grad U = grad {Ed), или, раскрывая градиент произведения по формуле A,47) и учитывая, что d — постоянный вектор, получаем F = (d grad) E+[d rot ?] = (<* grad) E. A7,9) В однородном поле (Е = const) на электронейтральную систему с дипольным моментом не действуют силы, стремящиеся сме- сместить ее в пространстве. Такие силы имеются лишь в поле, не- неоднородном в пространстве. Обобщенная сила, отвечающая обобщенной координате 0, определяющей ориентацию вектора дипольного момента, со- согласно известному положению классической механики1), пред- представляет момент силы M=-~-=EdsmQ. A7,10) Вращательный момент стремится повернуть систему так, чтобы ее дипольный момент был ориентирован параллельно полю. Полученные формулы позволяют без труда найти закон взаимодействия заряд — диполь и диполь — диполь. При этом под Е@) следует понимать поле, создаваемое в точке 0, соот- соответственно, зарядом и диполем. Для потенциальной энергии взаимодействия заряд — диполь находим (/=-?d=_-?i?, A7,11) где г — вектор, направленный от заряда к системе и равный по величине расстоянию от заряда до системы (пространственными размерами которой в этом приближении мы должны прене- пренебречь). Потенциальная энергия взаимодействия диполь — диполь равна, согласно A5,18), и--*^^2'3/^^ A7,12) где г — вектор, соединяющий оба диполя. ') Л. Д. Ландау и Е. М. Лифшиц, Теоретическая физика, т. I, Ме- Механика, «Наука», J966.
§ 18] ЭНЕРГИЯ ВЗАИМОДЕЙСТВИЯ СИСТЕМЫ ЗАРЯДОВ 73 § 18. Энергия взаимодействия системы зарядов и энергия электростатического поля Перейдем к вычислению энергии системы взаимодействую- взаимодействующих зарядов. Простейшим путем эта энергия может быть вычислена следующим образом. Пусть в некоторой точке про- пространства закреплен заряд в\. Заряд е2, находящийся первона- первоначально на бесконечности, перемещается в некоторую точку, на- находящуюся на расстоянии г\2 от первого заряда. При этом внешним источником против сил поля должна быть произведена работа М (г i2) ~ ф| (г -+ °°I Поскольку потенциал поля первого заряда на бесконечности равен нулю, cpi(/*i2) представляет потенциал поля первого за- заряда в точке г12, равный Поэтому работа перемещения второго заряда Поднося к системе из двух зарядов третий заряд, необхо- необходимо произвести работу Продолжая такое построение системы из N зарядов, находим, что для этого необходимо затратить работу 2 L Г21 Г23 r2.V J lklk Коэффициент -j введен потому, что в сумме встречаются дважды равные члены, отвечающие каждой паре частиц, на- например, ^^- и ^ё± . Чтобы не вводить сложного ограничения на выполнение суммирования, в A8,1) учитываются все члены такого типа, а результат уменьшается в два раза. Вводя в рассмотрение потенциал <р*, который создается всеми зарядами, кроме t-ro, в месте расположения последнего, A8,1) можно переписать в виде
74 ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ [Гл. It Произведенная работа сближения равна потенциальной энер- энергии, запасенной в системе частиц. Таким образом, Переходя от точечных зарядов к непрерывной функции рас- распределения плотности заряда, можно написать A8,2) в виде (.8,3) Потенциальная энергия взаимодействия A8,2) определяется мгновенным расположением всех зарядов в системе. Формулы A8,2) и A8,3) можно интерпретировать следующим образом: каждый заряд, входящий в систему, обладает потенциальной энергией е№. ; энергия системы слагается из энергий входящих в нее зарядов. Преобразуем теперь формулу A8,3), воспользовавшись ура- уравнениями поля. Выражая р через Е по A4,1), находим с по- помощью A8,3) и = Ж J ф div EdV = Г [ J div (ф?) dV ~ J Интеграл по бесконечной поверхности исчезает, поскольку при г?+оо имеем Ф^ ^-; S~r2. Поэтому находим окончательно -^dV. A8,4) Формула A8,4) вполне эквивалентна A8,3). Однако она не содержит никаких величин, характеризующих электрические заряды. Совершенно ясно, что выражение A8,4) является частным случаем общего выражения для энергии электромагнитного поля, а его вывод — частным случаем доказательства, приве- приведенного в § 12. Существенно, однако, то, что в рамках электро- электростатики нельзя отдать преимущество какой-либо из двух аль- альтернативных формул A8,3) и A8,4). Поскольку в формуле A8,3) не содержится никаких характеристик поля, в электро- электростатике поле можно трактовать как вспомогательный, чисто ма- математический прием описания взаимодействия между частицами.
§ 18] ЭНЕРГИЯ ВЗАИМОДЕЙСТВИЯ СИСТЕМЫ ЗАРЯДОВ 75 Состояние системы и ее энергия в электростатике определяются исключительно величинами зарядов и их взаимным располо- расположением. Ранее мы уже подчеркивали, что в общем случае системы движущихся зарядов и переменных во времени полей ситуация коренным образом отличается от электростатической. Электро- Электромагнитное поле в общем случае не может трактоваться как ма- математический образ. Оно является физическим объектом, ре- реальность которого является столь же полной, как и реальность заряженных частиц. Интересно применить формулу A8,4) к одиночному элемен- элементарному заряду — электрону или протону. Его энергия равна где ф@)—потенциал поля в той точке, в которой находится сам заряд. Поскольку рассматриваемое поле является полем самого заряда, его потенциал <р = — неограниченно возрастает при стремлении г к нулю. Это означает, что точечная частица имела бы бесконечно большую собственную энергию. Таким образом, представление о частицах как о точечных объектах, не имеющих пространственной протяженности, при- приводит к физически бессмысленному результату. В связи с этим был сделан ряд попыток построить электродинамическую тео- теорию элементарных частиц, обладающих конечными размерами (теория протяженного электрона), но эта теория, оказалось, противоречила основным положениям теории относительности (см. вторую часть курса). В вопросе о собственной энергии элементарного заряда классическая электродинамика столкнулась с непреодолимой трудностью. Было ясно, что законы классической электродина- электродинамики, находившиеся в прекрасном согласии с опытными фак- фактами в области макроскопической физики, имеют ограниченную область применимости. При переходе к весьма малым расстоя- расстояниям они должны подвергнуться существенным изменениям. О границах применимости классической электродинамики мы еще будем говорить в следующих параграфах этого раздела.
ГЛАВА III КВАЗИСТАЦИОНАРНОЕ МАГНИТНОЕ ПОЛЕ § 19. Поле системы зарядов, совершающих медленное, квазистационарное движение Следующим по степени сложности является случай поля зарядов, совершающих медленное, квазистационарное движение. Медленным движением системы зарядов мы будем называть движение со скоростями \v\, малыми по сравнению с величи- величиной с, которая является единственной характерной величиной размерности скорости, содержащейся в уравнениях Максвелла. Мы увидим в дальнейшем, что с — это скорость распростране- распространения в пространстве всех электромагнитных взаимодействий. Таким образом, предположение о медленном движении за- зарядов означает, что при таком движении можно пренебречь ко- конечностью скорости распространения электромагнитных полей (см. § 23). При медленном движении можно приближенно счи- считать, что поле в каждый момент времени определяется мгно- мгновенным расположением зарядов. Под квазистационарным движением мы будем понимать движение зарядов в некоторой ограниченной области, за пре- пределы которой они не выходят во все время движения. В этой области заряды могут двигаться периодическим или непериоди- непериодическим образом. В последнем случае, однако, за весьма большое время частицы неизбежно будут проходить если не через те же самые последовательности состояний, как при периодическом движении, то во всяком случае через последовательности близ- близких состояний. Иными словами, движение будет почти периоди- периодическим. Ниже будет показано, что в этих условиях в уравне- уравнениях Максвелла производные от полей по времени малы по сравнению с пространственными производными. Отсюда тер- термин — квазистационарное (как бы стационарное) движение. Поскольку частицы не могут выйти за границы области, на ограничивающей ее поверхности Si должно выполняться ус- условие: /« = 0. A9,1).
5 19) ПОЛЕ СИСТЕМЫ ЗАРЯДОВ 77 Здесь jn — слагающая плотности тока, нормальная к поверх- поверхности. При медленном движении зарядов изменение плотности за- заряда по времени можно считать малым, т. е. можно положить *-•¦ Тогда E,4) дает O. A9,2) Таким образом, при квазистационарном движении зарядов век- вектор плотности имеет соленоидальныи характер. Иными словами, квазистационарный характер движения зарядов позволяет представить их траектории в виде некоторых замкнутых трубок или нитей. Каждая из таких трубок замыкается сама на себя внутри области движения. Такое представление особенно на- наглядно в случае макроскопических постоянных токов, идущих, например, по замкнутым проводникам (см. § 17 части IV). Для каждой замкнутой трубки с током имеет место равен- равенство A9,3) где dS — сечение и jdS — постоянный ток, протекающий по се- сечению трубки; dt — элемент ее длины. Направления векторов / и dl, очевидно, совпадают. Интеграл от плотности тока по всему объему j j j/d/ = J dl поскольку интеграл по замкнутой трубке ф cf/ == 0. Смысл этого равенства весьма прост. Рассмотрим, например, его х-ю проек- проекцию. Интеграл | jxdydz представляет полный ток через пло- плоскость (уг), секущую трубки тока. В квазистационарном состоя- состоянии системы полный ток через любое сечение равен нулю. Число зарядов, проходящих по нормали к сечению через все трубки тока в обоих направлениях, дожно быть одинаковым, поскольку заряды совершают движение в ограниченном объеме простран- пространства Перейдем теперь к формулировке уравнений Максвелла для поля системы зарядов, совершающих медленное, квазиста- квазистационарное движение. Чтобы выяснить, какие упрощения можно внести в систему уравнений Максвелла для такого движения, оценим (по порядку величины) входящие в них члены. Подоб- Подобные методы оценок широко применяются в теоретической фи- физике.
78 КВАЗИСТАЦИОНАРНОЕ МАГНИТНОЕ ПОЛЕ [Гл. III Начнем с оценок производных по времени, фигурирующих в уравнениях Максвелла. Поскольку рассматриваемая система совершает периодическое или почти периодическое движение, | дЕ | \ан \\ и можно по порядку величины оценить величины написав | дЕ ~дТ дЕ dt Е_ Т дН dt где Т — характерный период движения. Величины ? и Я озна- означают характерные средние абсолютные значения напряженно- стей поля в области пространства, занятой системой зарядов. Разумеется, не имеет смысла стремиться к уточнению этих величин, относя их к определенному моменту времени или опре- определенной точке пространства. Написанные соотношения имеют смысл грубых оценок порядка величин. Найдем, далее, порядок величин rot? и rot Я в той же области пространства. Поля Е и Н в реальных системах, совер- совершающих квазистационарное движение, изменяются от точки к точке, вообще говоря, достаточно плавно. Если обозначить через L средние размеры системы, то все пространственные про- производные по порядку величины можно оценить следующим об- образом: дЕ дх дЕ ду дЕ dz Е_ L При этом мы отвлекаемся от распределения поля в системе, его конкретной зависимости от различных координат. Условие квазистационарности заключается в том, чтобы временные изменения полей происходили достаточно медленно, так чтобы в уравнениях Максвелла можно было опустить члены, содержащие производные по времени с соответствую- соответствующим коэффициентом, как малые по сравнению с членами, ха- характеризующими пространственное изменение полей. Для этого дожны выполняться (по порядку величины) неравенства: dEi дхк dHi дхк ъ 1 -*" с v-s 1 ~ С dHi dt dEt 1 dt 1 или н_ L 1 Е 7 т с Т A9,4) При этом одновременно должны выполняться приближенные равенства dEi dEk dHi dxu dx. ' dx.
§ 19] ПОЛЕ СИСТЕМЫ ЗАРЯДОВ 79 так что разности пространственных производных, входящих в уравнение Максвелла, взаимно компенсируют друг друга, а вре- временные производные (с коэффициентом 1/с) оказываются ве- величинами старшего порядка малости. Перемножая эти нера- неравенства A9,4), приходим к условию квазистационарности: Т>~. A9,5) С Неравенство A9,5) или эквивалентное ему неравенство *>-?¦«», A9,50 L где величину v—^-можно интерпретировать как характерную скорость движения зарядов в системе, имеют наглядный смысл. При квазистационарном движении зарядов их скорости должны быть малы по сравнению со скоростью распространения поля. Электромагнитные поля, для которых справедливо неравен- неравенство A9,5) и в которых можно пренебречь, как малым, током смещения, носят название квазистационарных полей. Для квазистационарных полей уравнения Максвелла при- приобретают следующий вид: A9,6) A9,7) A9,8) A9,9) Таким образом, в приближении квазистационарных полей ток смещения не входит в уравнения поля. Мы видели уже, что отсутствие тока смещения отвечает соленоидальному характеру линий тока. Обратно, если трубки тока являются почти замк- замкнутыми, а движение зарядов — происходящим в ограниченном объеме и почти периодическим, то ток смещения должен быть очень мал по сравнению с током зарядов. Система уравнений Максвелла оказывается распавшейся на уравнения для независимых полей: магнитного поля токов и электрического поля зарядов. Плотность заряда р в уравнении A9,9) зависит от времени, как от параметра. В приближении медленно движущихся заря- зарядов, решение уравнений для электрического поля приводит к очевидному результату: в каждый момент времени электриче- электрическое поле совпадает с электростатическим полем данной кон- конфигурации зарядов. rot// — div// = rot? = div? = An . с J' 0, 0, 4np.
80 КВАЗИСГАЦИОНАРНОЕ МАГНИТНОЕ ПОЛЕ [Гл III Магнитное поле системы зарядов, совершающих медленное стационарное движение, будет найдено интегрированием A9,6) — A9,7). Введем вектор-потенциал по формуле A0,1). Поскольку зависимостью плотности зарядов р и тока / от вре- времени можно пренебречь, напряженности магнитного и электри- электрического полей, а следовательно, и электромагнитные потенциалы также не зависят от времени. Поэтому уравнение для вектора- потенциала A0,6) и соотношение Лоренца A0,5) приобретают соответственно вид Д4=-^-./) A9,10) div4 = 0. A9,11) Уравнение A9,10) представляет совокупность трех скалярных уравнений Пуассона: Мы будем предполагать, что все компоненты вектора-потен- вектора-потенциала системы зарядов, совершающих медленное и стационар- стационарное движение, убывают на бесконечности не медленнее, чем по закону —: ¦О при г->оо. A9,12) o(jr) Здесь символ О означает, что отбрасываемые члены имеют по- порядок малости выше —. Решение уравнения A9,10), удовлетво- удовлетворяющее требованию A9,12), может быть написано по форму- формуле C,16) в виде л (г) _ 1 Г Яг') чу = ! Г _мх>, /, ?) d* ay d* где /(г')—плотность тока в точке г', а /?=|г — г'\ — расстояние от этой точки до точки наблюдения г, в которой ищется значе- значение вектора-потенциала. Нетрудно видеть, что решение A9,13) уравнения A9,10) удовлетворяет условию A9,11). Действительно, где дивергенция берется по координатам точки наблюдения (текущим координатам). Ввиду независимости операций диф- дифференцирования по координатам г и интегрирования по коор- координатам f порядок их можно изменить. Плотность тока /(г) можно было бы вынести за знак divr, но это нецелесообразно.
$ 19] ПОЛЕ СИСТЕМЫ ЗАРЯДОВ 81 Замена переменной дифференцирования по формуле, аналогич- аналогичной (I, 18), дает в силу условия A9,1). Таким образом, формула A9,13) дает решение задачи, удо- удовлетворяющее всем необходимым условиям. Зная вектор-по- вектор-потенциал, можно найти магнитное поле При дифференцировании по координатам г плотность тока /(г') должна считаться постоянной. Тогда по формуле A,43) на- находим Поэтому окончательно IV. A9,15) Формула A9,15) носит название закона Био и Савара. Она дает принципиальное решение поставленной задачи. Однако вычисление интеграла в формуле A9,15) достаточно сложно и может быть проведено до конца только для некоторых про- простейших систем. Для нахождения поля одиночного заряда, движущегося в пустоте, формула A9,15) применена в следующем параграфе. Однако она особенно важна для расчета полей токов, текущих по проводникам. Поэтому дальнейшие примеры расчетов с по- помощью закона Био и Савара будут разобраны в § 19 ч. IV книги. Подчеркнем, что все результаты этого параграфа, в част- частности закон Био и Савара, имеют приближенный характер. Они являются следствием соотношений A9,5). Квазистационарные поля особенно часто встречаются при рассмотрении электро- электромагнитных процессов в материальных средах. Поэтому мы вер- вернемся еще к ним в ч. IV (§ 22), где будет проведено более по- подробное обсуждение условий, при которых поле можно счи- считать квазистационарным. В заключение приведем соотношение, которое понадобится нам в дальнейшем. Очень часто размеры той области простран- пространства, в которой рассматривается воздействие магнитного поля на систему, достаточно малы, и в пределах этой области Mai- нитное поле можно считать постоянным и однородным. Тогда 6 В Г. Лсиич, том I
82 КВАЗИСТАЦИОНАРНОЕ МАГНИТНОЕ ПОЛЕ [Гл. Щ вектор-потенциал А этого постоянного однородного поля можно представить в виде А = Щр-. A9,16) В правильности этого соотношения можно убедиться непосред- непосредственным вычислением по формуле A,45). § 20. Поле одиночного заряда, совершающего медленное равномерное движение Рассмотрим одиночный заряд е, движущийся с постоянной скоростью v0. Мы будем предполагать, что |уо|*Сс (см, ниже, § 23). Плотность заряда р может быть представлена в виде р(г, /) = ей(г-го(/)). B0,1) Здесь го(/)— координата заряда в момент времени t. Форму- Формула B0,1) означает, что весь заряд в каждый данный момент времени находится в точке пространства с координатой rQ(t). Уравнения Максвелла для электрического поля имеют вид rot?=0, Поскольку поле имеет безвихревой характер, можно ввести по- потенциал ф(г, t), так что Е— — gradqp. Потенциал удовлетворяет уравнению Дф = - 4яе6 (г - г0 (/)). Решение последнего уравнения согласно @,0) может быть написано в виде Через R(t) обозначен вектор, соединяющий точку наблюдения с мгновенной координатой заряда ro(t). Из формулы B0,2) следует, что электрическое поле движу- движущегося заряда формально совпадает с полем неподвижного за- заряда, но вместо фиксированного расстояния от данной точки наблюдения до заряда, в B0,2) фигурирует переменное во вре- времени расстояние /?(/). Поле заряда дается, очевидно, формулой eR{i) F - R3 @ '
§ 20] ПОЛЕ ОДИНОЧНОГО ЗАРЯДА 83 Поскольку заряд движется равномерно, его положение в про- пространстве можно написать в виде г0 = vot. Поэтому напряженность электрического поля в точке будет за- зависеть от времени по закону Очевидно, что в некоторой точке г в момент времени t напря- напряженность поля будет такая же, как в точке с координатой r+v0 в момент времени t+l. Действительно, Это означает, что точка с данным значением напряженности поля равномерно движется в пространстве вместе с зарядом. При этом поле сохраняет сферическую симметрию относитель- относительно точки, характеризующей мгновенное положение заряда. В дальнейшем мы сравним формулу B0,4) с соответствующим выражением для поля, создаваемого зарядом, движущимся со скоростью j Uo | ~ с. Перейдем теперь к определению магнитного поля. Оно мо- может быть найдено по формуле A9,15), в которой плотность тока для единичного заряда можно написать в виде i = evo6{r-ro). Подставляя значение /в A9,15), находим Щ'Г~\Р-ЬЛ "^ ^-Т-^->оДЬ B0,5) Таким образом, магнитное поле оказывается перпендикуляр- перпендикулярным к электрическому полю и перпендикулярным к скорости заряда. Абсолютная величина \Н\~ — \Е\, причем всегда — < 1. Дифференцированием по формуле A,45), можно убе- убедиться, что вектор Н удовлетворяет уравнению A9,7). Мы разбирали без вычислений вопрос о нахождении поля движущегося заряда в § 9. При этом было указано, что если поверхность интегрирования 52 (рис. 4) проходит через точку, в которой находится в данный момент движущийся заряд, маг- магнитное поле связывается с током заряда /. Эта картина отве- отвечает произведенному нами расчету. Формула B0,5) была получена, как результат решения урав- уравнений A9,6) и A9,7), в которых ток смещения отсутствовал.
84 КВАЗИСТАЦИОНЛРНОЕ МАГНИТНОЕ ПОЛЕ [Гл. Ш Можно, однако, найти значение магнитного поля, не пользуясь формулой A9,15), по току смещения на произвольной поверх- поверхности St. Напишем уравнения для магнитного поля в виде ^^r0), B0,6) div//=0. B0,7) Зависимость электрического поля Е равномерно движущегося заряда от времени задается формулой B0,4). Дифференцируя по времени, находим дЕ (дЕ , дЕ , дЕ Согласно A,45) имеем rot [v0E] = (Е grad) v0 - (v0 grad) E + v0 div E - E div v0 = = - (»o grad) E + v0 div E, поскольку v0 — постоянный вектор. Отсюда находим 4f e ~ ta> erad)E = rot I^o^l ~ vo div E = = rot [v0E] - 4nvoe6 (r - r0), B0,8) в силу B0,1). Подставляя значение B0,8) в B0,6), имеем rot// = yrot[«>0?]. B0,9) Решением B0,9), удовлетворяющим B0,7), служит B0,5). Мы видим, таким образом, что оба способа расчета приводят, как и следовало ожидать, к одному и тому же результату. § 21. Поле системы зарядов, совершающих квазистационарное движение, на больших расстояниях от системы Предположим, что некоторая совокупность зарядов совер- совершает медленное и квазистационарное движение в ограниченной области" пространства. Часто основной интерес представляет электромагнитное поле этой системы на расстояниях, больших по сравнению с размерами системы (размерами области дви* жения). При этом, как и в случае электростатики, общая фор- формула A9,3) для вектора-потенциала допускает существенное упрощение.
5 21] ПОЛЕ СИСТЕМЫ ЗАРЯДОВ 85 Воспользуемся разложением A5,8), написав Подставляя -к в A9,13), находим В силу A9,4) первый интеграл для системы, совершающий ста- стационарное движение, равен нулю. Поэтому Vf. B1,1) Преобразуем подынтегральное выражение в B1,1) с помощью тождества Первую скобку можно представить в виде тройного векторного- произведения {/ (г'gradl)-г' (j gradl)}=[[r7]gradl] --И™. Таким образом, вектор-потенциал можно представить в виде Займемся вычислением второго интеграла. Вводя, согласно щей теории § 19, трубки тока, можно написать Действительно, изменение положения заряда dr' при движении по трубке тока тождественно с dl. Поэтому = J {/('", gradf) + r = J dl | d [f [f, grad |)) = 0, так как интеграл по замкнутому контуру от полного дифферен- дифференциала всегда равен нулю.
86 КВАЗИСТАЦИОНАРНОЕ МАГНИТНОП ПОЛЕ [Гл ПГ Таким образом, окончательно А=~- \ {[r'J]r}dV ^-^r[j [r'J]dV. г]. B1,2) Введем обозначение ±l B1,3) Величина М именуется магнитным моментом системы зарядов. Она зависит исключительно от свойств системы зарядов — рас- распределения плотности токов и геометрии системы. Ниже мы увидим, что М действительно является в известной мере анало- аналогом дипольного момента системы неподвижных зарядов. Вектор-потенциал вдали от системы приобретает вид А = &?-. B1,4) При этом магнитное поле согласно A,45) выражается фор- формулой Н = rot А = rot J^i = М div ~ - (М grad) ~. Поскольку дифференцирование ведется по координатам точки наблюдения, магнитный момент системы при дифференциро- дифференцировании является постоянным. Согласно (I, 42) находим div rgrad + divr + Далее, (Mgrad)^ Поэтому »™™ B1,5) Мы видим, что магнитное поле системы медленно и квази- стационарно движущихся зарядов вдали от системы выражает- выражается такой же формулой, как электростатическое поле системы покоящихся зарядов. Различие заключается в том, что вместо дипольного момента d в A5,18), в формуле B1,5) стоит магнит- магнитный момент системы М. § 22. Магнитный момент Рассмотрим несколько подробнее свойства магнитного мо- момента системы. Прежде всего нетрудно убедиться, что значение магнитного момента не зависит от выбора начала координат. Смещая начало координат на постоянный вектор а, т. е.
§ 22] МАГНИТНЫЙ МОМЕНТ 87 полагая г' = г" + а, находим м=i J Widv' - i J ^irfr + i J Ml </l ' Переписав появившийся дополнительный член в виде \[aj}dV'=[a\jdV'\, мы видим, что в силу A9,4) он равен нулю. Таким образом, магнитный момент, подобно диполыкжу моменту нейтральной системы зарядов, представляет величину, зависящую только от физических свойств системы, но не от выбора начала отсчета. Рассмотрим выражение магнитного момента для случая, когда заряды движутся по одной нити или тр}бке. Пользуясь A9,3), находим м=-h \ dI [t" dl]=т i J[/" dl]- B2> l> Нетрудно заметить, что величина у [г' dl\ представляет вектор площади. Интеграл s= ^r>dl^ представляет площадь боко- боковой поверхности конуса, опирающегося на контур с током. В ча- частном случае плоского замкнутого контура за S можно вы- выбрать вектор нормали к площади контура, умноженный на ве- величину площади. Можно записать М = -?. B2,2) Формула B2,2) допускает наглядную интерпретацию: всякий замкнутый ток (например, одна или несколько заряженных ча- частиц, движущихся по замкнутым траекториям) обладает маг- нитым моментом, пропорциональным величине тока В этой связи заметим, что каждый атом с электронами, обращающи- обращающимися по орбите, является элементарным магнитом (см. ч. IV). Перепишем теперь выражение для магнитного момента, вы- выразив плотность тока через скорость движения зарядов: где суммирование ведется по всем зарядам в системе. Рассмотрим важный случай системы, состоящей из одинако- одинаковых частиц или из разных частиц, но обладающих одинаковыми
38 КВЛЗИСТАЦИОНАРНОЕ МАГНИТНОЕ ПОЛЕ [Гл III значениями отношения заряда е к массе т. Вводя это отноше* ние в B2,3), находим м - w 14t К «л! - ш Ъ Vn = 4- L> <22-4> где /, — механический момент системы. Формула B2,4) показывает, что для системы частиц с по- постоянным значением — между магнитным и механическим mo- moot j ментом системы существует прямая пропорциональность. Пропорциональность между М и L имеет место также в системе, состоящей из двух частиц при произвольном отношении —. Действительно, в такой системе m Поместив начало координат в центр инерции, т. е. положив m,rJ + m/J = 0, ¦и вводя относительную скорость от _ гг — Г' = Г' voth '2 '\ 'огп> находим откуда где L = \г'0Т1:р0ТИ) = [г'ОТН\ю0Т1] - момент относительного движения ttl \t7to л р = - ' приведенная масса.
ГЛАВА IV ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ ПРОИЗВОЛЬНО ДВИЖУЩИХСЯ ЗАРЯДОВ § 23. Электромагнитное поле системы произвольно движущихся зарядов Рассмотрим систему зарядов, совершающих произвольное движение в некотором объеме V'. Распределение и движение зарядов в этом объеме будем характеризовать плотностью за- заряда р(г, t) и плотностью тока /(г, /), изменяющимися в про- пространстве и во времени. Мы будем предполагать, что функции р(г,/) и j(r,i) известны в любой момент времени (т. е. при —оо < *< оо). Уравнения для электромагнитных потенциалов, зависящих от координат и времени, имеют вид Аф (г, 0 —?¦ д'9& г) = ~ 4яр (г, (), B3,1) ^^-—т-У(г. t), B3,2) A-O. B3,3) Система уравнений B3,1) — B3,3) представляет систему линей- линейных дифференциальных уравнений в частных производных. Как известно из теории дифференциальных уравнений в частных производных, однозначное решение задачи, — в данном случае нахождение конкретного распределения электромагнитного поля в пространстве и во времени в зависимости от значений извест- известных функций р(г, /) и j(r,t), требует задания некоторых допол- дополнительных условий, именуемых граничными и начальными усло- условиями. Обычно задача о нахождении электромагнитного поля ставится следующим образом: до некоторого момента времени / = 0 (т. е. при всех значениях времени / < 0) заряды в системе были не- неподвижны; начиная с момента времени / = 0 заряды находятся
<H ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ [Гл. IV в движении и движение это произвольное. При этом в электро- электромагнитном поле возникает изменение или, как говорят, возму- возмущение. Мы будем предполагать, что в уравнениях B3,1) — B3,3) фигурируют векторный и скалярный потенциалы именно этого возмущенного поля. Функции р(г, I) и j{r,t), ответственные за возмущение поля при / > 0, считаются известными. При 1-^-0 следует положить Р(г, 0) = 0, J(r, 0) = 0. Соответственно в начальный момент времени ? = 0 равны нулю векторы электрического и магнитного полей Е(г, 0) = = Я(г, 0)=0. Тогда начальные условия для потенциалов гласят: л (г, OLo-°. дА (г, t) dt B3,4) Действительно, если условия B3,4) удовлетворены, то из опре- определений векторов поля непосредственно видно, что векторы поля обращаются в нуль. Таким образом, начальное условие B3,4) полностью эквивалентно требованию: плотности заряда и тока равны нулю при / = 0 и, вообще говоря, отличны от нуля при Граничными условиями будут служить требования, чтобы вдали от объема V потенциалы поля убывали не медленнее, чем по закону: °(т) при B3,5) при Г 0<1?< т. е. не медленнее, чем функция —. Для решения системы уравнений поля в этом параграфе мы воспользуемся простым, но не строгим методом, основанным на использовании принципа суперпозиции. В следующем параграфе будет приведен более последовательный, с математической точ- точки зрения, метод решения, который приводит к тем же резуль- результатам. Разобьем всю систему на совокупность как угодно малых зарядов бе, = p(r, t)bVlt где 8V,- — как угодно малый объем в области V. Будем искать в некоторой точке наблюдения N по- потенциал поля, создаваемого зарядом 8еи предполагая при этом, что никаких других зарядов в пространстве нет. Полное поле, на основании принципа суперпозиции, представляет сумму по- полей, создаваемых всеми зарядами бе,-, входящими в систему.
§ 23] ПОЛЕ СИСТЕМЫ ПРОИЗВОЛЬНО ДВИЖУЩИХСЯ ЗАРЯДОВ 91 Подчеркнем, что закон сохранения заряда не допускает су- существования уединенного и переменного во времени заряда bet. В действительности изменение (например, возрастание) заря- заряда bet во времени предполагает одновременное уменьшение за- заряда beh в другом элементе объема так, чтобы полный заряд системы сохранялся. Однако для нахождения потенциалов поля, создаваемого зарядом бе,, мы не будем формально учитывать существование остальных зарядов. Возникающее при этом ка- кажущееся нарушение закона сохранения заряда не отразится на конечном решении, в котором будет проведено суммирование по всем зарядам системы. Найдем, прежде всего, решение системы уравнений для по- потенциалов поля, создаваемого во всем пространстве вне малого объема 8Vi зарядом бе*. Во всех точках пространства вне объема 6V* плотность за- заряда, согласно нашему предположению, равна нулю. Поэтому вне объема 6V,- уравнения для потенциалов электромагнитного поля приобретают вид ¦!? = О, B3,6) Введем сферические координаты с началом координат, поме- помещенным б объеме f>Vi. Поле вне объема б^ обладает сфериче- сферической симметрией, так что потенциалы поля могут зависеть толь- только от расстояния до объема 6Vt— радиуса-вектора г и времени. Воспользовавшись выражением для оператора Лапласа в сфе- сферических координатах, имеем ^ = 0, B3,7) 7 "а^~(г А) ~~^~др--°- <23'8) Мы видим, что скалярный потенциал и все компоненты век- вектора-потенциала определяются уравнением одного типа: По причинам, которые будут ясны из дальнейшего, уравнение типа B3,9) носит название волнового уравнения. Интегриро- Интегрирование волнового уравнения может быть проще всего проведено ло методу Даламбера. Метод Даламбера заключается, грубо
92 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ (Гл. IV говоря, в сведении уравнения в частных производных типа B3,9) к уравнению со смешанной второй производной (за бо- более строгим изложением метода Даламбера отсылаем читателя к математическим руководствам1)). Перепишем уравнение B3,9) в виде k?-&¦№-О B3,10) и введем новую неизвестную функцию, 4> = rf, B3,11) что всегда возможно, поскольку гФО, вне объема bV{. Тогда имеем dr1 c! dt* ~u" Ц6,\Л) Перейдем теперь в уравнении B3,12) к новым переменным: & = <-?. B3,13) B3,14) Отсюда так что д д 1нГ д д ~ дг г — ¦ дг дг Л 6 + 4 2 U д . <? д% dt г + _, 1 Г с , = т! - с - 2" 2 С' \ ~ ~ЪТ~т~ / д , 1 V дг с д/ Далее, ^г2 с2 dt2 \ дг + с dt )\ дг с dt } ~ с2 д% дц ~~ с В новых переменных уравнение B3,12) имеет вид Это уравнение, содержащее лишь смешанную производную, ин- интегрируется непосредственно. Очевидно, что оно удовлетворяет- удовлетворяется любыми функциями \|)i(t)) и iMS) одной переменной, | или т|. Поэтому общее решение уравнения B3,15) можно на- написать в виде B3,16) ') См., например, А. Н. Тихонов и А. А. Самарский, Уравнения математической физики, «Наука», 1967, гл. П.
% 23] ПОЛЕ СИСТЕМЫ ПРОИЗВОЛЬНО ДВИЖУЩИХСЯ ЗАРЯДОВ 93 где tfi и тр2 — произвольные функции одной переменной — ? и ц соответственно. Возвращаясь к старым переменным ги I, полу- получаем ¦ (г, t)-^(t~j) + ^(t + j). B3,17) Найденное решение имеет простой смысл. Значение функции tt'i в точке г + с и в момент времени (t + 1) совпадает со значе- значением этой функции в точке г в момент времени t. Это означает, что i|>i \t—— j описывает процесс периодический в пространстве и во времени, т. е. волновой процесс. Волновой процесс распро- распространяется в сторону возрастающих значений расстояния г от начала координат со скоростью, равной с. Аналогично ^ (* + J описывает волну, распространяющуюся от больших г к меньшим в направлении к началу координат. Для функции f имеем (?) Лт) f= \ '+ \ '. B3,18) ¦Формула B3,18), дающая общее решение уравнения B3,9), представляет наложение двух волн — расходящихся из начала координат (первое слагаемое) и сходящейся к началу коорди- координат (второе слагаемое). Поверхности сфер г — const являются поверхностями постоянного значения функции / или поверхно- поверхностями равной фазы. Поскольку поверхностями равной фазы яв- являются сферические поверхности, говорят, что волновой процесс, описываемый функцией f, является совокупностью расходящей- расходящейся и сходящейся сферических волн. Скалярный потенциал ф и все компоненты вектора-потенциала А могут быть представлены в виде формулы B3,18). Для выяснения смысла полученных решений рассмотрим одно из частных решений, например расходящуюся сфериче- сферическую волну. Для конкретности напишем выражение для ска- скалярного потенциала: Чт) Ф(г, t)-- Ч ¦ B3,19) При произвольном виде функции <pi формула B3,19) дает част- частное решение уравнения B3,1) в области пространства вне объе- объема 6V{. Потребуем теперь, чтобы B3,19) непрерывно перехо- переходило в решение уравнения B3,1) вблизи объема bVu r. е. вбли- вблизи места расположения заряда 6е*(/). Если в уравнении B3,1)
94 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ [Гл IV совершить формальный переход (смысл такого перехода станет ясным из дальнейшего), положив с-+оо, то оно превратится, очевидно, в уравнение для электростатического потенциала, ре- решением которого служит Записав B3,19) в виде p(*-.-lW, dvAr, *) = У , B3,21) мы приходим к потенциалу поля.создаваемого зарядом deit ко- который удовлетворяет уравнению B3,7) вне объема 6V% и пере- переходит вблизи начала координат в B3.20). Формула B3,21) показывает, что потенциал поля в точке на- наблюдения, находящейся на расстоянии г от начала координат в момент времени t, определяется значением заряда в предыдущий момент времени x = t — —. Потенциал B3,21) называется по- поэтому запаздывающим потенциалом, а величина -— временем запаздывания. Время запаздывания представляет промежуток времени, в течение которого электромагнитное поле, распростра- распространяющееся со скоростью с, проходит путь г. Вводя начало координат в некоторой точке О, расположенной в объеме V", и интегрируя выражение B3,21) по всем зарядам системы, приходим к следующему выражению для потенциала поля, создаваемого в точке наблюдения N: с } _ _\ cj_ р (г , т) dV |r-/-'| -J R ~ ) R ' B3,22) где т = / — —, R = r — г'. Согласно B3,22) для получения потенциала в точке наблюде- наблюдения N, как и в электростатике, нужно взять интеграл от вели- величины -!г по всему объему системы. При этом, однако, значение плотности заряда берется в момент времени x = t—\r~r ' f Где С \r-r'\ время запаздывания -— определяется расстоянием от каж- каждой точки г' до точки наблюдения.
5 23] ПОЛЕ СИСТЕМЫ ПРОИЗВОЛЬНО ДВИЖУЩИХСЯ ЗАРЯДОВ 95 Совершенно аналогично для вектора-потенциала можно напи- написать частное решение уравнения B3,2) в виде k-r'i ~ с J =7} '*"ГУ 1 Г J(r',T)dV Наряду с решениями уравнений для потенциалов в виде за- запаздывающих потенциалов можно написать и другие частные ре- решения, отвечающие функции \р2 в общем решении B3,18): Г e[r''t + T)dV' Ф* (г, t) = J -i ^ , B3,24) 1 Г i(l"'t + i- J -i r 1 Г ( f) Х (г, 0—i- J -i r^l . B3,25 В формулах B3,24) и B3,25) значения функций р и /, опреде- определяющие потенциалы в точке г в момент времени t, берутся в мо- момент времени т* = М . Это означает, что потенциалы в мо- момент времени / зависят от той плотности заряда, которая будет в точке г через промежуток времени —. Потенциалы B3,24) и B3,25) называются опережающими. Из запаздывающих и опережающих потенциалов можно со- составить произвольные линейные комбинации вида сиф + агф*, Р1.Д + Р2А*, которые также удовлетворяют уравнениям поля. Об- Общее решение уравнений для потенциалов получается из найден- найденных частных решений и общих решений уравнений B3,7) и B3,8). Появление запаздывающих и опережающих потенциалов как равноправных решений уравнений поля вполне естественно. Как и уравнения механики, уравнения электродинамики симметричны относительно будущего и прошедшего. Они не меняются при за- замене t на (—t) и должны поэтому иметь общее решение, инва- инвариантное (неизменное) относительно изменения знака времени. Выбор коэффициентов в этих линейных комбинациях опреде- определяется заданием указанных выше дополнительных условий, ха- характеризующих поведение потенциалов на бесконечности. Для выполнения этих условий необходимо отбросить решение, отве- отвечающее опережающему потенциалу. Действительно, рассмотрим в момент времени / = 0 некоторую сферу радиуса R] «не объема V. Согласно граничному условию ,B3,5), потенциал
96 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ [Гл. IV <р(/?1, 0) « О (-?-]. Соответственно этому запаздывающий по- потенциал „ 0)=J V R C ' dV' = Q, поскольку по условию плотность заряда равна нулю при t < 0. Наоборот, опережающий потенциал В последней формуле значению / = 0 отвечают отличные от нуля значения аргумента функции р^, т), так как плотность заряда р(г', -j-J не равна нулю. Напомним, что использованные нами свойства плотности за- заряда р(г', 0) = 0, р(г', t J Ф 0 отвечают выбору начальных условий в форме B3,4). Мы видим, что при таких свойствах плотности р опережающий потенциал не удовлетворяет усло- условию B3,5), определяющему его поведение на бесконечности. Именно, опережающий потенциал убывает медленнее, чем функция —. Для получения такого решения волнового уравнения, которое удовлетворяло бы системе начальных и граничных ус- условий, следует положить аг = Рг = 0 и оставить лишь решение уравнений поля в виде запаздывающих потенциалов. Неслож- Несложные, но несколько громоздкие выкладки позволяют убедиться в том, что запаздывающие потенциалы, даваемые формулами B3,24) и B3,25), удовлетворяют условию Лоренца B3,3) при oi -=Pi - 1. Итак, мы приходим к весьма важному выводу: система за- зарядов, начавших в момент времени t = 0 двигаться нестацио- нестационарным образом, создает в окружающем пространстве электро- электромагнитное поле, потенциалы которого имеют характер запазды- запаздывающих потенциалов. Потенциалы поля имеют характер сфери- сферических волн, исходящих от системы и распространяющихся в пустоте со скоростью с. Мы будем говорить, что система нестационарно движущихся зарядов излучает электромагнитные волны, и кратко называть ее излучателем. Решение уравнений электромагнитного поля в виде запазды- запаздывающих потенциалов имеет большое принципиальное значение.
§ 23] ПОЛЕ СИСТЕМЫ ПРОИЗВОЛЬНО ДВИЖУЩИХСЯ ЗАРЯДОВ 97 Оно отвечает определенной системе представлений о характере причинной связи, которая отличается от представлений класси- классической механики. Как известно, все положения классической механики согла- согласуются с ньютоновским представлением о действии на расстоя- расстоянии. В классической механике предполагается, что ускорение некоторой материальной точки в данный момент времени пол- полностью определяется силой, действующей на нее в тот же мо- момент времени. Сила, действующая на данную материальную точку, в свою очередь зависит от положения других материаль- материальных точек, находящихся на конечном расстоянии от рассматри- рассматриваемой. Если положение какой-либо из материальных точек из- изменится в некоторый момент времени /о, в тот же момент вре- времени изменится и величина силы. Иными словами, скорость распространения взаимодействия в пространстве считается в классической механике бесконечно большой. В теории электромагнитого поля ситуация коренным обра- образом изменяется. Если изменить положение зарядов, находя- находящихся на расстоянии г от точки наблюдения, то потенциал в последней изменится лишь через время т = -j. Это время требуется для того, чтобы возмущение электромагнитного поля, движущееся от точки к точке с конечной скоростью, равной скорости света с, прошло в пространстве путь г. При этом возмущение передается от одной точки поля к другой, с ней со- соседней. Пространство, в котором происходит распространение элек- электромагнитных возмущений, уже не есть пустое «ничто» класси- классической механики, но считается заполненным реальным электро- электромагнитным полем, наделенным определенными физическими свойствами. Таким образом, бесконечно большая скорость рас- распространения взаимодействия и дальнодействие в классической механике заменяется конечной скоростью распространения взаимодействия и представлением о близкодействии в теории электромагнитного поля. Причина (изменение поля) и следствие (движение пробного заряда в точке наблюдения) относятся к одному месту и одному моменту времени. В следующей части книги точка зрения теории поля получит дальнейшее подтверж- подтверждение и расширение. Следует еще заметить, что, поскольку скорость распростра- распространения электромагнитных возмущений с весьма велика, очень часто на практике можно считать ее бесконечно большой. Представления классической механики тем самым не просто отвергаются как неверные, но сохраняются, как приближенные, имеющие определенную область применимости. 7 В. Г. Левнч, том I
98 Э'лрктромагнитНое -полр движущихся зарядов [гя кг § 24*. Общее решение уравнения Даламбера в виде запаздывающих потенциалов Перейдем теперь к строгому решению уравнения Даламбера для потенциалов. Мы ограничимся нахождением одного из по- потенциалов, например, векторного потенциала. Выражение для скалярного потенциала может быть написано по аналогии. В соответствии со сказанным в предыдущем параграфе уравнение для потенциала должно быть дополнено начальными и граничными условиями. Мы рассмотрим задачу в следующей постановке: пусть ра* нее некоторого момента времени / = 0 (т. е. при t < 0) имелась система зарядов, например, неподвижных или совершавших стационарное движение. К моменту t =? 0 их конфигурация заг дана и поле имеет некоторое распределение в пространстве. В момент времени / = 0 состояние системы изменяется и заряды начинают совершать нестационарное движение. Нас будет ин- интересовать закон изменения векторов поля, связанный с этим нестационарным движением зарядов, начиная с момента t = 0. Пусть Е и Н — векторы поля, связанные с движением за- зарядов за время /X). Иными словами, пусть Е и Н — измене- изменения электромагнитного поля, которое существовало в момент t = 0, вызванные движением зарядов при t^-Q. Тогда из опре- определения ? и Я следует, что они должны удовлетворять началь- начальному условию: Е = Н = 0 при t = 0 (во всем пространстве). Начальное условие для вектора-потенциала имеет при этом сле- следующий вид: А = 0 при / = 0, /- — любом, B4,2) ял ¦5т-0 цри / = 0, г-любом. B4,3) Первое из написанных равенств отвечает равенству Н = 0, вто- второе— отсутствию электрического поля ? = 0 в начальный мо- момент времени. Граничное условие на бесконечности имеет вид т) при г-*°°' Иными словами, под А мы понимаем вектор-потенциал поля, связанного с движением зарядов, начавшимся в момент t = 0 и продолжающ'имся при t > 0. Для получения решения поставленной задачи — нахождения решения уравнения B4,1),- удовлетворяющего системе условий
S 241 .ORIUrR Р1Ч11ЕНИП УРАВНЕНИЯ ДАЛАМВКРЛ QO B4,2) — B4,4) (именуемой в математической физике задачей Коши), — удобнее всего воспользоваться методом интеграла Фурье1). Представим векторный потенциал и плотность тока в виде трехкратного интеграла Фурье: iktt)e-*'dk, B4,5) {k,t)e-^dk. B4,6) При этом фурье-изображения вектора-потенциала и плотности тока даются формулами обращения: а (к, t) =? -^ j A (г, t) е-*' dr, B4,7) Р (*, t) = -~i; J j (r, t) e'"r dr. B4,8) Подставляя B4,5) и B4,6) в B4,1), находим -^ + k2c2a = 4мр. B4,9) Уравнение B4,9) представляет уравнение в полных произ- производных, и его общее решение может быть получено без труда. Подстановка B4,7) в начальные условия B4,2) и B4,3) дает а = 0 при * = 0, B4,10) ¦§- = 0 при / = 0. B4,11) Решение уравнения B4,9) с начальными условиями B4,10) и B4,11) гласит2): t in{ftc(f-U}d6. B4,12) Для получения функции А это значение а должно быть под- подставлено в B4,5). Тогда имеем ц -ir. B4,13) ') Р. Курант и Д. Гильберт, Методы математической физики, т. II, Гостехиздат, 1945, стр 183, А А. Власов, Макроскопическая электродина- электродинамика, Гостехиздат, 1955, стр 166 2) В. И. Смирнов, Курс высшей математики, Гостехиздат, т. II, 1951, стр 95.
100 ЭЛГКТРОМЛПШТНОЕ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ [Гл IV Вместо фурье-изображения р в B4.13) следует ввести плотность тока /. С помощью B4,8) находим t f 1 r'd%. B4,14) о В формуле B4,14) должно быть проведено интегрирование по переменным | и к. Изменим порядок интегрирования, написав = -± j dr> Вычислим внутренний интеграл. Имеем Ге-«(г-г'I1 {fee (t-D) dk k _ J e-«fc I r-f I cos 0 si" (M* ~ EH . k2 dk sif — О Г Sil Ho я +1 Г Г I л-ift Iг-r' I cos 6„in ft//fl — I л-fft I r-r'\U(Ju = О Поэтому OO J 0 ]]J 0 где через / обозначен интеграл: oo oo smaks'm$kdk = Y \ cos(a — о о
§ 2-я Общее решение уравнения дАЛАМвпрл Ю1 При вычислении / мы воспользовались одним из определений дельта-функции, данных в приложении III. Находим окончательно Г _rft (Г_г) sin {kc (t - Подставляя это выражение в B4,15), получаем] t Найдем интеграл по переменной |, воспользовавшись свой- свойствами 6-функции. Рассмотрим первый интеграл: t \j{rf, t)b[c{t -I) -\r-r>\]dl = т Т ct-\r-r'\ При этом за новую переменную мы выбрали и = c(t — g)—• -k-r'|. I г — Г' I Если имеет место неравенство ? >-* , можно расши- С рить пределы интегрирования, как это и было сделано. Если же t<- -, то интегрирование велось бы только по от- отрицательным значениям переменной и (оба предела отрица- отрицательны) . Точка ,м,= 0 в которой б(«) обращается в бесконечность, лежала бы Ьне области интегрирования, и в силу A11,3') ин- интеграл обратился бы в нуль. Это относится, в частности, к моменту времени t = 0, что отвечает выполнению начального
1Q2 ЭЛИКТРОМАГЛИТНОЕ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ [Гл TV условия B4,2)> Аналогично второй интеграл даех i I -г'| Действительно, в этом случае точка и = 0 оказывается вне об- области интегрирования Итак, мы получили ' 1) с J !/•-/¦' АЦ-'О-Т) \r-r'\ ldr'> <24'16> т е известно^ уже выражение для запаздывающего потенциала Опережающему потенциалу отвечало выражение со второй дельта-функцией Опережающий потенциал не дал никакого вклада в вектор-потенциал только потому, что при получении решения B4,12) уравнения B4,9) мы воспользовались началь- начальными условиями B4,10) и B4,11), что и определило вид a(k, t). Если бы мы написали общее решение уравнения B4,9), не задаваясь начальными условиями, в окончательное выражение для потенциала вошла бы линейная комбинация запаздываю- запаздывающего и опережающего потенциалов, а также общее решение однородного уравнения Для дальнейшего нам понадобится выражение для потен- потенциала в специальном случае, когда зависимость j{r, t) от вре- времени выражается простым гармоническим законом* /(г, О-/о(г)е"*. B4,17) Подстановка в B4,16) дает _ — i - А (г, 0 = ~ем J \Г_Г'{ dr' = Ао(г)е™К B4,18) Как и следовало ожидать, вектор-потенциал зависит от вре- времени по тому же закону, что и ток Амплитуда А0(г) равна, очевидно, А (г) = | J МГ')'Г_СГ,1 dr'. B4,19) С другой стороны, подставляя B4,17) и B4,18) в B4,1), имеем "тЛ0=-1~Л- B4,20)
Таким образом, формула B4,19) лает реиГеиие ур'авнения- B4,20), которое встретится нам в дальнейшем Заметим в заключение, что решение уравнения Пуассона является частным случаем пбслеДнёй задачи Пблагая в B4,20) и B4,19) о> — 0, приходим к соотношениям- Выражение B4,22) может быть получено и прямым реше- решением B4,21) с помощью разложения в интеграл Фурье Дек- ствитечыю, полагая
104 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ [Гл. IV § 25*. Поле произвольного движущегося точечного заряда Важным примером применения формулы запаздывающих потенциалов является случай одиночного точечного заряда, со- совершающего произвольное движение. Если скорость заряда равна vo(t), то его координата ro= lvQdt. Плотность заряда и плотность тока можно написать в виде р = еб (г' - r0), J = pv0 = еб (г' - r0) v0 (t). Тогда получаются следующие выражения для запаздывающих потенциалов: л (г л-в Г b(r'~ro{x))^(i)dV _ А[Г' 1) ~ 7 J \г-г'\ _ е Г \ °\ J Ф(г, t) = e J Поскольку r0 является функцией времени запаздывания I г — г' I t — -, в формулах B5,1) и B5,2) в подынтегральной С функции нельзя непосредственно воспользоваться свойством дельта-функции и положить г' = г0. Для выполнения интегриро- интегрирования введем новые переменные: /я = х' — *о(т), 1у~Уг — Уо(х), /z = z' — zo(t) Вычисление якобиана для перехода к новым переменным в общем случае довольно громоздких выкладок. Мы для про- простоты положим, что заряд движется вдоль оси Хо, так что vx = vq. Тогда имеем dlx _ . _ дх0 . дх„ дх дх1 дх' "*' дх дхГ ** \r~r'\\ . vo 1 — 1 -- dly д1г W dlz n. dlz dxf u> di/
§ 25] ПОЛС ПРОИЗВОЛЬНО ДВИЖУЩЕГОСЯ ТОЧЕЧНОГО ЗЛРЯДЛ ЦM Якобиан равен, таким образом, д (tx, ty, lz) , dtf.y.z') l c\r-r'\ • Аналогичное вычисление при произвольной ориентации ско- скорости приводит к выражению: д AХ, 1У, h) Mr-П l d{x',!/,z') ~l c\r-r'\ ¦ Поэтому можно написать * , л , j , д^-У1'2') ., ., 1, dlxdlydlz di dx d» dz " HiJl) dl*dl»dl> = ¦ *{rn = , vo(r~r') ' c|r-r'( c\r-r'\ Преобразуя выражения B5,1) и B5,2) к новым переменным, получаем Air i\ — — А{г' °" о еР0 (т) где через R(i) обозначен радиус-вектор, проведенный от точки мпювенного положения заряда до точки наблюдения, т. е. /?(т) —г — г0. Значение мгновенного положения заряда должно быть взято в момент времени t: Значение мгновенной скорости vo(x) также берется в момент времени г. Аналогично •• B5,4) Между ф и А имеется соотношение B5,5)
Потенциалы поля произвольна движущеюся точечного за- заряда B5,3) и B5,4) носят название потенциалов Лиенара — Вихерта Если ввести сокращенное обозначение Ю6 ЭЛГКТР,ОМАГНИТН<>Р, ПОЛИ ДВИЖУЩИХСЯ ЗАРЯДОВ [Гл IV то потенциалы Лиеиара— Вихерта г^риобретут вид Важно отметить, что потенциалы Лиенара—Вихерта характе- характеризуют поле точечного заряда в самом общем виде — при про- произвольных значении скорости и характере движения. Нетрудно заметить, что при скорости заряда у0, весьма малой по сравнению со скоростью света, т. е прин-^ >0, вы- выражение для скалярного 'потенциала ср переходит в формулу B0,2), а вектор-потенциал А оказывается малым. Однако при выводе потенциалов Лиепара — Вихерта мы не накладывал.! никаких ограничений на 'величину скорости. Именно поэтому потенциалы Лиенара — Вихерта характеризуют поле точечного заряда в самом общем случае — при произвольном характере и скорости движения. Мы проведем более подробное обсуждение поля заряда, совершающего произвольное движение в § 20 ч. if, поскольку ряд выиодов из формул B5,7) — B5,8) может стать ясным в свете теории относительности. Найдем поле движущегося заряда В формулах производные берутся по координатам точки наблюдения г и времени наблюдения / Между тем, потенциалы ср и А зависят ют г и t сложным образом. Именно', согласно B5,7) и B5,8) они являются функциями величины т, которая в свою очередь зависит от г и Л Поэтому нужно написать
§ 251 ПОЛГ: ПРОИЗВОЛЬНО ДВИЖУЩЕГОСЯ ТОЧЕЧНОГО ЗАРЯДА fO7 Для нахождения -^--воспользуемся определением* = f —, Дифференцирование дает откуда Воспользовавшись тождеством дх dt с dx dt dR(x) dt 1 Л. • 1 ~~ С 1 1 dR(x) dR(x) dx • dx dt • получаем <?r ~ R ¦ *25>У' Следовательно, B5,10) д (?T <?/ 1 tf0/? c« <9t X R h д дт ' Из определения Е и формул B5,7) и B5,8) находим B5,11) Имеем, очевидно, дъ (т) _ doft дх _ R ~а7 dt а/ _ R / с J ^, t дт с с дт J Вычислим теперь grad^. Поскольку X = X(R, x), находим grad Я, = (grad Я.), + ~ grad т,
ДО8 .ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ [Гл IV так как при дифференцировании по R при постоянном т век- top ю0 остается постоянным. Таким образом, v0R vQR в силу B5,13) и B5,10). Для gradt имеем grad r = grad (t - -f) = - ?&*- = - 1 ((grad *), + § grad т), откуда, на основании B5,9), Окончательно, I R VqR v%\ R V + -i—fj^. B5,14) Подставляя в B5,11) значения производных из B5,12), B5,13) и B5.14), приходим к выражению для Е: = ?, + ?2, B5,15) где D)() Iя—г) Аналогично магнитное поле е rot va e Но rot 90 (т) = - [v0, grad т] = - J^L,
5 25] ПОЛЕ ПРОИЗВОЛЬНО ДВИЖУЩЕГОСЯ ТОЧЕЧНОГО ЗАРЯДА Ю9 откуда ~ЪГ + Ь№&™М1 B5,18) Сравнивая формулы B5,18) с B5,15) и учитывая B5,14), на- находим ЦР B5,19) В формулах B5,15) и B5,18) величины v0 и /? следует брать в момент времени т. При этом R(r)—расстояние между положением заряда и точкой наблюдения в момент времени т, H(t)—расстояние от положения заряда до точки наблюдения в момент времени t. За время t — т возмущение электромагнитного поля проходит расстояние R(x). Если заряд движется равномерно, то путь заряда за то же время равен v(t — х). Электрическое поле Е, создаваемое зарядом, естественно распадается на две части. Первая, Ей зависит от скорости за- заряда v0, вторая, Е%, — от его ускорения v0. В случае равномер- равномерного движения вторая часть поля отсутствует. Величина \Е\\ на больших расстояниях от заряда убывает с расстоянием по закону Из B5.16) следует, что Et всегда имеет компоненту, направ- лепн ю по вектору R. Наконец, при v0 < с, как легко видеть, Р eR т. е. переходит в выражение B0,4) для поля медленно движу- движущегося заряда. Второе слагаемое в иоле, как видно из B5,17), всегда пер- перпендикулярно к радиусу-вектору R(x), т. е. имеет характер поперечного поля. Оно перпендикулярно также и к ускоре- ускорению Vq, Вторая часть поля на больших расстояниях от заряда убывает по закону \b\~i- Таким образом, на больших расстояниях Е ~ Е2. При v0 <C с из B5,17) находим
ПО ЭЛГКТРОМ^ГНИТНОГ ПОЛЕ ДВИЖУЩИХСЯ ЗАРЯДОВ [Гл IV» Смысл этого слагаемого будет ясен из дальнейшего (см* § 26-27). Магнитное поле движущегося заряда, согласно B5,19), всегда перпендикулярно к электрическому полю и радиусу-век- радиусу-вектору R По абсолютной величине напряженности электрического» и магнитного полей на больших расстояниях от заряда равны. между собой. \Е\ = \Н\. При выводе B5,15) — B5,18) мы не делали никаких допу- допущений о малости у по сравнению с с. Тем не менее, формулг* теряют всякий смысл, если попытаться положить в них v0 > с: при этом изменился бы знак у поля, т. е. оказалось бы, чти положительный заряд создает такое поле, какое должен создаг вать отрицательный заряд. Это означает, что при v0 > с полу- полученные соотношения теряют свою применимость. В части II книги смысл этого результата станет очевидным. Там же мы покажем, что найденные здесь соотношения действи- действительно справедливы при любых возможных скоростях дви- движения.
ГЛАВА V ТЕОРИЯ ИЗЛУЧЕНИЯ § 26. Потенциалы электромагнитного поля вдали от излучения в дипольном приближении Общие формулы для запаздывающих потенциалов, получен- полученные в § 23, весьма сложны. Действительно, поскольку входя- входящие в B3,22) и B3,23) выражения для плотности заряда и плотности тока, являются функциями времени запаздывания, для вычисления потенциалов в момент времени / необходимо в соответствующих интегралах брать значения этих величии в разные моменты времени в каждой точке системы Поэтому, кроме рассмотренного в предыдущем параграфе случая единич- единичного точечного заряда, не удается получить конкретных точных выражений для потенциалов с помощью общих формул B3,22) и B3,33). Если, однако, точка наблюдения находится достаточно да- далеко от системы движущихся зарядов, так что jr|3>I/, где- U ~ jV"|1/3— характерный линейный размер системы, то вы- выражения B3,22) й B3,23) допускают упрощения. Именно, вы- выражение | __ ,. можно разложить в ряд, как это было сде- сделано при вычислении полей неподвижных (§ 15) и медленна движущихся (§ 21) зарядов. Тогда получаем где г — расстояние от точки наблюдения до начала координат. Необходимо подчеркнуть, что J р(г', х)(№фе, т. е. не является полным зарядом системы. Действительно, значение
112 ТЕОРИЯ ИЗЛУЧЕНИЯ [Гл. V плотности в этом интеграле зависит от аргумента x — t — и представляет сложную функцию координат г', г с и времени. Время запаздывания для каждой точки в объеме V различное. По этой причине интегралы в B6,1) не могут быть вычислены в общем виде. Дальнейшее упрощение возникает в том случае, если вме- вместо различного времени запаздывания для каждой точки си- системы ввести одно общее время запаздывания для всей си- I г — г'\ стемы. Именно, написав аргумент x = t в виде С мы видим, что полное время запаздывания ——— слагается С из двух частей. Первая из них, равная —и именуемая временем запаздывания системы, представляет время, требующееся для распространения электромагнитного поля от начала координат г'г до точки наблюдения. Вторая часть, равная и именуемая СГ собственным запаздыванием, также имеет простой смысл: это время, которое требуется для распространения поля в пределах системы. По порядку величины —~ —, и при |r|t?> U соб- \г'\ Z С ственнос запаздывание —^- по абсолютной величине мало по сравнению с -—-. Это еще не означает, однако, что плотность за- С ряда можно разложить в ряд по малому параметру , написав Р (f, т) = р [rr, t - |r~r ') = dp r'r дх сг г г л (ff т \ сок ч\ Действительно, если за время, равное времени собственного за- запаздывания —, конфигурация зарядов в системе успеет за- заметно измениться, т. е. если за это время заряды успеют заметно передвинуться в системе, то плотность заряда в мо- момент времени / будет существенно отличаться от плотно-
§ 26] ПОТЕНЦИАЛЫ ПОЛЯ ВДАЛИ ОТ ИЗЛУЧАТЕЛЯ 113 г r'r сти заряда в момент времени?—~-\ . Иными словами, С СГ плотность заряда р будет быстро изменяющейся функцией своего аргумента, и пользоваться равенством B6,3) недопу- недопустимо. Для того чтобы это равенство имело место, необходимо, „ r'r чтобы за время , в течение которого поле, распространяю- распространяющееся со скоростью с, прошло по системе, заряды в системе, движущиеся со скоростью v, не успели заметно сдвинуться. За r'r r'r U г. время заряды проходят путь порядка v ~»—. Если сг сг с этот путь мал по сравнению с размерами системы, можно счи- считать, что за время собственного запаздывания расположение зарядов в системе не успевает измениться. Таким образом, можно считать, что при v Щ. « V, или при скоростях движения, удовлетворяющих неравенству v < с, B6,4) изменение конфигурации за время собственного запаздывания мало. При этом р(г', т) является медленно изменяющейся функ- функцией своего аргумента. Это значит, что малым изменениям т отвечают малые изменения р и можно пользоваться разложе- разложением р по степеням малого запаздывания. Подставляя B6,3) в B6,1) и ограничиваясь членами разложения, содержащими наименьшие степени — , находим «р « J (i + ??-) (р {г', т0) + ^- р (г', т.,)) dV - = J Л. { г'р (г', т0) dV'. B6,5) где я = —. Слагаемое —j-p(r', т0) мало по сравнению со сла- гаемым —¦$¦ р (г', т0) на достаточно большом расстоянии от си- системы. В формуле B6,5) сделано весьма существенное упрощение по сравнению с B6,1), поскольку плотность заряда во всех точках системы берется в один и тот же момент времени 8 В. Г. Левич, том I
Ц4 ТЕОРИЯ ИЗЛУЧСНИЯ [Гл V Первое слагаемое в B6,5) имеет простой смысл: р (г', ти) = = p(r', t — —) представляет плотность заряда в системе н мо- мент времени т0. Интеграл Г р(г', то)й?У дает полный1 заряд си- системы. Для электронейтральной системы он равен нулю. В этом случае имеем ч> {r> t] = IF I г'р (г'< То) dy'- B6>6) Интеграл в правой части формулы B6,6) перепишем, вое- пользовавшись уравнением непрерывности E,3): J г'р (г'( т0) rfV" = J r' ^- ^- rfK' = - J r' div/(rr, Последний интеграл удобно вычислить в координатном пред- представлении: где х\ и .Vj — границы области движения зарядов, на которых плотность гока обращается в нуль, так что Соответственно в векторном виде получим jVp(r', xo)dV'= jjdV. B6,7) Подс1авлян B6,7) в B6,6), находим скалярный потенциал в зависимости от плотности тока в системе Ф(г, /) = -?-J./(/", T0)rfV'. B6,8) Аналогично можно получить выражение для вектора-потен- вектора-потенциала, разлагая в ряд выражение -.—^-тт в формуле B3,23) и пренебрегая собственным запаздыванием: xu)dV. B6,9) Сравнивая B6,8) и B6,9), находим, что между ф и А суще- существует простая связь: Ф = Лл. B6,10)
4 °6] ПОТЕНЦИАЛЫ ПОЛЯ ПДЛЛИ ОТ ИЧЛУЧМЕЛЯ J E Интеграл | r'p(r', ro)dV имеет простой смысл. Действительно, из определения дипольного момента A5,14), мы видим, что J JdV = | г'р (г', т0) dK' = ?- J г'р (г', т„)dV" = d (т0), B6,11) где d(xa)—производная дипольного момента по времени, взя- тая в момент времени то. При этом мы воспользовались тем, что г'—независимая переменная интегрирования, не зависящая ОТ Тр. С помощью B6,11) выражения B6,8) и B6,9) можно пред- представить в виде B6.13) Мы видим, что в том приближении, когда можно пренебречь собственным запаздыванием, потенциалы поля вдали от си- системы определяются значением производной по времени от ее дипольного момента. Поэтому такое приближение при вычисле- вычислении потенциалов поля называется дипольным приближением. Условием применимости дипольного приближения является вы- выполнение неравенства B6,4). В динолыюм приближении потенциалы поля вдали от элек- электронейтральной системы убывают по закону 1//", в то время как аналогичный электростатический потенциал электроней- тралыюй системы неподвижных зарядов, обладающей диноль- ным моментом, изменяется по закону 1/г2. Легко проверить, что для потенциалов, найденных в диполь- ном приближении, выполнено условие Лоренца: Как и при вычислении B6,5), второй член, в сумме пропорцио- пропорциональный 1/л2 и малый по сравнению с первым, пропорциональ- пропорциональным 1/г, может быть опущен. Мы видим, что при дифференци- дифференцировании по координатам вдали от излучателя величину 1/г можно считать постоянной. Далее, по формуле A,39) имеем
как и должно было быть. Полученные результаты имеют простой и весьма важный смысл: при движении зарядов в системе (изменении ее диполь- ного момента во времени) в окружающем пространстве возни- возникает электромагнитное поле. Потенциалы этого поля сравни- сравнительно медленно (по закону 1/г) убывают с расстоянием от сн- етемы и зависят от времени. Система неравномерно движущихся зарядов является излу- излучателем. В последующих параграфах мы рассмотрим более подробно поле излучения и свойства излучающих систем. § 27. Электромагнитное поле дипольного излучения вдали от излучателя Зная распределение потенциалов, можно найти значения магнитного и электрического полей. Имеем При вычислении ротора вдали от излучателя следует прово- проводить вычисление так же, как и при вычислении дивергенции в формуле B6,14): при дифференцировании по координатам мно- множитель — следует считать постоянным. Тогда по формуле A,40) находим Мы опустили значок т0 при d. Однако здесь и во всех дальней- дальнейших соотношениях этого параграфа d является функцией аргу< , г мента то = г —- . Для любой функции запаздывающего аргумента t — — имеем
$ 27] ПОЛЕ ДИПОЛЬНОГО ИЗЛУЧЕНИЯ ВДАЛИ ОТ ИЗЛУЧАТЕЛИ где положено df = df дт0 _ » dt дт0 dt '• Поэтому для электрического поля можно написать ИГ = 1 {га (пА) - Л} = I [ [Ля] и] = -^ [ [rf/i] я]. B7,2> Сравнивая B7,2) с B7,1), мы видим, что векторы Е и Н свя-1 заны между собой соотношением Е = [Ял]. B7,3) Напряженности электрического и магнитного полей зависяг от координат и времени по закону: Как мы видели в § 23, последняя формула является выраже-1 нием сферической волны. Амплитуда волны уменьшается вдали от излучателя по закону ~—. При этом векторы электрическо- электрического и магнитного полей равны ме- между собой по абсолютной вели- величине, а по направлению перпен- перпендикулярных друг к другу и к радиусу-вектору г. Область вдали от излучателя, в которой электромагнитное по- поле описывается сферическими волнами, носит название волно- волновой зоны. Несколько ниже мы уточним это понятие. Введем сферическую систему координат г, 9, \|) (рис. 6) с по- полярной осью, ориентированной по вектору А. Направление вектора Н определяется вектором [я, df], направленным по касательной к линии широты на поверх- поверхности сферы и ориентированным в сторону убывания азимуталь- азимутального угла у, так что Рис. 6. - d sin 9.
[18 TFC-РНЯ ИЗЛУЧЕНИЯ [Гл V Поэтому вектор Н имеет в сферической системе координат слс* дующие проекции: Я, = 0; Яе = 0; #+ = ^-sin8. B7,4) Вектор Е направлен перпендикулярно к векторам Я и л по касательной к линии долготы и ориентирован в сторону убыва- убывания полярного угла 9. Его проекции равны , = 0. B7,5) Формулы B7,4) и B7,5) показывают, что напряженности лсля имеют наибольшее значение при 6=-^ (в экваториаль- экваториальной плоскости) и убывают до нуля по мере приближения к по- полярной оси. Вычислим вектор Пойнтинга излучающей системы: = сип, = -^ \Anfn = -^ [ndfn. B7,6) Вектор Пойнтинга оказывается направленным по радиусу-векн тору и но абсолютной величине равным То обстоятельство, что вектор Пойнтинга отличен от нуля и всегда направлен от излучающей системы, имеет очевидный смысл: имеется поток электромагнитной энергии, излучаемой системой в окружающее пространство. Формула B7,7) опреае- ляет плотность потока излучаемой энергии в зависимости or ориентации в пространстве (угла G) и расстояния до излучаю- излучающей системы. Наличие потока энергии оправдывает введенные нами раньше термины поля «излучение» и «излучатель». Подчеркиваем, что, как видно из B7,6), при фактическом наблюдении излучения в некотором направлении п играет роль только значение компоненты вектора второй производной от дн- полыюго момента (d) в плоскости, перпендикулярной к п. Поток энергии через векторную площадку dS, стягивающую телесный угол dil, называется интенсивностью излучения в телесном угле dQ. Для интенсивности излучения dl можно на- написать sin36 dddy = ig?- dQ. B7,8)
(И Р \ — -jT-J — убыль 'энергии излучающей системы за 1 се- секунду. Интенсивность излучения в дипольном приближении опре- определяется только значением d{t ). Иными словами, в мо- мент времени / значение / в данной точке зависит от вели- величины d в предыдущий момент времени t . В остальном же интенсивность излучения не зависит от расстояния(ДО излучаю- излучающей системы, как это и следовало ожидать на основании закона сохранения энергии: поток энергии, проходящий в единицу вре- времени через любую замкнутую поверхность, окружающую излу- излучающую систему, имеет одно и то же значение. В заключение укажем на соотношение, имеющее место для плотности энергии и импульса излучения. В силу формул B7,6) и A3,11) можем написать ? = 7а=Т"' <27'10> С этим важным соотношением мы неоднократно будем встре- встречаться в дальнейшем. Мы видим, что при излучении излучающая система теряет не только энергию, но и импульс, которые превращаются в энер- энергию и импульс излучения. § 28. Дипольное излучение простейших систем В качестве примера использования формул дипачьного излу- излучения рассмотрим несколько простейших систем. Для одиночного заряда, получающего ускорение под дей- действием силы F, можем написать F B8,1) где г = w — ускорение, с которым движется заряд. Поэтому Полный поток энергии, излучаемый системой, именуемый обыч- обычно полной интенсивностью излучения, равен
120 ТЕОРИЯ ИЗЛУЧЕНИЯ [Гл. V Поток энергии в направлении вектора ускорения (9=0) от- отсутствует и имеет наибольшую величину в направлении, пер- перпендикулярном к вектору ускорения 16 = у). Полная излучае- излучаемая за единицу времени в телесном угле dQ энергия (полная интенсивность излучения в угле dQ) равна edQ B8>3> и пропорциональна квадрату ускорения. Полная интенсивность, излучаемая одиночным зарядом во всех направлениях, равна (см. B7,9)) /-fir-. <28-4> Она определяется величиной квадрата ускорения и квадрата заряда. Мы видим, что всякий заряд, движущийся ускоренно, излу- излучает энергию в виде электромагнитных волн. Применение формулы B8,2) к единичному заряду требует некоторого пояснения. При выводе формулы B7,6) производи- производилось разложение по малому параметру — собственному времени запаздывания, который теряет смысл в случае системы, состоя- состоящей из одного заряда. Однако в § 25 мы нашли выражения для потенциалов поля произвольно движущегося одиночного заряда. Если заменить в B5,7) evo= J pvodV= jjdV = d и рассмотреть случай движения со скоростью, малой по сран» нению со скоростью света, так что Я(т)~/\ то выражение для вектора-потенциала точечного заряда будет тождественно с формулой B6,13). i Таким образом, вдали от медленного движущегося заряда его поле будет совпадать с полем системы зарядов в дипольном приближении. Вычислим еще потерю импульса излучающей частицей. В силу формул A3,11) и B8,2) мы видим, что полная потеря импульса заряда при излучении JrfQ = 0. B8,5) Смысл этого результата заключается в том, что излучение за* ряда под углами 0 и я— 0 одинаково. Импульсы излучения в противоположных направлениях взаимно компенсируются. Под- Подчеркнем, что формулы B8,4) и B8,5) относятся к заряду, кото-
§ 28] ДИПОЛЫЮЕ ИЗЛУЧЕНИЕ ПРОСТЕЙШИХ СИСТЕМ 121 рый в момент излучения покоился. Только для такого заряда имеет место соотношение B8,1). Рассмотрим несколько простейших примеров расчета излу- излучения движущегося одиночного заряда. Пусть, например, заряд движется в однородном магнитном поле. Для простоты будем считать, что начальная скорость за- заряда v0 перпендикулярна к вектору И. Движущийся в магнит* ном поле заряд обладает ускорением т тс и соответственно этому непрерывно получает электромагнитные волны. Полная интенсивность излучения равна l <28>6> Если считать потерю энергии малой, то можно приближенно считать скорость заряда постоянной: v «* v0. При этом [vH\ & « [vQH] » vqH. Поэтому 4 Излучаемая энергия обратно пропорциональна с5 и весьма мала. Однако она растет с энергией и эффект излучения стано- становится существенным при очень больших энергиях частиц, на- например, для частиц космических лучей в магнитном поле Земли или быстрых электронов, движущихся в магнитных полях со* временных бетатронов. Расчеты показали, что именно потери энергии на излучение в магнитном поле являются основным источником потерь, определяющих достижимые энергии частиц в бетатроне. Следует, однако, иметь в виду, что формула B8,6) применима лишь при скоростях у «С с. Случай v ~ с будет нами разобран в § 26 ч. II. В качестве второго примера рассмотрим излучение заряда, колеблющегося по гармоническому закону: г = r0cos((»o/ +;<*). B8,7) Ускорение заряда равно г = -&2ог= - ®lrQ cos ((at + а). B8,8) Поэтому интенсивность, излучаемая в телесном угле dQ, равна 4
122 TFOPHfl ИЗЛУЧЕНИЯ [Гл V; Средняя (за.один период) интенсивность излучения в угле dil ^ B9,9) Формула B8,9) определяет, в частности, угловое распределение излучаемой интенсивности. Полная интенсивность, излучаемая осциллятором, дается формулой Осциллятор излучает электромагнитные полны, частоты кото- которых совпадают с его собственной частотой о>о. Интенсивность излучения пропорциональна квадрату амплитуды и четвертой степени частоты. Особая важность этого примера заключается к следующем В начале развития электронной теории была предложена известная модель атома Томсона. Предполагалось, что электрон находится в центре сферы, образованной непрерывно распре- распределенным положнтблмшд! зарядом. Излучение атома в модели Томсона связывалось с малыми колебаниями электрона около положения равновесия в центре атома Таким образом, атом как излучающая система 'сводился к излучающему осциллятору, и формула -B8,10) давала интенсивность атомного излучения. В 1911 г. опыты Резерфорда показали непригодность модели Томсона и ана была оставлена Однако оказалось, что гармони- гармонический осциллятор как модель излучающей атомной системы приводил- в* ряде случаев к совершенно правильным результа- результатам, находившим подтверждение на опыте. Важнейшим из них является существование определенных частот оH излучения, ха- характерных для данного атома. Поэтому осциллятор оставался в классической физике моделью излучающей атомной системы, хотя в рамках классической теории невозможно было попять, почему такая далекая от действительности модель может пра- правильно передавать важные особенности атомных излучателей. Ситуация была разъяснена с появлением квантовой теории из- излучения. В квантовой механике мы увидим, что квантовая тео? рия излучения приводит в ряде случаев к соотношениям, фор- формально совпадающим с выражениями, полученными для клас- классической модели излучателя. Причина такого совпадения, грубо говоря, заключается в следующем: ряд свойств атомных излу- излучателей определяется не конкретным законом движения излу- излучающих частиц, а фактом периодичности процесса С другой стороны, круговому йериодическому движению электрона с по-
§ 29] РЕАКЦИЯ ИЗЛУЧРППЯ J3- стоянкой угловой скоростью отвечает колебание плоского осцил- осциллятора ( Поэтому модель осциллятора, колеблющегося с частотой м<* передает некоторые характерные черты атомного излучателя. Мы будем учитывать это обстоятельство и в дальнейшем под- подробно разбирать свойства осциллятора как классической модели атомной излучающей системы. С другой стороны, мы увидим на ряде примеров, что классическая электродинамика непосред- непосредственно неприменима к внутриатомным процессам и приводит к соотношениям, количественно и даже качественно противоре- противоречащим опытным данным. Рассмотрим теперь систему, состоящую из двух частиц с зарядами е\ и ег и массами т.\ и т.^. Для такой системы й = ехгх + e2r2 = е,зд>, + e2w2. Если система из двух частиц является замкнутой, ускорения могут быть написаны в виде F F 1 nil г т2 где F — сила взаимодействия между частицами. Поэтому и интенсивность излучения в угле dQ Важнейшим следствием формулы B8,11) является утвер- утверждение, что система, состоящая из одинаковых частиц, или си- система из различных частиц, но имеющих одинаковые'отношения elm, не может излучать в диполыюм приближении. Для нахо- нахождения излучения таких систем необходимо учитывать эффекты старшего порядка (см. § 32). § 29. Реакция излучения Мы видели в предыдущих параграфах, что одиночный заряд,, движущийся ускоренно, теряет энергию на излучение. При со- составлении баланса энергии частицы, движущейся под действием внешних сил, необходимо учитывать потери на излучение. Мы видели также, что поле излучения обладает не только энергией, но и импульсом. Благодаря этому, излучение сопро- сопровождается обратным силовым воздействием испускаемого поля на частицу. Это воздействие излучаемого поля на собственное движение частицы называется реакцией излучения.
124 ТЕОРИЯ ИЗЛУЧЕНИЯ [Гл V Баланс сил с учетом действия излучения должен быть на-1 писан в виде mw = р + Fs = J p(e + -^-)dV + Fs. Первое слагаемое представляет внешнюю силу, действующую на частицу, a Fs— силу реакции излучения, именуемую также силой лоренце'ва торможения. Для вычисления силы реакции Fs можно, в принципе, посту- поступить следующим образом. Представим, что излучающий заряд распределен в пространстве. Разбив его на элементы бе и бе', можно вычислить действие поля, излучаемого элементом бе', на элемент бе. Просуммировав затем по всем элементам бе' и бе, мы найдем искомую полную силу самодействия. Описанное вычисление'является довольно громоздким1). Кроме того, оно может быть проведено лишь на примере модели, ценность ко- которой с точки зрения современной квантовой теории весьма невелика. Мы остановимся поэтому на другом рассуждении, приводящем к тому же выражению для силы F,. Предположим, что сила лоренцева торможения Fs мала по сравнению с внешними силами. Смысл такого предположения мы подробно обсудим ниже, когда найдем Fs. Если это допу- допущение выполнено, то в первом приближении заряд совершает движение под действием сил внешнего поля F. При движении он излучает энергию, определяемую формулой B7,9). Допустим, кроме того, что заряд совершает периодическое движение или, в более общем виде, в некоторый момент вре- времени ^i возвращается в исходное состояние движения, в кото- котором он находился в начальный момент времени to- Составим баланс энергии для системы, состоящей из заряда, совершаю- совершающего подобное движение, и внешнего электромагнитного поля. Очевидно, что если бы заряд ничего не изучал, то по возврат щении его в исходное состояние полная работа, произведенная л над ним внешним полем W= I Fvdt, была бы равна нулю; и было бы равно нулю и изменение энергии Д?Вн поля внешнего поля. Если в следующем приближении учесть, что полная сила, действующая, на заряд, слагается из сил F и Fs, то можно написать баланс энергии в виде 1) В Гайтлер, Квантовая теория излучения, ИЛ, 1956, стр 41.
§29] РЕАКЦИЯ ИЗЛУЧЕНИЯ 125 где АЕ-*.энергия, излученная зарядом за время (ti — to). Учи- t, тывая, что в силу сказанного Д?вн. пош = Г Fvdt = 0, можно на- писать J"/>Л = ДЕ =--§--? jw4t. B9,1) Интегрируя правую сторону по частям, получаем Поскольку в момент t\ состояние движения совпадает с состоя^ иием движения в момент /0, так что vt, =»t,, wti —wt[, имеем и и Приравнивая подынтегральные выражения, находим1 * $~ з с3 з с3 * \*-*,*i Сила реакции излучения оказывается зависящей от произ- производной ускорения частицы. Согласно сделанному предположе- предположению, сила реакции излучения Fs мала по сравнению с внешней силой, действующей на частицу, так что под w в B9,1) нужно понимать ускорение частицы во внешнем поле сил. Если бы это было не так, т. е. если бы, например, выполнялось обратное неравенство FS^F, то уравнение движения имело бы вид с- 2 е2 • Его решением служит Последняя формула показывает, что под действием обратной ре- реакции излучения ускорение экспоненциально возрастает во вре- времени— частица саморазгоняется. Такой саморазгон противоре- противоречит как законам классической механики, так и всем опытным данным. Таким образом, допущение |Fs|l!S>|F| приводит к физически бессмысленному результату. Наоборот, при |Fs|<cjF| величину w можно' с достаточной степенью ' точности считать равной
126 ТЕОРИЯ ИЗЛУЧ1 НИЯ |Гл V ускорению bo внешнем поле, приобретаемому частицей под действием лоренцевои силы F. Считая последнюю периодической функцией времени с частотой ю, можем, очевидно, написать для абсолютной величины F, следующее выражение Поэтому условие применимости выражения B9,3) для реакции излучения |/M<§;|Fj приобретает следующий вид: 5-«1- B9,4) Невыполнение неравенства B9,4) означает, что реакция излу- излучения не мала, а последнее ведет к физически неверному резуль- результату. Таким образом, неравенство B9,4) имеет фундаменталь- фундаментальное значение для применимости теории излучения И законов классической теории поля вообще Классическая теория поля приводит к разумным результатам, согласующимся с опытными данными, лишь при частотах и <Г — B9 5) Если под т понимать массу элементарного заряда-электрона, то условие B9,5) оказывается выполненным при всех оптических и рентгеновских частотах и даже для не слишком жестких у-пу- чей Однако, как будет подробнее сказано в § 17 ч. II, в случае жестких \-лучей законы классической электродинамики оказы- оказываются более неприменимыми и квантовые эффекты играют основную роль Интересно переписать неравенство B9,5), введя в него длину 2л с полны А, = . Тогда вместо B9,5) имеем X » -Дг = г0. B9,6) Величина го~2,5-10~13 см по причинам, которые будут выяснены в § 13 ч II, называется классическим радиусом электрона Неравенство B9,6) можно интерпретировать следующим образом: у электромагнитных явлений в масштабах ~г0 реак- реакция излучения становится не малой по сравнению с другими силами. При этом соотношения классической теории поля ока- оказываются неприменимыми Таким образом, в классической тео- теории поля имеется внутренний предел применимости — ола при- пригодна к рассмотрению явлений, разыгрывающихся в области пространства протяженностью порядка классического радиуса электрона. В дальнейшем мы увидим, что фактическая область применимости классической теории поля не простирается до
<i 30] ШИРИНА I'^VMAEMbTX ЛИНИИ 127 сюль малых масштабов. Оказывается, что квантовые эффекты, кладущие предел применимости классических представлений к микрочастицам, начинают hi рать роль на расстояниях порядка Л = —, где й — постоянная Планка, равная 1,05 -\Q~27 эрг • сщ Величина Л, равная 2-Ю-10 см, носит название комнтоновскрй длины волны С этой величиной мы столкнемся в § 17 ч. Н» где будет рассмотрен так называемый эффект Комптона. В квантовой механике будет подробно разобран вопрос о границах применимости соотношений классической теории и будет дано доказательство приведенного утверждения. § 30. Ширина излучаемых линий Реакция излучения оказывает существенное влияние > но* свойства излучаемого поля Именно, мы покажем,1 что излу-1 чатель, который без учета действия силы реакции излучал бы- монохроматические электромагнитные волны с частотой1 «о, в действительности излучает совокупность частот близких, ш не равных ы0 Иными словами, благодаря эффекту затухания монохрома- монохроматическое излучение превращается в излучение непрерывного спектра волн со всевозможными частотами Доказательство этого утверждения мы проведем на про- простейшей модели излучающей системы — линейном гармониче- гармоническом осцилляторе Пусть заряженная частица движется под действием квазиупругой силы (—kx) вдоль оси х, так что урав- уравнение ее движения имеет вид или , 2 e2w + Х= — < где о»о — 1/ частота колебании осциллятора в отсутствие силы Fs. Считая Fs малой по сравнению с квазиупругой силой (—kx), можно положить ускорение равным ускорению гармо- гармонического осциллятора без реакции излучения, i. e. w=—(u2qx; w — — и>1х, и написать x+Y* + a>;;x = o, C0,1) где обозначено 4-J-J-- C0,2)
128 ТЕОРИЯ ИЗЛУЧЕНИЯ [Гл. V Решением уравнения C0,1) при y^iao служит выражение х « Хое~ е«Ч C0,3) При этом подразумевается, что в C0,3) и последующих фор- формулах, содержащих комплексные выражения, следует взять вещественную часть. Решение C0,3) отвечает начальному условию: х@)«=х0, х@)=0. Формула C0,3) показывает, что благодаря реакции излуче- излучения, определяемой величиной у, колебания осциллятора имеют затухающий характер. Коэффициент затухания —¦ аналогичен коэффициенту затухания механического осциллятора при нали- наличии силы трения. Это оправдывает второе название силы Fs — силы лоренцева трения. Для нахождения излучения затухающего осциллятора на- напишем его ускорение в виде где А — постоянная (равная, в том же приближении (у <С <во)} A «s — хо«>о). Ускорение затухающего осциллятора не является периоди- периодической функцией времени. Поэтому излучаемые таким осцил- осциллятором электромагнитные волны не имеют определенной ча- частоты. Напротив, в излучении будут представлены все частоты 0<ю< оо. Это означает, что затухающий осциллятор излучает сплошной спектр частот. Нас будет интересовать в дальнейшем распределение энер- энергии в этом спектре, т. е. доля полной энергии, излучаемой ос- осциллятором, приходящаяся на интервал частот а, со + da>. Эта функция /(со), носящая название спектральной функции рас- распределения Лоренца, связана с полной энергией /0, излучаемой осциллятором, /о= J /(«)Ж». C0,4) о Полная энергия, излучаемая осциллятором, равна оо оо оо /0- J /Л—?? J ш2^ = |-? | w4t. C0,5) 0 0 -оо При этом мы распространим пределы интегрирования на об-
5 301 ШИРИНА ИЗЛУЧАЕМЫХ ЛИНИЙ 129 ласть отрицательных времен, поскольку при /<0 осциллятор покоился и подынтегральная функция тождественно равна нулю. Разложим ускорение в интеграл Фурье: C0,8) С другой стороны, сравнивая C0,7) и C0,4) и учитывая, что спектральное распределение определено только для суще- существенно положительных значений частоты, находим / И = -ё -г Х ~гг ¦ C0,9) Спектральные функции распределения для разных значе- значений юо/2у представлены на рис. 7. Они имеют резкий максимум при wkscdo, т. е. при частоте, которая излучалась бы осцилля- осциллятором в отсутствие затухания. 9 В. Г. Леиич, том 1
130 тгория излучения [Гл. V При со = щ ± -|- излучаемая интенсивность равна т. с. вдвое меньше интенсивности в максимуме. По этой при- причине неличина у!2 носит название полуширины излучаемой 2.0 щ линии. Согласно C0,2) полуширине линии у12 отвечает интервал длин волн не зависящий от длины волны и по порядку величины равный классическому радиусу электрона.
5 31] ЭФФЕКТЫ ЗЕЕМАНА И ШТАРКД 131 § 31. Влияние магнитного и электрического полей на излучение (эффекты Зеемана и Штарка). Квадрупольное и магнитное дипольное излучение Важным открытием, сыгравшим существенную роль в утверждении электромагнитной теории света, было обнаружение влияния магнитного поля на излучение, названное эффектом Зеемана. Мы рассмотрим теорию эффекта Зеемана на обычной клас- классической модели атомного излучателя — пространственном гармоническом осцилляторе. Предположим, что излучающий гар- гармонический осциллятор помещен в магнитное поле Н, направ- направление которого выберем за ось г. Уравнения движения осцил- осциллятора в проекциях можно получить, используя выражение для силы Лоренца: х + ®1х = 2со/z/, C1,1) У + «>1у= -2cs>lx, C1,2) z + agz = 0, C1,3) где (Оо — частота колебаний осциллятора в отсутствие магнит- магните/7 ного поля и юл =-jj так называемая ларморова частота. Уравнение C1,3) показывает, что в направлении поля ча- частота колебаний не изменяется. Будем искать решение уравнений C1,1) и C1,2) в виде Подстановка в C1,1) и C1,2) дает Приравнивая нулю детерминант системы, находим (©2-©2J=4©;ffl2, откуда ю2 + 2aL©, — со^ = О, ш2! — 2coLcoL, — ©¦¦ = О, где о)| и 0J—возможные значения частоты. Решая эти уравне- уравнения, находим ©,= -(,>, H-l^ + ю2-, C1,4) ©2 = ©L+}/©y+©l\ C1,5)
132 ТЕОРИЯ ИЗЛУЧГНИЯ [Гл. V При этом у корня выбран положительный знак, поскольку ча- частота «—величина существенно положительная. Таким образом, излучение пространственного осциллятора эквивалентно излучению трех линейных осцилляторов: одного вдоль тюля Н с частотой <оо и двух других в плоскости (ху) с частотами coi и юг. Если направление наблюдения перпендику- перпендикулярно к полю Н, например, совпадает с осью х, то наблюдается излучение, определяемое компонентами вектора дипольного мо- момента, лежащими в плоскости уг. В этой плоскости лежат ком- компоненты: dy = еу = -e((a21bleie>-t + (о|&2е/ш<(), dz = ez= -е<й\сеш'*. Таким образом, при наблюдении вдоль оси х должны наблю- наблюдаться три частоты —Mi, шо и «г (так называемый триплет Зеемана). Измеряя расстояние между крайними линиями, (u2-g>i = -— , C1,6) можно определить значение ejm для излучающей частицы. Экспериментально Зееманом было обнаружено, что если пары веществ, находящихся в атомном состоянии, помещены в маг- магнитное поле, то в их излучении действительно наблюдается триплет. Расстояние между крайними компонентами триплета имеет значение, с большой степенью точности отвечающее по формуле C1,6) отношению е/т для электрона. Вскоре выяснилось, однако, что вместо триплета Зеемана в излучении целого ряда атомов в магнитном поле наблюдалась более сложная картина расщепления излучаемых линий. Это явченис, получившее название аномального эффекта Зеемаиа, оказалось встречающимся несравненно чаще, чем нормальный эффект Зеемана. Классическая теория излучения не могла дать удовлетвори- удовлетворительного объяснения аномальному эффекту Зеемана. В квантовой механике мы увидим, каковы причины, вызы- вызывающие аномальный эффект Зеемана, и почему осцилляторная модель атомного излучателя дает правильные результаты для нормального эффекта Зеемана. Рассмотрим теперь вопрос о влиянии постоянного во вре- времени внешнего электрического поля на излучатель. Во внешнем электрическом поле ? уравнения движения гармонического осциллятора имеют вид
§ ЗЦ ЭФФГ.КТЫ ЗППМАНА II ШТАРКА 133 Поскольку на протяжении атомной системы внешнее поле мож- можно считать неизменным и поле постоянно во времени, можно ввести новую координату, г -r-°L • 1 — * 2 • для которой имеем = 0. C1,7) Уравнение C1,7) означает, что гармонический осциллятор при наличии постоянного внешнего поля совершает колебания с той же частотой мо, но около смещенного положения равно- равновесия. В приближении ангармонического осциллятора классиче- классическая теория приводит к изменению излучаемой частоты во внешнем электрическом поле. Однако наблюдавшееся на опыте сложное расщепление линий у атомного водорода (эффект Штарка) получило объяснение только в квантовой механике. Мы видели выше, что в некоторых случаях система зарядов не может излучать в дипольном приближении. Это не означает, разумеется, что такая система вовсе не может излучать. Если в дипольном приближении излучение отсутствует, сле- следует искать старшие члены разложения по степеням собствен- собственного запаздывания в системе, которые будут определять излу- излучение высших порядков — квадрунольпое, октуполыюе и т. п. Мы ограничимся нахождением излучения следующего (после дипольного приближения) порядка. Напишем вектор-потенциал излучающей системы на боль- большем расстоянии от системы в виде, аналогичном B6,5): Г-Д.+Л- C1,8) Первое слагаемое в C1,8) описывает, согласно B6,9), ди- польное излучение. Нас поэтому будет интересовать только вто- второе слагаемое: При этом мы воспользовались тем, что постоянный вектор п и переменная интегрирования г' не зависят от времени, и изме- изменили порядок дифференцирования и интегрирования. Значение Интеграла берется в момент времени то'. =~к ?; J(r'- n)J{r'' dv'-
134 ТЕОРИЯ ИЗЛУЧЕНИЯ [Гл V Преобразуем подынтегральное выражение, симметризовав. его с помощью формулы A,6). Тогда получим ' о J C1,10) Из определения магнитного момента B2,1) следует, что пер- первый интеграл можно представить в виде Чтобы выяснить смысл второго интеграла, удобно перейти от интегрирования к суммированию, спроектировав векторное вы- выражение на некоторую ось а в декартовой системе коордипат: J Uir'n) + r' (jn)}adV = S [e,v1 (r'tn) где 3>„_$ — квадрупольный момент системы, определенный фор- формулой A6,3). По индексу р(Р=*, у, z) производится суммиро- суммирование. Переходя к векторному выражению, мы можем написать J {J(r'n) + г' (jn)) dV = -^ S>, C1,11) где, по определению, вектор $8 равен ^«--¦Ve- <31-12> Тогда окончательно находим для вектор-потенциала A(r, t) = -^ + ~[Mn]+-±? б = Атп + Ам,т.лт1 + Актлр, C1,13) где точкой обозначено дифференцирование по аргументу то, от которого зависят векторы М, d и D. Напряженности полей могут быть найдены с помощью A0 1) и A0,2). В выражении C1,13) первое слагаемое описывает диполыюе излучение. Второе определяется производной по времени от магнитного момента и, естественно, получило наименование магнитного дипольного излучения. Последнее слагаемое содер- содержит вторую производную от квадруп-ольного момента. Оно онре» деляет квадрупольнос излучение.
¦§31] ЭФФЕКТЫ ЗЕЕМЛПА И ШТЛРКА |35 тле L' — характерный размер системы и X — длина волны из- излучения. Поскольку но нашим допущениям v <С с и U <с %, слагае- слагаемые, отвечающие магнитному дипольному и квадрупольному излучениям, весьма малы по сравнению с первым слагаемым, •описывающим дипольное излучение. Это означает, что магнит- магнитное дипольное и квадруполыюе излучения играют роль только для систем, у которых дипольное излучение отсутствует. В об- общем случае нельзя сказать, какое из этих двух слагаемых вно- вносит основной вклад в излучение. Вычислим интенсивность магнитного дипольного и квадру- польного излучений в отдельности. Согласно формулам B7,8) и B7,1), интенсивность магнит- магнитного дипольного излучения Интенсивность магнитного дипольного излучения опреде- определяется точно таким же выражением, что и интенсивность ди- дипольного излучения B7,8), но в C1,14) вместо d стоит М. Полная интенсивность магнитного дипольного излучения по- получается интегрированием C1,14) по всем углам: Интенсивность магнитного дипольного излучения меньше, чем интенсивность дипольного излучения в отношении I— . Подчеркнем, что магнитное дипольное излучение отсутствует у систем, магнитный момент которых пропорционален механи- механическому моменту. Согласно сказанному в § 22, это имеет место для систем с постоянным значением отношения —, а также для
136 ТЕОРИЯ ИЗЛУЧЕНИЯ [Гл. V системы из двух произвольных частиц. В силу последнего, маг- магнитное дипольное излучение отсутствует при соударениях двух частиц. Перейдем теперь к расчету интенсивности квадрупольного излучения. Подставляя значение Д.пядр в общую формулу B7,7) и повторяя вычисления § 27, находим Преобразуем квадрат векторного произведения по формуле A,5) с учетом определения C1,12): [Dnf = (Df - (n&f = S?apS?aYnpn? - ^„в^пая^п^. C1,17) По парным индексам подразумевается суммирование. Угловая зависимость rf/ьвадр оказывается весьма сложной. Однако полное излучение в единицу времени может быть вы- вычислено сравнительно просто. Интегрируя C1,16) с учетом C1,17), получаем поскольку, согласно A6,16), сумма диагональных элементов J&aa всегда равна нулю. При периодическом изменении квад- рупольного момента квалруполыюе излучение оказывается пропорциональным и6. Множитель —j- d C1,21) делает его ий- теисивность весьма малой. Тем не менее существуют системы, для которых квадруиольное излучение играет основную роль. Это, прежде всего, атомные ядра, не обладающие диполыгым излучением (диполытыс моменты ядер, как и всяких других заряженных систем, можно считать равными нулю (см. § 15)). Другим примером может служить система, состоящая из ча- частиц с одинаковыми значениями —.
§ 32] ОБЩИЙ СЛУЧАЙ ИЗЛУЧЕНИЯ 137 § 32. Общий случай излучения — спектральное разложение, волновая и квазистатическая зона, учет собственного запаздывания* Рассмотрим теперь несколько более общий случай излучения системой движущихся зарядов. Не ограничивая общности, можно считать, что плотность тока в системе и плотность заряда допускают разложение в интеграл Фурье: J(rf, t)=\j{r', (o)e^rf(o, C2,1) p(r', 0= Jp(r', ю) <?'"'</«». C2,2) В этих разложениях мы пользуемся нормировкой A1,1) и счи- считаем формально частоту как положительной, так и отрицатель- отрицательной. В действительности частота со — величина существенно по~ ложительная, так что это представление следует дополнить условием: /(г', <о) = /(г',—со). При этом величина /(^,0 будет иметь вещественное значение. Тогда, разлагая в интеграл Фурье потенциалы поля А(г, 0 = J А (г, со) г'»'Ло C2,3) и подставляя разложение C2,1) — C2,3) в уравнение B3,23) для нектора-потенциала, находим откуда для компоненты Фурье вектора-потенциала получаем Аналогично Ф(^ со) = J-^ *-'>"''V'. C2,5) Если плотность тока и плотность заряда заданы как функции координат, то по формулам C2,4) и C2,5) можно найти ком- компоненты Фурье для потенциалов поля точно, не пренебрегая собственным запаздыванием в системе. После этого выражения для самих потенциалов найдутся непосредственно по формуле обращения интеграла Фурье A1,2). Таким образом, можно в принципе найти ноле излучающей системы, не пренебрегая собственным запаздыванием, а также
138 ТЕОРИЯ ИЗЛУЧЕНИЯ [Гл. V на любых расстояниях от излучающей системы. Ниже мы при- приведем простой пример такого расчета. Если нас интересует поле на больших расстояниях от излу- излучающей системы, то, полагая причем \r\~3> \rr\, и вводя величину, именуемую волновым век- вектором, k = — -=—n = kn, C2,6> с г с v ' ' где k — волновое число, fe = ^ = -^L, C2,7> и п — единичный вектор, имеем А (г\ ш) = ?~- J /(г', ш) е-*'' rfK', C2,8> Ф (г', ш) = "—- J р (г', ш) е'*'' dV". C2,9> Часто формулы спектрального разложения применяются к опре- определению поля одиночного заряда. В этом случае можно полу- получить полезное представление А {г', со), заменив компоненту Фурье для плотности тока на саму плотность тока по формуле j(r, ю) = -^- j J{ry и полагая где /?g(t) — мгновенное положение заряда в момент времени ty v dRB dt ф Это дает А(г\ еШг 2ясг оо I ev(t)ec C2.10> Последняя формула позволяет найти компоненту Фурье вектор- потенциала по заданной траектории частицы — зависимости /?о от времени. Величина г представляет абсолютное значение рас- расстояния от заряда до точки наблюдений в момент времени /. Если фурье-компонента вектора-потенциала на большом рас-
•§ 32] ОБЩИЙ СЛУЧАЙ ИЗЛУЧЕНИЯ 139 ¦стоянии от системы зарядов известна, то фурье-компоненты поля найдутся по формулам B7,1) и B7,3). Именно, имеем Л (г, t)= j H(r, ©)е«*Л»-гоМ(г, t) = \[An\ = = -j J (ю [А{г, ю), n]eMda, •откуда H(r, ш) = /[Л(г, со), ft]. C2,11) Аналогично E = {[k[A{r, со), ft]. C2,12) В общем случае излучающая система излучает всевозможные ¦частоты или, как говорят, спектр частот —оо < со < <х>. Часто представляет интерес найти вес различных частот в ¦спектре, т. е. относительную долю энергии, приходящуюся на данную частоту (или, точнее, на частоту, лежащую в интер- интервале со, o)+d(o). Представим полную излучаемую в телесный угол сШ за время dt энергию в виде H*r2dQ.dt =dQ j/ud<ad/, C2,13) где /Md<odQ — интенсивность, излучаемая в телесном угле dQ ¦и в интервале частот dot. Разлагая Н в интеграл Фурье и пользуясь равенством Пер- -севаля A1,9), имеем J (// (г, t)fdt = 4я j (// (г, ш)J da. Тогда для интересующей нас интенсивности (энергия в единицу dw времени) излучения в телесном угле dQ в интервале частот получаем выражение (г, со) |2 г2 dQ da = {r', со) e<*'W'] f dQtfco. C2,14) Фактическое спектральное распределение излучаемой энергии определяется, естественно, законом движения зарядов /(г, /). Предыдущие формулы существенно упрощаются, если плот- плотности тока и заряда в системе изменяются по простому гармо- гармоническому закону J(r', t)jo(r), C2'15)
]40 TFOPHfl ИЗЛУЧЕНИЯ ГГл V В этом случае система, естественно, излучает только одну ча- частоту соо. Вектор-потенциал дается при этом общей формулой Вдали от излучаемой системы А (г, t)^^—^ \j\{r')e^'dV. C2,18) Величина (Лг') определяет, очевидно, запаздывание внутри си- системы (собственное запаздывание). Рассмотрим теперь случай, когда собственным запаздыва- запаздыванием можно пренебречь. Для этого необходимо выполнение не- неравенства ?г'< 1 или L'<.\. C2,19) Мы видим, что условием пренебрежения собственным запазды- запаздыванием является малость )еометрических размеров излучающей системы по сравнению с длиной волны излучения. Предполагая выполненным условие C2,19), имеем в силу B6,11) А (г, /) = е—^ J Л (г') dV'=^, C2,20) что совпадает с B6,13). Найдем еще скалярный потенциал, не считая, однако, что расстояние до точки наблюдения велико по сравнению с длиной волны. Чтобы не повторять выкладок § 26, напишем выраже- выражение для скалярного потенциала, воспользовавшись условием Лоренца:
§ 321 ОБЩИЙ СЛУЧАП ИЗЛУЧЕНИЯ 141 Мы видим, что могут реализоваться два предельных случая: kr~ x>1( В первом случае, когда расстояние до излучателя велико по сравнению с его размерами, мы получаем Ф(г, t)-lk*^. C2,22) что совпадает с B6,12). Таким образом, в области справедливы все формулы § 26. Это — область далеких рас- расстояний, или волновая зона. В области расстояний г«: х:»; и можно написать „(г, Q^«L^-~^. C2,23) В этой области, именуемой ближней, или квазистатическои, зо- зоной, скалярный потенциал ф совпадает с потенциалом электро- электростатического поля диполя, величина которого изменяется по гармоническому закону. Векторный потенциал А в этой зоне мал но сравнению со скалярным в отношении у. Это означает, что в квазистатической зоне поле имеет в основном характер электрического поля. Напряженность электрического поля из- изменяется во всей квазистатической зоне в одной фазе с изме- изменением дипольного момента системы зарядов, и поле не имеет волнового характера. Магнитное поле меньше электрического в отношении в отличие от волновой зоны, где выполнено соотношение B7,3). Мы видим, что при излучении длинных волн (Я\3> L') поле излучающей системы имеет квазистатический характер в обла- области г >С Я, и волновой при гС?> >.. Угловое распределение элект- электрического поля в обеих областях различно. В квазистатической зоне средний по времени поток энергии, характеризуемый вектором Пойнтинга, равен нулю. Таким образом, квазистати- квазистатическая зона не дает вклада в излучение.
Выпишем еще выражения для полей в монохроматических волнах вдали от излучающей системы В волновой зоне вектор Пойнт;;нга определен формулой B7,6). Поэтому средняя по времени излучаемая интенсивность равна Она оказывается обратно пропорциональной четвертой степени длины волны и прямо пропорциональной квадрату амплитуды диполыюю момента d0- Наконец, разберем пример вычисления ноля излучателя с учетом запаздывания в системе. Рассмотрим систему, в кото- которой плотность тока выражается формулой Здесь k\ — единичный вектор вдоль оси г. Формула C2,28) имеет простой смысл: в бесконечно тонкой линии длиной L, ориентированной вдоль оси г, возбужден ток, имеющий характер стоячей волны. На концах линии при г = ± ' плотность тока обращается в нуль. Такая система на^ зывается линейным излучателем и часто применяется для излу* чения радиоволн. Подставляя C2,28) в C2,18), получаем для вектора А
§ 321 ОБ1ЦИП СЛУЧАИ ИЗЛУЧЕНИЯ где множитель F@, k) равен 143 C2,30) Множитель r фигурных скобках отвечает излучению волн, длина которых Я ;§>— (бесконечно длинных волн) и для которых Рис. 8. можно пренебречь собственным запаздыванием. Он гюл\чается непосредственно из C2,20) после подстановки формулы C2,26), в которой положено -=—> 0. Множитель F(Q, k) характеризует собственное запаздывачг? kL в системе. При -^—>0он стремится к единице. При конечном
144 ТЕОРИЯ ИЗЛУЧЕНИЯ [Гл. V значении kL он отвечает существенному изменению углового распределения излучения. При kL—n (т. е. Я = -2") угловое распределение излучения сравнительно мало отличается от такового у простого диполя (рис. 8, а). При &L = /mt, где т — целое число волн, укладываю- укладывающихся на длине линейного излучателя, возникают распределе- распределения, приведенные на рис. 8, б, в, г. С увеличением т числа лепестков в угловой диагралше излу* чение увеличивается и они постепенно приближаются к оси излучателя. В пределе, при т—*оо, излучение оказывается на* правленным вдоль оси излучателя.
ГЛАВА VI ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ВАКУУМЕ И РАССЕЯНИЕ ЭЛЕКТРОМАГНИТНЫХ ВОЛН § 33. Распространение электромагнитных волн вдали от излучателя В предыдущих параграфах было изучено явление излучения электромагнитных волн. Теперь мы можем разобрать механизм распространения электромагнитных волн в пространстве, сво- свободном от зарядов (в вакууме). Для получения более наглядных формул мы ограничимся случаем монохроматической волны. Мы видели в предыдущей главе, что излучающие системы излучают электромагнитные волны, у которых поверхностями равной фазы являются сферы радиуса г. Перейдем теперь в формулах C2,24) и C2,25) к пределу, считая расстояние до системы зарядов настолько большим, чтобы можно было пренебречь различием в направлении век- векторов г0 и я, где г0— единичный вектор, направленный из на- начала координат в точку наблюдения ил — по-прежнему еди- единичный вектор, направленный от излучателя к точке наблю- наблюдения. Тогда мы можем написать и сделать эту замену в фазовом множителе, после чего фор- формулы C2,24)" и C2,25) приобретают вид C3,1) ^). C3,2) В формулах C3,1) и C3,2) расстояние от точки наблюдения до начала координат входит в виде множителя 1/г в амплитуде. Ясно, однако, что на бесконечно большом расстоянии от начала Ю В Г. Левич. том 1
146 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ВАКУУМЕ [Гл VF координат изменение функции \\г можно считать происходящим весьма медленно и положить —«« const. И вменение полей с расстоянием определяется при этом исключительно фазовым множителем. Тогда C3,1) и C3,2) можно представить в виде ^'-^\ C3,3) ~~К C3,4) где Ео и Но — постоянные в пространстве и во времени вели- величины. Введем вектор k = —, именуемый волновым вектором. По абсолютной величине k=—=•-*-» где X — длина волны, и с а ориентирован по направлению распространения электромагнит- электромагнитной волны. Тогда '-*г), C3,5) -tr\ C3,6) В формулах C3,5) и C3,6) подразумевается, что в окончатель- окончательных выражениях следует брать вещественную часть. Согласно B7,3) амплитуды EQ и Но направлены перпендикулярно друг к другу и к вектору ft: Ео = \Ноп]. C3,7) Векторы Е и Н представляют плоские монохроматические волны: плоскости kr=const являются поверхностями равной фазы (равных значений папряженностей Е и Н), Мы приходим, таким образом, к естественному результату. На достаточно больших расстояниях от излучателя сферические волны превращаются в плоские. Это наглядно можно предста- представить следующим образом: если излучающая система находится достаточно далеко, радиус кривизны сферичсско/i поверхности равной фазы электромагнитной волны весьма велик по сравне- сравнению с размерами той области пространства, в которой рассма- рассматривается поле. Поэтому в пределах этой области сферу с до- достаточной степенью точности можно считать плоской поверхно- поверхностью. Если выбрать направление распространения за ось х, то фор- формулы C3,5) и C3,6) можно представить в пиле '-**), C3,8) ш-к*\ C3,9)
4 33] ЭЛГ.КТРОМЛГНИТНЫЕ ВОЛНЫ ВДЛЛИ ОТ ИЗЛУЧАТЕЛЯ 147 ¦Формулы C3,7) — C3,9) описывают плоские полны, распростра- распространяющиеся в положительном направлении оси х со скоростью v = j = c. C3,10) Действительно, в момент времени (/+1) фазовый множитель имеет в точке (х + с) то же значение, что он имел в момент / в точке х. Таким образом, v представляет скорость распростра- распространения поверхности равной фазы и по этой причине называется фазовой скоростью. Распространение плоских волн, в отличие от сферических волн, не сопровождается уменьшением их амплитуды. Вычислим вектор Пойнтинга а плоской волне: о = ? [ЕН] = -?¦ [ [Нп] Н] = пс-^ = nc-^f- = пси0. C3,11) В плоской волне он оказывается постоянным и равным потоку энергии, движущемуся со скоростью света. Импульс плоской электромагнитной волны равен Найденные нами выражения для поля в плоской волне могут быть получены также и непосредственно из решения уравнений поля в области пространства, свободной от зарядов. Поскольку плотность заряда и плотность тока в изучаемой ¦части пространства равны нулю, уравнения для потенциалов электромагнитного поля приобретают следующий вид: Для простоты рассмотрим сначала случай, когда потенциалы поля зависят только от одной координаты х, так что уравнения для потенциалов имеют вид d*A(x,t) J_ d*A(x,t) _ n ,„„ . „> aF с2 dt2 ~u> (M.16) —'^-±-Wr = °> <33'14> ^Ч;#=0. C3,15) 10*
148 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ВАКУУМЕ [Гл \1 Будем, кроме того, считать, что поле зависит от времени по про- простому гармоническому закону. Тогда решения уравнений C3,13) — C3,15) будем искать в виде Л (*,*)-А, (*)«*", C3.16) <р(х, О-Фо(*)е"* C3,17) Для До и фо подстановка C3,16) и C3,17) в C3,13) и C3,1-1) дает <PAt (х) , со2 . _ п Отсюда где обозначено k =— и I, V, а, а' — постоянные величины. Для потенциалов находим при этом А (х, t) = le' «"*-**> + t'e1 <«'+**>, C3,18) ф = ае! (m'-ftjt> + aV <^+**). C3,19) Первое слагаемое в C3,18) и C3,19) представляет плоскую монохроматическую волну, распространяющуюся в положи- положительном направлении оси х, второе слагаемое — такую же волну, распространяющуюся в отрицательном направлении оси х. Ка- Какая именно из этих волн фактически возбуждена, зависит от расположения излучающей системы. Не ограничивая общности, можно рассмотреть одну из этих волн, например первую. Амплитуды / и се не являются произвольными, но связаны между собой условием Лоренца C3,15), которое после подста- подстановки C3,18) и C3,19) дает a = lx. Тогда потенциалы поля окончательно запишутся в виде Л = /?<«¦>'-**> =/г"", C3,20) ф = 1хе1 <« -**> = (Ai) == (//) е'Ф, C3,21) где i — единичный вектор вдоль оси х и \|> = со/ — kx.
33] ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ ВДАЛИ ОТ ИЗЛУЧАТЕЛЯ 149 Напряженности полей в плоской волне имеют вид „ 1 дА , I дА <ЭгЬ дФ , , Е= ^-gradcp= -- —-5f--^-grad\|j где точкой обозначено дифференцирование по аргументу ij;, а Ео и Но — амплитуды напряженности полей по модулю, равные, очевидно, \Ео\ = \H0\=k\t\. Векторы Ео и Н перпендикулярны друг к другу. Распишем выражения для полей в компонентах: C3,24) В этих формулах, как и выше, подразумевается вещественная часть написанных комплексных выражений для потенциалов и полей. В общем случае, когда направление распространения волн не совпадает с осью х, единичный вектор i следует заменить па единичный вектор в направлении распространения л, и соотно- соотношения C3,22) и C3,23) совпадают с C3,5) и C3,6). Величин! амплитуды волн \Еп\ = \Н0\ остается совершенно произвольной. Она связана с амплитудой волн, излучаемых излучателем. Полезно сравнить полученные нами выражения с аналогич- аналогичными формулами, полученными при другой калибровке потен- потенциалов, которой часто пользуются в литературе1). Как мы видели в § 11, потенциалы поля допускают преобра- преобразование калибровки A1,1) и A1,2). Произведем переход от ф к новому значению ф', и выберем функцию ty = с (fdt. Тогда ф' = 0, т. е. в рассматри- рассматриваемом представлении поле описывается только иеьтором-по- тенциалом А'(х, I) = А + gradip. Такой выбор ty возможен не всегда, а лишь в вакууме, когда р = 0 и уравнение для ф допу- допускает нулевое решение. ') Л. Д. Ландау и Е. М. Л и ф ш и ц, Теория поля, Фнзматгиз, 1900, стр. 123.
J50 ЭЛЕКТРОМАГНИТНОЕ ПОЛК В ВАКУУМЕ (Гл VI Условие Лоренца запишется в виде дх = 0, т. е. Л, = 0. Решение /l^const =^-0 не отличается от Лк=0, поскольку оно приводит к тем же значениям напряженное гей поля. Нетрудно видеть, что для компонент поля при такой калибровке мы снова получаем значения C3,24). Если волновой процесс не имеет простого периодического характера, т. е. не описывается монохроматической волной, можно без труда получить решение уравнения для потенциа- потенциалов ф и А в общем виде. Решение проводится аналогично тому, как это было сделано в § 23. Вводя новые переменные, l=x — ct, r\=x+ct, сводим уравнения для потенциалов к виду Решением уравнения для вектора-потенциала служит А = A(ct — x) + A'(ct + х), где А и А' — произвольные функции аргументов ct~x и ct + к соответствен но. Первое из них представляет общее выражение для плоской волны, распространяющейся со скоростью с в по- положительном направлении оси х. Второе — волна, распростра- распространяющаяся в отрицательном направлении оси х. Аналогичное выражение получается и для скалярного потенциала. Условие Лоренца приводит к равенству Ф = /4Л =Ai, имеющему место при произвольном виде функций А и ф. Наконец, следует заметить, что в вакууме можно получить волновые уравнения непосредственно для векторов поля Е и Н. .Для этого следует взять ротор от уравнения Максвелла rotrottf=graddiv//-Atf= - Д## = j rot-|? , так что O Аналогичным образом можно получить волновое уравнение для Е.
5 34) ПОЛЯРИЗАЦИЯ ПЛОСКОЙ ВОЛНЫ I5fc § 34. Поляризация плоской волны Рассмотрим несколько детальнее, как происходит изменение векторов напряженности полей в плоской монохроматическое волне. Для этого перейдем от комплексной формы записи к ве- вещественным выражениям. В формуле C3,22) напишем комплексную амплитуду Еп в виде где g\ и g4 — вещественные векторы. Тогда будем иметь Е = Re {(gi + ig2) [cos (со/ - kr) + i sin (со/ - кг)]} = = Re {[g1, cos (at - kr) - g2 sin (at - kr)] + + i [g{ sin (at - kr) + g2 cos M - kr)]} = = g, cos Ш - kr) - g2 sin (at - kr). C4.1) Перейдем теперь от векторов g\ и g2, ориентированных пол произвольным \тлом друг к другу, к взаимно перпендикуляо- ным векторам Е\ и Е2. Пусть E,~gi cosa + ^sin a, C4,2} Е2 = Я) sin a— g? cos a, C4.3) где a—некоторый угол, который нам следует найти. Перемно- Перемножая выражения C4,2) и C4,3) скалярно, находим EtE2 = 0 = (g] — g§ sin a cos a — gtg2 (cos2 a - sin2 a), откуда Написав gr1 = f| cos a + Ej sin a, g2 = ?, sin a — E2 cos « и подставлял в C4,1), находим ? = ?, cos (со/ — Ar + a) + ?2 sin (со/ — Лг 4- a). Пусть направление распространения волн выбрано за ось .v. Если ориентировать ось у по вектору Еи то вектор Е2 будет направлен по оси г (в положительную или отрицательную сто- сторону). Тогда ?„ = ?, cos(o)/- kx + a), C4,1> —ftx + a). C4,5) Величины /Ti и ?2 называются амплитудами, а величина 1|? = (со/ — kx + а) — фазой волны.
|52 ЭЛЕКТРОМАГНИТНОЕ ПОЛС В ВАКУУМЕ [Гл VI Из формул C4,4) и C4,5) легко исключить фазу, написав -J + ^-l. C4-6) Вюлжение C4,6) связывает между собой значения компонент вектора Е в плоской волне. Очевидно, что в данной плоскости л" — const вектор Е вращается в плоскости (yz) так, что его ко- коней описывает эллипс. Формула C4,6) представляет уравнение этого эллипса. Если, в частности, амплитуды Е{ и Е2 равны по абсолютной величине, вектор Е вращается по кругу. Поскольку распространение электромагнитной волны про- происходит в направлении п, можно наглядно представить себе изменение вектора Е в пространстве и во времени, как движе- движение конца вектора Е по эллиптической (или круговой) спирали, 2л навитой на линию п. Шаг спирали равен длине волны Х~~-. В силу формулы C3,24) для компонент напряженности маг- магнитного поля можно написать выражения Ну= - E2sin(at-kx + a), C4,7) Нг = ?, cos (at ~kx + a). C4,8) Волны, в которых векторы Е и Н вращаются по эллипсу, называются эллиптически поляризованными, при вращении их по окружности— поляризованными по кругу. Направление вращения вектора Е определяется фазой. Если вращение происходит но часовой стрелке для наблюдения смот- смотрящего по направлению распространения волны, то такая волна называется имеющей положительную спиральность (а = —я/2). Если один из векторов Et или Е2 равен нулю, изменение Е п Н происходит в взаимно перпендикулярных плоскостях. Такие волны называются поляризованными в плоскости. По историческим традициям, плоскостью поляризации называют плоскость, в которой колеблется вектор Н. Таким образом, на- например, волна, поляризованная в плоскости г, имеет отличную от нуля компоненту Hz, колеблющуюся в плоскости (xz) и равную ей по величине компоненту Еч, колеблющуюся в плоско- плоскости (ху). § 35. Интерференция и образование волновых пакетов Рассмотренная выше монохроматическая плоская волна являлась лишь идеализацией реальных электромагнитных воли: с одной стороны, монохроматическая плоская волна, являющая- являющаяся процессом строго периодическим в пространстве и во вре*
§35] ИНТЕРФЕРЕНЦИЯ И ОБРАЗОВАНИЕ ВОЛНОВЫХ ПАКЕТОВ 153 мени, должна, очевидно, иметь бесконечно большую протяжен- протяженность в пространстве и бесконечно большую длительность во времени; с другой стороны, не существует строго монохромати- монохроматических излучателей. Как мы видели в § 30, эффект затухания проявляется в излучении частот, отличных от собственной ча- частоты wo (хотя и близких к ней). Поэтому для описания реаль- реальных волновых процессов необходимо рассмотреть результат наложения или интерференции различных плоских монохрома' тичеекнх волн. Рассмотрим наложение бесконечного множества плоскнч монохроматических волн, частоты которых непрерывно изме- изменяются в узком интервале &>о— Доз ^со ^«о+Асо, где шо, име- именуемая несущей частотой, удовлетворяет условию шо'^ Aw. Амплитуду всех волн будем считать постоянной. Для напря- напряженности электрического (или магнитного) поля можем на- написать <Оо+Дю ?= J Ейё <«* -**>й?о = Ей J Wo—Дм Шо—Аи Для общности результатов, которые будут нужны нам в даль- дальнейшем, мы будем считать, что волновое число k является не- некоторой функцией частоты со, не обязательно сводящейся к со- соотношению k = —, справедливому для электромагнитных волн в вакууме. Полагая <» = <о0 + (со - щ), k~ko+ (-?¦ )и=ио(со - щ) ^kQ+ (j~)o (со - ©о), находим J Д Aw sin Дю t-\-T~) x 0 Je»- -*'*>, C5,1) Irfto Jo где введенная переменная интегрирования u = w — mq. Мы прихо- приходим в принципе к следующему результату: наложение спектра волн с частотами, лежащими в узком интервале 2Аш вокруг несущей частоты wo, приводит к появлению волны с частотой о»
:154 электромагнитное полк в вакуумг: [Гл. vr •и волновым числом k0, но с модулированной амплитудой У- C5-2) v,-(¦%¦). ' C5,3) Модулированная амплитуда имеет весьма резкий главный мак- максимум (рис. 9, где дана зависимость А от -n-(t — vgx)) в точке Xm = Vgt, где она равна ^маис = 2АыЕ0. По обе стороны от точки максимума величина модулированной амплитуды уменьшается и в точках, где — vHt) = ±п, модулированная амплитуда обращается в нуль. Помимо глав- главного максимума, у модулированной амплитуды имеется целый ряд побочных максимумов, в которых, однако, амплитуда весь- весьма мала по сравнению с амплитудой в главном максимуме и высота которых бы- быстро убывает с увеличением аргумента (см. рис. 9). Практически можно считать, что электромагнитное поле возбуждено толь- только вблизи главного максимума, а в осталь- остальном пространстве наложение волн приво- приводит к их полному взаимному погашению. Возникающее образование в виде груп- гл мы волн называется волновым пакетом. Волновой пакет движется в пространстве со Рис. 9. скоростью vg, сохраняя ограниченную про- протяженность в пространстве. Поэтому величина vg называется групповой скоростью дви- движения пакета в отличие от фазовой скорости с которой переметается в пространстве поверхность равной фазы. Очевидно, что энергия волнового пакета движется вместе с его амплитудой, т. е. со скоростью v. Размеры волнового пакета ограничены интервалом пере- переменных
§ 35] ИНТЕРФЕРЕНЦИЯ И ОБРАЗОВАНИЕ ВОЛНОВЫХ ПАКЕТОВ |55- Для более наглядного выяснения смысла равенства C5,4) найдем пространственные размеры пакета. В фиксированный момент времени / иоле отлично от нуля между точками Х\ и х>, отстоящими друг от друга на расстоянии д, - Х2 = Д* = ^ = _; (Зоэ) вне этой области поле имеет значение, близкое к нулю. Если теперь фиксировать некоторую область x = const, то длительность временного промежутка, в течение которого поле волнового пакета отлично от нуля, равна Д/~|1. C5,6) По прошествии времени А/ поле п данном месте обратится п нуль. Таким образом, волновой пакет обладает ограниченной про- пространственной и временной протяжепностями, удовлетворяющи- удовлетворяющими условиями: М Аы ~ 2л; Л* Л/г ~ 2л. C5,7) Теперь можно видоизменить постановку вопроса. Предпо- Предположим, что мы хотим получить волновое поле, отличное от пуля, в некоторой области пространства Дх Для получения такого поля из монохроматических волн необходимо образовать волновой пакет. Если размеры пакета заданы нашим условием, то согласно- C5,7) следует произвести суперпозицию монохроматических волн с волновыми числами, лежащими в интервале Ak. Чем уже волновой пакет, т. е. чем меньше его пространственные размеры, тем больше Д&, т. е. тем больше интервал длин волн» которые должны участвовать в образовании пакета. Совершенно аналогично можно образовать волновой пакет, существующий в некотором месте ограниченное время. Чем меньше требующаяся временная длительность пакета At, тем больше интервал частот Аы тех монохроматических волн, кото- которые должны его образовывать. Соотношения, найденные для волн, распространяющихся в одном измерении (по оси х), могут быть без труда обобщены на случай волн, распространяющихся в произвольном направ- направлении в пространстве. Тогда получаются соотношения Ах Akx ~ 2л; Ay Aky ~ 2л; Az Akz ~ 2a; \t Лю — 2я. C5,8) Полученные результаты имеют большое принципиальное и практическое значение.
556 ЭЛЕКТРОМАГНИТНОЕ ПОЛП В ВАКУУМЕ [Гл VI Совершенно однородная и бесконечно протяженная п про- пространстве и времени монохроматическая волна, как указыва- указывалось ранее, не может быть фактически реализована. Однако располагая излучателем с достаточно слабым затуханием, ра- работающим достаточно длительное время, можно создать в про- прост рйнстве волны, достаточно близкие по своим свойствам к мо- монохроматическим. Ясно, что монохроматические волны, обла- обладающие бесконечно большой протяженностью, не могут быгь использованы для передачи каких-либо сигналов. Под сигналами мы понимаем такие электромагнитные воз- возмущения, которые в принципе можно регистрировать с по- помощью соответствующих устройств и которые могут служить для информации о некоторых физических событиях. Так, на- например, сигналом является самый факт излучения, начавшегося в некоторый момент времени. Обнаружение системы зарядов, рассеивающей электромагнитные волны, является другим при- примером сигнала. Из сказанного ясно, что электромагнитные волны могут быть использованы для образования сигналов только в том случае, если из них сформированы волновые пакеты. Соотношения C5,8) используются для анализа требуемых свойств сигнала. Пусть, например, регистрирующее устройство требует для своей работы сигнала, длительность которого не меньше некоторой величины Ы. Тогда сигнал будет зарегистрирован только в том случае, если он представляет волновой пакет, сформированный из монохроматических волн с частотами, распределенными в интервале Лю^-д^-. Мы не будем останавливаться на других примерах приме- применения соотношений C5,8). Они будут играть важную роль в квантовой механике. В заключение подчеркнем лишь, что полученное нами вы- выражение для волнового пакета имеет приближенный характер. Оно справедливо, если: 1) амплитуды всех монохроматических волн, образующих пакет, имеют одно и то же значение; 2) в разложении k(a) в ряд по Дш можно ограничиться первым членом. Первое ограничение не имеет принципиального значения, и ле представляет особого труда нахождения волновых пакетов, образуемых волнами с различными амплитудами. Второе требование для электромагнитных волн в вакууме . со <аэ | Аи .,1. выполняется автоматически: й = —= --—| = feo+— Лео. ?¦ С С С Однако, как мы увидим в квантовой механике, в тех случаях, когда требование 2) не выполняется, учет следующих членов
¦5 %] РЛГСГЯНМГ-: ЭЛЕКТРОМАГНИТНЫХ ВОЛН ЗАРЯДАМИ 157 разложении влечет за собой важные следствия: форма пакета, неизменная во времени и пространстве в первом приближении, при учете этих членов оказывается изменяющейся. Волновой пакет деформируется и постепенно расплывается. § 36. Рассеяние электромагнитных волн свободным и связанным зарядами Рассеяние электромагнитных волн связанным зарядом мо- может быть рассмотрено на примере линейного гармонического осциллятора. Пусть плоская монохроматическая волна, поля- поляризованная в плоскости, падает на осциллятор. Уравнение дви- движения осциллятора будет иметь такой вид: Считая затухание слабым, можем написать г « — «j^*» так что г 4- &2пг + уг = — ?ое1Ш, C6,1) и tn N 2 2 2 где у, как и в § 30, равна у—г- Интересующим нас частным решением уравнения C6,1) служит C6,2) Формула C6.2) дает закон движения осциллятора под дей- действием внешней силы. Для интенсивности излучения, рассеянного в телесном угле dQ, находим по формуле B7,8) ё1 .. eVM sin2d dl = г [ГП\2 С1п = ? -T-2 5Г5 2^- COS2 (CO/ - 6) dQ. C6,3) 4ЯС3 4ят2сл (ffl^co2J + coV Рассеянное излучение имеет ту же частоту, что и падающее, но сдвинуто по фазе на величину б = arctg 2YC0 2 . cog-w2 В формуле C6,3) через й обозначен угол между направлением наблюдения п и направлением вектора поляризации Еа
158 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ВАКУУМЕ [Гл. VI сЕ20 (рис. 10). Введя палающую интенсивность h — ~^ и усреднял за период Т = ——, находим 777 dl т 1 Г /лг\ а* ¦>! to4 sin2 О dQ /oc 4V = T J (dl) dt = rilu к_ю2J + (йу • C6,4> Процесс рассеяния электромагнитных волн принято характери- характеризовать дифференциальным эффективным сечением. По опреде- определению, дифференциальным эффективным сечением рассеяния в телесном угле dQ называется отношение интенсивности, рас- рассеянной в угол dQ, к интенсивности падающе- падающего излучения: 0 , ¦" da = -^. C6,5) 1 — Из C7,4) находим для дифференциального ?ц эффективного сечения рассеяния da = /o@2S'2n—2^г dQ. C6,6) Рис. 10. (,°>о-ш ) +ш V Как видно из формулы C6,5), дифференциальное сечение рас- рассеяния имеет размерность см2 (что и объясняет термин «сече- «сечение»). Формула C6,5) дает искомое сечепие рассеяния света, поляризованного в плоскости. Угол ft и полярные утлы 0 и t связаны /между собой соотношением, которое легко установить из рис. 10. На этом рисунке полярная ось г направлена по вол- волновому вектору k падающей волны, а ось х — вдоль ее вектора поляризации. Проектируя единичный вектор в направлении на- наблюдения я на ось х, находим cos ft = ч;п 0 cos t|) или sin2^ = 1 — sin29cos2tp. C6,7) На практике часто важно знать сечения рассеяния деполяри- деполяризованного излучения. Для нахождения последнего необходимо усреднить эффективное сечение C6,5) по всем возможным по- поляризациям, т. е. по всем возможным ориентациям вектора ?0 в плоскости (ху). Это означает, что необходимо усреднить вы- выражение C6,7) по всем возможным значениям азимутального угла \|>, т. е. положить . о „ , • ч п о 7 I s'n2 0 I + cos2 0 sin2'&= I —sin2 8cos2^= 1 — ¦ » =—~ .
•§ 3«] РЛССГЯНШ: ЭЛЕКТРОМАГНИТНЫХ ВОЛН ЗАРЯДАМИ 159 Тогда получим /лШ4 I + COS2 6 ddQ t368) da=Ti 5й ГУ dQ" t36-8) (cog - ш2J + о»У 2 Угловая зависимость в формуле C6,8) показывает, что в на- направлении падающего излучения (9 = 0) ив противоположном направлении @ = я) происходит самое сильное рассеяние. Интегрируя C6,8) по всему телесному углу, получаем пол- полное сечение рассеяния неполяризационного излучения а = t255 3 (©о - coy + Полученное выражение носит название дисперсионной формулы классической электродинамики. Зависимость полного эффективного сечения от частоты вы- выражается кривой, сходной с приведенной на рис. 7 с резко вы- выраженным максимумом при со~шо, т. е. при резонансной ча- частоте падающего излучения, близкой к собственной частоте осциллятора. Полагая в формуле C6,9) со^соо, получаем вблизи резонанса 2 rhul a C6>10) Величина у характеризует ширину области резонанса. В част- частности, в точном резонансе а) = (Оо. Сечение в максимуме равно °тах = "-д~ ro "TJF • C6,11) Поскольку y ^ wo, эффективное сечение для резонансной ча- частоты достигает очень больших значений. Это явление играет важную роль в оптике материальных сред. Оно называется ре- резонансной флуоресценцией *). Дисперсионная формула, полученная на примере рассеяния излучения гармоническим осциллятором, имеет в действитель- действительности весьма общий характер. Она по форме совпадает с соот- соответствующей формулой для рассеяния света атомами, которая получается в квантовой механике (гл. V). В квантовой меха- механике мы увидим, что область применимости дисперсионной фор- формулы не ограничивается рассеянием света, но распространяется н на ряд других систем. *) Сравнивая C6,10) с формулой A11,4'), мы видим, что при y~>0 сече- сечение ведет себя как б-функция.
160 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ВАКУУМЕ [Гл. VI Рассмотрим два соотношения, получающихся из C6,9) в пре- предельном случае малых и больших частот. При малых частотах <о «С wo a-^-rg-4, C6,12) т. е. сечение пропорционально четвертой степени частоты или обратно пропорционально четвертой степени длины волны па- падающего излучения. Этот закон рассеяния имеет весьма общий характер. Он при- применим тогда, когда длина волны рассеиваемого света велика по сравнению с размерами рассеивающего объема. Этот случай часто называют релеевским рассеянием. При высоких частотах св-^соо формула C6,9) вновь упро- упрощается: 8яе4 C613> Это выражение получило название формулы Томсона. Сечение оказывается постоянным, не зависящим ни от ча- частоты рассеиваемого излучения, ни от свойств осциллятора. По- Последнее обстоятельство имеет простой смысл: при высоких частотах сила, действующая на заряд со стороны поля, весь.\и велика по сравнению с квазиупругой силой. Электрон рассеи- рассеивает как свободная частица. Согласно формуле Томсона, сече- сечение а является универсальной постоянной, определяемой клас- классическим радиусом электрона. Ясно, что формула Томсона описывает рассеяние электронами любых систем, например, атомов, если можно пренебречь силами, связывающими элек- электроны в атомах, и считать их свободными. Рассеянием излуче- излучения тяжелыми ядрами можно пренебречь, поскольку сечение обратно пропорционально квадрату массы рассеипателя. Уни- Универсальный характер формулы C6,13) делает ее одним из фундаментальных соотношений классической электродинамики. Она была подвергнута тщательной опытной проверке, резуль- результаты которой приведены на рис. 11. Мы видим, что отношение JKcn ~ 1 лишь для длин волн, "томе больших примерно 2 А. При меньших длинах волн классическое рассмотрение про- процессов рассеяния оказывается неприменимым. Мы сталкиваемся здесь с упомянутым в § 28 обстоятельством. Хотя предел приме- применимости классической электродинамики, заключенный в самой теории, относится к масштабу длины волн к ~ Го ~ Ю~5А, фак- фактически он наступает уже при масштабах в Ю5 раз больших.
§37] ПОГЛОЩЕНИЕ ИЗЛУЧЕНИЯ 161 Это связано, как мы уже подчеркивали, с проявлением кван- квантовых эффектов. Ход сечения па рис. 11 в точности совпадает 1.0 0,8 0,2 200100 so го ю s г 1 as az a/ aes« PllC. U. с предсказаниями квантовой теории излучения (ч. V, формула Клеила — Нишины). § 37. Поглощение излучения Наряду с рассеянием излучение, взаимодействующее с ве- веществом, испытывает поглощение. В классической электродина- электродинамике последний эффект может быть рассчитан для модели осциллятора. Мы ограничимся излучением частоты падающего излучения, близкой к резонансной, когда поглощение будет наибольшим. Однако при этом нельзя считать частоту излуче- излучения точно равной собственной частоте осциллятора — из даль- дальнейшего видно, что в этом случае вычисление не привело бы к вполне определенному результату. Поэтому следует считать, чго падающее излучение имеет некоторое непрерывное распре- распределение по частотам. Мы можем разложить падающее поле в интеграл Фурье, на- написав Подставляя это в уравнение движения осциллятора C6,1) и разлагая в интеграл Фурье смещение последнего «= -^ J Ц В. Г. Левич, том 1
162 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ВАКУУМЕ (Гл. легко найти г((й) = А__. C7A) т Mq —со +(»Y Потеря энергии излучения равна, очевидно, полной работе, про- произведенной полем над осциллятором. Последнюю вычислим по формуле -&E = W= f Fvdt = e [ E{t)r(t)dt. C7,2) — оо Воспользовавшись обобщенной формулой Персеваля A1,9), легко найдем - (Д?) = -^ | /со {?(«.) • г' (ю) - Е* (со) ¦ г (со)} da | о = 2^ Г fviy)i; ^2^ f vigwi; rf@, C7C) «J Подинтегральное выражение имеет резкий максимум в области резонанса. Будем считать, что спектральное распределение по- поглощаемого излучения в области резонанса изменяется мед- медленно по сравнению с резонансным множителем. Тогда можно приближенно вычислить интеграл, если воспользоваться фор- формулой A11,3) и представлением б-функции A11,4'): оо о Г VIЕ («) I2 j Г Е ("Г . C7,4) Мы заменили нижний предел интегрирования на бесконечный, поскольку у < «>о. Подставляя C7,4) в C7,3), находим - АЕ = —-1 ? (coo) |2 = яс% | ? (оо) р. C7,5) Поглощенная энергия оказывается не зависящей от физиче- физических свойств поглощающей системы, за исключением положения резонанса частоты «о. Поэтому найденное выражение имеет, как и дисперсионная формула, весьма общий характер. Очен:! близкие выражения для поглощения получаются и в квантовой теории излучения (см. ч. V).
ft 38] КАНОНИЧЕСКАЯ ФОРМА УРАВНЕНИЙ ПОЛЯ 163 § 38*. Каноническая форма уравнений поля При переходе к квантовой теории электромагнитного поля удобно придать уравнениям электромагнитного поля вид, весь- весьма сходный с уравнениями механики. Именно, оказывается, что электромагнитному полю можно сопоставить некоторую меха- механическую систему, а уравнениям Даламбера придать форму уравнений Гамильтона, описывающих движение этой механи- механической системы. Мы ограничимся случаем электромагнитного поля в вакууме. Воспользовавшись описанной в § 11 кулоновской калибров- калибровкой потенциалов, при которой ф=0, запишем уравнения поля ё виде АА --L -|^=0, C8,1) div4 = 0. C8,2) Областью, в которой имеют место написанные уравнения поля, является пространство, свободное от зарядов и токов. На гра- границе этой области должно быть задано граничное условие. Та- Таким условием может служить, например, выражение для А в виде запаздывающего потенциала. Нас, однако, не будет инте- интересовать амплитуда электромагнитных волн, и мы ограничимся рассмотрением поля в вакууме вдали от токов и зарядов. Ра- Разобьем всю область пространства, свободную от зарядов, на со- совокупность кубов (мы будем именовать их нормировочными) с ребром L и будем рассматривать поле внутри одного из кубов. Тогда граничное условие должно быть задано на поверхности нормировочного куба. Как мы знаем, электромагнитное поле в вакууме предста- представляет совокупность бегущих волн. Решение в виде бегущих волн получится, если принять, что вектор-потенциал А и его производные имеют равные значения на противоположных гра- гранях куба. Это эквивалентно требованию: А является периоди- периодической функцией переменных х, у, г с периодом L: А(х и z) = А(х -\- L, и + L, z 4- L) /оя оч Получив решение уравнений C8,1) и C8,2) с граничным усло- условием C8,3) в нормировочном кубе с ребром L, мы можем на- иисать решение во всем пространстве простым повторением решения в исходном нормировочном кубе. Окончательные ре- результаты не будут зависеть от выбора L. Будем пытаться искать решение C8,1) и C8,2) в нормиро- нормировочном кубе в виде совокупности выражений вида qi(t)Ai(r), где <7*@ зависит только от времени, Аг(г) — от координат, II*
|64 ЭЛРКТРОМЛГНИТНОЕ ПОЛЕ В ВАКУУМГ- [Гя VI При соответствующем выборе векторных функций Аг(г) ка- каждая из них представляет волну в нормировочном кубе. По- Поскольку объем последнего является конечным, в нем может укладываться счетное множество стоячих или бегущих волн. Итак, положим t)=^qi(kt)Al{r), C8,4) где индекс i пробегает бесконечное, но дискретное число зна- значений. Это означает, что вектор-потенциал поля в нормировоч- нормировочном кубе можно разложить в ряд Фурье. Число членов в сумме C8,4), т. е. число волн в нормировочном кубе, бесконечно велико. Подставляя C8,4) в C8,1), находим 2 [qt (*) АЛ (г) --±-q\ {t) А (г)) = 0. C8,5) Поскольку все волны, образующие суперпозицию C8,4), яв- являются независимыми, равенство C8,5) должно иметь место для каждой из волн, т. е. 41 V) ДА (г) --У'й\ (t) А{ (г) = 0. C8,6) Перепишем C8,6) в виде ——L_Lj !*. — k = х и z C38 71 (Ai(r))k qt{t) ' ' у' W°.'J Поскольку (Л,(г))fi и <7г@ являются функциями разных пере- переменных, равенство C8,7) может иметь место только, если пра- правая и левая его стороны порознь равны некоторой постоянной, именуемой постоянной разделения. По причинам, ясным из дальнейшего, эта постоянная должна быть существенно поло- положительной величиной. Обозначив ее через( — rof), находим АЛ, (г) + -5- Л (г) = 0, C8,8) ¦ со??, @ = 0. C8,9) Решениями уравнения C8t8), удовлетворяющими условиям пе- периодичности C8,3), служат выражения типа A, ~«/sin*,r, I
§ 38] КАНОНИЧЕСКАЯ ФОРМА УРАВНЕНИЙ ПОЛЯ 165 Компоненты вектора &, должны принимать дискретный ряд значений где т, tit и яз — положительные целые числа. Совокупность та- таких значений компонент kt обеспечивает наличие узлов или пуч- пучностей на гранях нормировочного куба. Абсолютная величина и вектора k равна, но определению, | к{ | = —-. Век гор е, — еди- личный вектор поляризации, могущий принимать при данном fe, два значения (/=1,2). Вместо синусов и косинусов в формуле C8,10) мы могли бы взять их произвольную линейную комбинацию. Уравнение C8,2) приводит к требованию (еЛ)=0, C8,12) означающему (см. § 33) поперечность волн. Совокупность функций А, является полностью заданной уравнениями C8,1) и C8,2) и граничным условием C8,3). Она является одинаковой для любых полей в нормировочном кубе. Для фактического определения вектора-потенциала в данной точке пространства в определенный момент времени необходимо задать совокупность всех временных амплитуд q,(l). Это зна- значит, что состояние поля характеризуется заданием бесконеч- бесконечного набора амплитуд qx(t). Последние определяются уравнением C8,9), которое сов- совпадает с уравнением движения линейного гармонического ос- осциллятора. Величина шг представляет частоту колебаний этого осциллятора Значение цг{1) определяет состояние i^ro осцил- осциллятора в любой момент времени /. Задание совокупности пере- переменных амплитуд qt(l) равносильно заданию состояния сово- совокупности бесконечно большого числа осцилляторов с частота- частотами о)г. Если известно состояние всех осцилляторов п данный момент времени /, то известно и поле в этот момент. Таким образом, электромагнитное поле может быть формально заме- заменено механической системой с бесконечно большим числом сте- степеней свободы — набором бесконечно болыггото числа осцилля- осцилляторов, именуемых обычно осцилляторами поля. Совокупность состояний осцилляторов поля qt(t) характеризует состояние этой механической системы и, вместе с тем; состояние поля. Величины <7,@ можно рассматривать как совокупность координат механической системы, уравнения движения кото- которой можцо представить в виде уравнений Гамильтсша. Этой
166 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ВАКУУМЕ [Гл VI системе следует приписать функцию Гамильтона (совпадающую с ее энергией) где р, — импульс, сопряженный координате <7,. Масса всех осцилляторов поля принята равной единице. Действительно, уравнения Гамильтона для г'-й степени сво- свободы (i-ro осциллятора) гласят: дН . дН , откуда непосредственно следует уравнение C8,9) для вели- величины q;. Частное решение уравнений поля C8,1) и C8,2) можно за- записать в виде А^^Спе} cos Mtt sin ktr+C2le} sin (¦>,-? cosft,-r. C8,14) Если должным образом подобрать нормировку линейной комбинации решений типа C8,14), из которых образуется об- общее решение C8,4) уравнений поля C8,1) и C8,2), можно до- добиться совпадения энергии поля в нормировочном кубе с энер- энергией системы осцилляторов поля C8,13). При такой нормировке вектора-потенциала мы можем считать, что система осциллято- осцилляторов поля полностью эквивалентна электромагнитному полю. Состояние набора осцилляторов однозначно связано с состоя- состоянием поля. Требующаяся линейная комбинация решений типа C8,14) имеет следующий вид: А = У 17 S Е*/ ТГ(~ Ъ'№ sin *'г + ffl'flr| cos *'r) = — 2 =у 1? S S */ .17 (- Pisin **г+wcos Действительно, убедимся в том, что энергия поля в нормиро- нормировочном объеме удовлетворяет требованию При этом осцилляторы с разными поляризациями считаются различными. Полное число осцилляторов поля получается сум-
$ 38] КАНОНИЧЕСКАЯ ФОРМА УРАВНЕНИЙ ПОЛЯ 167 мированием по k и по /. Последнее сводится к удвоению ре- результата. Из C8,15) следует isin *<r+ю<р<cos < / 2 2 //= rot A = у ^J J] V -|: {- qt rot(<?/sin ^r) + сад* rot(e7 V -|: {Р [ft(<?/1 cos ft'r+со'<7г [ft'e/1 sin *'r i i 2 .. , 4л V V I t /J r h ~ i „ „ „:„ ь ..\ _ X' L""C1U C8 lg\ Состаним выражение для интегралов g—J ?2^Ки-д— H2dV. \'з ^8,17) следует •^ J ?2 dl/ = 27Т J j 2 S е> («W<sin kf + Picos *'r> Г dV- При вычислении интегралов воспользуемся очевидными со- соотношениями: j sin {ktr) sin (Arrr) dl/ = | sin (fefr) cos (krr) dV = = J cosikricoskfrfdV = J sin(ft.-r)co J sin2 kf dV = J cos2 ft,r ofV = \ = -~. Поэтому легко получить выражение
ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ВАКУУМЕ [Гл VJ Совершенно аналогично из C8,18) получается eITt (Pi [*'*'] COS*'Г + **•* [*'e'] S'n *' Складывая найденные выражения, приходим к равенству C8,16). При выбранной нами нормировке потенциала — подборе мно- множителей перед sin kxr и cos/t,r, — нолю в нормировочном объеме можно сопоставить набор осцилляторов поля, энергия которого совпадает с энергией поля. Состояние осцилляторов—набор величин g%(t) в момент времени / — определяет значение век- тора-потенниала A(r, t). Таким образом, электромагнитному полю в конечном объеме формально эквивалентна механическая система с бесконечна большим, но счетным числом степеней свободы — набор осцил- осцилляторов поля, а уравнениям поля — гамильтоновы уравнения движения осцилляторов поля Часто функцию Гамильтона экзи- валентной системы осцилляторов именуют просто гамильтоно- вой функцией поля, а разложение вектора-потенциала C8,15) — разложением поля на осцилляторы. Необходимо подчеркнуть, что в рамках классической электродинамики разложение поля на осцилляторы имеет характер вычислительного приема. Осцилляторы поля нельзя связать с колебаниями каких-либо частиц, имеющих реальный характер. Однако это разложение играет важнейшую роль в квантовой теории электромагнитного ноля (см. ч. V). В квантовой теории электромагнитного поля разложение C8,15) часто выражают через экспоненциальные функции. В дальнейшем, в ч. V нам понадобится такое представление. Запишем выражение для вектора-потенциала А (г, t) в виде А (г, t) = 2 (ЪкАк + blAl). C8,19) Здесь введены следующие обозначения:
$ ?»] КАНОНИЧЕСКАЯ ФОРМА УРАВНЕНИЯ ПОЛЯ 169 Индекс X, по которому производится суммирование в C8,19), заменяет индексы i и / в C8,15), т. е. он пробегает двойной (по сравнению с i) ряд значений, отвечающий обоим напра- направлениям вектора поляризации' (е\ и е2). Слагаемое ЬХА% харак- характеризует волну, распространяющуюся (бегущую) в поло- положительном направлении вектора к^. Второе слагаемое Ь*ХА\ представляет волну, распространяющуюся в противоположном направлении (—кх). Таким образом, волны, имеющие волновые векторы (kx) и (—кь), считаются разными волнами. Компоненты векторов (к})' и (—ky,) принимают значения, даваемые C8,11), но с положительными и отрицательными значениями целых чи- чисел П1,п2,п3 Это означает, что одной стоячей волне отвечают две бегущие — в положительном и отрицательном направлениях. Подставляя А\ и А*к в C8,19), перепишем эту формулу в виде А (г, I) Сравнивая последнее выражение с C8,15) и приравнивая коэф- коэффициенты при е' ^ и е~'ь^г, находим C8-2°) В этих обозначениях энергия поля запишется в виде « / А. Л Для дальнейшего нам понадобится еще вычислить число осцилляторов поля с данной частотой и данной поляризацией Оно равно, очевидно, числу бегущих волн в объеме V — Lz. Для нахождения числа осцилляторов удобно воспользоваться про- простым геометрическим построением. Выберем /гь п2 и /г3 в фор- формуле C8,11) за координатные оси в воображаемом простран- пространстве чисел (пь п2, п3). На рис. 12 изображена часть этого пространства. Каждому возможному значению «i и п2 на этом рисунке отвечает точка. Введем величину п = У п] + я| + n]j. Если числа «i «2, «з достаточно велики, то изображающие ик точки лежат весьма близко друг к другу и заполняют все
170 ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ВАКУУМЕ [Гл. V! пространство почти непрерывным образом. Величина п, как функция п\, «2, пз, будет изменяться почти непрерывно и на рис. 12 изобразится радиусом-вектором. Поскольку каждой тройке чисел П\, п2, д3 отвечает опреде- определенное значение k, равное k = | * | = Щ- VnJ+nJ+Ц = п ~, число волн с k, лежащим в интервале между k и k + dk, равно числу чисел п, лежащих в интервале между п, n + dn. Последнее Рис 12. равно числу изобразительных точек, попадающих в шаровой слой, лежащий между шаровыми поверхностями с радиусами п, п + dn. Для этого числа имеем, очевидно, значение g(n)dn = Ann2 dn. Таким образом, искомое число бегущих волн или число осцилляторов поля с \k\, лежащим в интервале A, k + dk, a данной поляризацией в объеме V — L3, равно Число осцилляторов с частотой, лежащей в интервале ш, и данной поляризацией g (©) da = BлсK L\ C8,22) Иногда приходится пользоваться формулой для числа осцилля-
$ 38] КАНОНИЧЕСКАЯ ФОРМА УРАВНЕНИИ НОЛЯ 17! торов поля с данной частотой, данной поляризацией и напра- направлением вектора ft, лежащим в телесном угле dQ. Число таких осцилляторов равно g (со) rfco rfQ = BjtcK . C8,23) Нам понадобится выражение для импульса излучения в объеме L3. Написав его на основании A3,11), C8,17) и C8,18) в виде
ГЛАВА VII ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ § 39. Движение заряженных частиц в постоянных электрическом и магнитном полях Одним из важных с практической точки зрения раздело» электродинамики является теория движения заряженных ча- частиц в электрические и магнитных полях Теория движения за- заряженных частиц в электромагнитных полях является основой всей электроники, техники ускорителей, электронной и протон- протонной микроскопии, масс-спектрографий, исследований реакций в. плазме и опытных установок для изучения термоядерных яв ie- нин. Она весьма важна для целого ряда других областей фи- физики — астрофизики, физики космических лучей и т. п. В рамках этой киниги мы ограничимся рассмотрением про- простейших задач. Мы будем предполагать, что поле, в котором находится некоторая частица, имеет напряженность, весьма большую по сравнению с полем самой частицы. Иными слова- словами, мы считаем частицу, движением которой интересуемся» пробной частицей, не искажающей заданное, внешнее по от- отношению к ней поле. Мы начнем с движения заряженной частицы в однородном постоянном во времени электрическом поле. Уравнения движе- движения имеют вид meE Если в начальный момент времени t — О заряженная частица была неподвижна, то, ориентируя ось х по полю, имеем тх = еЕ, откуда f Y C9,1)
4 39] ДВИЖЕНИЕ ЗАРЯЖЕННЫХ ЧАСТИЦ В ПОСТОЯННЫХ ПОЛЯХ 17,} где 1/= (фг — cpi) — ускоряющая (или замедляющая) разность потенциалов, пройденная зарядом. При этом положено v0 = 0. Если частица в начальный момент имела скорость v0, напра- направленную под углом 0 к оси у, и находилась в начале координат, то двукратное интегрирование уравнений движения дает x = ~Et+ vosinQ, y = (v0cosQ)t. Исключая t из написанных выражений для у и х, находим уравнение траектории Как и следовало ожидать, частица движется по параболе. Поперечное (по отношению к начальной скорости) электриче- электрическое поле обладает важным свойством фокусирования. Если пучок частиц выходит из начала координат под различными углами, близкими к 45°, то простой расчет показывает, что в некоторый момент времени / = /Макс все частицы собираются в точке, находящейся на расстоянии уМм;с- Здесь умаис — наиболь- наибольшее расстояние вдоль оси у, проходимое частицей (отвечающее наибольшей высоте подъема при аналогичном движении в поле тяжести), *„акС — время, требующееся для достижения этой точки. В однородном электрическом поле фокусируются заряды с одинаковыми отношениями— и начальными скоростями о0, вы- вылетающие под углом ~45° к вектору поля. Рассмотрим теперь движение частицы в однородном посто- постоянном магнитном поле Ориентируем ось г по направлению поля. Уравнения движения имеют вид пи = j \vH], C9,3) или, в проекциях, * = -??чН. C9.4) tj=--^xllt C9,5) 2 = 0. C9,6)
174 ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл VII Уравнение C9,6) означает, что магнитное поле, направленное вдоль оси г, не влияет на движение частицы в этом направле- направлении. Будем искать решение уравнений C9,4) и C9,5) в виде х = A cos (<s>ct + a). у = В sin {<j>ct + а). Тогда имеем Отсюда находим сос = -^-, А= ~В. C9,7) Таким образом, можем написать х = A cos (a>ct + а) = Л cos f -^ t + а), у = — A sin (a>cf + a) = — A sin [~ t + а). Очевидно, что где v^ — начальная скорость в плоскости (ху). Интегрируя еще раз полученные выражения, имеем C9,8) Исключая из последних соотноглений время, находим, что ча- частица движется по окружности J0)" ()* (y ±Rl Частота обращения частицы, определяемая формулой C9,7). носит название циклотронной частоты. Циклотронная частота, равная удвоенной ларморовой, не зависит от начальной ско- скорости частицы и определяется отношением ~. Радиус окруж- окружности C9.9)
§ 34] ДВИЖПШЕ ЗАРЯЖЕННЫХ ЧАСТИЦ В ПОСТОЯННЫХ ПОЛЯХ 175 имеет простой смысл: на окружности радиуса RL уравниваются центробежная сила и сила Лоренца, Если частица в начальный момент помимо скорости в пло- плоскости (ху) имела по оси z компоненту скорости vf\ то онаб>- дет совершать равномерное движение вдоль направления маг- магнитного поля. Наложение обоих движений, равномерного по оси г и вращения в плоскости (ху), приводит к траектории ча- частицы в продольном поле в виде винтовой линии. Витки траек- траектории навиваются на цилиндр радиуса Rc с осью, параллельной оси г. При движении в постоянном магнитном поле Н имеют место следующие законы сохранения: 1. Сохраняется полная энергия частицы е = -J ((W<o>J + (vff) = const. 2. Сохраняется проекция момента импульса на ось г, т. е. Lz = mR2cy = т/??сос = const. Из формулы B2,4) следует, что сохраняется также магнитный момент, создаваемый частицей, движущейся по окружности: - mv2. mv2, где eL = ~~o кинетическая энергия движения в плоско- плоскости (ху). Этим важным результатом мы воспользуемся в сле- следующем параграфе. Постоянное и однородное магнитное, как и постоянное одно- однородное электрическое, поле обладает свойство.ч фокусировки. Пусть из некоторой точки выходит пучок частиц в различных направлениях и с различными начальными скоростями, лежа- лежащими в плоскости (ху). Поскольку'циклотронная частота не зависит от начальной скорости, по прошествии промежутка времени Гс= —частицы, совершив один оборот, вновь собе- С pyicH в одной точке. Если теперь рассмотреть пучок частиц, имеющих одинаковые значения начальной скорости i»<0>|, но вылетающих в различ- различных направлениях, то можно заметить следующее: за время
176 ДВИЖ1.НИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл V'U Тс все они пройдут один виток винтовой линии. Шаг ее, равный l = vf)Tc = v^cos аТс, будет различным. Здесь а —угол между направлением начальной скорости и осью г. Поэтому частицы, выходящие из начальной точки, не собираются вновь в одной точке. Если, однако, угол а мал, так что cosa^l, то шаг винто- винтовой линии у всех частиц оказывается одинаковым и пучок фо- фокусируется. В отличие эт фокусировки электрическим полем, магнитное поле фокусирует только частицы, летящие под ма<- лыми углами к полю. Рассмотрим, наконец, общий случай движения частицы в однородных и постоянных во времени электрическом и магнит,- ном полях. Напишем уравнение движения ь общем случае в виде Введем новую неизвестную величину V, определяемую соот- соотношением К = «—?JML. C9,11) Подставляя V в уравнение движения, находим dt m Х^^ с Раскрывая векторное произведение EIP, получаем dV_ = ± И (НЕ) ,_e_ dt m Я2 ^ me Если электрическое поле перпендикулярно к магнитному, так что НЕ = 0, то At ~ тс Последнее уравнение совпадает с C9,3). Следовательно, V представляет скорость движения частицы по окружности в пло- плоскости, перпендикулярной к магнитому полю Н, которое про- происходит с циклотронной частотой. Проекции скорости V даются формулами, аналогичными C9,8), в которых мы положим а = 0. При этом полная скорость частицы ртвна
§ 39] ДВИЖЕНИЕ ЗЛРЯЖСННЫХ ЧАСТИЦ В ПОСТОЯННЫХ ПОЛЯХ [77 или, в проекциях, сЕи сП„ __ 1/ _L @) / I /Qfl I OV «^ = Vy = - t»(°) sin o>ct, C9,14) где v1® — начальное значение скорости в плоскости, перпенди- перпендикулярной к направлению магнитного поля Н. Постоянной а, вращение частицы Дргмф, вызванный в однородном однородным магнитном поле магнитным полем О Положительно |] {) A A наряженная \/ \ ) \ I \ I частице^ У V v ^r О Отрицательно |] (J [1 (\ заряженная \ ) \ I \ I \ I частица *ОС_Х_Х_Х^ Рис. 13. равной нулю, отвечает начальная скорость частицы, направлен- направленная по оси х. Из C9,13) следует, чго vx остается малой по сравнению со скоростью света с, если имеет место неравенство ЕУ«Н. Слагающая скорости частицы Vo-^ C9,15) направлена перпендикулярно к обоим полям. По абсолютной величине она равна l*>ol = -f- C9,16) и не зависит ни от заряда, ни от массы частицы. Движение частицы в направлении vu получило название дрейфа. Наглядное истолкование явления дрейфа может быть полу- получено из следующего рассуждения. Пусть положительно заря- заряженная частица движется по окружности в плоскости {ху), пер- перпендикулярной к направлению магнитного поля Н, выбран- выбранному за ось z (на рис. 13). Магнитное поле направлено вверх перпендикулярно к площади чертежа. Пусть, далее, электриче- электрическое поле направлено по оси у. Тогда электрическое поле будет 12 В Г. Леинч, тим 1
178 ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ 1Гл. VII ускорять частицу при ее движении по левой дуге полуокруж- полуокружности и замедлять при движении по правой полуокружности. Круговая траектория будет искажаться. Верхнюю часть окруж- окружности частица проходит с большей скоростью, чем нижнюю. Магнитное поле в нижней части окружности будет загибать траекторию частицы сильнее, чем в верхней. Поэтому проекция пути, проходимого частицей, на ось х в нижней части окруж- окружности будет меньше, чем в верхней. В итоге после каждого оборота возникает некоторое смеще- смещение частицы вдоль оси х, в положи- положительном ее направлении (на рис. 13 слева направо). В результате этого частица начнет смещаться в положи- положительном направлении оси х. Аналогичное рассуждение для от- отрицательной частицы приводит к тому же направлению дрейфа. Интегрируя еще раз выражения C9,13) и C9,14), находим уравнения траектории частицы в параметриче- параметрическом виде: о(°> cF.t х = -j?— sin <act + —jj- + x0, C9,17) У = - — cos (?>ct + y0. C9,18) Рис- 14' Кривая, описываемая частицей, носит название трохоиды. Конкретные пара- параметры трохоиды зависят от начальных условий. Если положить, что при / = 0 заряженная частица находилась в начале коор- координат, то Хо = 0; уо= —. При этом форма кривой опреде- ляется только значением начальной скорости и*?'. При 1 ^ I > 7" получается верхняя кривая рис. 14, при | о^ | < -^ — средняя кривая. Нижняя кривая, циклоида, отвечает случаю х ~~ // * Если Е не перпендикулярно к Н, то уравнение C9,12) мо- можно спроектировать на плоскость, перпендикулярную к Н, и ось z. Тогда находим
§ '.0] ДВИЖЕНИИ ЗАРЯЖЕННЫХ ЧАСТИЦ В ИЗМЕНЯЮЩИХСЯ ПОЛЯХ 179 где Е,,—слагающая электрического поля, параллельная маг- магнитному полю. В скорости дрейфа вместо Е следует при этом написать ?х. На дрейф частицы накладывается равномерно ускоренное движение вдоль магнитного поля под действием силы еГ. § 40. Движение заряженных частиц в медленно изменяющихся магнитных полях Обратимся теперь к весьма важному случаю движения ча- частиц в магнитных полях, переменных во времени и в простран- пространстве. В общем случае переменных полей интегрирование урав- уравнений движения оказывается весьма трудной задачей. Поэтому мы ограничимся случаем полей, медленно изменяющихся во времени и от точки к точке. Рассмотрим случай, когда магнитное поле медленно изме- изменяется во времени, оставаясь однородным в пространстве. Пусть частица вращается с циклотронной частотой we в плоскости, перпендикулярной к магнитному полю. Мы будем предполагать, что изменение поля за один оборот достаточно мало, т. е. дН at D0,1) 2я При изменении поля во времени можно написать §Edl=-l^dSi D0,2) где контуром интегрирования служит траектория частицы. Ум- Умножив D0,2) на заряд частицы и считая, что за время одного аи оборота величина -^- остается постоянной, можем написать dt ЛИ dt s=-- с дН at D0,3) Интеграл, стоящий в D0,3) слева, представляет работу, произ- произведенную над зарядом за один оборот. Она равна приращению кинетической энергии движения в плоскости (ху), которую обо- обозначим через Де^. Поэтому Ае, =-- дН \e\nR% дН at D0,4) Знак минус означает, что частица с отрицательным зарядом .движется в направлении, обратном положительному направле- направлению при интегрировании но контуру.
180 URIOKCHIIF ЧАСТИЦ R ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл VII i i an a I'M приизиидм имеем dt Гс сТс } 1U - <3// dt По определению C9,10) dB± dt dt с?// < ^// dt ' ан аи, ~дГ ~^ ~Ы: D0,5) D0,6) Сравнивая уравнения D0,5) и D0,6). мы видим, что при мед- медленном изменении магнитного поля магнитный момент частицы остается постоянным: D0,7) К аналогичному выводу можно прийти при рассмотрении движения частицы в стационарном магнитном поле, медленно изменяющемся от точки к точке. Пусть магнитное поле направлено вдоль оси z и напряжен- напряженность его увеличивается с ростом z. Линии поля сходятся, как это изображено на рис. 15. Мы будем считать, что на расстоянии ~ Rc изменение магнитного поля мало, т. е. \Н\. D0,8) Могнит силооые линии Рис. 15. дг i Поскольку магнитное поле изменяется вдоль оси г, ра- радиальная компонента поля Нг также отлична ог нуля. Из урав- уравнения непрерывности в цилиндрических координатах = 0 имеем Интегрируя и пренебрегая при этом зависимостью -—• от коор- координаты г на окружности радиуса г ~ Rc, находим дг Поскольку при выполнении условия D0,8) компонента Нт ыа по сравнению с компонентой Нг для всех г < Rc, можно
5 40] ДВИЖГНИЕ ЗАРЯЖЕННЫХ ЧАСТИЦ В ИЗМЕНЯЮЩИХСЯ ПФЛЯХ |8Г считать, что |//|«* Н2, т. е. поле направлено под малым углом к оси z, и Я,~--^. D0,9). Если компонента магнитного поля Нг ф 0, то на частицу, движущуюся в плоскости (ху) по окружности с циклотронной частотой, действует сила в направлении оси г. Частица будет совершать дрейф в этом направлении, причем компонента и, удовлетворяет уравнению движения dvz е 1Т е п дИ е п9 дН дН D0,10), Отсюда обычным способом, умножая D0,10) на vz, находим d mv\ дН dt 2 >* dt ¦ Поскольку полная энергия частицы сохраняется, имеем отсюда получаем d 1 dt Г* i I 2 1 d ( mv2± 2 2 \ Сравнивая D0,11) с D0,6), мы снова приходим к выводу о со- сохранении магнитного момента частицы: Сохранение магнитного момента в медленно изменяющемся неоднородном магнитном поле приводит к весьма важным след- е. enw j_ с г 1 ствиям. Поскольку fi=— и Rc = = — У 2ms ~ —?=¦> Н ell еН х \'Н радиус окружностей, по которым движется частица, умень- уменьшается в сторону возрастающих значений г (см. рис. 15). Пусть 9о — угол, образуемый вектором скорости частицы с осью z в некоторой точке г0, а 6 — тот же угол в произвольной точке. Точка в точке z = z0 e± = —2~ = —2~ sin2 00 = \iH (г0), где Я(г0) —значение магнитного поля в точке г0. В некоторой
]g2 ДВИЖЕНИИ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл. VI[ точке z напряженность поля равна Я (г) и 2 1 = —7p-Sin29. Поэтому имеем sin 9 = sit При движении частицы вдоль оси z и увеличении напряжен- напряженности поля угол 0 возрастает. В точке г*, где "I/ ,., . я» . п ' sin 9=1 и Oj = у0. Это означает, что компонента скорости частицы vz обра- обращается в нуль. Дальше точки г* частица двигаться не может и отражается в область z < г*. Область z^-z*, непроницаемая для частиц с начальной скоростью u±=uosin0o, называется магнитным зеркалом. Отражение частиц от магнитного зеркала играет существен- существенную роль в различных электронных устройствах. Э. Ферми была высказана идея об ускорении частиц в космических лучах в ре- результате отражения от магнитных зеркал. Роль последних могут играть облака межзвездной материи. Если допустить, что в об- облаках межзвездной материи напряженность магнитного поля выше, чем в разделяющем их пространстве, то все частицы, за- заключенные между облаками, будут отражаться от них, как от магнитных зеркал. Предположим, что облака движутся на- навстречу друг другу со скоростями v. Заряженные частицы, сталкиваясь с движущимися облаками и отражаясь от них, из- изменяют скорость на 2v при каждом отражении. Расчеты показывают, что в космических условиях скорости частиц могут достигать огромных величин. В заключение подчеркнем, что все полученные результаты относятся только к движению частиц со скоростями, малыми по сравнению со скоростью света с. В ч. II будет рассмотрено дви^ жение со скоростями, сравнимыми со скоростью света с. § 41. Функции Лагранжа и функция Гамильтона частицы, движущейся в электромагнитном поле Уравнения движения частицы в электромагнитном поле D1,1) могут быть записаны в форме уравнений Лагранжа, если ввести -функцию Лагранжа соотношением L = *g--ei + ±Av. D1,2)
§ 41] ФУНКЦИЯ ЛАГРАНЖА И ФУНКЦИЯ ГАМИЛЬТОНА ЧАСТИЦЫ 183 Составим уравнения Лагранжа _d_ dL_ _ dL_ _ ~ dt dv dr ~ • Очевидно, имеем для обобщенного импульса Соответственно, обобщенная сила j)v=~e§radФ + 7 §rad(Av)= = — е grad ер + 4 {(** grad) 4 + [f rot i4]}. С При вычислении частной производной по координатам v счита- считалась постоянной. Подставляя найденные выражения в уравнения Лагранжа,. находим или что совпадает с D1,1). Напишем еще функцию Гамильтона для частицы:
1Я4 ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл VII В случае системы независимых частиц функции Лагранжа и Гамильтона можно представить в виде и, соответственно, где Аг и ф, — значения потенциалов поля в месте нахождения i-й частицы; суммирование ведется по всем частицам системы В дальнейшем нам понадобятся эти выражения для функции Лагранжа и Гамильтона. Заметим, что если ввести в выражение для обобщенного им- импульса Р; вектор-потенциал в постоянном однородном магнит- магнитном поле по формуле A9,16), то /», = А + ?[//г] D1,7) и соответственно § 42. Движение и излучение системы из двух заряженных частиц До сих пор мы рассматривали движение частиц во внешних полях. Сейчас мы обсудим вопрос о движении заряженных ча- частиц в поле, создаваемом другими частицами. Рассмотрим прежде всего задачу о движении двух взаимо- взаимодействующих заряженных частиц '). Эту задачу можно решить, пользуясь методом последова- последовательных приближений. Именно, считая потери энергии частиц на излучение малыми, можно в первом приближении рассчитать траектории частиц. Зная последние, можно затем найти излуче- излучение системы. ') В дальнейшем мы (мраннчимся кратким изложением проблемы, по- поскольку она является частным случаем задачи двух тел, рассматриваемой подробно и курсах классической механики. Детальное изложение этого и других вопросов, затрагиваемых и да!шо%1 параграфе, можчо найти в книгах: Л Д.Ландау и С М Л и ф ш и ц, Меха-шка, Физматгиз, 1958, и Т. Го л д- с т е й н, Классическая мехлпчка, Гостехиздат, 1957.
S 42) СИСТЕМА ИЗ ДВУХ ЗЛРЯЖГ.1ШЫХ ЧАСТИЦ ] 8fy Пусть заряженные частицы имеют массы т^ и т?, заряды их равны в\ и е2. Потенциальную энергию системы можно за- записать в виде U = где ф(г)—потенциал поля, создаваемого зарядом е2, находя- находящимся на расстоянии г от заряда в\. Функцию Лаграижа системы можно записать в виде D2,1) г>| = /*|; v.2 = r2; r{ и г2— радиусы-векторы, проведенные к. частицам из произвольного начала координат. Поскольку потенциальная энергия зависит только от расстоя- расстояния между зарядами, т. е. U = U{\r\), где г = г, - г2, D2,2) удобно перейти к системе координат центра инерции. Именно, поместим начало координат в центр инерции — точку пространства, радиус-вектор которой по отношению к про- произвольной системе координат выражается формулой Из D2,2) и D2,3) находим и, соответственно, скорости частиц D2,4) 171 \ * . f* flli I n где vq = г — относительная скорость частиц и R — скорость центра инерции. Подставляя значение скоростей в функцию Лаграижа, на- находим L = ^-(RJ + ^(rJ-U(\r\), D2,5> где М — т\ + т2 — масса системы, а величина называется приведенной массой.
186 ДВИЖПНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл. VII Координаты центра инерции R являются циклическими. Со- Соответствующий обобщенный импульс сохраняется: 4(mf + /n2)tf const. D2,7) од Центр инерции движется с постоянной скоростью (в частности, он может оставаться неподвижным). Для исследования относительного движения зарядов введем координаты, начало которых помещено в центр инерции. По- Поскольку потенциальная энергия взаимодействия зависит только от расстояния г, поле имеет сферическую симметрию. Коорди- Координата, отвечающая произвольному повороту системы, является циклической. Это означает, что имеет место закон сохранения момента: L = [rp] = const. D2,8) Умножая последнее выражение скалярно на радиус-вектор г, имеем (Lr) = О, так что движение происходит в плоскости, перпендикулярной к вектору L. Выбирая направление вектора L за ось z и плоскость, в ко- которой происходит движение, за плоскость z — 0, можно ввести полярные координаты г, \|> и переписать лагранжиан, относя- относящийся к относительному движению, в виде Lom = f (r2 + rV) - е1ф (г). D2,9) Лагранжиан LJTU формально совпадает с лагранжианом одной частицы, имеющей массу ja и движущейся во внешнем поле сил <?icp. Координата ij> является циклической, и ей отвечает обоб- обобщенный импульс Р^= цг2ф = const. D2,10) Вычисляя п полярных координатах Lz, имеем, очевидно, Lz = \rp]z = »(ху — Ух) = цгЧ. D2,11) так что равенство р^= Lz = const = L выражает закон сохранения момента. Поскольку функция Лагранжа не зависит от времени, имеет место закон сохранения энергии: Е = ? (г2 + гЦ2) + eicp (r) = const. D2,12)
где в2 — заряд второй частицы. Ход центробежной энергии для этого случая изображен на рис. 16. Пунктиром на том же рисунке показан ход кривых — -^- и -г—г". Прямая ? = 0 также показана пунктиром. Ход кривой V{r) и положение точки мини- минимума зависят от величины момента L. Переписав формулу D2,12') в виде г Энергия D2,12') формально совпадает с энергией частицы, со- совершающей одномерное движение в поле с потенциальной энер- энергией V(r). то они определяют точки остановки или апсидальные точки г0, а которых радиальная скорость обращается в нуль. Если Е > 0, то дозволенная область движения простирается от бесконечно удаленной области г—> оо до точки остановки, отвечающей ми- минимальному расстоянию между частицами и определяемой перс- сечением прямой Е с кривой V(r). Если Е < 0, то имеются две точки остановки, отвечающие наименьшему и наибольшему расстояниям между зарядами. Движение совершается между этими точками. мы видим, что допустимая область относительного движения частиц зависит от взаимоотношения между Е и V(r). Области, в которых V(r)> E, являются запрещенными; области, где Е > V(r)—допустимыми. Если существуют корни уравнения
}88 ДВИЖСНИС ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ (Гл VII Для нахождения траектории следует исключить время из D2,12) и D2,11). Тогда имеем aib = —ir at -Интегрируя, находим ¦ dr - -to- D2,17) В частности, при движении в кулоновском поле притяжения под- подстановка ф(г) из D2,14) дает El? ц (eie2J где было обозначено " = 7- Обращая arccos, находим уравнение траектории ]• D2,18) Сравнивая последнюю формулу с общим уравнением кони- конических с'ечени'й где е — эксцентриситет, мы видим, что движение зарядов про- происходит по коническому сечению с эксцентриситетом D2,19) Параметр конического сечения р = . В зависимости от знака Е имеем ?>0, е> 1 — гипербола, ? = 0, е= 1 —парабола, Е < 0, е < 1 — эллипс, Е = ~ ** B/УJ » е = ° ~ окружность.
•§ «Г СИСТЕМА ИЗ ДВУХ ЗАРЯЖЕННЫХ ЧАСТИЦ 189 Найдешюе решение D2,18) определяет движение каждой из частиц. Именно, частицы движутся по траекториям, представ- представляющим конические сечения с фокусом, находящимся в центре инерции системы. Найденное решение не отличается от соответствующего ре- решения кеплеровой задачи о движении планет. Значения харак- характерных величин конических сечений приведены в цитированных руководствах по механике. Найдем теперь излучение системы двух зарядов. Мы огра- ограничимся здесь случаем периодического движения, т. е. случаем притяжения при Е < 0. Энергия, излучаемая за период Т, со- гласно B7,9) и B8,11), равна j где о Вместо интегрирования по периоду, можно с помощью D2,11) интегрировать по углу tp. Выражая г через ф по формуле D2,11), получаем 2л о о Таким образом, заряд, движущийся по замкнутой орбите, не- непрерывно излучает энергию. В частности, при движении по кру- круговой орбите е = 0, L2 = - ** ^'K , и формула D2,20) приоб- приобретает более простой вид: Ef- D2,2.) Потеря энергии на излучение приводит к тому, что круговая орбита превращается в свертывающуюся спираль.
190 ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ (Гл \ II Числовой расчет показывает, что система «электрон, обра- обращающийся вокруг протона», высвечивает свою энергию за время 7' & 10 сек при линейных размерах орбиты ~ 10~8 см. Мы видим, что планетарная модель атома коренным образом противоречит законам классической электродинамики. Впослед- Впоследствии при изложении квантовой механики будет выяснена причина этого противоречия. Оказывается, что нестабильность планетарной модели атома является иллюстрацией общего по- положения о неприменимости законов классической механики и классической электродинамики к рассмотрению внутриатомных явлений. § 43. Рассеяние частиц и излучение при рассеянии Рассмотрим теперь процессы, возникающие при пролете ча- частиц, отталкивающихся друг от друга или притягивающихся, по обладающих энергией Е > 0. Из общих соображений, связанных с ходом кривой V(r) (см. рис. 16), ясно, что в обоих этих слу- случаях движение будет происходить по незамкнутой орбите. Будем для наглядности считать, что одна из заряженных ча- частиц неподвижна относительно лабораторной системы коорди- координат. Мы будем называть ее рассеивателем. Другая частица, име- именуемая рассеиваемой, движется относительно первой. На до- достаточно большом расстоянии, когда взаимодействием частиц можно пренебречь, движение падающей частицы является пря- прямолинейным. Скорость этого движения vo будем считать задан- заданной. При сближении частиц происходит отклонение падающей частицы от прямолинейного полета, а частица, ранее неподвилс- ная, получает импульс и приходит в движение. Тогда говорят, что произошло столкновение частиц, в резуль- результате которого возникло взаимное их рассеяние. По причинам, которые будут особенно ясны из дальнейшего, изучение процесса рассеяния может дать важнейшую информа- информацию о характере взаимодействия между частицами. Изучение процессов рассеяния является в настоящее время основным экспериментальным методом ядерной физики. Иссле- Исследование взаимодействия частиц, например, быстрых электронов или протонов с ядрами, обычно осуществляется следующим пу- путем: пучок частиц, имеющих определенные свойства и известную скорость, падает на образец вещества, содержащий частицы дру- другого сорта. Наблюдая пучок рассеиваемых частиц, можно сде- сделать заключение о характере взаимодействия, которое привело к рассеянию. При такой постановке опытов рассеяние имеет характер мас- массового процесса. Наблюдается поведение пучка, обычно содер- содержащего огромное число частиц. Однако в основе процесса ле-
§ 43] РАССЕЯНИЕ ЧАСТИЦ И ИЗЛУЧЕНИЕ ПРИ РАССЕЯНИИ (91 жит индивидуальное взаимодействие между рассеиваемой и рас- рассеивающей частицами. Поэтому процесс рассеяния необходимо характеризовать величиной, не зависящей ни от свойств падаю- падающего пучка, аи от свойств материала рассеивателя, например, его плотности, но определяемой исключительно взаимодействием одной рассеиваемой и одной рассеивающей частиц. Будем характеризовать падающий пучок его интенсивностью или плотностью потока частиц /0 = nvn, где п — число частиц в единице объема пучка, а и0—их скорость; /о равно, очевидно, числу частиц, проходящих через 1 см2 сечения пучка в 1 се- секунду. Выберем положение рассеивающей частицы за начало коор- координат. Пусть через площадку, видимую из рассеивающего центра под телесным углом du, проходит в единицу времени dN рас- рассеянных частиц. Определим основную величину, характеризую- характеризующую процесс рассеяния — дифференциальное эффективное сече- сечение рассеяния da, как отношение *»—IT" t43-1) Эффективное сечение имеет, очевидно, размерность площади. Тогда число частиц пучка, рассеянных в угол dtt за время dt объемом рассеивателя V, равно dNaO4H = daI0pVdt, D3,2) где р — плотность числа частиц (pV — полное число рассеиваю- рассеивающих частиц). Если рассеяние происходит без изменения энергии рассеи- рассеиваемых частиц, то, умножая числитель и знаменатель D3,1) на энергию е частицы, может представить дифференциальное сече- сечение в виде do = -?-. D3.3) 'OS где dl — поток энергии, переносимой частицами в единицу вре- времени в телесном угле rfQ, /0Е — плотность потока энергии в па- падающем пучке. Формула D3,3) совпадает с определением сече- сечения, данным в § 36. Наряду с дифференциальным эффективным сечением, рас- рассеяние характеризуют также полным сечением D3,4) = J da, где интегрирование ведется по всем возможным значениям те- телесного угла. Величину da, выражающуюся через непосредственно изме- измеряемые величины, можно связать с параметрами, характеризую- характеризующими индивидуальный процесс столкновения.
192 ДВИЖПНИП ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл. VII Рассмотрим индивидуальный акт столкновения между двумя частицами. Мы ограничимся случаем, когда внутренняя энергия частиц остается неизменной. Такие столкновения называются уп- упругими. Не следует думать, что при упругих столкновениях энергия рассеянной частицы остается неизменной. Рассеиваю- Рассеивающая частица получает от рассеянной некоторый импульс и энер- энергию, величина которых зависит от соотношения между массами частиц. • При иеупругих столкновениях, например, столкновении элек- электрона с ионом, происходит дополнительная передача энергии иону, внутреннее состояние которого изменяется. Такие про- процессы более сложны и будут рассмотрены в ч. V. Рис. 17. Сначала будем относить процесс рассеяния двух частиц к системе центра инерции. Согласно результатам предыдущего параграфа, задача об относительном движении частиц в системе центра инерции сводится к задаче о движении одной частицы с приведенной массой ц относительно неподвижного силового центра, помещенного в центре инерции. Пусть падающая частица вдали от центра инерции движется прямолинейно со скоростью v0. Ее энергия и момент соответ- соответственно равны L = = Р D3,5) где р — расстояние между силовым центром и прямой, по кото- которой прошла бы мимо него частица, если бы взаимодействие от- отсутствовало. Величина р называется прицельным параметром, или прицельным расстоянием. При заданных значениях ? и р траектория полностью опре- определена. Процесс рассеяния мы будем характеризовать углом рассеяния (отклонения) 6, представляющим угол между направ- направлением полета частицы вдали от центра до и после рассеяния (рис. 17). Очевидно (рис. 18), что угол в дополняет угол хр0 ме-
i 43] РАССЕЯНИЕ ЧАСТИЦ И ИЗЛУЧЕНИЕ ПРИ РАССЕЯНИИ 193 жду асимптотами к траектории до 180°. В силу симметрии сило- силового поля и картины движения относительно оси пучка, число рассеянных частиц, а вместе с ним и эффективное сечение рас- рассеяния зависят только от угла 0, но не от азимутального угла. Телесный угол dQ можно поэтому представить в виде dQ = 2л sin 0 dO, а число частиц, рассеянных в телесный угол dQ, соответственно равно dN = 2я/0сг F) sin 9 dQ = /0 da, A3,6) где обозначено da = 2na@)sinOdO. Поскольку траектория рассеянной частицы однозначно опре- определяется энергией и прицельным параметром (? и р), каждому углу рассеяния отвечает траек- траектория с определенным значе- значением прицельного параметра. Отсюда следует, что число ча- частиц, рассеянных на данный угол 6, равно числу частиц, имевших на бесконечно боль- большом удалении от центра дан- данное значение прицельного па- параметра. Иными словами, в телесный угол dQ рассеиваются все ча- частицы, имевшие вдали от цент- центра значение прицельного пара- Рис. 18. метра р, лежащего в интервале р, р + dp. Поэтому число рассеянных частиц наряау с A3,6) можно написать в виде dN = /02яр dp. D3,7) где 2npdp— плошадь кольца, изображенного на рис. 17 слева. Сравнивая D3,6) и D3,7), находим аF) = - D3,8) Поскольку большим значениям р отвечают малые отклонения 0, а сечение по смыслу должно быть величиной положительной, мы написали знак абсолютного значения при производной. Интегрируя формулу D3,8) слева по углам рассеяния в интер- интервале от 0 до я, а справа по соответствующим значениям р, т. е. 13 В- Г, Леоич, том I
194 ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл. VII в интервале от р(9) до нуля, получаем важное соотношение F) sine rf8. D3,9) Для вычисления дифференциального эффективного сечения необходимо установить связь между прицельным параметром р и углом рассеяния 6. Для этого достаточно рассчитать траекто- траекторию и найти зависимость угла i\>o между асимптотами от пара- параметра р. Общая формула D2,17) дает Пределы интеграла определяются из следующих соображений: \ро представляет изменение угла i|) при пролете частицы по всей траектории. Траектория имеет две ветви — приближение частицы от бесконечности до точки наибольшего приближения (точки остановки) Го и удаление от точки Го до бесконечности (см. рис. 18). Траектория частицы всегда симметрична относительно точки остановки г0. Это следует из обратимости процесса рассея- рассеяния — частица, движущаяся в обратном направлении, должна уйти по той асимптоте, по которой движется частица в прямом направлении (см. рис. 18). Поэтому интеграл по траектории можно написать в виде суммы двух равных интегралов, взятых в пределах от г0 до бесконечности: где г0 — корень уравнения E = V(ro) = U(rQ) + ^f. D3,12) го Поскольку угол рассеяния Q = n — ^0, формулы D3,11) и D3,12) связывают искомое значение 0 с параметрами столкно- столкновения — величинами Е и р при произвольном виде потенциаль- потенциальной энергии U, зависящей только от расстояния г. Рассмотрим, в частности, случай кулоновского отталкивания U __ J_?i?2_|_
§13] РАССЕЯНИЕ ЧАСТИЦ И ИЗЛУЧЕНИЕ ПРИ РАССЕЯНИИ 195 Выражения D3,11) и D3,12) приобретают при этом вид E^lUflL + Ulf, D3,13) или Вводя новую переменную z — —, получаем При вычислении подставлено значение г0 = — из выражения D3,14). Обращая arccos, находим sin4 2 Формула D3,18) дает дифференциальное сечение рассеяния ча- частиц, отталкивающихся по закону Кулона. Поскольку о ~(е\е2J, ясно, что в случае притяжения (при С > 0) получается иден- идентичный результат. Найденное выражение для сечения носит название формулы Резерфорда. Она была получена в свялн 13*
196 ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл. VII с опытами по рассеянию а-частиц на атомах, позволившими Ре- зерфорду установить ядерную структуру атомов. Формулу D3,11) можно обратить и найти вид функции U(r) с помощью известных из опытных данных величин. Для этого нужно рассматривать D3,И) как интегральное уравнение отно- относительно неизвестной функции U(r). При некоторых (весьма общих) допущениях о виде функции U(r) уравнение D3,11) до- допускает решение '). Именно, запишем 8 в виде Относительно U(r) мы будем предполагать, что она убывает с ростом г при г —> оо. Введем новую функцию \ D3,20) и перейдем от интегрирования по г к интегрированию по F. Так как и, в силу D3,12), Пго) = ^-Ер1)г1 = Р2, D3,21) то Написав rflnr2 d . !гг\ . d\nF dF ~~ dF Ш \Tj+ rfF ' находим оо d , ( F \ .„ oo rflnF рг ¦ - r p2 ^-P' Последний интеграл легко вычисляется, так как ¦ = ~arctg p р р р' ') Мы следуем работе О. Б. Ф и р с о в а, ЖЭТФ, 24, 279, 1953.
§43] Поэтому РАССЕЯНИЕ Умножим обе ЧАСТИЦ оо Р2 части D И ИЗЛУЧЕНИЕ F' dln7T dl 1 dF' Ур' ПРИ -р2 РАССЕЯНИИ 1Я 9Я\ НЯ МИПЖИТРЛ!. 197 D3,23) и поо- интегрируем по параметру р в пределах от р = Y~F до р —> оо. Тогда имеем dF' Изменим порядок интегрирования по р и по F', написав d In (^] J rfF' J /-P4- Далее, F n J. f 2 J iatm: F') _ Fp' 2 1 (/r + f')_( — arccos -— - 2 To обстоятельство, что в результате интегрирования по р полу- получился интеграл, не зависящий от F', позволяет свести интегри- интегрирование по F' к элементарному преобразованию. Для получения более прозрачного результата прежде, чем сделать подстановку пределов, вернемся к переменной г, написав При этом согласно сделанному выше допущению мы положили U —>0 при ггг*оо.
198 ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл VII В итоге приходим к равенству оо Я1П12=_ jy==> D3>24> VT Р или — = ехр 6 (р) dp Vp Последнее выражение содержит интегрирование только по р. Если известна зависимость аF), в силу D3,17) задана также- функциональная зависимость G(p). Поэтому формула D3,25) представляет задание функции F(r) в неявном виде. Особенно простой результат получается для рассеяния ча- частиц с большой энергией, для которых ?/(r)<c E при всех зна- значениях г При этом формулу D3,24) можно переписать, восполь- воспользовавшись равенствами 1П ' • _, г у ? ; ., U(г) Г 6(p)dp „ Г 6(p)rfp J ,/~ /, i/(r)\ 2 ~ J Кр^^Г2 ' У1AI Тогда для искомой потенциальной энергии находим <43-26> Приведенные выше расчеты эффективного сечения рассеяние были выполнены в системе координат центра инерции. Для прак- практического их использования необходимо осуществить переход к лабораторной системе отсчета. Важность этого перехода видна из сравнения общей картины процесса рассеяния с точки зрения обеих координатных систем. В системе центра инерции каждая из частиц, падающая и рас- рассеивающая, движутся по траектории, определяемой формулой D3,10). Из равенства нулю полного импульса системы из двух частиц, отнесенного к координатам центра инерции, следует, что обе частицы движутся в противоположных направлениях с рав- равными импульсами (рис. 19). Наоборот, с точки зрения лабора- лабораторной системы падающая и рассеивающая частицы неэмлша-
<§ 13] РАССЕЯНИЕ ЧАСТИЦ И ИЗЛУЧЕНИЕ ПРИ РАССЕЯНИИ 199 лентны. До столкновения рассеивающая частица была непо- неподвижна, после столкновения она приходит в движение (рис. 20). Нашей задачей является установление связи между углами Од и = в и 0л = О. Для этого совместим на одном рисунке ско- скорости рассеянной частицы после соударения в обеих системах Рис. 19. Рис. 20. координат — центра инерции (v'n и) и лабораторной (sr^ = *'). Очевидно, что имеют место равенства D2,4) и D2,7). Вектор R совпадает с направлением поле- полета падающей частицы. Поэтому искомые углы равны соответ- соответственно (рис. 21) D3,27) у^и где штрих означает, что значения Рис 2i. скорости берутся после столкно- столкновения и имеющийся в D2,4) индекс 1 нами для краткости опущен. Из рис. 21 ясно, что Согласно D2,4) и D2,7) можем написать m, "о. Подставляя в D3,28), имеем trrft sinO,t.H D3,29)
200 ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл. VIB Формула D3,29) устанавливает1) связь между углами 0Ц. а и 6Л. Заметим, что если масса рассеивающей частицы m2?S>mu то 6л ~ 6ц. и- Смысл этого результата очевиден — очень тяжелая частица не получает импульса от пролетающей и остается не- неподвижной: система центра инерции совпадает с лабораторной. Зная связь между углами рассеяния в лабораторной системе и системе центра инерции, можно пыразить соответствующие эф- эффективные сечения друг через друга. Именно, написав число ча- частиц, рассеянных в телесном угле dQa и dQn. и в двух системах координат, 0M sin Влс1Ъл, dN = 2л/0<тц. и (ец. „) sin 6„. и Й6Ц. и, находим искомую связь между сечением в системах коорди- координат— в лабораторной (ал) и центра инерции (сц. „): ^;". D3,зо) Полное сечение, в отличие от дифференциального, является од- одним и тем же во всех координатных системах: о = 2я J од (8Д) sin 9Д Й6Л = 2л J оц. и (вд. „) sin 0ц. „ Й8Ц. „. D3,31) Остановимся еще на вычислении энергии, теряемой рассеи- рассеиваемой частицей. Из того же рис. 21 на основании теоремы коси- косинусов можем написать К. иJ = «У + & - Щ<)cos 0л- D3,32) Подставляя значения R и &ц и и обозначив энергии рассеи- рассеиваемой частицы, отнесенные к лабораторной системе координат до и после соударения, соответственно через Е] и ?', находим Е\ 2ц у Ег, т.,— т, _L_ JiJ-^cose,-^ !- = 0. D3,33) Уравнение D3,33) определяет зависимость Е\ от угла рассея- рассеяния 0л и масс частиц. Наибольшая потеря энергии имеет место при Ш\ = т2 и 9л = -у (при этом 0Ц. и = л). В этом случае Е\ = 0 и энергия полностью передается рассеивающей частице. ') Подчеркнем, что это относится только к упругим столкновениям, таи как при таких столкновениях относительная скорость до и после столкно- ве/гия имеет значение у0-
<§ 43] РЛССЕ-ЯНИЕ ЧАСТИЦ И ИЗЛУЧЕНИЕ ПРИ РАССЕЯНИИ 201 Мы не останавливаемся на некоторых деталях теории рас- рассеяния, изложение которых имеется в цитированных руковод- руководствах. Перейдем теперь к расчету излучения, возникающего при пролете пучка заряженных частиц мимо неподвижных зарядов. Это явление, называемое тормозным излучением, служит для получения рентгеновских лучей (со сплошным спектром) и играет важную роль в механизме торможения частиц высоких энергий, движущихся в веществе. Поскольку основной интерес представляют именно частицы .высоких энергий, мы ограничимся этим случаем. При достаточно большой энергии летящей частицы угол рас- рассеяния ее мал, если исключить маловероятные процессы лобо- лобового соударения. Считая траекторию почти прямолинейной, можно упростить соответствующие формулы. Рассмотрим прежде излучение одной частицы. Поместив на- начало координат в рассеивающий центр, можно написать следую- следующее выражение для компонент сил, действующих на пролетаю- пролетающую частицу: Fx = -^-x, Fy = -pS-y. D3,34) Поскольку движение происходит в плоскости (х, у), компонента силы Fz отсутствует. Считая, что скорость движения частицы постоянна и не из- изменяется при рассеянии, а отклонение от прямолинейной траек- траектории мало1), можно в формулах для компонент силы поло- положить X ~ VI, у ~ р, UI . \Ч[О,О0) Энергия, излучаемая частицей в телесный угол rfQ при про- пролете мимо рассеивающего центра, находится интегрированием формулы B8,11) (в которой нужно положить тг->схэ) по вре- времени пролета. С учетом D3,35) имеем Г 1 Г •• 1 е? +Г°° -AEdQ= dldt = —rdQ [dn]2dt = г—т dQ [Fnfdx. J 4jtc3 •> 4itcJ vmi J Распишем выражение [Fn]2. Имеем {Fnf = F2 - (Fnf = F2X + F\ - {Fxnx + Fynyf = = (l - nl) Fl + (l~ ny) Fl - 2FxFynxnv, где пх и ny — компоненты единичного вектора п в направлении телесного угла dii. ') Л. Д. Ландау и Е. М. Л и ф ш и ц, Механика, Физматгиз, 1958, стр. 73.
202 ДВИЖЕНИЕ ЧАСТИЦ В ЭЛЕКТРОМАГНИТНЫХ ПОЛЯХ [Гл. VIT Нам следует теперь вычислить три интеграла. Первый и* них — x*dx J F\dx = e\e\ J Полагая — ^дф, находим Г Г х dx ere, Г J *UX i 2J (*2 + p2K ¦* p3 J COS2q> 2g q Г ее Г = —j— sin ф cos ф dcD = г p J ^P J о о Аналогично вычисляются второй и третий интегралы: оо оо — оо 0 оо J FxFy dx = 0, — оо так как FxFy является нечетной функцией х. Окончательно, Л2 1 - Л? du = —т^—т (A - и2) + 3 A - га2)} dil = Л2 1 = —гЦ-~Г D - sin2 9cos2aJ> - 3 sin2 0 sin2if} sin 9 dQ d$. D3,36) 32c' vmi p Излучаемая энергия обратно пропорциональна скорости и кубу прицельного расстояния р и довольно сложным образом зависит от углов. Простое вычисление дает для полной излучае- излучаемой энергии AT? ДС< /4С\ * (Л1^ Ч7\ На практике основной интерес представляет вычисление по- потери энергии быстрой заряженной частицы на единице пути в веществе. Рассеивающими центрами, отклоняющими частицу, являются ядра с зарядом е2 = Ze, где Z — порядковый номер элемента, а е — заряд электрона (рассеянием на электронах
¦§ 13] РАССЕЯНИЕ ЧАСТИЦ И ИЗЛУЧЕНИЕ ПРИ РАССЕЯНИИ 203 можно пренебречь). При рассеянии на каждом ядре частица из- излучает энергию, определяемую по формуле D3,37). Умножая D3,37) на число ядер на единице длины в цилиндре радиуса {>, :р + dp и интегрируя по всем прицельным расстояниям, находим для потерь энергий ,1Е Г 2n2e4,Z2e2N 7 dp 2n2Z2e2e1,N I --=- /±EnomN2xpd9 = - ' 2 4= чз 2 dx J 3cm,» J p 3cmiv p 'мин D3,38) где N— число ядер в I см3 и pMim — некоторое минимальное значение прицельного расстояния. Если бы не существовало минимального предельного расстоя- расстояния, формула D3,38) приводила бы к бессмысленному резуль- результату: потери энергии частицы вследствие излучения на пути в веществе были бы бесконечно большими. В действительности, оказывается, однако, что законы классической физики стано- становятся неприменимыми на малых расстояниях от ядра. Расчет минимального значения прицельного параметра может быть проведен только на основе квантовой механики (см. также § 17 ч. II).
ЧАСТЬ IГ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ ГЛАВА I ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ § 1. Возникновение и значение теории относительности Развитие теории электромагнитного поля в конце XIX и на- начале XX века и усовершенствование экспериментальных мето- методов изучения электромагнитных процессов позволили исследова- исследователям приступить к настойчивым поискам непосредственных доказательств существования гипотетического эфира. В рамках данной книги мы не можем описывать историю этих поисков, которые привели не к обнаружению эфира, но к развитию нового физического мировоззрения и к полному отказу от си- системы представлений о пространстве и времени, установившихся в физике в конце прошлого века. Эта система представлений, которую принято называть клас- классической, была тесно связана с успехами классической меха- механики. Кратко принципы классических воззрений в физике можно выразить следующими словами: 1. Всякое физическое явление можно считать изученным только тогда, когда построена его механическая модель. 2. Единственно возможный вид физической закономерно- закономерности— динамическая закономерность классической механики. Как известно, в классической механике принимается, что зада- задание действующих сил и начальных Условий полностью опреде- определяет движение любой механической системы. Таким образом, начальное состояние полностью предопределяет поведение си- системы в любой последующий момент времени. Это утверждение и составляет содержание понятия о динамической закономер- закономерности. 3. Все физические процессы происходят в пространстве и во> времени, причем свойства пространства и времени установлены в классической механике; всякая физическая теория должна строиться по образу и подобию механики. Предполагалось, что свойства пространства сводятся к: 1) равноправию всех направлений (изотропности),
§ 2] ПРЕОБРАЗОВАНИЯ ГАЛИЛЕЯ 205 2) равноправию всех точек (однородности) пространства, 3) его евклидовости. При этом считалось, что, хотя движение физических тел всегда происходит в пространстве, тела никак не влияют на его свойства. В классической механике принималось, что можно ввести единое мировое время, текущее равномерно и одинаково, неза- независимо от состояния движения физических тел. Создание Эйнштейном в 1905 г. теории относительности привело к радикальному пересмотру представлений о свой- свойствах пространства и времени, взглядов на характер электро- электромагнитного поля, отрицанию необходимости и возможности соз- создания механических моделей для всех физических явлений. Теория относительности сыграла важнейшую роль в дальней- дальнейшем развитии современной физики, в частности, атомной и ядерной физики. Эта роль заключалась не только в использо- использовании важных соотношений теории относительности. Теория относительности впервые показала, что классические предста- представления, почерпнутые из повседневного опыта, казавшиеся на- наглядными и очевидными, оказываются несостоятельными или неполными при переходе к новым областям исследований. Поэтому с полным правом можно утверждать, что появление теории относительности знаменовало начало развития новой, не- неклассической физики. § 2. Преобразования Галилея Для того чтобы характеризовать движение тел в простран- пространстве, необходимо располагать некоторой системой физических тел, между которыми существует какое-либо, например, элек- электромагнитное взаимодействие. Кроме того, необходимо распо- располагать некоторым способом измерения времени. Возможность измерения времени дает любой периодический процесс, именуе- именуемый часами. Тогда, зная скорость света и время, требующееся для прохождения света от одного тела до другого, можно опре- определить расстояние между телами. Совокупность тел, находя- находящихся на определенных таким способом расстояниях и снаб- снабженных часами, называется системой отсчета. Только распо- располагая системой отсчета, можно говорить об определенном законе движения некоторого тела в пространстве. Если относить в каждый момент времени положение тела к системе отсчета, то совокупность всех положений тела в пространстве образует траекторию, а последовательность прохождения различных точек траектории — закон движения. В качестве системы отсчета может быть выбрана любая совокупность тел, движущихся по произвольным законам. Нас,
206 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. I однако, в дальнейшем будут интересовать так называемые инер- ниальные системы отсчета. Под инерциальными системами отсчета мы будем понимать такие, в которых справедлив закон инерции Ньютона. Иными словами, в инерциальных системах отсчета движение тел, не подверженных воздействию внешних сил, происходит равномерно и прямолинейно. Особая роль инерциальных систем отсчета связана с тем, что в них движение имеет наиболее простой вид. В неинерциальных системах от- отсчета, например, во вращающейся системе отсчета, даже про- простейшее прямолинейное и равномерное движение описывается весьма сложными соотношениями: Нашей задачей является сравнение законов движения тела в различных системах отсчета. Если некоторый физический за- закон не изменяется при переходе от одной системы отсчета к другой, то мы будем говорить, что он инвариантен относительно этого преобразования. Уже давно было установлено, что механические явления происходят одинаково во всех инерциальных системах отсчета. Иными словами, законы классической механики инвариантны относительно перехода от одних инерциальных систем отсчета к другим. Рассмотрим две системы отсчета К и К\ движущихся отно- относительно друг друга. Систему К' мы будем называть движу- движущейся, систему К — непод- ff д.- вижной. Условность такой У| у\ терминологии будет особен- особенно ясна из дальнейшего. Легко получить соотно- соотношения, связывающие между "х1 собой скорости и поло- положения движущегося тела относительно двух инер- инерциальных систем отсчета. Рис- 22- Направим оси х и х' вдоль вектора скорости относи- относительного дзижения v. Тогда относительное движение будет про- происходить только вдоль положительного направления оси х. Совместим, кроме того, начала обеих систем в начальный мо- момент времени / = 0 (рис. 22). Для нахождения законов преобразования от системы от- отсчета К к системе К' заметим, что, согласно сказанному, в обе- обеих инерциальных системах отсчета закон инерциального движе- движения некоторого тела должен иметь один и тот же вид. Именно, и обеих системах ускорение такого тела одинаково и равно нулю, т. е. х = Г - 0; у = у' = 0; г = г' = 0.
§ 2] ПРЕОБРАЗОВАНИЯ ГАЛИЛЕЯ 207 Интегрируя, находим x = x' + v, y*=y'\ z = z'. B,1) Второе интегрирование дает При этом мы молчаливо предполагали, что время имеет абсо- абсолютный характер и одинаково во всех системах отсчета. Для полноты системы преобразований следует написать f-t. B,3) Формулы B,2) — B,3) именуют законом преобразования Га- Галилея, а формулу B,1)—законом сложения скоростей клас- классической механики. Разумеется, формулы B,1) — B,2) можно без труда написать и в векторной форме, не специализируя вы- выбор ориентации осей координат, в виде r = r' + v, r = r' + vt. B,4) Неизменность законов классической механики при переходе от одной инерциалыюй системы отсчета к другой математи- математически выражается в том, что они инвариантны относительно преобразований Галилея. Это означает, что если в уравнениях Ньютона dU .. 0U . .. 0U совершить замену х-*х', у-*у', z-*z', т. е. перейти от систе- системы К к системе К', они останутся неизменными, если закон пре- преобразования координат и времени представляет закон преобра- преобразования Галилея B,2) — B,3). Действительно, поскольку в уравнения движения входят только ускорения, при преобразо- преобразованиях Галилея имеем ... dU ... dV .., dU mx=~^F' nt!fB*-W' mz=~-dF' что совпадает с уравнениями движения в нештрихованной си- системе отсчета. Необходимо подчеркнуть, что системы отсчета /С и /С' со- совершенно эквивалентны. С равным успехом мы могли бы рас- рассматривать переход от системы отсчета К' к системе Л'. Таким образом, равномерное и прямолинейное движение си- системы отсчета не влияет на механические процессы, происхо- происходящие в системе материальных точек. Это утверждение носит название принципа относительности Галилея. Следует отметить, что сам термин «принцип относительности Галилея» был введеи в связи с созданием теории относительности. Термин
208 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ (Гл. I «относительность» подчеркивает полную равноценность инер- циальных систем отсчета. Термины «покой» и «равномерное и прямолинейное движение» имеют относительный характер. Толь- Только относительное движение имеет смысл в классической меха- механике. Наоборот, понятие абсолютного покоя и абсолютного дви- движения не имеют реального содержания. Принцип относитель- относительности в механике формулируют обычно словами «равномерное и прямолинейное движение системы материальных точек не влияет на внутреннее движение в системе». Принцип относи- относительности классической механики (принцип Галилея) ограничен инерциальными системами отсчета. В основе принципа относительности Галилея лежат пред- представления классической физики о свойствах пространства и времени. Этот принцип, равно как и вытекающая из него фор- формула сложения скоростей B,4), подтверждаются таким обшир- обширным опытным материалом, в частности, связанным с миром не- непосредственно окружающих нас явлений, что его принято было считать чем-то самоочевидным. § 3. Попытки определения абсолютной скорости Уже вскоре после создания теории электромагнитного поля Максвелла — Лоренца возник вопрос об ее обобщении на слу- случай движущихся тел. Существует, однако, глубокое различие между уравнениями классической механики и электродинамики. Именно, в уравнения Максвелла входит характерная ско- скорость, скорость распространения электромагнитных волн в пу- пустоте (скорбеть света). Поэтому они не инвариантны относи- относительно преобразований Галилея. В этом легко убедиться непо- непосредственной подстановкой вместо скорости б' суммы (c + v). Естественно, возник вопрос о том, относительно какой систе- системы отсчета измеряется скорость света. Классическая электро- электродинамика Лоренца давала на этот вопрос, казалось бы, одно- однозначный ответ — относительно некоторой гипотетической среды, получившей название мирового эфира. Эфиру приписывались свойства всепроникающей, однород- однородной и изотропной среды, неподвижной и заполняющей все про- пространство. В теории Лоренца принималось существование абсо- абсолютной выделенной системы отсчета. Двигаться — это значит двигаться по отношению к эфиру, а скорость движения отно- относительно эфира — абсолютная скорость. Таким образом, в отличие от классической механики, в тео- теории Лоренца была сделана решительная попытка отказаться от принципа относительности. То обстоятельство, что уравнения Максвелла — Лоренца, в отличие от уравнений Ньютона, ока-
§ 3J ПОПЫТКИ ОПРЕДЕЛЕНИЯ АБСОЛЮТНОЙ СКОРОСТИ 209 зались не инвариантными относительно преобразований Гали- Галилея, казалось непосредственным следствием отказа от прин- принципа относительности. Ясно, что основным вопросом, стоявшим перед электроди- электродинамикой на рубеже XIX и XX веков, был вопрос об опытном определении абсолютной скорости и получении прямых дока- доказательств существования эфира. Мы не можем излагать здесь историю поисков эфира, кото- которые могут до сих пор служить примером изобретательности и упорства многих исследователей. Мы рассмотрим лишь принципиальную схему двух возмож- возможных экспериментов1). Пусть на некотором теле, движущемся относительно неподвижного эфира со скоростью v, установлены источник и приемник электромагнитных волн. Если направле- направление источник — приемник совпадает с направлением движения тела относительно эфира и, то расстояние между ними / свет пройдет за время Тг = . Измеряя время Гь можно найти скорость v относительно эфира. Однако, поскольку с очень ве- велико, а доступные в конце прошлого века скорости v малы, такое измерение лежало за пределами возможной точности экс- эксперимента. Можно было, однако, сравнить время Т\ с време- временем Т2, в течение которого свет проходит такое же расстояние / в направлении, перпендикулярном к скорости о. За время Т2 приемник проходит путь (иТ2) относительно эфира, так что полный путь, проходимый светом от источника до приемника, равен У f + v2T\. Соответственно для времени 7% имеем или Заставляя интерферировать лучи, двигавшиеся от источника к приемнику вдоль направления скорости и и в перпендикулярном направлении, можно было определить разность 7\ и Г2 и ско- скорость v с большой степенью точности. В 1881 г. подобный опыт был осуществлен Майкельсоном, который воспользовался в качестве скорости источника ско- скоростью орбитального движения Земли. ') См., например, Абрагам-Беккер, Электронная теория, ИЛ, I960; В. Па и овский и И. Филлипс, Классическая электродинамика, Физмат- гиз, 1963 и, особенно, Л. И. Мандельштам, Собр. соч., ч. V, Изд-во АН СССР, 1950. В этих книгах читатель может ознакомиться как с историей вопроса, так и с фактической методикой проведения экспериментов. 14 в. Г. Левич, том L
210 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ (Гл. t Он заставлял интерферировать лучи, прошедшие пути от источника к приемнику по направлению движения Земли и в перпендикулярном к нему направлении. Заметим, что в настоя- настоящее время точность измерений молекулярной электроники по- позволяет измерить разность G"i — Т2) непосредственно, не при- прибегая к интерференции. К удивлению современников Майкельсона, никакого раз- различия во временах Т\ и 7"г не удалось обнаружить. Оказалось, что с огромной степенью точности Т\ и Т2 были равны друг Другу. Другим принципиальным экспериментом мог бы служить следующий непосредственный опыт. Пусть источник света дви- движется, а приемник покоится относительно эфира. Тогда можно непосредственно найти зависимость скорости света от скорости источника. В качестве излучения, приходящего на Землю от движущегося источника, Де Ситтер (в 1912 г.) предложил вы- выбрать излучение так называемых двойных звезд. Последние представляют дзе близкие друг к другу звезды, обращающиеся вокруг общего центра тяжести. Наблюдая скорость света, излу- излученного при движении звезды в направлении к Земле и в про- противоположном направлении (через половину периода обраще- обращения), можно было определить скорость звезды относительно эфира. Однако и здесь не было обнаружено никакого влияния движения источника на величину скорости света. Был сделан целый ряд попыток объяснения отрицатель- отрицательного результата этих и многих других, сходных с ними экспе- экспериментов (например, изменение закона взаимодействия между зарядами с величиной их абсолютной скорости, § 20). Однако вес эти попытки оказались неудовлетворительными. Реше- Решение проблемы было дано лишь в теории относительности Энн- штейна. § 4. Постулаты теории относительности Эйнштейна Отрицательный результат опыта Майкельсона побудил Эйн- Эйнштейна пересмотреть исходные понятия классической физики и прежде всего представления о свойствах пространства и времени. В результате им была создана теория относительности* именуемая также частной или специальной теорией относитель- относительности. В основу теории относительности положены два принципа или постулата: 1) принцип относительности Эйнштейна; 2) принцип существования предельной скорости распростра- распространения взаимодействий.
•§41 ПОСТУЛАТЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ ЭПНШТЕПНЛ 211 Согласно принципу относительности Эйнштейна, равномер- равномерное и прямолинейное движение тел не оказывает влияния на происходящие в них процессы. Иными словами, все законы при- природы одинаковы в инерцнальных системах отсчета. Если в не- некоторой инерциалыюй системе отсчета произволный закон при- природы выражен в виде некоторого уравнения, в котором физиче- физическая величина является функцией координат и времени, то, совершая преобразование координат и времени к другой инер- инерциалыюй системе отсчета, мы обязательно должны получить ту же самую функциональную зависимость физической вели- величины в зависимости от новых координат и времени. Это утвер- утверждение кратко формулируется словами «законы природы ин- инвариантны (неизменны) при переходе от одной инерциальной системы отсчета к другой». Совершенно очевидно, что принцип относительности Эйнштейна является обобщением принципа от- относительности Галилея. Последний устанавливал относитель- относительность инерциального движения и невозможность введения по- понятий абсолютного движения и абсолютного покоя в рамках классической механики. Отрицательный результат опыта Май- кельсона, как это впервые осознал Эйнштейн, означал, что по- понятия абсолютного движения и покоя не имеют смысла и в тео- теории электромагнитного поля. Однако имеется глубокое различие между принципом отно- относительности Галилея и Эйнштейна. В последнем переход от од- одной инерциальной системы отсчета к другой не связывается с формулами преобразования координат и законом сложения скоростей классической механики. Действительно, например, уравнения Максвелла не удовлетворяют этим преобразованиям. Поэтому закон преобразования координат и времени при пере- переходе от одних инерциальных систем отсчета к другим в теории Эйнштейна должен быть найден заново. Для этой цели служит второй постулат теории относительности, утверждающий, что любые взаимодействия между телами распространяются в пу- ¦стоте с универсальной конечной скоростью, равной скорости свеча в пустоте с = 3-1010 см/сек и не зависящей от движения и состояния тел. Совершенно очевидно, что этот постулат- непо-' средственно выражает результат опыта Майкельсона. Второй постулат теории относительности был тесно связан с развитием электродинамики. Оно ясно продемонстрировало несостоятельность теории дальнодействия классической меха- механики. В электродинамике было установлено, что существует конечная скорость распространения электромагнитных взаимо- взаимодействий, численно равная скорости света в пустоте. Теоретиче- Теоретические исследования, выполненные Эйнштейном значительно по- позднее в связи с созданием так называемой обшей теории отно- относительности, показали, что гравитационное взаимодействие
212 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. I также имеет характер воли, распространяющихся в пустоте со скоростью света. Нет никаких сомнений и в том, что специфи- специфическое взаимодействие между ядерными частицами имеет ха- характер близкодействия. Нельзя считать исключенным, что дальнейшее развитие фи- физики может привести к открытию новых видов взаимодействия. Однако принцип предельной скорости распространения взаимо- взаимодействий выражает гипотезу о том, что скорость распростране- распространения взаимодействий в пустоте имеет универсальный характер и связана непосредственно со свойствами пространства и вре- времени, а не с физической природой взаимодействия. Существование предельной скорости распространения взаи- взаимодействия означает, что имеется некоторая связь между про- пространственными и временными промежутками. Более наглядно эта связь будет продемонстрирована при разборе выводов тео- теории относительности. Вместе с тем, наличие предельной ско- скорости автоматически предполагает ограничение скорости движе- движения материальных тел величиной с. Если бы какие-либо ча- частицы могли двигаться со скоростью большей, чем скорость света, эти частицы могли бы осуществлять взаимодействие между телами также со скоростью, превышающей предельную. Таким образом, второй постулат Эйнштейна ограничивает зна- значение всех возможных в природе скоростей движения и распро- распространения взаимодействия величиной с. Принцип существования предельной скорости распростране- распространения взаимодействий тесно связан с принципом относительности Эйнштейна. Действительно, нетрудно видеть, что если бы ско- скорость распространения взаимодействий зависела от скорости частиц или от природы самого взаимодействия (т. е. была бы различной для электромагнитного и гравитационного взаимо- взаимодействий), принцип относительности был бы нарушен. Напри- Например, если бы скорость света зависела от скорости прямолиней- прямолинейного и равномерного движения источника света, последнюю можно было бы определить на опыте. Часто распространение взаимодействий в теории относитель- относительности называют распространением сигналов. При этом под сиг- сигналом понимают любое взаимодействие между телами, нахо- находящимися на конечном расстоянии друг от друга в состоянии относительного движения или покоя. Принцип существования конечной скорости распространения взаимодействия называют принципом существования конечной скорости распространения сигналов. Все содержание теории относительности вытекает из двух ее постулатов. В частности, из основных постулатов Эйнштейна непосредственно следуют формулы преобразования координат и времени, которые заменяют формулы преобразования Гали-
§ 5] ПРЕОБРАЗОВАНИЯ ЛОРЕНЦА лея. В настоящее время оба постулата теории относительности: подтверждаются всей совокупностью экспериментальных дан- данных, полученных при изучении атомных и ядерных процессов,, движения быстрых частиц в приборах и инженерных сооруже- сооружениях (ускорители) и т. п. В дальнейшем мы приведем целый ряд примеров, иллюстри- иллюстрирующих последнее утверждение. § 5. Преобразования Лоренца Исходя из сформулированных выше постулатов теории от- относительности Эйнштейна, можно найти закон преобразования, связывающий между собой пространственные координаты и' время в двух системах отсчета, движущихся прямолинейно и равномерно относительно друг друга. Пусть х, у, z, t и х', у', z', f — координаты и время в инер- циальных системах отсчета К и К', а и — скорость их относи- относительного движения. При этом нет никаких оснований полагать, что время в си- системе К' совпадает со временем в системе К, как это безогово- безоговорочно принималось в классической физике. Для простоты выкладок мы выберем направление скорости за направление осей х и х', как это показано на рис. 22. Предположим, что в некоторый момент времени С в точке- с координатами (х', у', г') происходит некоторый физический процесс, который мы для краткости будем именовать собы- событием. Нашей задачей является нахождение «координат» это- этого события в системе отсчета К, т. е. нахождение величин (х, у, z, t), характеризующих тот же физический процесс в си- системе К- Для установления аналитической связи между величинами (x,y,z,t) и (л/, у', z', t') рассмотрим распространение сфериче- сферической электромагнитной волны в обеих системах отсчета. Выберем за начало отсчета времени /=0 тот момент, в ко- который начало координат системы К' совпадало с началом ко- координат системы К. Пусть в момент t = 0 из начала координат начала распро- распространяться сферическая электромагнитная волна. В системе К уравнение волновой поверхности имеет вид х2 + г/2 + г2 — c2t2 = 0. E,1). Поскольку, согласно принципу относительности Эйнштейна, за- закон и скорость распространения волны должны быть одинако- одинаковыми во всех инерциальных системах отсчета, наряду с E,1) с равным правом можно написать уравнение сферической волны
2М ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ (Гл. I в системе К': (х'У + {y'f + (z'f - с1 {t'f = jc2 + у2 + г2 - сН1 = 0. E,2) Формулы преобразования координат и времени должны, во-первых, не нарушать соотношений E,1) и E,2), а во-вторых, быть линейными. Требование линейности связано с однородно- однородностью пространства, в котором не существует каких-либо точек, выделенных по своим свойствам. Заметим прежде всего, что поскольку движение системы К' происходит только вдоль оси х, преобразование координат (у, г) должно иметь вид / = ;/; zf = z. E,3) Закон преобразования х' через х можно написать, исходя из следующего соображения: если в момент времени t=0 начала систем координат К и К' совпадали, то координата плоскости х' — 0 в системе К запишется так: х = vt. Следовательно, в са- самом общем случае можно написать x' = a{v){x-vt), E,4) где коэффициент a{v) может зависеть лишь от скорости отно- относительного движения. Me делая никаких произвольных допущений о совпадении времени в двух системах отсчета, мы можем представить f в виде линейной однородной функции х и /: f = frt+;Y.v. E,5) Коэффициенты р и у могут, вообще говоря, зависеть от скоро- скорости v. Если бы оказалось, что у—0, а Э=1, то мы вернулись бы к преобразованиям Галилея. Для определения коэффициентов а, E и у, отвечающих тре- требованиям принципа относительности Эйнштейна, мы должны подставить E,4) и E,5) в E,2). Это дает о?{х — vtJ+y2+z2 — c2(p/+v*J = x2 + i/2-fz2 — сЧ2. Для выполнения тождества необходимо приравнять коэффи- коэффициенты при х2, i2 и xt: aV - с2р2 = - с\ > = 0-
§5] ПРЕОБРАЗОВАНИЯ ЛОРЕНЦА 215 Из этих трех уравнений находим неизвестные величины о, Р и \i: av y-r При этом всюду мы выбрали положительный знак корня. Подставляя значения а, р и у в формулы преобразования координат E,4) и E,5) и учитывая E,3), находим = . E,6а> = У, E,66) = г, E,6в) V = r-L-т (б,6г> Формулы E,6а) —E,6г) носят название формул преобразования Лоренца. Согласно принципу относительности Эйнштейна эги преоб- преобразования должны заменить преобразования Галилея. Прежде чем перейти к обсуждению следствий из преобра- преобразований Лоренца, напишем формулы обратного преобразова- преобразования от штрихованных к нештрихованным величинам. На осно- основании принципа отрюсительности Эйнштейна системы отсчета К к К' совершенно равноправны. Мы могли бы повторить все предыдущие рассуждения, приняв за исходную систему К', я не К; при этом, однако, скорость относительного движения равна (—у), а не и. Поэтому получаем E,7а) ,2 У У', E,76) z = 2f, E,7в) E,7г)
21G ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. [ Тот же результат получается, если уравнения E,6а) — E,6г) разрешить относительно нештриховалных величин. Важность следствий, проистекающих из преобразований Ло- Лоренца, заставляет нас еще раз подчеркнуть, что в основу их вывода положен лишь принцип относительности Эйнштейна, принцип постоянства предельной скорости распространения взаимодействий и допущение об однородности всех точек про- пространства и времени. Эти положения в настоящее время под- подтверждены огромным опытным материалом и их обоснованность не подлежит сомнению. Замечательной особенностью преобразований Лоренца яв- является то, что при относительных скоростях движения, малых по сравнению со скоростью света, они переходят в преобразова- преобразования Галилея. Действительно, при У -С с можно пренебречь ве- личинами второго порядка малости, содержащими 1 — I , и напи- написать х « х' + vt, V « t, что совпадает с формулами B,2) и B,3). Таким образом, в предельном случае v «С с законы преобра- преобразований теории относительности и классической механики сов- совпадают. Это означает, что теория относительности не отвергает преобразования Галилея как неправильные, но включает их в истинные законы — преобразования Лоренца — как частный случай, справедливый при скоростях движения, малых по срав- сравнению со скоростью света. В дальнейшем мы увидим, что это отражает общую взаимо- взаимосвязь между теорией относительности и классической физикой. Законы и соотношения теории относительности переходят в за- законы классической физики в предельном случае малых (по срав- сравнению со скоростью света с) скоростей. § 6. Следствия из преобразований Лоренца. Пространственные и временные промежутки Преобразования Лоренца приводят к выводам, коренным об- образом противоречащим привычным представлениям о свойствах пространства и времени, сложившимся на основе повседневного опыта и сформулированным нами в § 2. Действительно, из пре- преобразований Лоренца непосредственно вытекает, что понятия пространственного и временного промежутков являются относи- относительными. Иными словами, понятия «размер тела» или «время, прошедшее между двумя физическими явлениями», не имеют -абсолютного характера и различны для разных систем отсчета. Рассмотрим прежде всего понятие пространственной протя- протяженности (длины). Пусть в некоторой системе К' покоится не->
5 6] СЛЕДСТВИЯ ИЗ ПРЕОБРАЗОВАНИИ ЛОРЕНЦА 217 которое тело, которое мы в дальнейшем будем именовать мае* штабом. На масштаб не действуют какие-либо силы, которые могут его деформировать и изменить его размеры. Длину мас- масштаба в направлении движения (оси *'') обозначим через LQ. Эту длину, измеренную в той системе отсчета, в которой мас- масштаб покоится (система К'), мы будем называть собственной длиной масштаба. С помощью преобразований Лоренца найдем длину масштаба в системе отсчета К, т. е. длину масштаба, дви- движущегося относительно системы К со скоростью v. Пусть в си- системе К' координаты начала и конца масштаба будут соответ- соответственно х\ и х'т Найдем эти координаты в системе К. Поскольку масштаб движется относительно системы от- отсчета К, для измерения его размеров необходимо зафиксировать координаты его начала и конца в один и тот же момент времени, измеренного в системе отсчета К. Для фактического осуще- осуществления этого измерения можно было бы зафиксировать в мо- момент времени / положения начала и конца масштаба с помощью светового сигнала, выходящего из системы К.'. Пусть в некоторый момент времени t в системе К начало и конец масштаба имеют координаты х\ и х2. С помощью фор- формулы E.6а) находим V = Вычитая, имеем к' — х' или, обозначая разность координат начала и конца масштаба (длину масштаба в системе К) через L, получаем F,1 У Мы видим, что длина масштаба, движущегося со скоростью v по отношению к системе отсчета К, оказывается меньшей, чем 1 —р- раз. Это сокращение раз- размеров тела часто именуется лоренцевым сокращением. По- Поскольку размеры масштаба в направлении, перпендикулярном. к скорости, остаются неизменными, объем масштаба оказы- оказывается связанным с его собственным объемом формулой F,2>
218 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. Г Таким образом, длина и объем масштаба, не подверженного действию внешних сил, оказываются величинами, имеющими относительное значение. Иными словами, утверждение: расстоя- расстояние между двумя точками пространства равно L, — не имеет смысла без указания, к какой системе отсчета отнесена эта ве- величина. Расстояние между двумя точками зависит от движения системы отсчета. В классической физике абсолютный характер понятия длины масштаба считался чем-то само собой разумеющимся. В этом состоит фундаментальное различие во взглядах на свойства про- пространства в теории относительности и классической физике. Следует иметь в виду, что обе системы отсчета, К и К'', яв- являются совершенно равноправными. Поэтому если масштаб по- покоится в системе К, то его длина в системе К' будет меньше, чем в системе К в том же отношении. Имеется полная взаимность между обеими системами отсчета. В этом можно убедиться не- непосредственным вычислением с помощью формул преобразова- преобразования Лоренца E,7а) — E,7г). Нетрудно показать, что отрицательный результат опыта Май- кельсона автоматически следует из наличия лоренцева сокраще- сокращения. Действительно, при прохождении света вдоль направления движения Земли и в обратном направлении, с точки зрения не- неподвижного наблюдателя (к которому относится все рассужде- рассуждение § 3), длина I должна быть уменьшена в l/l/ 1 —V Раз« При этом время Т\ прохождения лучом света полного пути равно, с точки зрения неподвижного наблюдателя, 21 V с2 21 Соответственно, разность времен Т2 — 7*1 = 0. Необходимо подчеркнуть, что сокращение длины — сжатие тела в направлении движения — имеет чисто кинематический характер. В теле не возникает каких-либо внутренних напряже- напряжений, вызывающих деформацию тела. В этом смысле можно го- говорить о «твердом» или, точнее, недеформируемом теле в теории относительности. С другой стороны, понятие абсолютно твердого тела несовместимо с выводами теории относительности. Действи- Действительно, если допустить существование абсолютно твердого тела, т. е. тела с неизменными расстояниями между всеми образую- образующими его частицами, то такое тело можно было бы использовать
§6] СЛЕДСТВИЯ ИЗ ПРЕОБРАЗОВАНИЙ ЛОРЕНЦА 21 * для передачи взаимодействия с какой угодно большой ско- скоростью. Удар по одному его концу передавался бы к другому концу с бесконечно большой скоростью. Поэтому говорят, что с точки зрения теории относительности невозможно допустить существование абсолютно твердых тел, даже как некоторой идеализации. Такому же фундаментальному изменению подвергается в теории относительности представление о времени. Пусть в некоторой точке х' в системе К' происходит некото- некоторый физический процесс в течение промежутка времени где t\ и i'2 время начала и конца процесса. Тогда в системе К для моментов t\ и h можно написать / УХ1 г УХ' 2 ~~<? . * _ 'с2 , » м — ¦ Вычитая, находим промежуток времени, прошедший от на- начала до конца процесса в системе К: ^— . F,3) Время Д/о, измеренное в системе отсчета, движущейся вместе с телом, в котором происходит процесс, называется собственным временем. Формула F,3) показывает, что собственное время Д/о между двумя физическими событиями меньше, чем время, прошедшее между этими событиями в системе К в 1 :1/ 1 — -V раз. В теории относительности принято обычно говорить о срав- сравнении хода часов в различных инерциальных системах отсчета. При этом под часами понимают произвольный периодический процесс. Тогда можно сказать, что время, показываемое часами, зависит от скорости их движения. Движущиеся относительно не- некоторой системы отсчета часы, с точки зрения этой системы, идут медленнее, чем часы, покоящиеся в этой системе отсчета (но совершенно идентичные с движущимися). Таким образом, в отличие от ньютоновской физики, течение времени оказывается зависящим от состояния движения. Не су- существует универсального мирового времени, и понятие проме- промежутка времени между двумя физическими событиями оказы- оказывается относительным. Необходимо туг же подчеркнуть, что
•220 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. t ¦имеется полная взаимность между системами отсчета К и К'. Предыдущие рассуждения можно было бы обратить. Если физический процесс происходит в точке х в системе К и имеет длительность Д^, то в системе К' он будет иметь длительность VX . VX /.-I- /¦-¦? /.-¦?' как это видно из преобразований Лоренца E,6а) — E,6г). Формула F,3) для изменения хода часов была проверена на опыте несколькими способами. Наиболее наглядным из них яв- является следующий. В космических лучах наблюдается распад положительного (л+-мезона и отрицательного [г~-мезона (с мас- массой 215 электронных масс) на позитрон (электрон) и два ней- нейтрино. При этом наблюдался распад ц-мезонов как заторможен- заторможенных почти до полной остановки, так и на лету, когда они дви- движутся со скоростью, близкой к скорости света. Времена жизни покоящегося и движущегося мезонов связаны релятивистским соотношением « П1ШЖ Поскольку v близко к скорости света, тДВИж должно быть значи- значительно больше Тпок- Ряд экспериментальных методов позволяет определить зна- значение Тпок. которое оказалось равным 2 • 10~6 сек. Если бы время жизни мезонов не зависело от скорости, они пролетали бы путь, равный v • Тпок ~ 600 м (при v & с). В действительности, как показывают измерения, мезоны распадаются, пройдя путь около 20 км. Такому пробегу отвечает время жизни _ 20 км - (n-r, тдвиж — ~с *** ' " 1 и сек * Релятивистское изменение времени жизни оказывается в этом ¦случае весьма большим эффектом. Естественно, возникают два вопроса: во-первых, почему до появления теории относительности вся совокупность имевшихся -опытных фактов находилась в согласии с ньютоновскими пред- представлениями об абсолютном характере длины тела и о едином мировом времени и, во-вторых, являются ли сокращение разме- размеров движущихся тел и замедление хода движущихся часов ре- .альными или кажущимися.
§ 6] СЛЕДСТВИЯ ИЗ ПРЕОБРАЗОВАНИИ ЛОРЕНЦА 221 Ответ на первый вопрос весьма прост. До опытов, имевших своей целью обнаружение движения Земли относительно эфира, физики не сталкивались с процессами, происходящими с такими объектами, которые двигались со скоростью, сравнимой со ско- скоростью света с. Иными словами, скорости всех тел, наблюдав- наблюдавшихся в физике до открытия электрона, были малы по сравне- сравнению со скоростью света. При скоростях движения, малых по сравнению со скоростью света, можно с достаточной степенью точности пользоваться старыми представлениями о пространстве и времени. Более того, к моменту создания Эйнштейном теории относительности опыт Майкельсона был единственным бесспорным указанием на не- недостаточность классической физики. Как будет видно из после- последующего, за истекшие 50 с лишним лет ситуация коренным об- образом изменилась. Теория относительности стала одной из основ современной теоретической и ряда областей экспериментальной физики. Многочисленные опытные подтверждения теории отно- относительности будут частично рассмотрены ниже. В частности, атомная и особенно ядерная физика, как правило, изучают про- процессы и поведение движущихся частиц, скорости которых весьма близки к скорости света. Все основные соотношения теории от- относительности широко используются в ядерной физике для чисто практических расчетов. Некоторые из них будут приведены ниже. Переходя ко второму из поставленных вопросов, следует под- подчеркнуть, что весьма распространенные формулировки «кажу- «кажущееся сокращение масштаба» и «кажущееся изменение хода ча- часов» является неудачными. Обычно авторы стремятся термином «кажущееся» подчеркнуть чисто кинематический характер со- сокращения. Вместе с тем, сокращение масштаба и замедление хода часов представляют реальный и объективный факт, отнюдь не связанный с какими-либо иллюзиями наблюдателя. Само со- собой разумеется, что все значения длины данного масштаба или промежутков времени, полученные в различных системах от- отсчета, являются равноправными. Все они «правильные». Труд- Трудность понимания этих утверждений связана исключительно с нашей привычкой считать понятия длины и промежутка вре- времени абсолютными понятиями, когда в действительности они суть понятия относительные. Поэтому также бессмысленно спра- спрашивать, какая длина масштаба является истинной, а какая — кажущейся, как бессмысленно говорить: «в действительности данное тело движется (или покоится)». Понятия длины и про- промежутка времени столь же относительны, как и понятия движе- движения и покоя. Истинный характер сжатия движущегося масштаба можно проиллюстрировать следующим примером. Пусть имеются два
222 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ |Гл. Г заряженных тела. Если одно из тел, например А, движется вместе с системой К', то с точки зрения системы К его продоль- продольные (по отношению к направлению движения) размеры испы- испытают сокращение, поперечные останутся неизменными. Взаимодействие между телами А и Б отвечает взаимодей- взаимодействию между заряженными сферой Б и эллипсоидом А. При этом с точки зрения системы К' тело Б является сферой, а тело А — эллипсоидом. С точки зрения системы К, тело А остается сферой, а тело Б превращается в эллипсоид. Однако величина взаимодействия А — Б будет одной и той же в обеих системах отсчета. Пример расчета взаимодействия между быстра движущи- движущимися электрическими зарядами будет разобран в § 20. § 7. Закон сложения скоростей Эйншейна и преобразование углов Важным следствием преобразований Лоренца является релятивистский закон сложения скоростей, который в тео- теории относительности заменяет закон сложения скоростей Га- Галилея. Проще всего найти его, записав формулы преобразования Лоренца для дифференциалов пространственных координат и времени: Пусть х', у', г' — координаты материальной точки, движущейся в системе координат К'. Компоненты скорости материальной точки в системе К' будут ../ __ dx' . . __ dif . .., dz1 * dt' ' у df а в системе К dx % _ dy_ ш _ dz dt • иУ~ dt ' Uz~~dT'
§ 7] ЗАКОН СЛОЖЕНИЯ СКОРОСТЕЙ И ПРЕОБРАЗОВАНИЕ УГЛОВ 223 Разделив дифференциалы координат на дифференциал времени, находим dx u'+v ^ G:) "'"У '"^ d± dt -' 1 + uxv »'./^ «* urv 1+-4- c2 Формулы G,1) — G,3) носят названия закона сложения скоро- скоростей Эйнштейна. Они заменяют формулы сложения скоростей классической механики B,1). При в<с закон сложения скоростей Эйнштейна непосред- непосредственно переходит в B,1), поскольку при этом Из формул G,1) и G,2), как это, впрочем, и следовало ожи- ожидать, вытекает, что скорость света с является предельной ско- скоростью. Если, например, частица в системе К? движется вдоль оси х со скоростью и = и'х = с, то в неподвижной системе К ее скорость C + V — /* — Если частица в системе К' движется со скоростью меньшей, чем скорость света, например, и' = и'х = с - а (а > 0), а система К' движется относительно К со скоростью v = с — |$ (р>0), то скорость частицы по отношению к неподвижной си- системе К равна
224 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. I Таким образом, сумма двух скоростей, каждая из которых меньше скорости света с, всегда будет меньше скорости света. Сумма двух скоростей, одна из которых равна, а другая меньше скорости света, равна скорости света. Из закона сложения скоростей непосредственно следует, что величина угла имеет относительное значение и изменяется при переходе от одной инерциальной системы отсчета к другой. По* скольку где в — угол, образуемый вектором скорости частицы с осью х, из G,2) и G,1) находим где ы^ = м'созО', u^ = u'sin6'. Последняя формула выражает закон преобразования углов в теории относительности. Она связывает углы 0' и 6, образуе- образуемые вектором скорости с осями х' и х соответственно. В заключение следует подчеркнуть, что под скоростью тела и следует понимать такую скорость, с которой может переме- перемещаться некоторое реальное тело или распространяться реальный процесс взаимодействия (сигнал). Можно представить себе, не входя в противоречие с теорией относительности, процессы, имеющие скорость, превышающую скорость с, но имеющие ки- кинематический характер и не могущие переносить тела или осу- осуществлять взаимодействия. Рассмотрим, например, скорость движения воображаемой точки а, в которой пересекается линейка А с линейкой В, при вращении линейки В. Если угол а как угодно мал, а длина подвижной линейки как угодно велика, скорость движения точки а также может быть как угодно велика. Однако движе- движение воображаемой точки пересечения линеек не сопровож- сопровождается переносом энергии и не может служить способом пере- передачи сигналов и взаимодействий. § 8. Одновременность, близко- и дальнодействие Пусть в некоторой инерциальной системе отсчета К' в точках х\ и х'2 в некоторый момент времени V одновременно произо- произошли два физических события. С точки зрения классической фи- физики два события, являющиеся одновременными в одной системе отсчета, происходят одновременно во всех других инерциальных системах отсчета.
5 8] ОДНОВРЕМЕННОСТЬ, БЛИЗКО- И ДАЛЬНОДЕЙСТВИЕ 225 Иначе обстоит дело в теории относительности. Рассмотрим инерциальную систему К, по отношению к ко- которой система К' движется со скоростью v в положительном направлении оси х. В системе отсчета К первое событие проис- происходит в момент времени ^1 = Второе событие происходит в момент /'-¦? Следовательно, в системе отсчета К события происходят не од- одновременно, а но прошествии промежутка времени д у_^.. (8,1) Более того, в зависимости от знака (х'2 — х\), промежуток вре- времени At может быть как положительным, так и отрицательным, т. е. в системе К «первое» событие происходит раньше или позд- позднее «второго». Таким образом, понятие одновременности оказывается отно- относительным. Единственным, но очень важным исключением является слу- случай, когда два события происходят одновременно и в одном месте, т. е. в момент времени /' в точке х'. Тогда согласно (8,\\ во всех инерциальиых системах отсчета (при любом v) At = 0, т. е. оба события совершаются абсолютно одновременно. Сказанное особенно ясно иллюстрирует тот факт, что теория относительности несовместима с понятием дальнодействия. Двл события могут относиться друг к другу как причина и следствие только в том случае, когда они происходят одновременно и в одном и том же месте, как этого требуют представления о близ- кодействии. Если бы, наоборот, причина и следствие могли быть пространственно разделены (причем взаимодействие распростра- распространялось с бесконечно большой скоростью), то всегда существо- существовало бы бесконечное множество инерциальных систем отсчета, в которых следствие предшествовало причине. 15 В. Г. Левич, том I
226 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. I Следует подчеркнуть, что представление об относительности одновременности было с самого начала положено в основу тео- рии относительности (в виде принципа конечности предельной скорости распространения взаимодействий) и его можно рас- рассматривать лишь как наглядный пример внутренней согласован- согласованности теории. § 9. Абсолютные величины в теории относительности. Интервал и собственное время Теория относительности разрушила учение классической фи- физики об абсолютном характере пространства и времени. Относительный характер пространственных и временных про- промежутков казался настолько парадоксальным, что авторы ряда многочисленных популярных изложений теории относительности, появившихся в особенности в 20-х годах, передавали идейное содержание теории относительности хлестким, но абсолютно не- неверным афоризмом: «Теория относительности показала, что все в мире относительно». В действительности дело обстоит кл:< раз наоборот. Задача, которую ставит перед собой теория относительности, заклю- заключается в нахождении абсолютных, но зависящих от выбора инерционной системы отсчета законом природы '). Таким образом, теория относительности отнюдь не отрицает существование абсолютных величин и понятий. Она устанавли- устанавливает лишь, что ряд понятий, считавшихся в классической физике абсолютными, например, величины пространственных и времен- временных промежутков, в действительности являются относительными. В связи с этим часто высказывалось мнение, что само назва- название «теория относительности» неудачно, так как оно не отражает содержания этого раздела физики. Указывалось, например, что с большим правом теорию относительности можно было бы име- именовать «теорией физической инвариантности». Нужно, однако, иметь в виду, что в момент возникновения теории относитель- относительности ее критическая сторона — установление относительности пространственных и временных промежутков — представлялась более существенной и новой. Задача о нахождении абсолютного выражения законов при- природы тесно связана с нахождением инвариантных, абсолютных величин. Первой из таких величин является универсальная ско- скорость распространения взаимодействия — скорость света с. Дру- Другой, также весьма важной инвариантной величиной, является так называемый интервал. ') В обшей теории относительности, которую мы лишены возможности изложить в рамках этой книги, задача о нахождении абсолютных законов природы расширяется на любые системы отсчета.
§ 91 АБСОЛЮТНЫЕ ВЕЛИЧИНЫ В ТЕОРИИ ОТНОСИТЕЛЬНОСТИ 227 Понятие интервала в теории относительности является обоб- обобщением обычных понятий интервала (т. е. расстояния) между двумя точками и интервала (т. е. промежутка времени) между двумя событиями. Пусть в точке пространства с координатами (х, у, г) в момент времени t происходит некоторое физическое явление, которое мы будем именовать событием. В другой точке *ь У\, Zi в момент времени t\ происходит другое событие. Тогда интервалом между обоими событиями называется вели- величина s = Vc2 (*, - tf - (jc, - xf - (у, - yf - (г, - zf. (9,1) Инвариантность интервала относительно преобразования Ло- Лоренца может быть проверена непосредственным вычислением. В движущейся системе координат К' имеем sf = Vc2 {t\ - t'f - (x[ - x'f - {y\ - // - {z[ - 27. Очевидно, /v' _ v'\2 _ (*i - x)* + v2 (U - ty - 2" (*i - «) «1 -1) \Xl X) ~ 02 » c2 (tt - tY - 2v (xi - x) (/, -1) + ?¦ (*, - *)» 1 c2 Подстановка этих выражений в s' после элементарных вычис- вычислений дает s'= s. Таким образом, утверждение: «два физических события раз- разделены интервалом s» имеет абсолютный характер. Оно спра- справедливо во всех инерциальных системах отсчета. Часто рассматривают интервал между двумя событиями, происходящими в бесконечно близких точках через бесконечно малое время. В этом случае интервал между двумя событиями равен ds = \rc2dti-dx2-dy2-dz2. (9 2) Величина интервала s может быть как вещественной, так » мнимой, в зависимости от знака подкоренного выражения. Рассмотрим сначала случай вещественного интервала с2(А/J > (Дл:J+ (Д«/J+ (ДгJ. 15*
228 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл I При этом всегда можно найти такую систему отсчета, в которой два события происходят в одном месте. Для этого необходимо, чтобы имело место условие Y& (Mf - (Axf ~ (AyJ - (\zJ = В принципе оно всегда может быть выполнено при веществен- вещественном значении подкоренного выражения. Поэтому вещественные интервалы получили название «времениподобных интервалов». Очевидно, в частности, что если два события происходят с од- одной и той же физической системой, то интервал между этими событиями имеет времеииподобный характер. Действительно, за время At между двумя последовательными событиями система может пройти путь /(АхJ + (Д уJ + (АгJ < с At, поскольку ее скорость всегда меньше скорости света. В виде примера времениподобного интервала можно привести интервал между двумя событиями, представляющими последовательные показания одних и тех же часов. Мнимый интервал носит название «пространственноподоб- ного». Если два события разделены пространственноподобным интервалом, то всегда можно найти систему отсчета, в которой они происходят в один и тот же момент времени. Для этого не- необходимо, чтобы выполнялось равенстио У с2 (AtJ - (АхJ - (АуJ - (АгJ = i [(Ax"J + (At/J + (Az'J], которое всегда может иметь место при отрицательном значении подкоренного выражения слева. Вернемся теперь к определению собственного времени и по- покажем, что оно, так же как и интервал, является инвариантной, абсолютной величиной. Пусть дана инерциальная система отсчета К'. В некоторой точке х', у', г' происходят два последовательных события, разде- разделенных промежутком времени dt0. Подчеркнем, что время t0 из- измеряется часами, покоящимися в системе К', как говорят, соб- собственными часами системы К', а время dt0 является собствен- собственным временем, прошедшим между двумя событиями. Интервал между указанными двумя событиями равен, по определению, ds = /с2 (dtof - (dx'f - {dy'f - (dz'f = с dt0. Таким образом, собственное время связано с интервалом со- соотношением dh = ~ (9,3) и является инвариантом.
§ 10] ИНВАРИАНТНОСТЬ ФИЗИЧЕСКИХ ЗАКОНОВ 229 Собственное время можно выразить через время в произ- произвольной системе отсчета dt, т. е. через время, измеренное ча- часами, движущимися по отношению к К' со скоростью (—v), подставляя в (9,3) выражение для ds: ф0 - - /с2 dt2 - dx2 -dy2- dz2 = С Конечный промежуток собственного времени t0 равен t Y-^dt. (9,5) Следует подчеркнуть, что формула (9,5) выведена для случая движения часов вместе с инерциальной системой отсчета, т. е. движения с постоянной скоростью. Часто формулу (9,5) применяют к ускоренному движению, считая v функцией премени. Нужно, однако, иметь в виду, что в специальной теории относительности не может рассматри- рассматриваться ускоренное движение систем отсчета. Поэтому вели- величина t0, определенная формулой (9,5), в случае ускоренного движения не имеет смысла собственного времени, но является удобной величиной, инвариантной относительно преобразовании Лоренца. § 10. Инвариантность физических законов относительно преобразований Лоренца. Четырехмерная формулировка теории относительности Согласно принципу относительности все физические за- законы — закогы механики, электродинамики, статистической фи- физики и т. д., должны быть одними и теми же во всех инерциаль- ных системах отсчета. Это означает, что все законы физики должны быть сформулированы таким образом, чтобы они оста- оставались инвариантными относительно преобразований Лоренца. Соотношения, инвариантные относительно преобразований Ло- Лоренца, мы будем в дальнейшем именовать релятивистски- или лоренц-инвариантными. Уравнения механики, инвариантные относительно преобразо- преобразований Галилея, не удовлетворяют, очевидно, требованию инва- инвариантности относительно преобразований Лоренца и, следова- следовательно, должны быть видоизменены. Наоборот, законы электро- электродинамики — уравнения Максвелла, как это будет показано позднее, уже с самого начала были сформулированы так, что
230 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. I они оказались релятивистски-инвариантными. С точки зрения теории относительности, уравнения Максвелла являются об- образцом «правильно сформулированного» физического закона. Реализация общей программы, поставленной теорией относи- относительности,— нахождение релятивистски-инвариантной формы физических законов, оказало большое влияние на все дальней- дальнейшее развитие физики. Так, например, прогресс, достигнутый в течение последних десятилетий в области квантовой механики и особенно в области квантовой теории поля, был тесно связан с выполнением этой программы теории относительности. Следует заметить, что требование инвариантности физиче- физических законов относительно некоторых преобразований систем координат не является специфической особенностью теории от- относительности. Хорошо известно, что требование инвариантности физических законов относительно поворота системы непосред- непосредственно связано с изотропией пространства. Действительно, всякий физический закон формулируется так„ что входящие в него величины относятся к некоторой системе координатных осей. Ясно, что при этом содержание физического закона не может зависеть от ориентации координатных осей и пространстве. Например, уравнения Ньютона mx = Fx; mij = F у, m'z — Fz A0,1) не зависят от того, как ориентирована в пространстве система координатных осей (х, у, г), к которой относятся проекции сил и ускорений. При любом повороте осей этой системы координат уравнения движения остаются неизменными: при поворота каждая из проекций ускорения и силы преобразуется по одному и тому же закону, так что равенства A0,1) не нарушаются. Эта свойство инвариантности физических законов относительно по- поворота системы координат может быть более точно сформулиро- сформулировано следующим образом: в классической физике все физиче- физические законы формулируются в виде равенств типа или а = р. (Ю,ч) а« = Р/*- (Ю, 1> Первое из них содержит связь между скалярными величинами, которые остаются неизменными при повороте координатных осей. Второе связывает между собой векторные величины. При повороте координатных осей векторные величины изменяются. Именно, если для простоты записи ограничиться поворотом во- вокруг оси z на угол ф, то х-я и у-я компоненты любых векторов
•§ 10] ИНВАРИАНТНОСТЬ ФИЗИЧЕСКИХ ЗАКОНОВ 231 изменяются по известным формулам аналитической геометрии: х = х' cos ф — у' sin ф, у = х' sin ф + у' cos ф. A0>5) Поскольку, однако, по этому закону изменяются компоненты любых векторов, в частности, векторов ускорения и силы, ра- равенство A0,3) (или равенство A0,1), являющееся его частным •случаем) не нарушается. Последнее равенство показывает в общем виде, что тензор- тензорная размерность величин, стоящих в обеих частях равенства, сохраняется. Таким образом, всякий физический закон должен быть сфор- сформулирован так, чтобы он содержал только величины одинако- одинаковой тензорной размерности. В классической механике законы преобразования координат, которые должны оставлять неизмен- неизменными физические законы, сводятся к следующим: 1) Инвариантность относительно преобразования Галилея. 2) Инвариантность относительно пространственных перено- переносов и поворотов системы координат A0,5). 3) Инвариантность относительно замены / па (/ + А0. вы- ражающая однородности течения времени. 4) Инвариантность относительно замены знака времени, указывающая на обратимость законов механики, симметрич- симметричных относительно будущего и прошедшего. Теория относительности вместо условия 1) выдвигает бо- более общее требование инвариантности физических законов от- относительно преобразований Лоренца. Такую инвариантность мы часто будем именовать релятивистской инвариантностью. Условия 2)—4) сохраняются и в теории относительности. На первый взгляд может показаться, что разнообразие фи- физических законов и фигурирующих в них физических величин исключает общий подход к установлению их релятивистски- инвариантных формулировок. В действительности, однако, это не так. Для нахождения общего метода составления релятивистски- инвариантных выражений вновь обратимся к выражению для интервала ds. Введем совершенно формально величину x=ict, A0,6) которую мы будем называть четвертой координатой или мни- мнимым временем. Само собой разумеется, что т, как величина мнимая, не имеет непосредственного физического смысла. С помощью мнимого времени интервал можно представить в виде d d2 d2 d2 ds A0,7)
232 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл I В этих обозначениях преобразования Лоренца допускают новую интерпретацию. Будем считать, пока не вдаваясь в физическое содержание нашего рассмотрения, величины х, у, г, х ортогональными коор- координатами в некотором воображаемом четырехмерном про- пространстве. Преобразование Лоренца представляет такое линейное пре- преобразование четырех координат (х, у, г, т.), которое оставляет неизменной величину ds2. Нетрудно заметить, что с геометри- геометрической точки зрения величина ds2 представляет квадрат рас- расстояния между двумя точками в четырехмерном пространстве. Следовательно, преобразование Лоренца является таким линей- линейным преобразованием, которое оставляет неизменным расстоя- расстояние между двумя произвольными точками в этом пространстве. Из геометрии известно, что существует только два таких линей- линейных преобразования: преобразование параллельного переноса и вращение. Параллельный перенос представляет тривиальное преобразование, сводящееся к изменению начала отсчета си- системы кордилат х, у, z, t. Поэтому единственным линейным преобразованием, оставляющим неизменной величину интер- интервала, является поворот в четырехмерном пространстве (х, у, г, /). Ниже мы подтвердим этот вывод непосредственным вычис- вычислением. Такая геометрическая интерпретация преобразования Ло- Лоренца, принадлежащая Минковскому, позволяет непосредствен- непосредственно сделать вывод о релятивистски-инвариантной форме физиче- физических законов. Именно, для того чтобы некоторое выражение было реляти- релятивистски-инвариантным, оно должно иметь вид а = Ь, A0,8) где а и Ь.— скаляры, или аа = Ьа, A0,9) где аа и Ьа — четырехмерные векторы, имеющие четыре компо- компоненты {а=х, у, z, т), и в общем случае ¦ . A0,10) где йару- и *aBv--- — четырехмерные тензоры произвольного ранга. При поворотах координатных осей в пространстве (х, у, г, т) все величины, входящие в релятивистски-инвариант- релятивистски-инвариантное выражение, преобразуются по одному и тому же закону, так что равенства тина A0,8) — A0,10) не нарушаются. Эти условия инвариантности в случае четырехмерного простран- пространства Минковского представляют непосредственный аналог усло- условий инвариантности при повороте системы координат в реаль- реальном трехмерном пространстве.
§ If] ИНВАРИАНТНОСТЬ ФИЗИЧЕСКИХ ЗАКОНОВ 233 Необходимо подчеркнуть, что введение представления о че- четырехмерном пространстве с координатами х, у, z, х имеет фор- формальный характер. Оно отнюдь не равнозначно утверждению о существовании реального пространства четырех измерений. Временная координата т является чисто мнимой величиной, что подчеркивает ее особый характер и принципиальное отли- отличие от пространственных координат х, у, z. Тем не менее, вве- введение временной координаты т имеет глубокий физический смысл. Оно указывает на неразрывную сьязь пространства и времени, о которой мы уже говорили ранее. В дальнейшем мы должны будем привести к релятивистски- инвариантному виду ряд важных физических законов и соот- соотношений. Для этого необходимо найти их четырехмерное обоб- обобщение. Как именно это следует делать, будет видно на конкрет- конкретных примерах. Предварительно убедимся, что преобразование поворота в четырехмерном пространстве (х, у, г, т) идентично преобразо- преобразованию Лоренца. Для простоты записи мы будем, как и прежде, считать, что движение инерциальных систем координат совер- совершается в направлении совмещенных осей х и х'. При четырех- четырехмерной интерпретации это отвечает повороту в плоскости (х, х) при неизменной ориентации осей (у, z). Если обозначить через ср угол поворота, то аналогично A0,5) можно написать связь между исходными координатами (х, х) и преобразованными координатами (х', х'): х — x'cosqp — x'sinqp, A0,11) т = T'coscp + Jt'sincp. A0,12) Угол поворота ф должен, очевидно, быть различным при раз- разных значениях скорости о. Напишем преобразования A0,11) и A0,12) для начала координат системы /(', т. е. точки х' — 0. Имеем, очевидно, Разделив верхнее выражение на нижнее, получаем или где v — скорость равномерного движения начала координат си- системы К' (точки х' — 0) относительно системы координат К- Из
234 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл Т равенства A0,13) можно без труда найти значения величин sin ф и cos ф, входящих в формулы A0,11) и A0,12): V 1 + tg21 tgcpcosqi = При этом /-¦?" x'-i-V с A0,14) A0,15) Переходя от т к времени t, мы видим, чго формулы A0,14) и. A0,15) совпадают с преобразованиями Лоренца. Нелишне подчеркнуть условный характер графического изо- изображения преобразований Лоренца. Угол поворота на рис. 23 является мнимым. Разумеется, изобразить поворот на мнимый угол мы не можем. Достоинства и недостатки графического пред- представления преобразования Ло- Лоренца ясно видны из нижесле- нижеследующего рассмотрения. Пусть в системе К' в некоторой точ- точке х' покоятся часы. Это физиче- физическое событие в момент времени rj изобразится первой точкой, в момент времени х'2 — второй точкой на оси т'. Промежуток времени Дт/ равен длине участка о г точки / до точки 2. При переходе к системе К (повороте на угол ф) отрезок Дт' переходит в отрезок Дт на оси т. Мы ясна видим, что бессмысленно говорить о том, какая система отсчета является более правильной и какой из промежутков времени, Дт или Дт', является истинным промежутком времени между двумя физическими событиями. Недостатком геометрического рассмотрения является то, что взаимоотношение между Дт и Дт' Рис. 23.
11] ЧЕТЫРЕХМЕРНЫЕ ВЕКТОРЫ И ТЕНЗОРЫ 235 на чертеже является обратным истинному: на чертеже Лт меньше, чем Дт', в действительности же он больше в отноше- отношении— , Искажение возникает потому, что мы не можем изобразить на рисунке мнимое значение угла ф и заменяем его вещественным углом. Аналогичную геометрическую интерпретацию допускают преобразование длины (рис. 24) и теорема сложения скоростей Эйнштейна. Сложению скоро- стей ti| и [<2 соответствуют два последовательных поворота в плоскости (х, т): повороту на угол ф1 отвечает переход от системы К к системе К', движущейся со скоростью V\ но отношению к /С; повороту ла угол фг соответствует пере- переход от системы К' к систе- системе К", имеющей скорость v2 относительно К'. Следователь- Следовательно, переходу от К к К", т. е. сложению скоростей v\ и и2- отвечает поворот в простран- пространстве (а:, т) на угол Скорости V] и у2 связаны с Рис 24. углами поворота ф1 и ф2 соот- соотношением A0,13), в которое входит тангенс угла поворота. Углу ф отвечает igy, равный Подставляя в последнее соотношение значения tg ф, tg ф! и tgф2 из A0,13), легко прийти к теореме сложения скоростей Эйнштейна. §11. Четырехмерные векторы и тензоры. Четырехмерные скорость и ускорение Мы перейдем теперь к составлению четырехмерных векто- векторов, которые согласно результатам предыдущего параграфа должны фигурировать в релятивистски-инвариантных выра- выражениях.
236 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. I Введем, прежде всего, четырехмерный радиус-вектор га (а=1, 2, 3, 4)—вектор, проекции которого на взаимно орто- ортогональные оси координат равны х, у, z, т. При преобразовании Лоренца — повороте в четырехмерном пространстве — компоненты вектора га преобразуется по закону r« = так чтобы квадрат вектора г\ оставался инвариантным: г\ = rara = %2 = const. Для этого коэффициенты преобразования Лоренца должны, очевидно, удовлетворять требованию часто именуемому условием ортогональности. Действительно, при этом имеем Это требование накладывает существенное ограничение на ко- коэффициенты преобразования у«В- В частном случае, когда пре- преобразование Лоренца отвечает вращению в плоскости (х>.т), при неизменных значениях у и z, для Yap легко написать, поль- пользуясь A0,14) и A0,15): о о . у < — с /-S 0 О 1 О О I о о . V о о 1 / 1--75 A1.1) Обобщим определение вектора га на случай произвольного 4-вектора. По определению, 4-вектором аа называется совокуп- совокупность величин (проекций) ах, ау, аг, ах, которые при преобразо- преобразованиях Лоренца — повороте осей в четырехмерном простран-
§ II] ЧГ.ТЫРГ.ХМПРНЫЕ ВЕКТОРЫ И ТЕНЗОРЫ 237 стве — преобразуются по тому же закону, что и компоненты радиуса-вектора га, т. е. по закону Если ограничиться поворотами в (хт) -плоскости, то, пользуясь определением YaB (или аналогией с A0,14) и A0,15)), можно написать закон преобразования в виде ах = ax+t — ax A1,2) A1,4) Для четырехмерных векторов, как и для трехмерных, можно ввести понятие скалярного произведения c = aa-ba=ab+ axbx, где с — скалярная величина. Векторы аа и Ьа называются орто- ортогональными, если их скалярное произведение равно нулю. Мы не касаемся других векторных алгебраических операций, по- поскольку они не понадобятся нам в дальнейшем. Важной характеристикой 4-вектора является скаляр, отве- отвечающий квадрату вектора, т. е. скалярному произведению: «а * аа = "а = «А + аУпу + «гаг + flt«T = invar- (I 1 >5> Инвариантность а\ непосредственно ясна из геометрических со- соображений: преобразования Лоренца являются поворотом в четырехмерном пространстве. Квадрат 4-вектора как и квадрат 4-радиуса-вектора г\, не является существенно положительным. Если квадрат вектора а?>0, то йа мы будем именовать пространственноподобным век- вектором. Вектор, у которого а\<0, именуется времениподобным. Рассмотрим определение двух важных 4-векторов: 4-вектора скорости и 4-вектора ускорения. Мы должны построить такой 4-вектор скорости, который обра- образуется в виде производной от 4-радиуса-вектора по некоторому инварианту — скаляру. Выбор этого скаляра определяется
238 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ (Гл. I тем, что при малых скоростях и «С с пространственные компо- компоненты 4-вектора скорости должны превращаться в компоненты обычной скорости. В силу сказанного, естественно определить 4-вектор скорости соотношением Для компонент 4-скорости имеем dx X dx и, v2 / icdt 2 ' t ic (Н,7) A1,9) 1~V dt При у<С<7 три пространственные компоненты скорости совпа- совпадают с компонентами обычной трехмерной скорости. Четвертая компонента скорости и является чисто мнимой. С точностью до множителя (ic) она представляет коэффициент перехода от собственного времени dt0 к времени dt. Важной особенностью 4-вектора скорости является то, что «?го компоненты не являются независимыми друг от друга. Дей- Действительно, составив квадрат вектора и2а, находим Таким образом, 4-вектор скорости является времениподобным вектором, а его абсолютная величина является заданной по- постоянной. Это свойство 4-вектора связано, разумеется, с тем, что скорость движения материальных тел не может превышать скорость света. Определим теперь четырехмерное ускорение wa как
$ 11] ЧЕТЫРЕХМЕРНЫЕ ВЕКТОРЫ И ТЕНЗОРЫ 23Э Выражая wa через скорость v и ускорение v, находим его ком- компоненты: dur dt 10) ¦ A1,14) A1,15) Простое вычисление показывает, что квадрат четырехмерного ускорения равен <= ( lcv±y >о- 01.17) Таким образом 4-ускорение представляет пространственно- подобный вектор. Дифференцируя равенства A1,11) по to, находим ^L = uawa = 0. A1,18) Последнее равенство означает, что векторы иа и wa ортого- ортогональны друг к другу в четырехмерном пространстве. Наряду с определением 4-векторов можио ввести 4-тснзоры. 4-тензором второго ранга называется совокупность величин Лар, которые преобразуются как произведение двух векторов а„-Ьа, т. е. Тензор Лар представляет совокупность шестнадцати величин (вместо девяти у тензора второго ранга в трехмерном про- пространстве). Как и у 4-вектора, т-компоненты 4-тензора, т. е. величины Аах, являются чисто мнимыми, а вес остальные — вещественными. Всякий тензор Аа§ можно разложить на сим- симметричную и антисимметричную (относительно перестановки значков) части, написав Аа$ = у (Лр + Лра) + Т (Atf - Ate) = Ah "
240 ОБЩИЕ ПРИНЦИПЫ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ Нетрудно видеть, что [Гя. I АЦ=- Преобразования Лоренца оставляют это разбиение неиз- неизменным. Важную роль в дальнейшем будут играть чисго антисим- антисимметричные тензоры. Из условия антисимметрии вытекает, что у таких тензоров имеется шесть независимых компонент, и их можно представить в виде таблицы О А, Лая - Аху О - Агт - Аи О (П.20) Пользуясь свойствами величин у<*в. можно найти закон пре- преобразования компонент 4-тензора. Мы ограничимся случаем антисимметричного тензора и подробно распишем одну из ком- компонент V А' ¦ 'УУ ху Остальные слагаемые обращаются в нуль в силу определения Yae и Аа$. Закон преобразования других компонент легко найти таким же способом. В результате для преобразования компо- компонент антисимметричного тензора получим а' -I— а' пху 1 с лцх ~7W v а' Лг„ = " Ч/г — Ауг, А'хх, v ,t ,1 , . V . 4,, +1 — А гт с , v .г хг A1,21) Важной характеристикой 4-тензороо являются их инварианты,
§ II] ЧЕТЫРЕХМЕРНЫЕ ВЕКТОРЫ И ТЕНЗОРЫ 241 т. е. комбинации, остающиеся инвариантными при преобразо- преобразованиях Лоренца. У антисимметричных тензоров второго ранга, которые нам понадобятся в дальнейшем, инвариантами яв- являются скалярные величины: !) Произведение Аа&Аа$ (квадратичный инвариант). 2) Произведение Аа^Ау^А^а (кубический инвариант). 3) Произведение Aa},AkllkAnvAva (биквадратный инвариант). Остальные скалярные соотношения выражаются через эти три инварианта или равны нулю. Так, например, скаляр /4aa; представляющий сумму диагональных элементов, равен нулю при антисимметричных тензорах.
гллвл п МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ § 12. Уравнения динамики материальной точки Перейдем теперь к рассмотрению динамики материальной точки в теории относительности. Кик и в классической механике, под материальной точкой понимают тело, размерами которого можно пренебречь. Часто, имея в виду физические приложения, мы будем говорить не о движении материальной точки, а о движении частицы. Прежде всего заметим, что закон инерции Ньютона является инвариантным относительно преобразований Лоренца. Действи- Действительно, если в некоторой инерциальной системе координат К частица движется неускоренно, то при линейном преобразова- преобразовании координат к другой системе К' движение ее также оста- останется нсускорепным. Однако уравнения динамики, инвариант- инвариантные относительно преобразования Галилея, не обладают свой- свойствами инвариантности относительно преобразований Лоренца. Для нахождения релятивистски-инвариантной формы урав- уравнений динамики их необходимо представить в виде четырех- четырехмерного соотношения типа A0,9). Инерционные свойства тела или частицы можно охарактери- охарактеризовать некоторым скаляром — инвариантной массой или массой покоя т. Значение массы покоя является константой, харак- характерной для каждого вида элементарных частиц. 4-и.мпульс ча- частицы ра определим как ра = тиа. A2,1) В компонентах имеем tnvx mvy \^Т' A2,2) icm Рх=-
¦§ 12] УРАВНЕНИЯ ДИНАМИКИ МАТЕРИАЛЬНОЙ ТОЧКИ 243 В предельном случае v <С с три пространственные компоненты импульса переходят в обычные компоненты импульса частицы: Естественным релятивистским обобщением уравнений дина- динамики Ньютона являются уравнения ^L = ^m«a = Fa> A2,3) где Fa — некоторый четырехмерный вектор, именуемый четы- четырехмерной силой или силой Минковского, и а пробегает значе- значения х, у. z, т. Релятивистски-инвариантный характер уравнений A2,3) непосредственно следует из сказанного в § 11: в правую и левую части A2,3) входят четырехмерные векторы, изменяю- изменяющиеся при четырехмерном повороте (преобразовании Лоренца) по одному и тому же закону, и скаляр in, i:e изменяющийся вовсе. В дальнейшем соотношения A2,3) мы будем именовать уравнениями релятивистской динамики. Распишем уравнения релятивистской динамики в компонен- компонентах. Имеем dpx1dmvx dt0 _ г. ИЛИ A2,4) При о<Сс уравнение A2,4) должно превращаться в обычное уравнение Ньютона. В левой части формулы A2,4) стоит производная от им- импульса но обычному времени. Потребуем, чтобы в правой части уравнения A2,4) стояла компонента обычной силы &~х. Следо- Следовательно, компонента 4-силы Fx связана с обычной силой ЗГХ классической механики соотношением Тогда формула A2,4) запишется в виде dt /'-¦? A2,6) При v <^ с формула A2,6) превращается в уравнение Ньютона. J6* S. Г. Левич, том I
244 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ ГГл [Г Аналогичные соотношения можно написать для двух других пространственных компонент: "=--=<Г,, A2,7) dt d mvz It Напишем теперь четвертую компоненту соотношения A2,3). Пользуясь A1,10), находим Л dt' Для нахождения физического смысла компоненты 4-силы Fx умножим A2,3) скалярно на иа и просуммируем по всем компо- компонентам а (а = х, у, z, т). Имеем, очевидно, в силу A1,18) dthuB а dtB ИЛИ Подставляя сюда значения FX) Fv, Fz, uy, uv, и2 и uT, имеем Отсюда следует, что FX Правая сторона последнего уравнения содержит работу, производимую силой У над частицей в единицу времени. Та- Таким образом, компонента 4-силы Fx оказывается связанной с работой трехмерной силы 9Г:
5 13] ИМПУЛЬС, ЭНЕРГИЯ И МАССА 245- Пользуясь A2,10), представим A2,9) в виде d тс2 dt /-? В правой части A2,11) произведение &~v дает работу силы над частицей, произведенную в единицу времени. Следовательно, в левой части этого уравнения стоит изменение энергии в еди- единицу времени. Мы определим, таким образом, полную энергию частицы как Е- ,"*' , ¦ A2,12). Найдем, наконец, выражение для ускорения. Уравнения дви- движения можно представить в виде d mv т dv . v d тс2 _ сг ИЛИ т dv . v dE _ у- (\0 \%\ С помощью A2,11) можно переписать A2,13) в виде W=zlf = т №—*&*))- A2>14>' § 13. Импульс, энергия и масса в релятивистской механике Обсудим теперь свойства введенных в предыдущем пара- параграфе механических величин — массы покоя, импульса и энергии. Связь между массой покоя т и трехмерным импульсом р определяется согласно A2,2) соотношением „ mv /to i\ P A30
¦246 МЕХ ШИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл II которое при и<Сс совпадает с обычным выражением классиче- классической механики. Отсюда, казалось бы, можно было заключить, что скаляр т совпадает с массой тела, движущегося с малой скоростью. Однако, как будет видно из дальнейшего, свойства инва- инвариантной массы (массы покоя) т существенно отличаются от тех, которые приписываются массе в классической механике. Именно, масса покоя не удовлетворяет закону сохранения. Су- Существуют физические процессы, при которых масса покоя ча- частиц до начала процесса не равна массе частиц, остающихся ¦после окончания процесса. Примеры такого рода явлений будут приведены ниже. Не- Необычность (с точки зрения представлений о массе в классиче- классической механике) и возможность несохранения массы покоя т особенно ясны из того факта, что наличие массы покоя не яв- является обязательным свойством частиц. Именно, не подлежит сомнению существование в природе элементарных частиц, масса покоя которых равна нулю. Та- Такими частицами являются световые кванты (фотоны). По всей совокупности имеющихся экспериментальных (см. § 16) и тео- теоретических данных частицами с массой покоя, равной нулю, являются нейтрино — нейтральные частицы, играющие важную роль в ядерных процессах (в частности, возникающие при Р-распаде). Ясно, что если в процессах взаимного превращения, которые играют важнейшую роль в мире элементарных частиц, имеются процессы перехода частиц с массой покоя, отличной от нуля, в частицы с массой покоя, равной нулю, то масса покоя не сохраняется. Такие процессы действительно происходят в при- природе и некоторые из них хорошо изучены. Соответствующие примеры будут приведены в § 16. Несмотря на свои необычные свойства, масса покоя является весьма важной характеристикой тел. Каждая элементарная частица имеет вполне определенное, не изменяющееся от экземпляра к экземпляру значение массы покоя (включая и значение, равное нулю). Поэтому масса по- покоя является фундаментальной характеристикой элементарной ¦частицы. Точно так же, как о массе покоя элементарной частицы, можно говорить о массе покоя тела, состоящего из многих эле- элементарных частиц. Если пренебречь размерами тела, можно считать его материальной точкой с массой покоя т. Вопрос о том, как связана масса покоя тела с массами покоя образую- образующих его частиц, будет обсуждаться ниже. Часто наряду с массой покоя вводят массу tn(v), именуемую релятивистской массой или просто массой и определяемую как
^ 13] ИМПУЛЬС, ЭНЕРГИЯ И МАССА 247" коэффициент пропорциональности между векторами риг»: p = m(v)v, A3,2) где Релятивистская масса зависит от скорости и потому является функцией не только свойств частицы, но и состояния ее дви- движения. Нужно, однако, подчеркнуть, что релятивистская масса m(v) не является релятивистски-инвариантной величиной. Дей- -./: w ствительно, величина 1/1 j" не является инвариантной 1 J- проще всего найти из (9,4),. учитывая, что dt0 — инвариант, а закон преобразования времени di известен). Если некоторая частица движется по отношению к двум системам отсчета с различными скоростями, то ее масса, изме- измеренная приборами, находящимися в этих системах отсчета, бу- будет различной. Энергия частицы была определена соотношением A2,12). Прежде чем перейти к обсуждению этого соотношения, заме- заметим, что из A2,12) и A2,2) вытекает следующее важное соот- соотношение, связывающее временную компоненту 4-вектора им- импульса и энергию р*=«•-!• A3-4> Таким образом рх с точностью до постоянного множителя сов- совпадает с энергией частицы. Важность соотношения A3,4) за- заключается в том, что с его помощью импульс и энергия ока- оказываются объединенными в один 4-вектор, который можно- назвать 4-вектором энергии и импульса: Pa=(px> Ру, Pz, iy)- A3'5> Компоненты 4-вектора энергии и импульса не являются реля- релятивистски-инвариантными величинами. Как трехмерный им- импульс, так и энергия оказываются относительными величинами. При переходе от одной инерциальной системы к другой ком- компоненты 4-вектора энергии и импульса преобразуются по
248 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. II формулам A1,1) — A1,4), т.е. ' + — v =-, A3,6) Р'„, A3,7) Р'г> A3,8) ртС Е + VD, ==• A3,9) Эти соотношения показывают, что при преобразованиях Лорен- Лоренца энергия и компоненты импульса выражаются друг через друга. Инвариантной величиной является не энергия и импульс порознь, но, как всегда, квадрат 4-вектора, т. е. величина fi*=P$ + Pl + Pl + P\ = Pt + Pl + Pl--§- = ^var. A3,10) Подставляя в A3,10) значения компонент импульса A2,2) и энергии A2,12), можно легко вычислить значение этого инва- инварианта, которое оказывается равным Таким образом, 4-вектор энергии и импульса является време- ниподобным вектором. Вернемся теперь к определению энергии частицы A2,12). При и<Сс формула A2,12) переходит в ^-. A3,12) Второе слагаемое совпадает с кинетической энергией частицы в классической механике. Однако при и = 0 энергия частицы вне поля сил Е0^пгс2 A3,13) оказывается отличной от нуля. На первый взгляд могло бы показаться, что такое опреде- определение энергии является произвольным. Поскольку энергия най- найдена из дифференциального соотношения A2,11), ее можно ¦определить как Е= rmci ^ +const A3,14)
$ 13] ИМПУЛЬС. ЭНКРГИЯ И МАССА 249' Если выбрать произвольную постоянную равной (—тс2), то определенная таким образом энергия при и<Сс будет совпадать с энергией частицы в классической механике. В действительности, однако, легко показать, что const сле- следует положить равной нулю, как это сделано в A2,12). Мы не можем заранее требовать, чтобы все без исключения величины релятивистской механики приобретали классический вид при у<Сс. Однако во всяком случае несомненно, что при v^ic пре- преобразования Лоренца должны совпасть с преобразованиями Галилея, и, следовательно, должен иметь место обычный закон сложения скоростей. Для того чтобы преобразование A3,6) им- импульса при t'<Cc переходило в теорему сложения скоростей классической механики, должно выполняться условие Е'^-тс2. При этом из A3,6) следует Рх = Р'х + mV или vx = v'x + v. Если бы энергия была определена формулой A3,14), а не A2,12) и при и<Сс стремилась к пределу ?'-»-0, то преобразо- преобразование Лоренца для скорости не переходило бы в формулу сло- сложения скоростей классической механики. Таким образом, теория относительности приводит к новому, весьма важному выводу: энергия покоящейся частицы равна тс2. Величину тс2 естественно назвать энергией покоя. Всякая частица или тело, обладающее массой покоя т, обладает вместе с тем энергией покоя тс2. Энергию движущейся частицы можно связать с релятивист- релятивистской массой соотношением E = m(v)c2, A3,15) аналогичным A3,13). Формулы A3,13) и A3,15), именуемые часто формулами Эйнштейна, показывают, что всякая частица, обладающая мас- массой т, одновременно имеет энергию Е. Энергия и масса нераз- неразрывно связаны между собой и пропорциональны друг другу. Часто это утверждение называют законом эквивалентности массы и энергии. Не следует, разумеется, смешивать понятия эквивалентности* и тождественности. Энергия и масса являются различными фи- физическими характеристиками частиц, и закон эквивалентности устанавливает лишь их пропорциональность друг другу. Взаи- Взаимоотношение между массой и энергией сходно с взаимоотно- взаимоотношением между тяжелой и инертной массой в классической ме- механике: обе массы неразрывно связаны между собой а
¦250 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. II -пропорциональны друг другу, но являются вместе с тем раз- разными характеристиками1). В настоящее время как формула Эйнштейна A3,15), так л -формулы A3,2) и A3,3) подтверждены обширнейшим опытным материалом и их достоверность не подлежит никакому со- сомнению. Если на частицу не действуют внешние силы, то имеет ме- место закон сохранения энергии ~ = 0 или ? = const A3,16) и импульса ^ = 0. A3,17) Из формулы Эйнштейна следует, что одновременно с законом ¦сохранения энергии автоматически имеет место закон сохране- сохранения релятивистской массы /n(c)=cons(. A3,18) В отличие от классической физики, где существуют два не- независимых закона сохранения — закон сохранения энергии и закон сохранения массы, в теории относительности имеет место ~жшь один закон сохранения — закон сохранения энергии или релятивистской массы. К физической интерпретации закона сохранения энергии в теории относительности мы вернемся еще в § 15—17. В заключение укажем, что обычно Е именуют полной энер- энергией. Это не должно повести к недоразумениям: в Е не вклю- включена потенциальная энергия частицы во внешнем поле, если таковое действует на частицы. Иногда вводят кинетическую энергию ?КИ11> определяя ее как энергию движения частицы, т.е. ?ки„ = Е - тс2 = тс2?/ '—_ - Л = [т (v) - m] с2. A3,19) Приведем еще полезную формулу, связывающую энергию и трехмерный импульс. Из A2,12) и A3,1) непосредственно сле- следует /» = -fr- (»3,20) С помощью формулы A3,13) можно найти выражение клас- классического радиуса электрона г0, введенного в ч. I. ') Подробнее см. В. А. Фок, Теория пространства, времени и тяготения, Гостехиздат, 1955, стр. 144.
§ 14] УРАВНЬ:НИЯ ЛАГРАНЖА 251 Мы обсуждали уже в § 18 ч. I фундаментальную трудность классической теории поля, связанную с проблемой собствен- собственной энергии электрона. Для энергии собственного поля элек- электрона получается выражение расходящееся при г0 -> 0. Если допустить, что вся масса электрона связана с массой, создаваемого им поля, т. е. положить U ~ тс'2 для покоящегося электрона, то для г0 получается значение совпадающее с неравенством B9,6) ч. I. Нужно, однако, иметь. в виду, что проблема собственной энергии введением радиуса электрона отнюдь не разрешается. Мы подчеркивали, что в теории относительности никакое тело, и в том числе электрон, нельзя рассматривать как идеально твердый шарик заданного радиуса. Поэтому величину г0 нельзя трактовать как истинный «радиус» электрона. Это—¦ минимальный размер области пространства, в которой еще можно пользоваться соотношениями классической теории поля, предел применимости ее понятий, заложенный в ней самой. На- Напомним, что, как было уже сказано в § 29 ч. I, фактически предел применимости классической теории поля наступает при значительно больших пространственных масштабах. § 14. Уравнения Лагранжа; функции Лагранжа и Гамильтона Как и в классической механике, уравнения движения можнсь записать в обобщенных координатах в форме уравнений Ла- Лагранжа. Для этого прежде всего следует составить функцию» Лагранжа. По определению, функция Лагранжа является величиной* производные от которой по координатам скорости представ- представляют компоненты импульса, а производные по координатам—. компоненты силы. Имеем поэтому dL
52 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл II где C/'поля — потенциальная энергия внешнего поля, зависящая только от координат частицы. Уравнениям A4,1) и A4,2) удо- удовлетворяет функция Лагранжа L = - тс2 у 1 - ~ - иполя. A4,3) Мы видим, что в релятивистской механике функция Лагранжа не представляет более разности между кинетической энергией и потенциальной. С помощью функции Лагранжа можно написать уравнения Лагранжа в обобщенных координатах с/,-: dt d<jt дЯ{ -°' A4'4) A dL _ dL - , или —гт Pt — -j— = 0, где р{ = -р обобщенные импульсы. Зная функцию Лагранжа, можно найти функцию Гамиль- Гамильтона Н. Если функция Лагранжа явно от времени не зависит, то, по определению, Qipi ~~L = г г'+ тс V 1 ~ ~^ /¦-I- тс + ?/. A4,5) ¦Скоропь может быть выражена через импульс с помощью со- соотношений A2,2), из которых следует, что = „2 = . 1 Простое вычисление дает Я = Yp2c2 + т2с* + U поЛя. A4,6) Формула A4.6) показывает, что в релятивистской механике функция Гамильтона совпадает с полной энергией, выраженной через импульс частицы.
151 МЕХАНИКА СИСТГ-МЫ ЧАСТИЦ В ТГОРИИ ОТНОСИТЕЛЬНОСТИ 253 При больших значениях импульса, когда р^тс, выраже- выражение для функции Гамильтона свободной частицы допускает важное упрощение: Н**рс. A4,7) Движение с таким большим импульсом, при котором справед- справедлива приближенная формула A4,7), называется ультрареля- ультрарелятивистским. Совершенно ясно, что для частиц с массой покоя, равной нулю, формула A4,7) является точной. Мы будем ею неоднократно пользоваться при рассмотрении процессов с уча- участием световых квантов (фотонов). § 15. Механика системы частиц в теории относительности До сих пор мы ограничивались рассмотрением одной ча- частицы. Построение механики системы частиц в теории относи- относительности является гораздо более сложной задачей. Тем не ме- менее и в последнем случае можно установить ряд важных общих законов. Систему частиц как целое можно характеризовать ее энер- энергией ?, импульсом Р и массой покоя М. Если нас интересует движение системы как целого, то, пренебрегая внутренними процессами в системе и ее пространственной протяженностью, можно считать систему одной материальной точкой. Для си- системы как целого можно написать равенство ? = Мс2, A5,1) где М—масса покоя всей системы. Поскольку всегда М>0, энергия системы частиц, как и энергия одной свободной ча- частицы, является существенно положительной величиной. Однако невозможно в общем случае найти выражения длят энергии и импульса системы через соответствующие величины для отдельных частиц или найти общие соотношения между энергией и импульсом. Взаимодействие, существующее между частицами, может приводить, например, к зависимости энер- энергии Е от времени (напомним, что Е означает сумму энергии покоя и кинетической энергии, но не включает энергию взаимо- взаимодействия). Поэтому фактическое построение механики системы частиц ограничено сравнительно немногими простейшими слу- случаями. К ним относятся: 1) система невзаимодействующих частиц; 2) система частиц, находящихся на больших расстояниях друг от друга и движущихся с весьма большими скоростями; 3) системы частиц со слабым электромагнитным взаимодей- взаимодействием. Последний случай будет рассмотрен ниже, в § 25.
254 МГХАНИКА ТЕОРИИ ОТНОСИТПЛЬНОСТИ [Гл I» В системе невзаимодействующих частиц энергия и импульс обладают аддитивными свойствами, так что A5,3)) где N — число частиц в системе и индекс i относится к каждой] частице. При этом скорости всех частиц постоянны, а следо- следовательно, постоянны во времени полная энергия и полный им- импульс системы. Нетрудно видеть, что величины Е и Р образуют 4-векгор. энергии и импульса. Действительно, можно написать Е=\- Поэтому можно ввести 4-вектор A5,4> A5,5> ;=1 Каждый член суммы р'^] является 4-вектором энергии и импуль- импульса отдельной частицы. Прежде чем перейти к обсуждению следствий из этих по- положений, покажем, что в наиболее важном втором случае свой- свойства системы взаимодействующих частиц можно свести к слу- случаю невзаимодействующих частиц. Рассмотрим систему частиц, движущихся на больших рас- расстояниях друг от друга. Поскольку, по предположению, ско- ,рости • частиц весьма велики, порядка скорости света, энергия) Ej: = '"' ,_ , вообще говоря, велика по сравнению с энер* глей их взаимодействия на больших расстояниях. Поэтому можно считать, что, как и для свободных частиц, полная энер- энергия и импульс системы выражаются формулами A5,4) и A5,5)...
§ 15] МЕХАНИКА СИСТЕМЫ ЧАСТИЦ В ТЕОРИИ ОТНОСИТЕЛЬНОСТИ 235 При сближении частиц (часто его называют столкновением) взаимодействие между частицами может становиться не малым и формулы A5,4) и A5,5) теряют свою применимость. Однако после того как столкнувшиеся частицы вновь расходятся на большие расстояния, формулы A5,4) и A5.5) опять применимы. Очевидно, кроме того, что полная энергия и импульс разошед- разошедшихся частиц не могут отличаться от этих величин до взаимо- взаимодействия. Поэтому можно записать законы сохранения в виде ¦V ,V* У ««*' = У '^?1 л 5 71 A5,8) Здесь индексы i и k относятся к частицам до и после взаимо- взаимодействия. Звездочка в суммах справа подчеркивает тот факт, что число частиц в системе до и после взаимодействия может быть различным (ср. § 17). Величины ?иР, относящиеся к частицам до и после взаимо- взаимодействия, образуют 4-вектор энергии и импульса. Согласно A3,11) можно написать инвариант для этого 4-вектора: / = Р« = 2 B P(i'f = invar = - М2с2. A5,9) Постоянство инварианта / выражает общий закон сохранения энергии и импульса. Преобразуем этот инвариант к виду, удобному для практи- практического использования. Имеем JaTf + 2 2j РаХ*' = »', а k < /, а С* ft < i k < I При этом мы провели суммирование по индексу а 4-вектора и воспользовались формулой A3,4) для />т. Перегруппировывая члены в сумме, находим *<*
256 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. II Таким образом, можно написать аи _ /р*\2 _ J~_i_ (\ К 1 \\ r ~ ci ~\r ) с2 ' \1ог11) где звездочками отмечены значения величин после взаимодей- взаимодействия. Компоненты 4-вектора Ра преобразуются при переходе от одной инерциальной системы отсчета к другой по общим формулам A3,6) —A3,9). Часто оказывается удобным пользоваться системой коорди- координат, в которой полный импульс равен нулю. Такая система бтсчета, как и в классической механике, называется системой центра инерции Л'(ц-н). Пусть задана некоторая система отсчета К, в которой си- система частиц имеет импульс Р и анергию Е. Найдем скорость движения системы центра инерции 1Л«-И> но отношению к си- системе К. Скорость У(ц "> характеризует движение системы как целого. Для простоты допустим, что скорость центра инерции системы направлена по оси х. Тогда по A3,6) — A3,9) имеем u. и) г1 р у{\\ и) L , (vUl-l0J ' с2 A5ДЗ) Индексом ц. и. снабжены величины, отнесенные к системе цен- центра инерции. Из A5,12) получаем В общем случае произвольной ориентации вектора скорости центра инерции вместо A5,15) получается К(ц-И) = ^-. A5,16) В отличие от классической механики, в релятивистской ме- механике скорость центра инерции нельзя представить как произ- производную по времени от координаты центра инерции: 1/(ц. и) _, d п(ц. и)
§ 15] МЕХАНИКА СИСТЕМЫ ЧАСТИЦ В ТЕОРИИ ОТНОСИТЕЛЬНОСТИ 257 Рс2 Действительно, величину —р~ нельзя, вообще говоря, предста- представить в виде производной по времени от какой-либо величины. Поэтому понятие координаты центра инерции для произволь- произвольной системы взаимодействующих частиц в релятивистской ме- механике ввести невозможно. В § 25 будет показано, что в слу- случае системы слабовзаимодействующих частиц можно, в извест- известном приближении, пользоваться понятием о центре инерции. Обсудим еще некоторые свойства массы покоя системы ча- частиц. Пусть имеется система центра инерции К'- Запишем инва- инвариант 4-вектора энергии и импульса A5,10) для этой системы в виде / г>(Ц. и)\2 2 /р(ц. и)\2 _ „24 П 5 17> уж } С- \LJ j •— irl L- ¦ у\ KJy 1 I j Поскольку Р<«'и) = 0, формула A5,17) приобретает в системе К' вид ?(«и)=Мс2, A5,18) где М — масса покоя. С другой стороны, по общей формуле A5,2) с<и- и) V "lie* / ¦4 где Vi — скорость f-й частицы, отнесенная к системе центра инерции. Тогда для массы покоя получаем "" A5,19) Мы видим, что масса покоя системы частиц не равна сумме масс покоя отдельных частиц 2 ти но зависит от скоростей их движения по отношению к системе центра инерции. Рассмотрим, например, случай, когда система частиц пред- представляет идеальный газ. Идеальный газ удовлетворяет, оче- очевидно, тем требованиям к характеру взаимодействия между частицами, о которых мы говорили выше. Тогда, согласно A5,17), масса покоя газа М зависит от внутреннего движения газовых частиц или, что то же самое, от температуры газа. Различие между массой покоя системы М и суммой масс по- покоя образующих систему частиц 2>"t, имеет важнейшее значе- значение для процессов, происходящих в природе. Мы обсудим это обстоятельство в следующем параграфе. В общем случае системы частиц с произвольным взаимо- взаимодействием формула A5,2) не является выражением для полной 17 В. Г. Лсвич, том I
258 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. П энергии системы; она дает лишь сумму энергии покоя и кине- кинетической энергии частиц. В полную энергию необходимо ввести энергию взаимодей- взаимодействия между частицами. Оказывается, однако-, что в релятивист- релятивистской механике не существует понятия потенциальной энергии взаимодействия системы частиц. Действительно, потенциальная энергия взаимодействия частиц должна зависеть только от их положения. Если положение какой-либо частицы изменяется, то мгновенно должны измениться потенциальная энергия системы частиц и силы, действующие на отдельные частицы. Иными словами, понятие потенциальной энергии взаимодействия ча- частицы связано с представлением о дальнодействии и не может быть введено в теории относительности. В общем случае на- написать выражение для энергии системы взаимодействующих частиц не представляется возможным. То же относится и к им- импульсу системы, который в теории относительности не является величиной, независимой от энергии. Помимо систем, взаимодействующих путем столкновений, в специальной теории относительности можно найти прибли- приближенное выражение для взаимодействия заряженных частиц. Это будет сделано в § 25. Гравитационное взаимодействие тел рассматривается в общей теории относительности, изложение которой выходит за рамки нашей книги. § 16. Закон сохранения энергии — импульса в ядерной физике Закон сохранения энергии — импульса и соотношение между массой и энергией не только нашли экспериментальное под- подтверждение, но стали основными положениями современной ядерной физики. Еще в первой работе Эйнштейна указыва- указывалось, что соотношение между массой и энергией можег быть проверено экспериментально при изучении явлений радиоак- радиоактивности. Действительно, характерной особенностью радио- радиоактивного распада, как, впрочем, и всех остальных ядерных процессов, являются большое изменение энергии системы и вы- высокие энергии образующихся ядерных частиц. Из всего много- многообразия ядерных процессов, в которых релятивистские эффекты играют существенную роль, в рамках этой книги мы должны ограничиться лишь самыми существенными или типичными. Цель приведенных ниже примеров — показать, что соотно- соотношения релятивистской механики являются необходимой основой для подхода к изучению процессов, происходящих с атомными ядрами и элементарными частицами. I. Реакции распада частиц. Ряд основных процес- процессов, происходящих с атомными ядрами и элементарными ча-
5 16] СОХРАНЕНИЕ ЭНЕРГИИ — ИМПУЛЬСА В ЯДЕРНОП ФИЗИКЕ 259 стицами, заключается в реакциях объединения и распада ча- частиц. Закон сохранения энергии и импульса накладывает суще- существенное ограничение на возможные реакции. Рассмотрим реакцию распада одной частицы или тела на две части. Мы будем предполагать, чго распад происходит самопроизвольно, т. е. в результате внутренних изменений в системе, без воздей- воздействия на нее внешних сил. Пусть распадающаяся частица имеет массу М. В системе центра инерции импульс до распада равен нулю. Инвариант 4-зектора энергии и импульса равен После распада возникают части с массами ть т2, импульсами рь р2 и энергиями Еи ?2. В системе центра инерции полный импульс после распада равен нулю: р1+р2 = 0. Инвариант / можно написать в виде или Написав энергии ?i и Е% в виде Е2 = т2с2 + ?fL имеем Мс2 = (от, + от2) с2 + ?{•}„ + ?Й„. A6,1) Поскольку кинетические энергии частей, образовавшихся после распада, ?кин>0 и ?(к2ж1>0, из A6,1) следует, что самопро- самопроизвольный распад тела возможен только при выполнении нера- неравенства M>ml + mz, A6,2) т. е. если его масса больше суммы масс покоя возникающих частей. Наоборот, в тех случаях, когда масса тела меньше, чем сумма масс возникающих частей, самопроизвольный распад тела невозможен. Для распада в этом случае необходим подвод энергии извне. Пользуясь равенствами?, = Ур\с2 + т\с* и E2=YpIc2 + и учитывая, что pf= р|, можно легко найти энергии частиц, возникающих при распаде. 17*
260 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. II Именно, имеем Е* = р\с2 + mfc* = Е\ + т\с* - т*с\ С другой стороны, откуда 2. Устойчивость атомных ядер. Полученные общие результаты позволяют внести ясность в важнейший вопрос об устойчивости атомных ядер. Рассмотрим атомное ядро, состоящее из Z протонов и А — Z нейтронов (где Z — атомный номер, А— массовое число) и имеющее массу М. Протоны и нейтроны в ядре обладают весь- весьма значительными кинетическими энергиями. Однако действую- действующие между ними весьма мощные силы притяжения — ядерные силы, обеспечивают устойчивость всей системы как целого. Энергия покоя ядра Мс2 слагается из энергии покоя всех входя- входящих в него частиц 2 гщс2, и энергии внутреннего движения и ваимодействия частиц. Для того чтобы ядро было устойчивым и движение ядерных частиц не могло привести к его самопроиз- самопроизвольному развалу, необходимо, очевидно, чтобы было выполне- выполнено неравенство 'Z A6,3) Величина Ашс2 = 2 пцс2 ~ Мс2, A6,4) именуемая энергией связи ядра, является мерой его устойчи- устойчивости. Если, в частности, Атс2 отрицательна, ядро неустойчиво и самопроизвольно распадается на части. Наряду с энергией связи мерой устойчивости ядра может служить величина 2т,-М, A6,5) называемая дефектом массы. Для устойчивости ядра необходи- необходимо, чтобы дефект массы был положителен. Если дефект массы ядра положителен, то согласно A6,1) ядро устойчиво по отно- отношению к распаду на образующие его частицы — протоны и нейтроны. Однако это не означает еще, что ядро является абсо- абсолютно устойчивым и может существовать неопределенно долго.
4 161 СОХРАНЕНИЕ ЭНЕРГИИ —ИМПУЛЬСА В ЯДЕРНОЙ ФИЗИКЕ 261 Допустим, что в результате распада ядра, например по схеме могут образовываться ядра с массами Mi и Af2. Такой распад в принципе возможен, если атомные номера Zt и Z2 и массовые числа А\ и А2 образующихся ядер удовлетворяют равенствам Пусть A/7?i и Ат2— дефекты масс образующихся ядер. Если дефект массы исходного ядра Am меньше, чем сумма дефектов масс образующихся ядер, т. е. Am то система, возникающая после распада, обладает большей устойчивостью, чем исходная. Поэтому при Am < (Ami + Ат2) ядро, устойчивое по отношению к распаду на отдельные элемен- элементарные частицы, не является устойчивым по отношению к рас- распаду на две части. В результате внутренних преобразований ядерных частиц, по прошествии некоторого промежутка времени, в ядре возникнет распадная конфигурация. Исходное ядро рас- распадается на два ядра с массами М\ и М2. В виде примера можно рассмотрето ядро Be*. Это ядро имеет массу М = 8,00785, которая меньше, чем массы четырех протонов и четырех нейтронов %т, = 4 • 1,008123+4-1,00893 = =8,008212. Поэтому ядро Be* устойчиво по отношению к рас- распаду на отдельные протоны и нейтроны. Однако масса Вс^ больше, чем масса двух ядер Не?: 2Мце=2 -4,00390=8,00780 аем. Поэтому ядро Be® неустойчиво и должно самопроизвольно рас- распадаться на две а-частицы, что и имеет место фактически. Наоборот, дефект массы ядра Ве^ не только положителен, но и превышает сумму дефектов масс всех ядер, на которые оно могло бы распадаться. Поэтому ядро Ве^ абсолютно устойчиво. Зная массы всех изотопов, можно без труда определить их устойчивость по величинам дефектов масс. За деталями отсылаем читателей к специальным руковод- руководствам. 3. Энергетический выход ядерных реакций. Применение закона сохранения энергии к ядерной реакции типа A + B
262 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. II где А и В — исходные ядра, а С и D — продукты реакции, по- позволяет найти энергетический выход реакции A6,6) если известны массы всех ядер. В виде важного примера, на котором соотношения теории относительности могут быть проверены особенно наглядно, рас- рассмотрим реакцию Массы всех фигурирующих в реакции ядер измерены с боль- большой степенью точности. Именно, з) = 7,01822 аем, М (я!) =1,00812 аем. Полная начальная масса = 8,02634 аем. Полная конечная мас- масса = 2М(Не42) = 2 ¦ 4,00390 = 8,00780 аем. В результате реакции масса покоя частиц уменьшается на Am = 0,0185 аем. Соответствующая энергия, представляющая кинетическую энергию двух ос-частиц, должна быть равна ? = Дтс2=17,2 Мэв, что с большой степенью точности совпадает с измеренными значениями энергии. На этом примере видно, что масса покоя частиц не сохра- сохраняется. В ходе реакции масса покоя, равная Am, бесследно исчезает. Однако имеют место закон сохранения энергии и закон сохранения релятивистской массы mLl(v) +mH(y) =2m1]e(y). Приведенная реакция является лишь одним из примеров ядер- ядерных реакций, в которых не выполняется закон сохранения мас- массы покоя. 4. Распад элементарных частиц. Целый ряд эле- элементарных частиц оказываются неустойчивыми по отношению к реакции распада. Здесь невозможно обсудить все известные Случаи реакций распада, и мы можем остановиться лишь на не- некоторых из них, наглядно иллюстрирующих важность приме- применения законов сохранения к анализу реакций.
§ 10] СОХРАНЕНИЕ ЭНГРГИИ — ИМПУЛЬСА В ЯДЕРНОЙ ФИЗИКЕ 263 В качестве примера рассмотрим реакции распада заряженных и нейтрального мезонов. Как известно, обнаружено существо- существование трех сортов л-мезонов: я+ с положительным, я~ с отри- отрицательным зарядом и я0— нейтральный мезон. Их массы ранны 273 тс для заряженных мезонов и 264 те для нейтрального ме- мезона. Заряд заряженных мезонов по абсолютной величине равен заряду электрона. Кроме я-мезонов, обнаружены два сорта (л-мезонов — положительный |л+ и отрицательный ц~-мезои, с той же абсолютной величиной заряда и массой, равной 207 элек- электронных масс. Оказалось, что как я-, так и ц-мезоны неустойчивы. Время жизни заряженных л±-мезонов составляет 2,6-10 сек, ней- нейтрального я°-мезона — около 10~15—10~16 сек. Как мы указы- указывали ранее, ц—мезоны имеют время жизни, равное 2-К)-6 сек. Совершенно ясно, что установление схемы распада всех этих частиц имеет фундаментальное значение для современной физики. Начнем с распада заряженных я-мезонов. Заряженные я—мезоны распадаются на ^-мезон и нейтрино v: п±-+ }_1 -4-v. Нейтрино представляет незаряженную частицу с весьма мялой массой покоя, которая, в отличие от фотонов, не вызывает на своем пути сколько-нибудь заметной ионизации атомов. Изуче- Изучение этой реакции позволяет наиболее точно оценить массу по- покоя нейтрино '). Именно, зная массы покоя я- и ц-мезонов, можно найти ки- кинетическую энергию ц-мезона ?к,ш в зависимости от массы покоя нейтрино. В системе центра инерции до распада импульс я-мезона ра- равен нулю. После распада полный импульс остается равным нулю, так что импульсы ц-мезона и нейтрино равны по вели- величине pu = pv = p и обратны по направлению (Pn+pv) =0. Закон сохранения 4-вектора энергии импульса сводится к закону со- сохранения энергии тлс — Е + Е , или nine 2 (?!?„„ + т*с2) + или, поскольку в системе центра инерции pv — p^, имеем nine2 = (Е^н +¦ mixc2) + Vplc2 + my. A6,7) ') О свойствах нейтрино см. § 137 ч. V,
264 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ |Гл. II Воспользуемся полезным тождеством ?к„„ + тс2 или Е2ШШ + 2тс2?кин = Р2с\ A6,8) и перепишем A6,7) в виде nine2 = (??„„ + т^) + У(?^„J + 2т^Е^н + Возводя последнюю формулу в квадрат и пользуясь A6,7), на- находим для энергии (х-мезона (отнесенной к системе цешра инер- инерции), который образовался при распаде я-мезона, B *>\2 2 4 тпс -яу:8) -яу Кинетическая энергия ц-мезона Е$„н измеряется по вызы- вызываемой им ионизации. Она оказывается имеющей всегда опреде- определенное значение. Из числового значения ??„„ вытекает, что в пределах точности опыта mv=0. Кроме того, фиксированная величина ??„„ означает правильность принятой схемы распада. Если бы при распаде появлялись две или более нейтральных частиц, то ?к„,1 не имела бы определенного значения, но зави- зависела от распределения кинетической энергии между нейтраль- нейтральными частицами. Именно последний случай реализуется при распаде ц-мезо- нов, который идет по схеме Здесь е~ означает электрон, а е+ — позитрон. Теория позитронов будет подробно изложена в ч. V. Здесь укажем лишь, что позитрон имеет положительный заряд, но ве- величине равный заряду электрона, и массу, равную массе элек- электрона. Электрон, л~-мезон и |Г~-мезон, с одной стороны, пози- позитрон, л+-мезон и (х+-мезон, с другой стороны, образуют группы античастиц. Античастицы образуются парами и могут анниги- аннигилировать (сливаться), образуя ^-кванты1). Опыт показывает, что при реакции распада ji-мезопов кине- кинетическая энергия возникающих электронов или позитронов не имеет определенного значения, изменяясь от опыта к опыту. Таким образом, ясно, что энергия, уносимая ускользающими от непосредственного наблюдения нейтральными частицами, может распределяться между ними разными способами. Это ') О свойствах элементарных частиц см. Ю. В. Новожилов, Элемен- Элементарные частицы, Физматгиз, 1959 (популярное и очень хорошее изложение); Э. В. Шпольский, Атомная физика, л. II, Гостехиздат, 1951.
§ 16] СОХРАНЕНИЕ ЭНЕРГИИ - ИМПУЛЬСА В ЯДЕРНОЙ ФИЗИКЕ 265 было бы невозможно при распаде по схеме, справедливой для я-мезонов, т. е. с вылетом одного нейтрино. В среднем кинетическая энергия заряженной частицы равна 7з полной энергии д.-мезона. Остальные 2/3 в среднем поровну распределяются между обоими вылетающими нейтрино. Рассмотрим, наконец, распад л°-мезона, который идет по схеме где у — гамма-квант, ^-кванты регистрируются по создаваемой ими ионизации. Наблюдается известная связь между углом разлета фотонов и их энергией. Эта связь может быть установ- установлена из законов сохранения. До распада инвариант 4-вектора энергии и импульса в си- системе, движущейся вместе с л°-мезоном, сводится к / = — тяс4, поскольку в этой системе полный импульс равен нулю. После распада в лабораторной системе / равно где рь Р2, ?i и Е2 — импульсы и энергии двух фотонов. Поэтому можно написать или, поскольку масса покоя фотонов равна нулю, ™У = 0»i + P2Jc2-(Pi + Р2Ус2 = 2/W2(l -coscp) = 4Plp2c* sin2-f • где <р — угол между направлениями полета фотонов. Следовательно, Зависимость угла разлета от энергии фотонов хорошо согла- согласуется с наблюдающейся экспериментально. 5. Образование пар электрон — позитрон у-квантами и электронами и аннигиляция "пар. Опытное обнаружение теоретически предсказанных явлений об- образования пар электрон — позитрон и их аннигиляции с образо- образованием у"квантов явилось основным подтверждением правиль- правильности релятивистской квантовой механики, с которой читатель ознакомится в ч. V книги. Вместе с тем, явления образования пар и их аннигиляции служат хорошей иллюстрацией соотноше- соотношений теории относительности.
266 MFXAHHKA ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. II Рассмотрим прежде всего вопрос о возможности образова- образования пары электрон — позитрон Y"KBanT0M B вакууме. Пусть Y-квант с энергией Е = рс создает электрон и позитрон. Нетруд- Нетрудно видеть, что такой процесс несовместим с законами сохране- сохранения. Действительно, если фотон создает пару электрон — пози- позитрон с минимальной возможной энергией — энергией покоя и импульсом, равным нулю, то он имеет энергию Е = 2тс2 и им- импульс р = —>0, где т — масса электрона. Если импульс пары отличен от нуля, то всегда можно перейти к системе центра инерции, где он равен нулю, и наше рассуждение справедливо. Таким образом, импульс отличен от нуля до образования пары и равен нулю после ее образования Это явно противо- противоречило бы закону сохранения импульса, и подобный процесс невозможен. Образование пар может происходить только при наличии третьего тела, обычно атомного ядра, принимающего на себя избыток импульса. Поскольку при этом ядро принимает на себя также и некоторую часть энергии, энергетический порог реакции образования пары ^-квантом лежит выше Imt7 Поро- Пороговая энергия Y"KBaHTa определяется требованием, чтобы все частицы — электрон, позитрон и ядро — имели в системе центра инерции импульс, равный нулю. Для нахождения этого порога найдем инвариант 4-вектора энергии и импульса. До реакции имелся у-квант с пороговой кинетической энер- ?пор гиеи ?пор, импульсом р= и покоящееся ядро с массой М; после реакции — пара электрон — позитрон и ядро, принявшее на себя часть импульса и энергии. Значение инварианта 4-вектора энергии и импульса до реакции Значение инварианта после реакции можно взять в любой системе координат, в том числе в системе центра инерции. До- Достоинством последней является то, что в ней полный импульс всех частиц равен нулю и значение инварианта сводится к ве- величине / = —(Мс2+2тс2J. Таким образом, имеем откуда для пороговой энергии у-кванта находим A6,11)
§16] СОХРАНЕНИИ ЭНЕРГИИ - ИМПУЛЬСА В ЯДЕРНОЙ ФИЗИКЕ 267 Совершенно аналогичным образом может быть найдена по- пороговая энергия других процессов образования электропно-пози- тронных пар, например, при соударении двух электронов. Процесс, являющийся обратным процессу образования пар -у-кваптами, носит название аннигиляции пар. При аннигиля- аннигиляции происходит слияние электрона и позитрона с образованием •у-квантов. Изложение сущности этого процесса с точки зрения современной квантовой теории будет кратко дано в ч. V. Про- Процесс аннигиляции происходит обычно при малых значениях ки- кинетической энергии позитрона. Поэтому разность энергий на- начального и конечного состояний составляет АЕ = тс2 — (—тс2) =2тс2= 1,02 Мэо. Одновременное сохранение энергии и импульса требует, чтобы эта энергия излучилась в виде (по меньшей мере) двух у-кван- у-квантов, вылетающих в противоположных направлениях и имеющих энергию 0,51 Мэв каждый. 6. В ряде опытов было установлено, что аннигиляция пози- позитронов действительно сопровождается таким излучением. Явле- Явление аннигиляции позитронов служит одним из наиболее эффект- эффектных подтверждений соотношения между массой и энергией. Следует заметить, что процесс аннигиляции иногда неправиль- неправильно трактуют как «превращение материи в энергию» или как «исчезновение частиц». Совершенно ясно, что возникающие при аннигиляции позитрона у-кванты так же материальны, как и частицы электрон или позитрон. В § 13 мы обсудили уже вопрос о свойствах массы покоя и законах сохранения в теории относительности и видели, что превращение частиц с массой покоя, отличной от нуля, в ча- частицы, не имеющие массы покоя, никоим образом не может рассматриваться как исчезновение частиц или превращение массы в энергию. 6. В качестве последнего примера использования законов сохранения в ядерной физике рассмотрим определение энерге- энергетического порога реакции образования л-мезона при столкнове- столкновении протона с протоном: где л+ — положительный я-мезон с массой тл. Напишем значение инварианта Е2— р2с2 до и после столк- столкновения. До столкновения (Етр+2Мс2J - pV= (?uop+2Mc2J - ?пор(?пор +2Мс2). При этом мы считали, что один из прогонов покоится до соуда- соударения и воспользовались формулой A6,8). Если налетающий
268 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. II протон имеет пороговую энергию, то образующиеся в результа- результате реакции частицы, дейтрон и л-мезон, имеют минимальную возможную энергию — энергию покоя (в системе ц. и.)- В систе- системе центра инерции можно написать ?2 _ р2с2 = BМс2+тлс*J. Из сохранения инварианта (Е2 — р2с2) имеем (?nop + 2Afc2J— ?nop(?nop + 2Afc2) = BМс2+тлсг)\ откуда пороговое значение кинетической энергии = тлс2B + ^)= 292 Мэв. A6,12) Значение ?Пор хорошо согласуется с измеренной величиной. Приведенные примеры носят чисто иллюстративный харак- характер, и в них нарочито затронуты разнообразные вопросы ядер- ядерной физики. Они, однако, показывают, что во всех ядерных процессах, при которых приходится учитывать достаточно зна- значительные изменения энергии системы, законы теории относи- относительности и, в частности, соотношение между массой и энергией играют фундаментальную роль. § 17. Теория столкновений релятивистских частиц. Эффект Комптона Большое значение для ядерной физики имеет теория столк- столкновений релятивистских частиц. При отсутствии ядерных реак- реакций между сталкивающимися частицами взаимодействие ме- между ними можно с достаточной степенью точности считать упругим соударением (т. е. происходящим без изменения внут- ренного состояния ядерных частиц). Это относится, в частности, к столкновениям элементарных частиц между собой, например, мезонов, протонов или фотонов с электронами. Мы рассмотрим прежде упругие соударения частиц с мас- массой покоя, отличной от нуля. Предположим, что быстрая ча- частица с массой \х и импульсом р сталкивается со второй части- частицей, имеющей массу т. Мы будем считать вторую частицу неподвижной и свободной. Такое приближение законно при до- достаточно большой скорости налетающей частицы. После столк- столкновения первоначально неподвижная частица будет двигаться с импульсом рь направленным под углом q> к импульсу нале- налетевшей частицы. Последняя при этом отклонится от первона*
§ 171 ТЕОРИЯ СТОЛКНОВЕНИЙ РЕЛЯТИВИСТСКИХ ЧАСТИЦ 269 чального направления полета на угол 9 и будет иметь им- импульс р2 (рис. 25). Мы можем написать закон сохранения энергии и импульса в виде A5,7) и A5,8): P = Pi + P2> A7,1) тс2 + Е = Ei 4- Е2, A7,2) где Е и Е%— энергии налетающей частицы до и после столкно- столкновения, ?1 — энергия первоначально покоившейся частицы после столкновения. Этих соотношений достаточно для нахождения всех величин, характеризующих процесс столкновения. Пусть, например, мы должны найти энергию, приобретаемую первоначально неподвижной частицей в зависимости от угла ее вылета ф. Проще при этом найти не полную энергию послед- последней Е\, а кинетическую Е(|КИ" = — Ei—тс2. Имеем, очевидно, из A7,2) % <«»»>. A7,3) Так как на основании A7,1) A7,4) то из A7,3) и A7,4) можно ис- РиС. 25. ключить р2. Кроме того, р\ сле- следует выразить через Е\ с помощью A6,8). Возводя A7,3) в квадрат и заменяя р\ его значением из A7,4), получаем после простых преобразований = ?<кии> {Ур2с2 + у?с* + тс2}. Возводя последнее соотношение в квадрат и вновь выражая р\ через ?'кин>, получаем окончательно ?<кин) _ 2тргс* cos2 ф , . {/pV + nV+mc^pVcos2? * V >; т. е. искомую зависимость энергии, переданной неподвижной частице, от р и ф, а также от масс частиц т и ц. Формула A7,5) показывает, что наибольшее значение пере- передаваемая энергия имеет при ф = 0, т. е. при вылете неподвижной частицы в направлении полета налетающей частицы (лобовое соударение). Именно, кин) 22
270 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. II Рассмотрим некоторые частные случаи формулы A7,6). Пусть, например, налетающая частица является протоном или мезоном, а покоившаяся частица — электроном. Тогда ц ^> т. Кроме того, будем считать падающую частицу весьма быстрой, так что рс » |ас2. Тогда из A7,6) находим \0ош) 2 ргС2 Если импульс падающей частицы столь велик, что выполнено неравенство то максимальная передаваемая энергия достигает значения рс~Е, A7,7) т. е. энергии падающей частицы. Рассмотрим теперь случай, когда падающая частица яв- является легкой, например электроном, а неподвижная — тяжелой (т. е. (i<Cm). Если, кроме того, первая частица обладает им- импульсом pc?j>jn,c2, то из A7,6) получаем для передаваемой энер- энергии \(КИИ) f Если выполняется неравенство рс » тс'1, то Мы видим, таким образом, что при очень больших импуль- импульсах законы упругих столкновений в релятивистской механике существенно отличаются от аналогичных законов в классической механике. При достаточно больших импульсах возможна полная передача энергии от тяжелой частицы к легкой и от легкой — к тяжелой. Напомним, что в классической механике в этом слу- случае упругий удар сопровождается лишь незначительной переда- передачей энергии '). Другие предельные случаи могут быть без труда получены из общего выражения A7,5). Нетрудно, в частности, показать, что при малых импульсах рс <с (яс2 и рс «С тс2 передаваемая энергия дается формулой, совпадающей с соответствующим вы- выражением нерелятивистской теории столкновений. ') См. § 43 ч. 1.
§ ;-| теория столкновений релятивистских частиц 271 Важным случаем упругого соударения является соударение фотона с электроном. Это явление, носящее название комптон- эффекта, было первоначально тщательно изучено в связи с вы- яснением квантовой природы света. Комптон-эффект играет роль в ряде практических проблем современной ядерной физики. У фотона масса покоя \х равна нулю и Е = рс, Е% = р2с. По- Поэтому формулы A7,1) и A7,2) приобретают вид ? = ?2 + ?{к"н), A7,8) где ?<кнп) = Ур*с2 + т2ес* — тес2, те — масса электрона, 0 — угол между направлением полета фотона до и после столкновения (угол рассеяния). Выражая в уравнении A7,9) р\с2 через кинетическую энер- энергию электрона с помощью A6,8), представим A7,9) в виде (Е\к""уJ + 2тес2Е{Гк) = Е2 + Е\ - 2??2 cos 0. A7,10) Найдем прежде всего энергию фотона, испытавшего столкнове- столкновение. Исключая е'Снл) из A7,8) и A7,10), без труда находим 2~ тес2+ ?A -cos8) ' U'>4> Последняя формула связывает энергию рассеянного фотона с энергией падающего и углом рассеяния Э. Переходя от энергий к длинам волн по известной квантовой формуле ? = Av =-т-, можно получить для уменьшения длины волны при комптоновском рассеянии ДА, значение ~A-cosG) = AA-cosO). A7,12) Величина Л = = 0,0242 А носит название комптоновской тес длины волны. Формула A7,12) показывает, что изменение длины волны происходит независимо от длины волны падающего излучения. Максимальное изменение длины волны равно 2Л. Зная энергию рассеянного фотона, можно легко найти энер- энергию, передаваемую электрону. Она оказывается равной г-(кин) р с Л A — COS 6) „ , „ , . ?, -?-?2= я, + ЛA-С08б) Е> A7'13) т. е. сравнительно небольшой при К ~Э> Л. Наоборот, при к ~ Л
272 МЕХАНИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ (Гл. II энергия, передаваемая электрону, оказывается значительной, по- порядка Е. Важность этого вывода состоит, в частности, в том, что он имеет вполне общий характер. Мы неоднократно указывали в ч. I, что классическая электродинамика содержит в себе самой границы применимости. Именно, классическая электродинамика становится неприменимой в области малыхдлин, порядка клас- классического радиуса электрона г0 = 2 • 10~13 см. Мы указывали, од- однако (см. § 28 ч. I), что фактически граница применимости клас- классической теории лежит гораздо выше, при расстояниях порядка 2 - 10~!0 см, что соответствует порядку комптоновской длины волны. Неприменимость классической электродинамики к явлениям, разыгрывающимся в области пространства с линейным разме- размером порядка Л, связана, очевидно, с тем, что в этой области начинают проявляться квантовые эффекты. Конкретным приме- примером этого может служить рассеяние света. При Х^> Л изменение длины волны рассеянного света и энер- энергии, передаваемая свободному электрону, сравнительно малы. Поэтому рассеяние света достаточно хорошо описывается клас- классической теорией. Рассеяние имеет когерентный характер. Из- Изменение длины волны Ак ~ Л весьма мало по сравнению с са- самой длиной волны; никакой передачи энергии свободному электрону не происходит и сечение рассеяния дастся формулой Томсона C6,9) ч. I. По мере приближения К к Л (жесткие рентгеновы лучи и Y-лучи) классическое рассеяние заменяется комптон-эффектом. Изменение длины волны света становится сравнимым с длиной волны, излучение выбивает электроны отдачи (движущиеся пре- преимущественно вперед, по направлению падающего фотона), и сечение рассеяния, как это видно на рис. 11, падает с энергией фотона. Явление приобретает ясно выраженный квантовый ха- характер и классическое рассмотрение явления рассеяния стано- становится совершенно невозможным. Квантовомеханический расчет сечения комитоновского рас- рассеяния будет дан в ч. V.
ГЛАВА III ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ § 18. Инвариантность заряда, четырехмерный ток и уравнение непрерывности От релятивистской механики мы перейдем теперь к построе- построению релятивистской электродинамики. В основу релятивистской электродинамики нами будет положено предположение об ин- инвариантности и сохранении электрического заряда. Заряд яв- является основной величиной, характеризующей свойства частиц, а постоянство заряда строго соблюдается во всех известных фи- физических процессах. Закон сохранения заряда div(p«) + |f = O A8,1) должен быть справедлив во всех инерциальных системах коор- координат. Для придания закону сохранения заряда релятивистски- инвариантной формы можно, следуя обычному методу, записать его в четырехмерной форме. Для этого достаточно ввести 4-вектор ja, именуемый четы- четырехмерным током и определяемый соотношением /в=(ри,*ср). A8,2) Тогда A8,1) легко записывается в четырехмерной форме: ?-?+?+?+?-•• сад Формула A8,3) записана в четырехмерном виде и является ре- релятивистски-инвариантным выражением. Отсюда следует, что формально определенная нами величина /о действительно пред- представляет 4-вектор. Из определения 4-вектора )а непосредственно вытекает, что при переходе от одной системы отсчета к другой его компоненты должны преобразовываться по формулам A1,1) — (П,4). Если применить этот закон преобразования к четвертой компоненте 18 В. Г. Левич, том I
274 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТПЛЫЮСТИ (Гл ИГ /т = icp, то мы получим закон сохранения электрического за- заряда de — pdV, заключенного в произвольном элементе объема dV. Действительно, рассмотрим закон изменения /t при пере- переходе от системы К', в которой заряды покоятся, к системе К. Система /С' движется по отношению к К со скоростью v. В си- системе К' скорость и = 0 и у вектора ]а отлична от нуля только компонента /т. Из формулы A1,4) для преобразования четвертой компо» ненты 4-вектора находим закон изменения плотности заряда: '==-• A8,4) Умножив A8,4) на элемент объема dV, имеем „ЛТ,_.7 O'JV Закон изменения объема F,2) дает при этом так что Таким образом, заряд любого элемента объема является ин- инвариантом относительно преобразования Лоренца. Это можно наглядно интерпретировать следующим образом: при уменьше- уменьшении вследствие лоренцева сокращения величины объема, плот- плотность заряда увеличивается в том же отношении, так что пол- полный заряд не изменяется. § 19. Релятивистски-инвариантная формулировка уравнений для потенциалов Выше мы уже указывали, что теория электромагнитного поля с самого начала была сформулирована «правильно» с точки зрения теории относительности. Это означает, что си- система уравнений Максвелла — Лоренца является релятивистски- инвариантной, удовлетворяющей требованиям теории относи- относительности. Проще всего в этом можно убедиться, если рассмотреть уравнения для потенциалов.
19] РЕЛЯТИВИСТСКИ ИНВАРИАНТНАЯ ФОРМУЛИРОВКА УРАВНЕНИЙ 275 Согласно сказанному в § 10 ч. 1 система уравнений ^^ A9,2) при учете условия калибровки div 4 +1|г = 0> <19'3) полностью эквивалентна уравнениям Максвелла — Лоренца. Релятивистская инвариантность системы A9,1) — A9,3) не- непосредственно вытекает из того, что эта система может быть без всяких изменений записана в четырехмерной форме. Действительно, умножим A9,2) на i и заметим, что при этом правые части уравнений A9,1) — A9,2) содержат компоненты 4-вектора плотности тока. Отсюда следует, что и левые части представляют компоненты 4-вектора, который мы будем имено- именовать 4-потенциалом Аа, Аа = (А, щ). С помощью 4-вектора Аа и \а уравнения A9,1) и A9,2) можно написать в виде ? Ла=--^/и, A9,4) где ? означает оператор Даламбера: При этом условие калибровки сразу записывается в четырехмер- четырехмерной форме в виде 1 = ° A96> Таким образом, полная система уравнений для потепцир.точ представлена в релятивистски-инвариантном виде. Это означает, что законы электродинамики одинаковы во всех инерциальных системах отсчета. Мы видим, далее, что потенциалы электромагнитного поля, а следовательно, и сами векторы электрического и магнитного полей не являются инвариантными величинами. Относительный характер величины векторов поля никоим образом не является чем-то новым и неожиданным. Достаточно вспомнить, что дви- движущийся заряд создает магнитное поле, которое, однако, отсут- отсутствует в системе отсчета, движущейся вместе с зарядом, 18*
276 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. Ill Закон преобразования потенциалов может быть написан без труда, поскольку они преобразуются по общей формуле преоб- преобразования компонент 4-вектора A1,1) — (П.4). Имеем, очевидно, A9,7) A9,8) A9,9) A9,10) В следующих параграфах мы применим эти формулы к рассмо- рассмотрению электромагнитного поля движущихся зарядов. § 20. Поле движущегося заряда Рассмотрим простейшую задачу о нахождении электромаг- электромагнитного поля, создаваемого равномерно движущимся зарядом, когда скорость заряда v сравнима со скоростью света. В си- системе отсчета К', движущейся вместе с зарядом, магнитное поле отсутствует, а потенциал электрического поля выражается фор- формулой В инерциальной системе отсчета К, по отношению к которой за- заряд движется со скоростью о, потенциал электрического поля согласно A9,10) имеет вид Найдем теперь формулу преобразования длины радиуса-век- радиуса-вектора. Имеем
§ 20] ПОЛЕ ДВИЖУЩЕГОСЯ ЗАРЯДА 277 Асимметрия последней формулы связана с тем, что движение происходит вдоль оси х. Отсюда находим = . B0,2) Заметим, что х = vt, у = 0, z = 0 представляют координаты точки, в которой в момент времени / находится заряд, так что радиус-вектор, проведенный от заряда к точке (х, у, z), можно написать в виде r = i(x — vt) + jy + kz B0,3) и Г==У(Х- vtJ + y2 + z2. B0,4) Рис. 26. Удобно упростить B0,2), выразив ц> через г и угол if, образуе- образуемый вектором г и осью х (рис. 26). Из рис. 26 видно, чго х — vt = г cos ф, у2 + z2 = г2 sin2 \Jj и, следовательно, Y(x-vtf + (l- ?) (у2 + z2) = = г -|/cos4 + (l - ?) sin2 Поэтому имеем %B0,5) Переходя к вычислению вектора-потенциала А, заметим, что в системе К' нет магнитного поля и А1 — 0. По формулам A9,7) и A9,10) находим Т С / „2 С V Т Ф = --^-sin*
278 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл lit В векторной форме можно написать А = ^. B0,6) Зная потенциалы поля, можно найти и самые поля. При вычислении электрического поля Е нужно помнить, что в нашем случае равномерно движущегося заряда дифференци- дифференцирование по премени сводится к дифференцированию по коорди- координате х согласно формуле _д__ _ _д_ di ~ v дх ' Действительно, при равномерном движении А и <р зависят от координаты и времени по закону f(x—vt), где f — некоторая функция аргумента (х — vt). Для такой функции всегда а/ = df d(x~vt) ^ _df_ ~ V дх ' Отсюда dt находим <Эф дх 1 ал г с dt д (x-vt) д(р дх "т dt у2 аф с2 ал: 1 аФ 1 My _/ v2 ^Ф_ _ i. дА* = A _ HL дг г dt \ сг дг с dl ^ c2/) U - tv (i~—\( 2 2^ls/l ' или, в векторной форме, B0,7) '-? При вСс формула B0,7) превращается, разумеется, в элек- электростатическое выражение для поля неподвижного заряда. Магнитное поле Н также находим без труда: 1/1 1 Н = rot А = — rot (©ф) = [v gradqp] = — [vE], B0,8) Формулы B0,5) и B0,7) показывают, что, в отличие от поля неподвижного заряда, электрическое поле движущегося заряда не имеет сферической симметрии.
§ 20] ПОЛЕ ДВИЖУЩЕГОСЯ ЗАРЯДА 279" Скалярный потенциал ф имеет постоянное значение на по- верхности эллипсоида: (х - Vtf + A - ~) (У2 + 22) = Const. Этот эллипсоид получается из сферы при сжатии ее в направле- НИИ ОСИ X В 1 . 1/ 1 г" Ра3- Характер распределения поля яснее всего виден из формулы { Е\= ,[v2c2Jvh. B0,9> На оси х (г|> = 0) поле меньше электростатического в 1: f 1 — ^г" I- раз, в плоскости, перпендикулярной к оси х, оно увеличено в от* ношении —г раз. По мере возрастания скорости эллипсоид равных значений- потенциала все более сплющивается, величина поля в направле- направлении движения уменьшается, в перпендикулярном направлении — увеличивается. При v ~ с все поле концентрируется в малом- интервале углов вблизи плоскости, перпендикулярной к напра- направлению движения. Ширина этого интервала Д"ф — Т/ 1 —^- • Магнитное поле Н всегда перпендикулярно к направлению- движения и вектору электрического поля Е. При v ~ с \Н\~ .~ \Е\, при малых скоростях (v <C с) можно положить B0,10). если считать приближенно, что Е имеет электростатическое зна- значение. Последняя формула совпадает с B0,5) ч. I. Поле, создаваемое движущимся зарядом, было найдено клас- классическими методами ') еще до появления теории относительно- относительности. И в этом нет ничего удивительного, так как уравнения Максвелла — Лоренца являются релятивистски-инвариантными. Применим найденные формулы к вычислению силы взаимо- взаимодействия двух зарядов в\ и е2, движущихся с одинаковой ско- скоростью v относительно лабораторной системы отсчета. В системе отсчета, связанной с зарядами, сила равна, очевидно, F = ^^- r- и направлена вдоль вектора, соединяющего заряды. Направле- Направление вектора v выберем за ось х. 1) См., например, Р. Б е к к е р, Электронная теория, Гостехиздаг, 1941.
280 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл III С точки зрения лабораторной системы поле заряда е{ выра- выражается формулами B0,8) и B0,10). На заряд е2 при этом дей- действует сила Лоренца: [v [vE]} = Эта сила не направлена более по радиусу-вектору г. Компо- Компонента силы по направлению движения равна Компонента силы в перпендикулярном направлении равна p-e(l «Чг До появления теории относительности полагали, что, наблю- наблюдая взаимодействие между движущимися зарядами, можно оп- определить их абсолютную скорость по отношению к эфиру. Од- Однако попытки измерений не привели ни к каким положительным результатам. В свете теории относительности ясна ошибка этих рассужде- рассуждений: в формулы для силы, измеренной в лабораторной системе координат, входит лишь общая относительная скорость обоих зарядов v. Полученный результат интересно применить к случаю дви- движения равномерно заряженной сферы. В собственной системе отсчета, движущейся вместе со сферой, плотность заряда по* стоянна, линии поля нормальны к поверхности. В лабораторной системе отталкивание зарядов должно приводить к неравномер- неравномерному распределению плотности заряда по сфере. Если провести полярную ось в направлении движения, то плотность заряда должна быть наибольшей у полюсов сферы и минимальной — в плоскости экватора. С нерелятивистской точки зрения, измеряя это распределение заряда, можно было бы найти абсолютную скорость движения сферы. В действительности это не так: движущаяся сфера с точки зрения лабораторной системы должна испытывать сжа- сжатие и превращаться в эллипсоид. Расчет показывает, что эффект сжатия сферы в точности компенсирует эффект накопления за- заряда у полюсов. В результате плотность заряда, измеренная в
§ 20) ПОЛЕ ДВИЖУЩЕГОСЯ ЗАРЯДА 281 лабораторной системе отсчета, будет постоянной по поверхности сферы. Приведенный пример очень интересен потому, что показы- показывает, как «правильная» с точки зрения теории относительности теория Максвелла — Лоренца в соединении с классическими представлениями о пространстве и времени приводит к невер- неверным результатам. Только последовательное изменение воззрений на пространство и время в сочетании с законами электродина- электродинамики позволяет привести теорию к согласию с экспериментом. Наряду с полем равномерно движущегося заряда оказы- оказывается возможным найти поле заряда, совершающего произвола ное движение. В § 25 ч. I мы нашли выражение для потенциалов Лиенара — Вихерта и указывали, что соответствующие выражения не те- теряют своей применимости и при скоростях, близких к скорости- света. Чтобы убедиться в этом, напишем потенциалы Лиенара — Вихерта в четырехмерном виде. Введем 4-вектор Ra, имеющий компоненты (г — r0), ic{t — т),. где г — координата точки наблюдения, г0 — координата заряда и x = t —. При этом связь между компонентами век- С тора Ra дается формулой я! = о. Действительно, подставляя в нее компоненты Ra, имеем (г--roJ-c2(f-TJ = 0. С помощью 4-вектора Ra можно ввести 4-потенциал Лие- пара — Вихерта соотношением А е"« где по индексу C проводится суммирование (р = х, у, г, т). Дей- Действительно, пользуясь определением 4-скорости «р A1,6), имеем у 1 с*
282 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл lit где, в соответствии с обозначениями § 25 ч. I, /?(т)= г — г0 — радиус-вектор, проведенный от мгновенного положения заряда до точки наблюдения в момент времени т. Соответственно, компоненты Аа имеют вид л evjc1 ex>jc У 1 с2 B0,11) и аналогичные выражения для Лу, Аг, Отсюда ^ B<M2) Формулы B0,11) и B0,12) полностью идентичны формулам B5,3) и B5,4) ч. I. Таким образом, потенциалы Лиепара — Вихерта действи- действительно можно представить в релятивистски-инвариантной форме и, следовательно, ими можно пользоваться при произвольном значении скорости движения заряда. § 21. Тензор электромагнитного поля и уравнения Максвелла Перейдем теперь к вычислению компонент электрического и магнитного полей. Пользуясь определением 4-потенциала и вводя координаты 4-радиуса-вектора, мы можем представить компоненты электри- ческого поля в виде 1Т ЗАг \ х дх )' дх дАх дАу _ -(dAx dAA dz dx B1,1) в то время как компоненты магнитного поля выражаются через компоненты вектора-потенциала обычными соотношениями 'дАг д/ ду и аналогично для Ну и Hz.
§ 21] ТЕНЗОР ЭЛЕКТРОМАГНИТНОГО ПОЛЯ И УРАВНЕНИЯ МАКСВПЛЛЛ 283 Симметрия формул B1,1) и B1,2) побуждает нас попы- попытаться записать всю их совокупность в виде одной общей фор- формулы. Именно, введем тензор Га$ с помощью соотношения дАа Тензор Fa$ является антисимметричным по определению. Вы- Вычисление компонент тензора Fа$ приводит к таблице О Hz ~Hy -iEx - Hz О НХ - iEy Hy -Нх 0 -iEz iEx iEy iEz О Мы видим, что все компоненты векторов электрического и маг- магнитного полей оказываются компонентами одной тензорной ве- величины Fap. Уравнения Максвелла представляют собой систему уравнений для тензора Fa$. Именно, если написать для Fa$ уравнение 1+^-40 B1 5V то, полагая а, р и Л последовательно равными 1, 2, 3 и 4 и поль- пользуясь определением B1,4), мы легко найдем, что четырехмерное уравнение B1,5) представляет запись двух векторных уравне- уравнений Максвелла— Лоренца (8,1) и (8,2) (см. ч. I). Аналогично, написав четырехмерное уравнение мы можем убедиться, что оно охватывает два векторных урав- уравнения (8,3) и (8,4). Формулы D,5) и B6,6) представляют реля- релятивистски-инвариантную форму записи системы уравнений Максвелла — Лоренца. Неразрывная связь между электриче- электрическими и магнитными полями выступала в нерелятивистской фор- формулировке теории электромагнитного поля в виде положения, следующего из совокупности опытных данных. В электродина- электродинамике теории относительности эта связь оказывается совершенно неизбежной и само собой разумеющейся. Из самого определе- определения поля вытекает, что его свойства характеризуются не двумя векторами, но одним антисимметричным тензором. Уравнения электромагнитного поля являются уравнениями относительно этого тензора. Компоненты полей Е и Н фигурируют в тен- тензоре Fap на равных правах. При преобразованиях Лоренца, ко- которые мы сейчас можем сформулировать, поля Е и Я выра- выражаются друг через друга.
^84 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл III Действительно, по формулам A1,21) имеем (полагая Аху = = Hz, Axz = — Ну, Ахх = — \ЕХ, Аух = — IEу, Агх = — iEz): 2 , Ег — /- 2 ) B1,7) и' v v' и' л v г' у г г ^ у НХ=НХ, Ну — Г , Яг= > „ • B1,8) Мы видим, что утверждения типа «поле имеет чисто электриче- электрический» или «чисто магнитный характер» являются относитель- относительными. Электрическое или магнитное поле может быть равно нулю в одной системе отсчета и отлично от нуля в другой. Бес- Бессмысленно поэтому приписывать физическую реальность от- отдельно взятым электрическому и магнитному полям. Физической реальностью является их совокупность, выражаемая тензором электромагнитного поля Fap. Естественно установить, какие величины, характеризующие электромагнитное поле, являются инвариантными. Поскольку электромагнитное поле описывается антисимметричным тензо- тензором поля Fa^ согласно результатам, приведенным в § 11, та- такими инвариантами являются величины FafiFafi и F^F^T^F^. Кубический инвариант FaoF^F^ оказывается равным нулю. Простое вычисление дает •fi = /Va,3 = tf2-?2 = invar, B1,9) /2 = ^ЛЛЛг = (?" J = invar. B1,10) Инварианты /] и /2 являются абсолютными характеристиками поля. Утверждения «электромагнитное поле равно нулю» (/i = /2 = 0) или «электрическое и магнитное поля равны друг другу по величине и перпендикулярны по направлению» (/j = /2 = 0) являются примерами абсолютных утверждений. Точно так же, если /2 = 0, т. е. поля Е и И перпендикулярны друг к другу, то они останутся перпендикулярными во всех си- системах отсчета. Если при этом /t > 0, то во всех системах от- отсчета |Я|>)?|. Мы можем найти такую систему отсчета, в которой электрическое (но не магнитное) поле равно нулю. Ана- Аналогично при /2 < 0 можно найти систему отсчета, в которой магнитное поле отсутствует. В предельном случае »<с формулы преобразования Ло- ренца существенно упрощаются. Пренебрегая —%¦, их можно за- записать в виде ^Я] М1 B1,11)
§ 22] ДОППЛЕР-ЭФФЕКТ; ЭФФЕКТ МСССБАУЭРА 285 Эти преобразования были получены еще в нерелятивистской теории поля. В заключение отметим, что связь и сходство между полями Е и Н не исключают и существования принципиального разли- различия между ними, о котором мы упоминали в § 7. В электроди- электродинамике теории относительности это различие проявляется в том, что компоненты электрического поля являются временными (мнимыми) компонентами тензора электромагнитного поля, тогда как компоненты магнитного поля образуют совокупность его пространственных (вещественных) компонент. § 22. Допплер-эффект; эффект Мёссбауэра; наблюдение за быстро движущимися телами; преобразование углов, интенсивности, сечения Мы видели, что утверждение «электромагнитное поле отсут- отсутствует в некоторой точке пространства в определенный момент времени» имеет абсолютный характер. Из этого следует, что величина фазы а в электромагнитной волне H=Hoeia является инвариантом. Если, например, фаза равна — или це- целому кратному -^, так что Е = Н = 0, то это значение фазы должно сохраниться во всех инерциальпых системах отсчета. Вводя формально 4-вектор ka, который носит название четырехмерного волнового вектора, можно записать фазу волны в виде скалярного произведения двух 4-векторов, ka и го, а = kara = (kr — at). Поскольку фаза является инвариантом, последняя формула по- показывает, что формально определенная величина ka действи- действительно является 4-вектором. Закон преобразования компонент 4-вектора позволяет найти закон преобразования частот в теории относительности. Именно, из определения четырехмерного волнового вектора следует, что •его четвертая компонента преобразуется по закону kx=
286 ЭЛЕКТРОДИНАМИКА ТГОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. И! Выражая kt через частоту «, находим ffl' /'-*¦ Написав k'x в виде kx = -^-cos9',где cos 6' — направляющий ко- косинус волнового вектора, находим »' A + — cos 8'| <Й = Аналогично kr-ikT— —cos6 +-j- , ш __ Выражая а» через со', находим cos 0' + - cos 0 = ¦ 1 +— cos 6' с ¦J/1-- sin G = sin 6'— 1 + - cos в' с B2,1) B2,2) B2,3) Формулы обратного перехода от системы К к системе К' гласят: «а A— — cos в) & = • B2,4) cos 9 1 - — cos 6 с sin 6' = sin 9 B2,5) Формула B2,1) выражает закон допплер-эффекта в теории относительности. Как известно, донплер-эффект заключается r
$ 22] ДОППЛЕР-ЭФФЕКТ, ЭФФЕКТ МЁССБАУЭРА 287 изменении частоты, излучаемой движущимся источником, по сравнению с частотой, излучаемой неподвижным источником. Формулы B2,5) приводят к закону преобразования углов. Закон преобразования углов, даваемый этими соотношениями, совпадает с тем, который следует из G,4). В этом проще всего убедиться, разделив нижнюю формулу B2,5) на верхнюю. В этих формулах о/ — частота, измеренная в системе от- отсчета, движущейся вместе с источником излучения, а со — ча- частота в неподвижной системе. Предполагается, что источник вместе с системой отсчета К' движется вдоль оси х. Угол 6' представляет угол между направлением излученной волны, ха- характеризуемым в системе К' вектором k', и направлением дни- жения источника. При переходе к неподвижной системе отсчета угол 8' преобразуется в угол 0, образуемый с направлением движения вектором к. Для практического использования наиболее важна формула B2,4), которую можно записать в виде l_iLcosO с B2,6) Формула B2,6) позволяет найти частоту света со в зависимости от частоты света а/, излучаемого движущимся источником в соб- собственной системе отсчета К', и угла 6, измеренного в системе К. Если источник света приближается или удаляется от наблю- наблюдателя, находящегося, например, в начале системы К', то гово- говорят о продольном допплер-эффекте. Приближению отвечает cos 0 = 1 и частота ш > а/, удалению cos 6 = — 1 и со < to'. Интересно сравнить релятивистскую формулу для изменения частоты при допплер-эффекте с классической. Последняя полу- получается из элементарного рассмотрения цуга волн, испускаемых движущимся источником и достигающих наблюдателя, и имеет вид (|) B2,7) Величина угла в классической физике считалась инвариантной во всех системах отсчета. Сравнивая классическую и релятивистскую формулы для из- изменения частоты при допплер-эффекте, мы видим, что при дви- движении источника излучения со скоростью v <c с, так что можно положить 1/ 1 — -V = 1 и ~ 1 + —cos0, обе фор- 1 cos О с мулы совпадают. Однако, если учитывать квадратичные члены,
288 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл Ш то между этими формулами возникает существенное различие. В частности, при движении источника в направлении, перпен- перпендикулярном к направлению наблюдения, т. е. при 0 — -^^ клас- классическая формула B2,7) показывает, что изменение частоты не происходит. Наоборот, согласно теории относительности возни- возникает изменение частоты («поперечный» допплер-эффект), рав- равное, согласно B3,6), -¦?. B2,8) Изучение законов допплер-эффекта на опыте имело особенно большое значение потому, что изменение частоты непосред- непосредственно связано с изменением времени при переходе от одной инерциалыюй системы отсчета к другой. Экспериментальное из- изучение допплер-эффекта позволило с большой степенью точности подтвердить правильность релятивистских соотношений. В опытах Айвса изучалось изменение частоты, излучавшейся атомами водорода в каналовых лучах. Скорость атомов состав- составляла приблизительно 6- 10~3 с. Главная трудность заключалась в выделении эффекта второго порядка по (~)> малого по срав- сравнению с обычным (классическим) смещением линии на величину порядка — . Для этого световые лучи, испускаемые вдоль и про- против направления движения, совмещались с помощью зеркал. Согласно релятивистской формуле B2,1) среднее значение из- излучаемых частот линий равно Классический результат был бы ш = о/. Измерения с большой степенью точности подтвердили реля- релятивистскую формулу B2,9). Опыты Айвса, относящиеся к 1938 г., явились первым непо- непосредственным экспериментальным подтверждением релятивист- релятивистского закона изменения времени при преобразованиях Лоренца. С этой точки зрения они играли роль, аналогичную опытам Майкельсона. Взяв за основу совокупность этих двух опытов, можно было бы последовательно построить всю схему теории относительности, если бы эксперимент в этой области предше- предшествовал развитию теории.
§ 22] ДОППЛЕР-ЭФФЕКТ, ЭФФЕКТ МГ.ССЕАУЭРА 289 Чрезвычайно точное измерение квадратичного эффекта Доп- плера стало возможным в самое последнее время благодаря от- открытию нового важного явления, так называемого эффекта Мёссбауэра. Хорошо известно, что у-кванты, излучаемые ядра- ядрами, являются в высокой степени монохроматическими. Ширина соответствующих спектральных линий на много порядков меньше естественной ширины линий, излучаемых атомами при оптических переходах. Это обстоятельство служило в течение долгого времени препятствием к наблюдению резонансного по- поглощения ядрами, т. е. поглощению ими у-квантов собственных частот. Ядра, как и атомные системы, весьма энергично поглощают излучение той частоты, которую они сами излучают. Однако, в отличие от излучающих атомных систем, ядра при излучении Y-квантов испытывают очень значительную отдачу. Эта отдача изменяет частоту излучаемого у-кванта, что, благодаря очень малой ширине линий, приводит к полному нарушению резонанса. Мёссбауэр показал, что ситуация может быть существенно изменена, если ядра ^-излучатели находятся в кристаллической решетке. Сила взаимодействия атомов в кристаллической ре- решетке с соседями весьма велика. Поэтому импульс отдачи, по- получаемый ядром при излучении у-кванта, оказывается недоста- недостаточным для того, чтобы ядро было вырвано из своего положе- положения в решетке. Импульс отдачи передается всему кристаллу как целому1). Масса последнего чрезвычайно велика и излучение у-кванта происходит практически без отдачи. у-лучи, излучае- излучаемые ядрами, находящимися в кристаллической решетке, имеют несмещенную частоту vo. При пропускании у-лучей, излученных кристаллическим излучателем без отдачи через поглощатель, содержащий те же ядра, что и излучатель, наблюдается резо- резонансное поглощение Хотя испускание у-квантов происходит без отдачи и импульс кристалла можно считать равным нулю, наличие теплового дви- движения приводит к малому изменению частоты. Именно, по> скольку скорость излучателя — атомного ядра, совершающего тепловое движение, отлична от нуля, должен иметь место эф- эффект Допплера. Для вычисления изменения частоты можно воспользоваться следующими соображениями. Если ядро излучает частоту vo, то энергия у-кванта равна /jvo. Масса у-кванта равна —¦. В результате излучения масса ') По крайней мере при достаточно низкой температуре. Более подробно об условиях, при которых импульс передается кристаллу как целому см Р. Мсссбауэр, УФН, т. 72, вып. 4 (I960), Ф. Л. Ш а п и р о — в том же выпуске журнала. ]9 В Г. Левич, том I
290 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. III ядра уменьшается на эту величину. Пусть масса ядра до излу- излучения равна М, а его кинетическая энергия При излучении масса ядра уменьшается на величину —? при постоянном значении импульса. При этом кинетическая энергия изменяется на величину Заменяя истинное значение р2 средним значением M2v2 для теп- теплового движения, получаем и2 Увеличение кинетической энергии излучающего ядра в про- процессе излучения движущимся ядром означает, что у-квант уно- 1 j-l. Эта энергия меньше, чем энергия Y-кванта, излучаемого неподвижным источником, на величину АЕнт1. Таким образом, тепловое движение излучаю- излучающих ядер приводит к смещению частоты от v0 до v, равной \l~w)- Это выражение для смещенной частоты совпадает с формулой квадратичного (с учетом членов порядка -р-1 эффекта Допплера. Отсутствие линейного члена в формуле допплер-эффекта свя- связано с тем, что средняя скорость теплового движения равна, нулю. Сдвиг излучаемой линии на величину ^°" хорошо согла- согласуется с опытными данными. Поскольку среднеквадратичная скорость молекулы в кри- кристалле зависит от температуры, можно найти температурную зависимость величины смещения v — vo: d Да Op d ~df~ ~ Ж5" dT
$ 22] ДОППЛЕР-ЭФФЕКТ; ЭФФЕКТ МЁССБАУЭРА 291 Но в кристалле теплоемкость при температуре, существенно выше дебаевской, равна (см. C0,1) ч. III): cv = N w N (+) N откуда Точность измерений эффекта Мёссбауэра настолько велика, что и этот эффект был измерен. Мы не можем останавливаться здесь на ряде других весьма важных результатов, полученных при изучении эффекта Мёссбауэра '). Остановимся теперь на некоторых формулах преобразования величин, играющих важную роль в физике. Мы начнем с рас- рассмотрения излучения частицы, движущейся со скоростью, близ- близкой к скорости света. Предположим, что в системе координат, движущейся вместе с излучающей частицей, излучение может происходить под боль- большим углом к направлению движения, т. е. cos 8' изменяется в пределах 0<cos9'<l. Посмотрим, каков будет угол, который будет образовывать из- излучение в неподвижной (лабораторной) системе отсчета. Формулу B2,3) удобно преобразовать, положив в ней где /2 При V, близких к с, величина агE§|1. Вводя это обозначение, получаем при а?|Я 1 cos 0 ¦¦ ('-J_)cose' l 2jr aa(l+cose0 „ , , cos6'-l 1 , tg 2 _ cosy cosG'+l o2 a2 a2 A + cos 6') ') См. цитированную статью Ф. Л. Шапиро (сноска на trp. 289), а так- также статьи Мёссбауэра и Паунда в том же номере УФН. 19*
292 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. Ш Поскольку cos 9 близок к единице, сам угол 9 равен л 2,8' и весьма мал при достаточно большом значении а, т. е. при ма- малом значении разности с — v. Это означает, что в неподвижной системе все излучение направлено вперед и заключено в узком конусе углов А9 ~ 1/ 1 — -^j-. Раствор этого конуса тем меньше, чем ближе скорость источника v к скорости света. Получим, далее, важную для приложений формулу преобра- преобразования элемента телесного угла dQ. Имеем, по определению, dQ.'= -2я d cos 6'. Поэтому Из формулы B2,5) находим () B2>П) I с Дифференцируя B2,11) по cos 9, находим d cos 9' с2 Поэтому окончательно с2 . B2,12) (,-ico.e) Найдем закон преобразования энергии в электромагнитной волне. Из общего соотношения A3,9) и формулы C3,12) ч. I имеем Е (nv) I—— cos 9 ^J c B2>l3)
§ 22] ДОППЛПР-ЭФФЕКТ; ЭФФЕКТ МЕССБАУЭРЛ 293 Инвариант 4-вектора энергии — импульса для электромагнит- электромагнитного поля в силу соотношения B7,10) ч. I равен нулю: l = g2—P—0. B2,14) Заметим, что выписывая формулы для энергии и импульса поля, которые были определены в ч. I как плотности соответствую- соответствующих величин и отнесены к единице объема, движущегося вместе с полем, т. е. со скоростью света, мы должны были бы более строго определить, что означает такой объем в теории относи- относительности '). Сравнивая B2,13) с формулой B2,4) для преобразования частоты, приходим к важному равенству: #-У-invar. B2,15) Найдем теперь выражение для преобразования полной ин- интенсивности излучения: 1 dt • Поскольку полный импульс, излучаемый системой в той си- системе отсчета, в которой она в момент излучения покоилась, ра- равен нулю (ср. B8,5) ч. I), можно написать Е Л-- Отсюда в силу F,3) dE d E dE V с2 dE dt ~ dt _ Г 3- _ Г. 5*~ dt ~ dt' и, следовательно, /=-4f=-^f- = invar. B2,16) Таким образом, полная интенсивность (энергия, излучаемая в единицу времени) является инвариантом. Интенсивность излу- излучения в элементе телесного угла dQ преобразуется по формуле dl = / (9) dQ = V (9') dQ' = invar, ') Это преобразование можно найти, например, в книге В. Паули, Теория относительности, Гостехиздат, 1947 или в неоднократно цитированной книге Беккера.
294 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. III откуда следует, что ^ с' . B2,17) Комбинируя формулы B2,4) и B2,12), приходим к выра- выражению со2 du = с/ dQ' = invar. B2,18) На практике часто приходится рассматривать закон преобра- преобразования величин dkx, dky, dkz. Из B2,2) находим v dtss' dkx = Учитывая, что ш' = с yk'x + ft'2 + k'l, имеем da у г так что db — икх dk'x X \ ф' у и, /-¦?¦ ' Кроме того, можно написать откуда находим dk'y = dky> г » (й kx со' + vk'x 0' / „2 dK = dkz, dkxdkudkP dk'dk'dk' со = J =invar, B2,19) или, в сферических координатах, i^- = ^^- = invar. B2,20) Важным вопросом в современной физике частиц высокой энергии является вопрос о преобразовании полного сечения рас- рассеяния при переходе от одной инерциальной системы к другой. В § 43 ч. I мы видели, что полное сечение в классической физике является инвариантом. В теории относительности эффек- эффективное сечение в общем случае не является инвариантом.
5 22] ДОППЛЕР-ЭФФЕКТ; ЭФФЕКТ МЕССБАУЭРА 295 Согласно D3,2) и D3,4) ч. I полное число частиц, рассеян- рассеянных за время dt объемом V в системе отсчета К, в которой рас- рассеиватель покоится, равно dN = где р — плотность числа частиц рассеивателя и п — плотность частиц в рассеиваемом пучке, v2 — скорость рас- рассеиваемых частиц, i»i — скорость частиц рассеивателя, равная нулю в системе К. Пусть в системе К' рассеиватель движется со скоростью v'{. Тогда ввиду инвариантности числа частиц dN имеем dN = alffiV dt = o'V'Ifa' dt', где Отсюда следует, что сюр J v2 - vl | V dt = o'n'p' | v'2 - v[ | V dt'. В силу формул F,2) и F,3) произведение Vdt является ин- инвариантом. Плотность рассеиваемых частиц п и плотность рас- рассеиваемых частиц р удовлетворяют уравнению непрерывности. Соответственно этому, можно построить 4-векторы (pfi, tcp) и (nv2, icn). Образуем их скалярное произведение, являющееся инвариантом. Имеем, очевидно, (ре,, /ср) ¦ (nv2, icn) = n'v'v'jo\ - с\'п' = - с2рл, поскольку в системе К рассеиватель покоится и Vi = 0. Преобразуя, имеем Таким образом, можно написать Поскольку Vi = 0, последнюю формулу можно записать в сим- симметричном виде: о I»» — v, I о' I да» — v', I
296 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. III Мы видим, что полное эффективное сечение рассеяния не яв- является инвариантной величиной. В частном случае, когда скорости рассеиваемых частиц и рассеивателя направлены навстречу друг другу или в противо- противоположных направлениях, мы можем выбрать направление дви- движения за ось х и воспользоваться формулой сложения скоро- скоростей. Согласно G,1) имеем 1 Таким образом, в этом частном случае а = о' = invar. B2,22) Интересным является вопрос о том, в каком виде представ- представляются быстро движущиеся объекты при их регистрации на фо- фотопластинку или визуальном наблюдении. Иными словами, спра- спрашивается, будет ли заметным лоренцево сокращение? Например, будет ли наблюдаться шар в виде эллипсоида, а куб в виде па- параллелепипеда и т. д.? Недавно соответствующее исследование было проведено Террелом '). Оказалось, что быстро движущиеся объекты должны наблюдаться не сплюснутыми, но поверну- повернутыми, причем угол поворота зависит от скорости объекта по от- отношению к наблюдателю и от угла наблюдения. Для того чтобы понять этот на первый взгляд неожиданный результат, уточним различие между результатами измерения формы быстро дви- движущегося тела и специальным случаем регистрации этой формы на фотопластинке. В общем случае для измерения формы тела, например, регистрируя излучение, одновременно выходящее с различных точек его поверхности, мы должны учесть конечное значение скорости света. Различные точки объекта наблюдения — движущегося тела— находятся на различных расстояниях от регистрирующего при- прибора. Поэтому электромагнитные волны, излучаемые различ- различными точками поверхности тела, до попадания в прибор прохо- проходят различные пути за разное время. Для получения правильной формы объекта наблюдения необходимо внести соответствую- соответствующие коррективы в данные измерений. При фотографировании или визуальном наблюдении тела си- ситуация изменяется. Фотопластинка (или глаз) регистрирует из- излучение, дошедшее до нее в данный момент времени. Следова- Следовательно, на фотопластинке одновременно регистрируются элек- электромагнитные волны, излученные разными точками объекта иа- ') J. Terr el, Phys. Rev. 116, 1041, 1959. См. также работу W. Weis- kopf, Physics to day 13, 24, I960.
§ 22] ДОППЛЕР-ЭФФЕКТ; ЭФФЕКТ МЁССБАУЭРА 297 блюдения в различные моменты времени. Пусть в некоторой си- системе отсчета покоится фотопластинка аа (рис. 27). Предполо- Предположим, что по направлению к ней движется протяженное тело. Скорость тела (и связанной с ним системы отсчета К') обозна- обозначим через v. Назовем углом наблюдения О угол между прямой, проведенной от фотопластинки к телу, и вектором скорости v. Излучение тела можно характеризовать в системе отсчета К', связанной с телом, волновым вектором k'. Угол наблюдения в системе отсчета К' будет равен О'. При этом угол 9', образуе- образуемый волновым вектором к' со скоростью V, равен, очевидно, В системе отсчета К волновой вектор в образует с вектором v угол в, причем 9 = л — ¦&. Будем считать телесный угол, под которым виден объект наблюдения, достаточно малым. При этом излу- излучение, испускаемое раз- разными его точками, мож- можно характеризовать од- одним значением волнового "~"~-^>^/f," вектора в. Назовем «кар- «картинкой» изображение тела на фотопластинке, Рис 27. полученное в некоторый момент времени. Посмотрим, каким образом получается картинка, т. е. как фиксируют электромагнитные волны, излучаемые разными точками Л, В, С поверхности тела (см. рис. 27). Одновременно с волной, излученной точкой С на по- поверхности тела, до фотопластинки доходят волны, излученные точками А и В в тот момент времени, когда они находились в положениях соответственно А' и В'. Иными словами, на фото- фотопластинке в точках Л", В", С" одновременно регистрируется из- излучение точек Л, В, С. Однако при этом до пластинки доходят волны, излученные в более далеких точках Л и Б в более ран- ранние моменты времени. Найдем связь между углами наблюде- наблюдения ¦& и ¦&'. Учитывая указанную выше связь между углами наблюде- наблюдения О и#'и углами излучения 0, 0' и формулу B2,5), мы мо- можем написать При этом в формуле B2,5) мы заменили углы 0 и в' на я—О, я — У. Графически зависимость й' = /(¦&) представлена на
298 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. II! рис. 28. Пунктиром на том же рисунке показана прямая ¦&' = #, отвечающая случаю v = О, т. е. регистрации на фотопластинке неподвижного по отношению к ней объекта. Рассмотрим прежде случай ft = п. Это означает, что фотографируемое тело движется прямо к фотопластинке. При этом ¦&' = я, т. е. мы получаем на пластинке изображение передней поверхности тела. /о2 1 г-. Это значит, что угол наблюдения лежит вне узкого конуса около направления движения. Из формулы B2,23) и гра- графика на рис. 28 видно, что при v та с значениям угла наблю- наблюдения |- отвечают значения угла $\ близкие к нулю. Углам 0\. близким к нулю, отвечают углы 6', близкие к я. Это зна- значит, что при скоростях движе- движения тела, близких к скорости света, на фотопластинку попа- попадает излучение с тыльной сто- стороны тела. Подчеркнем, что этот результат относится к телу, движуще- движущемуся по направлению к фотографирующему устройству (Ф>-^|. Наблюдаемая при этом интенсивность может быть найдена из. формулы B2,17). Именно, имеем Рис. 28. 1 — — Если угол ¦&<я —Т/ 1 2~, т0 наблюдаемая интенсивность света мала. Этот результат имеет простой смысл: при v ~ с в системе К все излучение сконцентрировано в узком конусе с рас- раствором Д6~"|/ 1 —^у в направлении скорости тела. В общем случае можно сказать, что если фотографируемый объект движется со скоростью v и наблюдается под некоторым углом Ф, то получается такая же картинка, что и при фотогра- фотографировании неподвижного объекта, но видимого под углом Ф'. Таким образом, изображение движущегося объекта на фотопла- фотопластинке получается таким же, как на пластинке, неподвижной по отношению к объекту. Однако объект фотографирования ока-
§ 231 СИЛА ЛОРЕНЦА: ФУНКЦИИ ЛАГРАНЖА И ГАМИЛЬТОНА 299 зывается повернутым на угол ¦&'— д. Так, при фотографирова- фотографировании шара на фотопластинке должен получиться круг, при фото- фотографировании куба — куб, по- вернутый под разными углами, и т. п. На рис. 29 схематически по- показано, как должно изменяться изображение куба на фотопла- стинке по мере приближения от- относительной скорости к скорости света. Точкам А, В, С, D куба отвечают на фотопластинке точки А', В', С, D'. Мы видим, как постепенно происходит «поворот» изображе* ния. Приведенные соображения де- делают особенно ясной бессмыс- бессмысленность терминологии «кажу- «кажущееся сокращение» в применении к лоренцеву сокращению. Заметим, что вся картина усложняется, если объект наблю- наблюдается под большим телесным углом. В этом случае каждой точке объекта соответствует свой угол наблюдения О, а следова- следовательно, и свой поворот. Однако и в этом случае изображение сферы на фотопластинке должно быть кругом. § 23. Сила Лоренца; функции Лагранжа и Гамильтона частицы, движущейся в электромагнитном поле В электродинамике было приведено выражение для силы, действующей на заряд, движущийся в электромагнитном поле. Эта сила, называемая силой Лоренца, была взята из опытных данных. Сейчас мы приведем простой вывод формулы для ло- ренцевой силы, основанный на преобразованиях векторов элек- электромагнитного поля. Рассмотрим некоторый заряд е, движущийся с произвольной скоростью v относительно неподвижной системы отсчета К. Пусть в системе отсчета, движущейся вместе с зарядом, имеется электрическое поле ?'. Тогда на заряд в системе отсчета К' дей- действует сила ЗГ Е B3,1)
300 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. Ill Нашей задачей является нахождение силы, действующей на заряд в неподвижной системе отсчета (в которой он движется со скоростью v). Для этого необходимо выразить поле Е' через электромагнитное поле Е, а силу ЗГГ — через силу &" в непо- неподвижной системе отсчета. Первое преобразование дается непо- непосредственно формулами § 21. Формулы для преобразования силы можно получить сле- следующим образом: найдем прежде всего формулы для преобра- преобразования компонент силы Минковского. Сила Минковского является 4-вектором, и ее компоненты преобразуются по общим формулам A1,1) — A1.4). В нашем случае в системе, движущей- движущейся вместе с зарядом, скорость v' = 0 и поэтому ^ = 0. При этом F\ = —г , '» ^2 = F2, F3 = F3. Компоненты силы Минковского связаны с компонентами обыч- обычной силы У соотношениями типа A2,5). В системе, движущейся вместе с зарядом, v' = 0 и F] = oF x\ F2 = &F у, Fi = eFz. В неподвижной системе по определению § 12 Поэтому находим ') без труда of x = u?x'i QFy = vFyy I —рг! oFz — sFzy I —^г". B3,2) Комбинируя B3,1), B3,2) и формулы преобразований B1,1) — B1,3), получаем выражения для компонент силы: ^х = <^'х = еЕ'х=еЕх, B3,3) B3,4) B3,5) ') Подчеркнем, что приведенные формулы справедливы только для пере- перехода от системы координат, движущейся имеете с частицей, к неподвижной системе.
5 23] СИЛА ЛОРЕНЦА; ФУНКЦИИ ЛАГРАНЖА И ГАМИЛЬТОНА 301 В векторном виде: &-=.e{E+±[vH]}. B3,6) Таким образом, выражение для силы Лоренца получено чи- чисто расчетным путем из общих соотношений теории относи- относительности. Напишем уравнения движения A2,3) для случая движения заряженной частицы во внешнем электромагнитном поле. Первые три уравнения имеют вид }. B3,7) При составлении четвертого уравнения нужно учесть, что ра- работа силы в магнитном поле равна нулю (так как v[vH] = =H[vv] = 0) и, следовательно, -М. = g-v = eEv. B3,8) В последующих параграфах мы рассмотрим некоторые ча- частные случаи движения частицы в электрическом и магнитном полях. Для дальнейшего нам понадобится выражение лоренце- вой силы через электромагнитные потенциалы. Имеем Воспользуемся формулой векторного анализа A,47) 4- [v rot A] + [A rot v] = (v grad) A + [v rot Л]- При этом мы учли, что дифференцирование по координатам производится при постоянном значении скорости v. Пользуясь этой формулой, перепишем SF в виде <Г = е { - grad Ф - i- ^ +1 grad (Av) - 1 (г- grad) A} = где полная производная (см. 1,7) dA дА Уравнения движения приобретают вид dt r zr — egraa-| n ф j- r iU . [Z6,y)>
302 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл lit Эти уравнения движения можно рассматривать как уравнения Лагранжа, если функция Лагранжа имеет вид B3,10) Действительно, при этом обобщенный импульс p_^Z1== mv , е л _ , е Соответственно обобщенная сила Q = -Qf = 7 grad (Av) - e grad ф. Уравнение Лагранжа гласит: d dL _dL dt dv ~ Or ' или B3,12) Подстановка значений Р и Q в B3,12) вновь приводит нас к B3,9). В нерелятивистском приближении функция Лагранжа при- приобретает вид (^) 1 B3I3) При этом мы опустили постоянную (—тс2), поскольку в урав- уравнения Лагранжа входят лишь производные от L и сама L опре- определена лишь с точностью до полной производной по времени1). Сравнивая функцию Лагранжа в обычном поле сил, — 2 мы видим, что при движении в поле функция Лагранжа содер- содержит еще член, зависящий от скорости и вектора-потенциала. Поэтому даже в нерелятивистском приближении функция Ла- Лагранжа в электромагнитном поле не может быть представлена в виде разности кинетической и потенциальной энергий. ') Л. Д. Ландау и Е. М. Лифшиц, Механика, Физматгиз, 1958, стр 13.
J23] СИЛА ЛОРЕНЦА; ФУНКЦИИ ЛАГРАНЖА И ГАМИЛЬТОНА 303 Найдем еще функцию Гамильтона заряженной частицы в электромагнитном поле. Очевидно, имеем Я= ? bPtLvPL — fJSL^ + mct B3,14) /-? Для получения функции Гамильтона следует еще выразить ско- скорость v через обобщенный импульс Р. Проще всего это сделать, исходя из равенств -^-, B3,15) 1 —J с2 которые получаются после возведения в квадрат B3,14) и B3,11). Переписывая B3,16) в виде m'v1 - + т2с*-тЧ* = -Щг-тЧ* = [p - ± с2 сг и сравнивая с B3,15), получаем или Я - ]/mV + (/» 7 Как и следовало ожидать из общих соображений, функция Гамильтона в электромагнитном поле, по существу, совпадает с функцией Гамильтона в электростатическом поле: магнитное поле не изменяет энергию частицы. В нерелятивистском приближении получаем из B3,17) p. B3,18) Последнее выражение, если не считать энергии покоя, совпадает fc классическим выражением функции Гамильтона частицы в влектромагнитном поле (см. ч. I, D1,4)).
304 ЭЛР.КТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. ИГ § 24. Движение частиц в постоянных электрическом и магнитном полях Простейшим случаем движения релятивистских частиц яв- является движение их в постоянных полях — электрическом и магнитном. Вместе с тем, движение заряженных частиц в элек- электрическом и магнитном полях имеет очень большой практиче- практический интерес. Достаточно привести несколько примеров: изуче- изучение движения электронов в электрическом и магнитном поляк позволило с большой степенью точности проверить релятивист- релятивистское выражение для импульса; релятивистские формулы, опре- определяющие закон движения частиц в электрическом и магнитном полях, представляют основу проектирования современных уско- ускорителей ядерных частиц, позволяющих получать частицы ре- релятивистских энергий. Изучение движения весьма быстрых частиц в камере Вильсона, помещенной в магнитное поле, слу- служит для определения их импульса. Сочетание измерений им- импульса с определением энергии (производимым, например, по создаваемой частицами ионизации) дает возможность опреде- определить массу частиц. Рассмотрим сначала движение релятивистской частицы в по- постоянном во времени и однородном в пространстве электриче- электрическом поле Е. Направление вектора Е выберем за ось х. Соглас- Согласно § 12 уравнения движения имеют вид dt -*-"*> dpy dpz dt =~dT ' dt ~"х x x dt ' В качестве первого примера рассмотрим движение заряда в поперечном электрическом поле. Пусть в момент времени /=0 заряд находился в точке х = 0 и имел импульс рх = О, ру = р0, pz = 0 и энергию Это означает, что в начальный момент заряд двигался в на- направлении, перпендикулярном к полю. Интегрирование уравне- уравнений для компонент импульса в постоянном электрическом поле выполняется непосредственно и с учетом начальных условий дает Рх = eExt, ру = Ро, pz = U. (z4,1) Уравнение для энергии также интегрируется непосредственно; Е = еЕхх + Ео.
§ 24] ДВИЖЕНИЕ ЧАСТИЦ В ПОСТОЯННЫХ ПОЛЯК 305 С другой стороны, 2X + Р2у + Р\) с2 + т2с* е = V(p[ = y[(eEJf + f%\c* + m*c* = V(ecExtf + E2Q. Сравнивая два выражения для энергии, можем написать V{ecExtf + El= еЕхх + Ео. B4,2) Формулы B4,1) показывают, что движение является пло- плоским и происходит в плоскости (ху). Для нахождения траекто- траектории можно составить отношение Рх mvx . rnvy _ vx _ dx^ Подставляя в B4,3) значение — из B4,1), получаем Ру dx _ ?М. dy~ Ра ¦ Для исключения времени воспользуемся формулой B4,2), которая дает ecEx Подставляя это выражение в B4,4), приходим к дифференци- дифференциальному уравнению траектории dy cpo Интегрирование дает уравнение траектории сРй J сРй J V(eExx + EQf-El еПх ИЛИ еЕх ср0 v > / Формула B4,5) показывает, что в поперечном электрическом поле заряд движется по цепной линии. При !/<с можно на- написать г- 9 тс2 и еЕху /п. „ч Ео « тс2; ро~ mvQ и х *« -^ ch -^g.. B4,6) Если аргумент гиперболического косинуса, содержащий с в знаменателе, мал, то, разлагая B4,6) и ряд, приходим к клас- классической формуле для траектории, найденной нами ранее (см. ч. I, § 39).' 20 В. Г. Леаич, том
306 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. ПТ Вторым важным случаем является движение заряда вдоль электрического поля, т. е. случай начальных условий р@) = о; р(о) = 0; р(о> = 0; ?<°> = тс2. * У * При этом поле будет считаться постоянным во времени, но произвольно изменяющимся в пространстве вдоль оси х. f t 20 30 ЬОМэвО t,0 2,0 3ft a) ffj Рис. 30. Интегрирование уравнений для компонент импульса дает Px=eEx{x)t, py=0, pz=0. B4,7) Уравнение для энергии запишем в виде dE d(f> dx dfp If** ~e~!x ~dT=~e~dF' где ф — электростатический потенциал. Отсюда находим инте- интеграл энергии Е + еф = const = тс2 +' бф0, или 1 --l\~eV, B4,8) где V-— пройденная частицей разность потенциалов и Д? — со- соответствующее изменение энергии. Скорость частицы, прошед- прошедшей разность потенциалов V, равна -*--^- m2c' т B4,9) Это выражение постоянно используется на практике для вы- вычисления скорости частицы, разгоняющейся в электрическом поле (рис. 30).
5 24] ДВИЖЕНИЕ ЧАСТИЦ В ПОСТОЯННЫХ ПОЛЯХ 307 При -^-j- <C 1 формула B4,9) переходит в классическое eV выражение C9,1) ч. I. Наоборот, при -^ > 1 с увеличением потенциала, скорость частицы стремится к постоянному пре- пределу: v-*-c. Если поле однородно в пространстве, то зависимость ско- скорости и координаты от времени получается непосредственно из B4,7). Именно, из B4,7) имеем B4,10) Формула B4,10) дает закон равномерно-ускоренного движе- движения в механике теории относительности. Под равномерно-уско- равномерно-ускоренным движением в теории относительности понимают следующее: введем множество инерциальных систем отсчета Ki> Къ Кз, ..., движущихся со скоростями, равными скорости движения частицы в различные моменты времени. Каждая из систем отсчета К' называется мгновенно-сопутствующей ча- частице. В мгновенно-сопутствующей системе скорость частицы равна нулю. Поэтому согласно A1,12) и A1,16) компоненты 4-ускорения равны в К': В неподвижной системе отсчета, в силу A1,1), w'r eEr v и, Л Отсюда найдем величину v, которую мы и будем называть уско- ускорением: Интегрируя B4,11), вновь приходим к формуле B4,10). Инте- Интегрируя B4,10), получаем закон движения: Это — уравнение гиперболы. Поэтому движение в постоянном поле в релятивистской механике часто именуется гиперболи- 20*
308 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. III ческим, в отличие от параболической траектории классической механики. Наконец, рассмотрим движение частицы в постоянном и однородном магнитном поле Н. Направление последнего выбе- выберем за ось z. Тогда уравнения движения приобретают вид Интегрируя уравнение для энергии, имеем Е = const = ?0. Прл этом с помощью A3,20) получаем dpx d IЕ \ Ео dvx dpy ?( dt dt \сг xj с2 dt ' dt c2 dt ' Поэтому уравнения для х-й и у-й компонент импульса можно написать в виде 1 dvr ecH 1 dt dvy ~dT Уравнениям B4,14) можно удовлетворить, положив vx = a cos (at + a); vy = — a sin {(at + a). B4,15) При этом для (о находим со = -тг-. B4,16) Кроме того, подстановка B4,15) в B4,14) с учетом B4,16) дает Величина (»х)о представляет начальную скорость движения частицы в плоскости (ху), которая остается постоянной во вре- времени. Вторичное интегрирование приводит к уравнению траекто- траектории в плоскости (ху): х = хо + ~± sin {at + а); у = уа + ±^- cos (a>t + а). Вдоль оси z, как видно из B4,13), частица движется с постоян- постоянной скоростью:
§ 24] ДВИЖЕНИЕ ЧАСТИЦ В ПОСТОЯННЫХ ПОЛЯХ Если, в частности, заряд в начальный момент не имел ско- скорости вдоль оси г, т. е. (vzH = 0, траектория его представляет окружность в плоскости (ху), радиус которой равен »(°-Оо_Ыо?о сРо B4т * © ecll ~ еН ' Х^Л1) где pa — начальный импульс. Частота обращения по окружности о пропорциональна на- напряженности магнитного поля и зависит от энергии Ео, которая остается постоянной при движении. При малых энергиях и <o«-j?, B4,18) т. е. переходит в циклотронную частоту, определенную в § 39 ч. I и не зависящую от энергии частицы. Формулы B4,16) и B4,17) имеют весьма важное значение для современной ядерной физики и техники. Измерение отклонения частиц в магнитном поле позволяет найти их импульс по формуле B4,17). Формула B4,16) служит основой расчета современных ци- циклотронов, позволяющих получить тяжелые частицы (протоны, дейтроны и сс-частицы) с релятивистскими скоростями. Как известно, в циклотроне частицы движутся в магнитном поле по окружности в разрезных коробках, именуемых дуанта- ми, к которым приложено переменное напряжение. Промежуток между дуантами частицы проходят в ускоряющем электриче- электрическом поле. Таким образом описав полуокружность с неизменной скоростью, частица ускоряется, описывает следующую полу- полуокружность с новым значением скорости и т. д. Для непрерыв- непрерывного разгона поле в ускоряющем промежутке в момент подхода частицы должно быть в определенной фазе. До тех пор, пока частицы не приобретут релятивистских скоростей, частота элек- электрического поля, подаваемого на дуанты, определяется форму- формулой B4,18) и не зависит от энергии частицы. Если, однако, скорость частиц достигает релятивистских значений, частота их обращения согласно B4,16) оказывается изменяющейся с энер- энергией. Поэтому для дальнейшего разгона частиц необходимо из- изменять частоту ускоряющего поля в соответствии с формулой B4,16). Циклотроны, работающие в режиме переменной часто- частоты, называются релятивистскими циклотронами или синхротро- синхротронами. Впервые расчет синхротронов был осуществлен 1944 г. В. И. Векслером, показавшим, что благодаря особым свой- свойствам движения заряженных частиц (так называемой автофази-
310 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. ИГ ровке) в синхротроне подвергаются ускорению частицы, посту- поступающие в камеру ускорителя с различными начальными фа- фазами движения. Ускорение легких частиц — электронов — уже при сравни- сравнительно малых энергиях проводится в релятивистском режиме. Одним из важнейших типов ускорителей является индук- индукционный ускоритель — бетатрон. Принцип действия бетатрона заключается в следующем: в бетатроне электроны движутся в магнитном поле с аксиальной симметрией между полюсами электромагнита. Если бы магнитное поле было постоянным во времени, дви- движение электрона с постоянной скоростью совершалось бы по окружности радиуса R, даваемого формулой B4,17). В бета- бетатроне, однако, напряженность магнитного поля изменяется во времени. Для конкретности будем счатать, что напряженность магнитного поля возрастает во времени. Это изменение напря- напряженности магнитного поля влечет за собой: I) появление индуцированного электрического поля с напря- напряженностью Е, определяемой формулой или 2nRc dt ' где Ф= f HdS — поток индукции через площадь круговой ор- орбиты радиуса R; в силу осевой симметрии магнитного поля ясно, что электрическое поле направлено по касательной к окруж- окружности радиуса /?; соответственно, на электрон будет действовать сила (—eEv), также направленная по касательной к этой окружности; возрастание импульса электрона будет отвечать, согласно B4,17), возрастанию радиуса орбиты, т. е. стремлению электрона двигаться по развертывающейся спирали; 2) уменьшение радиуса окружности в B4,17) при росте на- напряженности Н\ это отвечает тенденции электрона двигаться по свертывающейся спирали. Если подобрать закон изменения Н во времени (и, как это будет видно из дальнейшего, в пространстве) так, чтобы обе тенденции точно компенсировали друг друга, электрон будет двигаться по окружности постоянного радиуса R с возрастаю- возрастающим импульсом. Это — так называемый бетатронный режим движения частицы. Перейдем к выяснению условий, при которых будет иметь место подобный режим.
§25] СИСТЕМА СЛАБО ВЗАИМОДЕЙСТВУЮЩИХ ЗАРЯЖЕННЫХ ЧАСТИЦ 311 Изменение импульса электрона можно написать в виде ?Hr- <24'l9> Если считать, что электрон движется по окружности постоян- постоянного радиуса, то, интегрируя B4,19), получаем Постоянная интегрирования положена равной нулю в предпо- предположении, что в момент времени / = 0 имеют место равенства Я=0 и о = 0. Если подставить р в B4,17), то условие постоянства радиуса орбиты во времени можно представить в виде * = ^ = № B4.20) Поток магнитной индукции через площадь орбиты равен Ф = nR2H, где Н — среднее поле внутри орбиты. Тогда условие B4,20) сводится к равенству н И Последнее означает, что для движения ускоряемого электрона по круговой орбите необходимо создать не только переменное во времени, но и неоднороднее в пространстве магнитное поле. Поле на орбите должно быть равным половине средней напря- напряженности внутри орбиты. Для выполнения этого требования поле должно спадать с увеличением радиуса г. Ясно, что уско- ускорение частиц в бетатроне имеет прерывистый характер — оно происходит только при возрастании магнитного поля во вре- времени. Мы не можем осветить здесь вопросы устойчивости дви- движения частиц на орбите бетатрона, а также детали устройства реальных ускорителей 1). § 25*. Система слабо взаимодействующих заряженных частиц Мы можем теперь вернуться к системе частиц в релятивист- релятивистской механике и рассмотреть упоминавшийся в § 15 случай ча- частиц, связанных между собой электромагнитным взаимодей- взаимодействием 2). ') См., например, А. П. Гринберг, Методы ускорения заряженных частиц, Гостехиздат, 1950. 2) В. А. Фок, Теория пространства, времени и тяготения, Гостехиздат,. J955, стр. 105; Л. Д. Ландау, Е. М. Лифшиц, Теория поля, Физматгиз„ I960, стр. 203.
312 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. Ш Мы указывали уже, что для системы взаимодействующих ча- частиц нельзя ввести потенциальную энергию взаимодействия, по- поскольку запаздывающее взаимодействие зависит не от взаим- взаимного положения частиц в данный момент времени, но от движе- движения их в предшествующее время. Кроме того, при ускоренном движении заряженные частицы излучают и часть энергии уходит из системы, так что система в целом является неконсервативной. Оказывается, однако, что если движение частиц совершается достаточно медленно, так что ч < с, то в известном приближе- приближении можно ввести понятие о взаимодействии системы зарядов, зависящем только от их взаимного расстояния. Это позволит характеризовать состояние системы движущихся зарядов с по- помощью механических величин и рассматривать движение си- системы вне непосредственной связи с состоянием электромагнит- электромагнитного поля, по законам механики. Действительно, если заряды движутся с малыми скоростями, так что запаздыванием можно полностью пренебречь, то их энер- энергия взаимодействия выражается формулой электростатики где.г,-л — фиксированное расстояние между зарядами i и k. Для произвольно выбранного ft-ro заряда можно написать функцию Лагранжа в виде ^ B5,2) где q>h — потенциал поля, действующего на заряд k. Функция Лагранжа системы зарядов получается простым суммированием: B5,3) Зная функцию Лагранжа, можно найти закон движения системы. Дальнейшие расчеты покажут, что и в следующих приближе- приближениях разложения по степеням отношения —, вплоть до членов С порядка-V. можно найти функцию Лагранжа системы. Это в свою очередь позволит осуществить указанную программу чисто механического описания системы зарядов. Вместе с тем ясно, что если не отбрасывать величины по- порядка (—V , то подобное описание станет, вообще говоря, невоз- невозможным. Действительно, согласно результатам § 27 ч. I, ди- польное излучение системы определяется величиной порядка 1/е3.
§ 25] СИСТЕМА СЛАБО ВЗАИМОДЕЙСТВУЮЩИХ ЗАРЯЖЕННЫХ ЧАСТИЦ 313- Сохранение старших членов разложения потенциалов отвечает учету дипольного излучения. Это делает незаконным механиче- механический подход к рассмотрению состояния системы. В системах, в которых нет дипольного излучения, разложе- разложение потенциалов можно провести до членов следующего порядка малости. Напишем функцию Лагранжа Л-й частицы с учетом движения зарядов в системе: у 1 - ? - ek<vk + Ц- (vkAk), B5,4> где <pft и Aft — потенциалы поля, существующего в той точке, где находится /е-й заряд. Эти потенциалы с учетом конечности ско- скорости распространения взаимодействия можно представить в виде запаздывающих потенциалов (ср. § 24 ч. I): При медленном движении (v «С с) плотность заряда и плот- плотность тока можно разложить в ряд по степеням времени за- запаздывания. Важное отличие этого разложения от аналогичных формул § 26 ч. I заключается в том, что нас интересуют потен- потенциалы в точке rh, находящейся в пределах рассматриваемой си- системы зарядов. Поэтому нельзя разбить полное время запазды- запаздывания на собственное запаздывание и запаздывание системы, и разложение следует вести по полному запаздыванию: Тогда имеем S Отсюда
314 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. ИГ Порядок дифференцирования и интегрирования может быть изменен, поскольку вектор г* фиксирован, а г' является сово- совокупностью трех независимых переменных. Поскольку интеграл во втором члене берется в момент вре* мени t, он представляет полный заряд системы. Соответственно Окончательно находим dv'+&w J'Гк ~г''р (r'*t] dV'' B5>5) dK/' B5'6) Дальнейшие вычисления становятся более прозрачными, если перейти к точечным зарядам, положив Р(г', /)-2Ч<К'"-rt(t)). B5,7) Штрих при знаке суммы показывает, что в ней отсутствует член i = к. В дальнейшем мы не будем писать штрих при сумме, чтобы не загромождать формул, но будем подразумевать его во всех суммированиях по зарядам. Подставляя выражение B5,7) для p(r', t) в B5,5) имеем B5,8) Подчеркнем, что в результате интегрирования (устранения о-функции) вместо f в соответствующих выражениях появился радиус-вектор rt(t) t-ro заряда, явно зависящий от времени, Поэтому результат интегрирования по переменным г" следует дифференцировать по времени. Аналогично, полагая У (г', t) = 2' e,vt б (г' - rt (t)), B5,9) имеем из B5,6) Здесь ф,- и Ai — потенциалы, создаваемые в момент времени t в точке rft i-u зарядом. Выражение B5,8) для скалярного потенциала с учетом за- запаздывания (второе слагаемое) содержит вторую производную
$ 25] СИСТЕМА СЛАБО ВЗАИМОДЕЙСТВУЮЩИХ ЗАРЯЖЕННЫХ ЧАСТИЦ 315 по времени от вектора rt, т. е. ускорение i-й частицы, создающей поле в точке rh. Между тем, в функцию Лагранжа могут вхо- входить только координаты и скорости частиц. Поэтому целесооб- целесообразно произвести градиентное преобразование (см. § 11 ч. I) и подобрать функцию г|з так, чтобы в скалярном потенциале вто- второй член отсутствовал. Именно, полагая где e (rk-Ti,Vi) е \ (rk-ri)\dri 9 m ~ 2с I \fk-n\i dt ~ 2С \rk-n\ ' V°'ll> находим из B5,5) 22f^77t- <25-12> При дифференцировании по времени положение точки наблю- наблюдения fft является фиксированным, градиент направлен от за- заряда ( к точке наблюдения, уг означает скорость движения t-ro заряда в момент времени t. Соответственно, для А' получаем ^7T^ ^l^^. B5,13) i По формуле gradr< \rh-r,\ ~~ \гк-г,\ + \rk-n\3 где а — постоянный вектор, находим \rk~ri\ Iг*-/-, I Г \rk-r,\» Отсюда для полного вектора-потенциала находим 1 Л'_ V ( etot , е, *Ai Zj\ 2c\rk-ri\ ^ 2с Найденные выражения B5,12) и B5,14) для q/ и А' следует подставить в функцию Лагранжа B5,4) &-й частицы. Предва- Предварительно в ней следует разложить первый член в ряд по
316 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. III степеням —,г и ограничиться членами того же порядка малости, что и удержание вф'и А'. Это дает -J-i-|). B5,15) В результате находим 2 mbV С2 2c2 \rk-n\ Первый член в функции Лагранжа Lh относится к покоя- покоящейся частице, второй имеет смысл кинетической энергии в при- приближении классической механики, третий — релятивистской по- поправки к кинетической энергии. Слагаемое в фигурных скобках зависит только от мгновенных положений и скоростей частиц. Величину „ ___???* 1 eie/t'OiVk e-fik (rk - г,-, Vj) (rk - ru vk) .„ _. ik~ \rk~ri\ 2c2 \rk-n\ 2с2|г4-гг|» ' ^o,i/; зависящую от расстояния между f-й и k-н частицами в данный момент времени, можно рассматривать как обобщенную энер- энергию взаимодействия между частицами. Первое слагаемое имеет очевидный смысл — это потенциальная энергия взаимодействия между двумя неподвижными 1-й и k-м зарядами. Два других OiDb члена, пропорциональных , , представляют поправку к энер- гии взаимодействия, учитывающую движение зарядов и запаз- запаздывание. Ясно, однако, что хотя {/,-& — энергия взаимодействия, она не имеет смысла потенциальной энергии, зависящей только от положения частиц. Выражение B5,17) совершенно симметрично в обоих заря- зарядах. Поэтому легко написать функцию Лагранжа для системы частиц. Именно, l где L\ — функция Лагранжа системы зарядов в пренебрежении релятивистскими поправками и запаздыванием, даваемая фор-
§ 25] СИСТЕМА СЛАБО ВЗАИМОДЕЙСТВУЮЩИХ ЗАРЯЖЕННЫХ ЧАСТИЦ 317 мулой B5,3), и L2 — добавка к ней, найденная с точностью до /о\з членов порядка I — I : B5,19) Зная функцию Лагранжа, можно найти энергию, массу и им- импульс системы. Энергия системы находится по обычным правилам и равна ^пол.. = 2 Vk 4k ~ L = Е° + El + E» B5>20) ft где и ?2— релятивистская поправка к энергии, которая равна ft > i J B5,21) Мы видим, прежде всего, что энергия системы не может быть представлена в виде суммы кинетической и потенциальной энер- энергий. Релятивистская поправка к энергии Е2 зависит как от ко- координат, так и от скоростей, так что с учетом этой поправки по- потенциальной энергии системы не существует. Лишь в случае не- неподвижных зарядов, точнее, зарядов, движущихся так медленно, а2 , что величинами порядка — можно полностью пренебречь, воз- С можно опустить величину Е2 и пользоваться потенциальной энер- энергией B5,1). Пользуясь обычным определением массы, находим массу си- системы М- = —^- = 2jl mk "* ^—" B5,22) k Таким образом, масса системы слагается из масс покоя частиц и масс, обязанных своим происхождением кинетической энергии и энергии взаимодействия частиц системы (в приближении не- неподвижных зарядов — потенциальной энергии). Масса М не об- обладает, очевидно, аддитивными свойствами и не равна сумме масс отдельных частиц. Энергия системы Е и ее масса М сохра- сохраняются. Однако для отдельных слагаемых, входящих в ЕП0!т и М, написать закон сохранения нельзя.
318 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл Ш Импульс системы Р, по определению, равен к где Рх = 2 nHt°k ~~ обычное значение импульса в классической механике и Рг — релятивистская поправка к нему: B5,24) Мы видим, что поправка Р2 к импульсу зависит от координат частиц системы. Легко показать, что в рассматриваемом приближении можно ввести понятие о центре инерции системы, которое не суще- существует в произвольной системе взаимодействующих частиц. Из определения A5,16) скорости центра инерции Va „ = -? видно, Лполн что вектор Уц. и можно представить в виде производной по вре- времени от радиуса-вектора центра инерции: {} *«¦ и - — ^пгг — • <25-25) В этом можно убедиться непосредственной проверкой равенства хг dRa. и Рс* ц. и dt Епош' „2 справедливого с точностью до величин порядка —j-. С Помимо интеграла энергии и импульса, система материаль- материальных точек обладает интегралом момента i, B5,26) где LQ — момент импульса классической механики, a Lx — реля- релятивистская поправка, зависящая от скоростей и координат всех точек системы. Мы видим, что в этом приближении (с учетом поправок ¦V в релятивистской механике системы можно ввести те же основ- основные понятия, что и в классической механике. Однако и в этом приближении система не обладает потенциальной энергией. Таким образом, кроме разобранного в § 15 случая системы частиц, взаимодействующих путем столкновений, в теории отно-
$ 26] ИЗЛУЧЕНИЕ ДВИЖУЩЕГОСЯ ЗАРЯДА 319 сительности можно построить общую механику системы взаимо- взаимодействующих заряженных частиц. Однако в этом случае теория имеет приближенный характер и наименьшие удерживаемые в ней члены имеют порядок-^-. Учет последующих членов разло- жения по степеням (у) возможен лишь в конкретных систе- системах, не обладающих дипольным (члены ( —j j, квадрупольным ( (—] и т. Д. излучениями. В дальнейшем нам понадобится другое представление энер- энергии взаимодействия в том случае, когда система состоит из двух частиц. Записав функцию Лагранжа первой частицы в виде будем считать (pi и А{ потенциалами поля, создаваемого второй частицей в той точке пространства, в которой в момент времени / находится первая частица. С учетом запаздывания и при про- произвольном законе движения потенциалы ф! и А\ представляют потенциалы Лиенара — Вихерта. Потенциалы Лиенара — Вихер- та ф1 и А{ связаны между собой формулой B5,5) ч. I: Поэтому Отсюда следует, что для энергии взаимодействия двух ча- частиц можно написать выражение ^), B5,27) где ф — потенциал поля, зависящий от мгновенного расстояния R(x) между зарядами. § 26. Излучение движущегося заряда Формула B8,4) ч. I для излучения движущегося заряда применима лишь при скоростях, малых по сравнению со ско- скоростью света. Для получения аналогичного выражения, спра- справедливого при скоростях, близких к скорости света, введем в рассмотрение совокупность сопутствующих систем координат, в которых в каждый данный момент времени частица покоится.
320 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. III В каждой из них для излучения справедлива формула B8,4) ч. 1. Излучение, описываемое этой формулой, имеет характер сферических волн, так что полный импульс излученных элек- электромагнитных волн равен нулю. Энергия, излучаемая зарядом в единицу времени, согласно B2,16) является инвариантом: dE dE' . /ос ., ~1г = ~~ьт= ••• =invar- BQ>1> Для потери энергии на излучение за единицу времени можно написать, согласно B8,4) ч. I, dE' 2е2 , /Ч2 2 е2 , /v, поскольку в сопутствующей системе координат w'x = 0. Им- Импульс, теряемый на излучение в единицу времени, согласно B8,5) ч. I равен нулю: -^=0. B6,3) Для нахождения излучения в произвольной системе (не- штрихованной) отсчета следует лишь преобразовать квадрат ускорения (и>«J по формуле A1,17) к ускорению в нештрихо- ванной системе. Тогда имеем dE dE' 2ti l_^ j_ *c- \ i- / ь /л» ,i dt <Mt dt' ~ Зс3 г  ^3 = 4^3 '  ^3 " ^ ' Л о2\з Зс3 / uM3 V с*) V с') При этом для изменения импульса в единицу времени с по- помощью A3,6), B6,2) и B6,4) получаем dp V dE' ~ 2 d< Очевидно, при ^ <С 1 формулы B6,4) и B6,5) переходят в B6,2) и B6,3). С Формулы B6,4) и B6,5) позволяют находить ь произволь- произвольной, например лабораторной, системе отсчета энергию и им- импульс поля излучения, создаваемого ускоренно движущимся зарядом. Обычно ускоренное движение быстро движущихся частиц связано с воздействием на них электромагнитного поля. Для преобразования формул B6,4) и B6,5) к этому частному слу-
$ 26] ИЗЛУЧЕНИЕ ДВИЖУЩЕГОСЯ ЗАРЯДА 321 чаю воспользуемся выражением A2,14) для ускорения частицы в электромагнитном поле; подставляя значение лоренцевой силы, находим \ B6,6) Используя это выражение для ускорения, имеем ,26.7) Излучение энергии в единицу времени зарядом, движу- движущимся в электромагнитном поле, равно dE 2e4 dt ~ 3m2c3 _ о2 1 2 2е' / тс2 3mV I , \У '"IT Рассмотрим несколько случаев формулы B6,8) для ультра- ультрарелятивистского случая о «с. Пусть имеется только электрическое поле (т. е. Н=0). То- Тогда ±__ ?2 dt ~ При v±E потеря энергии При v||? потеря энергии dE 2e4E*K.,2/, v2\ 2e* ^ I1 ) и от энергии не зависит. 21 В. Г. Левич, том I
322 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. III При движении в магнитном поле, перпендикулярном к на- направлению скорости (v±H), и ? = 0 находим где р — импульс частицы. Формулы B6.9) — B6,12) используются в ядерной физике для определения потерь энергии ультрарелятивистскими части- частицами при движении в электрических и магнитных полях. При- Примером движения ультрарелятивистских частиц в магнитном поле может служить движение заряженных частиц в космиче- космических лучах в магнитном поле Земли и в магнитном поле бета- бетатрона. Расчеты показали, что потери энергии на излучение в магнитном поле определяют верхний предел энергии частиц, мо- могущих достигать поверхности Земли, а также верхний предел энергий, до которых электроны могут быть ускорены в бета- тропе. Важным применением полученных формул является расчет тормозного излучения ультрарелятивистских частиц в электри- электрическом поле ядра. Ультрарелятивистский электрон, пролетаю- пролетающий мимо ядра, испытывает весьма малое отклонение. Его ско- скорость можно считать постоянной, а ускорение — перпендику- еЕ , лярпым к направлению скорости и равным w± = —^-, где Интегрируя по времени пролета, получаем полную потерю энер- энергии ультрарелятивистской частицы на тормозное излучение — компонента поля ядра, перпендикулярная к скорости (на- (направление последней выберем за ось х). Для поперечного уско- ускорения можно пользоваться нерелятивистским выражением, по- поскольку соответствующая компонента скорости весьма мала. Как и в § 43 ч. I, р — прицельный параметр, а г — расстояние между ядром и электроном. При движении с постоянной ско- скоростью можно считать, что
§ 2G] ИЗЛУЧЕНИЕ ДВИЖУЩЕГОСЯ ЗАРЯДА 323 Имеем, очевидно, Формула B6,15) позволяет найти потери на тормозное излу- излучение при прохождении весьма быстрых частиц в веществе. Величина потерь энергии быстро растет с увеличением атом- атомного номера Z вещества, в котором движется частица. Формула B6,13) определяет потери энергии одной частицы, пролетаю- пролетающей на расстоянии р от ядра. Она показывает, что потери быстро растут с уменьшением р. На практике частица может пройти на любом расстоянии от ядра. Умножая B6,13) на 2л;р dpn, где п — плотность пучка, и интегрируя по всем значениям р, мы находим эффективное излучение пучка частиц В формулу B6,14) введено минимальное приближение электро- электрона к ядру рмин, поскольку интеграл расходится на нижнем пре- пределе. Введение этой неизвестной означает, что классическая теория излучения оказывается неприменимой для расчета тор- тормозного излучения. В квантовой механике будет показано, что классическое рас- рассмотрение движения электрона неприменимо па малых рас- расстояниях. Квантовомеханический расчет приводит к значению
324 ЭЛЕКТРОДИНАМИКА ТЕОРИИ ОТНОСИТЕЛЬНОСТИ [Гл. III Сравнение ее с формулой для потерь энергии на ионизацию показывает, что тормозное излучение является основным фак- фактором, определяющим торможение быстрых электронов в ве- веществе. Потери на тормозное излучение являются основными для электронов при энергиях порядка 200 тс2 A00 Мэв),ъ воз- воздухе и 20 тс2 A0 Мэв) в свинце. У тяжелых частиц, например протонов, почти все потери связаны с ионизацией вплоть до очень больших энергий. В заключение заметим, что нельзя непосредственно перехо- переходить от формулы B6,14) к нерелятивистской формуле D3,17) ч. I, полагая v<g.c. Формула B6,14) найдена для v^c, а не для общего случая произвольной скорости.
ЧАСТЬ III СТАТИСТИЧЕСКАЯ ФИЗИКА ГЛАВА Г ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ § 1. Задачи статистической физики. Необходимые сведения из классической и квантовой механики В ч. III мы ознакомимся с основами атомной теории макро- макроскопических тел. Под макроскопическими телами мы будем понимать системы, построенные из весьма большого числа частиц. Обычно принято разделять атомную теорию макроско- макроскопических тел на два раздела — статистическую физику и фи- физическую кинетику. В статистической физике ограничиваются рассмотрением свойств макроскопических систем, состояния которых не изме- изменяются во времени. Состояния макроскопической системы, в ко- которых она может находиться неопределенно долгое время, на- называют равновесными. Поэтому можно сказать, что задачей статистической физики (ее называют иногда статистической ме- механикой или физической статистикой) является исследование свойств и поведения макроскопических систем, находящихся в состоянии равновесия, на основании известных свойств обра- образующих их частиц. Частицами, из которых построены макроскопические тела, могут быть элементарные частицы — электроны, протоны, ней- нейтроны и т. п. или их образования — ядра, атомы и молекулы. Для краткости все частицы, т. е. молекулы, атомы, электроны, протоны и т. д., мы будем называть микрочастицами. Большая часть тел в обычных физических условиях построена из атомов яли молекул, как из структурных единиц. Лишь в высокотемпе- высокотемпературной плазме (см. ч. IV) приходится учитывать возможность диссоциации (распада) атомов на электроны и ядра. В статистической физике свойства и законы движения эле- элементарных частиц, атомов и молекул считаются известными. Задача состоит в том, чтобы описать поведение систем, содер- содержащих весьма большое число частиц с известными свойствами.
326 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. Г Исследования методами статистической физики свойств мак- макроскопических систем, состоящих из очень большого числа ча- частиц, позволили выявить важную принципиальную особенность- таких систем. Она заключается в том, что поведение макроско- макроскопических систем определяется закономерностями особого тина, получившими название статистических закономерностей. Оказалось при этом, что общие равновесные свойства си- систем сравнительно мало зависят от конкретных свойств частиц, из которых построены тела, и законов их взаимодействия. По- Поэтому в статистической физике удается установить общие за- законы поведения всех макроскопических систем, находящихся в состоянии равновесия. В частности, статистическая физика позволяет найти универсальные законы теплового поведения макроскопических тел (законы термодинамики). Однако при- применение ряда общих соотношений статистической физики к кон- конкретным системам требует некоторых, хотя и весьма ограни- ограниченных, сведений о законах, определяющих поведение атомных систем. Мы неоднократно подчеркивали, что классическая физика оказалась неприменимой в области атомных явлений. Поэтому применение законов статистической физики к реальным систе- системам фактически невозможно, если попытаться ограничиться классическими представлениями о движении атомных частиц. Мы будем вынуждены поэтому, забегая вперед, привести огра- ограниченный круг сведений из квантовой механики. Наряду с установлением свойств макроскопических тел, на- находящихся в состоянии равновесия, большой интерес для фи- физики представляет нахождение поведения тел, состояния кото- которых изменяются во времени. Изучение свойств макроскопиче- макроскопических систем, не находящихся в равновесии, является задачей физической кинетики. Ясно, что законы изменения состояния макроскопических систем — законы физической кинетики, яв- являются существенно более сложными, чем законы, определяю- определяющие поведение равновесных систем. В физической кинетике практически не удалось выявить конкретные законы изменения состояния систем во времени, имеющие универсальный харак- характер. Поэтому в настоящее время найдены законы поведения неравновесных систем, имеющих простейший характер. Перейдем теперь к изложению необходимых сведений из классической и квантовой механики. Для наглядного описания поведения механических систем, движение которых описывается уравнениями Гамильтона, Р ^ ( 12/) 01>
5 1] ЗАДАЧИ СТАТИСТИЧЕСКОЙ ФИЗИКИ 327 (где pi и 9i — обобщенный импульс и обобщенная координата, / — число степеней свободы, равное 3N, N — число материаль- материальных точек в системе, и Н — функция Гамильтона), в механике часто пользуются графическими приемами. Одним из таких приемов служит изображение состояния механической системы 6 фазовом пространстве. Фазовым пространством называется изобразительное про- пространство, в котором в качестве осей координат выбраны обоб- обобщенные координаты и импульсы. Рассмотрим сначала случай системы с одной степенью сво- свободы. Пусть нам известна зависимость координаты q и импульса р от времени. Тогда можно построить графики #@ и p(t), по- показывающие изменение этих вели- величин во времени. Удобнее, однако, иметь график, представляющий по- последовательность состояний систе- системы, а не отдельные графики, изо- изображающие изменения ее положе- положения и импульса. Для получения гра- графика последовательности состояний Рис 3[ нужно совместить два графика q(t) и рA), исключив из них время. Выберем в качестве оси абсцисс обобщенную координату q, а в качестве оси ординат — обобщенный импульс р. Кривая на рис. 31 показывает измене- изменение состояний системы. Так, например, в точке / система имела координату </i и импульс ри в точке 2 — аналогично qi и р2 и т, д По мере возрастания времени координата системы q и ее импульс изменяются по закону, изображенному графиком. Согласно определению пространство, изображенное на рис. 31, и есть фазовое пространство. Необходимо решительно подчерк- подчеркнуть, что фазовое пространство не имеет ничего общего с реаль- реальным пространством и является чисто условным понятием. Каждой точке фазового пространства соответствует вполне определенное состояние системы. Точку, положение которой в фазовом пространстве характеризует состояние системы, назы- называют изобразительной точкой. При изменении состояния си- системы, т. е. ее положения в реальном пространстве и импульса, положение изобразительной точки в фазовом пространстве из- изменяется, и она описывает некоторую фазовую траекторию. Форма этой траектории совершенно не похожа на форму реаль- реальной траектории. Однако она связана с ней, так же как и с за- законом изменения импульса, причем соответствие взаимно одно- однозначно. Для того чтобы представить себе все сказанное нагляднее, рассмотрим движение линейного гармонического осциллятора, Движущегося под действием квазиупругой силы F«=—%q около
328 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. 1 начала координат q = 0. Уравнение движения имеет вид mq = — щ. 0>2) Оно легко интегрируется: q = A sin (at + а), A,3) где А — амплитуда и а-фаза, определяемые начальными усло- условиями. При этом импульс осциллятора р = та A cos (at + a) A,4) и частота Формула A,3) представляет уравнение реального движения. Чтобы найти траекторию изобразительной точки в фазовом про- пространстве, нужно найти связь между р и q. Возведя уравнения A,3) и A,4) в квадрат и складывая, находим Это — уравнение эллипса. Таким образом, при колебаниях ос- осциллятора около точки д = 0 с амплитудой А изобразительная точка в фазовом пространстве описывает эллипс с полуосями а = А и Ь = тыА. Площадь эллипса S = ф р dq = nab = лпгсоА2. С другой стороны, вычисляя энергию осциллятора е, имеем откуда находим важное соотношение в = -= = v<fcprf<7. 0.5') Понятие о фазовом пространстве может быть введено и для системы с большим, чем одна, числом степеней свободы. В этом случае число измерений в фазовом пространстве равно, оче- очевидно, удвоенному числу степеней свободы, так как за одну ось принимается координата, а за другую — импульс. В случае систем с большим числом степеней свободы фазовое простран- пространство имеет очень большое число измерений и уже не может быть представлено графически. Тем не менее, и в этом случае ис- использование представления о фазовом пространстве оказывается очень полезным. Нам в дальнейшем понадобится выражение для элемента объема в фазовом пространстве. Обобщая обыч- обычное определение элемента объема dV = dx dy dz на случай мно-
$ 1J ЗАДАЧИ СТАТИСТИЧЕСКОЙ ФИЗИКИ 329 гих измерений, можно написать для элемента фазового объема следующее выражение: dT = dqidq2 ... dq3Ndpxdp2 ... dp3fl, A,6) где tig,- — дифференциал i-Pi координаты, a dpt— дифференциал i-то импульса, соответствующего этой координате (i=l, 2, ... ..., 3N). В произведение в правой части выражения A,6) вхо- входят в качестве множителей дифференциалы 3N обобщенных ко- координат и стольких же импульсов. Часто наряду с фазовым пространством пользуются поня- понятиями пространства конфигураций и пространства импульсов. Изобразительное пространство 3N измерений, в котором в качестве осей выбраны обобщенные координаты, называется пространством конфигураций. Совокупность всех положений частиц системы характеризуется положением изобразительной точки в пространстве конфигураций. Элементом объема про- пространства конфигураций служит dVK0I^ = dqi ... dq3N. A,7) В пространстве импульсов координатными осями служат 3/V компонент импульсов частиц /э(, Рг ••• Рзлг- Изобразительная точка характеризует значение всех импульсов частиц. Элемент объема пространства импульсов равен dVnvn = dp1 ... dpiN, A,8) так что dV = rfKKo-ф dVam. A,9) Понятия о фазовом пространстве, а также пространстве кон- конфигураций и импульсов, очень полезны для наглядного пред- представления законов статистической физики. Движение механических систем определяется так называе- называемыми динамическими закономерностями. Характерной особен- особенностью динамической закономерности является то, что если известно начальное состояние системы и воздействие на нее со стороны окружающих тел, состояние системы в любой после- последующий момент движения может быть однозначно определено. Иными словами, при заданных силах, действующих на систему, начальное состояние системы однозначно определяет все даль- дальнейшее ее движение. Общие черты, характерные для динамической закономер- закономерности, проявляются не только в механике, но и в широком круге других физических явлений, в частности в электродинамике. Было бы, однако, принципиально неправильным утверждать, как это делалось рядом исследователей, начиная с Лапласа, что динамическая закономерность исчерпывает все виды причин- причинности и взаимной обусловленности явлений в природе.
330 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. I Как мы увидим ниже, поведение макроскопических тел не подчиняется динамическим закономерностям, но определяется закономерностями другого типа — статистическими закономер- закономерностями. В дальнейшем мы будем предполагать, что атомы, молекулы и другие частицы, образующие макроскопические системы, дви- движутся по законам квантовой механики. Изложению последних посвящена ч. V этой книги. Здесь мы без доказательства при- приведем самые необходимые сведения и соотношения. Отличительной особенностью всех микросистем (атомов, мо- молекул) является то, что в известных условиях они могут нахо- находиться в дискретных, или квантованных, состояниях. Опытное и теоретическое (см. ч. V) изучение состояний атомов и моле- молекул показало, что их энергия может принимать дискретный ряд значений ej, ег, е3, ..., причем переход между этими состоя- состояниями, например ei и ег, происходит без прохождения состояний с промежуточными энергиями между ei и г% Таким образом, атом может поглощать или отдавать энергию определенными порциями, квантами. Состояний с промежуточными энергиями у атома не существует. Дискретный, квантовый, характер имеет не только энергия, но и ряд других величин, характеризующих состояние атомных систем, например, момент количества движения, который также принимает в атоме дискретный ряд значений и может изме- изменяться лишь скачкообразно. Энергию и подобные ей величины называют квантованными, а совокупность их возможных значе- Ш1Й — спектром. Квантованные значения энергии часто назы- называют также уровнями энергии. Существование квантованных состояний коренным образом противоречит законам классической механики, в которой со- состояния системы всегда изменяются непрерывно. В начале развития атомной теории были получены некото- некоторые формальные правила, с помощью которых из всех возмож- возможных с точки зрения классической механики состояний отбира- отбирались те, которые фактически могут реализоваться в атоме. Эти правила были названы квантовыми условиями Бора. Дальнейшее развитие атомной физики показало, что пред- представления классической физики требуют еще более глубокого изменения. В настоящее время законы движения микрочастиц выяснены в квантовой механике с достаточной полнотой. Откладывая подробное знакомство с ними до ч. V, приведем пока некоторые из них. 1. Квантованное движение частицы в потен- потенциальном ящике. В § 8 ч. V будет рассмотрена простей- простейшая квантовомеханическая система — микрочастица с массой
•§ I] ЗАДАЧИ СТАТИСТИЧЕСКОЙ ФИЗИКИ 335 т, заключенная в одномерном потенциальном ящике с непро- непроницаемыми стенками. Область движения такой частицы огра- ограничена размерами потенциального ящика (областью 0-^.х^Са, где потенциальная энергия равна нулю). На границах области при х=0, х — а потенциальная энергия отталкивания бесконечно велика и частица не может удалиться из ящика. Из общих положений квантовой механики следует, что энер- энергия и импульс такой частицы пробегают дискретные ряды зна- значений. Допустимые значения энергии и импульса даются фор- формулами: п~ '2т Здесь h — величина, именуемая мировой квантовой постоянной, или постоянной Планка (Л = 6,62• 107 эрг-сек); п — величина, пробегающая ряд целочисленных значений (л=1, 2, 3, ...), именуемая квантовым числом. Формула A,11) показывает, что уровни энергии частицы об- образуют дискретный ряд или спектр; расстояние между сосед- соседними уровнями энергии равно Де„ = еп+1-ев--^-B/1 + 1). A,12) Мы видим, что эти расстояния тем меньше, чем больше масса частицы и размеры области движения а. В случае движения частицы в области достаточно больших размеров расстояние между уровнями энергии настолько мало, что они образуют практически непрерывный спектр. Точно так же непрерывный спектр энергии и у любой частицы с большой, макроскопической массой. Найдем еще относительное расстояние между уровнями энергии, которое равно, очевидно, Гп При niS>l относительное расстояние между уровнями или вели- величина «ступенек» энергетического спектра равна «« * A,14) п п. При больших квантовых числах относительное расстояние между уровнями быстро убывает с ростом п, так что дискрет- дискретный характер спектра сглаживается.
332 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. t Мы видим, таким образом, что дискретность уровней энергии квантовой частицы проявляется: 1) при малой массе, 2) при движении частицы в малой области и 3) при малых квантовых числах. Наоборот, при больших массах, при движении в боль- большой области и больших квантовых числах квантование прояв- проявляется сравнительно слабо. Чтобы представить себе порядки величин, рассмотрим не- несколько чисел. Пусть, например, протон с массой тр = = 1,7-10~24 г движется в ящике, сторона которого имеет раз- размеры, близкие к атомным (a=10~8 см). Выражая энергию в электрон-вольтах, имеем е„=0,02»2 эв и Ае„ = (Х02B/г+1) эв. При не очень больших п расстояния между уровнями энергии оказываются одного порядка величины с самими энергиями (на- (например, при и=3 ез~0,2 эв, Дез~0,1 эв). Однако иначе дело обстоит в том случае, когда протон движется в области макроскопических размеров (например, а = 1 см). Тогда е„=2-10-18п2 эв A,15) и расстояние между соседними уровнями Де„=2.10-18Bп+1) эв. A,16) Пусть протон имеет энергию 2 ¦ 10~2 эв (как будет видно в даль- дальнейшем, такую энергию имеют атомы, находящиеся в тепло- тепловом движении при нормальной температуре). Тогда из A,15) находим: п~108. При таких значениях п относительное расстоя- расстояние между уровнями оказывается ничтожно малым. Таким об- образом, уже при движении протона в области достаточно боль- больших размеров дискретный, квантовый, характер его состояний проявляется весьма слабо. То же самое в еще большей степени относится к макроскопическому шарику с массой, равной, ска- скажем, 1 г. Движение такого шарика с огромной степенью точ- точности описывается законами классической механики. Закономерности, проявляющиеся в рассмотренном спе- специальном случае частицы, движущейся в потенциальном ящике, имеют общий характер. В ч. V будет показано, что классическая механика представ- представляет предельный случай квантовой механики, в которую по- последняя переходит, когда эффектами, пропорциональными по- постоянной Планка, можно пренебречь. Это возможно при изу- изучении явлений сравнительно большого масштаба, когда массы частиц, размеры области движения и т. д. достаточно велики.
«11 ЗАДАЧИ СТАТИСТИЧЕСКОЙ ФИЗИКИ 333 Рис. 32. Оказывается, что переход от квантовой механики к класси- классической можно сделать двояким образом: можно просто, пола- полагая Л=0, полностью пренебречь всеми квантовыми эффекта- эффектами— существованием у микрочастиц волновых свойств, кванто- квантованием энергии и других величин и т. д.; можно однако, считать h малой, но все же отличной от нуля величиной. Оказы- Оказывается, что в последнем приближении волновые свойства частиц проявляются очень слабо. Частицы можно считать движущи- движущимися по определенным траекториям, таким же, как в класси- классической механике. Однако квантование состояний все еще проявляется в том, что оказываются возможными не все, а только некоторые из классических траекторий. Такое приближение назы- называется квазиклассическим (в отличие от классического приближения, в кото- котором квантовые свойства частиц совсем ие учитываются). Чтобы представить себе, в чем состоит характер огра- ограничений, накладываемых на клас- классические траектории, вновь обра- обратимся к примеру частицы в одномерном ящике. Будем счи- считать, что можно пользоваться представлениями классической механики и рассматривать частицу как материальную точку, движущуюся между отражающими стенками. Фазовая диа- диаграмма на рис. 32 изображает последовательность ее состоя- состояний. Учтем теперь квантование состояний и выделим из всех возможных состояний те, которые удовлетворяют условию квантования A,10). Возможными оказываются ие все состоя- состояния р = const, а отстоящие друг от друга на расстоянии, опре- определяемом соотношением A,10). На рис. 32 изображено п-с (сплошная линия) и (п—1)-е (пунктирная линия) состояния. Число возможных квантовых состояний с импульсом, лежащим hn h между Рп = -2^ и Р = ~Ш' равн0 "• Вычислим теперь площадь Sn на фазовой плоскости, отве- отвечающую этим п состояниям. Очевидно, Sn = Ф Р dx = 2рпа = hn. Интеграл wpdx означает интеграл от р, взятый по полному периоду движения, т. е. по площади, ограниченной жирными прямыми на рис. 32. Этот интеграл равен а 0 а ф pdx= J pdx— J pdx = 2 J pdx.
334 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. I Если провести на рисунке линии, отвечающие остальным воз- возможным состояниям, то вся плоскость разобьется на клетки. Нетрудно видеть, что площадь всех клеток одинакова и равна h. Действительно, расстояние между возможными состояниями но оси р равно hn h(n-\) _ h 2а la ~ 2а' Площадь клетки (заштрихованная на рисунке) равна 2--д-Х X а = h. Таким образом, в квазиклассическом приближении каждому возможному состоянию соответствует клетка в фазовом про- пространстве, имеющая площадь h. Стационарными, возможными состяниями системы являются те, для которых выполнено условие " pdx^nh. A,17) § Последнее условие совпадает с условием Бора старой кванто- квантовой теории. Рассмотренный пример является типичным, и найденное условие A.17) имеет общий характер. Чтобы в этом убедиться, рассмотрим другой пример — линейный осциллятор. Примером осциллятора, совершающего малые колебания около положе- положения равновесия, как мы увидим ниже, может служить двух- двухатомная молекула. В квантовой механике (см. § 10 ч. V) по- показывается, что состояние осциллятора характеризуется кван- квантовым числом k, могущим принимать ряд полуцелых значений: , 13 5 , 1 к ~> ~о> "о~т ¦¦•* Т. е. к • it ~\ 2 (п—целое число). Энергия осциллятора принимает ряд значе- значений (см. A0,18) ч. V) A,18) При переходе осциллятора из данного квантового состояния в соседнее он излучает свет с частотой равной собственной частоте колебаний классического осцилля- осциллятора '). ') В квантовом механике показывается, что у осциллятора возможны пе- переходы только между соседними состояниями, так что т = и + 1. См. § 106 ч. V.
§ 1] ЗАДАЧИ СТАТИСТИЧЕСКОЙ ФИЗИКИ 335 Сравнивая A,18) с формулой A,5'), мы видим, что кванто- квантовое условие A,18) выделяет в качестве возможных те состоя- состояния осциллятора, для которых имеет место соотношение A,19) Все возможные орбиты изобразительной точки осциллятора, отвечающие квантовым состояниям пи п2, ..., изображаются подобными эллипсами. При этом площадь эллипса, отвечаю- отвечающего состоянию п, отличается от площади эллипса, отвечающего состоянию п — 1, на величину: ф р dx — ф р dx = h, п-\ где индекс означает номер состояния. На рис. 32 эта площадь. заштрихована. Мы приходим к выводу, что каждому квантовому состоянию осциллятора отвечает клетка в фазовом пространстве, площадь которой равна h. Таким образом, в квазиклассическом приближении (при больших квантовых числах или размерах области движения и больших массах частиц) условие квантования состояний заклю- заключается в том, что каждому квантовому состоянию произвольной системы отвечает клетка, или ячейка в фазовом пространстве, имеющая площадь Л. Можно показать, что форма ячейки яв- является произвольной. До сих пор мы ограничивались рассмотрением систем, имею- имеющих одну степень свободы. Однако оказывается, что получен- полученные результаты имеют общий характер и могут быть перене- перенесены на систему с произвольным числом } степеней свободы. Состояние подобной системы характеризуется заданием / кзач- товых чисел (примеры см. ниже). Фазовое пространс1во си- системы с / степенями свободы имеет 2/ измерений. Вновь в качестве иллюстративного примера рассмотрим дви- движение свободной частицы в ящике с идеально отражающими стенками, но имеющем уже три измерения. Для простоты будем считать, что ящик имеет форму куба с ребром а. Поскольку движение в любом из трех направлений является независимым и все они принципиально равноправны, для каждой из компо- компонент импульса можно написать Движение частицы в трех измерениях характеризуется тремя квантовыми числами П\, м2, п3, могущими принимать ряд целых
336 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. Г значений. Энергия частицы равна 2т Она характеризуется числом п = )/п^ + п| + /г^, но при данном п не зависит от того, каков вклад в это п каждого из квантовых чисел tii, n2, Из в отдельности. Благодаря этому одному и тому же значению энергии может отвечать несколько различных квантовых состояний. Пусть, например, П\ = \, «2 = 2, гс3=2 и «i=2, П2—1, п3=2. В обоих случаях п=3, так что оба состояния имеют одну и ту же энергию. Если нескольким различным со- состояниям отвечает одна и та же энергия, то такие состояния на- называются вырожденными. Число состояний с одной и гой же энергией носит название кратности вырождения или статистического веса. Фазовое пространство частицы в потенциальном ящике имеет шесть измерений, так что изобразить его графически не- невозможно. Однако можно сказать, что оно распадается на три подпространства двух измерений, отвечающие движению в со- соответствующем направлении. Простой подсчет приводит нас тогда к выводу, что каждому состоянию (тройке чисел nit n2 и щ) частицы отвечает объем h3. В самом общем случае произвольной системы, имеющей f степеней свободы, можно показать, что при переходе к квази- квазиклассическому приближению движение системы можно рас- рассматривать так же, как в классической механике, но налагая на возможные состояния ограничение: каждому квантовому со- состоянию системы с f степенями свободы в квазиклассическом приближении соответствует ячейка в ее фазовом пространстве, имеющая объем h1. Доказательство этого утверждения будет дано в § 41 ч. V. При изложении статистической физики нам придется в боль- большинстве случаев рассматривать движение сравнительно тяже- тяжелых частиц (например, молекул), движущихся в макроскопиче- макроскопических объемах, а также поведение макроскопических тел, содер- содержащих огромное число молекул. Для таких систем квантовые явления играют сравнительно малую роль. Тем не менее, как выяснится в дальнейшем, ими нельзя полностью пренебрегать. Поэтому мы будем учитывать их в квазиклассическом приближении, основываясь на приве- приведенном правиле квантования. В остальном же там, где это не оговорено особо, движение систем будет рассматриваться клас- классически. Разумеется, в некоторых случаях, когда масса системы достаточно велика, от квазиклассического способа рассмотрения можно перейти к чисто классическому и полностью пренебрегать
§ 1] ЗАДАЧИ СТАТИСТИЧЕСКОЙ ФИЗИКИ 337 квантовыми эффектами. Так мы будем поступать в гл. III. Од- Однако при общих рассуждениях и выводах будем считать состоя- состояния системы дискретными. 2. Число квантовых состояний. Во всем дальнейшем изложении важную роль будет играть понятие о числе кванто- квантовых состояний, отвечающих энергиям системы, лежащим в за- заданном интервале между е и е + Де. Будем обозначать его через Q(e)Ae. Вычислим это число сначала для частицы, свободно движу- движущейся в ящике. Согласно сказанному выше, каждому состоянию отвечает объем h3 фазового пространства. Поэтому искомое число состояний мы найдем, если вычислим объем фазового пространства, отвечающий энергиям частицы, лежащим между г и е+Ле, и разделим его на Л3. При вычислении фазового объема воспользуемся тем, что в квазиклассическом приближении квантовые скачки малы, и будем считать импульс изменяющимся почти непрерывно. Тогда элемент фазового пространства можно написать в виде A,6). Объем фазового пространства, отвечающий энергиям частицы, меньшим данной величины, получается интегрированием выра- выражения A,6) по всем координатам и всем импульсам, удовлетво- удовлетворяющим соотношению 0 <! р <1 У2тг. Переходя к сферическим координатам, можем написать Г=( dxdydzl dpxdpydpz = VTmz V2me ^| 4яBтГ6'/гК. (U22) VTm о Объем фазового пространства, отвечающий энергиям между е и е+Ле, равен ДГ = -Ц1 Де = AnrnV V2me Ле. A,23) Число состояний частицы, энергии которой лежат между е и е + Ле, равно j<-> гл i \ я 1 ЗГ . inmV V'2m.6 . /i пл\ dQ. = Q (e) Ле = -^ -^ Де = ^ Де. A,24) Поскольку все величины в квазиклассическом приближении изменяются почти непрерывно, мы часто вместо Де будем в фор- формуле A,24) писать бе, считая бе бесконечно малой. Нужно иметь в виду, что при больших значениях (больших квантовых числах) число состояний, отвечающих даже очень малому интервалу Де, оказывается огромным. Так, например, 22 В. Г. Л1вич, том I
338 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. Г в случае атомов водорода при Де = 0,005 эв, г=0,025 эв и V=\ см3 величина ?2Де оказывается равной около 4-Ю28. Эта величина, таким образом, практически не очень отличается от своего классического предела — бесконечности (при h —>-0). Тем не менее, конечность числа квантовых состояний, как мы уви- увидим в дальнейшем, играет большую роль. В случае произвольной системы, имеющей f степеней сво- свободы, можно написать ЛГ = -^-Де, A,25) где ДГ определяется формулой A,6). Соответственно для числа состояний имеем ~ Де, A,26) де или е+Де Q= f dQ = ~. A,26') j fi' e Величина Q (e) может быть названа плотностью числа со- состояний, отнесенных к единичному интервалу изменения энер- энергии. В дальнейшем для краткости будем ?1(е) условно имено- именовать просто числом состояний с данной энергией. Это не должно привести к недоразумениям. Для дальнейшего нам понадобится еще одно довольно оче- очевидное свойство Q. Именно, если имеется система, состоящая из двух независимых частей, и число состояний каждой из них равно Q\ и Q2, то число состояний сложной системы равно Q = QiQ2. Действительно, фазовый объем сложной системы по определению равен dr=dr\dT2, откуда сразу следует указан- указанное свойство. В общем случае ~~ !/. A.27) где произведение И берется по всем частям системы. Воспользуемся этим свойством Q для того, чтобы оценить число состояний системы, состоящей, например, из 100 незави- независимых частиц, движущихся в объеме V=l смъ с энергией в ин- интервале Де = 0,005 эв при е=0,025 эв и массе, равной массе про- протона. Имеем Q = QiQ2 ••• = D-1028)i00~ 102809. 3. С п и и. До сих пор, рассматривая отдельную микроскопи- микроскопическую частицу (например, электрон или протон), мы считали,
¦§ I] ЗАДАЧИ СТАТИСТИЧЕСКОЙ ФИЗИКИ 339 что ее состояние полностью характеризуется заданием трех квантовых чисел в соответствии с тремя степенями свободы. Оказывается, однако, что для полной характеристики состоя- состояния элементарной частицы необходимо указать еще одно кван- квантовое число. Оказывается, что большая часть частиц помимо момента количества движения в пространстве орбитального движения обладает дополнительным, собственным моментом количества движения, не связанным с пространственным перемещением. Ом получил название спинового момента, или коротко, спина. Спином элементарной частицы называют наименьший механи- механический момент (момент количества движения), которым она может обладать. Большая часть элементарных частиц (элек- (электроны, нейтроны, протоны) обладают спином s, равным ~^-. Это означает, что проекция спина sz на произвольную, выделен- h н.ую в пространстве ось z может иметь два значения: -у и —^-. Говорят, что спиновая координата принимает два зна- значения: -л- и —у. Спин сложных частиц может быть как це- целым, так и полуцелым, в зависимости от входящих в них эле- элементарных частиц. Спин —чисто квантовое свойство частиц, не имеющее аналогии в классической физике (см. ч. V). Наличие спина увеличивает число степеней свободы частицы с трех до четырех. 4. Принцип тождественности элементарных частиц. Оказывается, что учет дискретного характера состоя- состояний системы и, в частноеги, дискретных уровней энергии позво- позволяет охватить широкий круг вопросов, оставшихся нерешенными в классической физике. Однако помимо этого необходимо будет учитывать и некоторые другие особенности квантовых систем, существенно влияющие на поведение реальных макроскопиче- макроскопических систем. В дальнейшем нам часто придется иметь дело с системами, состоящими из некоторого числа одинаковых частиц (например, электронов или атомов данного типа). Законы по- поведения таких систем в квантовой механике резко отличаются от классических законов. В классической физике, как бы ни были сходны те или иные физические тела по своим свойствам, принципиально всегда можно проследить за их движением и отличить их друг от друга. В квантовой механике положение коренным образом изме- изменяется. Причина заключается в том, что в квантовой механике имеет место принцип тождественности одинаковых частиц. Со- Согласно этому принципу все одинаковые частицы данного вида 22*
340 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. Г (например, электроны), входящие в данную квантовомеханиче- скую систему, являются совершенно тождесгвенными. В системе, состоящей из частиц одного вида, состояния не изменяются при взаимной замене частиц. Пусть, например система состоит из двух электронов, при- причем первый электрон находится в состоянии, характеризую- характеризующемся совокупностью квантовых чисел nt, а второй электрон — в состоянии с квантовыми числами п2. Если поменять состоя- состояниями эти электроны, то получим состояние системы с той же энергией. На первый взгляд может возникнуть впечатление, что состояния системы являются двукратно вырожденными. Однако совокупность целого ряда данных, как основанных на общих по- положениях квантовой механики, так и следующих из статисти- статистических соображений, позволяет утверждать, что это не так (см. § 37 и § 64 ч. V). Тождественность частиц одного сорта является настолько полной, что замена, например, одного электрона в данном со- состоянии другим не является физическим событием. Поэтому не имеет смысла говорить, что электрон № 1 находится в состоя- состоянии 1, а электрон № 2 находится в состоянии 2. Следует ука- указать, что система из двух электронов находится в определенном состоянии. Из этого утверждения, непосредственно вытекающего из ряда опытных фактов, получаются весьма важные для стати- статистической физики следствия, с которыми мы познакомимся в гл. V и, особенно, в гл. X. Свойства систем частиц с целым и полуцелым спинами столь существенно отличаются, что, строго рассуждая, нужно гово- говорить о двух различных видах квантовой механики: для частиц с целым и полуцелым спинами. Это видно из следующего: для частиц с полуцелым спином имеет место так называемый прин- принцип запрета Паули, который гласит: «в каждом квантовом со- состоянии может находиться только одна частица с полуцелым спином». Часто принцип запрета формулируют несколько иначе: «в каждом квантовом состоянии может находиться не более двух электронов с различной ориентацией спина». Эквивалентность обеих формулировок очевидна. Для частиц с целым спином не существует никакого ограни- ограничения на число одинаковых частиц, находящихся в одном и том же квантовом состоянии. Ниже будет показано, что это обстоя- обстоятельство радикальным образом влияет на статистическое пове- поведение систем, состоящих из частиц с целым или полуцелым спином. 5. Энергетические зоны системы, состоящей из большого числа частиц. Рассмотрим некоторую си- систему, состоящую из N одинаковых атомов или молекул, при»
«11 ЗАДАЧИ СТАТИСТИЧЕСКОЙ ФИЗИКИ 341 !s+3s.p.(T чем будем считать, что N — большое число. Из общих сообра- соображений ясно, что поскольку система является макроскопической, внутренняя энергия системы должна изменяться непрерывно и квантовые эффекты не должны иметь существенного значе- значения. Мы посмотрим сейчас, каким образом при объединении атомов с дискретными уровнями энергии возникает непрерывное распределение энергетических уров- уровней. Для простоты рассмотрим два атома водорода, расположенных на большом расстоянии друг от друга (по сравнению с их размерами) и находящихся в одном и том же не- невырожденном состоянии с энер- энергией ео- На бесконечно большом расстоянии атомы не взаимодей- взаимодействуют друг с другом и энергия всей системы е равна сумме энер- энергий обоих атомов, т. е. Состояние системы будет дву- двукратно вырожденным; состояние си- системы, когда один электрон нахо- находится у первого ядра, а другой элек- электрон— у второго, будет обладать той же энергией, что и состояние с переставленными электронами. Сблизим теперь атомы на такое расстояние, чтобы они начали взаи- взаимодействовать между собой. Рас- Расчет показывает, что при возникно- возникновении взаимодействия уровень энер- энергии системы расщепляется и рас- распадается па два уровня, лежащих близко друг от друга. Го- Говорят, что взаимодействие сняло вырождение. Этот вопрос будет подробно освещен в § 54 ч. V. Если продолжать сближать атомы, образующие молекулу, расщепление уровней будет увеличиваться (рис. 33, нижний уровень). Очень часто уровни энергии каждого из атомов сами по себе являются вырожденными. Тогда из одного уровня энер- энергии возникает не два, а большее число уровней системы взаимо- взаимодействующих частиц (рис. 33, два верхних уровня). Мы видим, что число уровней энергии в системе взаимодействующих ча- частиц оказывается большим, чем в системе разделенных ча- частиц. Вырождение уровней снимается взаимодействием. Этот Рис. 33.
342 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. I результат не является специфическим для системы из двух ато- атомов, но имеет общий характер. Если система представляет собой систему атомов, характеризующихся квантовыми числами, то при образовании системы сильно взаимодействующих частиц, например, кристалла, все уровни энергии отдельных атомов расщепляются, распадаясь на отдельные уровни энергии си- системы как целого. Последние, вообще говоря, являются невы- невырожденными. Если число атомов в системе (или, точнее, число /) велико, то полное количество энергетических уровней в системе оказы- оказывается огромным. С увеличением энергии они быстро сбли- сближаются (как это видно из рис. 33; сравнить первый, второй и третий уровни), и при больших f и больших энергиях возбужде- возбуждения практически полностью сливаются, образуя сплошные по- полосы дозволенных уровней энергии. Из сказанного ясно, что утверждение о непрерывном изме- изменении энергии макроскопического тела является не вполне точ- точным. Самые нижние уровни энергии являются дискретными. По мере роста энергии происходит быстрое сближение уровней и энергия системы становится непрерывной. Мы увидим в даль- дальнейшем, что дискретность самых нижних уровней энергии в мак- макроскопических системах существенно сказывается на их свой- свойствах. § 2. Необходимые сведения из теории вероятностей Нашей дальнейшей задачей будет служить исследование статистических закономерностей в системах, состоящих из весьма большого числа частиц. В основу этих исследований будет положен математический аппарат теории вероятностей. Мы не будем излагать теории вероятностей в том виде, как она излагается в математических курсах. Мы с самого начала введем специальное определение вероятности, которое вполне эквивалентно принятому в математической теории вероятностей, но является более наглядным и удобным при рассмотрении ве- вероятностных процессов в статистической физике. Определение это тесно связано с представлением о зависимости между ве- вероятностью и частотой появления события, принятым в повсе- повседневной практике. Рассмотрим некоторую совершенно произвольную физиче- физическую систему, могущую находиться в различных физических состояниях. Предположим сначала, что эти состояния образуют дискретный ряд, и условно пронумеруем их цифрами 1, 2,3, ... Обозначим любую величину, зависящую от состояния системы, через L. Величина L может представлять, например, энергию,
$ 2] НЕОБХОДИМЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ 343 объем, сжимаемость или любую другую величину, являющуюся функцией состояния и изменяющуюся с изменением состояния системы. Мы будем считать L однозначной функцией состояния системы, так что каждому состоянию 1, 2, 3, ... отвечает вполне определенное значение величины L: Lx, L2, Z.3> ... Наоборот, если величина L имеет значение L*, то это означает, что система обязательно находится в i-u состоянии. Предположим, что в течение весьма длительного времени Т в силу разнообразных процессов, происходящих в системе, при неизменных внешних условиях ее состояния изменяются так, что она проходит через последовательность различных состоя- состояний 1, 2, 3, ..., i, ... Для наглядности допустим, что в течение всею времени изменения состояний Т равномерно каждые At секунд измеряется значение величины L. В некоторых состояниях система будет находиться долго и попадать в них часто, в других она будет проводить лишь не- незначительное время. В результате измерений мы будем полу- получать одни значения L чаще, другие — реже. Пусть в некотором состоянии I система проводит время U, составляющее часть пол- полного времени наблюдения Т. В результате ^i = ^j измерений будет найдено, что величина L имеет значение Lt. Полное число т измерений будет равно, очевидно, N = -т-т. Мы назовем ве- вероятностью г'-го состояния Wi или вероятностью значения вели- величины Li предел отношения числа измерений, дающих значение L, равное L,-, к полному числу измерений, когда последнее не- неограниченно возрастает, т. е. wt = lim %-. B,1) Иначе говоря, вероятность t-ro состояния ш4 определяется как предел отношения времени /,-, в течение которого система нахо- находится в этом состоянии, к полному времени наблюдения Т при неограниченном возрастании последнего: Wi= lim ¦?-¦ B,2) Необходимо ясно представить себе, что вероятность данного состояния i и вероятность того, что величина L имеет значение Lit отвечающее состоянию i, являются совпадающими поня- понятиями. Поэтому вместо B,2) мы можем написать wLl= lim ¦?-, B,3) где wl, — вероятность того, что величина L имеет значение L\.
344 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. I В определении вероятности B,1) или эквивалентном ему определении B,2) сделан важный шаг вперед: вероятность опре- определяется как предел отношения, а не как само отношение. Фактически это означает, что использование вероятностных пред- представлений предполагает, что число измерений или время наблю- наблюдения Т весьма велико. В определении B,2) заключено предпо- предположение о том, что предел отношения у- существует. Существо- Существование этого предела будет обеспечено в том случае, когда в течение всего времени наблюдения система находится в неиз- неизменных внешних условиях. Если это не так и в ходе измерений внешние условия могут непрерывно изменяться, отношением -=- может не стремиться ни к какому пределу. Так, например, если бы мы рассматривали неограниченно расширяющийся газ, то ни в одном состоянии система не находилась бы конечный про- промежуток времени. Ее состояния непрерывно изменялись бы в течение всего времени наблюдения. Поэтому предел отношения —- не существовал бы вовсе. На практике часто приходится встречаться с системами, состояния которых изменяются не дискретным, а непрерывным образом. Иначе говоря, часто ве- величины, характеризующие состояние системы, пробегают непре- непрерывный ряд значений. В этом случае определение вероятности B,3) теряет непосредственный смысл. В состоянии, в котором величина L имеет значение, точно равное Lit система будет проводить бесконечно малое время. Поэтому, как и в других случаях, когда приходится иметь дело с непрерывно изменяю- изменяющимися величинами, необходимо говорить не о значении Lit a о некотором интервале значений этой величины. Мы должны поэтому говорить о вероятности того, что величина L имеет значение, лежащее в интервале между L и L+dL. Эту вероят- вероятность будем обозначать через dwL. По определению, dwL= lim —jr-, где Л/l — время, в течение которого система находится в со- состояниях, соответствующих значениям L, лежащим между L и L + dL. Очевидно, что время Л^„ а следовательно, и вероят- вероятность dwL, будут при прочих равных условиях пропорциональ- пропорциональны величине интервала dL. Удобно поэтому представить dwL в виде dwL = p(L)dL, B,4) где p(L) —вероятность того, что значение L лежит в некотором «единичном» интервале. Функция p{L) называется плотностью
$ 2] НЕОБХОДИМЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ 345- вероятности. Она заменяет саму вероятность в тех случаях,, когда величина L изменяется непрерывно. Наряду с определением B,2) — B,4) в статистической фи- физике используется и другое определение вероятностей. Вместо того чтобы рассматривать изменения состояния си- системы во времени, можно мысленно представить себе совокуп- совокупность систем, тождественных с данной, но в некоторый момент времени хаотически распределенных по всем возможным состоя- состояниям. Такую систему именуют статистическим ансамблем. Бу- Будем определять число систем в ансамбле, находящихся в раз- различных возможных состояниях. Пусть из полного числа систем в ансамбле п в i-u состоянии находятся nt систем. Тогда ве- вероятность того, что при случайном измерении будет обнаружена система, находящаяся в i-м состоянии, равна wt= lim %-. B,5) п Л->оо Вероятность, определенная формулой B,5), носит название ве- вероятности по ансамблю. Пусть имеется сложная механическая система, совершающая движение по некоторой траектории в фазовом пространстве. Сложность траектории исключает возможность проследить за фазовой траекторией, и фазовые точки хаотически распреде- распределяются в фазовом пространстве. Вероятность обнаружить си- систему в данной области фазового пространства, согласно B,1) определяется временем пребывания ее в этой области. Вместо того чтобы следить за процессом перемещения изобразительной точки в фазовом пространстве во времени, можно ввести в рас- рассмотрение ансамбль систем, отличающихся начальными усло- условиями. Если начальные условия распределены хаотически, то вероятность найти систему в t-й области фазового пространства определяется числом изобразительных точек, отвечающих раз- различным системам ансамбля. Естественно допустить, что число таких точек для ансамбля пропорционально времени пребыва- пребывания в этой области отдельной системы. При этом отношения, входящие в определения B,1) и B,5), приводят к одинаковому значению вероятности. Это весьма правдоподобное допущение в статистической физике носит название эргодической гипотезы. В § 15 мы вернемся к ее обсуждению. Мы будем пользоваться обоими определениями вероятности, рчитая их равноправными. Перейдем теперь к формулиропке некоторых положений тео- теории вероятностей. 1. Закон сложения вероятностей. Рассмотрим фи- физическую систему, могущую находиться в различных состояниях. Если система находится в состоянии i, то она не может,
346 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. I очевидно, одновременно находиться в каком-либо состоянии к. Одновременные нахождения системы в состояниях i и k яв- являются взаимно исключающими друг друга событиями. Пред- Предположим, что нам известны вероятности состояний i и k. Для многих целей весьма важным является нахождение вероятности того, что система находится в одном из этих состояний, — без- безразлично, в каком именно. Иначе говоря, мы хотим найти ве- вероятность того, что система находится либо в состоянии /, либо в состоянии k. Для нахождения этой вероятности заметим, что время пребывания системы в одном из состояний, — безразлич- безразлично, в каком именно, — равно сумме времен пребывания в <-м и k-м состояниях. Поэтому искомая вероятность wi+h равна wi+k = lim -ЦД = lim Ц- + lim ^- = w, + wk. B,6) Формула B,6) выражает закон (теорему) сложения вероят- вероятностей. Вероятность нахождения системы в одном из двух взаимо- взаимоисключающих друг друга состояний равна сумме вероятностей нахождения системы в каждом из этих состояний. Теорема сложения вероятностей может быть без всякого труда перенесена на случай трех или большего числа состояний. В общем случае вероятность того, что система находится в од- одном из взаимоисключающих состояний t, k, I, ..., равна wi+k+l+... = Sa»/t B,7) где суммирование ведется по всем состояниям i, k, I, ... си- системы. Из теоремы сложения вероятностей вытекает важное след- следствие, которым мы будем неоднократно пользоваться в даль- дальнейшем. Предположим, что состояние системы характеризуется двумя не зависящими друг от друга величинами L и М. Например, L может представлять скорость движения системы в одном на- направлении, а М — в другом, или L и М могут быть энергией и объемом идеального газа и т. д. Пусть L может пробегать зна- значения L\, L2, ..., Lu ..., а М — значения Ми М2, ..., Mh, ... Предположим, что нам известна вероятность того, что система находится в состоянии, в котором L равно L,-, а М равно М^ Пусть эта вероятность равна WLtMk- Найдем вероятность wit того, что система имеет значение Li при любом значении величины Af. Согласно теореме сложе- сложения вероятностей можно написать wLi = ffi^w, + wLim3 + ... + WctMk + ... = S wc,Mr B,8) где суммирование ведется по всем значениям величины Л{,
§ 2] НЕОБХОДИМЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ 347" В том случае, когда величины L и М изменяются непре- непрерывно, суммирование в формуле C,3) нужно заменить интегри- интегрированием. 2. Статистическая независимость и закон умножения вероятностей. Второе важное положение теории вероятностей носит название теоремы или закона умно- умножения вероятностей. Рассмотрим две физические системы и предположим, что они являются совершенно независимыми друг от друга. Обозначим через wLl и wMk вероятности того, что первая система находится в состоянии, характеризующемся значением величины Lu и, аналогично, вторая система находится в состоянии, характери- характеризующемся значением величины Mh. Вероятности wLi и wMk яв- являются независимыми, если вероятность того, что первая си- система находится в состоянии i, не зависит от того, находится или не находится вторая система в состоянии к. Закон умножения вероятностей для статистически независи- независимых систем гласит: «вероятность того, что одновременно первая система находится в г-м состоянии, в котором L = L{, а вторая — в к-м состоянии, в котором M = Mh, разна произведению веро- вероятностей wLi и wM/t», т. е. ™цмк = ™ц™мг B,9) Закон умножения представляет строгое определение статисти- статистической независимости двух систем. Приведенное рассуждение может быть перенесено на две произвольные независимые физические системы. Пусть первая из них проводит время Т ¦ wLi в состоянии с L = Lt-. Если это время достаточно велико, то можно считать его временем на- наблюдения за состояниями второй системы. Из всего времени наблюдения за второй системой {Т • wL[^ она проводит часть, равную (Т • wLl) wMk, в состоянии со значением M = Mh. Искомая вероятность одновременного нахождения первой системы в со- состоянии с L = L,-, а второй в состоянии с M = Mh равна ,. TWLiWMk hm f что и поясняет закон умножения. Важным следствием закона сложения вероятностей является весьма очевидное утверждение, что вероятность нахождения системы в произвольном допустимом состоянии разна единице. Это означает, что а каком-либо из состояний мы с достовер- достоверностью найдем нашу систему. Справедливость его видна из
348 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. I того, что У У?^А = 1, B,10) поскольку, по определению, Т= 2 U- Если величины, характеризующие состояния системы, изме- изменяются непрерывно, то вместо условия B,10) можно написать l. B,11) В дальнейшем мы всегда будем считать все вероятности нормированными так, чтобы сумма всех вероятностей была равна единице. В этом случае будем говорить о вероятности, нормированной на единицу. В тех случаях, квгда первоначально распределение вероятности задано ненормированным, мы всегда будем его нормировать на единицу. § 3. Средние значения и флуктуации Теперь необходимо дать определение понятия статистиче- статистического среднего значения некоторой величины, зависящей от со- состояния системы. Понятие статистического среднего будет играть основную роль во всем дальнейшем изложении. Стати- Статистическое среднее является естественным обобщением привыч- привычного нам понятия среднего арифметического. Пусть у нас имеется ряд значений некоторой величины, например, скорости какого-либо тела. Под арифметическим сред- средним мы понимаем отношение суммы всех этих значений к пол- полному их числу, т. е. сумму вида ^ ' , где Lt — значение ве- величины L, N{ — число измерений, приводящих к этому значению, N — полное число измерений. Статистическим средним величины L, которое мы будем обозначать через L, называется предел отношения Поскольку Mi = -j?t и N = -?f, можно написать L=lim ДЬ^ = У/.,ш?/, C,1) где ti — время, в течение которого система находится в t'-м со- состоянии, когда величина L имеет значение L{, T — полное время
§ 3] СРЕДНИЕ ЗНАЧЕНИЯ И ФЛУКТУАЦИИ 349 наблюдения и wLl — вероятность того, что величина L имеет значение L{. Суммирование ведется по всем состояниям систе- системы. Формула C,1) является определением статистического среднего. В дальнейшем для краткости будем опускать слово «статистическое» и говорить просто «среднее значение». В случае систем, состояния которых изменяются непрерыв- непрерывно, так что вместо вероятности W{ мы должны писать dw, фор- формула C,1) должна быть переписана в виде 1 = JLdw = J Lp{L)dL, C,2) где интегрирование ведется по всем возможным состояниям си- системы. При вычислении средних значений будем пользоваться сле- следующей простой теоремой: если имеются две величины L и М, являющиеся функциями состояния, то среднее значение их сум- суммы (L + M) равно сумме средних L+M. Для доказательства за- заметим, что, по определению (L + M) = 2 (Ь{ + Mt) w{ = 2 Ltwt + 2 Mtwt = Z + M. Предположим, что нам известно распределение вероятно- вероятностей wL{ того, что величина L принимает значение Lt. Тогда с помощью формулы C,1) мы можем найти среднее значение этой, величины L. Так, например, зная распределение вероятностей для различ- различных значений энергии системы, можно вычислить среднее зна- значение энергии этой системы. Возникает естественный вопрос, в какой мере задание среднего значения характеризует реальное значение этой величины. В приведенном примере можно спро- спросить, в какой мере указание средней энергии может характери- характеризовав фактическую энергию системы. Ясно, что если отклоне- отклонения величины от своего среднего значения достаточно малы, то всегда можно без большой погрешности заменить истинное зна- значение величины ее средним значением. Для того чтобы дать точный количественный ответ, необхо- необходимо ввести некоторую величину, которая характеризовала бы отклонение истинных значений величины L от ее среднего зна- значения L. На первый взгляд может показаться, что в качестве такого критерия можно выбрать разность L — L. Однако это не совсем *ак. Отклонения величины от своего среднего значения могут быть велики, но, тем не менее, будут играть незначительную роль, если они происходят достаточно редко. Если, напри- например, заметные отклонения энергии от ее среднего значения
350 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. Г происходят так редко, что время, протекающее между двумя последовательными отклонениями, очень велико по сравнению с временем наблюдения, то такие отклонения вообще не будут проявляться в течение времени наблюдения. Если же отклоне- отклонения от среднего не очень велики, но происходят часто, то в этом случае указание только среднего значения L недостаточно ха- характеризует истинное значение величины L. Можно было бы попытаться в качестве критерия выбрать среднее значение раз- разности L— L, т. е. L— L. Однако эта величина в точности равна нулю: AL = L —L = L —1 = 0. (Заметим, что вторичное усреднение L проводить не нужно, по- поскольку среднее L есть некоторая постоянная величина. Па среднее значение постоянной величины равно, очевидно, самой величине.) Равенство нулю величины L — L выражает собой тот факт, что отклонения L от L в обе стороны, в сторону больших и в сторону меньших значений,_происходят одинаково часто. Для того чтобы отклонения от I в обе стороны не погашались, а складывались, нужно выбрать в качестве критерия не среднюю разность AL = L — L, а средний квадрат разности (ALJ. При этом значения (ALJ будут тем больше, чем больше отклонения L от L, независимо от знака отклонения, и чем чаще эти откло- отклонения происходят. Величина (ALJ = (L — LJ носит название квадратичной флуктуации. Квадратичная флуктуация является существенно положительной величиной. Она принимает наи- наименьшее возможное значение, нуль, только в том случае, когда L все время точно равна своему среднему значению L. Всякое отклонение от среднего вносит свой вклад в значение (А/-J. Из определения (ALJ имеем (А/.J = (L - Lf = L2 - 2LL + (LJ = L2 - ILL + (Lf = L2 - (LJ. C,3) Ясно, что для малости абсолютной флуктуации необходимо, что- чтобы большие отклонения L от L были мало вероятны, т. е. про- происходили достаточно редко. Таким образом, величина (AZ-J может характеризовать отклонение L от своего среднего значе- значения Если (AZ-J мала, то значение величины L все время близко к своему среднему значению. При этом среднее значение L мо- может достаточно точно характеризовать значение L. Относитель- Относительную погрешность, которую мы совершим, заменив L ее средним
•$ 3] СРЕДНИЕ ЗНАЧЕНИЯ И ФЛУКТУАЦИИ 351 значением L, можно оценить по значению величины uL = 'r - , носящей название относительной флуктуации. Если 6l "С 1, тоэто означает, что величина L в среднем на- настолько близка к L, чго замена L на L не вносит сколько-ни- сколько-нибудь значительной ошибки. Мы докажем сейчас теорему, имеющую основное значение для всего дальнейшего изложения. Эга теорема гласит: Если имеется система, состоящая из N независимых частей, то относительная флуктуация любой аддитивной функции1) состояния L обратно пропорциональна корню из числа ча- частей N, т. е. Для доказательства этой теоремы ьычислим величину По определению аддитивной величины, L = ^LW, где L<ft)— значение величины L для k-Pi независимой части системы (во из- избежание недоразумений индекс, характеризующий номер систе- системы, мы пишем вверху), и суммирование ведется по всем неза- независимым частям, входящим в систему. Из закона сложения вероятностей следует Е=2Л C,5) Вычислим теперь квадратичную флуктуацию величины L, т. е. k-\ J Для простоты предположим сначала, что система состоит толь- только из двух независимых частей. Тогда имеем [Д(L, + L2)f = (Д/.,J + 2AL, Поскольку L\ и Li — независимые величины, среднее от произ- произведения (&L\) • (AL2) равно произведению средних: ') Аддитивной функцией называют функцию, обладающую тем свойством, что значение этой функции для сложной системы равно сумме ее значений для всех независимых частей.
352 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. I Но (AL]) = (AZ.2) —0. так что т. е. квадратичная флуктуация системы из двух независимых величин равна сумме квадратичных флуктуации этих величин. Обобщая это на случай jV независимых частей, входящих в си- систему, можно написать C,6) Число слагаемых в сумме C,6) равно числу независимых частей в системе, т. е. N. Будем считать, что флуктуации в раз- различных независимых частях системы по порядку величины близки друг к другу (поскольку все части ее равноправны ме- между собой). Тогда значение суммы, написанной в правой части формулы C,6), будет пропорционально числу слагаемых, т. е. величине N, так что -JV. C,7) Среднее значение L также пропорционально числу слагае- слагаемых в сумме формулы C,6), т. е. пропорционально N. Поэтому относительная флуктуация величины L равна , V(ALJ l--\aj- /1 ¦ -¦ ^_. - /о оч L I vi г (к) N У N у ' ' Таким образом, теорема доказана. Как уже было указано во введении, задачей статистической физики является изучение свойств макроскопических систем, состоящих из огромного числа частиц атомов или молекул. Мы увидим в дальнейшем, что методы изучения свойств таких си- систем основаны на применении статистических законов. Приме- Применение этих законов позволяет находить средние значения раз- различных величин, характеризующих состояние системы. Из при- приведенной нами теоремы следует, что относительные флуктуации всех физических величин, значение которых для всей системы равно сумме значений их для всех частиц, обратно пропорцио- пропорциональны корню из числа частиц. Поскольку число частиц в ма- макроскопической системе выражается обычно огромными числа- числами (порядка 6-Ю23), относительная флуктуация любой адди- аддитивной величины практически оказывается равной нулю. Это означает, что все аддитивные величины имеют значения, весьма
§ 3] СРЕДНИЕ ЗНАЧЕНИЯ И ФЛУКТУАЦИИ 353 близкие к средним. Поэтому замена истинных величин их сред- средними значениями может быть произведена с большой точностью. Средние значения различных величин, вычисленные на основе законов статистической физики, с очень большой степенью точ- точности совпадают с их истинными значениями. Это означает, что вероятностные предсказания приобретают практически совер- совершенно достоверный характер. Представим себе, например, что мы хотим найти давление, оказываемое молем газа, находящимся в сосуде, на стенки по- последнего. С помощью положений статистической физики ока- з /вается возможным вычислить среднее давление газа р. /V Рис. 34. Истинное давление р. испытываемое стенкой, отнюдь не равно среднему давлению. В зависимости от сложных законов движе- движения молекул в газе оно будет принимать разнообразные, быстро изменяющиеся во времени значения (рис. 34), могущие быть и больше и меньше среднего давления. Тем не менее, теорема о флуктуациях показывает, что относительная ошибка, которую мы совершим, заменяя истинное, меняющееся во времени давле- давление его средним значением (изображенным на рис. 34 горизон- горизонтальной линией), будет порядка Ьр~—^=—_ , т. е. ошибка со- составляет ~ю-12%. Очевидно, что такая ошибка лежит далеко за пределами точности измерений лучших манометров и практически не имеет никакого значения. Поэтому мы можем пользоваться средним значением давления, совершенно не опасаясь допустить какую- либо погрешность. То же относится и к другим функциям со- состояния системы. Примеры этих функций будут даны в даль- дальнейшем. 23 В. Г. Левич, том I
354 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ (Гл. I § 4. Нормальное распределение и моменты Возвращаясь к обсуждению свойств аддитивной величины N ]_= 2 L(k), следует указать, что в теории вероятностей дока- зывается следующая, весьма важная теорема, именуемая цен- центральной предельной теоремой теории вероятностей: при уве- увеличении числа слагаемых в сумме (при N-+oo) статистическое распределение вероятностей для величины L стремится к нор- нормальному (гауссовому) распределению, имеющему вид В применении к физическим системам это означает, что нор- нормальное распределение для аддитивных величин, например, энергии должно установиться во всякой физической системе, содержащей достаточно большое число независимых частиц. Мы не будем приводить доказательства центральной предельной теоремы, а ограничимся рассмотрением одного характерного примера. Рассмотрим систему из N одинаковых статистически незави- независимых частиц. Пусть вероятность того, что одна из частиц по- попадает в р-е состояние, равна р. Найдем вероятность того, что в этом состоянии окажется п частиц. Для этого напишем ве- вероятность того, что п частиц находятся в состоянии р, а осталь- остальные (N— п) частиц в других состояниях, в виде: pn(l—p)N~n {на основании C,4), поскольку частицы независимы). Число способов, которым можно выбрать п произвольных частиц из общего числа jV частиц, равно числу сочетаний из N элементов по п. Последнее равно Спы= пцм-п)\ • Поэтому полная вероятность того, что п произвольно выбранных частиц одновременно окажутся в р-и состоянии, равна ^^"^/^„РМ-РГ". D,2) Полученное выражение носит название биномиального закона. Будем считать теперь, что в системе содержится очень много частиц, так что N\S>]n. Тогда можно написать, опуская п в по- показателе последнего множителя, / \~ Nl «/I \N N (N -1) ... (N-n+1) п,, \W ~ «i i1 n) *
$ 4] НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ И МОМЕНТЫ 355 где обозначено п = pN. Очевидно, что п представляет среднее число частиц в р-ы состоянии. В пределе N-+oo получаем ю(л)= lim wN{n) = ^~1. D,3) Последняя формула носит название формулы Пуассона. Па- конец, найдем асимптотическое выражение формулы Пуассона для случая, когда не только N весьма велико, но велико также и число частиц п в данном состоянии. Это значит, что п и п можно считать большими (по сравнению с единицей) числами, а разность п — п <^ п. Логарифмируя формулу Пуассона, имеем In w (п) = п In п — п — In и! Пользуясь формулой Стирлинга (приложение IV), т. е. учиты- учитывая, что l!l — П, можно окончательно записать (п-пУ w (n) = const • е 2п' . Постоянная находится из условия нормировки. При больших значениях п суммирование можно заменить интегрированием. Тогда получаем e 2i? dn, D,4) т. е. нормальное (гауссово) распределение вероятностей. Сред- Среднеквадратичная флуктуация числа частиц в рассматриваемом состоянии равна (д^)г = (я _ nf = п2 - (яJ = J п? dw (я) - (J n dw (га)J = п. D,5) В данном случае формула C,7) оказывается не приближенной, а точной. Поэтому распределение Гаусса можно представить в виде (п-пУ р (я) dn = J—. е~2 (Д^1 dn, D,6) что совпадает с D,1). Мы видим на частном примере, что при больших значениях чисел Nun устанавливается нормальное распределение вероятностей, причем в среднем отклонение чи- чисел п от их средних значений достаточно мало. Среднеквадратичная флуктуация характеризует эффектив- эффективную ширину нормального распределения. Чем меньше (Д/г)а, 23*
356 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. Г или в общем случае (ALJ, тем меньше ширина гауссова распре- распределения. В пределе (Д?J-»-0 гауссово распределение превра- превращается в б-функцию. При этом вероятность найти значение ЬФЬ стремится к нулю, а вероятность значения L = L — к еди- единице. Нормальное распределение имеет симметричный харак- характер, так что w(L) =йу(—L), т. е. вероятность отклонения от среднего в обе стороны одинакова. Если распределение не яв- является гауссовым, то оно, вообще говоря, не симметрично отно- относительно знака L. Степень асимметрии распределения характе- характеризуется величиной, именуемой асимметрией и равной {KL)s=U-3L'(Krf'=JJ~3L-[l?-(Lf\. D,7) Среднеквадратичное отклонение и асимметрия выражаются че- через величины L и Ln (n = 2, 3). Последние, определяемые в общем виде формулой Ln=\ LnP(L)dL, D,8) называются моментами п-го порядка. Оказывается, что если p(L) — аналитическая функция, дифференцируемая сколько угодно _ раз, то совокупность моментов всех порядков (L,L2,L3, ...) полностью определяет вид функции p(L). Дей- Действительно, совершая фурье-преобразование над p(L), имеем D,9) Функция \|)(со) называется характеристической функцией рас- распределения вероятностей. Дифференцируя D,10) по со и полагая затем ю=0, находим 2д J J Поэтому если известны все моменты, то известны коэффициенты в разложении ^.^ + ^.|i+... D,10)
-% 5] КОРРЕЛЯТИВНАЯ ФУНКЦИЯ 357 «, следовательно, известна сама функция гр(со). Тогда распре- распределение вероятностей получается непосредственно из преобра- преобразования. оо р (L) = J 1|> (®) e~imt da. D,11) -оо Иногда известны моменты L", во всяком случае первые не- несколько моментов, но неизвестно само распределение вероят- вероятностей. Тогда, находя точно (или приближенно) характеристи- характеристическую функцию гр(со), можно найти точно или приближенно само распределение вероятностей р(^). § 5. Коррелятивная функция В дальнейшем нам часто придется иметь дело с рассмотре- рассмотрением случайных функций. Под случайной функцией понимают такую функцию f(x), значения которой не находятся в одно- однозначной зависимости от переменной х. При фиксированном зна- значении х функция f(x) может случайно принимать всевозможные значения. При этом можно говорить лишь о вероятности того, что при заданном х функция f(x) имеет значение, лежащее ме- между [(х) и f(x) + df(x). В дальнейшем для конкретности будем считать, что случайная величина зависит от времени, т. е. бу- будем рассматривать случайную функцию времени f(t). Процесс, описываемый случайной функцией времени, называется стоха- стохастическим. Физические примеры стохастических процессов и слу- случайных функций, зависящих от времени, будут приведены ниже. Важнейшей количественной характеристикой случайных процессов является их коррелятивная функция. Коррелятивной (или, точнее, автокоррелятивной) функцией К(х) называется среднее (по времени или по ансамблю) значение произведения •случайной функции, описывающей стохастический процесс в не- некоторой системе, взятой в момент временя t, и той же функции, взятой в момент /+т: г -x)dt, E,1) где т может быть как положительным, так и отрицательным. Для краткости мы будем обозначать K(x)=f(t)}(i+x). E,2) Черта означает усреднение по времени. Наряду с временным усреднением, можно проводить усред- усреднение по ансамблю тождественных физических систем, в кото- которых происходит случайный физический процесс. В силу
358 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. 1 сказанного в § 2, оба усреднения являются эквивалентными. По-* этому можно написать >. E,3) Скобками () обозначено усреднение по ансамблю. Коррелятивная функция /С(т) является количественной ме- мерой связи между значениями случайной функции в последова- последовательные моменты времени. Иными словами, коррелятивная функция К(т) является мерой скорости изменения во времени функции f(t), описывающей стохастический процесс. Значения коррелятивной функции зависят только от т, но не от выбора значения t. Действительно, в силу однородности времени, изменение начала отсчета не может влиять на значе- значение величин, так что E,4) Если значения случайной функции /(/) изменяются так быстро» что ее значение в момент времени /+т совершенно не зависит от значения в момент времени /, то К(х)=Щ)-Щ+х)=0. E,5) При т-»-оо имеет место очевидное равенство E,6) именуемое свойством ослабления корреляции на бесконечности. В другом предельном случае т=0 равенство E,7) показывает, что К@) совпадает со среднеквадратичным значе- значением (вторым моментом) случайной функции f(t). Наконец, симметрия стохастического процесса во времени (см. §§ 25 и 36) позволяет написать условие К(т)=/С(-т). E,8) Конкретный вид коррелятивной функции зависит, разумеется, от природы случайного процесса. Однако существует некоторая теорема, связывающая между собой две важные характеристи- характеристики случайного процесса — коррелятивную функцию и так назы« ваемую спектральную плотность мощности. Случайную функ- функцию f(t) можно разложить в интеграл Фурье, написав f(t)= jf(<B>)eMdn. E,9) —оо Частоты Ki образуют непрерывный спектр.
§ 5] КОРРЕЛЯТИВНАЯ ФУНКЦИЯ 359 Представим среднеквадратичное значение </2) в виде 00 00 (f@)= J 7(co)d© = 2j I (a) da, E,10) — оо О где функция /(со) носит название спектральной плотности. По определению, /(со) — существенно положительная функция, при- причем /(со) =/(—со). Подставляя теперь E,9) в определение (/2) E,7), находим </2 (*)> = { J d(o fifoV <•+">' < f (со) / (ш')>. E,11) Распишем выражение для (f (co)/(coO), воспользовавшись фор- формулой обратного преобразования Фурье E,12) Согласно E,4) коррелятивная функция /Cfr) не зависит от t, и в последнем выражении можно вынести 7((т) из-под знака ин- интегрирования по U
360 ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ [Гл. I Сравнивая E,15) и E,10), получаем окончательно -'«*(т)Л. E,16) Обращая последний интеграл, можем также написать оо J Формулы E,17) и E,16) составляют содержание теоремы Ви- Винера— Хинчина. Они связывают между собой коррелятивную функцию и спектральную плотность мощности. Последняя ока- оказывается Фурье-компонентой коррелятивной функции. С приложением теоремы Винера — Хинчина мы столкнемся при изучении стохастических процессов в физических системах.
ГЛАВА II КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ <§ 6. Простейшая статистическая система — идеальный газ Изучение систем, содержащих весьма большое число частиц, -естественно начать с простейшего случая — идеального газа. В газообразном состоянии плотность вещества мала, так что •среднее расстояние между молекулами оказывается очень боль~ И1им по сравнению с геометрическими размерами частиц — ато- атомов или молекул. Благодаря этому основную долю всего вре- времени движения каждая из частиц находится сравнительно да- далеко от остальных газовых частиц. Силы межмолекулярного взаимодействия быстро убывают ¦с расстоянием и становятся ничтожно малыми, когда молекулы находятся на расстояниях, заметно превышающих их геометри- геометрические размеры. Таким образом, характерной особенностью дви- движения молекул в газе является малость межмолекулярного взаимодействия в течение подавляюще большой части времени движения. Из-за отсутствия взаимодействия газовые молекулы движутся прямолинейно и равномерно до тех пор, пока не про- произойдет столкновения между данной и какой-либо другой мо- молекулой или соударения со стенкой сосуда. При Столкновениях газовых молекул между собой или с молекулами стенки сосуда молекулы можно считать недеформируемыми. Это означает, что ¦столкновения между молекулами происходят по тем же зако- законам, что и столкновения обычных твердых шаров. В процессе столкновения между молекулами происходит обмен кинетиче- кинетической энергией и импульсом. Аналогично при столкновении моле- молекулы со стенкой сосуда, точнее говоря, с молекулой вещества этой стенки, можно считать, что газовая молекула упруго отра- отражается от стенки. Статистическую систему, частицы которой взаимодействуют друг с другом только в процессе столкновений, а все остальное •время движутся как свободные, мы будем именовать идеаль* дым газом.
362 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. II Движение каждой газовой молекулы строго определено за- законами механики (в первом приближении — классической меха- механики). Поэтому в принципе, интегрируя уравнения движения всех молекул, входящих в состав газа, можно было бы найти траекторию каждой из них. Однако фактически подобного рода расчет сталкивается с огромными трудностями. Уже интегриро- интегрирование уравнений движения трех взаимодействующих материаль- материальных точек (задача трех тел) является весьма сложной задачей, в общем случае еще не решенной. Общее решение задачи четы- четырех тел является столь сложным, что пути ее решения даже не намечены. В газе же число взаимодействующих частиц выра- выражается числами порядка 1020. За самый короткий, с макроско- макроскопической точки зрения, промежуток времени в газе происходят бесчисленные столкновения молекул между собой и со стенками сосуда. Поэтому для нахождения траекторий всех молекул в газе нужно было бы записать и разрешить 3 • 1020 связанных между собой уравнений движения с учетом соответствующих начальных условий. Из сказанного совершенно ясно, что подоб- подобная задача является не только практически, но и принципиально трудной. На первый взгляд может показаться, что последнее утвер- утверждение вообще лишает нас возможности изучать физические закономерности в системах, состоящих из очень большого числа частиц. В действительности, однако это не так. Хотя каждая из частиц, входящих в состав системы, сама является «механи- «механической системой» и подчиняется законам механики, совокуп- совокупность огромного числа молекул является системой, качественно отличной от системы, состоящей из небольшого числа молекул. В ней проявляются закономерности особого типа, совершенно не свойственные простым механическим системам и получившие название статистических закономерностей. Действительно, рассмотрим газ, состоящий из огромного числа молекул и заключенный в замкнутый сосуд. Такой газ представляет механическую систему с огромным числом степе- степеней свободы. Зная начальные условия, можно было бы в прин- принципе проинтегрировать уравнения движения всех газовых мо-< лекул и найти их траектории. Оставляя в стороне вопрос о прак- практической осуществимости такого расчета, необходимо заметить, что подобное решение не представляло бы никакого интереса. Мы хорошо знаем из опыта, что свойства газа фактически со- совершенно не зависят от начальных условий — начальных поло- положений и скоростей молекул. Так, например, свойства газа в замкнутом сосуде совершенно не будут зависеть от характера заполнения сосуда: независимо от того, втекал ли газ через одно отверстие и постепенно или через два отверстия и быстро, но прошествии некоторого промежутка времени после впуска
§ 6] ИДЕАЛЬНЫЙ ГАЗ 363 газ придет во вполне определенное состояние, в котором он и будет находиться в дальнейшем. Мы скажем, что газ придет в состояние равновесия. Свойства газа в состоянии равновесия не зависят от его предыстории и не изменяются во времени. Нам хорошо известно из опыта, что газ всегда стремится полностью и равномерно занять весь предоставленный ему объем. Поэтому такой характер движения газа, при котором плотность газа была бы неодинаковой в различных частях со- сосуда, является исключенным или, точнее, крайне мало вероят- вероятным. Никакого явного противоречия с законами механики при этом не возникло бы. Если бы состояние системы зависело от начальных условий, то последние принципиально можно было бы подобрать так, чтобы плотность газа в разных частях сосуда была различной. То обстоятельство, что состояние газа не за- зависит от начальных условий положения и скоростей его моле- молекул, совершенно обесценивает знание траектории отдельных молекул. Предположим, что мы сумели преодолеть все матема- математические трудности и нашли траекторию отдельной молекулы. Пусть при этом оказалось, что траектория данной молекулы почти целиком проходит в одном из углов куба. Ясно, что из этого мы не смогли бы вывести каких-либо заключений о пове- поведении всего газа. Газ как целое, содержащий огромное число частиц, яв- является системой, качественно отличной от отдельной молекулы, и его поведение подчиняется иным, статистическим закономер- закономерностям. В этом смысле один из создателей статистической фи- физики, Смолуховский, писал, что если бы даже мы умели на- находить траектории газовых молекул, все равно при описании свойств газа пользовались бы законами теории вероятностей. При отыскании статистических закономерностей будем искать среднее значение величин, характеризующих состояние газа как целого. Благодаря тому, что число частиц в газе весьма велико, из результатов § 3 следует, что найденные средние бу- будут с огромной степенью точности совпадать с истинными зна- значениями величин. Предыдущие рассуждения позволили нам выявить важней- важнейшую особенность «массовых» процессов, т. е. таких процессов, которые характеризуются наличием большого числа более или менее равноправных событий. Эта особенность заключается п том, что в таких процессах проявляются своеобразные стати- статистические закономерности, совершенно не свойственные отдель- отдельным системам или процессам. Рассмотрим некоторый замкнутый сосуд, заполненный газом. Предположим, что в газе установилось состояние равновесия. Попытаемся установить статистические законы, определяющие
364 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. Jf поведение газа. В соответствии с прямыми данными опыта будем предполагать, что молекулы газа распределяются по- всему объему замкнутого сосуда с равномерной плотностью (т. е. что число молекул в единице объема постоянно по всему сосуду). Будем также предполагать, что молекулы газа обла- обладают скоростями, равномерно распределенными по всем направ- направлениям в пространстве. Это означает, что число молекул, дви- движущихся во всех направлениях, должно быть одинаковым. Если бы это было не так и существовало бы направление преимуще- преимущественного движения молекул, то в этом направлении возник бы поток газа. Из опыта следует, что в газе, заключенном в замк- замкнутый сосуд и не подвергающемся воздействию извне, возник» новение установившегося потока газа невозможно. Предполо- Предположение о равномерном распределении молекул в пространстве и- равномерном распределении скоростей по всем направлениям называют предположением о молекулярном хаосе. Естественно, возникает вопрос, каким образом устанавли- устанавливается равномерное распределение скоростей молекул во всех направлениях. Ясно, что если бы молекулы совершенно не взаимодействовали между собой, то не было бы никаких при- уин, которые могли бы изменить первоначальное направление движения молекул. Поэтому наличие или отсутствие направ* ленного потока целиком определялось бы начальными уело* виями. Установление молекулярного хаоса обусловлено суще- существованием взаимодействия между молекулами. При столкнове* ниях между молекулами направления их движения непрерывно изменяются, и в газе устанавливается хаотическое движение с равномерным распределением скоростей по направлениям в- пространстве. Роль молекулярных столкновений не сводится только к уста- установлению равномерного распределения скоростей по направле- направлениям. При столкновениях молекул наряду с изменением направ- направления полета происходит также изменение скоростей молекул по абсолютной величине. Если бы в начальный момент времени все молекулы имели одинаковые скорости, то беспорядочные столкновения между ними привели бы к тому, что часть молекул случайно получила бы избыточную кинетическую энергию за счет других молекул, соответственно потерявших часть энергии. Благодаря этому равенство скоростей газовых молекул нару- нарушится и в газе появится некоторая часть молекул, имеющих большие и меньшие скорости. Иными словами, в газе возникнет некоторое распределение молекул по скоростям. В газе появится некоторое число молекул, имеющих большие скорости, и неко- некоторое число молекул со средними и малыми скоростями. Нашей задачей является нахождение распределения молекул идеального газа по скоростям. Это распределение будет харак*
§ 71 РАСПРЕДЕЛЕНИЕ МАКСВЕЛЛА 365 теризоваться средним числом молекул, имеющих данное значе- значение скорости. Из предположения о хаотическом характере молекулярного движения следует, что возможно появление молекул с любыми скоростями, так что распределение молекул можно характери- характеризовать некоторой непрерывной функцией. Поскольку скорости движения молекул изменяются непрерывно, нужно, конечно, го- говорить не о числе молекул, имеющих точно заданную скорость, а о числе молекул, имеющих скорость, близкую к данной. § 7. Распределение Максвелла Обозначим через dnv среднее число молекул в единице объема газа, имеющих компоненты скорости, лежащие в интер- интервале между vx и vx + dvx, vv и vy + dvv, vz и vz + dvz. Мы будем считать, что газ находится в стационарном состоя- состоянии, так что установилось состояние молекулярного хаоса и оно не изменяется во времени. При этом число частиц с данными компонентами скорости не зависит от времени. Ясно, что среднее число молекул dnv можно представить в следующем виде: dnv= n(vx, vy, vz)dv — n(v)dvxdvvdvz, G,1) где n(vx, vy, vz)—n(v)—среднее число молекул с компонентами скорости vx, vy, vz в единичном интервале. Функция п (о) полу- получила название функции распределения молекул по скоростям. Если интервал dv = dvx • dvy- dvz достаточно велик для того, чтобы в нем могло находиться сравнительно большое число мо- молекул, то функция распределения будет плавно изменяться с из- изменением значения своих аргументов. Поскольку все направления движения молекул в простран- пространстве равноправны, распределение скоростей должно быть изо- изотропным и функция распределения n(v)ne может зависеть от направления скорости. Это означает, что n(vx, vy, vz) не может быть произвольной функцией от компонент скорости vx, vy, vZf но должна являться функцией аргумента о = | V \ = Yv\ + v2 + v*r т. е. абсолютной величины скорости, и dnv = dnv. G,2) Переходя от компонент скорости к ее абсолютной величине и направлению, которое характеризуется полярными углами й и i|), можем в силу A,67) написать dnv = n(v)v2dv sinO^drp. G,3)
366 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. II JV Полное число частиц в единице объема п = у определяет ус- условие нормирования: п = J n (v) v2 dv sin ft d® d$ = 4я J n (w) у2 dv. G,4) Пределы интегрирования по компонентам скорости vx, vy, v2 или no абсолютному значению скорости v будут обсуждены в даль- дальнейшем. Нашей задачей является нахождение явного вида функции распределения n(v). Здесь мы ограничимся самым простым, хотя и не вполне строгим, выводом вида функции распределе- распределения, получившей название функции распределения Максвелла, или, кратко, максвелловского распределения. В этом выводе особенно ясна роль молекулярных столкновений и предположен ния о молекулярном хаосе в установлении равновесного рас- распределения молекул по скоростям. Рассмотрим процесс столкновения двух частиц, движущихся со скоростями fi и V2. Поскольку силы межмолекулярного взаи- взаимодействия быстро убывают с расстоянием и фактически .от- .отличны от нуля только в момент непосредственного контакта ча- частиц, мы можем заменить реальный процесс соударения идеа- идеализированной схемой упругого соударения двух материальных точек. При этом конкретный вид сил взаимодействия не играет роли. Пусть в результате соударения скорости молекул изме- изменяются. После соударения первая частица движется со ско- скоростью Vz, а вторая — со скоростью v4. Число таких столкнове- столкновений в единицу времени в единице объема газа должно быть пропорционально числу молекул со скоростями V\ и v2, т. е. произведению n{vi)n(v2). Рассмотрим далее процесс соударе- соударения, являющийся обратным данному. При этом скорости моле- молекул изменяются от значений »3 и V4 Д° значений fi и v2. Число таких соударений в единицу времени в единице объема пропор- пропорционально количеству молекул со скоростями v3 и w4, т. е. n{v3)n(Vi). В силу сделанного нами предположения о том, что число молекул с данными значениями скорости не изменяется процессами молекулярных столкновений в газе, находящемся в стационарном состоянии, можно считать, что число молекул, у которых скорости изменяются от значений г>[, v2 до значений г>3, г>4, равно числу молекул, у которых скорости изменяются от vz и «и до Vi и г>2, т. е. считать G,5) Равенство G,5) выражает детальный баланс частиц, полу- получающих и теряющих соответствующую скорость.
5 7] РАСПРЕДЕЛЕНИЕ МАКСВЕЛЛА 367 Поскольку в процессе столкновения энергия молекул сохра- сохраняется, для прямого и обратного процессов можно написать v\ + vl = v\ + v\. G,6) Равенство G,6) выражает закон сохранения энергии при столк- столкновении: при этом входящий в обе стороны общий множитель -g- опущен. Равенства G,4), G,5) и G,6) представляют совокупность, условий, которым должна удовлетворять искомая функция рас- распределения. Из формулы G,6), в которую входят только квадраты ско- скоростей, видно, что функциональное уравнение G,5) будет вы- выглядеть гораздо проще, если в качестве аргумента функции рас- распределения выбрать не самую абсолютную величину скорости, а ее квадрат, записав искомую функцию в виде n(v2). Это не изменяет существа дела, но позволяет переписать G,5) в более простом с математической точки зрения виде n(v*)n(vl) = n(v*)n(v>). G,7) Функциональное уравнение G,7) легко превратить в простое дифференциальное уравнение. Для этого выразим и4 через V\, ^г и и3 с помощью G,6) и перепишем G,7) в виде n (of) n (of)-п(о|) и (о?+ о|-О|). Взяв логарифм от этого равенства, имеем In п (и?) + In п (о22) = In п (»D + In п {v\ + v\ - of). G,8) Продифференцируем последнее равенство по аргументу v\. При этом мы должны помнить, что уравнение G,8) справедливо при совершенно произвольных и независимых значениях V\, «a и Уз [значение и4 определено формулой G,6)]. Имеем я (о?) dv] n(i)f + i|-i|) rf (cif Аналогично dnD) "O2) dvj n Сравнивая оба равенства, получаем I dn(vl) «(of) dv] nD) dv: 2 G,9) Так как vt и v2 — независимые переменные, а равенство G,9) должно иметь место при совершенно произвольных значениях
368 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. II независимых величин Vi и Уг. ясно, что оно может быть выпол- выполнено только тогда, когда правая и левая части G,9) равны не-- которой постоянной. Обозначим эту постоянную через — а. Тогда вместо G,9) можно написать В последнем уравнении мы опустили индекс при скорости, так как из смысла предыдущих рассуждений ясно, что оно должно быть справедливо при любом значении скорости. Интегрируя G,Ш), находим м(у2)= Ае-<™', G,11) где А — постоянная интегрирования. Постоянная интегрирования А может быть определена из условия нормирования G,4). В силу G,11) и G,4) имеем An A j e-av'v2 dv = п. G,12) Обсудим теперь пределы интегрирования в условии нормиро- нормирования G,12). Нижний предел интегрирования в G,12) отвечает наименьшему возможному значению скорости v. Последнее, очевидно, равно нулю. Что же касается верхнего предела, то мы не можем, конечно, указать значения наибольшей скорости, ко- которую может иметь молекула в газе. Однако вид распределе- распределения, входящего в G,12), показывает, что в знании этой вели- величины, в сущности, нет нужды. Подынтегральная функция на- настолько быстро убывает с ростом аргумента, что мы не сделаем никакой ошибки, заменив верхний предел в G,12) на бесконеч- бесконечный. Прибавляемая при этом площадь будет бесконечно малой высшего порядка. Поэтому условие нормирования G,12) можно записать в виде 00 4яД J G,13) Из условия G,13) непосредственно следует, что а > 0. В про- противном случае интеграл не существует. Интегрирование дает Окончательно функция распределения можег быть записана в виде / _ »\i е-*. G,15)
§8] СТОЛКНОВЕНИЕ МОЛЕКУЛ СО СТЕНКОЙ СОСУДА. ДАВЛЕНИЕ 369 Число молекул в единице объема, скорость которых лежит ме- между v и v + dv, таким образом, равно -а°2&2Л>. G,16) Формула G,16) носит название распределения Максвелла. Наряду с распределением по скоростям можно написать также распределение по компонентам скоростей: dvn = n\— e уху z> dv dv dv G,17) Переход от G,16) к G,17) соответствует обычному преобразо- преобразованию координат от полярных к декартовым. В формуле G,17) можно считать, что компоненты скорости изменяются в пределах от — оо до + «э. Заметим, что функция распределения по компонентам ско- скоростей может быть записана в виде произведения трех функций распределения по компонентам скоростей: dnB = dnOjc dnv dnVz = - (/? • о'™1' <*><) ¦ (/?*""• *.) • (/? ¦ •-*• "О ¦ G,18) Прежде чем перейти к обсуждению результатов, вытекаю- вытекающих из распределений G,16) или G,17), необходимо выяснить смысл фигурирующего в них параметра а. § 8. Столкновения молекул со стенкой сосуда. Давление. Связь параметра а с абсолютной температурой В процессе движения молекулы газа, заключенного в неко- некоторый сосуд, испытывают соударения с его стенками. Стенки сосуда не образуют геометрически рез- резкой границы, но имеют молекулярное строение. Газовая молекула, приближаю- приближающаяся к стенке, испытывает со стороны молекул последней весьма сильное от- отталкивание и отражается внутрь сосуда. На рис. 35 изображен схематический ход потенциальной энергии молекулы вблизи стенки сосуда. Последнюю мы можем Рис ,5 рассматривать как бесконечно высокий потенциальный барьер, непроницаемый для молекул. Можно считать, что отражение молекулы от стенки сосуда происходит совершенно упруго. Это означает, что компо- компонента скорости, перпендикулярная к плоскости стенки, при от- отражении изменяется на прямо противоположную. 24 В. Г. Левнч, том I
370 КИНЕТИЧЬСКАЯ ТЕОРИЯ ГАЗОВ [Гл. 1Г Рассмотрим некоторую площадку стенки dS, перпендикуляр- перпендикулярную к оси х. Тогда при отражении от этой площадки молекула, имевшая компоненты скорости vx, vv, vz, приобретает компо- компоненты скорости — vx, vy, vz. При отражении молекулы от пло- площадки происходит изменение компоненты импульса по оси х от значения mvx до значения — mvx, т. е. на величину 2mvx. Этот импульс передается отражающей стенке. Таким образом, столкновения молекул со стенкой будут при- приводить к появлению силы, действующей на поверхность сосуда. Силу, действующую на единицу поверхности стенки со стороны всех молекул газа, мы отождествим с макроскопическим давле- давлением. Это утверждение, являющееся, в сущности, основой ки- кинетической теории газов, казалось в свое время весьма ради- радикальным. Однако сейчас оно представляется естественным и совершенно очевидным. Для нахождения давления, оказываемого на стенку сосуда, нужно вычислить полное изменение количества движения моле- молекул газа, испытывающих отражение от единицы поверхности сосуда в еди- единицу времени. Оно равно, очевидно, изменению импульса в одном соуда- соударении со стенкой, умноженному на полное число ударов, приходящихся на 1 см2 поверхности за 1 сек. Изме- Изменение импульса равно 2mvx. Умножив это выражение на число ударов, при- приходящихся на 1 см2 стенки за 1 се- секунду, со стороны молекул, имеющих данную компоненту скорости vx, и суммируя или, точнее, интегрируя это- произведение по всем значениям vx, мы найдем искомое давле- давление. В единицу времени поверхности стенки будут достигать все молекулы, находящиеся от нее на расстоянии, меньшем или рав- равном vx (поскольку vx — путь, проходимый в единицу времени молекулой, движущейся в положительном направлении оси х). На 1 см2 поверхности за 1 сек будут попадать все молекулы, находящиеся в параллелепипеде высотой охис основанием 1 см2 (рис. 36). Объем этого параллелепипеда равен, очевидно, vx см3. В нем находится dnvvx молекул, компоненты скорости которых лежат между vx и vx + dvx; vy и vy + dvv; v2 и vz + dv2. Поверх- Поверхности стенки будут достигать все молекулы, находящиеся в ука- указанном параллелепипеде, независимо от значений компонент скорости vv и vz, параллельных этой поверхности1). >) Это рассуждение носит качественный характер. В нем не учитываются столкновения между молекулами, их взаимодействие со стенкой и т. п Оно имеет скорее характер общей схемы расчета давления газа. Рис. 36.
S 8] СТОЛКНОВЕНИЕ МОЛЕКУЛ СО СТЕНКОЙ СОСУДА. ДАВЛЕНИЕ 371 Число частиц с данной компонентой скорости vx (при про- произвольных значениях двух других компонент vv и vz) в единице объема равно е xdVr\ \е \у г>dvudvz = n\ — \ e xdv,. Число частиц, находящихся в параллелепипеде, имеющем объем vx, соответственно равно dv = vxdnv =n[^-)e~ax>xvxdvx. (8,1) X \ П, I Это выражение дает число молекул, имеющих данное значение компоненты скорости vx и достигающих 1 см2 поверхности стенки за 1 сек. Каждая из dv молекул, ударяющихся о стенку, передает ей импульс 2mvx, так что за 1 сек молекулы с данным значе- значением vx передают стенке импульс, равный 2mvxdv. Интегрируя последнее выражение по всем возможным значениям компо- компоненты скорости vx, мы найдем искомый импульс, передаваемый 1 см2 поверхности стенки за 1 сек всеми ударяющимися об ее поверхность молекулами газа. Переданный за 1 секунду им- импульс равен, очевидно, силе, действующей на 1 см2 поверхности, т. е. давлению газа р: 00 р=п Ш'/г J{2mVx) e~ay'Vx dv<- (8>2) U Интегрирование в (8,2) ведется только по положительным зна- значениям vx, поскольку молекулы с отрицательными значениями компоненты скорости по оси х движутся не к рассматриваемой стенке, а от нее1), и дает или Для определения числового значения а необходимо сопо- сопоставить уравнение (8,4) с экспериментальным значением давле- давления достаточно разреженного газа. Последнее дается формулой уравнения состояния pV - NkT. ') В выражении (8,2) не учитываются столкновения молекул между со- собой Однако молекулы, не достигающие стенки, передают свой импульс моле- молекулам, долетающим до стенки. 24*
372 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. II Сравнивая это выражение с (8,4), мы видим, что параметр а связан с абсолютной температурой Т соотношением Щ /О С\ « = W (8'5) Равенство (8,5) подтверждает, что формально введенный нами параметр а является существенно положительной величиной. При определении связи между а и температурой Т нам при- пришлось прибегнуть к данным эксперимента. В дальнейшем нам придется столкнуться с параметром, аналогичным а. Тогда во- вопрос об определении смысла и значения параметра будет об- обсужден детальнее. Мы увидим, что смысл параметра а может быть выяснен без непосредственного привлечения данных экспе- эксперимента. Найдем еще число v ударов молекул об 1 см2 стенки за 1 сек. Формула (8,1) дает число молекул, достигающих стенки за се- секунду и имеющих скорость между vx и vx + dvx. Полное число молекул, ударяющихся об 1 см2 стенки за 1 сек, получается ин- интегрированием (8,1) по всем значениям vx от нуля до беско* нечности. Это дает § 9. Свойства распределения Максвелла Перепишем теперь распределения Максвелла G,17) и G,16), выразив в них параметр а через абсолютную температуру ra3a:> 2kT dvxdvydvt, (9,1) me' е v av. \У>А) Вместо того чтобы пользоваться распределением частиц газа по состояниям, мы можем ввести эквивалентное ему распреде- распределение вероятностей того, что отдельная частица попадает в дан* ное состояние. Если среднее число молекул в 1 см3 газа, имеющих данную скорость, равно dn, а полное число молекул равно п, то, оче- очевидно, вероятность того, что некоторая произвольно выбранная молекула попадает в состояние с данной скоростью, равна
5 9] свойства распределения максвелла Поэтому функцию распределения Максвелла можно трактовать как функцию распределения вероятностей того, что отдельна» молекула попадает в дан- / an,bjcl ное состояние. П ~ ^ характеризуется Последнее рру значения- значениями компонент скоростей vx, vv и v2. На рис. 37 и 38 изобра- изображены функции распределе- распределения плотности вероятности (т- и соответственно по компонентам ско- скоп dvx п рости и абсолютной величи- величине скорости. Поскольку не- невозможно изобразить гра- графически функцию трех пере- 1.0 09 0.8 07 пВ U5 03 0.1 N \ \ \ \ \ \ ""*— 05 1.0 /.5 Рис. 37. менных, на рис. 37 по оси ординат отложено значение -~- а по оси абсцисс — величина |-^fI vx. На рис. 38 по оси ординат отложена функция — -^j2-, no ос» абсцисс— величина \-?j?p) *»• Число молекул в газе с очень малыми и очень большими ско* ростями оказывается сравнительно небольшим. Тем не менее, всегда можно найти извест- известное число очень быстрых и очень медленных молекул. На первый взгляд может показаться странным, что функция распределения по I anlv) n dv 1.0 U9 Q8 0,7 Q6 U5 ИЗ U2 7 Z скоростям имеет максимум. Действительно, множитель ту' е 2кТ экспоненциально- убывает с квадратом скоро- скорости молекулы. Поэтому чис- число молекул с данной скоро- скоростью должно быть тем- меньше, чем больше ско- скорость. Однако второй мно- множитель v2 изменяется в про- противоположном направлении и растет с ростом скорости. Этот множитель характеризует число состояний молекулы, имеющих. 0,5 1.0 1.5 Рис. 38.
Ь71 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. II скорость, меньшую данной. Конкуренция обоих множителей приводит к появлению максимума в функции распределения. С ростом температуры распределение становится все более пологим. Это означает, что относительное число молекул с дан- данным большим значением скорости постепенно возрастает. На рис. 39 изображено изменение рас- распределения Максвелла с ростом температуры (для молекул кисло* рода). Наряду с распределением моле- молекул по скоростям часто приходится пользоваться распределениями по импульсам и энергиям. Вводя в распределение G,17) новые переменные ш N '' 22 г,о 1.6 1,2 0,8 ь р / У \ — при т=г?з'к \\ ПриТ-- \ •з?з'н О 200 Ш 800 800 10001200 Рис. 39. рх = mvx, Ру = mvv, находим для числа молекул с данным импульсом *¦»-" wr —Y' 7а -' 2mkT dpz. (9,3) Аналогично число молекул с абсолютным значением импульса, лежащим между р и р + dp, будет равно р2 dp. Выражая импульс через энергию молекулы р = лучаем для числа частиц с данной энергией е выражение е -е Тт * _ hT (9,5) Экспериментальная проверка распределения Максвелла явля- являлась одной из важнейших задач молекулярной физики. Поэтому было разработано несколько методов измерения распределения скоростей. Самым наглядным из них является опыт, идентич- 'ный известному опыту Физо по определению скорости света. Молекулы, испаряющиеся с поверхности раскаленной нити, пропускаются через систему щелей — линз, образующих узкий молекулярный пучок, летящий в вакууме по направлению к ло- ловушке. На пути пучка устанавливаются два вращающихся диска с прорезями, через которые должен проникнуть пучок. Для того чтобы молекулы, имеющие скорость vx, могли проник- проникнуть через обе щели при заданной угловой скорости со враще^
ВЫЧИСЛЕНИЕ ХАРАКТЕРНЫХ ВЕЛИЧИН 375- ния дисков и расстоянии / между ними, щели должны быть сме- смещены на угол ф, равный ф = <о/ = © ¦ Таким образом, каждой скорости vx при заданной угловой скорости ш отвечает определенный сдвиг дисков на угол ф. Число частиц в пучке, обладающих данной скоростью, опре- определялось непосредственно по фотометрическому измерению тол- толщины осадка в ловушке, охлаждае- охлаждаемой жидким воздухом. После пересчета распределения скоростей в молекулярном пучке на распределение скоростей в изотроп- изотропных условиях получается гисто-< грамма, изображенная на рис. 40. Кривая на том же рисунке пред- представляет распределение Максвелла (для паров ртути). Другой весьма точный метод из- измерения распределения скоростей в молекулярном пучке паров лития, натрия или им подобных газов основан на изучении поведения пучка в магнитном поле, перпендикулярном к направлению движения этого пучка. Он представляет повторение известного опыта Штерна и Герлаха для определения магнитных моментов, но детально не может быть здесь описан (см. ч. V). § 10. Вычисление характерных величин Зная распределения (9,1) и (9,5), можно найти средние зна- значения любых величин, характеризующих свойства газовых мо- молекул. Найдем прежде всего ?реднее значение какой-либо ком- компоненты скорости, например vx. По определению среднего зна- значения 90 1W 19021.0 290 3U) 390 м/сек Рис. 40. vx = \vxdw = \vx^ = сю т VI, Г 5Г) J °- dvx X dvudvz. Интеграл по dvx, который берется от нечетной функции, равен нулю. Поэтому среднее значение vx равно нулю: Этот результат является совершенно очевидным. Он показы* вает, что оба направления движения вдоль оси х являются рав~ невероятными.
376 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. 1Г Аналогичный результат мы получили бы при вычислении лю- любой другой компоненты скорости. Найдем теперь среднее значение абсолютной величины ско- скорости. Имеем В соответствии со сказанным выше средняя скорость молекулы возрастает с ростом температуры. Это возрастание пропорцио- пропорционально корню из абсолютной температуры газа. Мы видим также, что средняя скорость молекул обратно пропорциональна корню квадратному из массы молекулы. Большой интерес представляет среднее значение кинетиче- кинетической энергии газовой молекулы е. Оно равно, в силу (9,5), -_[ dne _ 2 ( ~Тг ч J it j'z(kTK J и При вычислении последнего интеграла нужно ввести новую переменную x = Ye- Простое вычисление приводит к формуле для среднего значения кинетической энергии поступательного движения молекулы: ё = 4 ДгГ. A0,2) Как мы видим, средняя энергия молекулы не зависит от ее при- природы и пропорциональна температуре газа Т. Средняя энер- энергия Е всех газовых молекул в сосуде равна сумме энергий по- поступательного движения всех молекул, поскольку взаимодей- взаимодействие между ними отсутствует: E=Ne = jNkT, A0,3) где N — полное число молекул в газе. Энергия данной порции' идеального газа не зависит от объема сосуда и определяется только абсолютной температу- температурой1). 1) Может показаться, что независимость средней энергии газовой моле- молекулы от размеров сосуда противоречит квантовой формуле для энергии A,11), согласно которой ъп~—%-, где а — линейный размер сосуда. Нужно, однако, помнить, что средняя энергия определяется интегралом от произведения энер- энергии на число квантовых состояний. Последнее согласно A,24) пропорционально Q (е) Де~кКв Де~а5 ~а2Де. Это приводит к независимости энергии от объема.
S 10] ВЫЧИСЛЕНИЕ ХАРАКТЕРНЫХ ВЕЛИЧИН 377" Мы будем отождествлять эту среднюю энергию механиче- механического движения молекул газа с макроскопической тепловой- энергией. В связи с этим абсолютную температуру мы должны с кинетической точки зрения трактовать как величину, харак- характеризующую среднюю энергию движения молекул. В настоя- настоящее время такая трактовка является единственно возможной. В следующей главе мы подробно остановимся на обсуждении этих утверждений. Полученные выражения для средней энергии отдельной мо* лекулы и газа в целом могут быть интерпретированы следую- следующим образом. Каждая молекула имеет три степени свободы, к ее движение может быть разложено на движение в трех взаимно перпендикулярных направлениях. В силу равноправия всех направлений в пространстве средняя энергия движения в каждом направлении должна быть одинаковой. Таким образом, формула A0,2) означает, что на каждую степень свободы в среднем приходится энергия, равная -^kT. Это утверждение является частным случаем весьма общего закона о равномер- равномерном распределении энергии по степеням свободы. В § 39 мы подробно обсудим этот закон и укажем границы его примени- применимости. Представляет интерес установить связь между энергией газа е и его давлением р. Записав выражение (8,2) в виде :~f (aSf) J L о dvydvz
3 78 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. II мы видим, что давление идеального газа оказывается численно равным 2/3 от кинетической энергии поступательного движения молекул газа, находящихся в единице объема. Наконец, найдем скорость молекул газа он. в, при которой максвелловское распределение имеет максимум, т. е. наиболее вероятную скорость. Для нахождения ее ищем максимум функ-i ции распределения, который определяется из условия Легко находим () • (Ю,5) Сравнивая A0,5) с A0,1), мы видим, что средняя скорость мо- молекул на 13% больше наиболее вероятной. Часто вводят также понятие о средней квадратичной скоро- скорости V v2 , характеризующей энергию газовых молекул. В силу A0,2) эта величина равна (^r(^f)V. 00,6) Средняя квадратичная скорость на 22% больше наиболее ве- вероятной. Это вполне естественно, так как вклад быстрых моле- молекул в энергию должен быть больше, чем вклад медленных. § 11. Столкновения молекул между собой Рассмотрим две молекулы, движущиеся в идеальном газе со скоростями V\ и V2- Очевидно, что для столкновения этих моле- молекул друг с другом абсолютные величины и направления скоро- скоростей сами по себе не играют роли. Важно лишь, как происхо- происходит движение одной молекулы по отношению к другой. Если, например, обе молекулы движутся по прямой одна вслед за другой, то столкновение в единицу времени произойдет в том случае, если вторая молекула успеет за 1 секунду «догнать» первую молекулу. Скорости движения обеих молекул в про- пространстве по отношению к стенкам сосуда не играют роли. Таким образом, при решении вопроса о столкновениях нужно рассмотреть их относительное движение. В § 42 ч. I было показано, что движение двух частиц можно всегда разло- разложить на движение в пространстве общего центра тяжести и их относительное движение. Напишем вероятность того, что первая молекула имеет ско- скорость Vi, а вторая v2, в виде dwl2 = dwx dw2 = (tjSt) V^ dv{
§ ill СТОЛКНОВЕНИЕ МОЛЕКУЛ МЕЖДУ СОБОЙ 379 Перейдем от переменных v{ и v2 к новым переменным /?, оотп, пользуясь формулами D2,4) ч. I. Тогда имеем где ttl\ dvldva=\I\dkdvmu ¦ — приведенная масса, М = т^ + tn2 и |/1 озна- чает модуль якобиана преобразования от v{, v2 к i?, ^0 аг»от„ ЗЯ Зг>отн ЗЛ Таким образом, = 1 x X MR2 Мы видим, что вероятность данного состояния движения двух частиц равна произведению вероятностей двух независимых со- событий — вероятности того, что частицы имеют данную относи- относительную скорость: ""о 2kT и вероятности того, что центр инерции системы из двух частиц движется в пространстве с данной скоростью: м Vl, _** «¦ - = [шг) В проблеме столкновений интерес представляет только первая вероятность. В случае частиц с равной массой ц = -^> так что ) ( \ 4nkT A1,2)
380 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. 1Г С помощью распределения вероятностей A1,2) можно найти среднее значение скорости относительного движения уОтн: Таким образом, средняя скорость относительного движения почти в полтора раза превышает среднюю скорость теплового движения. Найдем теперь число столкновений, испытываемых в еди* ницу времени молекулой в газе, имеющем плотность п. Мы бу- будем предполагать, что газ является настолько разреженным, что молекулы сталкиваются попарно, и можно пренебречь столкновениями, при которых одновременно приходят в непо- непосредственный контакт три и более молекул. Процесс соударе- соударения молекул можно характеризовать их эффективным сече* нием а. Рассматривая соударения между молекулами газа, будем считать, что все молекулы газа, кроме одной, неподвижны. Вы- Выделенная молекула движется по отношению к неподвижным со скоростью Ус,™. Она проходит в единицу времени путь иотп и сталкивается со всеми частицами, лежащими в цилиндре объемом сШотп- Число таких столкновений равно, очевидно, ovOTHdnVoTH, где dnVor[i = n dwOTS и dwOTll дается формулой A1,2). Полное число соударений, испытываемых молекулой в еди- единицу времени, получается интегрированием этого выражения по всем возможным значениям vom: F J mt4.. Если эффективное сечение столкновения можно считать не зави- зависящим от скорости, то вместо A1,4) получаем = navom = па УТ» = 4па j/^-. A1,5) Это и есть число столкновений, испытываемых молекулой в се- секунду.
§ 12] ДЛИНА СВОБОДНОГО ПРОБЕГА. 381 § 12. Длина свободного пробега Найдем теперь средний путь, проходимый молекулой между двумя последовательными соударениями, именуемый средней длиной свободного пробега. За одну секунду молекула проходит в пространстве путь, равный в среднем v. При этом она испытывает v столкновений. Средняя длина пути между столкновениями равна !1 ± A2,1) «(joe™ па у 2 Длина пробега X в среднем пропорциональна отношению среднего пути, проходимого в единицу времени молекулой, к числу испытываемых ею соударений. Поэтому величину Я, име- именуют средней длиной свободного пробега. Средняя длина сво- свободного пробега X оказывается обратно пропорциональной плот- плотности газа п и эффективному сечению а. Формула A2,1) дает среднюю длину свободного пробега. Часто, однако, важно знать, какова вероятность того, что мо- молекула пройдет произвольный путь х, не испытав ни одного столкновения. Иными словами, представляет интерес закон рас- распределения вероятностей для пробега молекул. Обозначим че- через w(x) вероятность того, что молекула пролетит расстояние х, не испытав ни одного столкновения. Соответственно w(x + dx) представляет вероятность того, что молекула пролетит путь (x + dx), не испытав ни одного соударения. Прохождение пути x + dx представляет сложное событие, состоящее из двух независимых этапов: пролета пути х без столкновений и последующего пролета пути dx также без столк- столкновений. Поскольку эти события являются независимыми, можно на- написать w (х + dx) = w (x) w (dx). A2,2) Последнюю вероятность удобно переписать в другом виде, Очевидно, что вероятность w(dx) того, что на бесконечно ма- малом пути dx молекула испытает соударение, пропорциональна длине dx н может быть представлена в виде adx, где а — неко- некоторый коэффициент пропорциональности. Вероятность того, что молекула пролетит путь dx без столкновений, равна w {dx) = 1 — w (dx) = I —adx. Подставляя это в A2,2), находим w(x +_dx)= w(x)(l—adx). A2,3)
382 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ [Гл. Н Разлагая w(x + dx) в ряд по степеням dx и ограничиваясь бесконечно малыми величинами первого порядка малости, имеем откуда, подставляя в A2,3), получаем day = — aw(x)dx. Интегрируя, находим w(x) = Ае~ах. Для определения произвольной постоянной А заметим, что вероятность того, что молекула пролетит как угодно малый путь без столкновений, равна единице: w(x-*0)= 1. Отсюда следует, что А = 1 и окончательно w(x) = e~ax. A2,4) Для определения смысла постоянной величины а найдем среднюю длину свободного пробега X, пользуясь формулой A2,4). По определению, средняя длина свободного пробега К равна A2,5) о где dP — вероятность того, что молекула, пройдя без столкно- столкновений путь л:, испытает соударение на отрезке х, х+ dx. Со- Согласно предыдущему можно написать dP = w (x) w (dx) = w(x)adx = ae~ax dx. A2,6) Подставляя значение dP в A2,5), находим DO J xe~axdx =-j. A2,7) о Таким образом, постоянная а оказывается величиной, обратной средней длине свободного пробега. Формулу A2,4) для вероятности того, что молекула проле- пролетит путь х, не испытав ни одного соударения, можно переписать в виде »(*) = *"*. A2'8> Эта вероятность оказывается экспоненциально убывающей функцией расстояния. Подчеркнем, что w(x) дает вероятность
^ 12] ДЛИНА СВОБОДНОГО ПРОБЕГА 383 пролета молекулой пути х без столкновений, независимо от того, в каком месте она испытала последнее соударение. Это озна- означает, что расстояние х отсчитывается от произвольной точки, а не от места последнего соударения. Вероятность того, что молекула пролетит путь без соударе- соударения и столкнется на участке х, х + dx, согласно A2,6) и A2,7), равна dp = ±-e~~dx. A2,9) Формула A2,8) важна для экспериментального определения ¦средней длины свободного пробега молекул в газе. Представим себе узкий направленный пучок молекул, выходящий в некото- некоторый откачанный до сравнительно низкого давления сосуд, содер- содержащий охлаждаемую пластинку, помещаемую на пути пучка на расстояниях Xi и х2 от входного отверстия. Молекулы, пролетев- пролетевшие пути Xi и Х2 без соударений, будут достигать пластинки, об» разуя на ней осадок. Отношение числа частиц, осевших на пла- стинке в обоих положениях, равно, согласно A2,8), Измеряя числа N(Xi) и N(x2) и считая приближенно, что Я оди- одинакова для всех молекул в пучке, с помощью A2,10) можно оп- определить К. В соответствии с требованиями теории, к оказывается об- обратно пропорциональной плотности или, что то же самое, давле- давлению газа. По порядку величины % составляет около 10 см при р ~ 10 мм ртутного столба и около 10 при атмосферном дав- давлении.
ГЛАВА III СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ § 13. Квазинезависимые системы Рассмотрим некоторую макроскопическую систему, состоя- состоящую из весьма большого числа частиц. Мы будем предполагать, что движение всех частиц определяется законами квантовой ме- механики; состояние каждой частицы характеризуется некоторы- некоторыми квантовыми числами. Разделим всю нашу систему на боль- большое число частей так, чтобы взаимодействие между этими частями было весьма слабым и им можно было в первом при- приближении пренебречь. Мы будем называть всю изучаемую си- систему собранием ее почти независимых частей. Такие слабо взаимодействующие между собой части системы движутся в первом приближении независимо друг от друга. Однако взаимодействие, существующее между ними, приводит к тому, что фактически движение одной из частей влияет на движение другой, и полной независимости между ними не суще- существует. Мы будем называть в дальнейшем слабо взаимодей- взаимодействующие части большой системы квазинезависимыми подси- подсистемами, или просто подсистемами. Остановимся прежде всего на вопросе о том, когда подси- подсистемы, образующие большую систему, можно считать квази* независимыми. Очевидно, что подсистемы являются квазинезависимыми, если энергия их взаимодействия в среднем мала по сравнению с энергией каждой из подсистем. Это означает, что если в некото- некоторых случаях взаимодействие между подсистемами может быть достаточно большим, то при этом длительность взаимодействия должна быть настолько малой, что подавляюще большой проме- промежуток времени движения они проводят, совсем не взаимодей- взаимодействуя друг с другом. В качестве примера такого рода подсистем можно привести молекулы идеального газа, которые лишь изредка и на очень короткий промежуток времени вступают в сильное взаимодей- взаимодействие друг с другом.
? М] СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ 385 В других случаях между подсистемами может происходить непрерывное, но слабое взаимодействие. Представим себе, на- например, что каждая из подсистем, входящих в систему, содер- содержит очень большое число частиц (атомов или молекул) и яв- является, таким образом, макроскопической системой. Тогда пол- полная энергия подсистемы, слагающаяся из энергий движения отдельных частиц, будет пропорциональна полному числу ча- частиц, входящих в подсистему. Число частиц будет в свою оче- очередь пропорционально объему рассматриваемой подсистемы. Взаимодействие между различными подсистемами обусловлено главным образом силами молекулярного взаимодействия между молекулами, находящимися на поверхности каждой из взаимо- взаимодействующих подсистем1). Силы молекулярного взаимодей- взаимодействия так быстро убывают с расстоянием, что вклад в энергию взаимодействия, вносимый взаимодействием молекул, находя- находящихся в глубине подсистем, мал по сравнению с вкладом по- поверхностных молекул. Поэтому энергия взаимодействия между подсистемами пропорциональна числу молекул, находящихся на их поверхности, т. е. величине самой поверхности. Таким образом, энергия подсистемы ё пропорциональна /?3, где R — характерный линейный размер системы, а энергия взаимодействия ёВз~^2- Их отношение ё R3 R JV делается достаточно малым при достаточно большом N. Энергию всего собрания квазинезависимых систем можно считать равной сумме энергий отдельных частей, т. е. Я~2Х, A3,1) где знак ~ подчеркивает тот факт, что при написании A3,1) мы пренебрегли энергией взаимодействия между подсистемами, образующими собрание (ансамбль). Суммирование (в 13,1) ве- ведется по всем частям системы (подсистемам). § 14. Статистическое распределение Мысленно выделим из всей системы одну выбранную под- подсистему. Эта подсистема состоит из некоторого числа молекул ') Мы нигде не будем учитывать гравитационного взаимодействия, свя- связанного с притяжением по закону всемирного тяготения, поскольку оно яв- является весьма слабым и не играет никакой роли в молекулярных процессах. Нужно, однако, заметить, что при изучении макроскопических свойств веще- вещества в астрофизических проблемах гравитационное поле в ряде случаев имеет весьма существенное значение и должно обязательно учитываться. 25 В. Г. Левич, том I
386 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. Ш (как мы только что пояснили, оно может быть и большим и ма- малым, в зависимости от конкретного характера тех подсистем, из которых построена система), движущихся по законам кван- квантовой механики. Энергия нашей подсистемы не является строго постоянной, а, наоборот, все время изменяется в пределах вели- величины 8вз, где евз — энергия взаимодействия системы с ее окру- окружением. Хотя евз — весьма малая величина и ею можно прене- пренебречь в балансе энергии, тем не менее эта энергия взаимодей- взаимодействия играет очень существенную роль в поведении системы. Взаимодействие подсистемы с окружающими ее телами служит причиной переходов ее из одних квантовых состояний в другие. Это взаимодействие имеет чрезвычайно сложный и запутанный характер. Уже в простейшем случае, когда в качестве подсистем фигурировали отдельные молекулы, мы видели, что попытка определить движение каждой молекулы, т. е. последователь- последовательность изменения состояний, представляет огромные трудности. В газе, состоящем из очень большого числа частиц, проявлялись новые закономерности, кратко сформулированные нами в виде положения о молекулярном хаосе. Совершенно аналогично об- обстоит дело и в общем случае макроскопической системы, состоя- состоящей из большого числа квазинезависимых подсистем. Взаимо- Взаимодействие между подсистемами является настолько сложным, что точное определение состояния каждой из систем становится задачей еще более трудной, чем нахождение движения отдель- отдельных молекул в газе. Вместе с тем, такое определение теряет всякий физический смысл. Действительно, если бы мы даже сумели определить, в каком состоянии находится некоторая подсистема в данный момент времени, через весьма короткое время в результате взаимодействия с другими подсистемами она перейдет в другое состояние. Поэтому состояние единичной подсистемы, входящей в большое собрание систем, известное в некоторый момент времени, не характеризует состояния всего собрания, подобно тому как скорость отдельной газовой моле- молекулы еще не характеризует свойств газа как целого. В связи с этим мы заранее отказываемся от описания поведения отдель- отдельной подсистемы и будем искать статистические законы, характе- характеризующие поведение всего собрания подсистем в целом. Это означает, что мы не будем пытаться детально проследить за по- последовательным изменением состояния отдельной подсистемы с течением времени, а будем стремиться найти вероятность wt того, что одна произвольно выделенная из собрания подсистема попадет в некоторое i-e состояние. Если это распределение ве- вероятности будет нами найдено, то мы сможем: !) найти среднее число подсистем, находящихся в данном состоянии, если нам задано собрание, состоящее из N одинаковых подсистем (например, число молекул, находя-
§ 14] СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ 387 щихся в данном состоянии, если подсистеме соответствует от- отдельная газовая молекула); 2) найти среднее значение любой величины, характеризующей состояние отдельной систе- м ы, например ее энергии, по общим правилам, изложенным в §4; 3) найти отклонения величин от их средних значений, характеризующиеся средней квадратичной флук- флуктуацией. При этом к макроскопической квазинезависимой подсистеме, состоящей в свою очередь из очень большого числа частиц, мы можем применить общие статистические рассуждения § 5. По- Последние показывают, что в такой системе все величины имеют значения, очень мало отличающиеся от своих средних значений. Поэтому если нам известны последние, то мы можем считать, что с огромной степенью точности нам известны истинные зна- значения всех величин, характеризующих состояние подсистемы. Мы видим, таким образом, что постановка вопроса в стати- статистической физике в принципе ничем не отличается от постанов- постановки вопроса в кинетической теории газов. Мы исследуем стати- статистические закономерности, проявляющиеся в системах, состоя- состоящих из очень большого числа частиц. Зная эти закономерности, мы можем вычислять средние значения всевозможных величин. Поскольку однако, интересующие нас объекты являются макро- макроскопическими телами, состоящими из весьма большого числа частиц, вероятностные предсказания, полученные из статисти- статистических закономерностей, приобретают вполне достоверный ха- характер. Средние значения всех величин совпадают с истинными с большой степенью точности. Однако наряду с этим сходством между общей постановкой вопроса в статистической физике и кинетической теории газов между ними имеется и очень существенное различие. В кинети- кинетической теории газов отдельной квазинезависимой системой всегда являлась молекула разреженного газа. При этом моле- молекула считалась одноатомной, поскольку рассматривалось только ее поступательное движение. Газ в целом соответствовал на- нашему собранию систем. В статистической физике вопрос ста- ставится гораздо шире. Отдельной подсистемой может быть любая квазинезависимая система. Это может быть и та же одноатом- одноатомная молекула в разреженном газе и многоатомная молекула, совершающая не только поступательное, но и вращательное и колебательное движения. Подсистемой может являться также весь газ, как целое, заключенный в некоторый сосуд. Стенки этого сосуда и окружающие тела играют роль других систем, с которыми газ в сосуде (квазизамкнутая система) слабо взаи- взаимодействует и обменивается энергией. Газ, стенки сосуда 25*
388 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. III и окружающие тела образуют собрание подсистем. Подсистемой может являться, например, твердое тело, содержащее доста- достаточно большое число частиц. Окружающие его тела играют роль остальных частей собрания. Таким образом, идеальный газ, рассматриваемый в кинети- кинетической теории газов, является частным и самым простым слу- случаем общей статистической системы. В предыдущей главе мы выполнили частично программу, намеченную нами в начале этого параграфа для частного слу- случая идеального газа. Мы видели, что стационарное распреде- распределение плотности вероятностей различных состояний молекулы в газе устанавливается благодаря взаимодействию между моле- молекулами в газе при столкновениях. Точно так же в более общем случае собрания произвольных квазинезависимых систем, благодаря существующему слабому взаимодействию между ними, установится некоторое распреде- распределение вероятностей попадания подсистемы в определенное энергетическое состояние е,. В следующих параграфах будет дан вывод статистического распределения вероятностей для произвольной подсистемы. § 15. Вероятность состояний системы Последим мысленно за изменениями состояния произвольно выделенной нами подсистемы. Все остальные части системы, со- составляющие окружение этой подсистемы, мы будем именовать для краткости термостатом. Смысл такого названия будет ясен из дальнейшего. Саму же подсистему, там, где это не оговорено, будем именовать для краткости просто системой. Каждое сэ- стояние системы характеризуется набором квантовых чисел. Если система имеет f степеней свободы, то ее состояние характе- характеризуется набором f квантовых чисел. Каждому набору квантовых чисел отвечает некоторая вполне определенная энергия системы1). Если система состоит из боль- большого числа частиц и имеет очень много степеней свободы, от- отдельные уровни энергии, отвечающие различным, но близким между собой набором квантовых чисел, лежат очень близко друг к другу. В пределе, когда число частиц очень велико, так что система является макроскопической, мы переходим от кван- квантовой к классической системе2). При этом все уровни энергии сливаются в сплошной энергетический спектр, и вместо дискрет- ') В дальнейшем мы остановимся более подробно на этом вопросе и учтем такой случай, когда нескольким значениям кпантовых чисел отвечает одна и та же энергия, — случай вырожденных систем. 2) Более точно вопрос о переходе к классическим системам будет рас- рассмотрен в ч. V.
§ 15] ВЕРОЯТНОСТЬ СОСТОЯНИИ СИСТЕМЫ 389 ных уровней можно пользоваться непрерывно изменяющейся энергией классической теории. Энергия системы, как мы уже подчеркивали, благодаря взаимодействию с окружением не является постоянной. Поэтому не имеет смысла говорить о строго определенной энергии си- системы, а следует указывать, что ее энергия заключена в преде- пределах между е и е + бе. Значениями энергии системы, лежащим в пределах е и е + бе, отвечает известное число квантовых со- состояний Й(еNе. Мы будем часто называть Q(e) числом кванто- квантовых состояний, отвечающих энергии системы е, или кратностью вырождения данного состояния. Это не должно привести к не- недоразумениям. В действительности при этом будет подразуме- подразумеваться приведенное выше определение. Очевидно, что различ- различным значениям энергии е отвечает разное число квантовых со- состояний Q(e). Оно различно также у разных физических систем. В случае, когда системой является отдельный атом или моле- молекула, число квантовых состояний, отвечающих данной энергии, мало при малых энергиях возбуждения, но быстро растет с ростом энергии. Если системой является макроскопическое тело, всегда имеется практически непрерывный спектр энергий. В дальнейшем мы используем выведенное в гл. I фактиче- фактическое значение Q(e) для простейших систем. В результате сложного и беспорядочного взаимодействия между системой и ее окружением (термостатом) состояния си- системы будут изменяться и она будет переходить из одних кван- квантовых состояний в другие. При этом система будет совершать переходы как между различными состояниями, отвечающими данному значению энергии е (точнее, отвечающими энергии, заключенной в пределах е, е + бе), так и между состояниями с различными энергиями ъ^,ъа,... Например, в случае подсистемы — отдельной молекулы — столкновения с другими молекулами и стенкой сосуда, обра- образующими термостат, приводят к переходам в другие'состояния с той же энергией (изменения направления полета) или в со- состояния с другой энергией, — неупругие соударения или упругие столкновения со сравнительно большой передачей импульса. Если проследить за изменением системы в течение доста- достаточно большого промежутка времени, то она побывает во все- всевозможных состояниях. Состояние системы в данный момент времени не будет зависеть ни от ее начального состояния, ни от начального состояния термостата. Влияние начальных условий будет совершенно затушевано сложными и запутанными перехо- переходами, взаимодействиями и т. п. Поэтому мы можем утверждать, что. состояние системы в каждый момент времени будет опреде- определяться сложнейшей картиной хаотического взаимодействия ме- между системой и ее окружением.
390 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. III Если фиксировать сначала внимание на переходах между различными состояниями, принадлежащими к данному значе- значению энергии (между е и е + бе), то физически представляется очевидным, что все эти состояния равноправны между собой и никаких преимуществ одно из них перед другим иметь не может. Равноправность состояний системы, принадлежащих к данной энергии, является обобщением положения о молекулярном хаосе в идеальном газе. Действительно, последнее означало, что все состояния с одинаковой энергией, но различными напра- направлениями движения в пространстве и положениями в сосуде являются в идеальном газе равновероятными. Если проследить за системой достаточно долго, то, по- поскольку все состояния с данной энергией равноправны, она по- побывает во всех этих состояниях, независимо ог того, в каком из них она находилась в начальный момент. Более того, по- поскольку переход систем из одного состояния в другое совер- совершается в результате случайных возмущений и воздействия со стороны ее окружения, а все квантовые состояние, принадлежа- принадлежащие к данной энергии, совершенно равноправны, можно сказать, что система будет иметь равный шанс попасть в каждое из них. Поэтому время, в течение которого система находится в каждом из квантовых состояний, принадлежащих к данной энергии, яв- является одинаковым для всех этих состояний. Обычно для ха- характеристики состояния указывается не самый промежуток времени, в течение которого система в нем находится, а отно- отношение этого времени ко всему времени наблюдения, т. е. ве- вероятность осуществления данного состояния. Тогда предыдущее утверждение можно кратко сформулировать в виде следующего принципа: все квантовые состояния квазизамкнутой системы, принадлежащие к данной энергии (лежащей между е и е + бе), являются равновероятными. Это утверждение носит название закона равновероятности элементарных квантовых состояний. Вопрос о том, действительно ли макроскопическая система может побывать во всех без исключения состояниях с данной энергий, являлся предметом обсуждения физиков и математи- математиков в течение целого ряда лет. Системы, могущие в течении достаточно большого промежут- промежутка времени побывать в любом состоянии данной энергии, полу- получили название эргодных систем. Если в начальный момент вре- времени эргодная система находится в некотором состоянии, то рано или поздно она попадет в любое другое, заранее выбран- выбранное состояние из данной группы состояний (эргодическая гипо- гипотеза). Хотя это предположение кажется весьма правдоподоб- правдоподобным, его доказательства не существует. Трудности, возникаю- возникающие в связи с этой гипотезой, обходятся в квантовой статистике путем рассмотрения идеализированных систем, у которых пере-
$ 15] ВЕРОЯТНОСТЬ СОСТОЯНИЙ СИСТЕМЫ 391 ходы в некоторые из состояний не осуществляются в силу пра- правил запрета. Под правилами запрета понимаются некоторые ограничения возможности переходов, происходящих от разно- разнообразных причин, в которые мы не можем здесь вникать1). Тогда все микроскопические состояния можно разделить на две группы — такие состояния, между которыми возможны пере- переходы, и состояния, в которые системы из состояний первой группы попасть не могут. Если вторая группа состояний дей- действительно совершенно запрещена, то состояния этой группы при рассмотрении свойств системы можно считать вообще не •существующими. Наоборот, во всех состояниях первой группы система рано или поздно побывает. В действительности подобных идеализированных систем в природе не существует. Между любыми состояниями системы возможны и более или менее вероятны переходы. Вероятности этих переходов могут быть различными и отличаться друг от друга очень существенно. Представим себе, например, что мы рассматриваем систему, состоящую из атомов, могущих нахо- находиться в различных состояниях и взаимодействовать между собой. Тогда принципиально не исключено, что в результате этого взаимодействия в системе произойдут самые разнообраз- разнообразные процессы, если только они не противоречат основным зако- законам движения; например, часть атомов может получить энер- энергию от других атомов и перейти в ионизованное состояние. Однако подобные процессы происходят со столь ничтожной ве- вероятностью и идут поэтому так медленно, что при рассмотре- рассмотрении поведения системы в течение любого практически осуще- осуществляемого в земных условиях промежутка времени возмож- возможность этих процессов мы вправе полностью игнорировать. Ту же мысль можно выразить следующими словами: переход системы в состояние, соответствующее оголенным ядрам и сво- свободным электронам, является запрещенным и следует рассма- рассматривать только состояния системы, состоящей из атомов. Поскольку нашей целью является вычисление средних значе- значений, а вклад в них маловероятных состояний весьма мал, мы не совершим заметной ошибки, если будем полностью игнори- игнорировать возможные (но маловероятные) переходы в запрещен- запрещенные состояния. Если принять, что между остальными незапре- щенньши состояниями возможны любые переходы и система побывает за достаточно большой промежуток времени во всех этих состояниях (в таком ограниченном виде эргодная гипотеза представляется физически достаточно убедительной), то прин- принцип равной вероятности всех микроскопических состояний можно пояснить следующими рассуждениями. ') См. ч. V, § 106.
392 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. lit Предположим, что имеется система, состоящая из частиц, могущих находиться в состояниях 1, 2, ...,»,... с одной и той же энергией. Обозначим через N{ число частиц в i-m состоянии, а через Nh — число частиц в k-м состоянии. Пусть, далее, wifl — вероятность перехода частицы из /-го состояния в k-e. Эта ве- вероятность может быть вычислена по законам квантовой меха- механики. Наконец, пусть 'wm — вероятность перехода из k-vo со- состояния в *-е. В квантовой механике показывается, что все процессы, про- происходящие с отдельными микроскопическими частицами, яв- являются строго обратимыми, так что вероятности прямого перс- хода Wih и обратного перехода Wui всегда равны между собой1). Это — так называемый принцип микроскопической об- обратимости. Число частиц, переходящих из г'-го в k-e состояние- в единицу времени, равно, очевидно, числу частиц Nit находя- находящихся в i-m состоянии, умноженному на вероятность перехода Wa. Число обратных переходов равно соответственно NkWbi- В стационарном состоянии число прямых и обратных перехо- переходов должно быть одинаковым, так как система должна оста- оставаться в среднем в неизменном состоянии: A5,1) но в силу принципа микроскопической обратимости Wut откуда следует, что Ni = Nh. Это рассуждение может быть распространено на все осталь- остальные состояния, между которыми имеются переходы (т. е. и>мФ0). При этом оказывается, что все числа частиц во всех состояниях должны быть равны между собой, а следователь^^ все квантовые состояния равновероятны. Если обратиться теперь к переходам между состояниями си- системы с различной энергией (точнее, с энергией, отличающейся на величину, много большую, чем энергия взаимодействия евз), то можно утверждать, что благодаря незамкнутому характеру системы она имеет возможность совершать и эти переходы. При переходах в состояния с большей энергией нехватка энергии будет черпаться системой от ее окружения; при пере- переходах в состояния с меньшей энергией избыток энергии будет передаваться этому окружению. Принципиальная возможность таких переходов обеспечивается существованием взаимодей- взаимодействия. Именно взаимодействие является причиной переходов си- системы из одних состояний в другие. Эти рассуждения являются обобщением принципа молекулярного хаоса, которым мы поль- пользовались в кинетической теории газов. Нужно, однако, подчерк- подчеркнуть, что приведенное рассуждение является скорее физически ') См. ч. V, § 56.
$ 16] РАСПРЕДЕЛЕНИЕ ГИББСА 393 правдоподобным, чем строго обоснованным. Поэтому эргодная гипотеза должна быть принята как некоторый постулат, спра- справедливость которого доказывается сравнением теории с опытом. Во всяком случае для статистики достаточно, чтобы эта гипо- гипотеза выполнялась приближенно для большинства состояний. § 16. Распределение Гиббса Поставим теперь вопрос о том, какова вероятность wt найти нашу систему в состояниях с энергией, заключенной между ei и 8j + 6e< (где 6бг<Се* и индекс i пробегает ряд значений 1, 2, 3, ...). Каждому значению энергии е< отвечает некоторая группа Q(e,) квантовых состояний. Рассмотрим прежде всего случай замкнутой системы, кото- которая не взаимодействует с окружающими телами. В действитель- действительности в природе не может существовать совершенно замкиутых систем. Какова бы ни была физическая природа системы, она всегда, хотя бы и очень слабо, взаимодействует с окружающими ее телами. В квантовой механике показывается, что при этом система может иметь строго постоянную энергию только тогда, когда она находится в основном состоянии (что для макроско- макроскопической системы отвечает состоянию при абсолютном нуле; см. § 34 ч. V). Под замкнутой системой мы поэтому условно будем пони- понимать такую систему, энергия которой за все время наблюдения остается заключенной в заданных узких пределах бе;. Поскольку все состояния с данной энергией равновероятны, вероятность того, что замкнутая система находится в одном из состояний с данной энергией, будет просто пропорциональна числу состояний с данной энергией: A6,1) Формула A6,1) получила название микроканонического рас пределения Гиббса. Микроканоническое распределение показьь Бает, что вероятность нахождения замкнутой системы в одном из состояний с данной энергией пропорциональна кратности его вырождения. Микроканоническое распределение Гиббса является прин- принципиальной основой статистической физики. Оно показывает, что замкнутая система находится с большей вероятностью в та- таком состоянии, которое имеет большую кратность вырождения. В фазовом пространстве состояния замкнутой системы, ле- лежащие в узком интервале бе, образуют весьма тонкий слой, ко- который при 6е->-0 вырождается в поверхность постоянной энер- энергии. Каждому возможному квантовому состоянию отвечает клетка в слое (поверхности) постоянной энергии.
394 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. ИГ В виде примера применения микроканонического распреде- распределения рассмотрим систему из N невзаимодействующих между собой частиц, могущих находиться в двух различных состоя- состояниях. Для определенности мы будем говорить о частицах со спином половина (в единицах •%— ). При этом проекция спина каждой частицы на произвольную ось может принимать два значения: s» = -5- и s, = — w- Условно мы будем называть эти спины направленными соответственно вверх и вниз. В отсут- отсутствие внешнего магнитного поля энергия системы не зависит от ориентации спинов частиц, а также суммарного спина 5 =2s системы. Поэтому данному значению энергии системы е будет отвечать множество различных ее состояний, отвечаю- отвечающих разным ориентациям спинов отдельных частиц. Согласно сказанному выше, все состояния, отвечающие дан- данному распределению ориентации спинов, являются равнове- равновероятными. Применим формулу A6,1) к нахождению вероятности того, что система из iV независимых частиц будет иметь суммарный спин S. Полный спин системы 5 равен, очевидно, s(N] — N2) = = sn, где Ni и N2 — числа частиц со спином, ориентированным вверх и вниз соответственно, и n=Ni — N2. Поскольку Ni + N2 = = h, то суммарному спину S отвечает —^— частиц со спином, направленным вверх, и —~-^- частиц со спином, направленным вниз. Найдем число Q(n) независимых размещений —^~ ча~ стиц с одной ориентацией спина и —~— частиц с другой ориен- ориентацией спина при заданном полном числе частиц N. Каждое из таких размещений приводит к одному из равно- равновероятных состояний системы, так что вероятность интересую- интересующего нас состояния со спином S равна, согласно A6,1), w N независимых частиц можно расположить в данном порядке N\ способами. Перестановка между собой частиц с одной и той же ориентацией спина, т. е. —д-^- частиц со спином вверх и —^— частиц со спином вниз, не изменяет общего спина. Число таких перестановок равно!—<рг и (—i/'" Поэтому число состояний системы со спином S равно числу таких независимых размещений N частиц между двумя состояниями, при которых
4 16] РАСПРЕДЕЛЕНИЕ ГИББСА 395 из них находятся в первом состоянии (со спином вверх) DM СОСТОЯ* w ~ Q (я): и —к— во втором состоянии (со спином вниз). Соответственно, Для получения более наглядной формулы можно восполь- воспользоваться формулой Стирлинга (см. приложение IV) и предпо- предположить, что n<^N. Тогда, логарифмируя, имеем *** In w = In N1 — In ^—2~ I! — In ^—g—)! .... N N + n , N + n N-n , N-n ~JVIn-Inln или Мы пришли к вероятности состояния, выражаемой гауссов- ским распределением. Коэффициент пропорциональности может быть найден из условия нормирования. Очевидно, что наиболее вероятным состоянием является состояние с п = 0, т. е. состоя- состояние, в котором числа спинов, ориентированных вверх и вниз, равны между собой. Это состояние является аналогом состоя- состояния молекулярного хаоса в газе. Распределение вероятностей имеет тем более резкий максимум в точке п = 0, чем больше полное число частиц в системе. Как мы подчеркнули уже ранее, микроканоническое распре- распределение Гиббса, устанавливающее вероятность данного состоя- состояния замкнутой системы, имеет основное принципиальное значе- значение. На практике, однако, значительно чаще приходится иметь дело не с замкнутыми системами, а с подсистемами, находя- находящимися в термостате. Поэтому мы перейдем к рассмотрению таких подсистем. Подсистема и термостат вместе образуют замкнутую систему, энергия которой (со сделанной выше оговоркой) может счи- считаться постоянной ? = const. Нас интересует, однако, не распределение вероятностей для сложной системы, а распределение вероятностей для подси- подсистемы (при любом рспределении вероятностей для термостата). Для нахождения его необходимо учесть своеобразный характер взаимодействия между подсистемой и термостатом.
396 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ (Гл. III Как было указано выше, это взаимодействие является сла- слабым, так что энергией взаимодействия в полном энергетическом балансе можно пренебречь, написав последний в виде Е = Е^ + et- = почти постоянная, A6,2) где Е^ — энергия термостата, находящегося в fe-м состоянии, ы — энергия подсистемы, находящейся в г-м состоянии, и слова «почти постоянная» подчеркивают тот факт, что в законе сохра- сохранения энергии A6,2) опущены члены, выражающие взаимодей- взаимодействие между подсистемой и термостатом, а также между слож- сложной системой и окружающими телами. Пренебрежение энергией взаимодействия между системой и термостатом означает, что мы можем считать квазизамкнутую систему и термостат независимыми системами в течение подав- подавляюще большой части времени. Подсистема может находиться в любом из Q(e,) состояний с энергией е,, а термостат — в любом из Qo(?lO)) состояний с энергией Е^К Изменение состояния подсистемы никак не влияет на со- состояние термостата и, наоборот, изменение состояния термо- термостата не влияет на состояние системы, если указанные переходы не выводят систему из группы состояний с энергией е<, а термо- термостат соответственно из состояний с энергией Е(°\ С другой сто- стороны, в силу закона сохранения энергии A6,2) энергии термо- термостата и подсистемы однозначно связаны между собой. Если система обладает энергией е;, то термостат обязательно имеет энергию ?*0). После всех этих замечаний мы можем перейти к нахожде- нахождению интересующей нас вероятности того, что подсистема нахо- находится в одном из состояний с энергией ег. В силу последнего замечания эта вероятность ш,- равна ве- вероятности того, что сложная система (подсистема + термостат) находится в таком состоянии, когда подсистема имеет энергию 6i, а термостат — энергию Е^- Поскольку до* есть вероятность данного состояния замкнутой системы, она выражается через число состояний по формуле A6,1): A6,3) С другой стороны, число состояний замкнутой системы, со- состоящей из двух независимых частей, равно произведению числа состояний обеих частей, т. е. . A6,4)
5 16] РАСПРЕДЕЛЕНИЕ ГИББСА 397 При этом в выражении для числа состояний термостата Qo мы написали в качестве аргумента выражение Е— е* на основании A6,2). Подставляя выражение A6,4) в A6,3), находим о>,~?20(?-е,)Ще,). A6,5) Весьма слабое взаимодействие между системой и средой слу- служит причиной переходов системы из одного состояния в другое. Поскольку размеры термостата весьма велики по сравнению с размерами системы, мы можем считать, что его энергия Ei при всех значениях k также весьма велика по сравнению с энер- энергией последней. Поэтому, каковы бы ни были изменения энергии системы, энергию термостата можно считать почти неизменной. Все различные состояния, в которых оказывается термостат, ко- когда система переходит из одних энергетических состояний в другие, можно считать принадлежащими к одной и той же энергии. Благодаря этому мы можем разложить Qo(? — et) в ряд по степеням малой величины ег- и ограничиться первым членом разложения. Нужно, однако, заметить, что разлагать в ряд по степеням непосредственно саму функцию Qo(?— е;) нельзя. Действительно, мы знаем, что число состояний является мульти- мультипликативной функцией, а энергия — аддитивной функцией. Число состояний системы, составленной из независимых частей, равно произведению числа состояний этих частей, а энергия равна сумме соответствующих энергий. Если бы мы разложили ?1о(Е — е*) в ряд по степеням малой величины ei, то мы полу- получили бы выражение Qo(E-ei)^Q0(E)-^-Bi, A6,6) которое не обладает требуемыми свойствами. Если бы, напри- например, мы рассмотрели две системы с числом состояний Qo* и Qq2) и энергиями [?A) — е1!)] и [?<2) — е<2)], то число состояний должно было бы равняться Ц,° ' Qo2>> а энергия - [?»> - е<'> + ?<2> - ef»] Между тем при перемножении левых частей разложения B0,6) • правые части не перемножаются. Поэтому прежде чем разлагать число состояний Qo(E — е,) в ряд, представим его в виде Q0(E-ei) = ea(E-E'), A6,7) где а(Е — е,)—новая функция аргумента (Е — е*). Такое пред- представление всегда возможно, поскольку по самой своей природе число состояний — существенно положительная величина, зна- значения которой заведомо не меньше единицы.
398 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. III Написав а{Е — е*) в виде а(Е— е1) = \ппо(Е— г{), A6,8) мы видим, что о(Е — 8i), подобно энергии, является аддитивной функцией. Разлагая а(Е — et) в ряд по степеням малой величины et и ограничиваясь первым членом, имеем да е( где через 9 обозначена величина е-D!г).г„- A6>9) Тогда для Q0(E — е4) находим -Л. О (Р —• Р ^ 5^: Р® {Е)о в (\ (\ \ С\\ Нетрудно видеть, что A6,10) удовлетворяет указанному требо- требованию мультипликативности Q при сложении энергий независи- независимых систем. Подставляя выражение A6,10) в A6,5), имеем Wi = const e"TQ (e,), A6,11) где под const подразумевается произведение коэффициента про- пропорциональности и величины еа<Е>, не зависящее от значения ?,- и свойств подсистемы. Формула A6,11) определяет вероятность того, что некоторая система, представляющая малую слабо взаимодействующую часть некоторого собрания (ансамбля) произвольных физиче- физических систем, будет находиться в одном из й(е*) состояний с энергией, лежащей между е* и е^ + бе;, а термостат — в одном из состояний с энергией, лежащей между ? — е, и Е — (e, + 6et). Поскольку состояние термостата не представляет интереса, для краткости мы будем говорить, что иу, является вероятностью того, что подсистема находится в одном из состояний с энер- энергией е<. Из определения вероятности вытекает, что должно иметь место следующее условие нормирования: 2«»| = 1. A6,12) где суммирование ведется по всем возможным квантовым со- состояниям системы.
$ 16] РАСПРЕДЕЛЕНИЕ ГИББСА 399 Из условия нормирования и вида Wi сразу вытекает, что введенный формально коэффициент 6 является существенно по- положительной величиной. Только в этом случае вероятность со- состояний сколь угодно больших энергий оказывается стремящейся к нулю, как это и должно быть по самому смыслу понятия фи- физической вероятности и следует формально из условия норми- нормирования. Постоянная в A6,11) может быть найдена из условия нормирования. Подставляя A6,11) в A6,12), находим const Поэтому распределению вероятностей можно придать оконча- окончательный вид: (.6.13) К) Распределение A6,13) является искомым распределением и послужит основой для всего дальнейшего изложения. Оно было впервые найдено Гиббсом в 1901 г. для систем, подчиняющихся законам классической механики. Это распределение получило название распределения Гиббса или канонического распреде- распределения. Переход от квантовых систем, обладающих дискретным набором уровней энергии, к классическим системам не пред- представляет труда и будет сделан в одном из следующих парагра- параграфов. Входящая в распределение Гиббса величина 0 получила название модуля распределения, или статистической темпера- температуры. Распределение Гиббса описывает распределение вероятно- вероятностей различных состояний подсистемы, составляющей малую квазинезависимую часть произвольной системы, находящейся в состоянии статистического равновесия. Подчеркнем, что если система не находится в состоянии равновесия, то все предыду- предыдущие рассуждения теряют силу. В неравновесной системе непри- неприменим принцип равной вероятности состояний с данной энергией. _IL Сумма 2е 9 Ще<)» стоящая в знаменателе A6,13), будет играть большую роль в дальнейшем. Мы введем для нее спе- специальное обозначение Q(et) A6,14)
400 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. III и назовем ее функцией состояний, поскольку все состояния си- системы вносят в нее свой вклад. В литературе она обычно име- именуется суммой по состояниям, или статистической суммой. Однако эта терминология кажется нам не совсем удачной. С введением функции состояний распределение Гиббса можно записать в виде wt = ~e eQ(8/). A6>15) Распределение Гиббса для какой-либо конкретной физиче- физической системы можно считать известным, если известны уровни энергии системы, т. е. возможные значения энергии е;, и крат- кратность вырождения состояний системы, т. е. числа различных состояний Q(et), отвечающих данному значению энергии е*. Для ряда систем, которые будут рассмотрены ниже, можно найти эти физические характеристики. Замечательной особенностью распределения Гиббса является то, что в нем никак не фигурирует механизм взаимодействия подсистемы со средой. При помощи распределения Гиббса можно вычислить сред- среднее значение любой величины, зависящей от состояния системы. Если L(e,)—значение некоторой физической величины для со- состояний, отвечающих энергии е,-, то по общим законам нахож- нахождения среднего значения можно написать 0™ ¦ A6,16) § 17. Статическая температура Рассмотрим прежде всего свойства введенного нами модуля распределения 9. Из самого определения его следует, что он характеризует свойства всего собрания систем — термостата, а не выделенной нами подсистемы. Действительно, в формуле A6,9) фигурируют только величины, относящиеся ко всему со- собранию подсистем, — его энергия Е и функция о, значение (-з—1 которой берется при е, = 0, так что а=а(Е). Поэтому модуль 0 всегда относится к макроскопической системе и является функ- функцией состояния этой системы. При изменении состояния, в част- частности, энергии всей системы, изменяется модуль распределения 8. Поскольку функция а, определенная по формуле A6,8) и представляющая логарифм числа состояний с данной энергией, является однозначной функцией состояния (энергии) системы,
§ 17] СТАТИСТИЧЕСКАЯ ТЕМПЕРАТУРА 401 6 также является однозначной функцией энергии или состояния системы. Далее, модуль распределения 0 является величиной суще- существенно положительной. Действительно, если энергия системы е,- может принимать любые как угодно большие значения, то вероятность состояния с данной энергией е; должна умень- уменьшаться с ростом энергии. Если бы это было не так, условие нормировки A6,12) не смогло бы выполняться. Согласно сказанному, 9 может относиться только к макро- макроскопической системе и является существенно положительной однозначной функцией ее состояния. Покажем, что модуль рас- распределения является характеристикой состояния равновесия в системе. Для этого рассмотрим две подсистемы, принадлежащие к разным системам, имеющим модули распределения 9i и 8г- Каждую из подсистем будем считать находящейся в состояни-и статистического равновесия, так что вероятности их состояний определяются формулой A6,11): е, Предположим, что обе подсистемы приводятся в слабое взаимодействие, так что между ними может происходить обмен энергией. Обе взаимодействующие подсистемы можно считать одной объединенной подсистемой. Если последняя оказывается в состоянии статистического равновесия, то распределение ве- вероятностей ее состояний также должно описываться законом вида е. w = Ae~~»Q. A7,1) С другой стороны, поскольку взаимодействие является сла- слабым, энергией взаимодействия можно пренебречь и считать каждую из подсистем квазинезависимой. Тогда для нахождения распределения вероятностей сложной системы можно восполь- воспользоваться теоремой умножения и написать w = tt>iffi>2 = Л]Л2е °' е e'QlQ2. A7,2) Для того чтобы распределение A7,2) тождественно совпадало с A7,1), необходимо, чтобы Таким образом, если привести во взаимодействие две равновес- равновесные подсистемы с равными модулями 61 = 92, то получится ?6 В. Г. Левич, том I
402 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл lit объединенная равновесная система с тем же модулем G = 9i = Ог- Если бы 6i было отлично от бг, то при установлении взаимодей- взаимодействия возникла бы система с распределением вероятностей, вы- выражаемым формулой A7,2). Это распределение не является распределением Гиббса для системы с энергией е=е| + ег. По- Поэтому образовавшаяся при О^бг система не будет находиться в состоянии равновесия. Равновесное состояние не нарушается при установлении взаимодействия между подсистемами, если их модули 8i и бг равны между собой, и нарушается, если вв Именно поэтому величина 8 получила название статистиче- статистической температуры. В том случае, когда подсистема содержит настолько большое число частиц, что ее можно считать макро- макроскопической, можно также говорить о ее собственной статисти- статистической температуре. Температура ее определяется из условия равновесия подсистемы и термостата и, следовательно, равна температуре последнего. Для краткости можно поэтому назы- называть в температурой системы. Само собой разумеется, что если квазизамкнутая подсистема содержит недостаточно большое число частиц, то понятие ее температуры становится приближенным и в случае подсистемы, единичной молекулы идеального газа, вообще теряет смысл. Значение статистической температуры определяется по фор- формуле (Гб,9) и зависит от энергии системы Найти вид этой за- висимвети в общем случае невозможно, так как она опреде- определяется конкретными свойствами системы. На практике, однако, интересуются не зависимостью 0 от Е, а обратной зависимостью энергии от температуры Е—Е@). В дальнейшем мы увидим, что энергия является монотонной функцией температуры. Кон- Конкретный вид зависимости энергии от температуры 6 будет нами найден для некоторых простейших систем (газ, идеальный кри- кристалл и т. д.). § 18. Свойства распределения Гиббса и статистическое равновесие Распределение Гиббса характеризует распределение вероят- вероятности различных состояний квазизамкнутой системы. Условием применимости распределения Гиббса служит выполнение сле- следующих требований: 1) наличие некоторой макроскопической системы, состав- составляющей окружение рассматриваемой системы (термостат); 2) наличие слабого взаимодействия между системой и термо- термостатом. В остальном свойства системы являются совершенно произ- произвольными.
18] РАСПРЕДЕЛЕНИЕ ГИББСА И СТАТИСТИЧЕСКОЕ РАВНОВЕСИЕ 403 Распределение Гиббса, так же как и распределение Макс- Максвелла по энергиям, имеет максимум при некотором значении энергии. На первый взгляд существование этого максимума не очевидно: в распределении Гиббса фигурирует экспоненциально убывающий множитель е е . Нужно, однако, помнить, что число состояний с данной энер- энергией Q(e,) быстро растет с энергией системы. Чем больше ча- частиц содержит система, тем больше состояний Q(e,) отвечает данному значению интервала энергии еь e, + 6et. Поэтому рост Q(e,) с энергией происходит тем быстрее, чем больше частиц в системе. Как будет, например, показано в § 20, если подсисте- подсистемой является газ, состоящий из iV независимых одноатомных молекул, заключенный в сосуд с постоянной температурой (термостат), то Q(e)~e 2 . Произведение двух функций, — быстро убывающей с энер- энергией и быстро возрастающей, приводит к возникновению у рас- распределения Гиббса резкого максимума. Этот максимум яв- является тем более резким, чем круче растет Q(e,), т. е. чем больше частиц в системе. На том же примере мы увидим, что если система является макроскопической, так что в ней со- содержится огромное число частиц, то степень размытости максимума совер- совершенно ничтожна. Он является столь режим, что изобразить графически без искажения масштаба распределе- распределение Гиббса не представляется возмож- е'шнс е ным Это означает, что вероятность на- Рис 41 хождения системы в состояниях с энергией, заметно отличающейся от энергии ен в =" емакг, отве- отвечающей максимуму распределения Гиббса, ничтожно мала (рис. 41). Подавляюще большую часть времени наблюдения си- система проводит в состояниях с энергией, весьма близкой к послед- последней. Состояние, отвечающее максимуму распределения Гиббса, является наиболее вероятным. Наиболее вероятное состояние бу~ дет вносить основную долю в среднее значение величин, характе- характеризующих систему (например, энергию). Это следует из самого определения понятия среднего: в величину среднего каждое со- состояние вносит долю, пропорциональную своей вероятности. Поэтому в случае макроскопической системы функция со- состояний Z может быть представлена в следующем виде: -1L _елл 1 Z = 2> 9Ще,)~е'и Q (еи. в) « е~ 9 Q (в), A8,1) 26*
404 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл III где в сумме по состояниям оставлен только один, самый боль- большой член, относящийся к наиболее вероятной энергии. При этом мы воспользовались приближенным равенством наиболее ве- вероятной и средней энергий в макроскопической системе. Аналогично для среднего значения любой величины L можно написать I = 2 L (et) w (е.) « L (ен в) ~ L (ё), A8.2) т. е, состояние с е = еп в осуществляется с вероятностью Ц>(еПв)~1, а вероятность нахождения в остальных состояниях ет^ен в близка к нулю. Среднее значение всех величин будет близко к их наиболее вероятному значению. Это относится, в частности, и к энергии системы ё *« е„. в. Такой результат нахо- находится в полном согласии с общими выводами, сделанными в § 5 о свойствах систем, содержащих большое число частиц. Истинные значения всех величин близки к средним их значе- значениям, последние же близки к наиболее вероятным. Наличие у распределения Гиббса резкого максимума пред- представляет конкретное проявление общих свойств систем с боль- большим числом частиц, рассмотренных в § 3. Системы, находящиеся в таком состоянии, в котором истин- истинные значения характеризующих их величин близки к средним, называются системами, находящимися в состоянии статистиче- статистического равновесия. Мы видим, таким образом, что всякая макроскопическая квазизамкнутая система, описызаемая распределением Гиббса, находится в течение большей части времени наблюдения в со- состоянии статистического равновесия. § 19. Переход к классической статистике В большинстве случаев нам придется иметь дело с системами» у которых уровни энергии настолько сближаются между собой, что их можно считать непрерывно распределенными. Тогда со- совокупность дискретных значений уровней энергии ei, го, ... ..., е„ ... можно заменить непрерывной функцией е Иными словами, от квантового описания системы мы перейдем к ква- квазиклассическому в том смысле, как это было пояснено в § 1. Из распределения Гиббса вытекает, что для замены ступен- ступенек в чатой функции е е плавной функцией е е необходимо, чтобы размеры ступенек, т. е. расстояния между уровнями Аег = = e,+i — е,, были малы по сравнению со значением 0. Таким об- образом, переход к квазиклассической статистике должен насту- наступать при прочих равных условиях в области высоких темпера- температур. К последнему утверждению мы будем неоднократно воз»
S 19] ПЕРЕХОД К КЛАССИЧЕСКОЙ СТАТИСТИКЕ 40S вращаться в дальнейшем. Применение классического способа рассмотрения является очень важным и часто встречается на практике, поскольку у всякой макроскопической системы в обыч- обычных условиях энергетический спектр является почти непре- непрерывным. Статистическая физика систем, подчиняющихся классиче- классической механике, называется классической статистикой. В классическом приближении мы должны заменить дис- дискретный набор вероятностей различных состояний непрерывным распределением. Состояние системы из N частиц, имеющей 3N степеней свободы, в квазиклассическом приближении опреде- определяется значением координат qu q<i qZx и pit р2, ..., Рздг- Энергия системы е(р, q) выражается как непрерывная функция всех координат и импульсов. Поскольку энергия в классическом приближении может считаться непрерывной функцией, распре- распределение вероятностей различных состояний системы также выра- выражается непрерывной функцией. Именно, в классическом при- приближении можно указать вероятность dw того, что система об- обладает энергией, лежащей между г(р, q) и е(р, </)+de(p, q). Согласно A,26) энергии, лежащей в этом интервале, отвечает число состояний dQ, равное dQ = -^—^-, где N — число частиц в подсистеме. В классическом приближении распределение Гиббса можно написать в виде A9,1). При этом функция состояний системы, согласно A6,14), может быть написана в виде Отличие A9,2) от A6,14) состоит в том, что вместо суммиро- суммирования в классической формуле для Z производится интегриро- интегрирование. Часто Z именуют статистическим интегралом Интегриро- Интегрирование в A9,2) ведется по всему фазовому пространству, до- доступному для системы, т. е. по всем дозволенным значениям координат и импульсов. Какие именно значения координат и импульсов являются дозволенными, зависит от конкретных свойств системы и условий, в которых она находится.
406 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. ИГ Подставляя A9,2) в A9,1), имеем дк е di dT При такой записи ясно, что постоянная Планка выпадает из классического распределения Гиббса dw, как это и следовало ожидать. Часто классическое распределение Гиббса представ- представляют в виде A9,4) где р(р, q) —нормированная плотность вероятности: е (р, I?) jl. A9,5) I в При этом dw представляет вероятность данного состояния си- системы, т. е. вероятность того, что изобразительная точка системы находится в элементе фазового пространства. Иными словами, dw представляет вероятность того, что си- система находится в состоянии, в котором ее импульсы и коорди- координаты заключены в интервалах ри pi+dp^; ... p3.v> Psw + ^PavJ qu qi + dqu ... q3N, q3v + dq3W. Рассмотрим, в частности, случай, когда квазизамкнутой под- подсистемой является отдельная молекула в идеальном газе. При этом энергия подсистемы е(р, q) представляет энергию этой молекулы. Наша подсистема при М=\ будет иметь три степени свободы. Соответственно ее фазовое пространство будет шести- шестимерным. Элемент фазового объема dT будет иметь вид dY — dpx dpv dpz dx dy dz или в сферических координатах для импульсов, заменяя для краткости dx dy dz элементом объема dV: dT = p2dpsinQdQdydV. Если внешнее поле сил отсутствует, то энергия молекулы сво- сводится к ее кинетической энергии, в^1) = щ-
в 14] ПЕРГ.ХОД К КЛАССИЧЕСКОЙ СТАТИСТИКЕ 407 и не зависит от направления ее движения (углов G и ср) и поло- положения в сосуде. Поэтому энергии, лежащей в интервале между е и e + de, отвечает число состояний, равное р2 dp f dV dQ = Sift5 Вычисление -^- дает J si ,„ AnVmkV2k . ail = г, ae. Таким образом, распределение Гиббса для одной молекулы имеет вид dw=—-^—e ey2erfe, A9,6) где z — функция состояний отдельной молекулы. Сравнение A9,6) с распределением Максвелла по энергиям (9,5) убеждает нас в их совпадении, если только отождествить статистическую температуру 0 с величиной kT. Подчеркнем, что абсолютная температура, фигурирующая в распределении Максвелла, отно- относится не к отдельной молекуле (подсистеме), но ко всему газу (термостату). В §26 мы покажем, что эта связь между 8 и 7* имеет общий характер. На первый взгляд может показаться, что постоянная нормирования в распределении Максвелла от- отличается от постоянной нормирования в A9,3).. В частности, она не содержит постоянной Планка ft. В действительности, однако, это не так. Чтобы убедиться в этом, напишем явное выражение для г: | dV 4лУт f I о Поэтому A9,8) Таким образом, постоянная Планка исчезает из распределе- распределения, и константы в A9,8) и (9,5) совпадают. Клк мы подчеркивали в предыдущем параграфе, распреде- распределение Гиббса имеет весьма резкий максимум при некотором значении энергии. Это утверждение на первый взгляд противо- противоречит пологому максимуму распределения Максвелла. Нужно,
408 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. III однако, иметь в виду, что резкий максимум в распределении Гиббса возникает в результате конкуренции экспоненциально убывающего множителя expl — 4-У и растущего множителя злг Q(e). Последний растет как е 2 или как е''! в случае N==1. Поэтому при N!» 1 функция-т^- меняется быстро и возникает резкий максимум, а при N=1 она растет сравнительно мед- медленно и максимум у распределения оказывается пологим. Если квазиклассическая подсистема содержит очень боль- большое число частиц, то интеграл по состояниям, фигурирующий в формуле A9,2), имеет весьма резкий максимум при значении энергии 8Маг<о~е. т. е. в области состояний, отвечающих ста- статистическому равновесию системы. В этом случае аналогично A8,1) можно написать: 7 .=p-4-*i лл'у h6 где ДГ — объем той области фазового пространства, которая соответствует состоянию статистического равновесия, т. е. е~ен. в- Очевидно, что число состояний, отвечающих статистиче- статистическому равновесию системы, равно A9,10) § 20. Одноатомный газ как целое Описанные в § 18 и 19 свойства распределения Гиббса можно яснее всего разобрать на конкретном примере. Представим себе, что мы захотели бы весь газ в целом, по- помещенный в сосуд объема V, рассматривать как одну-един- ственмую квазизамкнутую систему. Если стенки сосуда яв- являются непроницаемыми для молекул, но могут обмениваться энергией с газовыми молекулами, то стенки сосуда и тела, окру- окружающие сосуд с газом, образуют термостат. Весь сосуд с газом можно характеризовать определенной температурой 9, равной температуре окружающих тел. Можно считать, что размеры последних и их энергия весьма велики по сравнению с энергией газа. Мы видим, что все условия применимости распределения Гиббса к газу как целому налицо, и для всего газа как целого можно написать это распределение. Будем считать газ одно- одноатомным и предполагать, что внешнее поле сил отсутствует. Тогда энергия газа равна сумме кинетических энергий всех
i 20] ОДНОАТОМНЫП ГАЗ КАК ЦЕЛОЕ 409 входящих в него частиц. Последняя дается классическим выра- выражением и изменяется непрерывно. Пусть в газе содержатся N молекул с массой т. Состояние системы полностью характери- характеризуется заданием координат и импульсов всех молекул qh q2, ..., q3N; ри р2, ..., p3,v- Фазовое пространство системы имеет 6Л' измерений. Элемент фазового пространства dY равен произведению дифференциалов всех импульсов и координат dV = dPl ... dp3N dq, ... dq^. B0,1} Энергия системы зависит только от импульсов молекул и мо- может быть написана в виде ^Р^) = ^Г1{р\ + Р\ + ••• +Рк)- B0,2) Для написания распределения Гиббса нужно найти выра- выражение для числа состояний, отвечающих энергии системы, ле- лежащей между е и e + de. По общей формуле A,26') имеем dQ = -4v— de. B0,3) h дг Распределение Гиббса для газа как целого имеет вид Г р2, + р1+ ... -t-pivl or - ^—^ ^ — de. L 2mO J де dw = -таг- exp - ^—^ ^ — de. B0,4) Найдем величину-д—. Объем части фазового пространства, в котором энергия газа не превышает е, равен, по определению, Г = J dpx ... dp3iydqi ... dq3N. B0,5) В формуле B0,5) пределы интегрирования определяются так, чтобы выполнялось условие +*" <*.<)¦ B0,6) Последнее условие не включает координаты молекул, по кото- которым можно интегрировать непосредственно. Это дает Pl ... dp,N, B0,7) где V= j dqx dq2 dqz — объем всего газа. Формула B0,6) определяет с геометрической точки зрения в пространстве 3N измерений шар, радиус которого равен R = У2тг. Тогда интеграл в B0,7) представляет объем этого шара. Зависимость объема шара Ш измерений от его ра- радиуса можно найти из соображений размерности. Именно, он должен быть пропорционален радиусу в степени, равной числу
410 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. III измерений. В трехмерном пространстве он пропорционален R3, в ЗЛЛмерном — Rm. Поэтому B0,7) можно написать в виде злг Г = const • VNRm = const VNe 2 . B0,8) Дифференцируя B0,8), имеем лг 3N i ~ = const • VNs 2 . B0,9) Значение постоянной в B0,9) не представляет особого инте- интереса, поскольку она будет сокращаться с такой же постоянной, возникающей при вычислении Z. Поэтому окончательно из B0,4) и B0,9) имеем _? ЗЛ/ ee 2 VNde. B0,10) Функция распределения Гиббса для системы с большим чис- числом частиц N имеет весьма резкий максимум, поскольку множи- 3.V д 3N тель б 2 и е 2 весьма быстро возрастает с ростом е, а мно- е житель е е, напротив, резко убывает. Найдем положение, ши- ширину и высоту этого максимума. Максимум выражения B0,10) достигается в точке, опреде- определяемой условием е ЗЛГ 1(» )-*.*-_„ B„,п, Отсюда находим, что условие максимума гласит: 9 +1 2 1)~ или ^макс "н. в I 2 i I "t где eMaitc — энергия в максимуме. Поскольку число частиц N очень велико, единицей можно пренебречь по сравнению с вели- „ злг чиной -у-, и тогда ^ B0,12)
J 20] ОДНОАТОМНЫЙ ГАЗ КАК ЦЕЛОЕ 411 Нетрудно показать, что величина —у- представляет сред- среднюю энергию всего газа. По определению, ё= const • V оо g 3JV е *е2 dB . 3JV »,оо 8 ЗА/ h const .у" f -?„—- К) * lnje ee 2 'rfe. B0,13) Интеграл, входящий в B0,13), вычислен в приложении IV. Вычисление его приводит нас к соотношению B0,14> Сравнивая выражения B0,12) и B0,14), мы видим, что наибо- наиболее вероятная энергия лежит весьма близко к средней. Если N достаточно велико, то эти энергии можно отождествить друг с другом с большой степенью точности. Таким образом, подав- подавляюще большую часть времени подсистема (идеальный газ) на- находится в состоянии, в котором ее энергия равна средней энер- энергии ё. Этим свойством не обладает подсистема, содержащая мало частиц; например, у одной молекулы различие между средней и наиболее вероятной энергией сравнительно велико. Для того чтобы представить себе, насколько резким является максимум в распределении Гиббса, т. е. как часто подсистема может попадать в состояния с энергией, отличной от наиболее вероятной емакс, найдем вид функции распределения вблизи максимума. Вблизи максимума, когда разность е — еыакС мала, функцию распределения можно разложить в ряд по степеням е — емакс и ограничиться первыми членами разложения. Если обозначить через f функцию распределения (отвлекаясь от не- несущественной константы), то 31V где
412 СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [Гл. III Поскольку в точке е = 8мако функция распределения f, а стало быть, и функция ф, имеют максимум, для <р(е) можно вблизи этого максимума написать разложение <р (е) « ф(е„акс) + {-^-} (e - емакс) + е=емакс Ф (вмме) + 4- (-S) (е - емаксJ. Нетрудно показать, что и, следовательно, Т1' макс __ е^ 2 ' е макс Таким образом, распределение вероятностей вблизи точки максимума имеет вид -(—-l)(e-eMaKCJ ^ -ф _W (_ ф dw=* const -щ-е е е^ак2с U »акс rfe. B0,15) Зависимость распределения вероятностей от расстояния .до мак- максимума (е — еМакс) характеризуется вторым экспоненциальным множителем в B0,15). Он представляет собой симметричную функцию типа СУП Г (е ~ емаксJ I ехР[ 26* J' ГДе емакс /JV У~г~х Величина б представляет ширину максимума. При значении (е — емакс) = 6 функция распределения уменьшается в е раз. Относительная ширина максимума равна /?¦-'
$20] ОДНОАТОМНЫИ ГАЗ КАК ЦЕЛОЕ 413 При значениях N, отвечающих числу молекул в макроскопиче- макроскопическом объеме (N^\019), ширина максимума распределения Гиббса оказывается чрезвычайно малой. Это означает, что рас- распределение Гиббса имеет весьма резкий максимум в точке ?мако- С подавляюще большой вероятностью газ находится в со- состоянии, в котором его энергия равна средней энергии ё. Ве- Вероятность того, что мы найдем 1см3 газа в состоянии с энергией, отличной от ё, например е, равной 99% ё, может быть без труда найдена по формулам B0,15) или B0,16). Она относится к ве- вероятности нахождения в состоянии е = ё как 1 : е 2 = 1 : е10'5. Таким образом, заметное отклонение энергии от среднего значения практически не осуществляется в газе, содержащем большое число частиц. Этот результат находится в полном со- согласии со сказанным в предыдущем параграфе, а также с об- общей теоремой § 5. Сравнивая относительную ширину максимума B©, 16) с определением относительной флуктуации энергии § 5, мы убеждаемся в их полной тождественности.
ГЛАВА IV СТАТИСТИЧЕСКАЯ И ФЕНОМЕНОЛОГИЧЕСКАЯ ТЕРМОДИНАМИКА § 21. Внутренняя энергия макроскопической системы Первое и второе начала термодинамики Располагая аппаратом гиббсовской статистики, мы можем перейти к последовательному построению теории тепловых свойств вещества. Прежде чем перейти к выполнению этой про- программы, необходимо кратко остановиться на истории развития теории тепла. Развитие техники и повсеместное распространение тепловых машин в первой половине XIX века настоятельно требовали развития теории тепловых процессов. Между тем, представле- представления о природе тепла были еще весьма туманными. Физика пер- первой половины XIX века была еще очень далека от построения теории тепловых процессов на основе молекулярных представ* лений. Поэтому развитие теории пошло по весьма своеобраз- своеобразному пути. Экспериментальное установление Джоулем механического эквивалента тепла и неудача всех попыток создания вечного двигателя (perpetuum mobile), с помощью которого можно было бы получать полезную работу без каких-либо изменений в ок- окружающих телах, позволили сформулировать некоторый об- общий принцип, получивший название первого начала термодина- термодинамики. Первое начало термодинамики представляет частный случай закона сохранения энергии в применении к тепловым процессам. Если количество тепла, получаемое системой и выраженное в механических единицах, равно 8Q, то первое начало термоди- термодинамики гласит: 6Q = — (>W + ЬЕ, B1,1) где {— 6W] — механическая работа, которую производят внеш- внешние силы над системой, получающей тепло. Разность 6Q—(—6W) между полученным теплом и произведенной работой представ- представляет часть тепла, затрачиваемую на изменение внутреннего со*
•§21] ПЕРВОЕ И ВТОРОЕ НАЧАЛА ТЕРМОДИНАМИКИ 415 стояния системы. Заметим, что выбор знаков при работе и количестве тепла является условным. Величина Е, представляющая функцию внутреннего состоя- состояния системы, получила название внутренней энергии. При так называемом круговом процессе, при котором система после всех изменений возвращается в первоначальное состояние, алгебраи- алгебраическая сумма всех теплот и произведенной работы равна нулю. Это означает, что при круговом процессе система получает извне столько же тепла и механической работы, сколько и отдает. Отсюда следует, что изменение внутренней энергии системы при круговом процессе равно фсШ = 0. Последнее равенство означает, что внутренняя энергия является однозначной функ- функцией состояния системы. Таким образом, соотношение B1,1) выражает закон сохранения энергии. Его записывают обычно dE = 6Q + 6W. Второе основное положение феноменологической термодина- термодинамики, получившее название второго начала термодинамики, также представляет обобщение результатов многочисленных опытных данных. Второе начало термодинамики гласит, что не- невозможно систематически отнимать тепло от системы и пол- полностью превращать его в работу без того, чтобы в системе или окружающих ее телах одновременно не произошли какие-то дру- другие изменения. Машина, которая, отнимая тепло от тела, систематически превращала бы его в работу, получила название вечного дви- двигателя II рода. Ясно, что если бы такая машина могла быть построена, окружающие нас большие тела, например океаны, служили бы практически неиссякаемым резервуаром работы. Между тем, все попытки создания такого рода машины не увен- увенчались успехом. Таким образом, второе начало термодинамики, как и первое, опиралось на многочисленные и достоверные опытные факты. Ниже будет показано, как из приведенной качественной форму- формулировки второго начала можно перейти к его количественной формулировке. Оказалось, что, опираясь на математические формулировки первого и второго начал термодинамики, можно построить феноменологическую теорию тепловых процессов, по- получившую название термодинамики. Все выводы термодина- термодинамики обладали той же степенью достоверности, что и поло- положенные в их основу первое и второе начала, что делало их со- совершенно бесспорными. В достоверности и общности выводов заключается важней- важнейшее достоинство термодинамических методов исследования. Недостаток их заключается в том, что они не раскрывают
416 ТЕРМОДИНАМИКА [Гл. IV физической, молекулярной сущности тепловых процессов. Поэто- Поэтому построение молекулярной теории тепла и выяснение молеку- молекулярной сущности термодинамических понятий явились важней- важнейшим этапом развития теории тепла и физики в целом. В настоящее время термодинамика и молекулярная теория тепловых процессов — статистическая термодинамика — состав- составляют неразрывное целое. Ниже на конкретных примерах мы будем иметь возможность убедиться в том, что феноменологическая и статистическая тер- термодинамика не противоречат, а взаимно дополняют друг друга. В основу молекулярной теории тепловых свойств вещества мы положим следующее, весьма естественное допущение: «Внутренняя энергия макроскопического тела тождественна со средней энергией ё, вычисленной по законам статистической физики». В дальнейшем мы будем рассматривать тепловые свойства макроскопических систем, содержащих весьма большое число частиц и находящихся в состоянии статистического равновесия. Поскольку в системе, содержащей весьма большое число частиц и находящейся в состоянии статистического равновесия, средняя энергия ё практически точно совпадает с ее истинной энергией, это допущение можно сформулировать иначе: «Внутренняя энергия всякого макроскопического тела пред- представляет энергию теплового движения молекул, из которых по- построено тело». Нужно заметить, что в настоящее время это положение на- настолько обосновано экспериментально и теоретически, что тер- мин «предположение» кажется излишним. Мы считали, однако, не лишним подчеркнуть что отождест* вление средней энергии движения молекул ё с термодинамиче- термодинамической энергией Е является основой дальнейшего изложения. Все другие утверждения, имеющие менее очевидный характер, на- например, статистическая трактовка второго начала термодина- термодинамики, которую мы будем разбирать в следующих параграфах, не требуют для своего обоснования каких-либо новых допуще- допущений или ссылок на опыт, а являются прямым следствием этого единственного допущения. Для фактического вычисления средней энергии системы мы должны воспользоваться общим правилом § 16 (уравнение A6,16)). В применении к энергии оно гласит: - суммирование ведется по всем уровням энергии системы.
§ 22] РАБОТА И ДАВЛЕНИЕ 417 Выражение для средней энергии ё можно переписать в более компактном виде. Именно, из очевидного тождества (-ir '(-i) следует, что е можно написать в виде в(-в) Из формулы B1,2) следует, что для нахождения средней энер- энергии системы достаточно знать ее функцию состояний Z. В силу сделанного нами предположения о тождестве средней и термо- термодинамической энергии системы мы будем всегда писать ' — П2 д 'п ^ /о 1 q\ ¦И) Из приведенных формул следует, что состояние макроско- макроскопической системы, и в частности ее внутренняя энергия, зависит от температуры термостата 6. В состоянии статистического рав- равновесия температура системы равна температуре ее окружения (термостата), так что можно говорить о зависимости энергии тела от его собственной температуры. Внутренняя энергия макроскопической системы обладает важным свойством аддитивности: энергия сложной системы рав- равна сумме энергий ее макроскопических частей. Это утверждение имеет, разумеется, приближенный характер. Оно предполагает, что энергией взаимодействия между частями можно прене- пренебречь. В случае макроскопических частей ею обычно можно пре- пренебречь, поскольку она имеет характер поверхностной энергии (см., впрочем, § 65). § 22. Работа и давление Помимо температуры, состояние тела, находящегося в ста- статистическом равновесии, зависит от внешних условий. Внешние условия, в которых находится тело, определяются значением внешних полей, действующих на тело. Согласно сказанному в начале § 8, объем тела также опре- определяется силовыми полями, действующими на поверхность тела; стенки сосуда представляют поле сил, изображенное на рис. 34. Внешние условия можно характеризовать заданием некоторых величин, носящих название внешних параметров. Внешние 27 В. Г, Левич, гом I
418 ТЕРМОДИНАМИКА [Гл. IV параметры системы определяются действующими на тело полями или положением окружающих тел. Представим себе, например, что наша система является га- газом, находящимся в сосуде с подвижной крышкой (поршнем). Тогда состояние системы будет зависеть от положения поршня. Это положение является внешним параметром, поскольку зна- значение координаты поршня не зависит от природы и свойств си- системы в сосуде. В качестве другого примера можно указать систему, находящуюся во внешнем поле сил. Если произвольная система находится во внешнем поле сил, то ее частицы обладают некоторой потенциальной энергией. Поэтому уровни энергии будут зависеть от свойств поля. В частности, в однородном поле эта зависимость определяется только положением системы в поле. В этом случае внешним параметром будет служить поло- положение системы. Таким образом, уровни энергии системы, вообще говоря, за- зависят не только от свойств самой системы, но также и от зна- значений внешних параметров, совокупность которых мы обозна- обозначим через к. Для того чтобы это подчеркнуть, мы будем иногда писать Ej(?i). Не нужно, однако, забывать, что значения е, за- зависят не только от X, но и от свойств самой системы. Рассмотрим изменение бег энергии системы при бесконечно малом изменении 6Х ее внешнего параметра X. При этом мы сначала ограничимся таким изменением внешних параметров, при котором распределение вероятностей различных состояний остается неизменным. Это означает, что при изменении внешних параметров не происходит перехода системы из одних состоя- состояний в другие (см. ниже). Тогда имеем де. Величину -~п можно рассматривать как некоторую (взятую с обратным знаком) обобщенную силу, действующую на систему. Обозначим ее через (—/г). Тогда B2,1) запишется в виде Ьг^-hbX. B2,2) Для нахождения изменения внутренней энергии мы должны найти среднее значение изменения каждого из уровней энергии системы. По обычным правилам усреднения имеем б? = бе = Ц 6etwt = - 2 fiwt ЬХ = - Л ЬХ, B2,3) где через Л обозначена средняя сила, действующая на всю под- подсистему при изменении параметра X, Л = B hwi)Wl-
§22] РАБОТА И ДАВЛЕНИЕ 419 Величина (—Adk) представляет собой работу, производи- производимую над системой при изменении параметра к на величину dk. Знак минус показывает, что работа производится внешними силами над системой. Обозначим среднее значение работы, производимой над си- системой при изменении внешних параметров к, через bW. Тогда имеем №w. = (bW)w.. B2,4) Рассмотрим, в частности, важный случай, когда обобщенной координатой служит линейный размер системы, определяемый координатой х. В этом случае вместо обобщенной силы удобно ввести давление р, которое мы определим как среднюю силу, действующую на один квадратный сантиметр нормально к по- поверхности тела (системы), т. е. А р Тогда имеем FE)Wi = bW = - pS 6x = - р 6V, B2,5) где 6V — изменение объема системы. Такое определение давления является не новым, мы пользою вались им в кинетической теории газов. В § 8 мы определили давление как среднюю силу, действующую на единицу поверх- поверхности стенки со стороны ударяющихся о нее газовых молекул. В системе, содержащей большое число частиц, истинная сила всегда имеет величину, очень близкую к своему среднему зна« чению. Это и оправдывает введение давления, заменяющего с большой степенью точности фактическую силу, действующую на поверхность тела. Очевидно, что FC)W/ не представляет полного возможного изменения энергии системы и не является полным дифферен- дифференциалом какого-либо выражения. Действительно, обобщенная сила A = 2/t^i при данной структуре системы представляет функцию внешнего параметра Я и температуры 0. Поэтому мы подробнее можем написать так: А(А., в)дА.. B2,6) Изменение энергии при изменении параметра Я в пределах от Я-i до Я,2 или работа, произведенная при этом над системой,, равна W=- J 27*
420 ТЕРМОДИНАМИКА [Гл. IV Значение интеграла в последней формуле зависит, очевидно, от пути интегрирования, т. е. от характера перехода от Х\ к "кг. В частности, в случае, когда к = V, V, W=-\p{V, TNV. B2,7) v, Поскольку давление зависит от объема и температуры, переход от объема V\ к объему V?, по различному пути интегрирования, т. е. при разном характере перехода от V{ к V2, приводит к раз- различным значениям работы W. § 23. Изменение энергии системы в общем случае квазистатического процесса Рассмотрим теперь изменение энергии подсистемы в более общем случае, когда она находится во взаимодействии с окру- окружающими телами (средой), обмениваясь с ними энергией при непосредственном контакте. Мы в дальнейшем ограничимся рассмотрением таких про- процессов, при которых состояние статистического равновесия в си- системе не нарушается. Такие процессы, при которых систему можно считать находящейся все время в состоянии статистиче- статистического равновесия или, точнее, в ходе которых система проходит через последовательный ряд равновесных состояний, мы будем именовать квазистатическими или обратимыми процессами. Вопрос о том, в какой мере фактически состояние системы может изменяться без нарушения состояния равновесия, т. е. можно ли осуществлять квазистатические переходы в системе, мы об- обсудим ниже. Поскольку система в течение всего времени процесса нахо- находится в состоянии равновесия, распределение вероятностей определяется равновесным распределением Гиббса. Для полного изменения средней энергии можно написать B3,1) где ш, — распределение Гиббса с температурой, равной темпера- температуре термостата. Последняя, однако, в ходе процесса не должна оставаться постоянной. Первое слагаемое в формуле B3,1) по-прежнему выражает работу, совершаемую над системой. Второе слагаемое представляет ту часть изменения энергии системы, находящейся во взаимодействии со средой, которая не связана с изменением внешних параметров. Иными словами, второе слагаемое в B3,1) равно изменению средней энергии
-f 23] ЭНЕРГИЯ СИСТЕМЫ В СЛУЧАЕ КВАЗИСТАТИЧЕСКОГО ПРОЦЕССА 421 системы, возникающему вследствие непосредственной передачи энергии от частиц среды к частицам системы, не сопровождаю- сопровождающейся изменением внешних полей или взаимного расположения тел. Эту часть изменения энергии мы назовем количеством тепла, подводимого к системе, и обозначим его 6Q. Тогда имеем 6E = bW + bQ. B3,2) Формула B3,2) представляет закон сохранения энергии для теплевых процессов (первое начало термодинамики). Именно я такой форме закон сохранения энергии при тепловых про- процессах был впервые установлен после опытов Джоуля. Статистическая физика позволяет вскрыть молекулярный •смысл величин, входящих в B3,2), а также, по крайней мере для простейших систем, дает возможность теоретического их вычисления. Для выяснения молекулярного смысла количества тепла рассмотрим произвольную незамкнутую систему, с которой про- происходит квазистатический процесс. При квазистатическом про- процессе можно написать, пользуясь определением B3,2), Второй член можно преобразовать следующим образом. Имеем очевидное тождество'): ~^О (e,)J = - | ?e~Q (в,) 6г1 + ^ г,е~п (в,) -g-, «з которого следует, что e"Q (в,)] + ^ 2 че'^п (В|), B3,3) откуда, разделив B3,3) на Z, находим 6Z 60 Це^ °Q(et) z + e z ') IJpn дифференцировании переменными величинами являются ei и в. Число состояний, отвечающих данной энергии, остается, очевидно, постояп- «ым, характерным для данной системы числом.
422 ТЕРМОДИНАМИКА (Гл. IV Первое слагаемое правой части B3,4) можно представить в виде e Во втором слагаемом выражение -~- ^ ete e Q(eJ можно заме- заменить на ё или Е. Тогда имеем ^ (| ) B3,5> Мы приходим, таким образом, к следующему важному выводу. Если с макроскопической системой происходит некоторый процесс, в ходе которого она все время остается в равновесии с термостатом, то изменение ее энергии может быть представ* лено в виде (^ ) B3,6) Формула B3,6), имеющая основное значение для дальнейшего, представляет общее выражение для изменения энергии при ква- квазистатическом процессе. Как видно из формулы B3,6), изменение энергии распа- распадается на две части — работу, производимую над системой (или самой системой), 6W, и количество тепла 6Q, получаемое (или отдаваемое) системой. Выполнение работы связано с изменением значений допусти- допустимых уровней энергии, обусловленным, как это мы видели а предыдущем параграфе (формула B2,1)), изменением ее внеш- внешних параметров. Если, в частности, система состоит из отдель- отдельных независимых частиц и можно говорить об энергиях от- отдельных частиц, то выполнение работы связано с изменением энергий отдельных частиц. Если внешние параметры не изменяются (работа внешних сил равна нулю), то энергетические уровни системы остаются неизменными. В этом случае энергия, подводимая в систему извне, идет на изменение распределения вероятностей. Состоя- Состояния с большей энергией становятся более вероятными — система нагревается. Если, например, система представляет идеальный газ, то при подведении энергии число молекул, имеющих отно- относительно большие энергии, увеличивается, а имеющих малые энергии — уменьшается. В случае, если система отдает, а не получает энергию, происходит обратное перераспределение ве- вероятностей: более вероятными становятся состояния с меньшей бнергией, система охлаждается.
$ 23] ЭНЕРГИЯ СИСТЕМЫ В СЛУЧАЕ КВАЗИСТАТИЧЕСКОГО ПРОЦЕССА . 423 Обсудим теперь вопрос о том, когда процесс может счи- считаться квазистатическим. Если внешние условия, в которых находится система, изме- изменяются, например, изменяются ее объем, действующие на нее поля или она получает извне некоторое количество энергии пу- путем непосредственного контакта, то состояние равновесия в си- системе нарушается. Если изолировать затем систему и предста- представить ее самой себе, то с течением времени система неизбежно должна будет прийти в состояние статистического равновесия. Действительно, мы говорили, что состояние сложной системы не зависит от ее начального состояния. Поэтому если время наблюдения достаточно велико, то основную часть времени наблюдения система проводит в состоянии статистического рав- равновесия независимо от того, в каком состоянии она находилась в начальный момент. По прошествии времени релаксации т система, первоначально находившаяся в неравновесном, мало вероятном состоянии, переходит в наиболее вероятное, равно- равновесное состояние. На вопрос о том, как именно произойдет этот переход и какое для него требуется время, в общем случае от- ответить невозможно. Процессы, протекающие при этом в системе, зависят от природы системы и от характера ее равновесного состояния. Предположим теперь, что изменение внешних условий про- происходит достаточно медленно. Именно, будем считать, что за- заметное изменение внешних условий происходит за промежутки времени, очень большие по сравнению со временем релаксации. Тогда в каждый данный момент времени система будет успевать приходить в состояние равновесия, соответствующее данным внешним условиям. Поясним это на простом примере. Рассмотрим процесс сжа- сжатия и расширения газа под поршнем. При движении поршня он производит работу над порциями газа, непосредственно к нему прилегающими. Соответствующие молекулы получают избыточную энергию по сравнению с остальной массой молекул 1"аза, и газ становится неоднородным. Благодаря процессам Соударения между молекулами, возникшая неоднородность бу- будет стремиться исчезнуть, а подведенная энергия равномерно распределится между всеми молекулами газа. Для того чтобы этот процесс успел произойти, и газ, выведенный из равновес- равновесного состояния, успел в него вернуться, требуется некоторое время, являющееся характерным временем релаксации для дан- данного процесса. Если поршень перемещается настолько медленно .(например, очень слабыми и редкими толчками), что время, требующееся для продвижения поршня на заметное расстояние, очень велико по сравнению со временем релаксации, то все нарушения однородности газа будут успевать рассасываться.
424 ТЕРМОДИНАМИКА [Гл. IV Газ будет все время однородным по составу, т. е. будет нахо- находиться в состоянии равновесия. Аналогично в случае нагревания в области, непосредственно примыкающей к источнику тепла (например, к одной из стенок сосуда), будет происходить изменение распределения молекул по скоростям и будет увеличиваться процент молекул с боль- большими скоростями. Процессы столкновения будут приводить к. выравниванию неоднородности газа за некоторое время релак- релаксации. Если нагревание газа происходит настолько медленно, что заметное изменение температуры будет происходить за время, значительно большее времени релаксации, возникшие неоднородности будут успевать рассасываться и газ будет все время находиться в состоянии равновесия. Таким образом, условием квазистатичности процесса являет- является условие его медленности. Каждому времени релаксации отве- отвечает своя быстрота изменения внешних условий, при которых процесс может считаться квазистатическим. Само собой разумеется, что квазистатический процесс пред- представляет некоторую идеализацию реальных процессов, идущих, всегда с конечной скоростью. Всякий квазистатический процесс является процессом обра- обратимым. Это означает, что если в ходе процесса система прошла через данную последовательность равновесных состояний (пря- (прямой процесс), то ее можно также перевести в первоначальное состояние, проходя через ту же самую последовательность со- состояний (обратный процесс). Для этого следует лишь изменять в обратном порядке внешние условия, в которых находится система. Это невозможно сделать для неквазистатических процессов. При неквазистатическом процессе состояние равновесия в си- системе нарушено. Состояние неравновесной системы не опреде- определяется заданием внешних параметров и температуры системы, но требует указания целого ряда других величин, например, рас- распределения температуры или плотности внутри системы. Изме- Изменение внешних условий в обратной последовательности не будет еще означать, что система проходит через те же состояния в- обратном порядке. Поэтому неквазистатические процессы яв- являются необратимыми. Само собой разумеется, что вполне обратимый процесс яв- является некоторой идеализацией. Реальные процессы всегда происходят с конечной скоростью и сопровождаются наруше- нарушением равновесия в системе. Однако очень часто можно в до- достаточно хорошем приближении не учитывать малых нару- нарушений равновесного состояния системы и считать процесс, фактически идущий с конечной скоростью, процессом обра- обратимым.
4 24] ЭНТРОПИЯ И ОСНОВНОЕ ТЕРМОДИНАМИЧЕСКОЕ РАВЕНСТВО 425 .§ 24. Энтропия и основное термодинамическое равенство Формула B3,5) показывает, что при квазистатическом про- процессе количество тепла, получаемого или отдаваемого системой, может быть представлено в виде B4,1) где 6а — изменение некоторой функции: . B4,2) Очевидно, что 6а представляет полный дифференциал выра- выражения, стоящего в скобках, а = -|- + In Z + const, B4,3) где const — произвольная постоянная. Функция а получила на- название энтропии системы. Физический смысл этой важнейшей величины будет выяснен несколько позднее. С помощью энтропии изменение энергии системы при квази- квазистатическом процессе может быть записано в виде 6? = 6 6а-Л6А,. B4,4) Чаще всего внешним параметром является объем системы V. Тогда 6E = 06a-p6V. B4,5) Формулы B4,4) или B4,5), выражающие изменение энергии ¦системы в самом общем случае квазистатического процесса, но- носят название основного термодинамического равенства. Основное термодинамическое равенство было получено нами чисто статистическим путем. Исторически, однако, это равен- равенство, а также энтропия, определенная формулой B4,1), были введены в феноменологической термодинамике (см. ниже). Основное термодинамическое равенство показывает, что пол- полное изменение энергии системы при квазистатпческом процессе определяется изменением внешнего параметра 6л и энтропии 6а. Действительно, из формул B4,4) и B4,5) находим так что можно написать 6Е = 0 бог - Л оЯ = D§-) Ьа + {~^-) 6Х. B4,7) Таким образом, термодинамическую внутреннюю энергию си- системы можно рассматривать как функцию независимых
426 ТЕРМОДИНАМИКА [Гл. IV переменных а и X (или V). При этом, как видно из равенства 6= (-я—] и условия в > 0, энергия является монотонной функ- функцией энтропии. Формула для изменения энергии по своей структуре сходна с формулой, связывающей изменение потенциальной энергии с обобщенной координатой в механике. По этой причине внут- внутреннюю энергию называют термодинамическим потенциалом по отношению к обобщенным координатам а и X. Величины в и Л играют роль обобщенных сил. Величина 6Е является полным дифференциалом в отличие от количества тепла 6Q и работы bW, которые в общем случае не представляют полных дифференциалов каких-либо выра- выражений. Взяв интеграл по замкнутому циклу изменений состояния системы, находим " ЬЕ = 0. Это вполне естественно, так как внутренняя энергия Е является однозначной функцией состояния системы. При возвращении системы в первоначальное состояние ее энергия также будет приобретать первоначальное значение. Работа W и количество тепла Q зависят не только от со- состояния, но и от характера процесса, происходящего с системой. Поэтому не имеет смысла говорить о количестве тепла, заклю- заключенном в системе в данном состоянии. Смысл имеет лишь изме- нение количества тепла 6Q. Формула B4,1) показывает, что отношение -^- является полным дифференциалом, следовательно, энтропия о представ- представляет однозначную функцию состояния системы. Для нее имеет место условие: Температуру 0 можно с математической точки зрения рас- рассматривать как интегрирующий делитель выражения 6Q. Для выяснения физического смысла энтропии, которое будет проведено в следующем параграфе, мы должны еще рассмот- рассмотреть другие ее свойства. Согласно формуле B4,3), для вычисления энтропии необхо- необходимо лишь знать функцию состояний Z. В формуле B4,3) фи- фигурирует постоянная интегрирования. Таким образом, энтропия определена с точностью до произвольной постоянной. Существен- Существенно, однако, что, как это будет показано в § 36, постоянная
4 25] ЗАКОН ВОЗРАСТАНИЯ ЭНТРОПИИ 427 энтропия является действительно постоянной, не зависящей не только от температуры системы, но также и от всех других параметров, характеризующих ее состояние (объема, физиче- физического и химического состояния системы и т. д.). Эту постоянную можно выбрать за начало отсчета энтропии и написать формулу B4,3) в виде c = -f + lnZ. B4,8) Преобразуем последнее выражение для энтропии, восполь- воспользовавшись тем, что в состоянии статистического равновесия си- система подавляюще большой промежуток времени будет обла< дать энергиями е,-, близкими к средней энергии ё. Преобразуем функцию состояний системы, учитывая, что за- заметный вклад в нее вносит только наиболее вероятное состояние с энергией ё. Мы можем написать el s е Z = 2e~~»~Q(si) « e~~*Q(ё) = e~TQ(ё). B4,9) При этом в сумме по состояниям мы пренебрегли всеми чле- членами, кроме самого большого. Подставляя B4,9) в B4,8), находим a-lnQ(e). B4,10) Энтропия макроскопической квазизамкнутой системы оказы- оказывается равной логарифму числа состояний, отвечающему сред- средней энергии системы, т. е. логарифму числа состояний системы, находящейся в состоянии статистического равновесия. Таким образом, энтропия а идентична функции а, введенной нами в § 16 (формула A6,7)). Весьма важным свойством эн- энтропии является ее аддитивность. Энтропия сложной системы, находящейся в равновесии и состоящей из п подсистем, равна ff = lnQ = lnIlQn = 2lnQn = 2<v B4,11) п Аддитивность энтропии непосредственно следует из ее опре- определения A6,7) или B4,3). Степень точности утверждения об аддитивности энтропии та же, что и утверждения об аддитивности энергии. § 25. Закон возрастания энтропии В предыдущих параграфах мы рассматривали квазизамкну- тую систему, находящуюся в состоянии статистического равно- равновесия или совершающую квазистатический (обратимый) про- Кесс. При этом мы установили, что ряду макроскопических
428 ТЕРМОДИНАМИКА [Гл. IV понятий — внутренней энергии, работе, количеству тепла может быть дано молекулярное (статистическое) истолкование. К та- таким понятиям принадлежит и введенная нами макроскопическая величина — энтропия. Формулы B4,8) и B4,10) позволяют вычислять значение1 энтропии, но не проливают света на смысл этой величины. Для выяснения молекулярного смысла энтропии следует рассмот- рассмотреть систему с более простым статистическим поведением, чем квазизамкнутая система,— систему замкнутую. Простота зам- замкнутой системы позволит нам не ограничиваться изучением свойств равновесных систем, но включить в рассмотрение также и системы неравновесные. Представим себе замкнутую макроскопическую систему как совокупность большого числа частей. Каждая из этих частей имеет размеры, малые по сравнению со всей системой в целом, но содержит еще огромное число частиц и является квазизамк- квазизамкнутой системой. Поскольку наше разбиение является совершен- совершенно произвольным, его всегда можно произвести. Предположим, что все части нашей сложной системы пришли в состояние ста- статистического равновесия. Тогда для каждой из них можно написать выражение для энтропии B4,10): ая-1п0я(ёя), B5,1> где индекс п означает номер части. Мы не будем, однако, предполагать, что имеет место стати- статистическое равновесие между частями системы; например, раз- различные части системы могут иметь разную температуру, хотя в каждой из частей имеет место постоянство своей температуры. Вся замкнутая система, как целое, будет находиться в нерав» новесиом состоянии. Определим энтропию замкнутой неравновесной системы. По самому смыслу этого понятия энтропию сложной системы следует считать аддитивно слагающейся из энтропии всех вхо- входящих в нее частей, т. е. *-2огя. B5,2> л Как мы видели выше, формула тривиальна для случая системы, в которой существует равновесие между частями. Она пред- представляет естественное обобщение понятия энтропии на случай неравновесной системы. Для каждой из частей системы можно представить равновес- равновесное значение энтропии по формуле B4,10). Тогда имеем о = 2 а„ = I In Qft (г) = in П Q. (О = In Q, B5,3>
$ 25] ЗАКОН ВОЗРАСТАНИЯ ЭНТРОПИИ 429 N где Q= П й„ (ё„) — полное число состояний системы, состоя- состояла щей из N независимых частей. Мы видим, что энтропия замкнутой системы оказывается равной логарифму числа состояний системы. Она может быть при этом не равна логарифму числа состояний Q(e) всей этой системы в состоянии статистического равновесия (как это всегда имеет место для каждой из ее частей или для всей системы, находящейся в состоянии статистического равновесия). В рассматриваемой замкнутой системе имеет место закон микроканонического распределения A6,1), связывающий ве- вероятность состояния замкнутой системы с числом ее состоя- состояний Q. Выражая Q через ш, находим а = In w + const. B5,4) Формула B5,4), представляющая основу статистического тол- толкования термодинамики, носит название формулы Больцмана. Формула Больцмана связывает значение энтропии замкнутой системы с вероятностью ее состояния. Изменение энтропии при переходе замкнутой системы из одного состояния в другое равно а2 — ofj = Дст = In-^т", B5,5) где o>i и до2, <Ji и G2 — вероятностии и энтропии первого и вто- второго состояний соответственно. Иногда энтропию связывают с числом состояний Q не фор- формулой B5,3), а выражением Е Л2, B5,3') о где интегрирование ведется по всем энергиям, меньшим Е. По- Поскольку число состояний Q(E) в макроскопических системах, при jVC|>1, большая величина, приближенно можно считать Q (Е) ы J dQ. При этом оба определения B5,3) и B5,3') приводят к одному и тому же значению о, а именно к среднему значению. Эго свойство формулы Больцмана именуют ее нечувствительностью. Формула Больцмана связывает между собой понятия разной физической природы. Энтропия является макроскопической ве- величиной, тогда как вероятность имеет механический и не макро- макроскопический смысл.
430 ТЕРМОДИНАМИКА [Гл. IV Энтропия квазизамкнутой системы может быть выражена через плотность вероятности р(р, q), входящую в классическое распределение Гиббса A9,4), следующим образом. Функция р удовлетворяет условию нормирования J pdQ= 1. Учитывая, что р(е) имеет резкий максимум при е = ё, имеем приближенно Поэтому энтропия системы на основании B4,10) равна С другой стороны, можно написать Поэтому для энтропии квазизамкнутой системы а можно напи- ¦сат ь в виде Ь B5>6) Эта формула понадобится нам в дальнейшем. Вернемся к формуле Больцмана B5,4) и посмотрим, как с ее помощью можно установить закономерности изменения во времени состояния замкнутой системы. Предположим, что первоначально замкнутая система находи- находилась в некотором неравновесном состоянии. Тогда W\ означает вероятность начального неравновесного состояния. По проше- прошествии времени релаксации система перейдет из неравновесного состояния в состояние статистического равновесия. Этот переход происходит благодаря слабому, но всегда существующему вза- взаимодействию между ее частями. Не вдаваясь в рассмотрение того, как именно и за какое время устанавливается равнове- равновесие,— это задача физической кинетики, — мы можем утверж- утверждать, что этот переход совершается неизбежно во всякой ма- макроскопической системе по прошествии времени релаксации. По определению, вероятность w2 состояния статистического равновесия (в котором макроскопическая система проводит почти все время) и'меет максимальное значение, так что w2 > wu Из формулы B5,5) следует, что при переходе замкнутой си- системы из неравновесного состояния в равновесное ее энтропия увеличивается. Таким образом, возрастание энтропии замкну-
§ 25] ЗАКОН ВОЗРАСТАНИЯ ЭНТРОПИИ 431 той системы оказывается связанным с переходом ее из менее- вероятного в более вероятное состояние. Наибольшее значение имеет энтропия системы, находящейся в состоянии полного ста- статистического равновесия. Полученный результат можно сфор- сформулировать следующим образом. Если некоторая замкнутая макроскопическая система пер- первоначально находится в неравновесном состоянии, то вероят- вероятность этого состояния и его энтропия не имеют наибольшего- возможного значения. Наиболее вероятным будет такое поведе- поведение системы, при котором по прошествии времени релаксации она перейдет в паи- б более вероятное состояние, энтропия ко- которого максимальна. Можно показать, что в среднем этот переход совершается монотонно, т. е. что система приходит в состояние статисти- статистического равновесия, проходя последова- ' \ тельно ряд все более и более вероятных состояний до тех пор, пока она не до- ИС- стигнет состояния полного равновесия. При этом энтропия системы постепенно возрастает, достигая максимального значения в наиболее вероятном равновесном со- состоянии. Таким образом, изменение энтропии во времени проис- происходит так, как это изображено на рис. 42 сплошной (но не пунк- пунктирной!) кривой. Представим себе теперь такой случай, когда замкнутая си- система в начальный момент уже находилась в состоянии полного- статистического равновесия, в котором ее энтропия имеет макси- максимальное значение. Тогда в течение весьма длительного времени,, превышающего время релаксации, система будет оставаться в состоянии равновесия, а ее энтропия — сохранять неизменное максимальное значение. В общем случае мы можем сказать, что> наиболее вероятным ходом процессов в замкнутой макроскопи- макроскопической системе является такой, при котором ее энтропия воз- возрастает или остается постоянной: Д<т>0, B5,7) где знак неравенства относится к процессам, приближающим систему к состоянию статистического равновесия, а знак равен- равенства — к процессам, происходящим в системе, уже находящейся в состоянии равновесия. Мы знаем, однако, что в применении к макроскопическим системам вероятные предсказания имеют практически вполне Достоверный характер. Поэтому, оставляя до § 36 вопрос о бо- более полной и глубокой трактовке закона возрастания энтропии, будем учитывать лишь наиболее вероятный ход энтропии и
432 ТЕРМОДИНАМИКА [Гл. IV считать, что формула B5,7) имеет не вероятностный, а достовер- достоверный характер. Тогда изменение или постоянство энтропии может рассматри- рассматриваться как критерий необратимости и обратимости процессов, происходящих в замкнутой системе. При необратимых процес- процессах, в ходе которых система приближается к состоянию равно- равновесия, энтропия увеличивается, при обратимых процессах — остается постоянной. В виде важного примера необратимого процесса, происходя- происходящего в замкнутой системе, рассмотрим процесс, возникающий при соприкосновении частей системы, имеющих различные тем- температуры. Если соприкасаются две части системы, имеющие темпера- температуры 8i и 8г (для конкретности будем считать Эг > 9|), то изме- изменение энтропии замкнутой системы равно Поскольку система является замкнутой, ее полная энергия со- сохраняется, так что 6? = 6?, + 6?2 = 0. Следовательно, (??H. B5,8) Формула B5,8) показывает, что если G2 > 0i, то из закона воз- возрастания энтропии следует, что 6?i 5*- 0. Это означает, что пер- первая часть, имеющая более низкую температуру, получает энер- энергию от второй части. Иными словами, тепло всегда переходит от более нагретого к менее нагретому телу. § 26. Основное термодинамическое неравенство Естественно прежде всего обобщить полученный нами закон розрастания энтропии на случай незамкнутых систем. Такое обобщение может быть без труда сделано в случае систем незамкнутых, но теплоизолированных. Под теплоизоли- теплоизолированными системами мы будем понимать системы, у которых все взаимодействие с окружающими телами сводится к возмож- возможному воздействию на систему внешних полей, т. е. изменению внешних параметров. Изменение внешних полей, как это было выяснено в § 22, мо- может приводить к изменению энергетических уровней системы (или энергий отдельных частиц в случае газов), но не приводит к изменению распределения вероятностей. Поэтому переход из менее вероятных к более вероятным состояниям в теплоизоли-
§ 26] ОСНОВНОЕ ТТРМОДИНАМИЧССКОЕ НЕРАВЕНСТВО 433 рованной системе происходит по тем же законам, что и в си- системе замкнутой. Можно непосредственно перенести результаты предыдущего параграфа на случай незамкнутых, но теплоизо- теплоизолированных систем, написав для них закон возрастания энтро- энтропии 6сг>0. B6,1) В общем случае незамкнутых систем, произвольным обра- образом обменивающихся энергией с окружающими телами, можно написать неравенство ба>^-. B6,2) При квазистатических процессах оно переходит в равенство B4,1), при переходе к теплоизолированной системе — в нера- неравенство B6,1). Физически неравенство B6,2) означает, что при необратимых процессах энтропия системы возрастает на величину, избыточ- 60 ную по сравнению с -?-, на которую увеличивается энтропия вследствие получения системой тепла. Это избыточное по срав- нению с —~- возрастание энтропии связано с переходом в бо- более вероятное состояние, т. е. приближением к равновесию. Комбинируя B6,2) с основным термодинамическим равен- равенством, можно написать для общего случая произвольных про- процессов в незамкнутых системах основное термодинамическое не- неравенство ?<е 6Г B6,3) где знак равенства относится к обратимым процессам, а знак неравенства — к процессам необратимым. Основное термодинамическое неравенство объединяет запись закона сохранения энергии и закона возрастания энтропии и может быть названо объединенной формой записи первого и второго начал термодинамики. Полученные соотношения позволяют указать способ опреде- определения шкалы статистической и абсолютной температур. Статистическая температура измеряется в эргах, тогда как на практике для измерения температуры пользуются другой си- системой единиц— градусами. Важное значение имеет абсолютная шкала температур, в которой температура отсчитывается от абсолютного нуля и по своему существу идентична статистической температуре. Для установления связи между статистической и абсолютной температурами необходимо найти лишь числовое выражение 28 В Г. Лсацч, гом I
434 ТЕРМОДИНАМИКА [Гл. IV энергетических единиц через градусы. Именно, можно написать 9 = kT, B6,4) где постоянная k представляет переходный множитель, связы- связывающий эрги с градусами. Он является некоторой универсаль- универсальной постоянной, численное значение которой может быть полу- получено только из опыта. Величина k получила название постоянной Больцмана. Про* изведенные измерения (например, измерения теплоемкостей га- газов) показали, что k= 1,38- Ю'16 эрг/град. Пользуясь абсолютной шкалой температур и вводя энтро- энтропию, выраженную в эрг/град, S = ka, можем переписать фор- формулы B5,4), B4,3) и B4,5) в виде 5 = k In w -f const = -J- + k In Z + const, B6,5) B6,6) § 27. Максимальная работа процессов. Невозможность построения вечного двигателя второго рода и феноменологическое определение энтропии Мы можем теперь обратиться к рассмотрению вопросов, изуче- изучение которых исторически послужило толчком к созданию фе- феноменологической термодинамики. Речь идет о вычислении по- полезной работы, которая может быть получена при изменении внутренней энергии системы. В термодинамике принято имено- именовать тепловыми машинами устройства, предназначенные для получения работы. Все тепловые машины можно разделить на два типа. Машины первого типа выполняют полезную работу за счет последовательности замкнутых (круговых) циклов. К таким ма- машинам относятся: паровые машины, паровые и газовые турбины, компрессоры, двигатели внутреннего сгорания и т. п. В итоге каждого цикла машина возвращается в первоначальное состоя- состояние. Поэтому сама машина служит как бы передаточным меха- механизмом, способствующим переходу внутренней энергии рабочего вещества в работу. Машины второго типа совершают некруговые процессы, про- производя при этом полезную работу. В подобного рода устройствах машина — некоторая система, находящаяся первоначально в не- неравновесном состоянии, приходит в состояние равновесия. Пе-1 реход в равновесное состояние сопровождается получением по- полезной работы. К такого рода машинам относятся все устройства однократ- однократного действия. Чаще всего в таких устройствах полезная работа
§ 27] МАКСИМАЛЬНАЯ РАБОТА ПРОЦЕССОВ 435 получается за счет химических реакций, протекающих в системе. В виде примера можно указать на гальванические элементы, ра« кеты и т. п. Рассмотрим вначале тепловые машины, совершающие замк« нутые циклы (машины первого типа). В рамках этой книги мы не можем, разумеется, подробно изучать теорию действия конкретных тепловых машин. Это за- задача технической термодинамики. Мы ограничимся лишь выяс- выяснением принципиальной стороны дела. Именно, рассмотрим прежде всего вопрос о том, можно ли непосредственно превратить внутреннюю энергию — энергию теплового движения частиц, имеющихся в теле, в полезную ра- работу. Покажем, что существование такого устройства, которое мы назвали выше вечным двигателем второго рода, противоречит закону возрастания энтропии и поэтому невозможно. Для этого рассмотрим произвольную теплоизолированную систему, имею- имеющую начальную энергию Ео, энтропию So и внешние параметры Хо. Предположим, что система, оставаясь теплоизолированной, неквазистатическим образом переходит за счет изменения внеш- внешних параметров в новое состояние с энергией Е', энтропией S' и параметрами к'. После этого система квазистатическим путем возвращается в состояние с внешними параметрами Ко. При этом, однако, в конечном состоянии она будет иметь энтропию 5' и энергию Е'', отличные от начальных значений энтропии и энергии. Согласно закону возрастания энтропии для теплоизолирован- теплоизолированной системы S'^-Sq. Но из условия 1-^- =Г>0, выражаю- выражающего монотонность энергии как функции энтропии, следует, что возрастанию энтропии отвечает также возрастание внутренней энергии тела, т. е. Е' ^ Ео. В ходе рассмотренного процесса энергия теплоизолирован- теплоизолированного тела должна возрастать. Увеличение энергии может проис- происходить только за счет работы, произведенной над системой внеш- внешними телами. Таким образом, из закона возрастания энтропии следует, что рассмотренная система не только не может служить источником полезной работы, но, наоборот, при необратимом переходе ее в состояние с новой энергией над системой необходимо произ- произвести работу. Мы можем поэтому утверждать, что закон возрастания эн- энтропии эквивалентен положению о невозможности создания веч- вечного двигателя второго рода. Разумеется, справедливо и обратное утверждение — из не- невозможности построения вечного двигателя второго рода 28*
436 ТЕРМОДИНАМИКА [Гл. IV однозначно вытекает существование в замкнутой системе моно- монотонно возрастающей функции состояния — энтропии (см. ниже). Исходя из сформулированного принципа, можно было вве- ввести в термодинамику энтропию и закон ее возрастания как коли- количественное выражение второго начала термодинамики. Именно так развивалась термодинамика, и этот исторический порядок изложения термодинамики сохранен и в современных учебниках термодинамики. Таким образом, ход исторического развития термодинамики был обратным той последовательности, которая била принята при изложении материала в нашей книге. Возращаясь к рассмотрению проблемы получения работы, замечаем, что для получения полезной работы необходимо иметь по крайней мере два тела, имеющих различные температуры, 7'| и Г2, т. е. систему тел, не находящихся в равновесии. Прежде чем вычислить получаемую работу, покажем, что наибольшая работа получается при обратимом (квазистатиче- (квазистатическом) процессе. Пусть изменение энергии в общем случае равно При обратимом процессе то же изменение энергии можно напи- написать в виде Вычитая, находим Но T6S > 6Q, так что bW'-6W>0, или 6W>6W. B7,1) iMaкcимaлыlaя работа может быть получена при обратимом (квазистатическом) переходе. Для вычисления этой работы за- заметим прежде всего, что установление теплового контакта между телами с разной температурой приводит к необратимому перс- ходу тепла и не сопровождается получением полезной работы. Поэтому рабочее устройство должно включать три элемента: 1) систему с температурой Т2 (нагреватель), 2) вспомогательную систему, с помощью которой энергия пе- переносится от более нагретого тела к менее нагретому без непо- непосредственного контакта между ними (рабочее тело), 3) систему с температурой 7\ < Т2 (холодильник). Энергия б?г = 6Q2 передается от нагревателя рабочему телу обратимым образом. Для этого необходимо, чтобы температуры
j J7] МАКСИМАЛЬНАЯ РАБОТА ПРОЦЕССОВ 43Т нагревателя и рабочего тела были равны друг другу в течение всего процесса передачи тепла (изотермический процесс). При этом bQ2 = T2&S2. Часть полученной от нагревателя энергии должна быть пе- передана холодильнику (в противном случае мы получили бы веч- вечный двигатель второго рода), а часть превращена в полезную работу. При этом баланс энергии гласит: 6Q2 + 6Q, = — bW, Для того чтобы избежать необратимых процессов, тепло должно передаваться холодильнику изотермическим образом при температуре холодильника 7Y Поэтому рабочее тело дол- должно теплоизолирование и обратимо перейти от температуры Тг к температуре Ти после чего квазистатически передать холодиль- холодильнику количество тепла 6Qi. Для повторения процесса рабочее- тело возвращается теплоизолированно (адиабатически) к тем- температуре Т2. Этот замкнутый цикл получил название цикла Карио. Поскольку все процессы в системе (нагреватель + рабочее тело + холодильник) обратимы, полное изменение энтропии bS = 6S, + bS2 = 0. Для произведенной работы можно написать — tW = 6Q2 + 6Qi = T26S2 + Ti 65i = = G-a - Г,) 6S2 = ЩИ 6Q2 = ^^ 6?2. 1 2 '2 Отношение произведенной работы к количеству затраченной энергии носит название коэффициента полезного действия (к. п. д.) г\. В нашем случае _ г,-г, ,97<А Из смысла проведенного вывода ясно, что полученный к. п. д. имеет максимально возможное значение. Если в тепловой ма- машине происходят необратимые процессы, то всегда г| < г)мт<с- Таким образом, максимальным коэффициентом полезного действия обладает обратимая машина, работающая по замкну- замкнутому циклу Карно. Значение коэффициента полезного действия не зависит от природы рабочего тела и определяется исключи- исключительно отношением перепада температур Т2 — F, к температуре нагревателя Т2. Воспроизведем теперь кратко ход рассуждений, который при* Вел к введению понятия энтропии в феноменологической термо- термодинамике. Он, до известной степени, был обратным нашему,
438 ТЕРМОДИНАМИКА [Гл. IV Из соотношения B7,2) следует О On i OQl л /Л7 О\ Отношение количества тепла 6Q, полученного при некоторой температуре Т, к величине этой последней, —~, Клаузиусом было названо приведенным теплом. Следовательно, алгебраиче* екая сумма приведенных теплот для цикла Карно равна нулю. Этот результат был получен нами с помощью формулы, связы- связывающей изменение количества тепла с абсолютной температурой и энтропией. Однако для идеального газа количество тепла, по- получаемого и отдаваемого при изотермическом процессе, и изме* нение температуры при адиабатическом процессе могут быть найдены непосредственно. Это позволяет найти к. п. д. обрати- обратимой машины, работающей по циклу Карно с идеальным газом, как рабочим веществом, который совпадает, конечно, с B7,2). Таким образом, формулы B7,2) и B7,3) могут быть получены и без введения энтропии. Рассмотрим теперь тепловую машину, совершающую пронз-* вольный обратимый цикл. Этот цикл можно разбить на бесконеч- бесконечное число бесконечно малых циклов Карно. Просуммировав по всем элементарным циклам соотношение B7,3), можем написать = 0. B7,4) Отсюда следует, что величина -~ представляет полный диф- дифференциал некоторой функции состояния системы S. При кру- круговом процессе полное изменение функции 5 равно нулю. Функ- Функция S получила название энтропии. Закон постоянства энтропии при обратимом процессе в замк- замкнутой системе (не получающей и не отдающей тепла) непосред- непосредственно следует из ее определения. Для нахождения изменения энтропии при необратимом процессе рассматривается переход из некоторого начального состояния А в конечное состояние В по двум путям — обратимому и необратимому. Изменение внутрен- внутренней энергии, также являющейся функцией состояния, равно ЬЕ = ЕЛ — Ев и не зависит от пути перехода. Изменение энтропии на обратимом пути связано с получен- полученным теплом 8Q соотношением 6S = -^-. Поэтому на обратимом .пути Л B7,5)
§ 28] МАКСИМАЛЬНАЯ РАБОТА НПКРУГОПЫХ ПРОЦЕССОВ 43* где |б№ОбР|—работа, произведенная системой над внешними телами. При переходе по необратимому пути произведенная ра- работа будет меньше, чем на обратимом (в противном случае к. п. д. необратимого замкнутого цикла был бы больше к. п. д. цикла Карно). Поэтому, учитывая, что 6? = 6Q 4 61Рнео6р = 6Q -1 6 WHeo6p |, B7,6) и вычитая B7,5) из B7,6), находим ИЛИ, ПОСКОЛЬКУ 1 6W06p | > 765 > 8Q. B7,7) Отсюда следует, что изменение энтропии при переходе А —*¦ В по необратимому пути 65 >^. B7,8). В замкнутой системе необратимый переход сопровождается воз- возрастанием энтропии: 65 > 0. B7,9) Таким образом, исходя из факта невозможности создания веч- вечного двигателя второго рода, можно было прийти к условию B7,3). Закон возрастания энтропии получается из B7,3), как прямое следствие, и оказывается, следовательно, эквивалентным исходной предпосылке. § 28. Максимальная работа некруговых процессов и термодинамические потенциалы Рассмотрим теперь вопрос о максимальной работе, которая может быть выполнена системой, совершающей некруговой про- процесс (тепловой машиной второго рода). Пусть некоторая си- система (мы будем называть ее основной системой) находится в термостате — среде, в которой поддерживается постоянная тем- температура То и давление р0. Между системой и средой имеет ме- место взаимодействие — обмен теплом и работой. Кроме основной системы и среды пусть имеется некоторое теплоизолированное тепло, над которым система может производить механическую работу. Это тело будем называть объектом работы, а совершен- совершенную над ним работу — полезной работой. Пусть основная система переходит из начального состояния в некоторое конечное состояние, производя при этом полезную работу (—6W). Если бы система не взаимодействовала со средой, полезная работа LFW) была бы равна изменению ее энергии б?.
440 ТЕРМОДИНАМИКА |Гл IV Непрерывное взаимодействие основной системы со средой в про- процессе выполнения полезной работы существенно изменяет это •соотношение. Именно, в то время как основная система выполняет полез- полезную работу, среда в свою очередь может обмениваться энергией с системой. Поэтому баланс энергии в замкнутой системе (основная си- система + среда + объект работы) должен быть записан в виде 6E + bEa = 6W, B8,1) где б?о — изменение энергии среды, которое можно записать в виде Здесь SQo — тепло, переданное основной системе средой, и 6W0—работа, произведенная средой над системой. Размеры среды настолько велики, что при любых взаимодействиях с си- системой в среде происходит бесконечно медленный квазистатиче- квазистатический процесс. Среда находится в состоянии равновесия с тем- температурой 7'о и давлением ро, которое не нарушается при лю- любых процессах в основной системе. Поэтому для среды можно написать 6?О= TobSo — роб Ко- B8,2) Поскольку объем замкнутой системы (основная среда + си- система) должен оставаться постоянным, имеем 6УО + 6У = 0. B8,3) Из B8,1), B8,2) и B8,3) находим 6W = 6Е + T06S0 + po6V. B8,4) Напишем закон возрастания энергии в замкнутой системе (ос- (основная система 4- среда) в виде 65 +¦ 6S0 > 0. Заменяя в B8,4) 6S0 на 6S, находим 6W > 8Е — TobS + робУ = 6R, B8,5) где величина R равна R = Е + PoV — T0S. B8,6) Согласно сказанному в предыдущем параграфе, наибольшая по- полезная работа может быть произведена над объектом работы при обратимом процессе, в данном случае обратимом процессе в системе, так как в среде процесс всегда обратим. При этом
$28] МАКСИМАЛЬНАЯ РАБОТА ПЕКРУГОВЫХ ПРОЦЕССОВ 441 в B8,4) должен быть оставлен только знак равенства, и мы- приходим к соотношению -б/?. B8,7> Таким образом, максимальная полезная работа по абсолют- ной величине равна убыли величины R. В R входят как вели- величины, относящиеся к системе (именно, Е, V, S), так и величины, относящиеся к среде (р0, 7). Конкретное выражение для f)WM3VC, содержащее только- характерные параметры системы, может быть получено лишь для некоторых специального вида процессов, происходящих в системе. Предположим, что система совершает изотермический про- процесс Т — То — const и объем системы не изменяется. В случае системы, находящейся во внешнем иоле сил при заданных Т и V, состояние системы полностью определено. Если, однако, си- система находится во внешнем поле или является неоднородной, например, представляет собой смесь реагирующих веществ, то при заданных 7" и V состояние системы может измениться. По- Получаемая при этом работа I— 6W|>6(?— TS)= 6F, B8,8) где обозначено F - Е - TS. B8,9) Величина F, являющаяся мерой работы, которая может быть получена при изотермо-изохорическом процессе, происходящем в системе, взаимодействующей со средой, именуется свободной энергией системы. Мы видим, что на получение полезной работы может быть затрачена лишь часть внутренней энергии системы. Часть же, равная (TS) и именуемая связанной энергией, остается в системе. Другим важным случаем является процесс при постоянной температуре Т = То = const и постоянном давлении р = р0 — р= const. При этом |— 6W\>6(E + pV — TS) = 6O, B8,10) где ф = Е + pV-TS, B8,11) носит название термодинамического потенциала Гиббса. Термодинамический потенциал является мерой работы при- изотермо-изобарическом процессе, подобно тому как свободная энергия служит мерой работы при изотермо-изохорическом про- процессе и внутренняя энергия — в теплоизолированной системе. Можно легко показать, что полученные выражения справед- справедливы не только при постоянстве температуры и давления или объема, но также и в том случае, когда равенства Т = То и
¦442 ТЕРМОДИНАМИКА [Гл. IV р = Ро или Т — То и AV = 0 имеют место только в начальном и конечном состояниях системы. Действительно, например, при ?нач = Т1ти — То и Унач = VKOU имеем — \AW\ = (Е — ToS + poVKOH) — (? — § 29. Свойства термодинамических потенциалов Рассмотрим случай, когда работа (—8W), производимая си- системой, находящейся в среде, равна нулю. Тогда формула B8,5) приобретает вид p0V)<0. B9,1) Знак равенства относится к обратимым процессам, знак нера- неравенства — к необратимым. Величина R при всех процессах, про- происходящих в системе, взаимодействующей со средой, не увели- увеличивается. Для частных случаев выражение B9,1) упрощается. В случае замкнутой системы б? = 0 и 6V = 0, так что B9,1) превращается в прежнее соотношение: 6S > 0. B9,2) Другими важными случаями являются изотермо-изохориче- •ский и иэотермо-изобарический процессы, происходящие в си< стеме, при которых ее температура или давление равны соответ- соответствующим величинам для среды. В первом случае Т — То и ¦6V = 0, так что имеет место неравенство б (Е — T0S) = bF < 0. B9,3) Во втором случае Т = То и р — р0. Тогда 6(Е — T0S + p0V) = 6Ф < 0. B9,4) Таким образом, при необратимом изотермо-изохорическом процессе, происходящем в системе, взаимодействующей со сре- средой, ее свободная энергия уменьшается. При обратимом изо- изотермо-изохорическом процессе свободная энергия остается по* -стоянной. Свободная энергия является аналогом энтропии и по- подобно энтропии служит критерием обратимости и необратимости процесса. Если, например, некоторое вещество изотермически раство- растворяется в значительном объеме растворителя, то температура и объем системы остаются постоянными. Свободная энергия об- образовавшегося раствора будет меньше, чем свободная энергия растворителя и растворенного вещества, так что процесс яв- является необратимым. Аналогичными свойствами обладает термодинамический по- потенциал, но при изотермо-изобарическом процессе. На практике
$ 29] СВОЙСТВА ТЕРМОДИНАМИЧЕСКИХ ПОТЕНЦИАЛОВ 44$ изотермо-изобарические процессы встречаются особенно часто, так как с экспериментальной точки зрения всегда легче реали- реализовать условия для поддержания постоянного давления, чем по- постоянного объема. Например, в случае химических реакций го- гораздо проще сохранять постоянное давление в реакционном со- сосуде, чем поддерживать постоянный объем реагирующей смеси. Свободная энергия и термодинамический потенциал играют весьма существенную роль в термодинамике. Из неравенста B9,3) и B9,4) видно, что они заменяют энтропию в случае не- незамкнутых систем, тогда как из B8,8) и B8,10) следует, что они одновременно являются аналогами внутренней энергии. Напишем выражения для изменения свободной энергии и термодинамического потенциала при обратимом процессе. В об* щем случае формула B6,6) имеет вид 6E = TbS — p6V. B9,5) Вычитая из нее 8(TS), по определению свободной энергии, на- находим 6F = — Sf>T — p8V. B9,6). Таким образом, свободная энергия является функцией пере- переменных Т и V (или Я,). Из формулы B9,6) получаем Р---81- <29>8> Эти формулы аналогичны формулам B4,6). Поэтому свободная энергия является потенциалом по отно- отношению к переменным Т, V и X, Величины S, р и Л, получаю- получающиеся из F дифференцированием, играют роль обобщенных сил. Особенно важной является формула B9,8). Она определяет зависимость давления от объема и температуры, т. е. представ- представляет собой уравнение состояния. Прибавляя к B9,6) полный дифференциал 8{pV) и учиты- учитывая определение термодинамического потенциала, имеем 6Ф = 6 (Е — TS + рV) = — S6T.+, V&p. B9,9) Таким образом, термодинамический потенциал Гиббса является потенциалом по отношению к переменным Тир. Роль обобщен- ных сил играют величины S и V: <29>и> Поскольку на практике удобнее всего изменять или поддержи- поддерживать постоянными температуру и давление, термодинамический
444 ТЕРМОДИНАМИКА [Гл. IV потенциал Гиббса особенно часто применяется и иногда назы- называется основным потенциалом. Потенциалом относительно пары переменных р и 5 служит величина, называемая энтальпией: Н = Е + pV. B9,12) Для нее легко получить 6Н = T6S + Vbp, B9,13) откуда Т = (—~\ B9 14\ V = Если, кроме объема, состояние системы зависит от других внешних параметров X, то формулы B9,6), B9,9) и B9,13) мо- могут быть обобщены и записаны в виде 6F = — S5T-p6V-A6k, B9,16) № = SbT-V6p-A6\, B9,17) 6H = SbT + V6p-A6X B9,18) и, соответственно, m =-S) — №) . B9.19) Как будет видно из дальнейшего, термодинамические потен- потенциалы и их производные полностью определяют термодинами- термодинамическое поведение произвольной системы. Ниже мы рассмотрим методы теоретического и экспериментального определения тер- термодинамических потенциалов. Однако предварительно необхо- необходимо получить ряд термодинамических соотношений, связываю- связывающих термодинамические потенциалы и их производные между собой и с непосредственно измеряемыми величинами. § 30. Некоторые термодинамические соотношения Важнейшую роль в термодинамике играют теплоемкости: теплоемкость при постоянном объеме Cv и постоянном давле- давлении Ср, которые определяются соотношениями: (ЗОЛ) C0,2)
<§ 30] НЕКОТОРЫЕ ТЕРМОДИНАМИЧЕСКИЕ СООТНОШЕНИЯ 445 Используя формулу B6,6), находим Аналогично Из определения теплоемкостей ясно, что они являются адди- аддитивными величинами. Обычно удобно пользоваться молярными теплоемкостями, отнесенными к 1 грамм-молю вещества. В даль- дальнейшем, если это особо не оговорено, мы будем пользоваться молярными теплоемкостями. Теплоемкости представляют непо- непосредственно измеряемые термодинамические характеристики ве- вещества. Другим важным соотношением является формула B9,8). По- Поскольку свободная энергия является функцией независимых пе- переменных Т и V, формула B9,8) может быть записана в виде v>>- C0-5> Она определяет зависимость давления от температуры и объема, т. е. представляет уравнение состояния тела. Продифференцируем формулы B4,6), B9,7), B9,10) и B9,14) вторично, образовав вторые смешанные производные. Имеем, очевидно, / дт \ _ д ( дЕ \ _ д (дЕ \ _ /др\ \W)s-~dv\-dS~)--dsVdv)- — [-ds) и, аналогично, д*Р _(др\ dVdT ~{) ar\ д*н idv dpjs- dds -{ds Формулы C0,6) — C0,9) носят названия перекрестных соотно- соотношений Максвелла. Особенно важными являются второе и третье из этих соот- соотношений. Они связывают производные от энтропии с непосред- непосредственно измеряемыми величинами f-^f-)
446 ТЕРМОДИНАМИКА [Гл IV Термодинамические потенциалы Е и F, и Н и Ф не являются независимыми друг от друга. Легко установить связь между ними, если воспользоваться их определениями и определением энтропии. Так, из B8,9) и B9,7) находим E-f + rS-F-Г (¦§?¦). C0,10) Аналогично Формулы C0,10) и C0,11) носят название уравнений Гиббса — Гельмгольца. Уравнения Гиббса — Гельмгольца можно записать также & виде Е C0,12) Т2 дТ }р Т* • C0,13) Если известны зависимости энергии и энтальпии от темпера- температуры, интегрирование уравнений Гиббса—Гельмгольца позво- позволяет найти зависимость от температуры свободной энергии и термодинамического потенциала: F = — T jj?dT + const- T, C0,14) Ф = — Т jjfdT + const.T. C0,15) § 31. Приемы преобразования термодинамических величин В термодинамике часто приходится производить преобразо- преобразования термодинамических величин, например, преобразования переменных или замену одних величин, поддерживаемых по- постоянными в ходе процесса, другими. Такие преобразования нужно совершать по общим правилам замены переменных при дифференцировании по нескольким переменным. Один из прие- приемов таких преобразований мы здесь приведем'). ') Другой прием, основанный n<i использовании свойств якобианов, см. в книге Л. Д. Ландау иЕ. М. Лифшица, Статистическая физика, Гоо- техиздат, 1951, § 16.
§ 31] ПРИЬМЫ ПРЕОБРАЗОВАНИЯ 1ЕРМОДИНАМИЧЕСКИХ ВЕЛИЧИН 447 Пусть задана тройка переменных величин (х, у, z) такая, что каждую из них можно считать однозначной функцией двух других, т. е. Z=*z{x, у), У = у{х, z), х = х(у, z). Найдем связь между производными (-^г) и BE dy, у \ Оу ]х Для этого напишем очевидные равенства: m dx+m y\ ох /у \ ay i х ,п, ,\ дх \ , , / дх \ ' ' Подставляя dx из нижнего равенства в верхнее, имеем Поскольку dy — произвольная бесконечно малая величина, для выполнения C1,2) необходимо, чтобы Отсюда следует искомое соотношение: %т=-(?\- C1'3) дг\ \ дх )г ду)х Рассмотрим еще случай, когда имеются четыре величины (х, у, z, t), причем каждая пара величин полностью определена, если задана другая пара, т. е. t = t(xyy)=t{y,z)=t{x,z) и т. д. Представляя / как функцию пары переменных х и у, имеем То же изменение величины t как функции у и z можно написать в виде
448 ТЕРМОДИНАМИКА [Гл. IV Подставляя в C1,4) выражение dx из C1,1) находим C1,6) Сравнивая C1,5) и C1,6), находим дх C1,7) Приведем несколько примеров использования соотношений C1,3) и C1,7). 1. Найти связь между производными l^j и \~дГ) > ПР°" "" dS\ изводными -д— и -i-p • \др }т \ дг }р По формуле C1,3) имеем \дУ )т /дГ\ . ias\ - \avjs' \ат)у дТ C1,8) 2. Термическими коэффициентами именуются величины: a~Y\'w) ~~к0ЭФФии-иент теплового расширения, Р = — ("af") —термический коэффициент давления, = у \~д~) "" Изотермическая сжимаемость. Найти связь между ними. Из определений а и р* и C1,3) следует а "в — дТ 3. Найти отношение адиабатической и изотермической ежи- маемостей, выразив его через теплоемкости. Адиабатическая сжимаемость определяется как C1,10) 1 IdV
§ 31] ПРИЕМЫ ПРЕОБРАЗОВАНИЯ ТЕРМОДИНАМИЧЕСКИХ ВЕЛИЧИН 449 Аналогично, изотермическая сжимаемость будет По формуле C1,3) находим (дУ\ \др]у . (дул \др)у \ dp )s (dS_\ ' \др)т (дТ\ \dv)p \av)p Деля первое равенство на второе, имеем Vs = \dp)s _. \др)у\.дУ)р \дТ Ь (*УЛ (Щ (Ё§\ (Щ С C1,12) 4. Найти связь между (-^-)г и По формуле C1,3) имеед! )т (дТ\ ( (дн_\ - [др)„- \ ОТ )„ (А О \ ~дГ) И Поскольку устанавливается связь между четырьмя величи- величинами S, Т, р и V, следует воспользоваться формулой C1,7). Она дает Ё1\ дт)р Из соотношения Максвелла C0,7) и определения теплоемкостей находим С помощью C1,9) можно написать г -С ' дТ '" ¦ С \~др~)т 29 В. Г. Левин, том I
450 ТЕРМОДИНАМИКА |Гл IV 6. Найти связь между изотермической сжимаемостью уг = тт (-д—) и адиабатической сжимаемостью ys = — —?г("л~) • Используя C1,7), имеем V dp it \ dp is \ dS /о ' dp )г' С помощью формулы C0,8) и равенства (*SA „@S\ (дТ\ \dVJp \drJp\dVjp получаем It \ dp Is Ср \ дГ )Р \ dp js C1,16) dp )т \ dp )s Cp \ дГ )P \ dp )s Cp или Cp § 32. Определение термодинамических величин методами статистической физики Для определения введенных нами термодинамических вели- величин существуют две возможности: 1) вычисление их методами статистической физики, 2) нахождение их на основе некоторых тепловых измерений. Мы начнем с разбора методов вычисления термодинамиче- термодинамических величин. Как видно из формулы B1,3), внутренняя энергия любого тела может быть найдена, если известна его функция состоя- состояний Z. Согласно B4,8) энтропия также требует для своего на- нахождения вычисления функции состояний. Подставляя в определение свободной энергии значение S по B4,8), имеем F = E— TS = — kTlnZ. C2,1) Выражение F через Z оказывается особенно простым. Напишем еще явное выражение для давления. Согласно B 2,5) и B2,3) можно написать откуда
§ 32J МЕТОДЫ CTATHCTH4F.CKOFI ФИЗИКИ И ТЕРМОДИНАМИКИ 451 При этом мы воспользовались тем, что распределение вероятно- вероятностей остается неизменным, и подставили его явное выражение. Формулу C2,2) можно переписать в стандартном виде, выразив ее через функцию состояний Z. Для этого заметим, что е, е, dZ д dV д\ Поскольку Q(e,) представляет число состояний с данной энер- энергией, оно не зависит от объема системы и его не нужно диффе- дифференцировать. Из C2,3) следует: ei д In Z 1 dZ 1 V^ osi —jj- _ . , ,„о ... gy z~ ~dV ~ ~§Z~ ZU ~W \ l>' V>AV Сравнивая C2,4) и C2,2), мы видим, что давление может быть представлено в виде п-й dlnZ - ьт dlnZ П9 Ч\ Сопоставляя выражение C2,5) с выражением C2,1) для сво- свободной энергии, находим в соответствии с B9,8) <32,в) Из формулы C2,6) следует, что, зная функцию состояний системы Z, можно найти уравнение состояния системы. Дейст- Действительно, поскольку F = f(V, T), формула C2,6) устанавливает связь между давлением, объемом и температурой системы. Из хода доказательства видно, что никоим образом нельзя отождествить среднее значение производной -jp-, т. е. -^р-, ^ дг дЕ с производной по объему от средней энергии -jrr, т. е. -зтг. Последняя величина в силу C0,10) и B9,8), очевидно, равна dV dV V 1 дТ) P^ l дТ ' В дальнейшем изложении важную роль будет играть термо- термодинамический потенциал Гиббса Ф. Найдем его статистическое выражение. Из определения термодинамического потенциала следует, что, в отличие от свободной энергии, он является функ- функцией давления, а не объема. Иными словами, Ф является функ- функцией обобщенной силы Л = р, а не обобщенной координаты 29*
452 ТЕРМОДИНАМИКА [Гл. tV К = V. Именно с этим обстоятельством связана важная роль Ф в термодинамике — на опыте проще поддерживать постоянное значение давления и других обобщенных сил, чем объема и соответствующих обобщенных координат. Для получения статистического выражения для Ф необхо- необходимо найти зависимость функции состояний Z от обобщенной силы (давления р) как независимой переменной, т. е. Z = Z{T, p). В ходе предыдущего изложения мы считали, что энергетические уровни системы зависели от параметра X, т. е. Si = Ei(X). Те- Теперь мы будем считать переменной силу Л, а значение К — функцией Л. Рассмотрим в качестве примера сосуд с идеальным газом, обладающий подвижной стенкой. Если независимой переменной является внешний параметр — объем сосуда, системой является газ в сосуде. Если же независимой переменной является дей- действующая сила — внешнее давление, подвижную стенку следует включить в состав системы. Таким образом, подсистему образуют N молекул газа и под- подвижная стенка сосуда, так что всего подсистема будет иметь 3A/+J степеней свободы. Состояние ее будет характеризоваться координатами и импульсами всех молекул, а также положением и импульсом подвижной стенки. На подвижную стенку будет действовать давление р. Изме- Изменение давления будет приводить к изменению объема системы. Последнее в свою очередь приводит к смещению энергетических уровней системы. Напишем энергию системы (газ + подвижная стенка) в виде е* (/>) = е« + (ешт +>пот), где ei — энергия газа и (еКИн+еПот)—энергия стенки. Для нахождения потенциальной энергии стенки еПот заме- заметим, что работа, совершаемая над системой при изменении внешнего давления р на величину Ьр, равна = — V6p. Поэтому для Епот можно написать еПот = Vp. Кинетической энергией теплового движения стенки е1Шп можно пренебречь по сравнению с кинетической энергией молекул газа (поскольку число последних весьма велико). Поэтому оконча- окончательно имеем
§ 32] МЕТОДЫ СТАТИСТИЧЕСКОЙ ФИЗИКИ И ТЕРМОДИНАМИКИ 453 Функция состояний системы имеет вид it+pV Z (р, Г) = J 2 е~~^~ Q (Bt) dV, C2,7) i где суммирование ведется по всем уровням системы (значе- (значение Ej зависит от V), а интегрирование — по всему объему си- системы. По аналогии с C2,1) можно написать Ф = —ЙГ In Z(p, T). C2,8) Формула C2,8) показывает, что логарифмы функции состоя- состояний представляет свободную энергию в широком смысле: F в случае переменной V и Ф в случае переменной р. Поскольку в предыдущих рассуждениях не фигурировали конкретная при- природа системы, а также характер обобщенной силы, полученное выражение для Ф остается справедливым для любой системы и при любой обобщенной силе. Из формулы C2,8) можно найти средний объем системы и-(дФ\ - ЪТ д Найденные нами соотношения позволяют непосредственно выразить термодинамические функции — внутреннюю энергию тела, его свободную энергию, энтропию и давление через функ- функцию состояний Z. Значение функции состояний определяется мо- молекулярными свойствами системы — ее возможными энергети- энергетическими состояниями, а также температурой Т и объемом или давлением. Таким образом, мы приходим к важному выводу. Статисти- Статистическая физика позволяет находить значения термодинамических величин чисто расчетным путем, если только известны энергети- энергетические уровни системы и статистические веса соответствующих состояний. Однако роль и значение статистической физики не сводятся к этому весьма важному, но все же частному результату. Она позволяет придать термодинамическим величинам и понятиям более глубокий смысл и вскрывает физические законы, лежащие в основе термодинамического поведения системы. Так, мы ви- видели, что понятия термодинамической энергии, работы, энтро- энтропии и количества тепла получили ясную физическую интерпре- интерпретацию. Все эти понятия были связаны с молекулярными процессами, происходящими в системе. В полученных нами формулах нашло математическое выражение общее утвержде- утверждение о том, что теплота является формой движения. Правда, до сих пор мы не рассматривали конкретных фи- физических систем, не детализировали характера молекулярного
454 ТЕРМОДИНАМИКА [Гл IV движения и квантовых состояний системы. Конкретизации найденных закономерностей будут посвящены следующие главы, в которых общие законы статистической физики будут приме- применены к различным физическим системам. Та общность, с которой мы формулировали статистические законы, имеет очень существенные преимущества. Именно, бла- благодаря общности статистических законов, найденных перво- первоначально для систем, подчиняющихся законам классической механики, они и поныне нисколько не устарели и подверглись лишь незначительным видоизменениям, связанным с заменой классических систем квантовыми. Эта же общность законо» статистической механики позволила не ограничивать круг ге рассмотрения чисто тепловыми процессами, которые составили первоначальную основу статистики, но включить в него самые разнообразные свойства вещества — электрические, магнитные* химические и т. п. Эти свойства вещества будут рассмотрены в ч. IV книги. Пока же мы ограничимся изучением тепловых свойств вещества. § 33. Определение термодинамических величин из опытных данных Рассмотрим теперь общие методы нахождения термодинами- термодинамических величин из опытных данных. Прежде чем перейти к тер- термодинамическим потенциалам, обсудим вопрос об установлении шкалы абсолютной температуры. Для получения этой шкалы необходимо найти некоторую взаимосвязь между абсолютной температурой и эмпирической температурой, измеряемой в про- произвольной шкале любым термометром. 1 дЕ\ ( дЕ\ H и (-J Найдем связь между величинами (-jtH и I-^tH , восполь- зовавшись формулой C1,7): (дЕ\ _(дЕ\ ,(дЕ\ (dS \~dV)r~\dV js" Пользуясь B4,6) и C0,7), имеем Пусть теперь температура измеряется в произвольной эмпи- эмпирической шкале температур t, для которой можно написать t = f(T) или T = y(t). где / — неизвестная функция. Тогда, очевидно, (дЕ\ _(дЕ\ (_др_\ _(др\ Л \dVjj- \dV)t' \dTJv \dt)vdT'
4 33] ОПРЕДЕЛЕНИЕ ТЕРМОДИНАМИЧЕСКИХ ВЕЛИЧИН ИЗ ОПЫТА 455 Следовательно, \dV)t dt di )v d\nT ' откуда (IE.) (E) dlnT _ \dt)v = ^ v) (ЗЗД) {—)¦ \dV), dt + P В правой части уравнения C3,1) стоят только непосредствен- непосредственно измеряемые величины, выражаемые через объем V и эмпири- эмпирическую температуру t Поэтому, определив на опыте функцию y(t, V), можно, проинтегрировав C3,1), найти зависимость Г от t Фактически для установления абсолютной шкалы темпера- температур, например, при температурах, близких к абсолютному нулю «ли очень высоких, пользуются не только тепловыми, но и маг- магнитными или оптическими методами измерений. Перейдем теперь к методам нахождения термодинамических величин. Проще всего определение энтальпии. При постоянном давлении dH = TdS = Ср dT. Интегрируя, имеем т Н= \cp{T)dT + Ih. C3,2) г, Для экспериментального нахождения И(Т) необходимо изме- измерить теплоемкость Ср во всем интервале температур и знать Hi при некоторой температуре. Если, как это обычно бывает, нас интересуют изменения теплосодержания, то г ДЯ = Я (Г) - Я G*0 = J Ср (Т) dT г, и постоянная Н{ выпадает. Для абсолютного измерения Я необходимо воспользоваться свойствами Я при абсолютном нуле, устанавливаемыми третьим началом термодинамики (см. ниже § 35). При плавлении и парообразовании происходит рост энталь- энтальпии при фиксированной температуре (см. § 62). Нахождение энтропии производится по тем же значениям теплоемкости т т S= J -A^ + S^ J CpdlnT + Si. т, r,
456 ТЕРМОДИНАМИКА [Гл. IV Значение 5 получается графическим интегрированием кривой Ср = {(In Г). Изменение энтропии г AS = S (Г) - 5 (Ti) = J Cpd In Г. C3,3) т, Значение 5@) определяется третьим началом термодинамики (см. §35). Для нахождения энтропии жидкости и пара необходимо учи- учитывать изменение энтропии при поглощении скрытого тепла плавления и парообразования (см. § 62). Зависимость энтропии от давления определяется из формулы C0,8): Интегрируя, находим р 5 (Г, р) = — J aV dp + S {T, p.) C3,4) или для изменения энтропии р 5 (Т, p)-S (Т, р,) - — J aF dp. C3,5) Pi Зная уравнение состояния V = VG\ p), можно найти коэф- коэффициент теплового расширения а и по формуле C3,5)—зави* симость энтропии от давления. Зная Я, 5 и уравнение состояния, можно найти все осталь- остальные термодинамические потенциалы: Е = Н - pV, F^E-TS. Таким образом, для нахождения всех термодинамических потенциалов данного вещества необходимо: 1) измерить теплоемкость во всем интересующем интервале температур, 2) измерить коэффициент теплового расширения и 3) определить уравнение состояния. При этом Н, Е и S определяются с точностью до некоторой постоянной, представляющей значение этих величин при не- некоторой температуре, F и Ф — с точностью до линейной функ- функции температуры.
$ 84] ДРОССЕЛИРОВАНИЕ 457 В заключение следует остановиться на термодинамических потенциалах химических соединений. При образовании хими- химического соединения происходят изменения энтальпии АН и энтропии AS=—y~ (§ 67). Соответственно термодинамические потенциалы химических соединений аддитивно слагаются из их значений для исходных веществ и их изменений в ходе реакции. Введение термодинамических потенциалов позволяет в прин- принципе определить термодинамические потенциалы любых слож- сложных веществ, если известны термодинамические потенциалы входящих в них элементов и теплоты химических реакций обра- образования соединений. § 34. Дросселирование Важную роль в современной технике играет процесс, при котором газ, занимавший первоначально объем Vi при постоян- постоянном давлении ри выходит из сосуда и переходит, снова при постоянном давлении рг, в сосуд с объемом Уг- Этот процесс получил название процесса дросселирования или процесса Джо- Джоуля — Томсона. Процесс дросселирования является одним из основных мето- методов получения низких температур в современной криогенной технике. Фактически процесс дросселирования осуществляется путем медленного продав'ливания газа из одного сосуда в дру- другой через систему тонких капилляров, представляющих большое гидродинамическое сопротивление протеканию газа. Большое гидродинамическое сопротивление обеспечивает малую макро- макроскопическую скорость движения газа. Продавливаиие газа про- производится в адиабатических условиях, для чего аппарат покры- покрывается теплоизолирующим материалом. Поскольку к системе не подводится тепло, а диссипацией энергии из-за трения (ввиду малой скорости движения газа) можно пренебречь, изменение внутренней энергии газа Д? рав- равно механической работе, производимой над газом, Д? = Е2 — ?i = W, где Е\ и Е2 соответственно энергия газа в начальном и конеч- конечном состояниях. Последняя слагается из производимой над га- газом работы сжатия при давлении р\ (от начального объема Vi до конечного объема, равного нулю) и производимой газом ра- работы расширения при давлении р2 (от начального объема, рав- равного нулю, до конечного объема V2), т. е. Uо v, «. " Pl dV + J p2dV = -{p2V2 - о /
458 ТЕРМОДИНАМИКА [Гл IV Поэтому для процесса дросселирования можно написать или Я, = Я2. C4.1 > Таким образом, процесс дросселирования представляет про- процесс при постоянной энтальпии газа. Считая давления р\ и рч весьма близкими (причем рц < р\. Ар <0), найдем изменение температуры газа с изменением дав- давления в процессе дросселирования. Это изменение характери- характеризуется производной %==(~з"-) i именуемой характеристикой диф- дифференциального эффекта дросселирования. Значение последней было найдено выше (см. C1,13)). Запишем C1,13) в виде (дН\ ( д (Ф + TS) \ \ д) \ д ) ( ( \ дР)т _ \ др )т др)н (дН\ Ср \дТ)р t C4i2> Применим прежде всего формулу C4,2) к идеальному газу. При этом, очевидно, *=(?)„=<>• При дросселировании идеального газа не происходит изменения его температуры. Смысл этого результата очевиден: внутренняя энергия идеального газа не зависит от объема и не изменяется при его расширении. Иначе дело обстоит с реальным газом, у которого энергия взаимодействия между молекулами и, следо- следовательно, внутренняя энергия зависит от объема. Теория реаль- реального газа будет изложена в § 46—47. В приближении уравнения D7,2) находим Х- Ср ~ 2СР где р — постоянная, входящая в уравнение Ван-дер-Ваальса. Поскольку Ср > 0, знак % определяется знаком числителя. Из определения р D6,14) находим <34-3>
1 %] ТРЕТЬЕ НАЧАЛО ТЕРМОДИНАМИКИ 459 При высоких температурах в области притяжения г > d. u(r)<g.kT и е~и1ЬТ f» \. В области отталкивания r<d, u(r)*s> и e кт <С 1. При этом все подинтегральное выражение в C4,3) отрицательно и р—7"-^S-<0. При низких температу- температурах в области притяжения г > d, |ы(г)|>?Г и -^р>>1. При этом подинтегральное выражение положительно и Р-Г-f >0. Таким образом, х < 0 и температура газа при дросселирова- дросселировании повышается при высоких температурах; )[>0 и темпера- температура газа при дросселировании понижается при низких темпе- температурах. При некоторой температуре, именуемой точкой инверсии данного газа, его коэффициент % = 0. Осуществляя дросселирование при температурах ниже точки инверсии, можно охлаждать газы до весьма низких температур. Дросселирование является одним из широко распространенных методов охлажде- охлаждения газов. § 35. Третье начало термодинамики Рассмотрим поведение некоторой макроскопической (термо- (термодинамической) системы при весьма низких температурах. Мы будем считать, что система находится в состоянии статистиче- статистического равновесия с энергией ё, так что ее энтропия опреде- определяется формулой Больцмана. Пусть возможные значения энер- энергии системы (ее энергетические уровни) образуют последова- последовательность во, еь С2, ез ... , где во — наименьшая возможная энергия (нормальный уровень системы), а еь е2, е3 ... — воз- возбужденные энергетические уровни. Уровни энергии весьма быстро сближаются с ростом возбуждения. Однако чрезвычайно важным является то обстоятельство, что расстояние ei — ео = = Дё между нормальным и первым возбужденным уровнями является конечной, хотя и чрезвычайно малой величиной. Если температура системы достаточно низка, так что тепло- тепловая энергия kT значительно меньше расстояния между нижним и первым возбужденным уровнями, т. е. kT <C Ае, то тепловые возбуждения системы недостаточны для того, чтобы система могла попасть в состояние ъ\. Поэтому при весьма низкой тем- температуре система должна находиться в состоянии с наименьшей энергией ео. Термодинамическая энергия системы равна, оче- очевидно, Ео = ео C5,1),
460 ТЕРМОДИНАМИКА [Гл. IV и не зависит от температуры (при Т <С ~^")> Отсюда следует, что теплоемкость системы при постоянном объеме Найдем теперь энтропию системы. По формуле Больцмана энтропия равна 5 = k In fio, C5.3) где Qo — число состояний системы с энергией so. Но при абсо- абсолютном нуле равновесная система находится во вполне опреде- определенном состоянии, энергия которого точно равна Ео. Мы знаем, однако, что если энергия системы точно определена, то тем са- самым определено состояние системы. Поэтому число состояний с энергией ео равно просто единице1). Тогда из формулы C5,3) следует, что энтропия системы при абсолютном нуле равна нулю, 5 = 0 при 7->0. C5,4) Условие C5,4) было впервые установлено Нернстом и полу- получило название третьего начала термодинамики, или тепловой теоремы Нернста. Оно было выведено не статистически, а на основе анализа экспериментальных данных, в частности, по теп- тепловым эффектам химических реакций при низких температурах. Условие C5,4) не является следствием первого и второго начал термодинамики. Вместе с тем его роль в современной термодинамике весьма существенна. Как мы указывали уже в § 33, для определения значения термодинамических потенциалов из эмпирических или статисти- статистических данных нужно знать их значение при абсолютном нуле. Третье начало позволяет это сделать. Необходимо подчеркнуть, что третье начало термодинамики тесно связано с квантовым характером системы. Если бы рас- рассматриваемая нами система подчинялась законам классической механики, то ее энергия изменялась бы непрерывно. Поэтому, как бы ни была низка температура Т, энергия теплового воз- возбуждения kT, имеющаяся в системе, была бы бесконечно велика по сравнению с бесконечно малым расстоянием, на которое разделены энергетические уровни в классической системе. Ко- Конечному интервалу энергии kT соответствовало бы бесконечно большое число возможных состояний Q. При этом энтропия ') Если случайно состояние с энергией ео является вырожденным и энер- энергией е0 обладает несколько состояний, то дело не изменяется. Если йо(ео) — небольшое число, то А1пЙ0(ео) практически равно нулю ввиду крайней ма- малости к.
§ 35] ТРЕТЬЕ НАЧАЛО ТЕРМОДИНАМИКИ 461 была бы велика при любой как угодно низкой (но конечной) температуре. Квантовый характер реальных систем, весьма слабо прояв- проявляющийся при высоких температурах, приобретает, как мы ви- видим, первостепенное значение при очень низких температурах. Это находится в полном согласии с общими положениями, вы- высказанными в § 1. Недостатком этого рассуждения является то обстоятельство, что оно не учитывает флуктуации в системе при низкой температуре. При низкой температуре 7—>0 число эффективных степеней свободы становится малым и в системе возможны значительные флуктуации. Поэтому неясно, можно ли вообще говорить о за- задании в системе средних величин, в частности термодинамиче- термодинамических функций. Нужно еще сказать несколько слов по поводу постоянной энтропии. Хотя мы и пишем 5 = 0 при Т—>0,,фактически следо- вало бы формулу C5,4) писать в виде (см. § 24) S-* const при Т-*0. C5,5) Постоянная в формуле C5,5) не может быть определена, по- поскольку она является произвольной постоянной интегрирования. Значение постоянной в C5,5) не зависит от давления, объ- объема и других параметров, характеризующих состояние системы. В каком бы состоянии ни находилось вещество — в виде хими- химического соединения или чистого вещества, при большой или ма- малой плотности и т. п., — значение этой постоянной будет одним и тем же. Разность энтропии двух термодинамических состояний одной системы, которые отличаются различными значениями парамет- параметров, стремится к нулю при Т—>0. Так, например, энтропия Si смеси двух молей элементов А и В а энтропия 5г одного моля их соединения АВ равны друг другу при Т-*0. Именно такого типа утверждение следует из тех опытных данных, которые позволили установить третье начало в термо- термодинамике. Довольно часто приходится встречаться с утвержде- утверждением о том, что с помощью третьего начала термодинамики можно определить постоянную интегрирования в формуле для энтропии и тем самым определить ее абсолютное значение. Рас- Рассуждения этого параграфа и § 24 ясно показывают, что абсо- абсолютная величина энтропии не имеет физического смысла: энтропия по самому своему существу определена с точностью до произвольной постоянной. Смысл третьего начала состоит не в том, что оно позволяет находить абсолютное значение энтропии, а в том, что оно уста- устанавливает постоянство ее при Г—»0 (в смысле независимости от параметров, характеризующих состояние). Значение этой
462 ТЕРМОДИНАМИКА [Гл IV постоянной может быть выбрано за начало отсчета значений энтропии. Часто третье начало термодинамики формулируют как прин- принцип недостижимости абсолютного нуля. Такая формулировка вы- вытекает из условия C5,4). Если энтропия системы S = 0, то с ее помощью можно построить вечный двигатель второго рода, с помощью цикла из двух адиабат 5 = Si и S = S2. соединенных изотермой Т = 0 (на которой 5 = 0) и второй произвольной изо- изотермой. Однако нужно заметить, что недостижимость абсолют- абсолютного нуля не противоречит принципиальной возможности полу- получения температур, как угодно мало отличающихся от Т — 0. В ходе предыдущих рассуждений считалось, что система находится в состоянии равновесия. Однако мы не делали ника- никаких предположений относительно ее агрегатного состояния. По- Полученное нами выражение C5,4) должно быть справедливо в равной мере для твердых, жидких или газообразных систем. Существует только одна система, остающаяся жидкой вблизи абсолютного нуля — гелий II. Что же касается газов, то все обычные газы при достаточном давлении конденсируются за- задолго до тех низких температур, при которых энтропия стре- стремится к нулю. Поэтому упругость насыщенного пара над твер- твердым телом при Г->0 совершенно ничтожна. Существуют, однако, системы, которые можно условно считать газообраз- газообразными при Т—>0. Это прежде всего электронный газ в металлах, свойства которого будут нами более подробно рассмотрены в § 79—80. Все обычные вещества при достаточно низкой температуре переходят в твердое состояние. Нужно заметить, что, помимо истинных твердых тел — кристаллов, довольно много веществ находится в твердообразном, или аморфном, состоянии. Хотя аморфные тела могут обладать рядом свойств, очень сходных со свойствами истинно твердых тел, они в действительности представляют собой переохлажденные жидкости. На свойствах переохлажденных жидкостей мы остановимся несколько ниже. Справедливость третьего начала термодинамики проверялась на опыте разнообразными способами для большого числа веществ. Хотя опытные данные, подтверждающие справедли- справедливость третьего начала термодинамики, не являются еще столь многочисленными и разносторонними, как опытные данные, под- подтверждающие второе начало, они не оставляют никакого co.\f- нения в его справедливости. Наиболее точным методом провер- проверки является изучение химических равновесий при низких темпе- температурах. Для ряда веществ были проведены прямые измерения теп- теплоемкости, на основе которых были найдены значения энтропии; последние сравнивались с теоретически вычисленными на основе
ТРЕТЬЕ НАЧАЛО ТЕРМОДИНАМИКИ 463 предположения S = О при Т -* 0. Примером результатов такой прямой проверки служит табл. 1. Таблица 1 Энтропия HCI из экспериментальных калориметрических данных Агрегатное Твердая Жидкая Газообразная Интервал температур 0-16° К 16-98,36° К 98,36° К Фазовый переход в другую кри- кристаллическую модификацию 98,36-158,91° К 158,9 Г К - плав лен ие 158,91-188,07° К 188,07° К-кипение 188,17° К !ЯЗ,17°К Метод нахождения Экстраполяция кривой, полученной при более высоких температурах Из измеренных значении теплоемкости .... Из теплоемкости .... Скрытое тепло .... Из теплоемкости . . . Скрытое тепло Итого ... Измеренная энтропия Вычисленная теоретиче- теоретически с поправкой на неидеалыюстыаза . . Энтропия, кал моль'град 0,30 7,06 2,89 5,05 3,00 2,35 20,52 41,17 41,2 41,3 Наконец, для многих веществ производилась эксперимен- экспериментальная проверка некоторых следствий из третьего начала. Так, например, из условия C5,4) вытекает также, что Но %L\ =0 др)т при Т->0. \др)т~ дрдГ ~~ \ Поэтому из третье! о начала термодинамики следует, что коэф- коэффициент теплового расширения должен обращаться в нуль при Т—*0. Измерения его для ряда кристаллов (алмаз, НС1, Си и др.) полностью подтвердили этот вывод. Однако для ряда веществ измерения энтропии показали,что условие 5 = 0 при Т—>0 оказывается невыполненным. Число таких веществ сравнительно велико. К ним относятся все аморф- аморфные тела, сплавы, а также ряд химических соединений: СО, NO, HjO и т. д. Существование таких многочисленных исключений
464 ТЕРМОДИНАМИКА [Гл. IV из третьего начала заставляло высказывать сомнение в его об- общей применимости. Статистическая интерпретация третьего на- начала позволила выяснить истинное происхождение таких нару- нарушений. При выводе третьего начала мы предполагали, что наша система находится при абсолютном нуле в состоянии равнове- равновесия и при стремлении температуры к нулю переходит в состоя- состояние с наименьшей энергией ео. Существуют, однако, системы, не находящиеся в равновесии при Т-+0, к которым неприме- неприменимо третье начало термодинамики. Эти системы обладают при абсолютном нуле энтропией, отличной от нуля. Мы говорили уже, что время релаксации может изменяться в чрезвычайно широких пределах и в ряде случаев достигать очень больших значений. Это особенно относится к низким тем- температурам, когда тепловая энергия невелика. При этом установ- установление состояния равновесия происходит особенно медленно. Для конкретности представим себе, что наша система построена из двухатомных молекул (например, молекул СО), образующих а) б) Рис. 43. правильную кристаллическую решетку. На рис. 43 каждая мо- молекула схематически изображена стрелочкой, один конец кото- которой изображает атом углерода, а второй — кислорода. Возмож- Возможны два типа ориентации молекул СО в решетке, схематически изображенные на рис. 43, с и б. В одном случае имеется совершенно беспорядочная ориен- ориентация молекул, й другом — регулярная. Все свойства атомов углерода и кислорода настолько близки, что между обоими видами кристалла, с правильно и хаотически ориентированными молекулами, имеется весьма незначительное различие. Их сим- симметрия и основные свойства совершенно идентичны. Различие в энергиях обоих состояний весьма невелико. Полному равно- равновесию при Г—»-0 соответствует состояние с регулярной ориента- ориентацией молекул, энергия которого оказывается несколько ниже, чем энергия состояния с хаотической ориентацией. Однако при более высоких температурах равновесной является хаотическая ориентация молекул. СО кристаллизуется при относительно вы- высокой температуре, когда хаотическое распределение ориента- ориентации является равновесным. При понижении температуры до Т «С —г" °110 оказывается неравновесным, так что молекулы и должны были бы перейти в состояние с правильной ориента-
$ 35) ТРЕТЬЕ НАЧАЛО ТЕРМОДИНАМИКИ 465 цией. Однако переход молекул из хаотического в регулярное распределение при низких температурах происходит настолько медленно, что при разумно больших временах наблюдения пол- полное равновесие не успеет установиться. Система при сколь угодно низкой температуре будет находиться в состоянии с бес- беспорядочной ориентацией молекул. Это состояние будет факти- фактически реализующимся состоянием с наименьшей возможной энергией. Оно не является равновесным, поскольку при регу- регулярной ориентации энергия системы была бы еще меньшей, но вместе с тем при низких температурах, когда скорость процесса ориентации становится весьма малой, в этом состоянии система может находиться чрезвычайно долго (практически как угодно долго). Состояние с хаотическим распределением ориентации является, таким образом, метастабильным состоянием. К си- системе, находящейся в метастабильном состоянии, неприменимы приведенные выше рассуждения, и ее энтропия не удовлетво- удовлетворяет условию C5,4). Не представляет труда нахождение энтропии системы с вполне беспорядочным расположением молекул. Каждая моле- молекула с равной вероятностью может находиться в двух состоя- состояниях, отличающихся только разной ориентацией. Если система содержит N молекул, то полное число состояний равно, очевид- очевидно, Qo = 2N (при этом ввиду простоты задачи нет надобности выражать это число через фазовый объем). Энтропия системы при абсолютном нуле равна Измеренное значение энтропии СО при Г—*0, в хорошем со- согласии с теорией, оказывается равным 1,1 кал/моль • град. Мы видим, что энтропия системы действительно отлична от нуля, причем ее величина близка к теоретической. Третье начало термодинамики имеет очень большое значе- значение для нахождения значений термодинамических функций. При его практическом использовании нужно, однако, всегда иметь в виду то, что оно относится лишь к системам, находящимся в равновесном состоянии, и неприменимо к метастабильным си- системам. Приведенный пример не является единичным. В § 54 мы вернемся еще к вопросу о поведении систем при низких тем- температурах и приведем другие примеры кажущихся отклонений от третьего начала термодинамики. Во всяком случае, возмож- возможность применения третьего начала термодинамики часто бывает не очевидной и требует большой осторожности. До появления статистического вывода третьего начала, когда не были еще выяснены границы его применимости, неосмотрительное 30 В. Г. Лсвич, том I
466 ТЕРМОДИНАМИКА [Гл IV применение третьего начала к метастабильном системам приво- приводило к противоречиям, о которых было сказано выше. Нужно еще заметить, что. хотя третье начало термодинамики является весьма важным положением, степень его важности для науки вряд ли можно сравнивать со степенью важности второго начала. В этом смысле термин «третье начало» является не вполне удачным. § 36. Статистический характер второго начала термодинамики В предыдущих параграфах мы установили, что закон воз- возрастания энтропии, представлявший в термодинамике непосред- непосредственное обобщение результатов опытов, приобретает новое, более глубокое и вместе с тем ясное содержание в свете рас- рассуждений статистической физики. Закон возрастания энтропии с точки зрения статистической физики представляет выражение статистических закономерностей, проявляющихся в системах, состоящих из очень большого числа молекул. В этих системах благодаря силам межмолекулярного взаимодействия всегда происходит переход из менее вероятных в более вероятные со- состояния до тех пор, пока система не приходит в наиболее ве- вероятное состояние — состояние полного статистического равно- равновесия. Этот переход из неравновесного состояния в равновесное совершается путем сложных процессов, в которых принимает участие огромное число молекул. Механизм установления рав- равновесия и характер происходящих при этом процессов во многих отношениях зависят от конкретных свойств системы. Простейшим примером может служить установление равно- равновесия— молекулярного хаоса — в идеальном газе. Молекуляр- Молекулярный хаос устанавливается в результате соударений молекул со стенкой и между собой. Сейчас нас будет интересовать вопрос не о том, как именно установится равновесие в системе, а лишь тот факт, что оно обязательно установится за гот или иной промежуток времени. Мы видели, что статистическая формулировка второго начала термодинамики отличается от термодинамической в одном весь* ма важном отношении: в ней употреблены слова: «наиболее вероятным ходом процессов», тогда как в термодинамике го- говорится просто о ходе процессов. Формулировка статистической физики имеет значительно менее категорический характер. Она нисколько не исключает, а наоборот, предусматривает возмож- возможность процессов, в ходе которых система переходит из более вероятного в менее вероятное состояние и энтропия ее умень- уменьшается. Существование таких процессов, названных флуктуа- циями, полностью отрицается в термодинамической формули* ровке второго начала.
•§ 3G] СТАТИСТИЧЕСКИЙ ХАРАКТЕР ВТОРОГО НАЧАЛА 467 Например, представим себе, что газ занимает половину сво- свободного объема. Согласно законам термодинамики газ должен расшириться и занять весь объем, причем это расширение бу- будет сопровождаться возрастанием энтропии. С точки зрения ста- статистической физики такое поведение газа является наиболее вероятным. Однако не исключается и возможность того, что газ ¦будет не расширяться, а сжиматься. В макроскопической си- системе последний процесс имеет вероятность ничтожно малую по сравнению с вероятностью процесса расширения. Поэтому на практике в макросистемах всегда будет наблюдаться первый процесс. Большее значение имеют флуктуации, происходящие в си- системе, уже находящейся в равновесии. Представим себе тот же газ, наполняющий весь объем с равномерной плотностью и на- находящийся в состоянии равновесия. Если этот газ не будет подвергаться воздействию извне, то с точки зрения термодина- термодинамики он будет неопределенно долго находиться в этом состоя- состоянии. Статистическая физика утверждает, что, хотя подавляюще большую часть времени газ будет находиться в состоянии рав- равновесия и занимать весь объем, не исключена возможность флуктуации, в ходе которых газ будет самопроизвольно выхо- выходить из состояния равновесия. В частности, газ может самопро- самопроизвольно переходить в состояние, в котором он занимает не весь, а лишь часть объема. Вероятность такого перехода опре- определяется формулой Больцмана. Мы не будем сейчас останавливаться на разборе конкретных примеров флуктуации, поскольку этому важному явлению будет посвящена гл. VIII. Подчеркнем лишь, что опыт целиком под- подтвердил предсказания статистики относительно существования в природе таких самопроизвольных процессов, идущих с умень- уменьшением энтропии. Но тогда, естественно, возникает вопрос: не противоречит ли статистическая формулировка второго начала чисто термодинамической? Не следует ли из статистической формулировки второго начала, что построение вечного двига- двигателя второго рода является трудной, но в принципе осуществи- осуществимой задачей; нельзя ли для ее решения использовать флуктуа- ционные процессы, идущие с убылью энтропии? Вопрос этот -служил предметом дискуссии в течение ряда лет, и решение «го оказалось весьма плодотворным для развития основных положений статистической физики. Но прежде чем дать ответ на этот вопрос, необходимо разобрать другой, не менее слож- сложный вопрос, логически ему предшествующий: как вообще могло случиться, что, рассматривая молекулярные процессы, мы при- пришли к идее о необратимости? Хорошо известно, что законы механики являются строго об- обратимыми. Это видно хотя бы из того факта, чго уравнение 30*
468 ТЕРМОДИНАМИКА [Гл. IV классической механики т dt2 ~r остается неизменным при обращении знака времени. В области внутриатомных процессов также царит полная обратимость: из законов квантовой механики вытекает принцип микроскопиче- микроскопической обратимости, устанавливающий, что для всех микроскопи- микроскопических атомных или молекулярных процессов вероятности пря- прямых и обратных процессов равны друг другу. Таким образом, в элементарных законах молекулярных процессов отсутствует необратимость. Все процессы строго сим- симметричны по отношению к будущему и прошедшему. С другой стороны стати- статистическая физика, основанная на моле- молекулярных законах, приводит к появле- \ нию необратимости. На первый взгляд q-^ j^q может показаться, что законы статисти- статистической физики противоречат законам Рис 44. молекулярного движения, на основе ко- которых они были выведены. В действи- действительности, однако, дело обстоит не так. Возрастание эн- энтропии имеет место тогда, когда первоначально система на- находилась в некотором неравновесном состоянии. При этом наиболее вероятным поведением системы с течением вре- времени будет переход ее в состояние равновесия. На рис. 44 по оси абсцисс отложено время, по оси ординат — энтропия; сплошной кривой изображен этот наиболее вероятный переход, пунктиром — мало вероятный переход в состояние с меньшей энтропией1). Здесь направление времени, различие между на- начальным и конечным моментом времени выступают с полной очевидностью. Но если вдуматься внимательнее в это рассуж- рассуждение, то можно заметить, что мы всегда начинаем рассмотре- рассмотрение с заведомо неравновесного состояния системы. В самой постановке задачи скрыта некоторая асимметрия; мы говорим: вначале задано неравновесное состояние; что будет происхо- происходить с системой, предоставленной самой себе, потом? Попы- Попытаемся, однако, представить себе, откуда могло возникнуть это начальное неравновесное состояние. Оно могло возникнуть либо путем вмешательства в систему извне, либо в замкнутой ') Следует отметить, что приведенные здесь и ниже рисунки нужно счи- считать схемой, служащей для пояснения свойств энтропии В действительности в системе, состоящей из частей, строго определено значение энтропии в те- течение некоторого конечного промежутка времени, но не в каждый данный момент. Поэтому график S(t) нельзя понимать буквально (см. В Г. Л е в и ч, Введение в статистическую физику, Гостехиздат, 1954, § 35).
СТАТИСТИЧЕСКИЙ ХАРАКТЕР ВТОРОГО НАЧАЛА 46» системе самопроизвольно. В первом случае ясно, что отсут- отсутствие симметрии в поведении системы по отношению к прошед- прошедшему нисколько не противоречит обратимости законов молеку- молекулярных процессов. Оно связано с асимметрией самих условий задачи: в прошлом система подвергалась воздействиям извне, в будущем она предоставлена самой себе. Более важным, но ме- менее наглядным является такой случай, когда система не под- подвергалась никаким воздействиям извне, а пришла в данное (начальное для нашего предыдущего рассмотрения) состояние самопроизвольно, оставаясь все время замкнутой. Спраши- Спрашивается, в каком состоянии замкнутая система находилась до того, как она пришла в данное состояние? Она могла прийти в данное неравновесное состояние из еще более неравновесного- или, наоборот, из равновесного состояния. Но всякая макро- макроскопическая система основную часть времени находится в со- состоянии статистического равновесия. Если мы спросим, в каком состоянии находилась система при /<0, то из самых общих соображений ясно, что с подавляюще большой вероятностыо- она находилась в состоянии равновесия. Поэтому в данное не- неравновесное состояние система чаще всего приходит из равно- равновесного состояния. Иными словами, для того чтобы система могла прийти в неравновесное состояние, заданное при /=0, она при /<0 должна была испытать флуктуацию. На рис. 45 сплошной кривой изображен наиболее вероятный процесс, при- приводящий систему в состояние, которое являлось исходным для процессов, изображенных на рис. 44. Не исключено, конечно* о Рис. 45. /\ о Рис. 46. 1 что данное при t — О неравновесное состояние возникло из дру- другого, еще более неравновесного состояния, как это изображено на рис. 45 пунктиром. Но поскольку вероятность найти замкну- замкнутую систему в неравновесном состоянии мала, такой случай яв- является мало вероятным. Совместим теперь оба рисунка, т. е. рассмотрим весь процесс во времени. Тогда мы получим кривые, изображенные на рис. 46, совершенно симметричные но отно- отношению к будущему и прошедшему. Асимметрия второго нача- начала—указание на то, что энтропия будет возрастать в будущем,.
470 ТЕРМОДИНАМИКА [Гл IV оказывается, таким образом, связанной с асимметрией началь- начального условия — заданием в начальный момент времени системы в неравновесном состоянии. Представим себе теперь, что состояние замкнутой системы задано как равновесное состояние, отвечающее максимальному значению энтропии (рис. 47). Согласно положениям термоди- термодинамики во все дальнейшее время система будет находиться в рав- равновесном состоянии и энтропия ее будет оставаться постоянной. Статистическая физика допуска- допускает возможность самопроизволь- самопроизвольного выхода системы из равно* -ч> у^—i весного состояния — флуктуации. h / Как мы видели выше, вероят- вероятность флуктуации резко умень t шается с ее величиной. Поэтому, Рис. 47. для того чтобы мы могли за- заметить флуктуацию, необходимо наблюдать за системой в течение достаточно большого проме- промежутка времени, во всяком случае много большего, чем время релаксации %. Кроме того, вероятность флуктуации весьма су- существенно зависит от размеров системы (числа частиц в ней). Если мы будем следить за поведением замкнутой системы, на- находящейся в момент времени t = 0 в состоянии равновесия, то мы увидим, что энтропия этой системы будет убывать (участки ab и de на кривой рис. 47) и возрастать (участки be и ef) оди- одинаково часто. Впрочем, это лишь совпадает со сказанным ранее; в сущности, процесс, изображенный па рис. 46, является част- частным случаем процесса, изображенного на рис. 47, и отвечает одному из зубцов на этом последнем. Таким образом, мы видим, что если отрешиться от асим- асимметрии в постановке вопроса, т. е. не задаваться в начальный момент времени мало вероятным (неравновесным) состоянием системы, то закон «возрастания» энтропии теряет свой одно- односторонний смысл и становится симметричным по отношению к будущему и прошедшему. Это можно сформулировать еще и следующим образом: в течение достаточно "большого проме- промежутка времени в замкнутой системе число переходов из равно- равновесного состояния в неравновесное равно числу обратных пе- переходов из неравновесного состояния в равновесное. Это равенство возникает потому, что число первых равно большому числу начальных (равновесных) состояний, умноженному на малую вероятность флуктуации. Число вторых равно малому числу начальных (неравновесных) состояний, умноженному на большую вероятность перехода в равновесное состояние (ре- (релаксации). В системе, являющейся всегда замкнутой, энтропия возрастает и убывает одинаково часто.
§ 36] СТАТИСТИЧЕСКИЙ ХАРАКТЕР ВТОРОГО НАЧАЛА 471 В практике, однако, чаще всего приходится иметь дело с си- системами, находящимися в начальный момент времени в задан- заданном неравновесном состоянии. В случае всегда замкнутой си- системы всякое неравновесное состояние можно рассматривать как флуктуацию. Если мы будем наблюдать за последующим изменением состояния системы в течение времени, сравнимого с временем релаксации или меньшим, то наиболее вероятным ходом процессов будет возрастание энтропии. Кажущаяся асимметрия возникает при этом из-за асимметрии в постанов- постановке задачи. Возможно также, что в неравновесное состояние система по- попала в результате внешнего воздействия, которое после этого прекращается. В этом случае система является изолированной не всегда, а лишь начиная с некоторого момента времени. В дальнейшем ее энтропия будет возрастать. Здесь асиммет- асимметричный ход энтропии связан с существом дела — наличием в прошлом воздействия на систему извне. Мы видим, что различие между необратимыми и обратимы- обратимыми процессами становится весьма условным и никакого про- противоречия между обратимостью законов механики и существо- существованием необратимых процессов в статистике нет. В связи с условным характером понятий обратимости и необратимости воз- возникает необходимость в более четком критерии необратимых и обратимых молекулярных процессов. Чтобы подойти к этой фор- формулировке, рассмотрим еще один конкретный пример. Представим себе некоторый объем в сосуде, занятом смесью двух газов. Пусть в некоторый начальный момент времени за- задано неравновесное состояние газа: в рассматриваемом объеме имеется отклонение состава газа от однородного на 1%. Если газ предоставлен самому себе, то с вероятностью порядка еди- единицы по прошествии времени релаксации газы смешаются и система перейдет в состояние с однородной плотностью. При этом энтропия газа будет увеличиваться. С точки зрения чистой термодинамики мы имеем классический пример необратимого процесса. Разберем, однако, этот процесс более внимательно со статистической точки зрения. Система действительно самопроиз- самопроизвольно перейдет от неравномерного к равномерному распреде- распределению молекул в смеси. Но нельзя утверждать, что начальное состояние уже никогда не повторится и что система будет во все дальнейшее время находиться в состоянии с равномерным распределением молекул. Наоборот, в системе будут происхо- происходить флуктуации, в результате которых равномерность состава газа будет нарушаться. По прошествии достаточно большого времени в системе, предоставленной самой себе, обязательно произойдет флуктуация такого масштаба, что отклонение от однородности в выделенном объеме достигнет 1%, и система
472 ТЕРМОДИНАМИКА [Гл IV вернется в начальное состояние. Возвращение системы в началь- начальное состояние показывает, что процесс взаимной диффузии га- газов нельзя считать необратимым. Рассматриваемый процесс мо- жно назвать процессом обращающимся. Мы вновь приходим, казалось бы, к полному противоречию <.• чистой термодинамикой. Однако в какой мере это противоре- противоречие имеет практическое значение, зависит от масштаба явления и времени, требуемого для возвращения системы в начальное состояние. Последнее можно считать, грубо говоря, обратно пропорциональным вероятности флуктуации соответствующего масштаба. Можно поэтому считать, что время, требующееся для возвращения системы в начальное состояние, тем больше, чем больше размеры системы и чем сильнее различие между на- начальным и равновесным состояниями. Обозначим это время, именуемое обычно временем возвращения, через г*. Тогда оче- очевидно, что если полное время наблюдения Г мало по сравнению с т*, то за время наблюдения система не успеет вернуться в начальное состояние. При этом процесс, идущий с возраста- возрастанием энтропии, является необритимым. Если же, наоборот, пол- полное время наблюдения Т велико по сравнению с временем воз- возвращения т*, то за время наблюдения система обязательно вер- вернется в начальное состояние. В этом случае тот же процесс нужно считать обратимым. Впервые такую трактовку развил М. Смолуховский. Таким образом, решающим в критерии обратимости и не- необратимости является отношение времени т* и Т. Для получения представления о порядке величины времени возвращения т* вычислим его для простейшей системы. Пусть в момент времени / = 0 идеальный газ, первоначально заключен- заключенный в левую половину сосуда, заполняет весь сосуд. Найдем, какое время потребуется для того, чтобы в результате молеку- молекулярного движения все N молекул газа вновь собрались в левой половине сосуда с вероятностью, близкой к единице, например равной 0,9. Вероятность того, что при одном измерении одна из моле- молекул окажется в левой половине сосуда, равной w\l) =y. Соот- Соответственно вероятность того, что при одном измерении две мо- ~k) »a вероятность нахождения N молекул при одном измерении Вероятность того, что в левой половине при одном изме- измерении не окажется N молекул, равна, очевидно A jf-\. Bepo-
§36] СТАТИСТИЧЕСКИЙ ХАРАКТЕР ВТОРОГО НАЧАЛА 47а ятность того, что при п измерениях в левой половине сосуда не A \" 1 jy-J . Вероятность того, что после п измерений N молекул окажут- окажутся, в левой половине сосуда, равна Положив, по условию, iwjw = 0,9, находим Поскольку N велико, —jf «С 1, так что In A j Тогда имеем -^г=1. Если измерения производятся через каждые М сек, то N мо- молекул с вероятностью 0,9 окажутся вновь собравшимися в левую половину сосуда по прошествии времени Если, например, измерения производятся каждые А/ = 1 секг то х* = 2N сек. Время возвращения чрезвычайно быстро растет с числом частиц в газе N. Представления о числовом значении т* дают цифры табл. 2, Таблица 2 N т*. сек 5 32 10 1024 100 1032 105 21 1019 2ю19 Мы видим, что при достаточно малом числе частиц в системе время возвращения системы в первоначальное состояние яв- является вполне реальным и может быть наблюдено в течение обозримых промежутков времени. Наоборот, при большом числе частиц время обращения ста- становится необозримо большим. Нельзя ожидать, чтобы за реаль- реально наблюдаемые большие промежутки времени система с боль- большим числом могла вернуться в первоначальное состояние. За- Заметим, что эксперименты полностью подтвердили расчетные значения времен возврата для скоплений в малых объемах не- небольшого числа коллоидных частиц (см. § 56). Из сказанного ясно, что развитая выше точка зрения на обратимость и необратимость практически нисколько не
474 ТЕРМОДИНАМИКА (Гл [V противоречит выводам термодинамики. Времена возвращения для процессов макроскопического масштаба оказываются столь большими, что для любого времени наблюдения неравенство т* ~Э> Т всегда удовлетворено. Поэтому процессы, являющиеся необратимыми с термодинамической точки зрения, можно счи- считать необратимыми и со статистической точки зрения. Теперь мы можем перейти к разбору второго вопроса, по- поставленного в начале этого параграфа: нельзя ли осуществить вечный двигатель второго рода, используя явление флуктуации? Представим себе, что у нас имеется некоторый механизм, который можно использовать для производства полезной ра- работы флуктуации, происходящей в некоторой системе. Для кон- конкретности представим себе, что механизм этот представляет поршень, который приводится в одностороннее движение флук- туациями плотности, происходящими в объеме газа под порш- поршнем. Если бы такой механизм можно было практически осуще- осуществить, то можно было бы систематически получать полезную работу за счет тепловой энергии среды, т. е. построить вечный двигатель второго рода. Однако легко показать, что построе- построение такого механизма невозможно. В самом деле, какова бы ни была конструкция механизма, поршень и другие его части, так же как и газ или другая среда, состоят из атомов или молекул. Поэтому рабочий механизм,так же как и среда, будет испытывать флуктуации. Флуктуации ме- механизма и среды являются независимыми друг от друга и про- происходят вообще говоря, в различные моменты времени и в различных направлениях. Пусть, например, поршень движется и производит работу при расширении газа. Но сам поршень так- также испытывает флуктуации и при этом смещается в сторону, противоположную той, в которую он движется при расширении. Благодаря независимости флуктуации в газе и механизме сред- среднее во времени смещение поршня оказывается в точности рав- равным нулю. Следовательно, равна нулю и средняя работа, произ- производимая поршнем. Эти качественные соображения подтверждаются количест- количественными расчетами различных схем такого рода рабочих меха- механизмов. Таким образом, систематическое получение полезной работы за счет малых флуктуации, происходящих в некотором рабочем механизме, оказывается принципиально невозможным. Точно так же невозможно получить полезную работу за счет единич- единичных больших флуктуации: вероятность больших флуктуации уменьшается несравненно быстрее, чем растет величина полез- полезного эффекта. Тем самым доказывается, что построение вечного двигателя второго рода, систематически производящего полезную работу
§ 36] СТАТИСТИЧЕСКИЙ ХАРАКТЕР ВТОРОГО НАЧАЛА 47S за счет флуктуации, принципиально невозможно. Классическая формулировка второго начала — «невозможно построить вечный двигатель второго рода, т. е. приспособление, которое в течение продолжительного времени потребляло бы теплоту более низкой температуры и служило при этом источником полезной рабо- работы»,— сохраняет полную силу. В заключение мы должны остановиться на вопросе о так на- называемой «тепловой смерти» вселенной. Теория тепловой смерти мира, выдвинутая Клаузиусом, за- заключается в следующем. В настоящее время вселенная не на- находится в состоянии теплового равновесия, в ней существуют разности температур, движение и т. п. Однако, поскольку все- вселенная представляет замкнутую систему, к которой применимы законы статистики и термодинамики, по истечении достаточно большого промежутка времени все разности температур, суще- существующие во вселенной, выравняются и движение прекратится. Вселенная перейдет в состояние полного покоя, тепловой смерти. Учение Клаузиуса подверглось критике со стороны большого числа физиков-материалистов, в первую очередь Больцмана. В настоящее время с несомненностью выяснено, что нет ни- никаких оснований для перенесения законов статистической физи- физики— учения о законах движения молекулярных систем — на из- изменяющуюся во времени вселенную. Уже учет гравитационных явлений в рамках общей теории относительности показывает, что термодинамические свойства систем космического масштаба должны коренным образом отличаться от термодинамических свойств обычных замкнутых систем. В термодинамике, основан- основанной на общей теории относительности, показывается, что энтро- энтропия систем космического масштаба не может стремиться к мак- максимальному значению и достигнуть его и в них не может уста- установиться тепловое равновесие1). Более полное изучение закономерностей поведения вселен- вселенной и, в частности, ее термодинамического поведения — дело будущего. Но уже сейчас ясно, что они несравненно сложнее, чем свойства обычных макроскопических молекулярных систем, и применение ко вселенной законов обычной термодинамики не- незаконно и недопустимо. ') См R. Г о 1 m a n, Relativity thermodynamics and cosmology, Oxford 1934.
ГЛАВА V ИДЕАЛЬНЫЕ ГАЗЫ § 37. Функция распределения для идеальных газов В этой и" последующих главах мы рассмотрим приложения общей теории к конкретным системам. В первую очередь будут рассмотрены идеальные газы. Функция состояний идеального одноатомного газа имеет вид S. kT Q(en), C7,1) где е„ — энергия газа как целого и суммирование ведется по уровням энергии системы. Поскольку расстояния между уровнями энергии газа как целого весьма малы по сравнению с kT, суммирование по уров- уровням энергии можно заменить интегрированием. Таким образом, "" dQ. C7,2) Найдем число состояний системы с данной энергией dQ. По- Поскольку все частицы идеального газа являются независимыми, можно написать где произведение берется по всем координатам и импульсам ча- частиц. Штрих в произведении означает, что при его образовании следует включать в него только такие члены, которые отвечают различным состояниям системы как целого. Подставляя dQ в C7,1), находим C7'3)
b • —о I I •§ 37] ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ ДЛЯ ИДЕАЛЬНЫХ ГАЗОВ 477 Для того чтобы найти область интегрирования в C7,3), рас- рассмотрим случай двух ч-астиц, совершающих одномерное движе- движение. Пусть р\ означает импульс первой частицы и Рг—импульс второй. Интегрирование в C7,3) ведется по всем значениям им- импульсов, которые может иметь каждая из молекул. Рассмотрим два состояния системы, изображенные на рис. 48 точками. В первом состоянии первая молекула имеет импульс, равный а, вторая молекула — импульс, равный Ь. Во втором состоянии, наоборот, вторая молекула имеет импульс а, а первая — рав- равный Ъ. Можно сказать, что второе состоя- состояние отличается от первого тем, что им- Рг пульс первой частицы заменен на импульс второй частицы, и наоборот. Иначе го- говоря, изобразительные точки обеих мо- молекул или, как говорят обычно для крат- краткости, молекулы переставлены между со- а. бой в фазовом пространстве. При выполнении интегрирования в _ 'C7,3) мы учитываем в отдельности каж- а рг дое из этих и им подобных состояний •системы из двух молекул. Интегрируя по ¦ 48- Рх при фиксированном значении р2, -а затем по рг при фиксированном рь мы проходим через последовательность значений импульсов (рь р2) и (р2, рО, отли- отличающихся друг от друга перестановкой частиц в фазовом про- пространстве. Иначе говоря, мы считаем состояния «первая моле- молекула имеет импульс рь вторая — импульс рг» и «первая моле- молекула имеет импульс р2, вторая — импульс pi» двумя различными состояниями. Однако если обе молекулы одинаковы, то эти со- состояния являются двумя одинаковыми состояниями. Но из по- положения квантовой теории о полной тождественности элементар- элементарных частип вытекает, что оба эти состояния отвечают одному и тому же физическому состоянию системы. Физическое состояние системы характеризуется тем, что одна частица имеет им- импульс рь а вторая — импульс р2. Какая именно из частиц имеет импульс рь а какая — импульс р2, совершенно безразлично, по- поскольку обе частицы являются абсолютно тождественными. Со- Состояния (рь Рг) и (р2, Р\) являются не двумя одинаковыми, а одним и тем же состоянием системы. Поэтому мы совершаем ошибку, учитывая в ходе интегрирования в C7,3) оба состояния (Ри р2) и (р2, Р\) как независимые состояния. В действительно- действительности оба они соответствуют только одному физическому состоя- состоянию системы. Для того чтобы не впадать в эту ошибку, нужно учитывать только одно из состояний: либо (рь р2), либо (р2, pi). Интегрирование по рх и р2 в C7,3) нужно вести не по всем воз- возможным их значениям, а только по значениям, отвечающим
478 ИДЕАЛЬНЫЕ ГАЗЫ (Гл V физически различным состояниям системы. Для этого можно, например, интегрировать не по всей фазовой плоскости {ри р2), а по половине ее, отсекаемой биссектрисой, проведенной на рис. 48. Проще, однако, поступить иначе. Можно по-прежиему вести интегрирование по всем значениям pi и рг, а получив- получившийся результат уменьшить вдвое. Тем самым будет компенси- компенсировано неправильное удвоение числа состояний при их подсчете. Совершенно аналогично следует поступать и при вычислении той части функции состояний, которая включает интегрирование по координатам двух молекул. Состояния, отличающиеся друг от друга только перестановкой молекул в пространстве, нужно считать не разными, а одним и тем же состоянием. В общем случае при вычислении интеграла по всем состоя- состояниям системы, состоящей из двух частиц, следует производить интегрирование по всем состояниям — координатам и импуль- импульсам (pi, q\) первой и (рг* <7г) второй частицы, но полученный результат уменьшить вдвое. При этом будет автоматически уч- учтено, что «перестановка» в фазовом пространстве изобразитель- изобразительных точек, характеризующих состояние каждой из частиц, не приводит к разным состояниям всей системы. Полученный результат можно обобщить на произвольные со- состояния газа, содержащего N молекул. Все состояния газа, от- отличающиеся между собой только тем, что значения координат и импульсов одной молекулы заменены значениями координат и импульсов другой молекулы, являются тождественными физиче- физическими состояниями. Можно сказать, что совокупность всех со- состояний, которые получаются перестановкой между собой N изобразительных точек в фазовом пространстве, отвечает только одному физическому состоянию. При вычислении полной функ- функции состояний газа каждое из них нужно учитывать в интегри- интегрировании только один раз. Поэтому при выполнении интегриро- интегрирования по всем возможным значениям координат и импульсов газовых молекул нужно разделить результат на число переста- перестановок изобразительных точек между собой в фазовом простран- пространстве. Последнее равно, очевидно, /V! Следует заметить, что необходимость деления фазового интеграла на N\ учитывалась в классической статистике. В про- противном случае нарушалась аддитивность получаемых термоди- термодинамических функций. Однако полная очевидность необходимо- необходимости такого деления видна в квантовой статистике после учета принципа тождественности атомных частиц. Итак, мы можем написать
$ 37j ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ ДЛЯ ИДЕАЛЬНЫХ ГАЗОВ 479 Распределение Гиббса для идеального газа имеет вид Соответственно для функции состояний получаем где интегрирование ведется по всему фазовому пространству. Представив энергию газа как лолучаем тде г — интеграл состояний для одной молекулы, вычислявшийся уже ранее (формула A9,7)). Подставляя его значение, находим Перейдем к вычислению термодинамических функций идеаль- идеального одноатомного газа. Для энергии газа можно написать F = ЬТ2 ~——In 7= — NbT И7 fi\ с hi ^j. in с g ''Ki • \°' >"/ Энергия газа пропорциональна температуре и не зависит от объема газа в соответствии с формулой B0,14). Теплоемкость одноатомного газа оказывается равной ?\ 3 ,,, п кал Т )v 2 "п " моль-град ' Для свободной энергии идеального одноатомного газа нахо- находим согласно C2,1): kT In Z = — NkT\n V i^^Ly + kT\nN\ Для вычисления N\ при большом N можно воспользоваться фор- формулой Стирлинга (см. приложение IV). Тогда имеем eV ( 2яткТ \ч, J. C7,7)
480 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V Из свободной энергии можно найти уравнение состояния газа. В соответствии с C2,6) получаем (dF \ NkT ¦л [/ | == Тг~~ • \Ot ,о) ov )т V \ » / Мы приходим, таким образом, к хорошо известному уравнению состояния идеального газа. Необходимо подчеркнуть, что это уравнение найдено нами чисто теоретическим путем, без каких- либо ссылок на экспериментальные данные. Экспериментально определяется только числовое значение постоянной k. Вычислим теперь энтропию газа. Согласно B9,7) она равна Y ^ j. C7,9) По причинам, которые будут выяснены позднее, величина носит название химической постоянной. Энтропия, определенная формулой C7,9), выражена как функция числа частиц и объема газа. Как это и должно быть в силу аддитивности энтропии, оиа пропорциональна числу частиц в газе. При одновременном уве- увеличении объема и числа частиц в газе в произвольное число раз энтропия увеличивается или уменьшается во столько же раз. Может показаться странным, что вычисленная нами энтропия не содержит никакой произвольной постоянной, тогда как со- согласно сказанному в § 24 энтропия определена с точностью до неопределенной постоянной. В действительности в формуле от- отсутствует произвольная постоянная потому, что мы в основу вычисления F и S положили формулы B9,7) и C2,1), в которых произвольная постоянная энтропии была выбрана за условное начало отсчета энтропии. Выражение C7,9) для энтропии теряет свою применимость при Т—*0. При выводе C7,9) мы не учитывали явления кванто- квантового вырождения газа, играющего основную роль в его поведе- поведении при весьма низких температурах. Это явление будет рассма- трипаться нами в гл. X. Без учета явления вырождения невозможно получить пра- правильное выражение для энтропии, удовлетворяющее третьему началу термодинамики. Нужно, однако, заметить, что обычных газов при столь низких температурах, при которых наступает вырождение, не существует. Задолго до этих температур насту- наступает ожижение газов при всех реальных значениях плотности.
S37] ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ ДЛЯ ИДЕАЛЬНЫХ ГАЗОВ 481 При весьма высоких температурах формула C7,9) вновь не- неприменима, так как она не учитывает тепловой ионизации ато- атомов. Тем не менее интервал применимости формулы C7,9) весьма широк — от точки ожижения до нескольких тысяч гра- градусов. На практике часто удобнее выражать энтропию через давле- давление и температуру. Подставляя в C7,9) значение V, выражен- выраженное через давление, находим Nk\nkTNk\np + jNk + Nkj = j. C7,10) Вычислим еще термодинамический потенциал Гиббса (Ф). Имеем для Ф на основании B8,11) и C7,7) ф « F + pV = — |- NkT In kT + NkT In p - NkTj = = NkT In p-CpT\nkT-NkTj. C7,11) Полученное выше выражение для теплоемкости можно срав- сравнить с опытными данными. Число одноатомиых газов ср?мни- ср?мнительно невелико. Одноатомными являются благородные газы и пары металлов. В табл. 3 приведены измеренные значения теплоемкости. Таблица 3 Теплоемкость (при постоянном объеме) Не Аг Na Hg Вещество (пар) . . (пар) . . одноатомных газов 1 1 • Температура, °С 291 93 26 18 288 750-920 548-629 Си кал "' моль-град 3,008 2,93 3,00 3,02 3,07 2,95 2,9?- Из таблицы видно, что предсказания теории хорошо оправды- оправдываются на опыте; теплоемкость одноатомных газов постоянна в широком интервале температур и имеет значение, почти точно совпадающее с теоретическим значением кал моль ¦ град 31 В. Г, Левин, том I
482 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V В заключение рассмотрим важный вопрос о смешивании газов. Для наглядности предположим, что газ помещен в две ка- камеры с объемами V\ и V$, разделенные вначале непроницаемой перегородкой. Затем перегородка удаляется, и молекулы обеих порций газа начинают взаимно диффундировать. В результате этого процесса происходит перемешивание газов. Мы будем счи- считать, что температуры и давления газов до смешивания были равны между собой. Найдем изменение энтропии при смешивании двух порций газа. При этом нужно различать два случая: смешивание раз- различных и одинаковых по своей природе газов. Мы начнем с рассмотрения первого случая. Согласно C7,9) энтропии различных газов до смешивания даются выражениями S? = Nik In jfc + Nj (T), где f(T)—слагаемые в формуле для энтропии, не зависящие от •объема. Полная энтропия системы до смешивания равна После смешивания каждый из идеальных газов будет вести себя так, как будто бы другого газа не было, и занимать весь суммарный объем (V\ + V2). Температура смеси будет равна исходной температуре газа. Поэтому после смешивания энтро- энтропия каждого из газов будет равна t 'V2 Энтропия смеси, состоящей из двух невзаимодействующих идеальных газов, равна сумме их энтропии, т. е. Изменение полной энтропии всей системы при смешивании равно k + H+toh
§ 37) ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ ДЛЯ ИДЕАЛЬНЫХ ГАЗОВ 483 При данной температуре и давлении V1 + V2 = ( и аналогично для —1-у—- , так что изменение энтропии равно Таким образом, энтропия смеси больше, чем энтропия исход- исходных газов. Процесс смешивания двух различных газов является необра- необратимым процессом. Происхождение этой необратимости вполне понятно. Когда перегородка, разделяющая газы, удаляется, на- начинается взаимная диффузия газов. До смешения существовала «правильность» в расположении молекул: молекулы одного газа находились в одной части сосуда, молекулы второго газа — в Другой. После того как диффузия полностью перемешает оба газа, наступает равномерное, совершенно хаотическое распределение молекул и вероятность состояния увеличивается. Для обратного разделения газов необходимо затратить некоторую работу, ко- которую в принципе можно вычислить. Рассмотрим теперь процесс смешивания двух порций одина- одинаковых газов. Газы могут считаться одинаковыми в том случае, когда они ведут себя идентично во всех возможных внешних полях. Энтропия двух порций одного газа до смешивания равна S, = Nxk In -Jj- + Ыф In JJs- + (JV, + N2) f (T). Энтропия всего газа после смешивания равна S2 = 0V, + N2) k In ^±^ + (Ni + N2) f (T). Тогда для изменения энтропии получаем Но из уравнения состояния газа следует, что при постоянном давлении и температуре Ух + У* _ Vi г_ У* Ni + N2 Nt N2 * поэтому Таким образом, изменение энтропии при смешивании двух порцгй одного газа действительно тождественно равно нулю. 31»
484 ИДЕАЛЬНЫЕ ГАЗЫ (Гл. V Этот результат, находящийся в полном согласии с опытом, тесно связан с предположением о тождественности между собой всех частиц данного газа. Благодаря этой тождественности переме- перемешивание их между собой не является физическим событием. При смешивании двух порций одного газа при постоянном давлении и температуре распределение молекул во всем объеме сразу ока- оказывается равномерным и хаотическим и никакой взаимной диф- диффузии не происходит. Нужно подчеркнуть, что молекулы или атомы могут считаться принадлежащими к одному сорту и по- потому тождественными только в том случае, когда они имеют одинаковую химическую структуру, массу и все другие харак- характеристики. Это означает, что даже различные изотопы одного элемента или атомы, находящиеся в разных энергетических со- состояниях, нельзя считать тождественными. Так, например, сме- смешение двух разных изотопов газа или двух порций газа, состоя- состоящих из нормальных и возбужденных молекул, представляет необратимый процесс. Это особенно ясно видно из того, что самопроизвольного обратного разделения смешавшихся газов не происходит, и для их разделения нужно затратить некоторую работу. § 38. Распределение Максвелла—Больцмана и распределение Больцмана в однородном поле сил На практике часто приходится иметь дело с газом, находя- находящимся в однородном внешнем поле сил. Наиболее важным примером такого поля является поле тяжести. До сих пор мы отвлекались от действия поля тяжести на поведение газа. Мы рассмотрим теперь идеальный газ, помещенный в однородное силовое поле. В таком поле каждая молекула обладает полной энергией е = епоступ + и (х, у, z), где епоступ—кинетическая энергия ее поступательного движе- движения, аи — потенциальная энергия во внешнем поле, зависящая от положения частицы. Подставляя это выражение' для энергии в распределение Гиббса A9,6) для молекулы идеального газа, имеем епоступ+и dw = ^e kT dpxdpydpzdV, C8,1) где интеграл состояний равен, очевидно, епоступ+» dpx dpy dpzdV кТ 7л • C8,2)
1 38] РАСПРЕДЕЛЕНИЕ МАКСВЕЛЛА—БОЛЬЦМАНА 485 Интегрирование ведется по всем возможным значениям пере- переменных. Замечая, что интеграл состояний можно записать в виде епоступ Je-TTdv = [**j?Ly Jе~И dV> C8) K) мы находим, что нормированное на единицу распределение Гиббса для молекулы идеального газа при наличии внешнего .поля имеет вид ^ dV C8,4) и "kf dV Полученное распределение вероятностей, характеризующее вероятность того, что молекула имеет данный импульс и нахо- находится в данном элементе объема, носит название распределения Максвелла — Больцмана. Первый из множителей в C8,4)—хорошо знакомое нам рас- распределение Максвелла. Оно характеризует распределение ве- вероятностей по компонентам импульса. Второй множитель зави- зависит только от координат молекулы и определяется видом ее потенциальной энергии и(х, у, z) во внешнем поле сил. Он выражает вероятность нахождения молекулы в данном объеме dV. В частном случае, когда внешнее поле сил отсут- отсутствует, распределение молекул по всему объему сосуда является dV равновероятным и последний множитель сводится к величине р-. На основании теоремы умножения вероятностей распределе- распределение Максвелла — Больцмана можно рассматривать как произ- произведение вероятностей двух независимых событий — вероятности данногр значения импульса и данного положения молекулы. Первая вероятность представляет распределение Максвелла; вторая вероятность — распределение Больцмана. Каждое из рас- распределений нормировано на единицу. То обстоятельство, что оба эти распределения являются не- независимыми, выражает важное и заранее совершенно неочевид- неочевидное физическое положение: вероятность данного значения импульса совершенно не зависит от положения молекулы, и, наоборот, вероятность положения молекулы не зависит от ее импульса. Рассмотрим теперь более подробно распределение Больц- Больцмана для частного случая, когда газ находится в поле земного тяготения. Направим ось г вертикально вверх. Тогда
486 ИДЕАЛЬНЫЕ ГАЗЫ [Гл V потенциальная энергия газовой молекулы может быть написана в виде и = mgz. Поскольку потенциальная энергия зависит только от высоты, в плоскости 2 = const молекулы распределяются равномерно. Поэтому представляет интерес лишь зависимость распределения вероятностей от координаты г. Она имеет вид mgz C8,5) kT dz где интеграл берется по всем возможным значениям г. Вводя вместо распределения вероятностей среднее число ча- частиц в 1 см3 на данной высоте, можно переписать C8,5) в виде mgz dn = пф~ кт dz, C8,6) где rt0 — число частиц в 1 см3 на условном уровне отсчета коор- координаты Z В ПЛОСКОСТИ Z = 0. Формула C8,6) показывает, что плотность газа в поле тяже- тяжести убывает по экспоненциальному закону. Она уменьшается в е раз при поднятии на высоту б = . Эту величину можно назвать характеристической длиной распределения частиц в поле тяжести. Для водорода б составляет при комнатной темпе- температуре около 3 • 105 м, для воздуха б соответственно равно 104 м. На всех высотах имеет место максвелловское распределение мо- молекул по скоростям с постоянной температурой Т Однако число молекул, находящихся на разных высотах, убывает по экспонен- экспоненциальному закону C8,6). На первый взгляд неизменность тем-* пературы на всех высотах может показаться противоречащей следующему простому энергетическому рассуждению- если не~ то2 которая молекула, имевшая на высоте го энергию —w-, подни- поднимается на высоту z, то ее энергия должна уменьшаться до зна- значения I —jp - mg (z -го)|, где mg(z — z0)— работа против силы тяжести. Поэтому на большой высоте молекула будет иметь меньшую скорость и энергию. Но с другой стороны, температура связана со средней квадратичной скоростью соотношением A0,6), Следовательно, температура газа должна падать с вы- высотой. Ошибочность этого рассуждения коренится в том, что в нем фигурирует только одна молекула, рассматриваемая без учета ее столкновений с другими газовыми молекулами. Макс-
 38] РАСПРЕДЕЛЕНИЕ МАКСВЕЛЛА-БОЛЬЦМАНА 487 велловское распределение скоростей устанавливается благодаря столкновениям между молекулами. В предыдущем рассуждении установление максвелловского распределения игнорируется и рассматривается не имеющая смысла «температура молекулы». Фактически подниматься вверх будут преимущественно те мо- молекулы, которые имеют большую скорость. Поэтому максвеллов- ское распределение будет устанавливаться автоматически на всех высотах. Рассмотрим некоторые выводы, которые можно получить из распределения плотности газа с высотой. Прежде всего остано- остановимся на понятии веса газа. Представим себе сосуд высотой ft, в котором находится газ. Как известно, этот газ обладает неко- некоторым весом. Часто говорят, что вес газа — это вес всех входя- входящих в него молекул. В действительности, однако, это не совсем верно. Вес газа измеряется разностью давлений, оказываемых газом на дно и крышку сосуда. В создании этой разности давлений участвуют все молекулы газа, находящиеся в непре- непрерывном движении и большей частью непосредственно ни с дном, ни с крышкой сосуда не сталкивающиеся. В этом заключается различие между весом газа и весом тела, лежащего на тарелке весов. Найдем вес столба газа высотой h. Для этого можно посту- поступить двояким образом: во-первых, можно определить его чисго формально, написав, что вес столба газа равен весу всех входя- входящих в него молекул; во-вторых, его можно найти, взяв разность давлений, оказываемых газом на дно (z = 0) и крышку (z = h) сосуда. В первом случае имеем п P — tng\ dN = mgn0 \е kT dz\dxdy = j J J о = SmgnJ ¦ — \1 - e xt J= $kT (n0 - nh), где S — площадь сечения сосуда, а п0 и nh — плотности газа на высотах z = 0 и z = h. Во втором случае мы можем написать Р = 5 (р0 — ph) = S (п0 — nh) kT, где ро к Ph — давления на высотах z = 0 и г = Л соответственно. Таким образом, расчет подтверждает правильность представле- представления о весе газа как разности давлений на дно и крышку сосуда. Молекулы газа, находящиеся в поле тяжести, обладают некоторой средней потенциальной энергией, избыточной по
488 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V сравнению со средней энергией газа, находящегося вне поля сил. Поэтому средняя энергия газа в поле тяжести, а следова- следовательно, и его теплоемкость должны быть больше вычисленных нами ранее. Найдем избыточную теплоемкость, которую должен иметь газ, находящийся в поле тяжести. Для этого вычислим среднюю потенциальную энергию газовой молекулы в поле тя- тяжести. По определению, она равна = mg J zdwb, C8,7) где йшъ — вероятность того, что молекула будет находиться на высоте z и z + dz, даваемая формулой C8,5). Подставляя вы- выражение для йшь в C8,7), имеем mgz ~ kT z C8,8) ге kT dz При вычислении интегралов, входящих в C8,8), очень су- существенно знать высоту столба газа. Рассмотрим прежде всего случай бесконечно высокого столба газа, точнее, столба, заклю- заключенного в сосуд, высота которого значительно больше, чем ха- характеристическая высота 6. Тогда пределы интегрирования по г распространяются от z — 0 до г—* оо. Вычисление простых ин- интегралов (см приложение IV) дает п = kT. Средняя потенциальная энергия одной молекулы в бесконечном столбе газа оказывается пропорциональной абсолютной темпе- температуре. Средняя потенциальная энергия грамм-моля газа в бесконечном столбе равна U = ЛГоп = N№. Отсюда находим для избыточной теплоемкости при постоянном объеме на один грамм-моль, обусловленной потенциальной энер- энергией, СГ = Nok. Полученная теплоемкость, таким образом, сравнима с тепло- теплоемкостью, обусловленной кинетической энергией молекул. К совершенно иному выводу мы придем в случае столба, за- заключенного в сосуд высотой h <c й. В этом случае средняя
% 38] РАСПРЕДЕЛЕНИЕ МАКСВЕЛЛА - БОЛЬЦМАНА 489 потенциальная энергия молекулы равна ft mgz п==т§\ таг в kT dz mgz z Поскольку в пределах интегрирования -Jr- =• -т < 1, подын- подынтегральную функцию можно разложить в ряд и ограничиться первым членом разложения. Это дает В этом приближении средняя потенциальная энергия столба газа вообще не зависит от температуры. Соответствующий вклад в теплоемкость равен нулю. В следующем приближении можно получить некоторую теплоемкость, весьма малую по сравнению с теплоемкостью, обусловленной наличием кинети- кинетической энергии. Таким образом, в практически интересных слу- случаях долей, вносимой потенциальной энергией в теплоемкость газа, можно пренебргчь. Рассмотрим, наконец, распределение по высоте молекул, об- обладающих различной массой. Из вида распределения C8,5) ясно, что чем больше масса молекулы, тем быстрее убывает число соответствующих молекул с высотой. Если молекулы с массами т\ и т2 на высоте z = О имеются в одинаковом коли- количестве, то отношение числа молекул обоих сортов на высоте h равно «¦ Если бы простые законы равновесного распределения плот- плотности были применимы к земной атмосфере, то наблюдалось бы резкое изменение состава атмосферы с высотой. В действи- действительности, однако, произведенные измерения состава атмосферы не подтверждают этого вывода. Общеизвестно также понижение температуры с высотой, что тоже находится в полном противо- противоречии с требованием постоянства температуры в равновесном столбе газа. Эти, а также ряд других фактов показывают, что атмосфера не находится в состоянии статистического равно- равновесия.
490 ИДЕАЛЬНЫЕ ГАЗЫ [Гл V § 39. Вычисление теплоемкости двухатомных молекул г помощью классической статистики и закон равномерного распределения по степеням свободы Большая часть веществ в газообразном состоянии сущест- существует в виде молекул. Весьма часто приходится иметь дело с двухатомными газами. Таковы Нг, Ог, N2, HC1, СО и целый ряд других. Нашей ближайшей задачей является обобщение полученных результатов на случай неодноатомных газов и, в особенности, на самый простой случай двухатомных газов. Основным отличием неодноатомных газов от одноатомных является наличие у них вращательных и колебательных степе- степеней свободы. Мы начнем рассмотрение с более простого слу- случая— двухатомных газов. При этом мы будем вначале считать» что молекула представляет систему, подчиняющуюся законам классической механики. Поскольку внутреннее движение элек- электронов в атоме нас интересовать не будет, каждый атом мы будем заменять материальной точкой, не имеющей протяжен- протяженности. Две материальные точки, связанные между собой в мо- молекулу, можно уподобить миниатюрной гантели, на концах которой находятся бесконечно малые шарики с массами mi и тг (различными массами атомов). Поскольку связь между ато- атомами в молекуле является не абсолютно жесткой, возможны следующие виды движения: поступательное движение (три сте- степени свободы); вращение вокруг двух осей, перпендикулярных к оси, соединяющей оба атома (две степени свободы); колеба- колебания атомов вдоль линии, их соединяющей. Мы считаем моле- молекулы материальными точками, имеющими бесконечно малые размеры, так что говорить о вращении вокруг оси молекулы не имеет смысла. Энергия молекулы может быть написана в виде е == епоступ "Г евращ + еколеб1 C9,1) где епоступ. евращ и Бколеб — соответственно энергии поступатель- поступательного, вращательного и колебательного движений. Состояние молекулы, образованной из двух связанных меж- между собой атомов, определяется заданием шести координат и шести импульсов. Координатами являются: координаты х, у, г, определяющие положение центра инерции в пространстве; углы 9 и ф, определяющие положение оси молекулы в простран* стве; координата q, определяющая отклонение атомов от равно- равновесного расстояния. Импульсы, соответствующие этим коорди- координатам, равны Рх, Ру, Рг, М\ = /@1, М2 = /0>2, Pq-
§39] ВЫЧИСЛЕНИЕ ТЕПЛОЕМКОСТИ ДВУХАТОМНЫХ МОЛЕКУЛ 491 Здесь / означает момент инерции, а ы — угловую скорость вра- вращения молекулы. Соответствующее фазовое пространство имеет 2- C*2) = 12 измерений. Применим к молекуле распределение Гиббса, считая ее ква- квазизамкнутой подсистемой. Очевидно, имеем , 1 Г епоступ + ввращ + вколеб ~\ ,„ . . dw = ж ¦ ехР 1. kf Jdr- C9>2) Элемент фазового пространства двухатомной молекулы может быть записан в виде di = <?Гпоступ diBpaui diK0Jie6, C9,3) где введены обозначения: ^Гпоступ = dpx dp у dpz dx dy dz; с?Гвращ = <Ш, dM2 sin 0 d9 dy; йГколеб = dpq dq. C9,4) Первый множитель в выражении фазового объема соответствует трем степеням свободы поступательного движения, второй — двум степеням свободы вращательного движения и третий — колебательному движению молекулы. Таким образом,  к Г 8п0ступ + еВращ + вколеб 1 ,r ,r | ^ J • dY поступ dW = -jjej ехр | ^ J • dY поступ вращ колеб- \оУ,0) Мы видим, что распределение Гиббса распадается на три независимых множителя, соответствующих поступательному, вращательному и колебательному движениям. Каждый из этих видов движения является независимым от двух других. По- Поэтому поступательное движение, вращение и колебания можно рассматривать независимо друг от друга. Поступательное движение двухатомных мо- молекул ничем не отличается от поступательного движения од- одноатомных молекул, поскольку поступательное движение сво- сводится к движению центра тяжести системы. Рассмотрим теперь вращательное движение двухатом- двухатомной молекулы. Энергия вращения двухатомной молекулы при заданном расстоянии между атомами имеет вид _ /»? /col Aff Ml евращ — ~2 I 2 7" ' ~~2Г' \°У>°) где Mi и саг — угловые скорости молекулы, a Mi и М% — моменты количества движения. Момент инерции молекулы / равен Где а — расстояние между атомами и nil и т2 — их массы.
492 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V Вероятность того, что молекула имеет значения момента ко- количества движения, лежащие между Mi и Mi +'dM\, M% и М2 + dftli, и ориентирована в пространстве так, что ее ось об- образует с осями координат углы между 0, в + dQ и ф, ф-Fcftp, имеет вид dwBpaui = const • е 275? dMi dM^ sin 9 de d(f C9j8) Поскольку мы не интересуемся ориентацией молекулы в про- пространстве, удобнее перейти от выражения C9,8) к выражению вероятности того, что моменты количества движения имеют данное значение при любой ориентации оси молекулы в про- пространстве. Интегрируя выражение C9,8) по углам В и ф, по- получим О 9 M+M dffi>Bpani = const- e 2lkT dMtdM2. C9,9> Постоянная в выражении C9,9) может быть найдена из уело* вия нормирования. Вместо моментов количества движения относительно осей можно ввести более привычные величины — угловые скорости. Тогда вероятность того, что молекула имеет компоненты угловой скорости, лежащие между <oi, Mi + dca\ и <о2, сог+'Лог, дается выражением dwB9tm = const • <Г 2кТ dco, da, C9,10) где постоянная снова определяется из условия нормирования. Интегрируя формулу C9,10) по всем значениям компонент угловой скорости (пределы интегрирования можно распростра- распространить до ±<х> на том же основании, что и для компонент посту~ пательной скорости), имеем «> / (^+«2) 1 = const | J е 5*г~ dca, da>2, C9,11) —00 откуда const --g^jr. C9,12) Поэтому окончательно имеем dw е C9,13)
§ 39] ВЫЧИСЛЕНИЕ ТЕПЛОЕМКОСТИ ДВУХАТОМНЫХ МОЛЕКУЛ 493 Исходя из условия C9,10), найдем среднюю энергию вра- вращения % ТК + ^)- C9,14) Для среднего значения компоненты скорости имеем /<о| -^d(o2 = -^. C9,15) Из соображений симметрии ясно, что Ц = Ц, C9,16) поэтому среднее значение энергии вращения равно 1гТ. C9,17) На каждую степень свободы для вращательного движения kT приходится энергия, равна -^-. Переходя к колебательному движению двух- двухатомной молекулы, заметим прежде всего, что можно в первом приближении ограничиться учетом малых колебаний около положения равновесия, т. е. равновесного расстояния между обоими атомами. При этом энергию колебаний двухатом* ной молекулы можно написать в виде о 2 2 2 11 м цсо д _ р (хш д Еколеб— 2 2 — 2ц 2 ' \OX3,iO) где q — отклонение атомов от положения равновесия, ц — при- приведенная масса, (о — частота колебаний, связанная с постоянной квазиупругой силы -л соотношением <о = Т/-^-. Импульсом ко- колеблющейся системы будет pq = щ. Вероятность того, что атомы в колеблющейся молекуле на- находятся в положении q и имеют импульс pq, имеет вид C9,19) Функция состояний z в выражении C9,19) находится из условия нормирования: 2=т оо ца2д2 Jе"^ЙГd(?; C9'20)
4Э4 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V поскольку подынтегральные функции весьма быстро убывают с ростом аргументов и интегралы быстро сходятся, мы распро- распространили пределы до бесконечности. Простое вычисление дает C9,21) Таким образом, окончательно имеем 2 ,,ич. C9,22) Найдем среднюю энергию колебательного движения - "я i У" ш 7 . A.Q 9^^ "колеб о., "Т" о • yo^j^O) Вычисляя средние, имеем у&Т.?-?. CJ.21) Подставляя средние значения из C9,24) в C9,23), находим *Г. C9,25) На одну колебательную степень свободы приходится в среднем энергия, вдвое большая, чем на одну степень свободы посту- поступательного или вращательного движений. Смысл этого станет понятным, если вспомнить, что при колебательном движении средняя (за период) кинетическая энергия системы равна сред- средней потенциальной энергии. Энергия колебательного движения состоит из двух слагаемых, имеющих одинаковую структуру,— квадратичных выражений относительно независимой перемен-- ной pq или q. Для остальных степеней свободы энергия выра- выражается одним квадратичным в отношении независимой пере- переменной членом на каждую степень свободы. Усреднение каждого квадратичного слагаемого в энергии приводит к средней энер- kT . kT i ™ гии — + -у = яГ. В общем случае мы можем сказать, что каждое квадратич- квадратичное слагаемое, входящее в энергию системы, имеет среднее kT значение, равное -г-. Мы убедились в том на примере одно- и двухатомных молекул. Все наши рассуждения могут быть пере- перенесены без особого труда на случай многоатомных молекул. Рассмотрим, например, трехатомные молекулы. Трехатом- Трехатомная молекула может иметь структуру, подобную молекуле ССЬ или подобную Н2О и SO2 (рис. 49). В первом случае все атомы ее расположены вдоль линии и молекула называется линейной.
§391 ВЫЧИСЛЕНИЕ ТЕПЛОЕМКОСТИ ДВУХАТОМНЫХ МОЛЕКУЛ 495 Молекулы второго типа называются нелинейными. В случае трехатомной линейной молекулы, имеющей девять степеней сво- свободы, возможны следующие виды движения: поступательное движение молекулы как целого (три степени свободы); вра- вращение вокруг двух осей, перпендикулярных к оси молекулы (две степени свободы); колебательное движение (четыре сте- степени свободы). Возможные типы колебательного движения ли- линейной молекулы изображены на рис. 49. Стрелками показаны направления движения в одной фазе нормальных колебаний; vb V2 и V3 означают частоты ко- колебаний. Возможны два коле- колебания с частотой V2, происходя- происходящих независимо друг от друга в двух перпендикулярных пло- плоскостях. Средняя энергия линей- Рис. 49. ной молекулы слагается из сред- средней энергии поступательного, вращательного и колебательного движений. Каждый из этих видов движения, а также различные нормальные колебания независимы друг от друга. Поэтому к каждому из этих видов движения в отдельности мы может* применить рассуждения предыдущих параграфов. На каждую степень свободы поступательного и вращательного движений kT приходится средняя энергия -у, а на каждую колебательную степень свободы — энергия kT. Таким образом, средняя энергия линейной трехатомной молекулы равна 8 = 3-^ 4/гГ = 6,5*7". Для нелинейной молекулы средняя энергия оказывается иной. У такой молекулы возможны следующие виды движения: поступательное движение молекулы как целого (три степени свободы); вращение вокруг трех взаимно перпендикулярных осей (три степени свободы); колебания (три степени свободы). Возможные нормальные колебания изображены на рис. 48. Все остальное, сказанное относительно линейных молекул, относится и к нелинейным трехатомным молекулам. Таким образом, сред- средняя энергия нелинейной трехатомной молекулы равна t = 3~ + 3~ + 3kT = QkT. ^Аналогичным образом может быть рассмотрен вопрос о сред- средней энергии многоатомной молекулы. Если молекула содер- содержит п атомов, то из 3/г степеней свободы всегда имеется три
496 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V поступательные степени свободы, три или две (в случае линей- линейной молекулы) вращательные и соответственно (Зп — 6) или (Зп — 5) колебательные степени свободы. Каждая из степеней свободы вносит соответственный вклад в среднюю энергию, та- такой же, как и у двухатомных или трехатомных молекул. Таким образом, средняя энергия n-атомной молекулы равна в случае нелинейной молекулы а в случае линейной молекулы 8 = 1^ + 2 J^L + Cn- 5) kT. В общем случае можно написать kT е = г~Г» где г — число квадратичных слагаемых, входящих в выражение для энергии. Таким образом, оказывается, что все степени сво- свободы молекулы являются равноправными: каждое квадратичное слагаемое в энергии дает вклад в среднюю энергию молекулы, ., kT , равный -у (закон равномерного распределения по степеням свободы). Закон равномерного распределения является весьма общим законом. При выводе его мы не делали каких-либо спе- специальных предположений, а считали лишь, что справедливы законы статистической физики- и что движение молекулы проис- происходит по законам классической механики. Следует еще заметить, что название этого важного закона является весьма неудачным. В самой формулировке его под- подчеркивается различие между колебательными и другими сте- степенями свободы. Поскольку, однако, приведенная формулировка является об- общепринятой, мы будем ею пользоваться в дальнейшем. Более того, часто числом степеней свободы мы будем для краткости называть число квадратичных слагаемых в энергии. Зная среднюю энергию газовой молекулы и учитывая, что все молекулы в идеальном газе совершенно одинаковы и равно-' правны, мы можем без труда найти среднюю энергию газа в целом. Если в газе имеется N частиц, то средняя энергия газа равна E~Nl = N^-. C9,26)
«391 ВЫЧИСЛЕНИЕ ТЕПЛОЕМКОСТИ ДВУХАТОМНЫХ МОЛЕКУЛ 497 Теплоемкость газа при постоянном объеме Cv равна С„ = (Щ —^ C9 27) В частности, для одного грамм-моля газа теплоемкость при постоянном объеме равна Су--т-. C9,28) Соответственно теплоемкость при постоянном давлении равна R C9,29) Ср = Ск + /? = (г + 2) 2- Таким образом, теплоемкость идеальных газов оказывается не зависящей от температуры и определяется исключительно структурой молекулы. У одноатомных газов теплоемкость при постоянном объеме, вычисленная по формуле C9,28), равна on Cv = -§- = 2,98 кал1моль • град. Для сравнения с опытом в табл. 3 (стр. 481) приведены из- измеренные значения теплоемкостей некоторых одноатомных газов при постоянном объеме и различных температур. Из табл. 3 видно, что предсказания теории хорошо оправдываются на опыте: теплоемкость одноатомных газов постоянна в широком интер- интервале температур и имеет почти точно теоретическое значение. Совершенно иная картина наблюдается у двухатомных газов. Согласно предсказа- предсказаниям теории, теплоемкость двухатомных газов должна быть равна Г — ^ _ С QC КаЛ v 2 ' моль • град C9,30) О 0,1 ПЯ Oj Ofi Ц5 Ц6 0,7 30 ф ТПц Рис. 50. Однако опыт показывает, что такой большой теплоемкостью двухатомные газы в действительности не обладают. Кроме того, оказывается, что теплоемкость двухатомных газов зависит от температуры. Эта зависимость иллюстрируется рис. 50. Общий характер зависимости теплоемкости от температуры можно ха- характеризовать следующим образом. При очень высоких темпе- температурах теплоемкость хотя и не достигает теоретического зна- значения C9,30), но стремится к нему; с понижением температуры теплоемкость падает и стремится к значению кал моль •град ' C9,31) 32 В, Г. Ленин, том I
498 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V Это значение имела бы двухатомная молекула с абсолютно жесткой связью между атомами, при которой колебательное движение невозможно. Такое исчезновение колебательного дви- движения с точки зрения классической механики является совер* шенно необъяснимым. С этой точки зрения, как мы неодно- неоднократно подчеркивали, все степени свободы являются совер- совершенно равноправными. Исчезновение малых колебаний при понижении температуры находится в резком противоречии с 2.5 Z3 2J 2,0 1,9 1.8 1.7 1,6 / / / / 50 ЮО 150 Рис. 51. гОО 250 1"Н основными положениями классической механики. Еще более разительный пример такого противоречия дает поведение водо- водорода при низких температурах. Именно, как видно из рис. 51, при понижении температуры теплоемкость водорода умень- шается и падает до значения тг^' Равног° значению теплоем- теплоемкости одноатомного газа. Таким образом, при низких темпера- температурах в молекулах водорода исчезает не только колебательное, но также и вращательное движение. Двухатомная молекула может совершать только поступательное движение. С точки зрения обычных представлений кажется совершенно непонятным, почему протяженное тело, которым является двух- двухатомная молекула, может потерять способность к вращению. Противоречие этого факта наглядным представлениям, основан- основанным на законах классической механики, еще более очевидно, чем в случае исчезновения колебаний. Все сказанное относительно двухатомных молекул целиком относится и к многоатомным молекулам. Доля энергии, прихо- приходящаяся на колебательные степени свободы, всегда значительно меньше той, которая должна была бы быть при выполнимости закона равномерного распределения. Например, в случае ли-
§ 40] ФУНКЦИИ СИСТЕМЫ В ДВУХ КВАНТОВЫХ СОСТОЯНИЯХ 499 нейной молекулы СОг колебательная теплоемкость должна была бы быть равной 4R « 8 кал/моль • град. Фактически она состав- составляет около 0,8 калIмоль • град при комнатной температуре и возрастает до значения б кал/моль • град при очень высоких температурах. Аналогично молекулы СН4, обладающие девятью колебательными степенями свободы, которым по закону равно- равномерного распределения должна соответствовать теплоемкость 18 кал/моль-град, имеют колебательную теплоемкость, не пре- превышающую 3,3 кал/моль-град. Таким образом, опыт указывает на неприменимость закона равномерного распределения энергии по степеням свободы. Но, как мы подчеркивали, этот закон основан только на двух пред- предположениях— предположении о применимости общих статисти- статистических законов к простейшим молекулярным системам и пред- предположении о применимости законов классической механики к описанию движения отдельных молекул. Поскольку в справед- ливости первого предположения нет никаких сомнений, проти- противоречие с опытом, к которому приводит закон равномерного распределения, показывает, что второе предположение является ошибочным. В действительности движение отдельных молекул подчиняется законам квантовой механики. Ниже будет изло- изложена статистика молекулярных систем, движущихся по зако« нам квантовой механики. § 40. Термодинамические функции системы, могущей находиться в двух квантовых состояниях Прежде чем перейти к рассмотрению более сложных двух- и многоатомных молекул, следует рассмотреть в общем виде свойства системы, которая может находиться в двух квантовых состояниях. Мы не будем при этом конкретизировать природу этих квантовых уровней. В следующих параграфах мы увидим, что это могут быть квантовые уровни энергии вращательного Или колебательного движений; иногда они могут иметь и другую природу. Найдем функцию состояний такой системы. По определе- определению, z=Iie~^g(el), D0,1) где е, — квантовые уровни энергии и g(et)—число состояний частицы, энергия которых равна ei. Если g отлично от еди- единицы, так что одному значению энергии системы отвечает не- несколько различных состояний, то эти последние называются вырожденными состояниями, а число их — статистическим ве- весом уровня энергии е,-. В нашем случае, когда мы для простоты 32*
500 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V ограничиваемся двумя уровнями энергии, индекс i пробегает значения 0,1. Обозначим g(eo) через go, a g(ei)—через gt. Тогда z = goe kT+gle kT = goe *ni+ALe "т i D0J) Если выражать энергию в тепловых единицах kT, то можно написать е, — eQ = kTc, D0,3) где Тс— некоторая температура, отвечающая разности (г\ — eo)j с помощью D0,3) выражение D0,2) можно написать в виде D0,4) Из выражений D0,2) или D0,4) видим, что если разность энергий между возбужденным и основным уровнями настолько велика, что при температуре Т имеет место неравенство ei — Eo^ikT или ТаЬу?Т, то вторым членом в D0,4) можно пренебречь, так что z = goe~^. D0,5) Физически это означает, что при данной температуре вероят- вероятность того, что система попадает в возбужденное состояние с энергией еь весьма мала. Температура является слишком низ- низкой для того, чтобы тепловое возбуждение могло с заметной вероятностью переводить систему в верхнее энергетическое со- состояние. Если, однако, в функцию состояний входит лишь один член, так что система с вероятностью, равной единице, нахо- находится в состоянии с энергией во, то ее энергия в точности рав- равна ео- Это же подтверждает прямое вычисление. Функция состояний системы, образованной из N независи- независимых одинаковых частиц, равна ^ kT Энергия системы согласно B1,3) равна Теплоемкость системы при постоянном объеме равна CV-(§)v = 0. D0,6)
$ 40] ФУНКЦИИ СИСТЕМЫ В ДВУХ КВАНТОВЫХ СОСТОЯНИЯХ 50f Мы видим, таким образом, что при Т <ГС наличие второго уровня совершенно не сказывается на термодинамических свой- свойствах системы, которая ведет себя, как система с постоянной энергией. Теплоемкость системы при достаточно низкой темпе- температуре равна.нулю. Представляет интерес поведение теплоемкости системы с двумя уровнями энергии при повышении температуры. Если неравенство ТС^Т не выполняется, то в функции состояний нужно оставить оба члена, написав Де\ go I При этом Энергия системы As D0,7> Наконец, теплоемкость при постоянном объеме G и — ( дт. \ Ход теплоемкости изображен на рис. 52. Из рис. 52 видно, что теплоемкость обнаруживает своеобразный ход: при Т == 0 она в согласии со сказанным ранее равна нулю. При повыше- повышении температуры теплоемкость возрастает и имеет характерный максимум. При дальнейшем росте температуры теплоемкость- вновь обращается в нуль. Последнее обстоятельство предста- представляет характерную особенность системы с конечным числом уровней. Причина обращения Cv в нуль становится понятной из формулы D0,7). При очень высокой температуре энергия.
502 ИДЕАЛЬНЫЕ ГАЗЫ [Гл V системы равна Е ~ Ne0 (et-eQ) go (l+gilgo) = const D0,9) и не зависит от температуры. Физически это означает, что при Т\Э> Тс тепловое возбуждение так велико, что система может одинаково легко находиться и в нормальном и в возбужденном состояниях. Вероятность нахождения ее в возбужденном со- состоянии сравнима с вероятностью ее нахождения в нормальном состоянии Если бы система имела другие возбужденные уровни, про- простиравшиеся до как угодно больших энергий, последнее обстоя- обстоятельство не имело бы места. Даже при высокой темпера- температуре нашлись бы такие уровни энергии, в которые система по- попадала бы с малой вероятно- вероятностью. Поэтому средняя энергия такой системы не выражалсь бы формулой типа D0,9), а при высокой температуре зави- зависела бы от температуры. Соответственно при высо- высокой температуре не будет об- обращаться в нуль теплоемкость системы. Характерный ход теплоем- теплоемкости с максимумом, обра- обращающейся в нуль со стороны низких и высоких температур, яв- является специфическим для системы с уровнями, лежащими в конечном интервале энергий. Наличие именно двух уровней упрощает расчет, но не является сколько-нибудь существенным. Аналогичный ход теплоемкости будет иметь место и в системах с несколькими уровнями Важно лишь, чтобы они лежали до- достаточно близко друг к другу, так чтобы можно было достиг- достигать температуры, при которой выполнено условие kT>>] >»(ео —еп)- Типичным примером атомов с двумя близкими уровнями являются атомы галоидов и щелочных металлов. У галоидов нижний уровень обладает четырехкратным вырож- вырождением go = 4, ближайший к нему возбужденный уровень вы- вырожден двукратно, g\ = 2. Расстояние между уровнями —у фто- фтора ГС = 582,7°К, у хлора ГС=1299°К, у брома ГС = 5275°К. Следующий уровень энергии лежит много выше — соответст- соответствующая температура составляет несколько десятков тысяч гра- лусов (например, у брома —около 88- 103°К) —и не дает прак- практически никакого вклада в теплоемкость. г/тс Рис 52
,41] ДВУХАТОМНЫЕ МОЛЕКУЛЫ 503 Рис. 53 § 41. Двухатомные молекулы Простейшими молекулами г^яются двухатомные молекулы, Представляющие устойчивое соединение двух одинаковых или различных атомов. Мы лишены возможности подробно разби- разбирать вопрос о природе сил, приводящих к образованию молекул из свободных атомов, а также детально описывать движение атомов в молекулах. Поэтому мы ограничимся лишь самой по- поверхностной характеристикой молекул, приведя только те све- сведения, которые нам понадобятся для дальнейшего. (Теории мо- лекул посвящена гл. X ч. V.) На рис. 53 изображена типич- типичная кривая, представляющая энергию взаимодействия элек- электронных оболочек атомов как функцию расстояния между ними. Потенциальная энергия взаимодействия имеет минимум в некоторой точке, обозначенной буквой г0. Вправо от нее на больших расстояниях тангенс угла наклона кривой, а следова- следовательно, и сила взаимодействия положительны. Это означает, что атомы притягиваются друг к другу. Слева от точки, в области, где электронные оболочки перекрываются, возникает сильное отталкивание между ато- атомами. Таким образом, устойчивому положению равновесия в мо- молекуле отвечает некоторое определенное расстояние между ядрами атомов, которое можно назвать диаметром молекулы ((см. табл. 4 на стр. 506). Энергия электронных оболочек U(r0) имеет минимальное значение. Если расстояние между ядрами изменяется на малую величину х, то энергия молекулы стано- становится равной U(ro + x). При малых значениях х ее можно раз- разложить в ряд по степеням х и ограничиться первыми членами разложения: (^) (^)^ ^- D1,1) (в точке минимума первая производная равна нулю, а вто- вторая— положительна). Формула D1,1) показывает, что при от- отклонении атомов от равновесного положения на них действует квазиупругая сила, возвращающая их в положение равновесия. Из сказанного ясно, что в молекуле, помимо движения электро- электронов в атомных оболочках, возможно еще колебание атомов-
504 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V около положения равновесия. Кроме того, молекула как целое может вращаться вокруг двух осей, перпендикулярных к пря- прямой, соединяющей ядра. Таким образом, энергию молекулы можно считать слагаю- слагающейся из энергии поступательного движения молекулы как це- целого в пространстве, энергии движения электронов, энергии колебаний и энергии вращения •'=¦- молекулы. Поступательное дви- г , жение двухатомной молекулы ' v~ ничем не отличается от поступа- з тельного движения одноатомной f v=Z молекулы. Нас поэтому будет 4 интересовать только внутреннее | или движение двухатомной моле- ' V=J кулы. Ее внутреннюю энергию з можно написать в виде г J=i - *-fff еваутр = е9л + екодеб + 8вращ, D1,2) * где еэл — энергия движения элек- 3 тронов, еколеб — энергия колеба- г ний и 8вращ — энергия вращения. -*"~- v=Z Внутреннее движение молекулы оказывается квантованным. Энер- 2 ZZZH ГИИ Еэл» 8колеС И бвращ ПрИНИМаЮТ / v=/ дискретный ряд значений. При 4 этом оказывается, что расстояние 3 между соседними уровнями энер- 2 гии электронов в молекуле Деэл J=i =^^———_ v=a,i гораздо больше расстояния ме- между соседними уровнями энер- Рис- 54- гии колебательного движения Аеколеб- В свою очередь расстоя- расстояние между соседними уровнями энергии колебательного дви- движения Двколеб очень велико по сравнению с расстоянием между соседними уровнями вращательного движения Девращ. Итак, Деэл > Деколеб > Девращ. D1,3) Поэтому энергетические уровни молекулы расположены так, как это схематически показано на рис. 54. На этом рисунке схематически показаны колебательные и вращательные уровни, принадлежащие к двум электронным уровням, / и /'. Расстоя- Расстояние между последними велико и показано штрих-пунктиром в знак того, что оно не может поместиться в масштабе рисунка. Жирные линии отвечают колебательным состояниям с кванто-
$ 41] ДВУХАТОМНЫЕ МОЛЕКУЛЫ 505 выми числами v = 0, 1, 2. Тонкие линии — разные вращатель- вращательные уровни с кватовыми числами / = 1, 2, 3, 4. Поскольку движение электронов происходит гораздо быстрее, чем движе- движение тяжелых ядер (при колебаниях и вращении молекулы как целого), в первом приближении можно считать, что движение ядер не сказывается на движении электронов. Далее, если амплитуда колебаний ядер в молекуле доста- достаточно мала, можно пренебречь влиянием колебательного дви- движения на вращение. При малой амплитуде колебаний измене- изменение расстояний между ядрами настолько мало, что соответст- соответствующее изменение момента инерции молекулы весьма мало и его можно не учитывать. Вращение будет происходить с неиз- неизменным моментом инерции, как будто бы колебаний не про- происходило. Таким образом, в первом приближении все три вида движения в молекуле можно считать независимыми друг от друга. Следует заметить, что точность современных методов изме- измерений такова, что для многих целей вычисления, основанные на представлении о независимом вращательном и колебательном движениях, оказываются недостаточно точными. В современной теории приходится учитывать изменение момента инерции мо* лекулы, обусловленное ее колебаниями. Соседние уровни энергии электронного движения, так же как и уровни энергии в атомах, лежат на расстоянии порядка нескольких электрон-вольт, что соответствует температуре в не- несколько тысяч градусов. Для того чтобы перевести молекулу С одного уровня электронного движения на другой, ей должна быть сообщена соответствующая энергия. Это возможно только при очень высоких температурах (а также при нетепловых воз- Действиях на молекулу, например при освещении ее светом, ударе быстрым электроном и т. п.). Обычно, однако, можно считать, что источники возбуждения электронного движения от- отсутствуют и молекулы находятся на самом низком энергетиче- энергетическом уровне электронного движения. В дальнейшем мы ограни- ограничимся исследованием этого случая. Таким образом, при рас- рассмотрении теплового движения молекул электронные уровни Энергии вообще можно не принимать во внимание. Рассмотрим теперь колебательное движение двухатомной молекулы. Колебания обоих ядер около равновесного расстоя- расстояния можно свести к колебательному движению одной мате- материальной точки с приведенной массой ц= „/"l"^ • Такая ма- материальная точка представляет собой линейный осциллятор, рассмотренный в § 1. При достаточно малой амплитуде коле- колебаний его можно считать гармоническим осциллятором. Энер- Энергия гармонического осциллятора принимает дискретный ряд
506 ИДЕАЛЬНЫЕ ГАЗЫ значений, даваемый формулой A,18): ГГл V где квантовое число я принимает ряд целочисленных значений: п = 0,1,2, ..., v — классическая частота, связанная с постоян- постоянной квазиупругой силы к и массой осциллятора обычным соот- соотношением v~я Все уровни осциллятора являются невырожденными, так что каждому значению квантового числа п отвечает вполне опреде- определенная энергия еколеб- Разность энергий между соседними уров- уровнями колебательного движения равна Ае колеб = hv [п + y) ~ hv[n - 1 + ^ hv и не зависит от квантового числа п: уровни энергии располо* жены на равных расстояниях друг от друга. Согласно правилу частот Бора при переходе системы с од- одного уровня энергии на другой излучается или поглощается свет с энергией hv. В квантовой механике показывается, что изменение квантового числа п подчиняется так называемому правилу отбора: Дп= ±1. Измеряя частоты поглощения или излучения света моле- молекулами, можно определить собственную частоту v молекулы и найти постоянную квазиупругой силы и и разности энергий Аеколеб- Значения этих величин для некоторых молекул при- приведены в табл. 4. Частоты, излучаемые или поглощаемые моле- Таблица 4 Основные величины, характеризующие свойства двухатомных молекул Молекула н2 . N2 . О2 . С12. НС1 со. N0 Расстоя ние меж'iv атомами Го, К)""8 см 0,74 1,10 1,21 1,99 1,27 1,13 1,15 Момент инерции /, Ю-40 г с.«2 0,46 13,84 19,13 113,5 2,67 14,37 16,43 Частота колебаний V ~с' см~1 4276 23СЮ 1580 565 2989 2169 1906 Вращательная постоянная В ft с &п21с ' см~1 59,35 2,00 1,45 0,24 10,6 1,92 1,68 Постоянная квазиупругой силы к, 10~5 дн1см 5,1 22,2 11.3 3,21 8,65 18,6 15,4 Энергия днесоциа ции D, аа 4,48 7,38 5,08 2,47 4,40 9,61 5,29
5 41] ДВУХАТОМНЫЕ МОЛЕКУЛЫ 507 кулами при изменении их колебательного состояния (при фик- фиксированном значении электронной энергии), лежат в инфра- инфракрасной области спектра') и составляют обычно 100—4000 см~1. Приведенные формулы для энергии колеблющейся молекулы справедливы лишь в приближении малых колебаний. При боль- большом возбуждении колебаний (например, при высокой темпера- температуре) амплитуда их становится не малой и следует учитывать ангармоничные члены в потенциальной энергии. Рассмотрим теперь вращательное движение двухатомной молекулы. Если пренебречь изменением момента инерции моле- молекулы из-за колебаний, то молекулу можно считать твердым ротатором с моментом инерции / = —т^тг -г\, вращающимся вокруг центра тяжести. Как показывается в квантовой меха- механике (§ 81, ч. V), энергия вращающегося ротатора выражается формулой ^ +1), D1,4) где / — квантовое число, принимающее целочисленные значе- значения: / = 0, 1, 2, ..., и В —~р~тг ~ постоянная, называемая вра- вращательной постоянной. При этом оказывается, что состояния ротатора, отвечающие данной энергии вращения, являются Bj + 1)-кратно вырожденными (см. § 30 и § 81, ч. V). При изменении квантовых состояний молекулы квантовое число изменяется на величину А/ = ±1. Расстояние между со- соседними уровнями энергии вращения равно Д (/ 1) Наблюдая излучение при переходе между вращательными уровнями, можно определить величину AeBpaw и, следовательно, момент инерции молекулы /. Значение этих величин для неко- некоторых молекул можно вычислить с помощью табл. 4. Подстав- Подставляя в выражения для евращ и еКолеб значения постоянных, при- приведенных в четвертом и пятом столбцах таблицы, убеждаемся в справедливости предположения о том, что АеКолеб ^ Аевращ (АеВращ в 800—1000 раз меньше Ае,(Олеб)- Нужно заметить, что на практике редко удается наблюдать переходы молекулы между разными вращательными уровнями при неизменных электронном и колебательном состояниях, так как Аевращ стоть мало, что соответствующие частоты v = —т— лежат в далекой ') Нужно заметить, что это не относится к симметричным молекулам ти- типа Н2 и О2, у которых таких переходов нет. У этих молекул Ле^олеб опре- определяется из переходов с одновременным изменением электронных состояний.
508 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V инфракрасной части спектра, где точность измерений мала. Чаще всего наблюдаются спектры излучения и поглощения мо- молекул в области видимого спектра. Эти спектры возникают при одновременном изменении электронного, колебательного и вра- вращательного состояний молекулы. Излучаемый (или поглощае- поглощаемый) при этом спектр имеет характер групп близких спектраль- спектральных линий, сливающихся в слабом спектроскопе в сплошные полосы (полосатый спектр молекул). Происхождение полос легко понять из рис. 53. Пусть, например, переход происходит с верхних на самый нижний уровень. Основная частота излу- излучается при переходе с уровня 2 v = 0, /=1. Близкие к ней частоты излучаются при переходе с уровней 2, v = 1, / = 0; v = 2, / = 0 и т. д. Таким образом, при одновременном измене- изменении колебательного, вращательного и электронного состояний молекулы излучается целый ряд частот, лежащих близко друг к другу (поскольку выполнено неравенство D1,3)). Совокуп- Совокупность спектроскопических данных позволила установить поло- положение энергетических уровней для очень большого числа двух- двухатомных молекул. § 42. Термодинамические функции двухатомных газов Теперь мы можем перейти к рассмотрению теплоемкостей и термодинамических функций двухатомных газов, вычисление которых оказалось непреодолимо трудным для классической статистики. Схема вычисления термодинамических функций двухатомных газов ничем не отличается от рассмотренной уже нами схемы вычисления для одноатомных газов. Поскольку мо- молекулы являются тождественными между собой независимыми частицами, функция состояний всего газа, содержащего N мо- молекул, может быть написана в виде Нам требуется найти функцию состояний одной молекулы. Энергию молекулы можно разбить на энергию движения ее как целого в пространстве и энергию внутреннего движения: В = вцоступ т ввнутр- Поскольку эти два вида движения являются независимыми, чис- число состояний системы, отвечающих энергии е, распадается на число состояний, отвечающих энергии поступательного и вну- внутреннего движений: У = У (бцОСТУп) " (ввыуТр) •
4 42] ТЕРМОДИНАМИЧЕСКИЕ ФУНКЦИИ ДВУХАТОМНЫХ СОСТОЯНИЙ 509 Соответственно этому функцию состояний можно разбить на произведение двух множителей епоступ евиутр 2=2 е **~ Q (епоступ) • 2 е ^~п (евнутр) = zn0CTyn• 2внутр, D2.2) где 2Поступ — функция состояний, связанная с поступательным движением молекулы как целого, и гВПутр — функция состояний внутреннего движения. Функция состояний поступательного движения двухатомной молекулы ничем не отличается от функции состояний одноатом- одноатомной молекулы, поскольку она движется в пространстве как ма- материальная точка с массой т = Ш\ + т2, находящейся в центре тяжести молекулы. Поэтому для функции состояний поступа- поступательного движения можно написать ( 2nmkT \'/i ,, ,.п оч = ( # ) V. D2,3) Более сложным является вычисление zBH>ip. Внутреннее дви- движение двухатомной молекулы сводится к вращению ее относи- относительно двух взаимноперпендикулярных осей и колебаниям атомов около положения равновесия. В первом приближений можно не учитывать влияния малых колебаний на величину мо- момента инерции молекулы и считать колебательное и вращатель- вращательное движения независимыми друг от друга (ср. § 41). Электрон- Электронную энергию, остающуюся все время неизменной, можно совсем не рассматривать. Поэтому согласно D1,2) энергию внутрен- внутреннего движения молекулы можно написать в виде " бколеб Т ввращ- Соответственно этому функция состояний для внутреннего дви- движения распадается на произведение двух множителей еколеб+еврлщ Явнутр = 2 е~ кТ Q (еколе6) Q (евраш) = еколеб 8вращ = 2 е~ kT Q (еколеб) 2 е kT Q (евращ) = 2колсб • гвращ. D2,4) Подставляя в D2,1) выражения для г из D2,2) и D2,4), получим ?• == дг j V^nocryiu v2'кoлeв^ \2!вращ/ • Dл,О) Отсюда можно найти выражения для термодинамических функ- функций: ~ ' ноступ + Еколеб 4" « враш.1 D2,6)
510 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V где через /доступ, ^колеб и FBpam обозначены отдельные слагае- слагаемые в свободной энергии, обязанные своим происхождением по- поступательному, колебательному и вращательному движениям молекул газа. Выражение для /доступ совпадает со свободной энергией одноатомного газа (формула C7,7)), если заменить в последней массу одного атома на суммарную массу двухатом- двухатомной молекулы. Аналогично ~df ~ постУп ¦" Околев ~Ь ^враад» D2,7) о — I ~~Qf~ I == «Ьпоступ i Околев Т ОВращ, D2,8) D2,9) Таким образом, все термодинамические функции распа- распадаются на отдельные слагаемые. Каждое слагаемое соответ- соответствует одному из не зависящих друг от друга видов движения двухатомной молекулы: поступательному, колебательному или вращательному. Для вычисления термодинамических функций атомного газа необходимо найти соответствующие функции со- состояний внутреннего движения. В следующих параграфах мы рассмотрим функции состояний колебательного и вращатель- вращательного движений. § 43. Колебательная функция состояний и вклад колебаний в энергию и теплоемкость В первом приближении колеблющуюся двухатомную моле- молекулу можно рассматривать как квантовый гармонический ос- осциллятор, энергия которого выражается формулой A,18). Все уровни энергии осциллятора являются невырожденными, т. е. с весом Q=l. Подставляя выражение для энергии A,18) в функцию состояний, имеем п=0 D3,1) Воспользовавшись известной формулой суммирования беско- бесконечно убывающей геометрической прогрессии, получим ftv hy_ kT D3J) Из формулы D3,2) видим, что функция состояний, а следо- следовательно, и термодинамические величины определяются зна-
$ 43] КОЛЕБАТЕЛЬНАЯ ФУНКЦИЯ СОСТОЯНИЙ 511 чением переменной hvjkT. В обозначениях § 40 мы можем, вы- выразив hv в энергетических единицах, написать: hv=kTc, где Тс — так называемая характеристическая температура. Формулу D3,2) можно переписать в виде Вычислим теперь термодинамические функции двухатомной молекулы, отвечающие ее колебательному движению. Найдем прежде всего среднюю колебательную энергию: щ- In гколеб = NkT2 -gjr In 2 Для колебательной теплоемкости находим Nk I h\ \2 1 Nk ,43,3) Мы видим, что средние колебательные энергия и теплоем- теплоемкость оказываются сложными функодями температуры Г и ха- характеристической температуры Тс (или собственной частоты v). Рассмотрим предельный вид этих функций при высоких (Т^>ТС) и низких (Т'СГс) температурах. В первом случае экспоненци- экспоненциальную функцию можно разложить в ряд и ограничиться пер- первыми членами разложения. Это дает Яколев « NkT, D3,5) С^колеб « Nk. D3,6) При низких температурах е т >¦ 1, так что D3,7) D3(8)
512 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V Формулы D3,5) и D3,6) совпадают с классическими форму- формулами § 39. Наоборот, при низких температурах выражения для энергии и теплоемкости очень существенно отличаются от клас- классических. При понижении температуры энергия колебаний стре- „ NkTc Nhv _ мится к постоянному пределу ?о = —„—=—2—' Последняя величина, представляющая энергию колебаний молекул при аб- абсолютном нуле, носит название нулевой энергии. Существование нулевой энергии является характерной особенностью квантового движения. Оно является выражением того факта, что в квантовой теории поня- понятие полного покоя частицы оказывается лишенным физического смысла. Численное значение Ео может быть найдено из спектроскопических данных; для этого нужно лишь найти значение собственной частоты колебаний моле- молекулы v. Теплоемкость при низких темпе- температурах оказывается малой величиной, ' г т/тс убывающей по экспоненциальному за- закону, т. е. стремящейся к нулю при Рис. 55. Т-+0. Таким образом, общая схема из- изменения энергии и теплоемкости с темпе- температурой сводится к тому, что при высоких температурах, когда тепловая энергия kT велика по сравнению с расстоянием между уровнями энергии Де = h\ = kTc, теплоемкость и энергия даются классическими выражениями; при низких температурах энергия стремится к предельному значению — к нулевой энер- энергии квантового осциллятора, а теплоемкость — к нулю. Такой ход величин находится в согласии с общими соображениями. При высоких температурах размер квантовых ступенек Ае ока- оказывается малым по сравнению с тепловой энергией, так что осциллятор может находиться в большом числе возбужденных квантовых состояний, а его энергию можно считать изменяю- изменяющейся непрерывно, как у классического осциллятора. Наоборот, при низких температурах осциллятор все время находится в нормалйном состоянии и тепловое возбуждение является недо- недостаточным для перевода его в верхние возбужденные состояния. Кривая зависимости средней энергии осциллятора от отно- отношения Т/Те, даваемая формулой D3,3), изображена на рис. 55. Из рис. 55 видно, что при приближении Т к Тс происходит плав- плавный переход между предельными значениями D3,5) и D3,7). Основное отличие классического выражения для средней энер- энергии осциллятора D3,5) от квантового выражения D3,3) состоит в том, что в последнем случае энергия зависит от частоты. Бла- Благодаря этому задание температуры не характеризует еще пол-
. 43] КОЛЕБАТЕЛЬНАЯ ФУНКЦИЯ СОСТОЯНИЙ 513 г ностью энергию осциллятора. При одной и той же температуре два осциллятора с разными собственными частотами колебаний будут иметь различные энергии. На рис. 56 изображена зави- зависимость энергии осциллятора от частоты при фиксированной температуре Т. Теплоемкость плавно убывает с падением температуры от ее классического значения D3,6) до нуля. Таким образом, ис- исчезновение колебательной тепло- теплоемкости, «замораживание» ко- колебаний, о котором шла речь в § 39, появляется при рассмотре- рассмотрении свойств молекулы как кван- квантового осциллятора самым не- непосредственным и естественным образом. При низких температурах частота колебаний v оказывает- оказывается относительно (по сравнению с kT/h) очень большой. Большой частоте соответствует большая жесткость связи обоих атомов. С понижением температуры рост относительной жесткости при- приводит к тому, что колебания постепенно прекращаются. Чтобы можно было представить себе порядки величин и, в частности, порядок характеристических температур различных молекул, мы приводим в табл. 5 соответствующие значения для ряда молекул. Значения частот собственных колебаний молекул находятся из спектроскопических данных. Таблица 5 Рис. 56. Молекула н2 . . . . N..... О, .... СО .... Характери- Характеристическая температура Молекула X 1000° К 6,0 3,34 2,23 3,07 HCI . . . НВг . . . HJ . . . . Характери- Характеристическая температура X 1000° К 4,14 3,7 3,2 Из табл. 5 можно сразу же сделать важный в практическом отношении вывод: поскольку характеристические температуры колебаний всех молекул имеют порядок нескольких тысяч граду- градусов, температура порядка 300° К соответствует предельному слу- случаю Т «С Тс Поэтому колебательная теплоемкость большинства молекул при комнатных температурах очень мала. Например, 33 В. Г. Левнч, гом 1
Б14 ИДЕАЛЬНЫЕ ГАЗЫ [Гл. V г V в случае Ш при 640° К вычисление по общей формуле D3,4) показывает, что колебательная теплоемкость составляет около 0,08 кал/град • моль. В большинстве практически важных слу- случаев при не очень высоких температурах можно считать, что колебательное движение является замороженным и его вклад в теплоемкость равен нулю. Во всяком случае он су- существенно меньше, чем это следовало бы из закона равно- равномерного распределения. Коле- Колебательная часть теплоемкости зависит от температуры и не- неодинакова у молекул различ- различных веществ. Перейдем теперь к вычис- IV V Ш Г 1 1 Nkf — —^_^ 1 1 ! 1 I | Г ! о I высояие темпер г tlV 3 Huamie irnrmep Рис. 57. лению других термодинамиче- термодинамических величин. Свободная энергия, обусловленная колебатель- колебательным диижением, имеет вид * колеб — Nkl 1П 2коле6 Nhv - + MWlnU -e ¦ D3,9) Соответственно, энтропия С~Щ i Nhv схрКМ-1 ckl — 1 ¦Mfelnj"l -expf—- . D3,10) При высоких температурах можно произвести разложение по степеням отношения TJT и ограничиться первыми членами раз- разложения. Это дает колеб ' с T Наоборот, при низких температурах е г < 1, так что Экспеб 0.
§44] ВРАЩАТЕЛЬНАЯ ФУНКЦИЯ СОСТОЯНИЙ 515 Для практического вычисления функции состояний колеба- колебательного движения и термодинамических величин требуется зна- знание одной характерной молекулярной постоянной — собственной частоты колебаний молекулы v. Ее значение для большинства двухатомных молекул известно из спектроскопических данных, в частности инфракрасных колебательных спектров. Значения функций, входящих в формулы D3,3), D3,4), D3,9) и D3,10), табулированы и находятся прямо по таблицам. Зависимость их от отношения hv/kT показана на рис. 57. § 44. Вращательная функция состояний и вклад вращения в термодинамические функции Рассмотрим теперь функцию состояний для вращательного движения двухатомной молекулы. Энергия ротатора принимает дискретный ряд значен.й h2 j (}+ 0» D4,1) где /=0, 1, 2, 3,... Каждое состояние с определенной энергией вращения, т. е. с определен и ы м значением вра- вращательного квантового числа, оказывается B/ + 1)-кр а тновы рож деи н ы м. Поэтому функция состоя- состояний вращательного движения имеет вид p D4,2) /?2 Т ФуНКЦИЯ СОСТОЯНИЙ гвращ ЗаВИСИТ ОТ ОТНОШеНИЯ я 2iur ~^f~y где Тс= "g~2l7~ характеристическая температура для враще- вращения. Таким образом, 2вращ=2B/+1> г . D4,3) /=о В табл. 6 приведены значения характеристических температур для вращения различных двухатомных молекул. Из табл. 6 видно что, в отличие от характеристических тем- температур для колебательного движения, характеристические тем- температуры для вращательного движения чрезвычайно малы и лежат значительно ниже точки конденсации газа при нормаль- нормальном давлении. Исключение составляют молекулы Н2 и D2, у которых характеристические температуры сравнительно велики и лежат выше температуры конденсации. Высокие характери- характеристические температуры Н2 и D2 обусловлены малостью их 33*
516 идеальный газы [Гл V Таблица 6 Молекула и, .... D2 . . . . N2 . . . . Характери- Характеристическая температура, °К 85,4 43 2,85 Молекула о2 . . . . НС1 . . . FIJ . . . . Характери- Характеристическая температура, °К 2,07 15,1 9,0 моментов инерции \1Пг = —^— и /Сг = —^—, где тн и массы протона и дейтрона и а — расстояние между ними в моле- молекулах). Поэтому для всех молекул, кроме Н2 и D?, можно счи- считать, что расстояния между двумя последовательными уровнями энергии вращения малы по сравнению с тепловой энергией. Иначе говоря, по отношению к вращению тяжелых молекул тем- температура всегда является высокой. При высоких температурах суммирование по отдельным уровням энергии в D4,3) можно заменить интегрированием по почти слившимся уровням: Гс/(/ + 0 2j+l)e T dj. D4,4) Вводя новую переменную интегрирования у=Щ+\), находим оо Т п 2вращ =Je T dt)=*y-= \г • D4'5) О Мы приходим, таким образом, к классическому выражению В следующем приближении функцию состояний можно вы- вычислить при помощи известной формулы суммирования Эй-* лера'): /=о о Г@). Т ,1A+1) В даннэм случае f(j) = Bj+l)e , так что f@) = l; f@) = 2—^; Г ') См., например, А. Гельфонд, Исчисление конечных разностей, Гос- техиздат, 1952, стр. 343.
§ 44] ВРАЩАТЕЛЬНАЯ ФУНКЦИЯ СОСТОЯНИЙ 517 и для 2„Ращ получаем Второй и третий члены представляют квантовую поправку к классическому значению z^p,m. Из формулы D4,6) видно, что эта поправка мала при температуре Т, большей Тс, и быстро убывает с ростом Т. Учитывая приведенные значения характеристических темпе- температур, можно сказать, что вся область реальных температур лежит гораздо выше Тс. Поэтому квантовые поправки к 2вращ у всех молекул, кроме самых легких, играют весьма незначи- незначительную роль. При низких температурах (Т<^ТС) в общем выражении для Явращ нужно оставить лишь первые, самые большие члены. Это даег „Jk. 2враЩ~1+Зе т. D4,7) Найдем теперь слагаемые в термодинамических функциях, связанные с вращательным движением. Очевидно, имеем Vj+Ve ~. D4,8) /-о При высоких температурах имеем ^) D4,9) Соответственно вращательная теплоемкость при высокой темпе- температуре имеет классическое значение: Су„лщ~Мк. D4,10) При низкой температуре врап = NkT-±r и теплоемкость Еврап = NkT*-±r In (l + 3<r») « ^ eOT D4.1 _. о { I? Y N „S Cv « Таким образом, при очень низких температурах вращательная энергия и теплоемкость оказываются экспоненциально убываю- убывающими с температурой. Как мы подчеркивали ранее, фактически' наблюдать уменьшение по экспоненциальному закону величины
5J8 ИДЕАЛЬНЫЕ ГАЗЫ [Гл V теплоемкости с температурой можно только у самых легких молекул. Напишем еще выражения для свободной эьергии и энтропии. При высоких температурах будет ^вРа,ц=— NkT\nzmm=-NkTln \2uBj+l)e т U, L/-o J -^---|^ D4,13) Sopam ~ - Nk In Ц- + Nk. D4,14) При низких температурах, с учетом D4,7), получаем D4,15) . D4,16) Таким образом, вращательная энергия и энтропия при очень низких температурах экспоненциально убывают. Общий ход теплоемкости, связанной с вращением, имеет тот же характер, что и ход теплоемкости, связанной с колебаниями молекул: при высоких температурах теплоемкость стремится к классическому значению, при низких в согласии с требованиями третьего на- начала термодинамики теплоемкость стремится к нулю. Однако понятия высокой и низкой температур для вращения и колеба- колебаний оказываются существенно различными — для колебаний комнатная температура, как правило, должна считаться низкой, для вращения — высокой. Как видно из формул D4,8), D4,12) и последующих, для фактического вычисления функции состояний и термодинамиче- термодинамических величии нужно знать только одну молекулярную постоян- постоянную— момент инерции молекулы /. Значение этой функции для большинства двухатомных молекул известно из спектроскопи- спектроскопических данных, в частности из вращательных инфракрасных спектров. Если же известен вращательно-колебательньгй спектр молекулы, т. с. ее уровни энергии вращательного и колебатель- колебательного движений, то вычисление функций состояний можно про- производить с помощью непосредственного суммирования1). В заключение отметим, что в случае водорода и дейтерия необходимо учитывать влияние спина ядра на вращательное ') Подробнее см И. II. Годней, Вычисление термодинамически функ- функций по молекулярным данным, Гостехиздат, 1956.
$ 43] МНОГОАТОМНЫЕ МОЛЕКУЛЫ 519 движение. Оказывается, что ядерный спин существенно влияет на характер вращательных состояний молекул, состоящих из одинаковых атомов. В частности, в зависимости от значения ядерного спина молекулы водорода могут находиться в двух типах вращательных состояний. В состояниях первого типа, отвечающих суммарному значе- значению спина обоих ядер, равному нулю, вращательное квантовое число / пробегает ряд четных значений / = 0, 2, 4, 6, . .. В со- состояниях второго типа, отвечающих суммарному спину обоих ядер, равному единице, квантовое число пробегает ряд нечетных значений /=1,3,5,... Молекулы первого типа носят название параводорода, а вто- второго— ортоводорода. Между орто- и параводородом в обычных условиях не существует переходов, так что газ как целое нужно считать смесью двух различных модификаций. Это обстоятельство существенно отражается на виде вычис- вычисленных термодинамических функций1). § 45. Многоатомные молекулы Рассмотрение многоатомных молекул в принципе мало отли- отличается от рассмотрения двухатомных молекул. Функция состоя- состояний многоатомной молекулы, так же как и функция состояний двухатомной молекулы, может быть написана в виде D0,1 ) если только пренебречь влиянием колебаний на вращение мо- молекулы (в связи с изменением размера последней). Функция состояний поступательного движения ничем не отличается от вычисленной ранее. Однако вычисление функции состояний вну- внутреннего движения у многоатомных молекул несравненно слож- сложнее, чем у двухатомных молекул. При рассмотрении вращательного движения молекулы нуж- нужно различать три случая: линейной молекулы, симметричного и асимметричного волчка. Вращательное движение линейной многоатомной молекулы ничем не отличается от вращения двух- двухатомной молекулы. У симметричного волчка два главных мо- момента инерции равны между собой (I\ = h=fch), тогда как у асимметричного волчка все моменты инерции различны (^Ф^ФЫ) В первом случае квантовомеханическое рассмотре- рассмотрение позволяет вычислить уровни энергии вращения молекулы, которые выражаются формулой, сходной с формулой для уров- уровней энергии простого волчка. Однако явного выражения для ') См, например, Л. Д. Ландау и Е. М Лафшни, Статистическая физика, Гостехиздат, 1951, стр 163.
520 ИДЕАЛЬНЫЕ ГАЗЫ [Гл V уровней энергии асимметричного волчка не существует. В случае молекул типа асимметричных волчков обычно пользуются неко- некоторыми приближенными выражениями для энергетических уров- уровней, точность которых не очень велика. Однако положение суще* ственно облегчается тем, что характеристические температуры для вращения многоатомных молекул обычно еще меньше, чем у двухатомных молекул. Поэтому обычные температуры, при ко- которых можно работать с несконденсированными многоатомными газами, являются высокими, и для фУНК1ши состояний враща- вращательного движения можно без сколько-нибудь заметной погреш- погрешности пользоваться классическим выражением для 2вращ. Так, например, отличие между квантовым и классическим выраже- выражением для вращательной функции состояний у молекулы HCN при температуре 100° К составляет около 0,5%, у молекул СНзС1 — около 1%; при температуре 300°К это отличие стано- становится совсем ничтожным и лежит за пределами точности изме- измерений. В большинстве расчетов функции состояний многоатом- многоатомных молекул пользуются классическим приближением. Характерной особенностью большого числа многоатомных молекул, в частности молекул органических соединений, являет- является наличие у них большего или меньшего числа одинаковых атомов. С наличием одинаковых агомов в молекуле тесно свя- связана ее симметрия. Благодаря наличию симметрии молекула со- совмещается сама с собой при определенных поворотах, точно так же как двухатомная молекула, содержащая два одинаковых атома, при повороте на 180°. Наличие симметрии у молекулы требует введения во вращательную функцию состояний мно- множителя симметрии у. Множитель симметрии у—2 следует вво- вводить и для двухатомных молекул с одинаковыми ядрами. Он представляет число физически неразличимых положений моле- молекулы при ее поворотах, как твердого тела. Для получения пра- правильного выражения для вращательной функции состояний, в которой каждое физическое состояние учитывалось бы только один раз, функцию состояний, полученную при интегрировании по всем значениям угла поворота (в классическом приближении), нужно разделить на множитель симметрии у- С введением мно- множителя симметрии вращательную функцию состояний много- многоатомной молекулы с тремя различными моментами инерции в классическом приближении можно записать в следующем виде: г /8я2(&П3/,/2/з, D5,2) где моменты инерции выражены в г • см2 и температура отсчи- тывается по абсолютной шкале. Если известна структура моле- молекулы, то значения множителя у находятся из простых соображе- соображений симметрии. В случае линейной молекулы СОг (см. рис. 48)
$45 МНОГОАТОМНЫЕ МОЛЕКУЛЫ 521 множитель симметрии у = 2, так как молекула совмещается сама с собой при повороте на угол п. Нелинейная молекула SO2 (рис. 48) также совпадает сама с собой при повороте на угол я, и для нее у=2. Молекула метана СЬЦ представляет правильный тетраэдр с атомом углерода в центре. Она совмещается сама с собой при повороте на угол 120° вокруг вертикальной оси и при совмещении каждого из четырех углов тетраэдра, всего при 12 поворотах, так что у^^. Молекула аммиака NH3 представ- представляет пирамиду с атомом азота в вершине. Она совмещается сама с собой при повороте на 120° вокруг вертикальной оси, так что y=3. Колебательное движение многоатомных молекул несравнен- несравненно сложнее, чем колебательное движение двухатомных моле- молекул. Число колебательных степеней свободы составляет 3« — б у нелинейных многоатомных молекул и Зп — 5 у линейных и мо- может быть довольно велико у сложных молекул. Например, у молекул SO2 имеются три колебательные степени свободы, у молекулы NH3 их уже шесть, у молекулы С6Н6 число колеба- колебательных степеней свободы равно 30. Изучение колебаний подоб- подобных систем представляет сложную задачу. Тем не менее, коле- колебательное движение очень большого числа молекул исследовано. Если считать отклонения атомов от положений равновесия ма- малыми (что не всегда возможно в случае многоатомных моле- молекул; см. ниже), то движение системы будет представлять собою малые колебания и колебательное движение молекулы можно разложить на совокупность независимых нормальных колеба- колебаний1). Каждой степени свободы отвечает одно нормальное ко- колебание со своей собственной частотой. Частоты нормальных колебаний (собственные частоты системы) связаны с массами ядер и постоянными квазиупругих сил обычными соотноше- соотношениями. В общем случае частоты всех нормальных колебаний являются различными. Однако нередко частоты некоторых нор- нормальных колебаний совпадают. В этом случае колебания являются вырожденными. ') В произвольных координатах потенциальная энергия системы колеб- колеблющихся точек имеет вид где | — смещения. Для нахождения нормальных колебаний необходимо найти такие координаты |ь в которых потенциальная энергия системы имеет вид ортогональной квадратичной формы U =*-^- ^jai^- Выбор новых перемен- переменных может быть сделан чисто алгебраическим путем, но очень существенно •упрощается при использовании свойств симметрии системы (см., например, Л. Т.. Л а н д а у и Е. М. Л и ф ш и ц, Механика, Физматтиз, I960).
522 ИДЕАЛЬНЫЕ ГАЗЫ [Гл у Значения собственных частот могут быть найдены из ана- анализа инфракрасных спектров, а также спектров рассеяния мо- молекул, хотя это является далеко не простой задачей. Спектры ряда более простых молекул изучены достаточно подробно, и их собственные частоты определены с большой степенью точности. На рис. 48 изображены нормальные колебания некоторых ти- типичных молекул (Н2О, БОг и СО2). Каждое нормальное коле- колебание с собственной частотой v; вносит свою долю в функцию состояний 2колеб. которая в силу независимости нормальных ко- колебаний может быть представлена в виде произведения соответ- соответствующих множителей: D5,3) где Т® — характеристическая температура 1-го нормального ко- колебания. Значения T^J для различных нормальных колебаний могут заметно отличаться друг от друга. Так например, у моле- куты аммиака шесть нормальных колебаний имеют следующие характеристические температуры-Т^ (в 102°К): 13,6; 23,3; 23,3; 47,8; 48,8; 48,8. Мы видим, что характеристические температуры могут отличаться друг от друга в три раза. Различие характе- характеристических частот связано с различием в величине постоянных квазиупругих сил (различие жесткости связей атомов в моле- молекулах). Характеристические температуры многоатомных моле- молекул, как и характеристические температуры двухатомных моле- молекул, составляют несколько сотен или тысяч градусов. Поэтому вклад колебаний в теплоемкость при умеренных температурах сравнительно невелик. Во всяком случае, колебательная часть теплоемкости во много раз меньше, чем это следовало бы из закона равномерного распределения. В качестве примера можно привести ту же молекулу ам- аммиака. Полная теплоемкость молекулы NH3 составляет Cv = Скпоетуп + CVmm + С„колв6 = | + | + Сукажб (в единицах Nk). В табл. 7 приведены вычисленные по D5,3) и наблюденные на опыте значения (в кал/моль•град) колебательной теплоем- теплоемкости СГколев. При Т > 240° К вращательную теплоемкость можно считать имеющей классическое значение 3/г. Таким образом, при темпе- температуре около 800° К колебательная теплоемкость составляет около 2/з от полной теплоемкости молекулы и ею никоим обра- образом нельзя пренебрегать. Даже при комнатной температуре
45] МНОГОАТОМНЫЕ МОЛЕКУЛЫ 523 Таблица 7 г°к 213 272 303 334 383 ''колеб (вычисл.) 0,12 0,19 0,29 0,37 0,56 (наблюд.) 0,14 0,22 0,31 0,45 0,60 423 582 655 796 СУкотеб (иычпсл.) 0,70 1,31 1,72 2,06 (наблюд) 0,75 1,2 1,5 1,9 WO0VK Рис. 58. СуК01Сб составляет около 7% от полной теплоемкости. Тем не менее, она значительно меньше, чем это следует из закона равномерного распределения {6Nk), Подобная ситуация яв- является характерной для боль- большинства многоатомных молекул. Вклад различных видов дви- движения в значение энтропии моле- молекулы аммиака показан на рис. 58. Колебательное движение мно- многоатомных молекул имеет одну замечательную особенность, кото- которая не имеет аналога у двух- двухатомных молекул. Именно, очень часто амплитуда нулевых коле- колебаний определенных групп, вхо- входящих в молекулу, оказывается настолько большой, что соответствующее движение перестает быть гармоническим или совсем теряет колебательный характер. Яснее всего это видно на конкретных примерах. В большое чис- число многоатомных молекул, особенно органических, входят от- отдельные группы или радикалы, имеющие характер самостоя- самостоятельных групп, например, молекул этилена С2Н4 представляет образование из двух групп СНг. Аналогично молекула этапа С2НВ состоит из двух групп СН3. Молекула диметилацетилена СНз—С^:С—СН3 содержит две группы СН3 и углеродный остов. Благодаря существованию взаимодействия между водородными атомами потенциальная энергия групп СН2 или СН3 имеет минимумы при вполне определенной ориентации одной группы относительно другой. Именно, минимуму потенциальной энергии отвечает значение утла поворота (отсчитываемого от средней линии) одной группы СНз относительно другой, равное 60° или 180°. Иначе говоря, потенциальная энергия имеет минимум, когда обе группы расположены зеркально относительно друг друга (рис. 59). При смещении из положения равновесия (пово- (повороте одной из групп относительно другой) потенциальная энер- энергия возрастает и возникает сила, стремящаяся вернуть молекулу
524 ИДЕАЛЬНЫЕ ГАЗЫ (Гл. V к равновесному расположению. При этом возникают враща- вращательные колебания вокруг оси молекулы. Если, однако, ну- нулевая энергия этих колебаний оказывается настолько большой, что она превышает потенциальный барьер, препятствующий по- повороту группы, вращательные колебания превращаются в сво- свободное вращение группы относительно оси молекул. Последний случай встречается сравнительно редко. Примером его может служить упомянутая выше молекула диметилацетилена. В пей обе группы СНз отстоят друг от друга на сравнительно большом расстоянии и их взаимодействие не очень велико. Поэтому высота барьера, препятствую- препятствующего вращению, оказывается относи- относительно небольшой и группы СН3 нахо- 0 1п in -п. -я 4к дятся в свободном вращении. Однако 33333 в большинстве случаев вращение от- Рис. 59. дельных групп является заторможен- заторможенным. При низких температурах про- происходят вращательные колебания большой амплитуды, которые превращаются во вращение при очень высоких температурах, когда тепловая энергия kT оказывается большей, чем высота барьера Uo. Существование свободного вращения изменяет ве- величину теплоемкости и других термодинамических величин по сравнению с молекулами без вращений: часть колебательных степеней свободы заменяется вращательными. Если считать вращение свободным, то расчет теплоемкости и других термо- термодинамических величин не представляет труда, поскольку вра- вращение сравнительно тяжелой группы можно считать классиче- классическим. Если же вращение является заторможенным, то для расчета необходимо знать высоту барьера, препятствующего тор- торможению. Нахождение этой высоты из спектроскопических дан- данных весьма затруднительно. Поэтому поступают в обратном порядке: вычисляют термодинамические величины, чаще всего энтропию, задаваясь различными значениями высоты барьера, и сравнивают ее вычисленные и измеренные значения. Совмеще- Совмещение теоретической и экспериментальной кривой зависимости энтропии от температуры позволяет найти высоту барьера. У различных молекул высота барьера варьирует в довольно широких пределах. Так, для вращения групп СН3 в молекуле этана НзС—СН3 высота барьера составляет около 1570° К, так что вращение при температуре Г> 1570° К просиходит свободно. У молекулы этилена С2Н4 барьер, препятствующий вращению групп СН2, имеет высоту около 6000° К, так что вращение при комнатной температуре сильно заторможено и фактически про- происходят вращательные колебания сравнительно небольшой ам- амплитуды.
ГЛАВА VI СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ § 46. Взаимодействие между молекулами в неидеальных газах До сих пор мы ограничивались изучением свойств настолько разреженных газов, чтобы взаимодействием между молекулами можно было пренебречь. Теперь мы перейдем к рассмотрению статистического поведения систем взаимодействующих частиц. В § б мы уже коснулись вопроса о характере межмолеку- межмолекулярного взаимодействия. На больших расстояниях между мо- молекулами это взаимодействие сводится к слабым силам притя- притяжения, которые быстро убывают с расстоянием между центрами молекул. На малых расстояниях, когда молекулы вплотную нодхо- дят друг к другу, так что проис- происходит взаимное проникновение их электронных оболочек, воз- возникает весьма сильное отталки- отталкивание. Благодаря этому отталки- отталкиванию невозможно заметное проникновение молекул друг в друга и их деформация при столкновениях. В дальнейшем мы ограничимся одноатомным газом и будем считать, что взаи- взаимодействие зависит только от расстояния между атомами. Ход потенциальной энергии взаимодействия двух молекул изображен на рис. 60. Мы будем предполагать, что силы при- притяжения являются настолько слабыми, что наибольшее значение потенциальной энергии притяжения — при сближении молекул вплотную (расстояние между центрами равно диаметру d). Но il«(d)| все же мало по сравнению с тепловой энергией kf, Рис. GO. \u(d)\4HkT. D6,1)
526 СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ [Гл VI Потенциальная энергия настолько быстро убывает с рас- расстоянием, что она практически обращается в нуль уже при расстояниях между центрами молекул, составляющих несколько диаметров. Введем формально некоторое расстояние р, дальше которого взаимодействием можно полностью пренебречь. Это расстояние мы будем называть радиусом взаимодействия. Это означает, что истинную кривую потенциальной энергии мы за- заменяем упрощенной кривой, изображенной на рис. 60 пунктиром и выражаемой формулой | 0, ы= — и {г), p>r>d, D6,2) Здесь через г обозначено расстояние между центрами г-й и k- н молекул Это означает, что взаимодействие отсутствует, когда расстояние между центрами молекул превышает р, представ- представляет притяжение (знак минус при и(г)), когда расстояние между центрами меньше р, но больше d, так что молекулы не- непосредственно не соприкасаются, и превращается в очень силь- сильное (бесконечно сильное в нашем приближении) отталкивание, когда молекулы приходят в непосредственный контакт. Вели- Величина р обычно равна трем-четырем диаметрам молекул. Если газ не является очень плотным, то среднее расстояние между молекулами весьма велико по сравнению с их разме- размерами. Поэтому можно считать, что, как правило, на расстояние взаимодействия одновременно сближается не более двух моле- молекул сразу. Иначе говоря, можно считать, что молекулы взаимо- взаимодействуют только парами. Такие конфигурации, когда в сфере взаимодействия одновременно находится «рой» из трех, четырех и так далее частиц, встречаются редко, и мы будем ими пре- пренебрегать. Вычислим функцию состояний газа при этом условии. Энер- Энергия всего газа s может быть написана в виде е = екип + U. D6,3) Первый член в D6,3) выражает сумму кинетических энергий молекул. Он совпадает с энергией идеального газа. Второй член представляет потенциальную энергию взаимодействия молекул, зависящую только от их взаимных расстояний. Воспользовав- Воспользовавшись этим выражением для е, можно написать функцию состоя- состояний газа в виде dpx dpij dp)j [j e ** dVt... dVN), D6,4)
К] ВЗАИМОДЕЙСТВИЕ В НЕИДЕАЛЬНЫХ ГАЗАХ 527 Л ... dVy — произведение дифференциалов пространствен- пространственных координат dxdydz для каждой молекулы. Первый множи- множитель не отличается от соответствующей величины для идеаль- идеального газа. В силу результатов § 37 его можно написать в виде J dPx dpu dp, = BnmkT)'u, так что Z = —w BnmkT)^ ( J e'&dVL.. dV ;V). D6,5) Здесь же нам нужно вычислить второй множитель, именуе- именуемый конфигурационным интегралом: dVidVi...dVs, D6,6) Для его вычисления воспользуемся тем, что молекулы взаимо- взаимодействуют между собой только попарно Поэтому энерппо взаимодействия можно представить в виде суммы энергий взаи- взаимодействия пар молекул U = 2 и (г,*), D6,7) где под парой мы подразумеваем две молекулы, сблизившиеся на расстояние, меньшее расстояния взаимодействия р. Энергии взаимодействия каждой пары обозначена через н; она опреде- определена формулой D6,2). Число слагаемых в сумме D6,7) равно числу пар, образующихся в газе из N молекул. Оно равно а; N(N-1) „ числу сочетании из N элементов по два, т. е. ——^ При N2 большом N можно считать это число равным -у. Тогда _U_ ?» (rik) » (rik) kT — р кТ — ТТ о кТ Q Kl IL где произведение берется по всем парам, т. е. U_ и (г„) и (гп) е кт =е" кт .е кт %гш D6,8) Это произведение содержит -у сомножителей Каждый чле,1 в этом произведении при ггк > р стремится к единице, поскольку и{г^)-*0. Удобнее ввести функцию fth, определенную равен- равенством » (rtk) /tt-в" *т -1, D6,9)
528 СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ [Гл VI которая стремится к нулю при rih > p и отлична от нуля только » irtk) при r,ft < р. Тогда, очевиднее кТ = 1 +fik и «"? = ПA+/«) = A + УA+ЫA+и...= = l+(fi» + fi3 + fi4+ •••) + (f12f13 + A2fi4+ -..)+... D6,Ю) Действительно, попарные, тройные и так далее произведения функций fni по определению этой функции и в силу предполо- предположения об отсутствии роев всегда весьма малы. Так, например, для того, чтобы /12 • /13 было существенно отлично от нуля, нужно, чтобы одновременно были отличны от нуля fi2 и fK, т. к. одновременно малы (меньше р) расстояния ri2 и Гц. Это зна- значит, что первая, вторая и третья молекулы одновременно попали в область взаимодействия р, образовав не пару, а тройку мо- молекул. Точно так же /u'/is'fu отлично от нуля, только если одновременно не равны нулю fn, fi3 и fu- Последнее имеет место только тогда, когда первая, вторая, третья и четвертая молекулы одновременно оказались в области порядка р. По- Поэтому с достаточной степенью точности можно написать в-!г„ \+{fi2 + fl3+ ...)-l + Sf«. D6,11) Число слагаемых в ^ fik равно числу пар, т. е. -у-. По- Поскольку все молекулы одинаковы, можно считать, что все fi!t также одинаковы, так что ~^ ^ D6,12) Подставляя выражение е кт из D6,12) в D6,6), имеем J = | i"^fdVx ... dVN = J [l + ¦?-/(*) dV* • • • dN" = = J dVx... dVN + -f- J fik dVx... dVN. D6,13) Первый интеграл в D6,13) равен, очевидно, VN- Во втором интегрирование по всем элементам объема, кроме /-го и А-го, дает J dV,... dVt-vdVw ... dVk-{ dVk+l... dVN J fikd
¦§ 47] УРАВНЕНИЕ СОСТОЯНИЯ НЕИДЕАЛЬНОГО ГАЗА 529 Таким образом, Для выполнения последнего интегрирования введем сфериче- сферические координаты с центром, помещенным в одной из молекул. Тогда rlk = г и где 4я — результат интегрирования по углам. Поэтому, обо- обозначив получаем Для / окончательное выражение будет следующим: /=KA'(l+-g-p). D6,15) Подставляя выражение D6,15) для / в D6,5), имеем § 47. Уравнение состояния неидеального газа С помощью функции состояний D6,16) можно вычислить термодинамические функции газа, слабо отклоняющегося от идеального. Мы ограничимся вычислением давления, поскольку уравнение состояния газа представляет первоочередный интерес. Отклонение газа от идеального учитывается с помощью уравнения Ван-дер-Ваальса, которое для малых плотностей газа может быть записано в виде где через Zm обозначена функция состояний идеального одно- атомного газа. Заметим, что величина -^-fi^y • —?~ мала при малой плотности газа -у.
530 СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ [Гл VF Поскольку в ходе расчетов предыдущего параграфа мы не учитывали «роев», полученные результаты относятся к малым плотностям газа. Простой расчет давления, основанный на функции состояния D6,16), приводит к выражению, в точности совпадающему с D7,1). Действительно, по C2,5) давление /> равно д!пгид д г) / V2R \ NhT /v-к, ii ~™TftJ <ЭК \ 2K / К 2V72 ' ^ ' ' Здесь, считая плотность малой, мы разложили логарифм в ряд по степеням величины -=Л-, которая весьма мала ко сравнению с единицей, и ограничились первым членом разложения. Сравнивая формулу D7,2) с D7,1), убеждаемся в полной тождественности обоих выражений, если только положить ! = тг-6- <47-3) Таким образом, формула D7,2) представляет уравнение Ван- дер-Ваальса, теоретически выведенное для небольших плотно- плотностей газа. Предыдущий расчет относился к случаю одноаточ- ных газов. Можно, однако, показать, что и в случае сложны ч многоатомных газов качественная сторона вывода не изменится, хотя явный вид величины C будет более сложным. Для выяснения смысла постоянных а и Ь, фигурирующих в уравнении Ван-дер-Ваальса, рассмотрим подробнее вели- величину р. По определению оо |3 —4л f(r)r2dr. D7,4) о Подставляя в D7,4) выражение для f{r), имеем ц (г) е kT -l\r2dr. D7,5) о Разобьем интеграл D7,5) на две части — интеграл в проме- промежутке 0-*Cr4^.d и в промежутке d->С г <*? оо, т. е. и (г) \ ~ / и (г) \ е кТ — 1 ) г dr + 4я I I е кГ — 1 \г dr. О ч ' d ч '
$ Щ УРАВНЕНИЕ СОСТОЯНИЯ НКИДЕАЛЬНОГО ГАЗА 531 и (г) В первой области в силу D6,2) е кт « 0, и в первом интеграте экспоненциальный член можно опустить. Во втором интеграле потенциальная энергия взаимодействия молекул в силу D6,!) мала по сравнению с тепловой энергией kT, так что можно приближенно написать «и , . , ,,, kT * ' kT Тогда имеем О й Подставляя р в D7,3), получим оо 2nd3 , 2л Г. ,.. . . о . .,_ -, 3- + WJ !"(Г>|Г2^ = lf-6. D7,6) d Сравнивая в D7,6) коэффициенты при -j и постоянные члены, находим Ъ = J^L = 4t»0, D7,7) где Уо — объем, занимаемый молекулой. Таким образом, по- постоянная Ь в уравнении Ван-дер-Ваальса оказывается равной учетверенному объему молекулы. Далее, оо а = у • 4я j \u(r)\r2dr. Постоянная а выражается через интеграл от потенциальной энергии взаимодействия двух молекул. Поскольку функция и (г) быстро убывает с расстоянием между молекулами, этот интеграл быстро сходится. Таким образом, Р = ¦??¦-8о0. D7,8) В зависимости от температуры р может быть как положитель- положительной, так и отрицательной. При достаточно низкой температуре Р > 0, при высокой температуре р < 0. Если подставить найденные нами выражения для постоян- постоянных а и Ь в уравнение Ван-дер-Ваальса, то получаем oo v J \u{r)\r2dr\. D7,9) 34*
532 СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ [Гл VI В первом приближении, когда плотность газа достаточно мала, чтобы вероятностью одновременной встречи трех и более мо- молекул в сфере взаимодействия можно было пренебречь, давле- давление в неидеалыюм газе отличается от давления в идеальном газе двумя слагаемыми. Первое из них представляет отношение учетверенного объема всех молекул ко всему объему газа. Смысл этой (положительной) поправки к давлению состоит в том, что она учитывает объем реальных молекул. Вторая поправка к давлению отрицательна и по абсолютной величине равна отношению Это отношение также имеет простой физический смысл. Ве- Величина — • An J | и {г) \r2 dr = u представляет собой среднее значение от потенциальной энергии взаимодействия пары молекул. Это среднее значение берется по всевозможным расстояниям молекул друг от друга, т. е. по всему объему, доступному для движения молекул. Тогда, оче- Л'2м видно, ~2у~ является средним значением энергии взаимодей- взаимодействия всех пар молекул, существующих в единице объема газа. Вторая поправка характеризует, таким образом, уменьшение давления молекул газа на стенки сосуда из-за их притяжения друг к другу. Иначе можно выразить этот факт словами: в газе существует внутреннее давление, обусловленное притяжением молекул. Как известно, уравнение Ван-дер-Ваальса описывает fie только свойства газов со сравнительно малой плотностью, но также и весьма плотных газов и даже жидкостей. Однако в этом случае оно уже не может быть выведено теоретически и представляет чисто эмпирическое уравнение, которое должно рассматриваться как более или менее удачная экстраполяция из области малых плотностей. Как именно должна совершаться эта экстраполяция, видно из уравнения D7,1), если его пере- переписать в виде р =
§ 47] УРАВНЕНИЕ СОСТОЯНИЯ НЕИДЕЛЛЬНОГО ГАЗА 533 Уравнение справедливо при т.е. когда объем 4Nv0, занимаемый всеми молекулами, очень мал по сравнению с объемом газа. Если, однако, плотность газа возрастает, что можно охарак- охарактеризовать уменьшение объема V при фиксированном N, та формула D7,10) теряет свою силу. Физически ясно, что при сжатии газа до предела при плотной упаковке молекул с ми- минимальным зазором правильная формула для давления должна была бы указывать на бесконечное возрастание давления. Даль- Дальнейшее сжатие, связанное с деформацией атомов, было бы связано с такими огромными давлениями, которые были бы бесконечно велики по сравнению с обычными давлениями в га- газах или жидкостях. Из геометрических соображений ясно, что- плотной упаковке шарообразных молекул соответствует объем системы, равный 4v0N = Nb. Следовательно, правильная фор- формула для давления должна приводить к неограниченно возра- возрастающим значениям р при V —*Nb. Между тем формула D7,10) не имеет подобного характера. Если, однако, рассматривать множитель (l+-f7~) как результат разложения в ряд величины а71~> т0 сразу получаем следующую формулу для давления: NkT N2a ,..,., p"vr' ( 'п> V V ) удовлетворяющую требуемым условиям: 1) р неограниченно возрастает при V—*Nb; 2) при V^'Nb формула D7,11) переходит в теоретическую формулу D7,1). Формула D7,11) является полным уравнением Ван-дер- Ваальса, описывающим состояние газов в широком интервале плотностей. Из самого характера вывода ясно, однако, что оно не может иметь того важного теоретического смысла, который имеет уравнение D7,1). При больших плотностях газа постоян- постоянные а и & не имеют уже точного смысла и могут лишь прибли- приближенно рассматриваться как характеристики объема молекул и их взаимодействия. Это видно, в частности, из того факта» что для получения количественного совпадения уравнения D7,11) с опытными данными приходится отказаться от постоян- постоянства величин а и Ъ и считать их функциями температуры. Не- Неудобство последнего побудило многих исследователей предло- предложить другие эмпирические уравнения состояния» Тем не менее.
534 СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ [Гл Vt большим достоинством уравнения Ван-дер-Ваальса является то, что качественно оно очень правильно передает поведение газов и содержит указания на переход газа в жидкое состояние и критические явления. § 48. Метод коррелятивных функций и его применение к теории плотных газов и жидкостей Мы видели, что прямое вычисление конфигурационного ин- интеграла для системы взаимодействующих частиц оказывается достаточно сложной процедурой. В последние годы в связи со стремлением создать стати- ¦стическую теорию жидкостей усиленно развиваются различные методы подхода к рассмотрению статистических свойств си- систем взаимодействующих частиц. Одним из весьма эффектив- эффективных оказался метод коррелятивных функций, развитый Н. Н. Боголюбовым и независимо Кирквудом, Борном и Грином. В методе коррелятивных функций вычисление конфигура- ционного интеграла заменяется получением некоторой цепочки «нтегро-дифференциальных уравнений, связывающих между со- собой систему функций, характеризующих их взаимную корре- корреляцию в пространственном расположении частиц. Подчеркнем с самого начала, что метод коррелятивных функ- функций является непосредственным следствием гиббеовской стати- статистики. Нас в дальнейшем будет интересовать пространственное распределение системы взаимодействующих частиц. Интегрируя распределение Гиббса по всем импульсам, на- находим выражение для вероятности данной конфигурации си- системы частиц: Г 1 -— dv)r = I dw = je kT drx dr2 ... drN, D8,1) p где / — конфигурационный интеграл: _u_ /= I e kTdr{dr2...drN. D8,2) Если проинтегрировать dwr по координатам всех частиц, кром одной, то получаем - <!> = drl J e kT dr2... drN. D8,3) Очевидно, что dw^ представляет вероятность того, что частица JVb 1 находится в элементе объема drx при любых положениях
§ 48] МГТОД КОРРЕЛЯТИВНЫХ ФУНКЦИЙ 535 всех остальных (N—1) частиц. Эту вероятность можно пред- представить в виде *Ц*Ь., D8,4> где p(f])—плотность вероятности нахождения частицы в эле- элементе объема dr\, нормированная на объем системы: ~^dr2...drN. D8,5> Функцию pi(f|) мы будем именовать ординарной функцией распределения. Аналогично, интегрируя распределение Гиббса D7,1) по ко- координатам всех частиц, кроме первой и второй, получаем ^f j^dr3 ... drN, D8,6) так что (^Гг) = у J Функция pi2 представляет плотность вероятности того, что пер- первая частица находится в элементе объема dru а вторая частица одновременно — в элементе с/г2, нормированную на объеме си- системы. Мы будем называть рJ двойной (бинарной) функцией рас- распределения. Аналогичным образом можно определить функции распределения любого порядка. Например, функция распреде- распределения т-го порядка характеризует вероятность того, что пер- первая частица находится в элементе объема drh вторая — в объе- объеме dt2, ..., т-я — в объеме drm при любых положениях осталь- остальных (N •—т) частиц: Рт (гь Г2> ¦ • ¦> rni> I J o~~kT Лг Иг 1ЛЯ п\ ут Т J drm + \ •¦• "rN- Do,8> Если нас интересуют свойства системы, зависящие от положе- положений не всех, а лишь некоторых частиц, входящих в систему, функции распределения рт начинают играть ту же роль, что функция распределения Гиббса для системы в целом. С помощью функций распределения можно находить сред- средние значения величин, зависящих от координат соответствую- соответствующих частиц. Например, (гь r2, ..., fm) pm (ru ..., rm) y— - ) — J
536 СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ [Гл. VI На первый взгляд может показаться, что отыскание функ- функции распределения m-го порядка, которая характеризует про- пространственное распределение некоторых частиц системы, долж- должно быть проще, чем нахождение распределения Гиббса — функ- функции распределения N-ro порядка, характеризующей конфигу- конфигурацию всех частиц системы. Однако ясно, что непосредственное определение функций распределения рь р2, . .., рт, ... связано с вычислением кон- конфигурационного интеграла, и поэтому их применение нисколько не упрощает задачи и не является шагом вперед. Применение функций распределения не представляло бы ни- никакого интереса, если бы не существовало другого способа их вычисления, не связанного с определением /. Именно, оказывается возможным составить дифференциаль- дифференциальное уравнение, которому должны удовлетворять функции рас- распределения р,п. Для нахождения уравнения, которому должна удовлетворять ординарная функция, продифференцируем фор- формулу D8,5) по координатам Г\. Имеем, очевидно, Рассмотрим подробнее производную u(\ri-r1\). D8,10) /=2 -При этом мы воспользовались тем, что все члены суммы по i, кроме одного, относящегося к частице № 1, не зависят от г\ и обращаются в нуль при дифференцировании. Подставляя D8,10) в D8,9), получаем в правой части ин- интеграл v IkT i V IkT i Но по определению D8,7) T I e kT dr2... drs_x drj+l ... drN = ¦ Поэтому правая часть может быть написана в виде v f W,
§ 481 МЕТОД КОРРЕЛЯТИВНЫХ ФУНКЦИИ 537 Сумма по / содержит (N—1) слагаемых, каждое из которых, представляет интеграл вида J i- Поскольку система состоит из одинаковых частиц, так что "(ki — ri\) ПРИ данном In — Г}\ имеет одно и то же значение, а по всем \rt—r$\ ведется интегрирование, можно написать T.L дГ, Pi/(ri> ri)drl = 1-2 J dFt ~ v Подставляя это выражение в формулу D8,9), получаем Г J Формула D8,11) связывает ординарную функцию распределе- распределения pi с бинарной pij. Найдем уравнение, которому удовлетворяет бинарная функ- функция pij. Дифференцируя D8,7)* получаем lkT lkT J e «ЭП - r> I ) Следовательно, окончательно Г J Уравнение D8,12) связывает бинарную функцию распределения с тройной. Таким же образом может быть получено уравнение, связывающее тройную функцию распределения с четверной, .. , т-ю с (т+1)-й и т. д. В результате получается незамкнута:? цепочка уравнений, каждое из которых выражает производную
538 СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ [Гл. VI от функции распределения данного порядка через самую функ- функцию распределения следующего порядка: =TTPl2F Л' ) 2d "d77PI2...m,m+lrfrm+I- D8,13) Продолжая этот процесс, мы придем к уравнению, связываю- связывающему функцию (/V—1)-го порядка с функцией распределения Лг-го порядка, т. е. с распределением Гиббса. Следовательно, задача о нахождении функций распределения низшего порядка оказывается вновь связанной с распределением Гиббса для всей системы. Однако —и в этом состоит важнейшая особенность полученных уравнений — функции старшего порядка входят под знак интеграла не сами по себе, а всегда с коэффициентом д" - ^ том слУчае» когда потенциальная энергия взаи- взаи(j |) б б модействия между двумя частицами «(jr, — r,|) быстро убы- убывает с расстоянием и становится малой на расстояниях, превы- ди шающих молекулярные размеры, величина -=—- весьма мала при \r\—fjl^d, где d — диаметр молекулы. Поэтому, напри- например, в уравнении D8,13) выражение для интеграла в правой части можно оценить но порядку величины следующим образом: N Г ди . d3 I ди \ Т J ~д?\ Pi2Jar> = Т/КГ[dFi 9i2Jld' где f-r^- р|2;) берется при расстояниях между частицами по- порядка d. Ноли объем, приходящийся на одну частицу V/N, велик по d3 сравнению с объемом частицы d3, то коэффициент -у^ мал. Поэтому для значения подынтегрального выражения, в частно- частности, функции распределения третьего порядка, можно пользо- пользоваться приближенными выражениями. Этот вывод не относится ¦специально к уравнению для бинарной функции, но имеет об- общий характер. § 49. Уравнение состояния и энергия системы Важное значение имеет бинарная функция распределения лторого порядка pi2(*"i, ^2), через которую может быть выра- .жено уравнение состояния.
Поскольку, как мы видели выше, Z распадается на два множи- множителя, один из которых Zkk-п зависит только от кинетической энергии, но не зависит от конфигурации частиц и, следователь- следовательно, от объема, а второй / зависит только от конфигурации,, имеем
540 СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ [Гл V п JV(iV-0 При этом мы воспользовались тем, что все ~ слагае- слагаемых (число взаимодействующих пар) в двойной сумме идентич- идентичны между собой. С помощью D9,5) и D9,1) получим NkT N2 J и' (| г, - г21) drx dr2 J e kT dr3 ... drH. и V 6V7 Воспользовавшись определением D8,7), находим окончательно Р = —у- ~ "ёр" J Pl2 (**1. Г2> ( \ Г\ - Г2 I ) "' ^1^2- D9,7) Формула D9,7) связывает уравнение состояния с бинарной функцией распределения. Бинарная функция распределения pi2(fi, ъ) характеризует вероятность данного взаимного расположения двух произвольно выделенных частиц в системе. В изотропных фазах — газах и жидкостях — уравнение D9,7) допускает еще некоторое упро- упрощение. Поскольку в изотропных фазах бинарная функция не может зависеть от направлений, но только от расстояния между ча~ стицами, ее можно написать в виде Поэтому NkT Вводя новую переменную r=\rl — гг\ и г' = f' 2 Га , можно написать Jn(ir,-r2|)(|rl-r2|)«'(|ri-'|)?fr1dr2 = = 4лУ J \i (г) и' (г) г3 dr, о так что окончательно NkT оо | ц (г) и'(г) г3 dr. D9,8) Р~ V 3V2 о Аналогичным образом можно найти выражение для энергии системы р - ЬП d[nZ - ЬП ' д'1™* Л. kT2 dl - MkT _L kT* dI (ЛЯ Q\ где —s энергия системы невзаимодействующих частиц.
•§ 49] УРАВНЕНИЕ СОСТОЯНИЯ И ЭНЕРГИЯ СИСТЕМЫ 541 Вычислим -jjr. Подставляя значение / из D9,6), находим W=W*Fr f Mdri-r2l)Pi2(ri. r^drl(ir2. Поэтому -\—y—j n(r)u(r)r2dr. D9,10) WkT Таким образом, энергия, как и давление, выражается через би- бинарную функцию распределения \х(г). Бинарная функция распределения ц(г) может быть вы- вычислена для газов, когда плотность частиц в системе мала. Именно, в случае газов, имеющих не слишком большую плотность, уравнение для бинарной функции D8,12) может <5ыть решено по методу последовательных приближений. Действительно, в газах с не слишком большой плотностью среднее расстояние между частицами велико по сравнению с их размером. Оценки, проведенные в конце § 48, показывают, что коэффициент при тройной функции распределения в правой d3 части D8.12) пропорционален -ущ-и, следовательно, весьма мал в достаточно разреженном газе. Это позволяет подставить в ¦интеграл в правой части D8,12) вместо точного значения p!2j его приближенное значение, не делая при этом заметной ошибки. Для получения приближенного выражения для р12 разложим все функции распределения в ряд по степеням малой величины N/V (в действительности это разложение проводится по степе- степеням отношения y,N ) и ограничимся в этом разложении чле- членами низшего порядка, написав 51+ D912) Подставляя эти ряды в уравнение для коррелятивных функций и удерживая младшие степени малых величин, можно последо- последовательно определить коррелятивные функции, в частности pi2- Тогда давление согласно D9,8) представится в ряд по
542 СИСТПМЫ ВЭЛИМОДГ.Й.. 1 ЗУЮЩИХ ЧЛС1ИЦ [Гл VI степени Л'/V. 2 М2 -jyrh. D9,13) V, D9,14) "(г/) \ *r -\)dVdV. D9,15) Второй член в D9,13) созпадает, очевидно, с D7,2), а третий член дает поправку к давлению следующего порядка малости (по степени плотности N/V). В случае разреженных газов метод коррелятивных функций не имеет особых преимуществ перед другими методами расчета поправок на взаимодей- взаимодействие. Более важным является применение этого метода к построе- построению статистической теории жидкостей. До настоящего времени статистическая теория жидкостей на- находится в самой начальной фазе своего развития. Причина этога коренится в самом характере теплового движения в жидкостях. Тепловое движение в жидкостях отличается от теплового- движения в газах и кристаллах тем, что в жидкостях энергия взаимодействия молекулы со своими соседями не может счи- считаться ни малой (как в газах), ни большой (как в кристаллах) по сравнению с энергией теплового движения. В жидкостях эти. величины как раз одного порядка малости. В жидкости соседние молекулы колеблются около некоторых положений равновесия с относительно большой амплитудой. При этом взаимная конфигурация молекул примерно такая же, как в элементарной ячейке соответствующего кристалла. Однако, в отличие от кристалла, амплитуда этих колебаний столь велика, что соседние частицы сравнительно легко отры- отрываются друг от друга и покидают положения равновесия. Как примято говорить, среднее время оседлой жизни молекулы в положении равновесия т ограничено (оно составляет около» Ю-8 сек). В течение промежутков времени, малых по сравнению с этим временем т, колебания молекул в жидкости имеют примерно такой же характер, что и в кристаллах. Однако за времена t~S>T молекула жидкости может очутиться в любой точке жид- жидкости. В этом смысле ее движение сходно с движением газо- газовой молекулы. Характер перескоков и частота колебаний определяются взаимодействием между молекулами в жидкости. Это взаимо- взаимодействие может изменяться у различных жидкостей в весьма
¦§ 49] УРАВНЕНИЕ СОСТОЯНИЯ И ЭНЕРГИЯ СИСТЕМЫ 543 широких пределах. Поэтому основная задача современной тео- теории жидкостей сводится к получению качественных их харак- характеристик. Такой качественной характеристикой является, в ча- частности, бинарная коррелятивная функция (д. (г). Бинарная коррелятивная функция характеризует взаимодействие ближай- ближайших соседей. Она может быть определена экспериментально из рассеяния рентгеновских лучей. На рис. 61 кружками показана коррелятивная функция ц@> ¦определенная таким способом. Мы видим, что при фиксирован- фиксированном положении некоторой молекулы ее ближайшие соседи рас- располагаются с наибольшей вероятностью на расстояниях, отве- отвечающих максимумам кривой ц(г). Оказывается, что положение О г, Д этих максимумов близко к соответствующим положениям в кристаллической решетке того же вещества. Говорят, что в рас- расположении атомов в жидкости наблюдается ближний порядок, и в этом смысле говорят о квазикристаллической структуре воды. Необходимо, однако, подчеркнуть принципиальное разли- различие между кристаллом и жидкостью. В жидкостях регулярность в расположении атомов простирается па ближайшие три-четыре соседних атома. У кристаллов правильная повторяемость ато- атомов сохраняется на расстояниях, которые с микроскопической точки зрения являются бесконечными. Иными словами, в кри- кристаллах имеется дальний порядок, простирающийся на как угодно большие расстояния. Это различие, как мы подчерки- подчеркивали, связано с равным характером теплового движения. По- Поэтому аналогией между кристаллами и жидкостями можно пользоваться лишь в весьма ограниченных пределах. С помощью известных упрощающих предположений из тео- теории коррелятивных функций удается получить ход \i{r), каче- качественно правильно передающий опытные данные. Именно, во-первых, вместо истинной энергии взаимодействия вводится
544 СИСТЕМЫ ВЗАИМОДЕЙСТВУЮЩИХ ЧАСТИЦ (Гл VI упрощенное выражение, показанное на рис. 61 пунктиром, °о при d^.2r, 0 при d>2r, где й — диаметр частиц. Эта энергия отвечает замене молекул твердыми (непроницаемыми) сферами диаметра d. Во-вторых, делается так называемое суперпозиционное приближение в функции рJз, которое заключается в замене —Р13Р23- D9,16) Смысл формулы D9,16) заключается в том, что взаимодействие частицы 3 с частицей 1 происходит так, как будто бы частицы не было вовсе. Иными словами, взаимодействие частицы 3 с ча стицами 1 и 2 равно сумме парных взаимодействий C1) и C2). Хотя суперпозиционное приближение не может быть обос- обосновано теоретически, качественно ясно, что оно представляет следующий шаг вперед по сравнению с допущением о независи- независимости взаимных положений частиц в пространстве (т. е. пред- предположением р123 = р1р2рз). В суперпозиционном приближении уравнение D8,12) замы- замыкается. Оно содержит только бинарную функцию р12= ц(г). Решение уравнения для \i(r) в указанном приближении было проведено численно. Оно зависит только от одного параметра, включающего величины N/V, Т и d. Полученные решения при- приведены на рис. 61 сплошной кривой. Мы видим, что общий ход расчетной и опытной кривых яв- является весьма сходным. Это означает, что, несмотря на всю свою схематичность, модель молекул твердых шариков в супер- суперпозиционном приближении, в общем, правильно передает харак- характер взаимодействия молекул в жидкости.
ГЛАВА VII КРИСТАЛЛЫ § 50. Строение кристаллов и тепловое движение В основу современной теории кристаллического состояния кладется положение, согласно которому в узлах кристалличе- кристаллической решетки помешаются структурные единицы (атомы или мо- молекулы) кристалла. Многочисленные рентгенографические иссле- исследования кристаллов и ряд других данных полностью подтвер- подтвердили это положение и позволили измерить расстояние между атомами в кристаллической решетке. В дальнейшем мы будем исходить из указанного положения как основы теории кристал- кристаллического состояния. Расстояния между атомами в кристаллах весьма малы. Они в общем того же порядка, что и расстояния между атомами в молекулах, а иногда точно с ними совпадают; например, рас- расстояние между атомами в алмазе A,54 ¦ 10~8 см) очень близко к расстоянию между атомами углерода в соединениях типа углеводородов с длинной цепью (алифатические соединения, расстояние С — С равно 1,51 • 10~8 см). Расстояние между молекулами в кристаллах, построенных из молекул, всего в два-три раза больше внутримолекулярных расстояний. Благодаря малости расстояний между атомами в кристаллах взаимодействие между ними чрезвычайно велико. По порядку величины оно соответствует взаимодействию между атомами в молекуле. С этой точки зрения атомный или ионный кристалл можно рассматривать как одну гигантскую молекулу, содержащую огромное число связанных атомов. Как и в моле- молекулах, энергия взаимодействия между атомами в кристалле очень велика по сравнению с энергией теплового движения. Ча- Частицы в кристалле оказываются настолько прочно связанными между собой, что тепловое движение не может нарушить этой связи. Таким образом, с точки зрения межатомного взаимодействия кристаллы представляют обратный предельный случай по срав- сравнению с газами. Очевидно, что единственно возможным видом 35 В. Г. Левич, том I
546 КРИСТАЛЛЫ [Гл. VII движения связанных частиц в кристалле является колебатель- колебательное движение около положений равновесия. Мы будем предпо- предполагать, что амплитуда колебаний весьма мала по сравнению с расстояниями между атомами. Ниже мы более подробно об- обсудим справедливость этого допущения. Вычислим прежде всего среднюю энергию и теплоемкость кристалла, атомы которого совершают малые колебания около положений равновесия (узлов решетки), исходя из законов классической статистики. Для этого мы можем воспольоваться законом равномерного распределения энергии по степеням сво- свободы. На каждую степень свободы колебательного движения ') приходится энергия kT. Число колебательных степеней свободы у кристалла, содержащего N атомов, равно CN — б) «* 3/V (так как N велико). Поэтому из классической статистики следует, что средняя энергия теплового движения в кристалле равна E=ZNkT. Соответствующая молярная теплоемкость равна ^ E0.0 Теплоемкость кристаллов оказывается не зависящей от темпе- температуры и от конкретных свойств кристаллов. Формула E0,1) совпадает с известным эмпирическим законом теплоемкости Дюлонга и Пти. Закон Дюлонга и Пти сравнительно точно пе- передает теплоемкость многих атомных кристаллов при высоких температурах. Однако он становится совершенно непригодным при переходе к низким температурам. При низких температурах теплоемкость всех кристаллов убывает с понижением температуры, как это и следовало ожи- ожидать, исходя из третьего начала термодинамики. Более того, теплоемкость некоторых кристаллов зависит от температуры и при температурах, значительно превышающих комнатную. В ка- качестве характерного примера полной неприменимости закона Дюлонга и Пти можно привести кристалл алмаза. Таким обра- образом, в случае кристаллов мы вновь сталкиваемся с ограничен- ограниченной применимостью закона равномерного распределения, т. е. с ограниченной применимостью классической статистики. Наиболее простая попытка применения квантовых законов к рассмотрению теплоемкости кристаллов состоит в следующем. Будем рассматривать каждый атом, колеблющийся в узле кри- кристаллической решетки, как квантовый осциллятор, имеющий ') Подчеркнем, что это относится только к колебательному движению малой амплитуды, когда потенциальная энергия выражается квадратичной функцией от величины смещения (см. § 50).
§ 50] СТРОЕНИЕ КРИСТАЛЛОВ И ТЕПЛОВОЕ ДВИЖЕНИЕ 547 три степени свободы. В кристалле, построенном из атомов од- одного сорта, все атомы совершенно равноправны и колеблются с одинаковой частотой v. Если предположить, что атомы колеб- колеблются независимо друг от друга, то среднюю энергию теплового движения всего кристалла Е можно представить в виде лг где ёп— средняя энергия «-го осциллятора и суммирование ве- ведется по всем осцилляторам кристалла. Поскольку каждый атом является трехмерным осциллятором, ёп = 3ё, где ё— сред- средняя энергия линейного квантового осциллятора, даваемая фор- формулой D3,3). Таким образом, средняя энергия кристалла имеет вид ^ ~ 2 ^ " Ш ' а теплоемкость ЗЛГ/г sh W Ход теплоемкости, передаваемый формулой E0,2), обсуждался нами в связи с колебательной теплоемкостью молекул (§ 43). При высоких температурах (kT » hv) величина теплоемкости стремится к предельному значению Cv ~ 3Nk. При низкой температуре в соответствии с требованием третьего начала Cv стремится к нулю по экспоненциальному закону: Г ~~ ° ( \ /з W (КО Q\ v ~ 4 \ kT } ' VJU,oj Простейший квантовый закон качественно правильно пере- передает ход теплоемкости кристалла с температурой. Однако бо- более детальное сравнение формулы E0,3) с опытными данными для теплоемкости показывает, что закон E0,3) не передает всех особенностей хода теплоемкости. Теплоемкость кристаллов уменьшается с температурой не по экспоненциальному закону E0,3), а по степенному закону вида Cv ~ Р. Расхождение формулы E0,3) с экспериментом связано с ошибочностью пред- предположения о независимости колебаний атомов в кристалле, которое было положено в основу ее вывода. В действительности атомы в кристалле настолько прочно связаны между собой, что не может быть и речи об индивидуальном движении отдельного атома, не зависящем от движения остальных атомов решетки. 35*
548 КРИСТАЛЛЫ [Гл VII Колебательное движение атомов в кристалле имеет коллектив- коллективный характер, и в нем принимают участие все атомы кристалла одновременно. Для получения более ясного представления о характере теплового движения атомов в кристалле мы воспользуемся фик- фиктивной моделью кристалла в виде цепочки атомов, расположен- расположенных вдоль линии на равных расстояниях друг от друга. Такую цепочку можно рассматривать как некоторый одномерный кри- кристалл. Хотя в природе не существует одномерных кристаллов, рассмотрение теплового движения в одномерном кристалле по- позволяет выяснить характер движения в реальном трехмерном кристалле. Пронумеруем атомы в цепочке так, чтобы номер п пробегал значения от п=\ до n = N (всего в цепочке имеется N атомов). Предположим, что некоторый атом (ион или молекула), имею- имеющий, скажем, номер п, выйдет из положения равновесия и сме- сместится на расстояние |п вправо или влево. Тогда он будет испы- испытывать силы со стороны соседних атомов — силу отталкивания со стороны того соседа, к которому он приблизился, и притяже- ния со стороны другого соседа. Поскольку силы межмолекуляр- межмолекулярного взаимодействия быстро убывают с расстоянием, мы можем учитывать только взаимодействие данного атома с его двумя ближайшими соседями — атомами с номерами (п — 1) и (п+1). Уже следующие атомы с номерами (п+2) и (п — 2) будут взаимодействовать с рассматриваемым атомом очень слабо, так что этим взаимодействием можно пренебречь. Сила, действующая на я-й атом со стороны каждого из двух его соседей, может быть записана в виде р __ ди(In) п~ din » где и(%п) — потенциальная энергия п-го атома в точке \п- При малых смещениях потенциальную энергию «(?п) можно разло- разложить в ряд по степеням малой величины |п и ограничиться пер- первыми членами разложения, как это всегда делается в теории малых колебаний: Поскольку в точке | = 0 потенциальная энергия имеет минимум, в ней —^- = 0 и —^- = и>0. Сила, действующая на частицу. При этом предполагалось, что соседние атомы, имеющие но- номера (п— 1) и (п+1), оставались неподвижными в своих узлах
§ 50] СТРОЕНИЕ КРИСТАЛЛОВ И ТЕПЛОВОЕ ДВИЖЕНИЕ 549 кристаллической решетки. В действительности, конечно, это не так. Смещение n-го атома приведет к смешению (п—1)-го и (я+1)-го, причем (я-Н)-й атом под действием силы отталки- отталкивания сдвигается вправо на расстояние |n+i, а (п—1)-й под действием силы притяжения последует за я-м и сместится на расстояние |„_ь Поэтому расстояние между п-м атомом и его соседями изменится соответственно на (|„+] —1„) и (|n_i — gn). При этом на /г-й атом будет действовать сила Смещение («+1)-го атома приведет к смещению (п+2)-го, а (п—1)-го— к смещению (п — 2)-го. Эти атомы в свою очередь будут действовать на следующих соседей, и в результате вся цепочка атомов придет в движение. Чтобы исследовать это дви- движение, достаточно найти движение произвольно выбранного «-го атома. Уравнения его движения имеют вид т|„=х(|„+1 + Б„_1 —2|„). E0,4) Для решения системы уравнений требуется задание гранич- граничных условий. Из общих положений статистической физики сле- следует, что движение системы, состоящей из большого числа ча- частиц, не может зависеть от характера граничных условий. Мы выберем в качестве граничного условия так называемое условие периодичности. Именно, будем считать, что вдоль всей оси х расположены одинаковые цепочки атомов, каждая из ко- которых содержит N атомов. При этом решение для всех цепочек должно быть одинаковым. Это значит, что должно выполняться условие En = U±n. E0,5) Будем пытаться искать решение системы уравнений E0,4) в виде Подставляя это значение \п в E0,4), находим miif = — х B — е*'а — е~^а) щ = — 2х A — cos /a) щ. E0,6) Решение уравнения E0,6) имеет вид uf = Aelwf\ где А — амплитуда. Подстановка этого значения щ в E0,6) дает |- /2A- cos fan) - 2 Y^ sinlT' <50'7>
550 КРИСТАЛЛЫ [Гл. VII Для того чтобы удовлетворить граничным условиям E0,5), следует положить e±cf°N = 1 E0,8) или /*-±s» <50'9> где k пробегает ряд целых четных значений k=2, 4, 6, ..., N. Мы видим, что в случае цепочки атомов, связанных квази- квазиупругими силами, в ней возникает система бегущих волн. Формула E0,7) определяет закон дисперсии волн. Волновые числа fk и частоты «/ пробегают дискретный ряд значений. Од- Однако, поскольку число атомов N весьма велико при не малых значениях k, интервал между fk и fh±i столь мал, что можно считать f и (Hf практически непрерывно изменяющимися вели- величинами. Соответственно смещения п-го атома можно написать в виде решений E0,4): Значения волнового числа можно считать ограниченными и ле- лежащими в интервале -? = fmin</</m.x=-?. E0,11) Если взять значения f, лежащие вне этого интервала, то в силу периодического характера закона дисперсии E0,7) они будут приводить к тем же значениям частоты. Поэтому можно в E0,7) взять лишь одну ветвь синуса и представить зависимость ниж- нижней кривой на рис. 62. Всего имеется 2N бегущих волн, распространяющихся в про- противоположных направлениях по цепочке, каждая из которых имеет одну и ту же частоту. Длина волн, бегущих по цепочке, дается формулой к = ~к~=°~Ы' E0,12) Самая длинная из стоячих волн (при k=\) имеет длину волны 2N,a, т. е. на всей цепочке укладывается одна полуволна. Зна- Значениям k—l, 2, ... соответствуют все более и более короткие волны, но такие, что на длине цепочки укладывается целое число полуволн. Замечательно то, что все атомы цепочки ко- колеблются с одинаковой частотой (т. е. (O/t зависит только от ky но не от номера атома).
50] СТРОЕНИЕ КРИСТАЛЛОВ И ТЕПЛОВОЕ ДВИЖЕНИЕ Скорость распространения волн равна 551 E0,13) т. е. оказывается различной для различных волн. При малых волноеых числах fk, т. е. при длинных волнах, sin -^- можно разложить в ряд и написать В этом случае = vo = a Л/ V — — const. т E0,14) E0,15) В случае очень длинных волн, для которых выполнено неравен- неравенство fftfl<Cl или Х~Э>а, очень большое число атомов колеблется почти в одной фазе — изменение фазы происходит на длине полуволны, охватывающей большое число атомов. Поэтому атомная структура решетки перестает сказываться на ее свой- свойствах. Решетка ведет себя по отношению к длинным волнам, как ¦сплошная упругая среда. Стоячие волны в решетке превра- превращаются в стоячие волны в упругой среде. Скорость распростра- распространения волн в решетке, даваемая по E0,15), совпадает со ско- скоростью упругих волн (скоростью звука) в сплошной среде.
552 КРИСТАЛЛЫ [Гл. VII Самой короткой из возможных волн KN =-j^=2a соответ- соответствуют наибольшая частота M" = 2~/l <50>16> и скорость распространения v = vMmt = ^-y ¦?-. E0,17) Сравнение формул E0,15) и E0,17) показывает, что длинные волны распространяются с несколько большей скоростью, чем короткие, т. е. имеет место явление дисперсии. В промежуточной области частот скорость распространения волн, определяемая формулой: E0,13), зависит от волнового числа fu или ча- частоты <i>k. Смещение произвольного n-атома в цепочке дается в виде наложения смещений вида E0,10), т. е. ln= SSnft=S^sin(©ft/ + o)sin(a/ftn), E0,18) k где суммирование ведется по всем возможным значениям вол- волнового вектора /&. Вместо произвольной амплитуды Ah введем амплитуду Г —Л/ ~ А *-k — у 2 к и обозначим Ck sin (<aft/ + а) = qk. E0,19) Тогда имеем In = "j/iHrT 2 9* sin f*a«- E0,20) Если заданы значения амплитуд qh, то из формулы E0,20) сле- следует, что смещение произвольного атома в цепочке будет пол- полностью определено. Поэтому амплитуды qh можно рассматри- рассматривать как обобщенные координаты системы. Найдем энергию всей цепочки, выраженную через обобщен- обобщенные координаты q^ Кинетическая энергия цепочки, очевидно, равна Т = — У ?2 2 JU 6п'
где ип — потенциальная энергия я-го атома. Действительно, если сила Fn, действующая на л-й атом, равна где суммирование ведется по всем атомам цепочки. Имеем Кинетическая энергия цепочки выражается квадратичной фор- формой производных от координат qh. Найдем теперь потенциальную энергию всей цепочки. Из формулы E0,3) следует (в чем можно убедиться дифференци- дифференцированием), что потенциальная энергия всего кристалла равна
554 КРИСТАЛЛЫ [Гл. VII из формулы E0,20) находим ( + !K ~ sin J] 2 cos (ffcan + у) sin Поступая так же, как при вычислении кинетической энергии, имеем u=j - т^т •4 S S S ^A'cos [ъап+4")х п ft &' sin ~ sin ~ = |- -д^-р 4 X X k ' k' Но для косинусов имеет место условие ортогональности: N~\ ... поэтому Учитывая формулу E0,11), окончательно находим E0,23) Таким образом, полная энергия кристалла равна Формула E0,24) имеет важный физический смысл: полная энер- энергия кристалла выражается квадратичной формой, содержащей только квадраты величин fa и q^ (но не их произведения вида qhqu). Поэтому величины <?л являются нормальными координа- координатами колеблющегося кристалла. Каждое слагаемое в E0,24) имеет вид • - f (я+«ад - f №
§ 50] СТРОЕНИЕ КРИСТАЛЛОВ И ТЕПЛОВОЕ ДВИЖЕНИЕ 555 т. е. представляет энергию линейного гармонического осцилля- осциллятора с массой, равной массе атома, колеблющегося с частотой \h. Энергия Е равна сумме энергий таких осцилляторов, имею- имеющих различные частоты vh. Энергия кристалла из N атомов, совершающих связанные колебания, оказывается равной энер- энергии N независимых гармонических осцилляторов с набором ча- частот va, определенных формулой E0,11). В этом смысле система из N связанно колеблющихся атомов эквивалентна набору N независимых осцилляторов с частотами \-k. Вместо того чтобы находить среднюю энергию сложной системы из N связанных атомов, мы можем искать среднюю энергию гораздо более про- простой эквивалентной системы набора N независимых осцилля- осцилляторов. Необходимо подчеркнуть, что линейные осцилляторы с энергией, даваемой формулой E0,25), не имеют ничего общего с реальными атомами (за исключением одинаковой массы). Каждый осциллятор представляет одно из нормальных коле- колебаний всего кристалла как целого. В нормальном колебании кристалла участвуют все атомы, которые колеблются с одной и той же частотой V&. Совершенный нами переход от смещений ?„ к нормальным координатам Ци. представляет обычное для волновых процессов преобразование и не связан с особенностями линейной цепочки. Возможность перехода к нормальным координатам, в которых энергия имеет вид квадратичной формы E0,24), представляет общую алгебраическую теорему. Очень редко встречаются реальные кристаллы, построен- построенные из атомов (или молекул) с одной массой т. Обычно в со- состав решетки входят частицы с разными массами и различной химической природой. Последнее приводит к изменению закона взаимодействия между соседними атомами, так что величина и имеет разные значения в разных точках кристалла. Не учитывая последнего эффекта, рассмотрим лишь влияние на характер движения цепочки различия в массах атомов на примере модели одномерной цепочки. Пусть на равных расстояниях в цепочке поочередно разме- размещены атомы с массами mt и т2, имеющие одну и ту же физи- физическую природу (т. е. с теми же значениями квазиупругой по- постоянной). Уравнения движения цепочки запишутся теперь в виде m,in = xBgf,-iin-Ti,,-i), E0,26) = %{2r\n-ln -&,_,), E0,27) где In и Т1„ — смещения атомов с атомами. Аналогично E0,9) можем искать решение системы уравне- уравнений E0,26) и E0,27), удовлетворяющее граничным условиям
556 КРИСТАЛЛЫ [Гл. VII E0,5), в виде Подстановка этих выражений в E0,26) и E0,27) приводит к си- системе алгебраических уравнений (-(o2mi + 2х) А = 2х cos (/an) В, (- ©2m2 + 2к) В = 2х cos (fan) Л. Исключая амплитуды, можно получить уравнение для со2: ^«и _!_+_!_ ±т/ _L._|—!._ - "'" "*""' , E0,28) Если изобразить со как функцию /, то в зависимости от знака перед корнем получаются две ветви, изображенные на рис. 62. При малых f, разлагая в E0,28) квадратный корень, полу- получаем E0'29) Ветвь ©1, именуемая акустической, отвечает со —*-0 при fk-^O. Ее ход практически не отличается от хода дисперсионной кри- кривой E0,14) для цепочки из одинаковых атомов. Вторая ветвь частот, отсутствующая в цепочке из одинако- одинаковых атомов, обнаруживает совершенно другое поведение (верх- (верхняя кривая рис. 62). При fj-vO co2 стремится к постоянному пределу E0,30). Эта ветвь частот называется оптической. При данном fk частота волн оптической ветви гораздо выше акусти- акустической. При малых //( легко определить отношение амплитуд воли в оптической ветви Т--~- E0-31) Знак минус в последней формуле показывает, что частицы с массами т\ и т2, участвующие в оптических волнах, движутся навстречу друг другу. В акустических волнах соседние частицы с разными массами движутся в близких фазах и в одном направлении (рис. 63, сверху). На рис. 63 снизу изображены оптические волны. Стрел- Стрелками изображены направления движения атомов.
. 61] ДЛИННЫЕ ВОЛНЫ В ТРЕХМЕРНОМ КРИСТАЛЛЕ 557 Мы видим, что различие в массах атомов существенно изме- изменяет характер теплового движения в кристалле. Если в узлах кристаллической решетки располагаются не нейтральные атомы, а заряженные ионы, то оптической ветви отвечает их встречное движение. Поэтому оптические волны вызывают колебания поляризации кристалла. Поэтому именно Оптическая -п/2а п/2а Рис. 63. оптические волны оказывают существенное влияние на электро- электромагнитные процессы в кристаллах. С этим связано само их на- название. § 51. Длинные волны в трехмерном кристалле Тепловое движение в трехмерном кристалле имеет в общем такой же характер, что и в одномерной модели. Смещение про- произвольного атома из положения равновесия в решетке пере- передается его ближайшим соседям в трех измерениях. Смещения их вызовут в свою очередь смещения других атомов, и в кри- кристалле возникнет упругая волна, распространяющаяся в трех измерениях. В результате отражения упругих волн от граней кристалла в последнем установится система стоячих воли. В том же приближении, что и для одномерной модели (пренебрегая третьими степенями смещений), энергию кристалла можно на- написать в нормальных координатах в виде E1,1) где суммирование ведется по всем возможным волновым чис- числам. Связанные колебания атомов в трехмерном кристалле
558 кристаллы [гл. vir эквивалентны набору 3/V независимых линейных осцилляторов с собственными частотами vs. Определение собственных частот для трехмерного кристалла представляет очень большие математические трудности. По- Поэтому для нахождения термодинамических функций кристалла необходимо сделать дальнейшие (кроме пропорциональности сил первой степени смещений) упрощающие предположения. Во-первых, при рассмотрении тепловых волн в кристалле мы ограничимся случаем длинных волн (Х^а). Как мы видели в предыдущем параграфе, в случае длинных волн очень большие группы атомов колеблются в одной фазе и можно пренебречь дискретной атомной структурой кристалла. Точно так же в слу- случае длинных волн в трехмерном кристалле можно отвлечься от дискретной структуры и рассматривать кристалл как сплошную упругую среду. Во-вторых, мы будем пренебрегать анизотропией кристалла и считать его изотропной упругой средой. В изотроп- изотропной упругой среде тепловые возмущения кристалла образуют систему стоячих волн. В трехмерной упругой среде волновое число f равно f-Vn + П + П. E1,2) где fi, /2 и /3 — три величины, характеризующие распрост- распространение волны в трех взаимно перпендикулярных напра- направлениях. Для того чтобы выполнялось условие типа E0,5), т. е. усло- условие отражения упругих волн от граней кристалла, волновые числа должны удовлетворять условиям: ''"IF' h~~W> «"IF* v*1'6' где ku k2 и &з — целые числа A, 2, ..., N). Частота длинных волн связана с волновым числом соотношением, представляю- представляющим непосредственное обобщение формулы E0,14). В отличие от линейной модели, в трехмерной изотропной упругой среде возможно распространение трех упругих волн: одной продольной (в которой смещения происходят вдоль на- направления распространения волны) и двух поперечных (в ко- которых смещения перпендикулярны к направлению распростра- распространения). Скорости распространения продольной С/ и поперечных волн ct различны. Поэтому вместо E0,13) в трехмерном случае нужно написать 2vi = cif, 2л\t = ctf, где V; и V( — частоты продольной и поперечных упругих воли, a Ci и Ct — скорости продольного и поперечного звука.
§ 51] ДЛИННЫЕ ВОЛНЫ В ТРЕХМЕРНОМ КРИСТАЛЛЕ 559 Для дальнейшего нам понадобится знать число упругих волн, частота которых лежит в интервале между v; и vi + dvi и V/ и Vt+dvi соответственно. Вычисление этой величины ничем не отличается от расчетов § 38 ч. I. Действительно, в § 38 ч. I было вычислено число бегущих волн в полости объема V. Совершенно аналогичным образом можно найти число стоячих волн в объеме кристалла. Един- Единственное отличие от расчета, проведенного в § 38 ч. I, заклю- заключается в том, что в кристалле волновые векторы определены формулой E1,3), отличающейся от C8,11) ч. I отсутствием множителя 2. С другой стороны, целые числа ku k2, k3 здесь принимают только положительные значения, тогда как в § 38 ч. I — как положительные, так и отрицательные. В итого для числа волн с частотой между v;, vi+dvi полу- получается формула ^ E1,4) идентичная с формулой C8,22) ч. I1)- Для числа поперечных волн с частотой между vt и аналогично находим где множитель 2 появляется вследствие того, что в упругой среде имеется две поперечные волны с одной и той же частотой V/. Полное число упругих волн, частота которых лежит между v и v + cfv, очевидно, равно (±^) E1,6) Поскольку каждой волне с частотой v& мы сопоставляли осциллятор, колеблющийся с той же частотой, вычисленная нами величина g(v)dv представляет число осцилляторов, ча- частота которых лежит между v и v + rfv. Если бы кристалл имел бесконечные размеры и содержал бесконечно большое число ') Заметим для дальнейшею, что смещение, представленное к формуле E0,6) в виде стоячей волны, может быть записано в виде наложения двух бегущих волн. Повторяя выклалки § 38 ч. I, можно написать ? в виде
560 КРИСТАЛЛЫ [Гл. VII атомов, число возможных частот или осцилляторов также было бы бесконечным. В действительности, однако, оно равно 3N. Поэтому мы можем написать 3#-2*Ы E1,7) где суммирование ведется по всем возможным частотам. Вид функции g(v) установлен нами в области длинных волн или малых частот, в которой ее можно считать непрерывной функцией аргумента v, даваемой формулой E1,6). Однако в области высоких частот вид спектральной функции неизвестен и зависит от конкретной структуры данного кристалла. Дебаем был предложен метод вычисления термодинамиче- термодинамических функций кристаллов, который, по существу, основан на некоторой интерполяции. Именно, спектральная функция g(v) считается имеющей вчд E1,6) во 15сей области частот, и во всей области частот сумми- суммирование заменяется интегрированием. Однако интегрирование ведется до некоторой предельной частоты \-макс. которая вы- выражается через число частиц в кристалле с помощью условия E1,7). Таким образом, спектральная функция g(v) считается имеющей вид ( (r 4!. v<vMaKC, g(v)=j Vе/ Ч) E1,8) 0, v>vMKC. Это дает 3JV = j откуда N е?с3 \'л ) Наибольшая, или предельная, частота vMaKc оказывается за- зависящей только от измеряемых на опыте величин — скоростей звука С; и С; и пропорциональна плотности кристалла \-у\ . Введение такой «усеченной» спектральной функции E1,8) приводит к выражениям для термодинамических функций, ко- которые в предельных случаях низких и высоких температур пре- превращаются в точные выражения, а в области промежуточных температур имеют характер интерполяционных формул.
§ 52] ФУНКЦИЯ СОСТОЯНИЯ КРИСТАЛЛА 561 С помощью выражения для предельной частоты vMai,-c опре- определенной по формуле E1,10), можно переписать спектральную функцию g(v) в более компактном виде: 4^ E1,11) 4 'макс § 52. Функция состояний кристалла В предыдущих параграфах мы установили, что тепловое дви- движение в кристалле, содержащем N атомов, описывается набо- набором из 3iV независимых осцилляторов, частоты которых лежат между нулем и vManc- Чтобы найти функцию состояний всего кристалла, нужно найти функцию состояний системы, состоящей из Зл' -независимых осцилляторов. Поскольку осцилляторы явля- являются независимыми, мы можем, очевидно, написать эту функцию в виде произведения функций состояния всех осцилляторов, т. е. Z=l]zkt E2,1) где Z — функция состояний кристалла и г» — функция состоя- состояний отдельного k'To осциллятора. Необходимо подчеркнуть, что осциллятор не является отдельным атомом, а характеризует определенное колебание всего кристалла, как целого. Поэтому в E2,1) не следует производить деление на 3N\, как это нужно было бы сделать в случае системы из 3/V одинаковых незави- независимых частиц. Функция состояний квантового осциллятора z& была вычислена нами в § 43. Логарифмируя E2,1) и подстав- подставляя а него D3,2), находим 3N 3/V fe=l ft-I Для вычисления суммы E2,2) необходимо знать все возмож- возможные частоты Vft кристалла. Однако, как мы указывали выше, эта задача еще не решена. Поэтому мы ограничимся приближением Дебая и заменим суммирование интегрированием по «усечен- «усеченному» спектру E1,11). Это дает V hv JnZ= In ~~ E2,3) 0- '• Ливич, том I
562 КРИСТАЛЛЫ [Гл VII Для вычисления интегралов в формуле E2,3) введем новую переменную *~W E2>4) и характеристическую температуру кристалла 0С аналогичную характеристической температуре, введенной в § 43. Тогда получим (^f j x2\n(\-e~x)dx. E2,5) Вычисление последнего интеграла может быть проведено только в случае низких и высоких температур. Под низкими температурами мы будем понимать температуры, значительно более низкие, чем характеристическая температура кристалла 8С- При 7"<С0С предел в интеграле можно заменить на бесконеч- бесконечный, поскольку подынтегральная функция весьма мала при сколько-нибудь больших значениях аргумента х. Это дает J x^.j x2\n(l-e-x)dx. E2,6) о о Интеграл E2,6) вычислен в приложении IV. Подставляя его значение в E2,5), имеем In Z = - -gjr-+-g- (-^) . E2,7) Замена предела в интеграле E2,6) на бесконечность имеет важ- важный физический смысл. Она показывает, что при Г<СЭС в кри- кристалле возбуждены только колебания с малыми частотами v (т. е. существенны малые значения х). При больших частотах (больших х) подынтегральная функция обращается в нуль и соответствующие частоты не вносят никакого вклада в значе- значение Z. Это оправдывает сделанное в предыдущем параграфе приближение — замену дискретного кристалла сплошной упру- упругой средой, в которой возбуждены только колебания с малыми значениями v. При высоких температурах ГС§>0с в пределе интеграла стоит малая величина. Поэтому в подынтегральной функции х заве-
§ 53] ТЕРМОДИНАМИЧЕСКИЕ ФУНКЦИИ КРИСТАЛЛА 563 домо мало, и ее можно разложить в ряд по степеням. В этом случае имеем In A — е~х) «* \пх, так что •elT Ут J x*\n{l-e-*)dx** J x4nxdx=^(^-f\n^- }Ш\ о о E2,8) Подставляя формулу E2,8) в E2,5), находим E2,9) С помощью выражений E2,7) и E2,9) можно найти термо- термодинамические функции кристалла при высоких и низких темпе- температурах. § 53. Термодинамические функции кристалла Вычислим прежде всего энергию и теплоемкость кристалла при низких температурах. При низких температурах (Г<СОС) энергия равна «Л1» 1«1^ E3.1) ет ] Первый член в формуле E3,1) представляет энергию кристалла при Т-*-0, т. е. нулевую энергию. Второй член показывает, что с повышением температуры энергия кристалла быстро (как Г4) растет с температурой. Теплоемкость кристалла при низкой температуре дается формулой СУ-\дТ )у~ 5 \вс) ' {b6'Z) Теплоемкость кристалла при низких температурах оказывается пропорциональной кубу абсолютной температуры. Характерной особенностью выражений E3,1) и E3,2) яв- является то, что в них входит материальная константа кристал- кристалла— его характеристическая температура 0О. Поэтому при низ- низких температурах различные кристаллы обладают разной теп- теплоемкостью (тем меньшей, чем выше б-). При высоких температурах G"С§>9П) энергия и теплоемкость равны соответственно Е = kT2 ^~ = ZNkT + -| NkQc « ZNkT, E3,3) 36*
564 КРИСТАЛЛЫ [Гл VII Как и следовало ожидать, значения Е и Cv совпадают с полу- полученными из закона равномерного распределения энергии по степеням свободы. Они не зависят от материальных констант кристалла и являются универсальными величинами. Независи- Независимость энергии и теплоемкости от материальных констант обу- обусловлена тем, что при достаточно высоких температурах энергия кристалла оказывается не зависящей от частот колебаний, имеющихся в кристалле. Последнее обстоятельство позволяет понять, почему формулы E3,3) и E3,4) оказываются правиль- правильными, несмотря на то, что они выведены на основе заведомо неправильного допущения. Действительно, при получении их считалось, что основную роль играют малые частоты (длинные волны), при которых дискретный кристалл может рассматри- рассматриваться как сплошная упругая среда. При 7!S>9C в кристалле наряду с низкими частотами должны быть возбуждены и вы- высокие частоты, которые будут вносить заметный вклад в функ- функцию состояний. Поэтому приближенный закон распределения частот E1,8) будет уже неприменим. Однако в классическом приближении, справедливом при достаточно высоких темпера- температурах, значение Z, а следовательно и энергии кристалла, вообще не зависит ни от самих частот, ни от характера их распреде- распределения. В промежуточной области температур Г^0е энергия и теп- теплоемкость выражаются более сложными формулами, которые получаются при численном интегрировании в формуле E2,5). Поскольку ширина переходной области невелика, она не пред- представляет особого интереса. Напомним, что, хотя мы вычисляли теплоемкость при по- постоянном объеме, полученное выражение с большой степенью точности совпадает с теплоемкостью при постоянном давлении, так как в твердом теле обе теплоемкости практичекси совпа- совпадают. Найдем теперь энтропию 5 кристалла. При низких темпе- температурах G<6С) из E3,1) и E2,7) находим . E3,5) При высоких температурах (Г!»0С.) из E3,3) и E2,9) получаем S + k\Z3Nk\n~ + 4Nk. E3,6) Формула E3,6) совпадает с чисто термодинамическим выра- выражением для энтропии, отличаясь только тем, что в нее не входит неопределенная постоянная энтропия. Формула E3,5) пока- показывает, что энтропия атомного кристалла стремится к нулю при Т-*-0, как куб температуры, что находится в полном согла-
§ 54] СРАВНЕНИЕ ТЕОРИИ С ЭКСПЕРИМЕНТОМ 565- сии с требованиями третьего начала термодинамики, точно так- также как и убывание теплоемкости при 7->0. Найдем, наконец, свободную энергию и парциальный потен- потенциал кристалла. Из условий E2,7) и E2,9) получим при Г«0с, E3,7) F «* - ZNkT In — - NkT при 71>ес. E3,8). Исходя из свободной энергии, можно получить уравнение состояния кристалла, которое имеет вид при T^QC: /д?_\ _ MkT дОс Р~ \дУ)т вс dV * Поскольку р оказывается выраженным через величину -дтг, а последняя не может быть вычислена теоретически или найдена из достаточно простых экспериментов, уравнение состояния не имеет большого практического значения. Интересно найти закон распределения уровней энергии в твердом теле, точнее, расстояние между уравнениями энергии. Если Q(e)—число уровней в единичном интервале энергий, то расстояние между соседними уровнями энергии равно, очевидно, ?>^) = 'Щг)' С помощью формул B4.10) и E3,5) можно написать С понижением температуры, а также уменьшением числа частиц расстояние между уровнями уменьшается. При Т, весьма близ- близких к абсолютному нулю, в соответствии со сказанным в § 35,. расстояние оказывается равным kT даже для макроскопиче- макроскопического тела. § 54. Сравнение теории с экспериментом Для практического использования полученных выражений и сравнения вычисленных величин с опытными данными необхо- необходимо знать характеристическую температуру кристалла 0С. Из определения и формулы E1,10) находим h /QV\'' 33 '/ Э k \4nVj
566 КРИСТАЛЛЫ ГГл. VII В формулу E4,1) помимо числовых величин и универсальных постоянных входят две величины, определяющиеся свойствами кристалла: плотность N/V и скорость звука в кристалле. Эти величины измерены для многих кристаллов. Поскольку скорость звука согласно E0,15) обратно пропорциональна корню квад- квадратному из массы атомов, она особенно велика у весьма твер- твердых кристаллов, построенных из легких атомов. У подобных кристаллов характеристическая температура особенно высока. В табл. 8 приведены характеристические температуры неко- некоторых кристаллов. Из этой таблицы следует, что для кристал- кристаллов типа свинец — поваренная соль комнатная температура C00° К) и более высокие температуры (до 1000° К) являются сравнительно (хотя и не очень) высокими. Поэтому для подоб- подобных кристаллов отклонения от классических законов и, в частно- частности, от классического значения теплоемкости в этой области не очень велики. Не совершив большой погрешности, можно счи- считать их теплоемкость равной 6 кал/моль; однако при температу- температурах ниже 100° К для всех этих кристаллов отклонение от по- последнего закона становится очень заметным. Та блина 8 Кристалл РЬ . . . . J Бензол . . Na . . . . к 88 106 150 172 Кристалл Apr- . . • NaCl . . . Си .... Be .... о? Кристалл 215 281 315 1000 1 Al . . . . Fe . . . . Ллмаз . . к 398 453 1860 Иначе обстоит дело в случае кристаллов с высокой характе- характеристической температурой, особенно в случае алмаза. Для по- последнего комнатная температура является низкой и ни о какой применимости классических законов не может быть и речи. Теп- Теплоемкость алмаза уже при комнатной температуре следует за- закону Т3. Измерения хода теплоемкости с температурой, проведенные для очень большого числа кристаллов, показали, что изложен- изложенная теория находится в очень хорошем согласии с эксперимен- экспериментом. При температурах Т <С 9С теплоемкости действительно сле- следуют закону Р и стремятся к нулю при Г-^0. При Т^0с происходит постепенный переход к классическому (постоян- (постоянному) значению теплоемкости. Полный ход кривой теплоемкости большого числа кристаллов представлен на рис. 64. Точками на кривой показаны измеренные значения теплоемкости различных кристаллов. Все они изображены в универсальной шкале 770». -Согласие теории с экспериментом оказывается очень хорошим.
54] СРАВНЕНИЕ ТЕОРИИ С ЭКСПЕРИМЕНТОМ 567 Нужно, однако, иметь в виду, что развитая грубая теория относится только к кристаллам, построенным из частиц, внут- внутренней структурой которых можно пренебречь. Это означает, что мы можем не учитывать влияния температуры на состояние частиц. В большинстве случаев этому условию удовлетворяют кристаллы, построенные из атомов. В атомах расстояние между нормальным и первым возбужденным состояниями обычно ве- велико по сравнению с kT и тепловое движение не может влиять на состояние атомов. Поэтому их внутреняя энергия не зависит кал / f I i J «r—* с Ад ?. Al n ClSBOlpUt о А\гЬ3 XKCl 77t 0,5 1,0 Рис. 64. г.о т/ес от температуры и они не могут давать вклада в теплоемкость. Однако у некоторых атомов нижние электронные уровни лежат очень близко друг к другу. Так, например, у ионов гадолиния, входящих в кристаллический сульфат гадолиния, нижний уро- уровень энергии состоит из восьми подуровней, разделенных между собой на расстояния, отвечающие в температурной шкале ха- характеристической температуре 1,6° К. При весьма низких темпе- температурах Т ш 7° К, в соответствии с результатами § 40, появ- появляется добавочная теплоемкость, налагающаяся на теплоем- теплоемкость кристаллической решетки. Поскольку при столь низких температурах теплоемкость решетки весьма мала, рост теплоем- теплоемкости имеет весьма резкий характер. При Г= 1,6° К теплоем- теплоемкость почти в 500 раз превышает теплоемкость кристаллической решетки. При дальнейшем понижении температуры теплоем- теплоемкость системы падает до нуля. В случае кристаллов; построенных из сложных моле- молекул, пренебречь внутренней структурой частиц, как правило, нельзя. В первом приближении можно пренебрегать влиянием
•568 КРИСТАЛЛЫ [Гл VIГ колебаний молекулы в кристаллической решетке на ее внутрен- внутреннее тепловое движение. Молекула как целое колеблется в кри- кристаллической решетке, тогда как внутри нее происходят коле- баиия отдельных атомных групп. В некоторых случаях внутрен- внутреннее движение молекулы представляет свободное вращение. Так, например, молекулы Н2 нужно считать свободно вращающимися в кристалле водорода. Одновременно с вращением молекулы Н2 участвуют в тепловых колебаниях решетки. Пренебрегая взаи- взаимодействием внутреннего движения в молекулах с движением молекулы как целого, можно написать полную энергию кри- кристалла Е в виде где ?Реш — средняя энергия колебаний решетки кристалла, а ¦Евнутр — средняя внутренняя энергия молекулы, вычисленная нами в гл. V. Соответственно теплоемкость кристалла можно представить в виде О v" ^~ С» v ~т~ (-* v • v vpeui ' v внутр Вклад внутреннего движения в теплоемкость в некоторых случаях может быть очень значительным. Так, например, тепло- теплоемкость внутримолекулярных колебаний в бензоле составляет около 20% от теплоемкости решетки при Т ?» 150° К и достигает 80% последней при Т « 270° К. Поэтому при вычислении тепло- теплоемкости сложных кристаллов необходимо учитывать вклад внутреннего движения, особенно при высоких температурах. Хорошее согласие изложенной теории с экспериментом оправды- оправдывает сделанные упрощения. Однако в ряде случаев наблюдаются хотя и незначительные, но вполне реальные расхождения между теорией и эксперимен- экспериментом. При высоких температурах амплитуды колебаний стано- становятся немалыми и пренебрежение квадратами смещений в выражении для квазиупругих сил уже не оправдано1). Коле- Колебательное движение теряет простой гармонический характер. Погрешность, возникающая в результате предположения об изотропии упругой среды, является сравнительно незначитель- незначительной. Более существенной оказывается погрешность, возникаю- возникающая от пренебрежения дискретным характером кристалла. Влияние распределения высоких частот, которым мы пренебре- пренебрегали, определяя число нормальных колебаний кристалла, ска- сказывается в том, что для твердых кристаллов характеристическая температура 0с оказывается не постоянной, а функцией темпе- ') Заметим в связи с этим, что, как показывает расчет, кристалл, у ко- которого силы были бы точно пропорциональны смещениям, имел бы коэффи- коэффициент теплового расширения, равный нулю.
§ 54] СРАВНЕНИЕ ТЕОРИИ С ЭКСПЕРИМЕНТОМ 5691 ратуры кристалла. Например, в случае лития ее значение изменяется от 330° К при температуре кристалла, равной 20° К, до 410° К при температуре 120° К. Сходное явление имеет место у алмаза. Все указанные погрешности столь незначительны, что они были отмечены только лишь в сравнительно недавнее время в связи с возросшей точностью измерений. Нужно еще заметить, что существование аномалий при низ- низких температурах, подобных тем, которые имеются у гадолиния, может привести к кажущимся противоречиям с третьим нача- началом термодинамики. Обычно значение теплоемкости при Т—*(У находится экстраполяцией от значений, измеренных при более высоких температурах. Если эта экстраполяция производится от некоторой температуры, лежащей выше температуры, при которой происходит возрастание теплоемкости, то возникает о f cv dT существенная погрешность. Значение I T , полученное из о экстраполяции, может заметно отличаться от эксперименталь- экспериментального значения энтропии при высокой температуре, найденного из других данных. Поэтому для нахождения правильных значе- значений термодинамических функций желательно доведение измере- измерений теплоемкости до возможно более низких температур.
ГЛАВА VIII ТЕОРИЯ ФЛУКТУАЦИИ § 55. Малые флуктуации в макроскопических системах В предыдущем изложении мы неоднократно указывали на различие между статистическими и чисто термодинамическими представлениями о ходе тепловых процессов. Из законов ста- статистической физики с неизбежностью вытекает существование флуктуации. Система, испытывающая флуктуацию, может само- самопроизвольно перейти из более вероятного в одно из менее ве- вероятных состояний. При этом ход процесса является обратным тому, при котором происходит возрастание энтропии. Вероятность флуктуации в замкнутой системе может быть вычислена с помощью формулы Больцмапа. Простые оценки, произведенные с помощью этой формулы, а также общие со- соображения, изложенные в § 36, показывают, что вероятность сколько-нибудь заметных флуктуации в системе, содержащей большое число частиц, чрезвычайно мала. Явление флуктуации практически может наблюдаться в двух случаях: 1) когда раз- размеры системы достаточно малы; в этом случае флуктуации будут происходить часто и масштаб их будет относительно ве- велик; 2) когда размеры системы не малы, но фиксируются до- достаточно малые флуктуации. Такие малые флуктуации также будут происходить часто, но отклонение системы от состояния равновесия будет сравнительно мало. В этой главе мы рассмот- рассмотрим оба случая флуктуации. Для того чтобы правильно оценить роль, которую сыграли исследования флуктуации в развитии молекулярно-статистиче- ских представлений, необходимо иметь в виду, что существова- существование флуктуации было предсказано теоретически в то время, когда второе начало термодинамики многим казалось одной из догм в физике. Представители так называемой школы энерге- энергетиков вообще отрицали существование материальных атомов и молекул. Статистическая физика, в которой законы классиче- классической механики объединялись со статистическими законами, ка- казалась внутренне противоречивой и была принята многими
§ 55] МАЛЫЕ ФЛУКТУАЦИИ В МАКРОСКОПИЧЕСКИХ СИСТЕМАХ 571 физиками с большим недоверием. Поэтому открытие многочис- многочисленных примеров флуктуационных процессов явилось блестя- блестящим подтверждением законов статистической физики и послу- послужило одним из важнейших моментов в окончательном утверж- дении молекулярной теории. В работах Эйнштейна и Смолуховского было показано, что целый ряд давно известных физических процессов обусловлен явлениями флуктуации, и была развита количественная теория этих процессов, оказав- оказавшаяся в прекрасном согласии с экспериментальными фактами. Лучше всего значение этих открытий можно охарактеризовать словами самого Смолуховского1): «В настоящее время мы не относимся с таким почтением, как ранее, к догмам в физике. Произошли огромные изменения в процессе о значении кинетической атомистики и термодина- термодинамики. Они связаны с тем, что лишь в последнее время на основе кинетической теории удалось дать объяснение давно известным фактам, например, броуновскому движению, открытому еще в 1827 году, явлению критической опалесценции, открытому более 20 лет назад, общеизвестному факту синей окраски неба и т. д. То новое, с чем мы встречаемся в этих объяснениях и что нахо- находится в противоречии с повседневными установившимися пред- представлениями, заключается в том, что в них вполне серьезно учитывается максвелловский закон распределения скоростей. В результате в них впервые теплота рассматривается как про- процесс движения, тогда как раньше эго представление о природе тепла считалось обычно своего рода поэтическим сравнением». Мы начнем рассмотрение процессов флуктуации со второго случая, т. е. со случая систем, размеры которых достаточно велики. Ниже мы изложим общую теорию малых флуктуации, про- происходящих в произвольной макроскопической системе. Возьмем некоторую замкнутую систему, находящуюся в состоянии стати- статистического равновесия и имеющую энтропию So. Предположим теперь, что состояние системы изменяется так, что она перехо- переходит в неравновесное состояние, в котором ее энтропия равна S. Мы будем считать, что изменение состояния системы можно характеризовать изменением некоторого внутреннего парамет- параметра |, значение которого зависит от состояния всей системы. В состоянии равновесия параметр | имеет значение \ = go, в неравновесном состоянии его значение отлично от go- В качестве примера параметра ? можно привести плот- плотность р газа, находящегося в замкнутом, теплоизолированном сосуде. В состоянии равновесия плотность постоянна по всему объему сосуда, т. е. go = ро = const. В результате флуктуации ') М. Smoluchowski, Phys. Zs. 13, 1059, 1912.
572 ТЕОРИЯ ФЛУКТУАЦИИ [Гл VIII система может самопроизвольно перейти в неравновесное со- состояние с переменной плотностью % = р(х). Другие примеры будут разобраны в дальнейшем. Энтропия системы будет некоторой функцией параметра ?, так что можно написать S = 5(|). При этом в состоянии равно- равновесия 5о = 5(|о). Вероятность того, что рассматриваемая зам- замкнутая систем^ попадет в состояние, характеризуемое значением параметра |, лежащим в интервале между g и \ + й\, можно найти с помощью формулы Больцмана: .S(i-)-S(So) AS dw = const -e k d\ = const -ek tfg, E5,1) где постоянная определяется условием нормирования1). Вели- Величина изменения энтропии является, очевидно, отрицательной. Приложения формулы E5,1) к конкретным случаям флук- флуктуации будут рассмотрены в следующем параграфе. Формула E5,1) применима к флуктуациям в системе с постоянной энер- энергией. Очень часто, однако, приходится рассматривать флуктуации, происходящие не в замкнутой, а » квазизамкнутой системе, со- составляющей малую часть замкнутой системы. Такую квази- квазизамкнутую систему можно считать некоторой подсистемой, по- погруженной в термостат с постоянной температурой 7V Мы бу- будем считать, что флуктуации происходят только в подсистеме. Термостат при этом может совершать квазистатический про- процесс, не нарушающий его равновесия. Состояние подсистемы будет характеризоваться значением некоторого внешнего пара- параметра X. При переходе из равновесного состояния в неравновес- неравновесное параметр X изменяется от Хо до X. При изменении X изме- изменяются также значения термодинамических величин, характери- характеризующих подсистему. Мы будем предполагать, что изменения макроскопического параметра X происходят достаточно мед- медленно, так что в каждый данный момент в подсистеме будет существовать равновесное статистическое распределение. При этом можно считать, что термодинамические величины в под- подсистеме связаны между собой обычными равновесными соотно- соотношениями. Процесс перехода из равновесного в неравновесное состояние у подсистемы, погруженной в термостат, можно рас- рассматривать как переход, совершающийся под действием неко- некоторого внешнего источника работы. При изменении параметра X на величину АХ =¦ X — Хо источник совершает над подсистемой работу AW(X). ') Строго говоря, постоянная в E5,1) также зависит от параметра ?. Можно, однако, показать, что п системе, содержащей достаточно большое число части», зависимость от % множителя, стоящего перед экспокектой, не играет роли по сравнению с зависимостью экспоненты.
§ 55] МАЛЫЕ ФЛУКТУАЦИИ В МАКРОСКОПИЧЕСКИХ СИСТЕМАХ 573 Напишем теперь выражение для вероятности того, что под- подсистема перейдет в состояние со значением К между h и Я + АХ, в то время как термостат останется в равновесном состоянии. Поскольку термостат и подсистема вместе составляют замкну- замкнутую систему, к ним применима формула E5,1). В ней, однако, изменение энтропии нужно написать в виде AS = AS0 + AS', где AS' — изменение энтропии подсистемы. Тогда вероятность того, что подсистема перейдет в состояние с X в интервале А,, X +' d). под влиянием внешнего источника работы, дается фор- формулой A dw = const • е k dk. E5,2) Но в силу нашего предположения о медленности изменения макроскопических параметров для AS' можно написать обычное равновесное выражение: где То и ра — равновесные температура и давление системы (рав- (равные соответствующим величинам термостата), Е' и V — энергия и объем подсистемы. (В последней формуле ясно видно, что AW представляет работу, совершенную внешним источником, но не термостатом. Работа,совершаемая термостатом, равна — poAV.) Далее, . с ЛЯ0 + Ро ^Va Аоо = ? • 'о Но в силу замкнутости системы (термостат+подсистема) пол- полный объем системы остается постоянным, так что Закон сохранения энергии дает АЕ' + А?о = 0. поэтому ASo=-AS'-^^-. E5,4) Подставляя E5,4) в E5,2), находим dw = const- e kT» dk. E5>5) Таким образом, в самом общем случае можно сказать, что мерой вероятности малых флуктуации в макроскопической си- Йтеме является та работа, которую нужно над нею совершить
574 ТЕОРИЯ ФЛУКТУАЦИИ [Гл. VII! для изменения параметра к, характеризующего состояние си- системы, на величину АХ. Это не означает, однако, что система может испытывать флуктуацию только тогда, когда над ней производится реальная работа извне. Это особенно ясно видно на примере замкнутой системы, над которой вообще не совер- совершается никакой работы. Работа AW является лишь количест- количественной характеристикой флуктуации. Работу AW можно пред- представить как изменение потенциальной энергии при перемещении системы в некотором воображаемом (а иногда и реальном) поле сил. Обозначая потенциал этого поля сил через и{к), имеем AW = "(Я)— и(Я0)= и(Х), если и(ко) выбрать за уровень отсчета потенциальной энергии. При этом формулу E5,5) можно написать в виде dw = const • e kT» dk = w (A) dk. E5,6) Мы приходим, таким образом, к формуле, являющейся аналогом формулы Больцмана. В дальнейшем мы увидим, что эта анало- аналогия имеет вполне ясный смысл. Для вычисления вероятности флуктуации по формулам E5,5) или E5,6) нужно в каждом отдельном случае найти ра- работу или изменение потенциальной энергии в процессе флуктуа- флуктуации. При этом в силу малости флуктуации выражение для и (к) можно разложить в ряд но степеням малого параметра {к — ко) и ограничиться первыми членами разложения: u{k) = u'{ko){k~h) + u"{ko)^=^-+..., где штрихами обозначены производные по к. В состоянии равно- равновесия потенциальная энергия поля должна иметь минимум, так что и'{ко) = 0 и и"{ко)> 0. Поэтому распределение вероятностей E5,6) можно представить в виде dw = const -e~ 2kT> dk. E5,7) Распределение вероятностей E5,7) носит название распреде- распределения Гаусса. Значение постоянной и"{ко) зависит от природы того реального или фиктивного поля сил, в котором происходит «перемещение» системы из положения к0 в положение к. С по- помощью распределения вероятностей малых флуктуации E5,7)
§ 551 МАЛЫЕ ФЛУКТУАЦИИ В МАКРОСКОПИЧЕСКИХ СИСТЕМАХ 576 можно найти среднее значение флуктуации параметра X: Д2 = (л-Х0J = const j {Х-Х0Jе г№ dX. Постоянная в E5,7) определяется условием нормирования Const = ТТГТп—Г^г • и" (л.в)(Л.—л.о)' J e~ 2*г° dX Таким образом, (Х-Х0J 2kT° dX M' • E5,8) 2kT' dX Флуктуации параметра X происходят в обе стороны от зна- значения его в равновесном состоянии. Поскольку подынтегральная функция в интегралах в числителе и знаменателе выражения E5,8) быстро убывает с увеличением абсолютной величины разности (X — Д-о), интегрирование можно вести в пределах от —оо до +оо, аналогично тому, как это делалось нами при нор- нормировании распределения Максвелла. Итак, окончательно, и" (Mi*.-U? j (А,-; E5,9) 2кТ<, j. е -2kT" dX — оо С помощью формулы E5,9) распределение вероятностей E5,7) можно написать в виде dw Вероятность данной флуктуации резко уменьшается с ростом ее величины, а также с уменьшением А2. Последняя величина пропорциональна абсолютной температуре, Поэтому можно утверждать, что интенсивность флуктуации уменьшается с паде- падением температуры1). В следующих параграфах найденные общие соотношения будут применены к конкретным случаям малых флуктуации в макроскопических системах. ') Об исключении из этого правила см. В. Г. Л е в и ч, Введение в ста- статистическую физику, Гостехиздат, 1954, § 63.
576 ТЕОРИЯ ФЛУКТУАЦИИ [Гл VIII § 56. Броуновское движение В качестве первого случая, когда явления флуктуации ока« зываются легко доступными наблюдению, рассмотрим так на- называемое броуновское движение. Броуновским движением называют наблюдающееся под микроскопом непрерывное хао- хаотическое движение малых частиц, взвешенных в жидкости или в газе. Полная количественная теория броуновского движения, не только объяснившая его природу, но и позволившая предска- предсказать ряд его характерных особенностей, была развита в работах Эйнштейна и Смолуховского A905—1906 гг.). Исследования броуновского движения сыграли важнейшую роль в торжестве молекулярио-кинетической теории, поскольку именно броунов- броуновское движение было первым физическим процессом, в котором существование молекул обнаруживалось самым непосредствен- непосредственным и наглядным образом. Значение и важность теории броу- броуновского движения отнюдь не ограничиваются историческим интересом. Наоборот, именно в сравнительно недавнее время ряд случаев броуновского движения приобрел особую актуаль- актуальность в связи с созданием новых, весьма точных измерительных приборов (см. § 58). Переходя к разбору теории броуновского движения, рас- рассмотрим макроскопическую частицу, взвешенную в объеме жидкости или газа, и попытаемся найти силы, действующие на нее со стороны молекул среды. Молекулы среды находятся в не- непрерывном тепловом движении. Поэтому о поверхность частицы будут непрерывно ударять молекулы жидкости или газа, в ко- который погружена частица, и передавать ей при каждом ударе соответствующий импульс. Иными словами, молекулы среды будут оказывать давление на поверхность частицы. Удары мо- молекул о поверхность частицы происходят совершенно беспоря- беспорядочно, со всех сторон. Если размеры поверхности частицы достаточно велики, так что за очень короткий промежуток вре- времени о нее ударяет большое число молекул, то можно считать, что импульсы, передаваемые частице со всех сторон, в среднем уравновешиваются. Иначе дело обстоит в случае очень малых частиц (размером порядка 10~4 см). Такие частицы содержат еще огромное число молекул и являются макроскопическими телами. Тем не менее поверхность таких частиц столь мала, что за короткое время она получает сравнительно малое количество молекулярных толчков. Равнодействующая сил, действующих со стороны молекул среды на поверхность частицы, оказывается отличной от нуля. В результате частица придет в беспорядоч- беспорядочное движение, направление и скорость которого будут изме- изменяться с очень большой частотой (порядка 1012 раз в секунду).
. 56] БРОУНОВСКОЕ ДВИЖЕНИЕ 577 Характер этих смещений передает рис. 65, на котором пред- представлено положение частицы, фиксированное каждые 30 сек. Сторона клетки отвечает расстоянию 3-Ю см. При этом число молекул, ударяющих о частицу, и передаваемый ими импульс будут испытывать большие флуктуации. Таким образом, броу- броуновское движение обусловлено флуктуациями давления, ока- оказываемого молекулами среды на взвешенную в ней частицу. Хотя ее движение непосредственно не является молекулярным движением, оно служит своего рода индикатором молекулярного движе- движения. Как мы неоднократно подчер- подчеркивали, явления флуктуации про- противоречат положениям чистой тер- термодинамики. Это можно проиллю- проиллюстрировать особенно наглядно на примере броуновского движения. Самый факт непрерывности и неуничтожаемости броуновского движения указывает на непрерыв- непрерывное нарушение требований второго начала термодинамики. Действи- Рис. 65. тельно, если бы частица, находя- находящаяся в среде, получила единичный импульс от какого-либо внешнего источника, то ее движение было бы быстро затормо- заторможено в результате потери энергии на вязкое трение. Поэтому неуничтожаемость броуновского движения свидетельствует о существовании процессов, обратных процессам вязкого трения и идущих с убылью энтропии. Для поддержания движения ча- частица непрерывно черпает энергию из окружающей ее среды, что прямо противоречит второму началу термодина- термодинамики. Для построения количественной теории броуновского дви- движения мы можем воспользоваться общими соотношениями, вы- выведенными в предыдущем параграфе. Пусть в некоторой среде, жидкости или газе, взвешена очень маленькая, но макроскопическая частица с массой ja. Предпо- Предположим, что положение этой частицы характеризуется некоторым параметром (обобщенной координатой) А,. Таким параметром может являться, например, расстояние частицы до некоторой плоскости сосуда, которая выбрана за начало отсчета расстоя- расстояний (другие примеры будут даны ниже). На частицу будет действовать со стороны среды быстро и беспорядочно изменяю- изменяющаяся во времени сила, обусловленная флуктуациями теплового движения молекул среды. Под действием этой флуктуаннонпоЧ силы, которую мы для краткости будем называть броуновской, частица будет испытывать весьма малые смещения, так что 37 В. Г. Левин, том I
578 ТЕОРИЯ ФЛУКТУАЦИИ [Гл. VIII значение ее параметра X будет постоянно изменяться на весьма малые величины АХ. Вместо тогсГчтбВы следить за движением одной частицы во времени, можно, следуя Эйнштейну, рассмотреть множество оди- одинаковых частиц, испытывающих броуновские смещения, и найти количество частиц, проходящих через некоторую воображаемую поверхность в среде. Обозначим через с(Х) число частиц в единице объема, нахо- находящихся на расстоянии X, X+dX от поверхности Х=О. Пусть А=У{АХJ означает среднее квадратичное смещение частиц за некоторое малое время т. Тогда через 1 см2 вообра- воображаемой поверхности, проведенной в растворе, за время т прой- дет в среднем [ ——^ J Д частиц, движущихся слева на- направо. Аналогично, двигаясь в обратную сторону, через эту по- поверхность пройдет за то же время I %— I А частиц. В результате через 1 см2 воображаемой поверхности пройдет число частиц N = jx = \ ' g 2 ~ ' 2 1А' E6'D где / — поток частиц. Считая Д малым, а с(X) — медленно изменяющейся функ- функцией координаты Я, можем написать Л/я» — —— или /— , (?к(\ 0\ Поток вещества пропорционален градиенту его концентра- концентрации и направлен в сторону ее уменьшения. Коэффициент про- пропорциональности Д2/2т называется коэффициентом диффузии D: Таким образом, среднее квадратичное смещение частицы оказывается равным Д2 = (ДЦТ= 20т. . E6,4) Средний путь, проходимый частицей, оказывается пропорцио- пропорциональным корню из времени наблюдения за ней т.
§ 56] БРОУНОВСКОЕ ДВИЖЕНИЕ 579 Коэффициент диффузии D может быть выражен через тем- температуру и физико-химические постоянные среды. Именно, пред- предположим, что, помимо градиента концентрации, поток частиц создается также вследствие внешней силы /, действующей на каждую из частиц. Под действием силы / малая частица, находящаяся в вяз- вязкой среде, движется со скоростью и, которая при стационарном движении равна где Ъ = (Cria) — величина, именуемая подвижностью частицы, а — ее радиус, г| — вязкость среды и С —числовой коэффициент, равный для сферических частиц 6л. Формула E6,5) носит на- название формулы Стокса. Простой расчет показывает, что время установления стационарного движения для мелких частиц весь- весьма мало. Полный поток вещества может быть написан в виде j=-D^- + uc E6,6) или _ дс , dU ?Nс где U — потенциальная энергия, отвечающая силе f. Предположим теперь, что поток частиц, вызываемый внеш- внешним полем, равен по величине и противоположен по направле- направлению потоку частиц, создаваемому градиентом концентрации. Тогда полный поток частиц / обращается в нуль. При этом распределение концентрации частиц определяется условием п дс . dU п или ьи с = сйе~°. E6,8) С другой стороны, нам известно, что во внешнем поле частицы, не взаимодействующие между собой, распределены по Больц- ману и и_ с = сое кт. E6,9) Сравнивая последние выражения, мы находим D = bkT. E6,10) 37*
580 ТЕОРИЯ ФЛУКТУАЦИИ [Гл. VIII Таким образом, коэффициент диффузии частиц связан с их подвижностью универсальной формулой E6,10), которая для сферических частиц приобретает вид kT D E6,11) Подставляя значение D из E6,11) в E6,4), находим E6,12) Таким образом, средний путь, проходимый частицами, растет с температурой среды. Все величины, входящие в формулу E6,12), известны или могут быть измерены. Следует отметить, что из формулы E6,12) в свое время было определено значение постоянной Больцма- на k. О точности совпадения этих формул с экспериментом мож- можно судить по тому факту, что в 1910—1915 гг. значение числа Авогадро N= ~т-, найденное из измерений броуновского движе- движения (N = 6,44 • 1023), считалось одним из наиболее точных зна- значений этой величины. Опыты с броуновским движением позволили непосредственно и наглядно продемонстрировать еще один важный вывод стати- статистической механики. Речь идет об утверждении относительно принципиальной обратимости молекулярных процессов. Опыты состояли в наблюдении за числом броуновских частиц, находя- находящихся в резко ограниченном (например, путем соответствую- соответствующего освещения) поле наблюдения под микроскопом. Благодаря броуновскому движению частицы будут входить в поле наблю- наблюдения и выходить из него в неосвещенную часть раствора. Предположим, что в какой-то момент времени концентрация броуновских частиц в поле наблюдения оказалась выше, чем в остальном растворе. Согласно второму началу термодинамики при этом должно происходить выравнивание концентраций пу- путем диффузии частиц из освещенного в неосвещенный объем. После окончательного выравнивания концентраций в системе должно установиться полное равновесие, которое не должно на- нарушаться в дальнейшем. С точки зрения статистической физики явление должно было бы протекать совершенно иначе. Число частиц в достаточно малом объеме должно было бы увеличи- увеличиваться и уменьшаться одинаково часто, так что понятие диф- диффузии и выравнивания концентрации потеряло бы всякий смысл. По прошествии времени возврата т* число частиц, пер- первоначально равное, скажем, п, должно было бы вернуться к этому же значению. Длительность времени возврата была вы- вычислена Смолуховским. Как мы уже говорили, она резко воз-
56] БРОУНОВСКОЕ ДВИЖЕНИЕ 581 растает с размерами системы, в данном случае с величиной числа п. Результаты наблюдений сведены в табл. 9 и 10. Таблица 9 Наблюдаемая частота изменения числа частиц п -> т в поле зрения п 0 1 2 3 4 5 210 134 27 10 2 126 281 138 20 2 0 т = 2 35 117 108 76 14 2 т = 3 7 29 63 38 22 10 0 1 16 24 13 10 т — 5 1 1 3 6 11 J т-6 _ 0 3 3 В первой из них приведена частота изменения числа частиц в области наблюдения. Через п обозначено число частиц в этом объеме при первом наблюдении, через т — число частиц при последующем наблюдении. Частота перехода п—*т означает число случаев, при которых имела место замена п на т. На- Например, цифра 27 в третьей строке второй колонки означает, что в 27 случаях число частиц, бывшее при первом наблюдении равным двум, при втором наблюдении уменьшилось до нуля. ¦Среднее число частиц, которое должно было бы находиться в поле зрения, составляло п = 1,43. Измерения производились через промежуток времени М = 1,39 сек. Таблица 10 Среднее время возврата Время наблюдения 0 I 2 3 4 • т(наблюл) ел зд 4,1 7,8 18,6 т(вычнсл) 5,5 3,2 4,0 8,1 20,9 Анализ цифр табл. 9 сразу указывает на правильность ста- статистической точки зрения и может служить непосредственной иллюстрацией рассуждений § 25. Действительно, согласно поло- положениям термодинамики мы должны были бы ожидать постоян- постоянного уменьшения числа частиц (т < п) в случае, когда перво- первоначальное значение п > п, и увеличения числа частиц в обрат- обратном случае. Ничего похожего в табл. 9 не обнаруживается. Наоборот, при п > п в последующих наблюдениях очень часто
582 ТЕОРИЯ ФЛУКТУАЦИИ (Гл. УПГ обнаруживается еще большее число частиц. Так, при п = 3 в- 106 случаях при втором наблюдении обнаруживается меньшее (т = 0, 1, 2) число частиц, а при 68 наблюдениях — большее или равное число частиц (т = 3, 4, 5). Из табл. 9 видно, что при малом числе частиц числа, стоя- стоящие по обе стороны от главной диагонали, практически равны между собой. Например, частота перехода отп~3кт = 0 составляет 10. Частота перехода от п = 0 к т = 3 равна 7. Частота перехода от п = 2 к m = 4 равна 16, отл = 4кт = 2 равна 14 и т. д. Это означает, что процесс броуновского движе- движения имеет строго обратимый характер. Флуктуации происходят так часто, что не обнаруживается никакого систематического- хода их со временем. Если, однако, число частиц п оказывается значительным, так что масштаб флуктуации велик, то в соот- соответствии с рассуждениями § 25 можно ожидать рассасывания флуктуации. В этом случае наиболее вероятный ход процесса совпадает с предсказываемым термодинамикой: чаще всего ча- частицы будут удаляться (диффундировать) из зоны наблюдения^ и число частиц в ней должно в большинстве случаев умень- уменьшаться. Из табл. 9 видно, что при п = 5 (такое п уже довольна существенно превышает п) в 22 случаях происходит уменьшение числа частиц и лишь в четырех случаях оно увеличивается или остается постоянным. Если бы число частиц п было очень ве- велико и намного превышало среднее значение п, то уменьшение его происходило бы уже в подавляющем большинстве случаев. Возникла бы необратимость процесса. Не менее убедительно выглядят данные табл. 10. В ней ука- указаны вычисленные и наблюденные времена возврата числа ча- частиц в поле наблюдения (в единицах А/=1,39 сек) для взвеси со средним числом частиц п = 1,55. Из таблицы видно, что по прошествии промежутков времени т*, хорошо согласующихся с теоретически вычисленными, число частиц, первоначально об- обнаруженных в поле наблюдения, вновь восстанавливается. Вре- Время возврата резко возрастает с величиной отклонения п от п> так что большие флуктуации повторяются весьма редко (см. также табл. 9). Все эти факты убедительно свидетельствуют о правильности молекулярно-статистической точки зрения. § 57. Флуктуации термодинамических величин в однородной системе Рассмотрим теперь флуктуации термодинамических величин, относящихся к системе, погруженной в термостат. Количественной мерой вероятности флуктуации- является работа, которую нужно произвести над подсистемой для того,
$ 57] ФЛУКТУАЦИИ В ОДНОРОДНОЙ СИСТЕМЕ 583 чтобы перевести ее из начального, равновесного, в конечное, флуктуационное состояние. Ввиду малости флуктуации переход можно считать обрати- обратимым. Работа обратимого перехода для системы, погруженной в среду, выражается общей термодинамической формулой B8,7): Д№ = АЕ — TQAS+'p0AV, E7,1) где АЕ, AS и AV— изменения соответствующих величин при переходе из начального в конечное состояние. Конкретное вы- выражение работы AW можно получить для различных частных случаев процесса. Мы ограничимся вычислением работы для флуктуации обь- ¦ема при постоянной температуре и флуктуации температуры при постоянном объеме. Рассмотрим прежде всего флуктуации объема при постоян- постоянной температуре (Т = 7\> — const). Работа изотермического изменения объема при постоянной •температуре равна AW = АЕ — A(TS) + p0AV = AF +' p0AV. E7,2) Подчеркнем, что формула E7,2) показывает, что работа AW представляет работу, совершаемую над подсистемой внешним источником работы (но не средой). При малом изотермическом изменении объема AV свобод- свободную энергию в формуле E7,2) можно разложить в ряд по сте- степеням AV, переписав ее в виде сте- сте¦pbV-(-jfr] 2^-. E7,3) Поскольку процесс можно считать квазистатистическим, в про- процессе флуктуации равновесное давление в подсистеме можно считать равным давлению в среде. Поэтому находим оконча- окончательно Подставляя E7,4) в формулу E5,5), находим вероятность того, что объем V системы лежит между V и V -f.dV: ( др\ AV» . Д SV )т 2кТ dw = const • ех 0V 'r <*' dV. E7,5)
584 ТЕОРИЯ ФЛУКТУАЦИИ [Гл. VIIT Постоянная находится из условия нормирования: <х> ( ар' J const• J e — 00 2kT E7,6) Из формул E7,5) и E7,6) вытекает, что производная должна быть отрицательна. Если бы это условие оказалось невыполненным, вероятность флуктуации не убывала бы, а воз- возрастала с ее масштабом. В таком веществе происходили бы флуктуации объема, в результате которых объем системы не- неограниченно возрастал или уменьшался до нуля. Вещество на- находилось бы в неустойчивом состоянии. Таким образом, условие- устойчивости состояний однородного вещества дается фор- формулой '%) <0. E7,7) Если условие E7,7) выполнено, интеграл E7,6) без труда мо~ жет быть вычислен. Тогда const = Нормированное распределение вероятностей изотермических флуктуации .объема имеет вид dw Л/ \дУ)т f 2nkT Найдем с помощью распределения вероятностей E7,8) среднюю квадратичную флуктуацию объема (AVJ=(V—V^J. Оче- Очевидно, имеем (V-Vo)' Вводя значение (AVJ в распределение E7,8), можно перепи- переписать его в более компактном виде: dw = J dV. E7,10).
f 57] ФЛУКТУАЦИИ В ОДНОРОДНОЙ СИСТЕМЕ 585 Из формул E7,9) и E7,10) следует, что масштаб и вероятность флуктуации растут с повышением температуры вещества, а также с увеличением изотермической сжимаемости. Применим формулу E7,9) к случаю идеального газа: kT V2kT V2 dV В дальнейшем нас будет интересовать значение средней квадратичной флуктуации плотности Р = ~ = " (где т — мас* ¦са, заключенная в объеме V, в котором происходит флуктуа- флуктуация). Имеем ~ *2 kT р2 Ш где уг — изотермическая сжимаемость. Относительная флук- флуктуация плотности в объеме V равна E7,12) Найдем также флуктуацию числа частиц, находящихся в заданном объеме. Величина (AVJ представляет среднюю квад- квадратичную флуктуацию объема V системы, в котором содер- содержится N частиц. Флуктуация объема, приходящегося на одну частицу V/N, равна kT ДГ2 \(Ш Считая объем V фиксированным, находим флуктуацию числа частиц в этом объеме: N4T 1 V* К*), E7,13) В частности, для идеального газа (Щ* = N. E7,14) Независимость флуктуации числа частиц в данном объеме от температуры в идеальном газе связана с тем, что в идеаль- иом газе движение каждой частицы происходит независимо от движения остальных частиц. С ростом температуры в идеаль- идеальном газе растет лишь средняя квадратичная скорость, но самый характер движения не изменяется.
586 ТЕОРИЯ ФЛУКТУАЦИИ [Гл. VIII Формулы E7,8) и E7,9) теряют смысл в том случае, когда изотермическая сжимаемость обращается в бесконечность (а производная {-jrn — в нуль]. Формальное применение фор- формулы E7,9) приводит к абсурдному результату — бесконечно большой флуктуации объема. В действительности, однако, при обращении в нуль производной {jJrr) изменяется выражение E7,4) для работы AW, на котором основан вывод формулы E7,9). Разложение E7,3) должно быть продолжено, так что вместо E7,3) нужно написать E7,,5> Предположим, что вторая производная (зтАч отлична от нуля. Тогда, опуская в E7,15) бесконечно малые старшего по- порядка, можно написать Подставляя E7,16) в условие нормирования E7,6), мы видим, что оно не может быть удовлетворено ни при каком значении постоянной ("лт/т) • Это означает, что сделанное предположе- предположение о том, что при (-д^-) =0 может быть выполнено условие ^ ^' ПРИВ°ДИТ к противоречию. Отсюда видно, что если (-jy) = 0, то одновременно должно быть выполнено и условие 1^1-°- <57'17> Совокупность этих двух условий определяет положение кри- критической точки (см. § 64). В критической точке вероятность флуктуации плотности ока- оказывается значительно большей, чем в обычном состоянии ве- веществ, так как здесь работа изотермического изменения объема весьма мала. Необходимо, однако, подчеркнуть, что для нахождения ко- количественного выражения для распределения вероятностей флуктуации в критической точке пользоваться формулой E5,5) с подстановкой в нее разложения E7,15) оказывается неза- незаконным.
¦§ 57] ФЛУКТУАЦИИ В ОДНОРОДНОЙ СИСТЕМЕ 587 В критическом состоянии вещества его сжимаемость на- настолько велика, что малые силы вызывают большие действия. Благодаря этому флуктуации здесь не только велики, но, что •самое главное, теряют свой местный характер. Это означает, что теряет смысл утверждение о флуктуации объема, происходя- происходящей в данной точке вещества 1). Рассмотрим теперь флуктуации температуры подсистемы при постоянном объеме. Работа, которую нужно было бы про- произвести над подсистемой для того, чтобы перевести ее из рав- равновесного состояния с температурой 7*0 в неравновесное состоя- состояние с температурой Т, равна W = АЕ — Г0Д5. Разложим изменение энергии Д? в ряд по степеням AS и огра- ограничимся первыми членами разложения. При этом, поскольку энергия является потенциалом относительно энтропии и объема, имеем Но AS-(#) ДГ. Поэтому окончательно J _ 1дГ\ (dS\* JMT _(?S\ ~~\dSjv\dTJv 2 \dT]v Вероятность того, что температура подсистемы испытает флуктуацию и ее температура будет лежать между Т и Т + dT, равна Су(т-т0)* dw = const- e" »т. dT. E7,18) Нормируя распределение E7,18), находим тоJ dT- E7,19) ') Теория флуктуации вещества, находящегося в критической точке, не может быть изложена в рамках этой книги. С ней можно ознакомиться в книге Л. Д. Л а н д а у и Е. М. Л и ф ш и ц а, Статистическая физика, Гос- техиздат, 1951.
588 ТЕОРИЯ ФЛУКТУАЦИИ [Гл. Vllt Из распределения E7,19) следует, что теплоемкость одно- однородного вещества при постоянном объеме должна быть суще- существенно положительной величиной. В противном случае веще- вещество находилось бы в неустойчивом состоянии. Таким образом,, наряду с E7,7) мы получаем второе условие устойчивости со- состояний однородного вещества: Cv > 0. E7,20) Если бы теплоемкость тела была отрицательна, то тело можно было бы нагревать, забирая при этом от него тепло. Иными словами, можно было бы построить вечный двигатель второго- рода. Можно показать, что флуктуации объема и температуры являются независимыми. Не останавливаясь на строгом дока- доказательстве этого утверждения, заметим лишь, что оно вытекает также из общих физических рассуждений. Состояние однород- однородного тела полностью определяется тремя термодинамическими параметрами, которые связаны между собой одним соотноше- соотношением— уравнением состояния. Поэтому изменения двух термо- термодинамических параметров в однородном теле могут всегда про- происходить независимо друг от друга. В однородном веществе условия E7,7) и E7,20) являются достаточными для устойчи- устойчивости состояний системы. Напомним, что необходимыми усло- условиями устойчивости являются постоянство температуры и дав- давления в однородной системе. В заключение отметим, что полученные нами условия устой- устойчивости не обязаны выполняться в неоднородной системе, например в системе, находящейся в поле сил или состоящей из нескольких фаз. В этом случае состояние системы, помимо па- параметров р, Т, S и V, зависит и от других величин, например на- напряженности внешнего поля. Поэтому изменятся выражения для работы флуктуации и условия устойчивости. § 58. Влияние флуктуации на чувствительность измерительных приборов Флуктуации играют важную роль в действии современных высокочувствительных приборов — весов, гальванометров и т. п. Чувствительность этих приборов столь высока, что они позво- позволяют регистрировать явления того же масштаба, что и флук- флуктуации, вызываемые тепловым движением молекул в самом приборе. Это влечет за собой важное следствие: при непосред- непосредственном (однократном) измерении физической величины, зна- значение которой меньше, чем флуктуации самого прибора, он регистрирует собственное тепловое движение (фон), а не изме-
§ 58] ВЛИЯНИЕ ФЛУКТУАЦИИ НА ЧУВСТВИТЕЛЬНОСТЬ ПРИБОРОВ 589 ряемую величину. В этом смысле говорят, что тепловое движе- движение кладет предел чувствительности данной конструкции при- прибора (при однократном измерении). Дальнейшее повышение чувствительности и измерения ве- величии, лежащих ниже фона теплового движения, сопряжено с выполнением многократных измерений (или изменением кон- конструкции прибора). Действительно, если прибор регистрирует только собственное движение, то среднее отклонение прибора будет равно нулю. Если же на фон накладывается некоторое внешнее воздействие, то прибор будет флуктуировать около некоторого нового поло- положения и его среднее отклонение будет отлично от нуля. Чем больше число произведенных измерений, т. е. чем больше время наблюдения, тем меньшие значения физической величины (ле- (лежащие ниже фона) могут быть зарегистрированы. Найдем чувствительность некоторых приборов при однократ- однократном измерении. Подвешенное зеркальце. Одним из простейших и наиболее чувствительных приборов является легкое зеркальие, подвешенное на тонкой, обычно кварцевой, нити. Чувствитель- Чувствительность прибора определяется возможностью регистрации весьма малых углов поворота зеркальца на нити. Предел чувствитель- чувствительности, т. е. наименьшие углы поворота, которые могут быть зарегистрированы, при однократных измерениях определяются тем, что они должны быть больше, чем колебания зеркальца, вызванные тепловым движением молекул зеркальца и нити. Это тепловое движение приводит к случайным поворотам под- подвешенного зеркальца на углы, величина которых определяется значением среднего квадратичного угла поворота. Вычислим эту величину. Для того чтобы зеркальце «случайно», т. е. под действием молекулярного теплового движения, отклонилось от равновес- равновесного положения ф = 0 на некоторый угол ф, необходимо, чтобы была произведена работа против упругих сил нити. Эта работа производится за счет энергии теплового движения. Роль пара- параметра, определяющего отклонение системы от положения рав- равновесия, играет угол ф. Вероятность отклонения системы от рав- равновесного положения ф = 0 на угол ф определяется формулой E5,6), в которой в качестве потенциальной энергии будет потенциальная энергия кручения нити. При малых углах где а=П и (здесь г — радиус нити, / — ее длина и G — мо- модуль сдвига нити).
590 ТЕОРИЯ ФЛУКТУАЦИИ 1Гл. VIII Таким образом, dw = const .g~«*rtf<p = -^ афГф . E8,1) J Здесь постоянная определена из условия нормирования. Средний квадратичный угол отклонения равен oo J — oo ф2е Дф2 ~~2kT . Этот результат имеет простой смысл: средняя потенциальная энергия нашей системы с одной степенью свободы равна в соответствии с законом о равномерном распределении. При 7 = 300° К и а—\0'в эрг (таким значением а обладают очень тонкие кварцевые нити) имеем Уф2 =2-10~4- Эта величина определяет угол, на который в среднем поворачивается зер- зеркальце «само по себе». Если измеряемая по отклонению зер- зеркальца величина вызывает поворот на меньший угол, то при однократном измерении регистрируется собственное отклонение. Ясно, однако, что при отсутствии систематической откло- отклоняющей силы среднее отклонение зеркальца будет равно нулю, а при наличии такой силы зеркальце будет испытывать колеба- колебания около смещенного положения равновесия. Производя мно- многократные измерения колебаний зеркальца, можно найти, около какого среднего положения происходят эти колебания. Тем са- самым можно определить величину, значения которой лежат ниже теплового фона или чувствительности при однократном изме- измерении. Пружинные весы. Совершенно аналогичные результаты могут быть получены для пружинных весов. Флуктуации давле- давления окружающего воздуха и тепловое движение механизма весов будут приводить к тому, что нагрузка весов будет хаоти- хаотически изменяться, Это изменение нагрузки буде! компенсиро-
§ 58] ВЛИЯНИЕ ФЛУКТУАЦИИ НА ЧУВСТВИТЕЛЬНОСТЬ ПРИБОРОВ 50Г ваться квазиупругой силой кАх. Изменение потенциальной энер- энергии системы при смещении на А* равно Срелняя потенциальная энергия по закону равномерного рас- распределения равна kT/2. Поэтому среднее изменение длины пру- пружины равно -. E8,3> Измерение массы т на весах возможно, если вызываемое ею растяжение пружины больше, чем флуктуация длины нити V(АхJ. Растяжение пружины грузом т равно Ах = ~^-. По- Поэтому предельно малая масса, которая может быть найдена при однократном измерении, равна к IГ.. у, YkTv. m~- К(ДхJ= ——• Газовый термометр. Предположим что мы измеряем" температуру с помощью газового термометра, наполненного идеальным газом. Температура, измеряемая термометром, не будет оставаться постоянной, а будет непрерывно испыты- испытывать флуктуации так же, как и другие термодинамические величины. В идеальном газе флуктуация температуры может быть- легко выражена через флуктуацию обьема. Из уравнения Кла- Клапейрона следует Nk где через AT и AV обозначены малые изменения температуры и объема. Если понимать под малыми изменениями объема из- изменения его вследствие флуктуации, го можно написать YTF ' r \ dV 1Т так что С помощью газового термометра нельзя измерять изменения температуры, меньшие, чем AT. Если термометр содержит всего
592 ТЕОРИЯ ФЛУКТУАЦИЯ [Гл. VHI К)-4 моля газа (т. е. объем его 0,02 л), то N=6- 1023-10'4 = = 6-1019, так что минимальное измеримое изменение темпера- температуры дгю1ог Оно является столь малым, что все реально измеряемые изме- изменения температуры чрезвычайно велики по сравнению с пре- пределом чувствительности. Таким образом, чувствительность газового термометра прак- практически не ограничивается изменениями температуры. Приве- Приведенные примеры показывают, что влияние флуктуации на чув- чувствительность приборов широко изменяется в зависимости от характера прибора. Мы не можем в рамках этой книги изложить теорию изме- измерения величин, лежащих ниже уровня шумов, и отсылаем чита- читателя к специальной литературе (см., например, Б. Р. Левин, Теоретические основы статистической радиотехники, т. II, «Сов, радио», 1968).
ГЛАВА IX СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ § 59. Большое каноническое распределение Гиббса Рассматривая в § 13 взаимодействие подсистемы с окру- окружающими ее телами (термостатом), мы предполагали, что это взаимодействие состоит только в обмене энергией. В действи- действительности, однако, очень часто взаимодействие подсистемы с окружением не сводится к одному обмену энергией, но вклю- включает также и обмен частицами. В процессе взаимодействия под- подсистема обменивается частицами с окружающей средой. Уходя- Уходящие и приходящие частицы несут с собой энергию, так что об- обмен энергией и частицами идет одновременно. В этом случае переменной является не только энергия, но число частиц, имею- имеющихся в системе. Для того чтобы характеризовать состояние си- системы, недостаточно указать полную энергию системы, но необходимо также указать, сколько частиц в ней содержится. Благодаря взаимодействию с окружением, выделенная подси- подсистема может побывать в различных квантовых состояниях, от- отличающихся при этом числом частиц, содержащихся в системе. Прежде чем перейти к выводу статистического распределения для этого случая, приведем некоторые примеры подсистем с пе- переменным числом частиц. Допустим, что наша подсистема представляет макроскопи- макроскопическую каплю или кристалл, находящийся в равновесии с паром или расплавом соответственно. Последние играют роль окруже- окружения (термостата). Молекулы с поверхности жидкости переходят в пар, а молекулы из пара конденсируются на поверхности жидкости. То же происходит с молекулами на поверхности кри- кристалла. Если систематического перехода частиц из пара в жидкость или обратно не происходит, то в системе установится состояние равновесия, при котором число частиц, переходящих в обоих направлениях, уравнивается. Другим примером системы с переменным числом частиц может послужить система, в которой происходит равновесная химическая реакция. В ходе химической реакции в выделенной 38 В. Г. Левич, том I
594 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX подсистеме (например, молекулах соединения АВ) число частиц изменяется: уменьшается за счет реакции распада АВ->-А+В и увеличивается за счет синтеза А + В^-АВ. В состоянии равновесия между подсистемой и термостатом идет непрерывный обмен энергией и частицами. Условиями рав- равновесия при обмене энергией служило равенство температур и давлений. Дополнительное условие равновесия при обмене ча- частицами будет найдено в дальнейшем. Перейдем к выводу статистического распределения системы с переменным числом частиц, т. е. распределения вероятностей WiV того, что подсистема находится в <-м состоянии и содержит при этом п частиц. Нахождение статистического распределения в этом случае отличается от рассмотренного в § 16 только тем, что число состояний подсистемы с данной энергией Q(et) нужна заменить на число состояний с данной энергией и данным чис- числом частип Qfe,-, n). Соответственно число состояний термостата будет йо(?о, No), причем сумма числа частиц в подсистеме и термостате остается постоянной, N = n + N(,=const. Тогда вместо формулы A6,5) получаем или вместо A6,7) Qo (Е - е„ N - п) = в" <*-<• w-n>. E9,1) Поскольку размеры подсистемы малы, ее энергия и число содержащихся в ней частиц малы по сравнению с энергией и числом частиц во всей замкнутой системе, е,<сЯ и n<g.N По- Поэтому, как и в § 16, мы можем разложить функцию — еи N—n) в ряд по степеням е,- и п и ограничиться первыми членами раз- разложения. Это дает , я), E9,2) или et-»n win «= const ¦ е 9 Q (еь п), E9,3) где символом const обозначена постоянная величина е^ N\ не зависящая от ег- и п\ через 0 по-прежнему обозначена статисти- ческая температура \-g?-J и
§ 59] БОЛЬШОЕ КАНОНИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ГИББСА 595 Производная в формуле E9,4) берется при постоянном значении энергии и внешних параметров. Молекулярный смысл величины ц. будет выяснен в следующем параграфе. Подчеркнем, что в отличие от 8, ц может иметь любой знак. Действительно, в формуле E9,5) суммирование ведется по ко- конечному числу частиц, в отличие от суммирования по бесконеч- бесконечному числу уровней в формуле A6,12). Значение постоянной может быть найдено из условия норми- нормирования: где суммирование ведется по всем энергетическим уровням и всем возможным числам частиц в системе. Очевидно, имеем цп-ег const- 2Не ° Q(e,t я)=1, i n поэтому const = ^г . E9,5) Искомое распределение вероятностей состояний системы с пе- переменным числом частиц можно окончательно записать в виде \in-et ! 6 Й (er n) E9,6) i n Формула E9,6) отличается от формулы A6,13) только тем, что вместо одной переменной, характеризующей состояние си- системы— энергии, в ней содержится две переменные — энергия Si и число частиц в системе п. Мы будем называть распределе- распределение вероятностей E9,6) большим каноническим распределением. Введем обозначение Z = е~~22е~*~ п(si, n). I п При постоянном числе частиц в системе п=п величина Z совпа- совпадает с обычной функцией состояний, 38*
596 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX С помощью 7j распределение вероятностей E9,6) можно записать в стандартном виде: Win- Число состояний системы Й(е,-, п) можно (в квазикласси- квазиклассическом приближении) выразить через объем фазового простран- пространства АГ по формуле A,26): О(е*. л)—рг, E9,7> где ДГП — объем фазового пространства системы, содержащей п частиц. Очевидно, что с изменением числа частиц изменяются число степеней свободы Зп и величина фазового объема: ДГ„=А<71 Aq2 ... Д<7зп Ар, Др2 ... Дрзп. E9,8> Тогда для вероятности того, что система находится в энергети- энергетическом состоянии, отвечающем элементу фазового объема dVnt и содержит п частиц, получаем Зная распределение вероятностей E9,6) или E9,9), можно находить средние значения всех величин, характеризующих со- состояние системы с переменным числом частиц. По общей формуле образования средних находим среднее значение любой величины L, зависящей от состояния подсистемы и числа частиц: \чг-г1 ~Т~0(в..*) цп_с< . E9,10) е й (егп) В частности, среднее значение числа частиц при произвольном значении энергии системы равно
§ 69] БОЛЬШОЕ КАНОНИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ГИББСА 597 В системе с переменным числом частиц Z естественно на- назвать функцией состояния или большой суммой (или интегра- интегралом) по состояниям. Удобно ввести величину г, именуемую активностью, равную по определению С помощью активности 2 можно представить в виде 2=2znZn, E9,12) n—l где Zn — статистическая сумма для п частиц. В классическом приближении можно написать дл И Рп цп-F V.N-F В следующем параграфе будет показано (см. формулу F0,4)), что [хЛ/ = Ф, где Ф — термодинамический потенциал Гиббса. Поэтому для Z находим Z = e» E9,13) или p = -y\nZ. E9,14) Аналогично E9,11) можно записать в виде Мы должны теперь перейти к установлению физического смысла параметра ц. В § 17 был выяснен физический смысл формально введенной величины 6 и было показано, что она представляет статистиче- статистическую температуру. Условием статистического равновесия ме- между квазинезависимыми подсистемами, могущими слабо взаи- взаимодействовать между собой и обмениваться энергией, служило равенство их температур. Замечательно то, что и формально введенная величина ц оказывается имеющей важный физиче- физический смысл, который можно выявить с помощью рассуждений, совершенно аналогичных рассуждениям § 17. Рассмотрим некоторую систему, находящуюся в состоянии статистического равновесия. Выделим из нее две подсистемы, также находящиеся в состоянии статистического равновесия и слабо взаимодействующие между собой. Это взаимодействие
¦598 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX состоит во взаимном обмене энергией и частицами между обеими подсистемами. Для каждой из них можно написать рас- распределение вероятностей состояний в виде w2= А2е е* Q2, где индексом 1 отмечены величины, относящиеся к первой, а индексом 2 — ко второй подсистеме. Поскольку подсистемы являются квазинезависимыми, к ним можно применять теорему умножения вероятностей, а для вероятности одновременного нахождения первой системы в i-м, а второй — в k-м состояниях можно написать wl2= WiW2 = Ахе e' A2e в< Q^. E9,16) С другой стороны, обе подсистемы вместе можно считать одной подсистемой с энергией, равной сумме (е<1 + еЛ2) и числом частиц, равным («i+пг)- Поскольку эта подсистема находится в состоянии равновесия, для нее также можно написать большое статистическое распределение в виде wl2=Ae ¦ 9 Q. E9,17) Если подсистемы находятся в равновесии друг с другом, то при установлении взаимодействия между ними их состояния не должны изменяться. Это означает, что должно остаться неиз- неизменным распределение вероятностей состояний в системе, обра- образованной из двух подсистем. Для этого необходимо, чтобы вы- выражения E9,16) и E9,17) были идентичны. Последнее условие требует, однако, выполнения равенств е = 9,=в2 E9,18) ц=т = Ц2- E9,19) Первое из них представляет хорошо знакомое условие равен- равенства температур во всех квазинезависимых подсистемах, входя- входящих в состав равновесной системы. Это условие было получено в § 17 для подсистем, взаимодействие между которыми своди- .лось к обмену энергией. Второе равенство является существенно новым. Оно показывает, что величина ц, относящаяся, как и 9, к термостату (см. § 17), в состоянии статистического равнове- равновесия должна иметь одинаковое значение во всех частях системы
§ 59] БОЛЬШОЕ КАНОНИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ГИББСА 599> Наряду с условиями постоянства температуры и давления постоянство ц является необходимым условием статистического равновесия в системе. Появление дополнительного условия рав- равновесия связано с тем, что мы рассматриваем теперь подси- подсистемы, могущие обмениваться между собой не только энергией, но и частицами. Мы будем называть величину ц статистическим парциаль- парциальным потенциалом термостата. В том случае, когда выделенная нами подсистема сама является макроскопической системой, условия равновесия позволяют относить jx к самой системе, а не к термостату. Действительно, в состоянии равновесия парциаль- парциальные потенциалы термостата и макроскопической подсистемы должны быть равны. Не имеет, однако, смысла говорить о пар- парциальном потенциале макроскопической подсистемы, например, молекулы. Напомним, что то же самое относилось и к статисти- статистической температуре 0. Она также представляет температуру термостата, но для макроскопической системы может быть ото- отождествлена с температурой последней. Нельзя, однако, гово- говорить о температуре отдельной молекулы. С точки зрения молекулярных представлений условие E9,18) выражает требование, чтобы количества энергии, отдаваемой и получаемой подсистемой, были равны друг другу. Условие- устанавливает, что при обмене частицами не только должны быть равны друг другу числа приходящих и уходящих из под- подсистемы частиц, но также равны и средние энергии, переноси- переносимые частицами. Если бы это было не так, например, если бы уходили только быстрые, а приходили только медленные ча- частицы, то состояние равновесия было бы нарушено. Очень важным и часто встречающимся случаем равновесия является равновесие в системе, находящейся во внешнем поле- сил. Если силы допускают потенциал, то энергию, отнесенную к одной молекуле, можно написать в виде е = ео + и(х, у, г). Соответственно химический потенциал системы приобретает- вид ц = цо+и(х, у, г), где величины с индексом «нуль» относятся к системе вне поля. Условие равновесия E9,19) приобретает при этом вид 1хо + и{х, у, z)=const. E9.20). Таким образом, во внешнем поле сил значение цо оказывается переменным от точки к точке.
flOO СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX § 60. Основное термодинамическое равенство и вычисление парциальных потенциалов Для выяснения термодинамических свойств системы с пере- переменным числом частиц необходимо прежде всего найти основ- основное термодинамическое равенство для таких систем. Последнее можно получить наиболее просто следующим образом. Поскольку величины, входящие в основное термодинамиче- термодинамическое равенство B4,5) —энергия, энтропия и объем, — обладают аддитивными свойствами, это равенство может быть написано не только для величин Е, а и V, но также и для удельных зна- значений этих величин, отнесенных к единице массы или к одной частице. Пусть в системе содержится N частиц. Тогда энергию, эн- энтропию и объем, приходящиеся на одну частицу, можно запи- записать в виде E/N, a/N и V/N. Записав основное термодинамиче- термодинамическое равенство для удельных величин, отнесенных к одной ча- частице, имеем Ш-<-«(?)¦ Совершенно очевидно, что последнее равенство будет иметь ме- место независимо от того, по какой причине изменяется удельное значение энергии и других величин — из-за изменения самих величин или из-за изменения числа частиц в системе. Поэтому в равенстве можно считать N переменной величиной и написать dE N откуда Обозначив получаем EdN N2 U N ?-9, dN , (E-Qo \ f я + pV N i/ dN v N2 pdV N F0,1) F0,2) Отсюда следует, что имеют место равенства v- F0>3) Сравнение формул F0,3) и E9,4) убеждает нас в тождествен- тождественности величины ц, определенной формулой F0,1), и парциаль- парциального потенциала. Первое из равенств F0,3) показывает, что ларциальныи потенциал равен производной от энергии по числу частиц. С точки зрения практического вычисления парциальных
§ 60] ВЫЧИСЛЕНИЕ ПАРЦИАЛЬНЫХ ПОТЕНЦИАЛОВ 601 потенциалов особенно важно равенство F0,1), которое показы- показывает, что парциальный потенциал ц представляет термодинами- термодинамический потенциал Гиббса, отнесенный к одной частице: . F0,4). Последнее оправдывает название парциального потенциала. Парциальный потенциал ц удобнее всего выражать как функ- функцию давления и температуры по формуле F0,4). Формула F0,2) представляет основное термодинамическое равенство, написанное для системы с переменным числом ча- частиц. Заметим еще, что, переходя в F0,2) от энергии к свободной энергии обычным способом, т. е. вычитая из обеих частей F0,2) дифференциал d(TS), можем написать dF=-SdT-pdV + \idN, F0,2') откуда HfL <60'3/> Полученные соотношения без труда могут быть обобщены на случай систем, содержащих частицы различных сортов. В даль- дальнейшем мы будем рассматривать статистические свойства си- систем с переменным числом частиц и нам понадобятся конкрет- конкретные выражения парциальных потенциалов. Они могут быть по- получены для газов и кристаллов. С помощью C7,11) находим для парциального потенциала идеального одноатомного газа ^ kT\np-~kTj, F0,5) где величина /, часто именуемая химической постоянной, равна Аналогично для двухатомного газа можно получить 7 0, F0,6) где химическая постоянная / и нулевая энергия ео равны '''
¦602 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX В случае кристаллов, по определению парциального потен- потенциала, имеем где F дается формулами E3,7) и E3,8), a v обозначает объем, приходящийся на одну частицу в кристалле. При низкой тем- температуре 7<Свс, *<kT (т\г, _. F0>7) Аналогично при высокой температуре, T^QC, H=~3kT\n^--kT + pv. F0,8) В последние формулы входит произведение ри, содержа- содержащееся в уравнении состояния кристалла, которое выражается через трудноизмеримые величины. Однако ввиду малости объе- объема v, приходящегося на одну частицу, в большинстве случаев можно опустить малое слагаемое pv. В заключение воспользуемся найденным значением пар- парциального потенциала для того, чтобы записать распределение Максвелла в форме распределения Гиббса с переменным числом частиц. Для этого выразим ц не через давление, а через объем системы. Получим откуда — (—L—X1' = JL eW V \ 2zimkT } h3 Подставляя это в распределение Максвелла (9,3), получаем <*л = е~мг-§-. F0,10) Заметим, что парциальный потенциал идеального газа — весьма большая отрицательная величина. Если газ находится во внешнем поле сил, то и вместо F0,10) можно написать распределение Максвелла — Больцмана dn = e «• ^. F0,11)
§ 61] УСЛОВИЯ РАВНОВЕСИЯ ФАЗ 603 § 61. Условия равновесия фаз Одним из наиболее важных случаев статистического равно- равновесия в системе с переменным числом частиц является случай фазового равновесия. Представим себе некоторую макроскопи- макроскопическую однородную квазизамкнутую систему, отделенную от остальных тел поверхностью раздела и находящуюся в состоя- состоянии равновесия. Такую систему мы будем называть фазой ве- вещества. Понятие фазы является обобщением и уточнением понятия агрегатного состояния вещества. В качестве примера фазы можно указать пар, находящийся в равновесии со своим кон- конденсатом; в этом случае через границу раздела пар — жидкость или пар — твердое тело происходит обмен энергией и частицами между паром и его окружением — термостатом. Другими при- примерами могут служить: кристалл, находящийся в равновесии со своим расплавом; одна кристаллическая модификация, нахо- находящаяся в равновесии с другой; электронный газ в вакууме, находящийся в равновесии с электронным газом в металле. В дальнейшем мы приведем примеры других, более сложных фазовых равновесий. Во всех случаях фазового равновесия характерным является существование поверхности раздела между разными фазами. В состоянии статистического равновесия число частиц, перехо- переходящих из одной фазы в другую, и переносимая ими энергия в точности равны соответствующим величинам, переходящим в обратном направлении. Если бы не существовало границы раз- раздела, резко разделяющей фазы, не имело бы смысла говорить об особой квазизамкнутой подсистеме как о фазе. Поясним это на примере. Представим себе, что две фазы, представляющие одно- однородные изотропные состояния вещества, находятся в равновесии, соприкасаясь по некоторой поверхности раздела. Тогда менее плотную фазу мы назовем паровой, или газовой, более плот- плотную— жидкой. Если же перед нами имеется одна однородная система, то, как это подробно будет пояснено в § 64, понятие жид- жидкости или газа к ней неприменимо: изменяя физические условия, в которых находится система, можно непрерывным образом пе- переводить ее из состояния с большой плотностью в состояние с малой плотностью. Состояние с большой плотностью нельзя на- называть жидкостью, а состояние с меньшей плотностью — газом. Оба они представляют случаи однородного состояния вещества. Таким образом, наличие границы раздела между фазами яв- является необходимым условием для того, чтобы можно было го- говорить о существовании фаз и фазовых равновесиях. Напишем условие статистического равновесия между фа- фазами, ограничившись вначале случаем двух фаз одного вещества.
604 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл< IX Каждую из фаз можно рассматривать как квазизамкнутую подсистему, а их совокупность — как замкнутую систему, нахо- находящуюся в состоянии статистического равновесия. Поэтому условия равновесия между двумя фазами можно написать в виде E9,14) и E9,15): Tt = T2> F1,1) Г). F1,2) Кроме этих условий, необходимо потребовать, чтобы силы, действующие на границу раздела со стороны обеих равновесных фаз, были равны между собой. В противном случае граница раз- раздела между фазами пришла бы в движение и равновесие в си- системе было бы нарушено. Условие механического равновесия удобно отнести к единице поверхности раздела, заменив силы давлениями. Таким обра- образом, к условиям равенства температур и парциальных потен- потенциалов следует добавить условие равенства давлений в обеих фазах. Это простое рассуждение можно строго обосновать, рас- рассмотрев условие механического равновесия, которым служит требование минимума свободной энергии замкнутой системы при 5" = const и \х = const. Условие механического равновесия в системе, состоящей из двух фаз, при r=const можно написать в виде dF = dFi + dFz = — pvdVi — p2dV2 = 0. Поскольку объем всей системы остается неизменным, dVi = — dV2 и Pi = Pi. F1,3) Таким образом, давления в обеих фазах должны быть равны между собой. С учетом условий F1,1) и F1,3) формулу F1,2) можно записать в виде (xi (Р- Т)~МР, Т). F1,4) Поскольку в состоянии равновесия Тир имеют равные зна- значения в обеих фазах, из уравнения F1,4) можно выразить одну из этих величин через другую. Пусть в результате этого у нас получится уравнение (Т) F1,5) для зависимости равновесного давления от равновесной темпе- температуры. Уравнение F1,5) представляет на плоскости (р, Т) некоторую кривую, называемую кривой фазового равновесия. Все точки этой кривой отвечают соприкосновению равновесных фаз. При давлениях больших и меньших, чем равновесное при
§ 62] УРАВНЕНИЕ КРИВОЙ ФАЗОВОГО РАВНОВЕСИЯ 605 данной температуре, устойчивой является одна из фаз: именно та, у которой меньше термодинамический потенциал. Если, на- например, одной из фаз является жидкость, а второй — ее пар, область на (р, Т) -плоскости, лежащая выше кривой, отвечает жидкой фазе, область ниже кривой соответствует газовой фазе. Вдоль линии происходит равновесный фазовый переход жид- жидкость— пар. Соответственно при равновесии кристалл — расплав кри- кристаллической фазе отвечает область выше кривой фазового рав- равновесия ab, на кривой лежат точки плавления, ниже кривой устойчивой фазой является жидкость. При фазовом переходе происходит выделение или поглощение скрытого тепла. Скры- Скрытая теплота при переходе одной молекулы из одной фазы в другую равна (поскольку процесс является равновесным и обратимым) где s — энтропия, отнесенная к одной молекуле. Так как при фазовом переходе температура постоянна, ее можно вынести за знак интеграла и написать / = Т As = T(s2 — si). Таким образом, скрытая теплота фазового перехода равна разности энтропии, умноженной на температуру перехода. Скрытое тепло считается положительным, если при фазовом переходе тепло поглощается. Выделяющееся скрытое тепло счи- считается отрицательным. § 62, Уравнение кривой фазового равновесия Зависимость парциального потенциала от температуры и давления известна лишь для немногих простых систем. В боль- большинстве случаев конкретный вид функции ц(р, Т) неизвестен. Поэтому уравнение кривой равновесия F1,5) невозможно напи- написать в явном виде. Оказывается, однако, что дифференциальное уравнение кривой равновесия имеет более простой вид и со- содержит лишь легко измеримые величины. Для получения дифференциального уравнения кривой равно~ весия продифференцируем условие F1,4). Имеем F2,1) или dp р^ дТ * др р* дТ
506 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX Из формулы F2,2) находим тангенс угла наклона кривой рав- равновесия %~ f f . F2,3) dp dp Уравнение F2,3) и является искомым дифференциальным уравнением кривой равновесия. Для приведения его к оконча- окончательному виду необходимо выразить стоящие в нем величины через непосредственно измеряемые. Согласно B9,10) и B9,11) имеем с дФ и _ дФ Ъ~ dT ' V ~ dp ' поэтому где N — число частиц. Подставляя это в F2,3), находим dp_ = Sj-S2 ,g2 5y Заменяя разность энтропии теплом перехода /, получим ie. F2 6> Формулу F2,6) обычно относят к одному молю газообразной фазы. Обозначая скрытую теплоту фазового перехода одного моля вещества IN через L и изменение молярного объема через AV, окончательно находим dp dT dT T AV * Формула F2,6) носит название уравнения Клапейрона — Клау- зиуса. Формула Клапейрона — Клаузиуса связывает измене- изменение равновесного давления р при бесконечно малом изме- изменении равновесной температуры Т с непосредственно измеряе- измеряемыми величинами. Ее обсуждение для конкретных случаев фазового равновесия будет проведено в последующих пара- параграфах. Нетрудно видеть, что если фазовый переход происходит при повышении температуры, то скрытое тепло всегда поглощается, т. е. L > 0. Действительно, L = Г (S2 - 5,) = NT (^ - ^). F2,8)
¦§ 62] УРАВНЕНИЕ КРИВОЙ ФАЗОВОГО РАВНОВЕСИЯ 607 Характер температурного хода парциальных потенциалов при фазовом переходе, происходящем с повышением температуры, представлен на рис. 66. До точки 1 устойчивой фазой является первая фаза, парциальный потенциал щ которой меньше потен- потенциала второй фазы р.2. После точки / имеет место обратное положение. В самой точке / имеет место равновесие фаз, в ней парциальные потенциалы обеих фаз равны между собой; ее ордината представляет температуру фазового перехода (при данном давлении). Из рис. 66 видно, что в точке / тангенс угла наклона кривой jii должен быть больше, чем тангенс угла наклона кривой цг- В противном случае выше этой точки (u,i не станет больше, чем Ц2- Поэтому в точке 1 имеем ОТ ^ дГ ' Тогда из формулы F2,8) следует, что Рис 66. если фазовый переход происходит при повышении температуры, его скрытая теплота всегда положи- положительна. Численное значение последней не может быть найдено теоретически, поскольку она выражается через энтропии фаз, а явный вид этих функций в большинстве случаев неизвестен. Доказанная теорема позволяет установить знак температур- температурного коэффициента равновесного давления dp/dT для различных фазовых переходов. Если фазовый переход происходит с повы- повышением температуры (плавление, кипение, сублимация), так что L положительно, то согласно формуле Клапейрона — Клау- зиуса знак dp/dT определяется знаком величины AV — измене- изменения объема при фазовом переходе. При испарении и сублима- сублимации объем фазы резко возрастает, так что всегда ДУ>0. Поэтому для этих фазовых переходов dpjdT также положи- положительно, т. е. равновесное давление растет с повышением темпе- температуры или, наоборот, равновесная температура растет с повы- повышением давления. При понижении давления температура точки кипения и сублимации понижается. Такая связь между равно- равновесным давлением и равновесной температурой находится в согласии с хорошо известными экспериментальными фактами (повышение температуры кипения в котлах высокого давления, понижение температуры кипения с высотой и т. п.). При плавлении встречаются два случая: когда AV поло- положительно, так что плотность жидкой фазы меньше плотности твердой фазы, и когда AV отрицательно, и более плотной яв- является жидкая фаза. Для тел первого типа -^>0. так что тем- температура плавления повышается с ростом давления.
608 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX Число тел более плотных в жидкой фазе сравнительно не- невелико. К ним относятся прежде всего вода, чугун, висмут, а также ряд сплавов. У этих тел -rpf<Q, т. е. температура плав- плавления падает с повышением давления. Эта особенность плавле- плавления льда и других веществ также широко известна. Интересно отметить, что вблизи абсолютного нуля темпера- температурный коэффициент dpfdT стремится к нулю, так что равно* весное давление в точке плавления перестает зависеть от тем- температуры. Действительно, из третьего начала термодинамики следует, что при Т-*0 изменение энтропии при плавлении AS-+0. Следовательно, обращается в нуль скрытая теплота плавления, а с ней в силу F2,6) и dp/dT. Такой ход зависимо- зависимости dpIdT от температуры действительно имеет место для жидкого гелия II, являющегося устой- Гелий чивой фазой при Г->0 при давлениях ниже 30 атм. При давлениях выше ~30 атм устойчивой фазой является твердый гелий. Кривая фазового равновесия (твердый гелий ч=ь жидкий гелий II) идет почти горизонтально; ее угловой коэффициент -jf--*0 при 9 10 2,0 3.0 WT,'K T-+Q (рис. 67). Рис. 67. Как мы уже указывали, найти явный вид кривой равновесия в об- общем случае нельзя. Если из опытных данных известна зависи- зависимость скрытой теплоты перехода и изменения молярного объема от температуры и давления, то уравнение Клапейрона — Клаузиуса может быть проинтегрировано. При этом находится зависимость равновесного давления фазового перехода от тем- температуры, т. е. форма кривой равновесия. Зависимость указан- указанных величин от температуры и давления является обычно слож- сложной, и интегрирование производится численно. Положение существенно упрощается, если одной из равновесных фаз яв- является пар, т. е. в случае кипения или возгонки (сублимации). В случае равновесия между конденсированной фазой и паром можно считать, что молярный объем пара значительно больше, чем молярные объемы конденсированной фазы — жидкости или кристалла. Поэтому изменение объема при фазовом переходе можно приравнять объему газовой фазы (отнесенному к соот- соответствующему числу частиц): Д V = Vпар — V конд. фаза ~ ' пар- При этом уравнение Клапейрона — Клаузиуса принимает ¦ ¦ i
§ 62] УРАВНЕНИЕ КРИВОЙ ФАЗОВОГО РАВНОВЕСИЯ 609 Если пар, находящийся в равновесии с конденсированной фазой, является достаточно разреженным, так что его можно считать идеальным газом, то Va^ = ^f-. F2,10) Заметим, что это предположение выполняется с достаточной сте- степенью точности только при сравнительно низких температурах. Подставляя F2,10) в F2,9), имеем 7 = 1^ F211) Зависимость L от температуры может быть найдена с помощью приема, совершенно аналогичного тому, который применялся при выводе уравнения Клапейрона — Клаузиуса. Дифференцируя L по Г, имеем или i aT dJ, -1- или, с учетом F2,9) и F2,10), dL Г AS <?]/п Таким образом, скрытая теплота перехода при некоторой тем- температуре Т равна Г \ F2,12) где Lo — скрытая теплота при 7 = 0. Последняя величина пред- представляет ту работу, которую нужно произвести при абсолютном нуле для того, чтобы разорвать связи, существующие между молекулами в конденсированной фазе, и превратить их в не- невзаимодействующие молекулы. При этом скрытая теплота пере хода из конденсированной фазы в газ приобретает особенно ясный смысл: она равна работе, затрачиваемой на преодоление связей, плюс та энергия, которую нужно сообщить системе для того, чтобы компенсировать различие в энергиях теплового дви- движения в конденсированной фазе и газе. Подставляя формулу F2,12) в F2,11), имеем т р ЗЭ В. Г. Левин, том 1 L»dT л- dT Г (\г } нт NkT1 ^~ NkT* J U"Vai-
«510 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ 1Гл. IX Интегрируя, получаем или где i — некоторая постоянная, именуемая обычно постоянной упругости пара. Формула F2,13) показывает, что давление равновесного насыщенного пара быстро уменьшается с понижением темпе- температуры. В случае испарения основная часть скрытой теплоты пере- перехода обычно отвечает первому члену в F2,12). Поэтому фор- формулу F2,13) часто приближенно записывают в виде F2,14) В формулу F2,13) входит неизвестная постоянная упругости пара i, скрытая теплота перехода при абсолютном нуле La и разность теплоемкостей обеих равновесных фаз. С помощью статистических методов можно получить значе- значение всех этих величин, кроме Lo, расчетным путем, если только конденсированной фазой является кристалл. Малость давления насыщенного пара позволяет считать пар идеальным газом и пользоваться парциальным потенциалом, определенным фор- формулой F0,5). Приравнивая парциальные потенциалы газа (для простоты формул— одноатомного) и кристалла, мы получим уравнение кривой возгонки. При этом мы выберем начало отсчета энергий так, чтобы энергия неподвижной молекулы, находящейся в газе, была равна нулю. Энергия молекулы в кристалле, отсчитывае- отсчитываемая от этого уровня, отрицательна (поскольку молекула яв- является связанной в кристаллической решетке) и будет обозна- обозначена через ео = — -^-. Очевидно, го равна работе, которую нужно затратить при абсолютном нуле для того, чтобы оторвать молекулу от се соседей в кристаллической решетке и перевести ее в газовую фазу, в которой она также будет покоиться. Таким образом, (—ео) представляет теплоту возгонки при абсолютном нуле, от- отнесенную к одной молекуле и взятую с обратным знаком. При- Приравнивая (хгаа и ць-рнст, находим условия равновесия в системе.
§62] УРАВНЕНИЕ КРИВОЙ ФАЗОВОГО РАВНОВЕСИЯ 611 (кристалл *г газ) при низкой температуре: или P = (kTL'e NkT 5VeJ eJ. F2,16) Основным членом в F2,16) является член, содержащий скры- скрытую теплоту перехода при абсолютном нуле. Сопоставим формулу F2,16) с общей формулой F2,13). Для этого мы должны вычислить двойной интеграл в F2,13). Ис- Используя для Сркрцсх его значение по формуле E3,2) имеем ^Ьр— Ь р Крист И Т Т' Т Т' [ Г -Ink l2n'Nk ( Г Y <- р газ — 2 " 5 V 9<г / f ,„ ,гг„ [ dV Г Г 5 ... 12гс4 *1 ACpdT }1 lNk J Г^З 5 9CV 2 5 VeJ V Подставляя F2,17) в общее выражение для давления F2,13), получаем выражение, совпадающее с F2,16), если только поло- положить постоянную г, входящую в F2,13), равной химической по- постоянной /. Таким образом, с помощью статистических соображе- соображений можно вычислить постоянную давления насыщенного пара. Формула F2,16) находится в хорошем количественном со- согласии с экспериментом. Совершенно таким же образом можно получить кривую рав- равновесия при высоких температурах. Приравнивая парциальные потенциалы F0,5) и F0,8), на- находим lnp=-^\nkT + i + ^r~3kT\n^--l. F2,18) Тот же результат может быть получен и из обшей формулы F2,14). Следует заметить, что, как видно из F2,16), давление на- насыщенного пара очень быстро повышается с ростом темпера- температуры. Если характеристическая температура 0с кристалла срав- сравнительно велика, так что условие 7С§> 9П выполнено при высо- высокой температуре, то соответствующая плотность насыщенною пара будет слишком большой для того, чтобы пар можно было считать идеальным газом. 39я
612 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX В этом случае в формуле F2,16) нужно пользоваться пар- парциальным потенциалом для ван-дер-ваальсова газа. На прак- практике чаще пользуются эмпирическими формулами для кривой упругости пара. На приведенном примере полезно провести сравнение прак- практических возможностей термодинамического и статистического методов. Термодинамическим методом нами была получена формула F2,14), обладающая большой общностью и устанавливающая равновесное давление пара над любой конденсированной фазой. Однако в эту общую формулу вошли величины, числовое зна- значение которых могло быть определено только из опыта. Статистическим методом выражение для давления пара было получено при сильных ограничивающих допущениях, но в этих рамках были получены количественные значения и вы- выяснен молекулярный смысл всех величин. § 63. Теория фазовых переходов*) До сих пор мы ограничивались термодинамическими рас- рассуждениями, принимая как опытный факт существование фаз и возможность фазовых переходов. Теперь мы должны обсудить явления фазовых переходов со статистической точки зрения. Фазовый переход всегда связан с разрывом непрерывности некоторых термодинамических ве- величин. В рассмотренном выше примере фазового перехода, но- носящего наименование фазового перехода 1-го рода, термодина- термодинамические потенциалы фаз остаются непрерывными, а их энтропия „ С dF \ ., л V I / dF \ S = — \~gf\ и удельный объем у = -^= — -тг I-у—I испытывают конечный скачок. Наряду с фазовыми переходами 1-го рода существуют так называемые переходы 2-го рода, при которых терпят разрыв вторые производные термодинамических потенциалов — тепло- -тг=г) и коэффициент теплового расширения <t= рчит") ' скачко°бРазно изменяясь на величины ДсриДа. С многочисленными примерами фазовых переходов второго рода мы будем сталкиваться в дальнейшем (см. § 20 гл. IV и § 21 ч. IV). Необходимо подчеркнуть, что самый факт суще- существования фазовых переходов, с точки зрения статистической физики, представляется довольно неожиданным. Казалось бы, *) В изложении этого параграфа мы следуем книге К. Хуанга «Статисти- «Статистическая механика», ИЛ, 1962. За деталями теории отсылаем читателя к этой книге и оригинальным работам Янга и'Ли, Phys. Rev. 87, 410 A952).
<$ 63] ТЕОРИЯ ФАЗОВЫХ ПЕРЕХОДОВ 613 что статистическая сумма (или интеграл) определяет термоди- термодинамические потенциалы как непрерывные функции параметров, характеризующих состояние систем (температуры и объема). Действительно, напишем уравнение состояния фазы си- системы с заданным числом частиц N, занимающей объем V. Из E9,14) и E9,15) с учетом E9,12) следует, что nZn(V,T,n), F3,1) 1 _ N _ kT dlnZ I ain(S z"Zn(V, Т, п) др v V V дц ~ V д\аг ~ д In z ' ^ ' ' Исключая z из F3,1) и F3,2), можно найти зависимость /(/>, -гт , т), т. е. уравнение состояния. Если принять закон взаимодействия между молекулами в виде D6,2) и считать объем фазы имеющим конечное фиксированное значение V, то в Zn можно выполнить интегрирование по импульсам и напи- написать (в классическом приближении) Zl 2nmkT \% 1 Г г~— ,., „. ,„о оч « = \—ЙГ~) 7ГТ J е aVi... dVn. F3,3) Очевидно, что все статистические интегралы Zn являются су- существенно положительными величинами, зависящими от объе- объема Vn и температуры Т как от параметров. Распишем подроб- подробнее выражение для Z: N Z = 2 znZn = ZlZ + Z2z2+ ... + ZNzN. F3,4) Большая статистическая сумма 2 является полиномом W-й сте- степени относительно z с существенно положительными коэффи- коэффициентами. Поэтому Z является монотонно растущей функцией активности z. В силу непрерывности функции Zn(V,T,n) она также является непрерывной функцией температуры и объема (или плотности р — N/V). Из вида функции Z и формулы F3,1) видно, что p(z) яв- является монотонно растущей функцией активности г, как это изображено на рис. 68, а. Обратный удельный объем 1/у, в силу F3,2), также является монотонно растущей функцией z (рис. 68,6). Согласно формуле E7,7) необходимым условием устойчивого существования всякой фазы является требование 1-дМ <0, т. е. требование монотонного убывания давления с ростом объема (приходящегося на одну частицу). Поэтому кривая p(v) имеет вид, представленный на рис. 68, в.
614 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ (Гл. IX Мы видим, что давление является монотонной функцией объема (при данной температуре) и никакой тенденции к по- появлению разрывов на кривой, выражающей уравнение состоя- состояния произвольной фазы, не обнаруживается. Если, однако, функ- функция Z обратится в нуль, то согласно F3,1) и F3,2) давление р РМ б) Рис. 68. в) и объем и станут неопределенными и наши рассуждения поте- потеряют свою силу. Поэтому необходимо более детально обсудить поведение Z как функции активности г и объема v. Само существование фазовых переходов (разрывов в термо- термодинамических величинах) связано с поведением системы при Z-*Q, где функции р и v имеют особенности. Для того чтобы найти значения, при которых большая ста- статистическая сумма Z обращается в нуль, необходимо знать ее явное выражение как функцию z и V. Для реальных систем нахождение большой статистической суммы является до на- настоящего времени неосуществимой задачей. Оказывается, однако, что в предельном случае, когда число частиц в системе N и ее объем V неограниченно возрастают Л1 -> оо, К->оо, но так, что удельный объем и остается огра- ограниченным v-^.0, можно определить поведение Z(z, V), не опре- определив ее явного вида. При этом можно показать, что из пове- поведения Z{z) вытекает возможность существования фазовых пере- переходов. Запишем выражение F3,4) в виде Z(z, V, Т) = Д (г - zt), F3,5) где Zi — корни полинома F3,4). Поскольку все коэффициенты полинома F3,4) положительны, корни zt не могут быть поло- положительными: они либо отрицательны, либо попарно комплекс- комплексно-сопряженные величины, либо равны нулю. Хотя реальный смысл имеют только положительные и в край- крайнем случае нулевые значения z, с математической точки зрения удобно ввести в рассмотрение комплексные величины z и рас- рассматривать функцию комплексного переменного Z{z), Перейдем
631 ТЕОРИЯ ФАЗОВЫХ ПЕРЕХОДОВ 615 лри этом в формулах F3,1), F3,2) и F3,5) к пределу, написав р = kT lim \\r In Z (г, V, Т)}, F3,6) У-*оо I V I 1 д In 2 (г, V, Т) 1 Z(z,V,T)= lim Ц(г-2(). ЛГ->оо ( = 1 F3,7) F3,8) Число корней Zi при этом неограниченно возрастает, и они рас- располагаются на комплексной плоскости. Математическое иссле- исследование, проведенное Янгом и Ли, показало, что пределы в формулах F3,6) и F3,7) существуют, и при V—*оо функция 1 V In Z и является аналити- аналитической функцией 2 в некото- некоторых областях R комплекс- комплексного переменного, включая и действительную ось, не * содержащих нулей zt. Это означает, что при всех значениях z в этих областях в системе с V-voo давление не имеет особен- особенностей (т. е. фазовых переходов нет). На рис. 69 эти области обозначены через R\ и R2. Нули zt обозначены точками. Однако, в отличие от системы с конечным значением Л' (конечным числом нулей), в системе с N~*oo и V—»оо число нулей z неограниченно велико. Поэтому они, заполняя плос- плоскость комплексного переменного, могут в некоторых точках •Нули функции г Рис. 69. 1 1 1 1 а 1 х 1 aj б) Рис. 70. приближаться как угодно близко к действительной оси. Пусть г0 — такая точка на действительной оси (рис. 69). В как угодно малой окрестности точки z0 находится нуль функции Z. По- Поскольку давление p(v) является аналитической функцией в точке z = го, оно должно оставаться непрерывным (рис. 70,а).
616 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. ГХ Однако обратный удельный объем 1/у, который согласно F3,2V является производной от давления, в точке го может испыты- испытывать разрыв din г ^- = Л dim' Если такой разрыв имеет место, как это показано на рис. 70,6, то уравнение состояния (зависимость p{v)) приобретает вид, показанный на рис. 70, в. Это — типичная кривая фазового пе- перехода первого рода. При изменении удельного объема от Vi> до va давление остается неизменным. Разрыв в производной, согласно сказанному, является возможным, но не обязатель- обязательным. Если, однако, давление и его первая производная непре- непрерывны при z = г0, то может испытывать разрыв вторая произ- производная давления -^. В этом случае на кривой 1/и(г) возникает P(Z) IFTz) P(v) а) ч Рис. 71. В) излом, как это показано на рис. 71,6. Соответственно уравнение состояния будет иметь вид, представленный на рис. 7\,в. Такая кривая характерна для фазовых переходов 2-го рода. Необходимо подчеркнуть, что изложенная теория указывает на возможность фазовых переходов, но не позволяет установить. ни положение точек фазового перехода, ни характер самого пе- перехода. Существование изолированных точек г0 также не доказано. Поэтому существенно то обстоятельство, что для простейшей двумерной решетки, состоящей из частиц, могущих находиться в двух состояниях (так называемая модель Изинга), удалось вычислить статистическую сумму в явном виде. Это вычисление слишком громоздко и не может быть здесь приведено. Оказа- Оказалось, что в такой решетке обнаруживается фазовый переход, причем именно такого типа (с изолированной точкой го), как это предполагалось выше.
«§ 64] КРИВЫЕ ФАЗОВОГО РАВНОВЕСИЯ 617 § 64. Кривые фазового равновесия Кривая фазового равновесия, т. е. кривая зависимости рав- равновесного давления р от равновесной температуры Т на плос- плоскости (р,Т), имеет различный вид для разных фазовых равно- равновесий. Как мы уже указывали, общий вид кривой нельзя опре- определить теоретически. Можно лишь высказать одно общее соображение по поводу этой кривой. Рассматривая вопрос о взаимоотношении между жидкостью и газом (§ 48), мы имели уже возможность указать на отсут- отсутствие принципиальной разницы между этими состояниями ве- вещества. Имеющиеся качественные отличия между жидкостью и .газом связаны с различной ролью взаимодействия между ато- атомами. При понижении температуры или увеличении плотности газа среднее расстояние между атомами уменьшается. Это со- соответствует уменьшению средней длины свободного пробега и ¦относительному увеличению средней энергии взаимодействия (по сравнению с kT). При известных условиях термодинамиче- термодинамический потенциал системы со свободно движущимися, разделен- разделенными значительными расстояниями частицами (газ) оказы- оказывается выше потенциала системы, в которой молекулы нахо- находятся на малых расстояниях (жидкость). В этот момент происходит фазовый переход (конденсация). Хаотическое сво- свободное движение молекул, характерное для газа, превращается в беспорядочное метание отдельных молекул в «клетке», обра- образованной их ближайшими соседями. Хотя движение атомов в газе очень заметно отличается от движения в жидкости, это раз- различие имеет скорее количественный характер и, во всяком слу- случае, не отличается по своей природе: в обоих случаях движение имеет совершенно хаотический характер. Из этого следует, что лри известных условиях переход от хаотического движения при малых плотностях к хаотическому движению при больших плот- плотностях может происходить постепенно, без скачка в точке кон- конденсации. Иными словами, при некотором способе изменения лараметров (р, V и Т) можно добиться непрерывного перехода из жидкого в газообразное состояние и обратно, при котором ¦отсутствует скачкообразный фазовый переход, связанный с по- поглощением или выделением скрытого тепла. Возможность непрерывного перехода между жидким и га- газообразным состояниями налагает существенное ограничение на характер кривой равновесия фаз жидкость — газ. Именно, непрерывный переход между жидкой и газообразной фазами возможен только в том случае, если кривая фазового равнове- равновесия р(Т) оканчивается в некоторой точке К (рис 72), именуе- именуемой критической (точкой абсолютного кипения, по Менде- Менделееву).
618 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX Пусть рк и Гк — давление и температура в критической точке, называемые критическим давлением и критической тем- температурой. При всех значениях р и Т, лежащих ниже рк и Гк> переход из жидкости в газ и обратно происходит с пересече- пересечением кривой равновесия фаз. На самой кривой обе фазы нахо- находятся в равновесии друг с другом, соприкасаясь по некоторой поверхности раздела. Выше точки К имеется однородное состоя- „ ,_.N ние вещества, в котором не существует каких-либо поверхностей раздела. Оно часто именуется закритическим. Од- Однородное состояние вещества может иметь и большую и малую плотности,, в зависимости от температуры и да- давления. Не имеет, однако, смысла на- ~r*~ T зывать вещество выше критической точки жидкостью или газом. Рис- 72- Переход из точки / (жидкость) & точку 2 (газ) может совершаться как по пути, изображенному сплошной линией, так и по нуги, изображенному пунктиром (рис. 72). На первом пути про- происходит пересечение кривой фазового равновесия, так что переход сопровождается выделением или поглощением скры- скрытого тепла. На втором пути переход происходит через закритическое состояние и происходит непрерывно, без скачкообразного изме- изменения характера движения и без выделения или поглощения скрытого тепла. Возможность непрерывного перехода из жидкого в газообразное состояние показывает всю условность терминов «жидкость» и «газ». Строго говоря, пользоваться терминами «жидкость» и «газ» можно только тогда, когда они существуют одновременно и со- соприкасаются друг с другом по некоторой поверхности раздела, т. е. являются фазами. Найдем условия, определяюгцие положение критической точ- точки на (р, Т)-плоскости. Поскольку она лежит на кривой фазо- фазового равновесия, в ней выполняются условия равновесия, в част- частности условия где Ар и AT — разность давлений и температур в фазах. Вблизи критической точки разница между обеими фазами становится малой, а в самой критической точке вовсе исчезает. В частности, вблизи критической точки плотности обеих фяз близки друг к другу. В отличие от точек, лежащих вдали or
$ 64] КРИВЫЕ ФАЗОВОГО РАВНОВЕСИЯ 619 критической, здесь изменение плотности при фазовом переходе очень мало. Если обозначить разность плотностей фаз через Др, то всегда можно написать формальное разложение: В силу условия фазового равновесия сумма этого ряда равна нулю. Вблизи критической точки разложение упрощается. До- Достаточно близко к критической точке можно считать величину Др бесконечно малой. В разложении F4,1) можно опустить старшие члены разложения и написать )гДр = 0. F4,2) Поскольку Др — произвольная бесконечно малая величина, из F4,2) вытекает, что Производная в F4,3) берется в критической точке. Таким образом, в критической точке ?),-(#),-«• <«•<> Если величина -—¦ обращается в нуль, то для устойчи- устойчивости вещества необходимо, чтобы одновременно выполнялось условие В противном случае флуктуации объема, как мы выяснили в § 57, были бы бесконечно велики. Условия F4,3) и F4,4) определяют положение критической точки. Они совпадают с ши- широкоизвестными условиями для точки перегиба на кривой Ван- дер-Ваальса. Вблизи критической точки вещество обладает рядом замеча- замечательных свойств. Разница в свойствах жидкой и газообразной фазы постепенно уменьшается и исчезает в самой критической точке. Можно показать1), что вблизи критической точки плот- плотности обеих фаз зависят от температуры по закону: р = Рк ± V const (Т - Тк), ') Л. Д. Ландау и Е. М Лифшиц, Статистическая физика, Гос- «ехиздат, 1951.
620 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX где знак плюс относится к жидкости, а знак минус — к газу. В критической точке скрытое тепло перехода обращается в нуль, а теплоемкость Ср — в бесконечность. Поверхностное на- натяжение на границе раздела жидкость — газ также обращается- в нуль в критической точке. Обращение в бесконечность сжи- сжимаемости в критической точке приводит к существенному умень- уменьшению работы сжатия или расширения некоторого элемента- объема в системе вблизи критической точки. Иной характер имеют переходы из кристаллического состоя- состояния в изотропное. Под изотропным состоянием мы понимаем со- совокупность аморфного, жидкого или газообразного состоянии. В этом случае происходит переход из состояния упорядоченного- движения в состояние хаотического движения. Упорядоченному движению атомов (или ионов) в кристалле отвечает нахождение- атомов вблизи узлов кристаллической решетки и связанная с этим правильным расположением определенная симметрия кри- кристалла. При повышении температуры происходит некоторое уве- увеличение амплитуды колебаний атомов в узлах решетки и возра- возрастает число нарушений правильности решетки, но общий упоря- упорядоченный характер движения, симметрия решетки, сохраняются вплоть до самой точки плавления (или возгонки). В точке плавле- плавления происходит катастрофическое разрушение решетки, симмет- симметрия исчезает и упорядоченное движение заменяется хаотическим. Процесс плавления оказывается растянутым по шкале темпера- температур всего на доли градуса из-за влияния всякого рода примесей. В отличие от переходов между различными изотропными фазами непрерывный переход между кристаллом и одной из, изотропных фаз невозможен. Невозможность непрерывных пе- переходов связана с принципиальной разницей в характере дви- движения в этих фазах. Это видно также из соображений симмет- симметрии. Невозможно непрерывным образом перевести бесконечно симметричное (изотропное) тело в тело с вполне определенной конечной симметрией. То же самое относится к фазовым пере- переходам между различными кристаллическими модификациями. Каждая из модификаций обладает вполне определенным упо- упорядоченным движением атомов и отвечающей этому движению симметрией. При фазовом переходе изменение характера дви- движения и симметрии кристалла происходит обязательно скач- скачком. Благодаря этому кривая равновесия фаз кристалл 5=? изо- изотропная фаза или кристалл з=? кристалл но может иметь точки окончания и должна уходить на бесконечность. Переход из. одной фазы в другую всегда связан с пересечением кривой рав- равновесия и имеет скачкообразный характер1). ') Подробнее о фазовых переходах см. В. Г. Л е в и ч, Введение и ста- статистическую физику, Гостехиздат, 1954, § 76, и, особенно полно, Л. Д. Л а н- дау и Е, М. Л и ф ш и ц, Статистическая физика, Гостехиздат, 1951.
§ 65] ПОВЕРХНОСТНОЕ НАТЯЖЕНИЕ 621 § 65. Поверхностное натяжение и поверхностное давление До сих пор мы рассматривали равновесие соприкасающихся фаз, не учитывая особых свойств поверхности раздела и их влияния на равновесие. Если, однако, фазы, находящиеся в равновесии, обладают развитой поверхностью, то полное пре- пренебрежение поверхностными эффектами может внести суще- ственную погрешность в произведенные расчеты. В этом пара- параграфе мы учтем влияние поверхности на равновесие фаз. Молекулы, расположенные в тонком слое, непосредственно прилегающем к поверхности раздела, находятся в условиях, от- отличных от условий у молекул, находящихся в объеме. Они взаи- взаимодействуют не только с молекулами своей фазы, но также и с близлежащим слоем молекул чужой фазы. Благодаря этому строение и физические свойства тонкого слоя вещества, тол- толщиной порядка радиуса молекулярного взаимодействия, оказы- оказываются отличными от объемных. Детальное рассмотрение свойств поверхностного слоя по- потребовало бы знания механизма молекулярного взаимодействия. Подобная теория была бы весьма сложна. Поэтому мы должны упростить задачу, заменив поверхностный слой конечной тол- толщины идеализированной, бесконечно тонкой поверхностью раз- раздела, разграничивающей сбе фазы. Такой идеализированный, бесконечно тонкий поверхностный слой мы будем кратко назы- называть поверхностью. Площадь поверхности является новым при- примером параметра, характеризующего состояние системы. При данном значении объема система может иметь различную по- поверхность 2, причем каждому значению 2 отвечает определен- определенное состояние системы. Изменение поверхности системы сопровождается получением или затратой работы. Для образования новой поверхности ча- частица из объема должна перейти на поверхность, что требует затраты работы. Обозначим обобщенную силу, отвечающую па- параметру 2, через у. Если изменение поверхности производится при постоянной температуре, то работа изменения поверхности (dW = —ydl.) равна убыли свободной энергии (—dFuoaepx), так что ^поверх - V rfS. F5,1) Величина у, представляющая свободную энергию единицы по- поверхности, называется поверхностным натяжением. Поверхност- Поверхностное натяжение у зависит от природы поверхности (иначе го- говоря, от природы образующих ее фаз), а также от темпера- температуры. Значение у не зависит, однако, от площади поверхности. Поэтому можно написагь YS. F5,2)
C22 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX Состоянию развновесия незамкнутой системы при постоянной температуре и объеме отвечает минимум свободной энергии. Поверхность раздела фаз представляет пример такой системы. Поэтому в состоянии равновесия поверхность раздела фаз имеет минимальное возможное значение. При одновременном измене- изменении величины поверхности и температуры в системе изменение свободной энергии поверхности имеет вид ^поверх = — ^поверх *Т + У dS. F5,3) Из формулы F5,3) следует, что энтропия поверхности опреде- определена соотношением о (?>?_] vJiL (rxa\ ^поверх — \дТ )z~ dT ' *¦ ' " позволяющим выразить S,IObcpx через поверхностное натяжение. Наряду со свободной энергией поверхности можно написать выражение для энергии поверхности Еаозгтк'- F =F -4-Т9 = vS— T^- S = (v — Т -^Ле ffi5 *A ^-поверх * поверх ~ 1 '-'поверх У^ 1 д-р ^ \ V ' ^р I •"• vJtJ>tJ/ Последняя формула показывает, что было бы ошибочным опре- определить поверхностное натяжение как энергию единицы поверч- ности. Для дифференциала энергии поверхности можно написать dEn0Bepx = T dSnooepx + Y dS. F5,6) Из последнего равенства следует соотношение рх \ Y /fic 7ч 1—дТ~ f Т- F5'7) \ "^ ''-поверх Заметим, что в F5,7) нельзя подставить непосредственно F5,4). Это привело бы к неверной формуле -pf- — jr. Про- Производная в F5,7) берется при постоянной энергии поверхности, но из F5,5) следует, что -^ 2 = т "°Rei , а из F5,4) — что Y^ ~ ^поверх тт j. j. г-. 5 = f • Дифференцируя при ?цОверх = const по- последнее выражение, вновь приходим к формуле F5,7). Изменение энергии поверхности можно разбить на работу и количество тепла: = TdSn0V[evlj +]у rfS = dQ + dW. С учетом F5,4) отсюда следует, что количество тепла, погло- поглощающегося при обратимом увеличении площади поверхности на 1 см2, равно Q = (Г AS)AS., = --§-. F5,8)
§ 65] ПОВЕРХНОСТНОЕ НАТЯЖЕНИЕ 623 Теплоемкость единицы поверхности (при постоянном значении площади поверхности 2 = 1) можно определить как Все величины, характеризующие термодинамические свой- свойства поверхности, определяются через поверхностное натяже- натяжение и ее производные по температуре. Температурная зависимость поверхностного натяжения в на- настоящее время может быть установлена теоретически только для квантовых жидкостей (жидкого гелия II). Отделить движе- движение молекул поверхностного слоя от движения частиц в объеме жидкости при высоких температурах не представляется воз- возможным. Поэтому имеющиеся попытки расчета поверхностного натяжения без учета этой связи не выдерживают критики. Поверхностное натяжение изменяет условие равновесия фаз. Условие равновесия в системе, состоящей из двух фаз и по- поверхности раздела, при Т = const можно записать в виде dF = dFt + dF2 + fif/Wpx = —PidVi — p2dV2 +' у d2 = 0. По- Поскольку объем всей системы остается постоянным, ?1/ dV так что или §;. F5,10) Величина dE/dVi представляет кривизну поверхности раздела JL.--L ¦ JL dV, - г, т г2 ' где Г] и г2 — главные радиусы кривизны. В случае сферической поверхности _rfS_ _ // D-lr2) = 2 dVt'" ' 4 г\ г' При этом радиус-вектор считается положительным, если он на- направлен в глубь первой фазы. Таким образом, окончательно имеем Величина vl i ) носит название давления Лапласа, а формула F5,11) — формулы Лапласа. Формула Лапласа пока- показывает, что давление в первой фазе уравновешивается суммой давления во второй фазе и давления Лапласа. В частном случае
624 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. [X плоской поверхности раздела давления Лапласа обращается в НуЛЬ, ПОСКОЛЬКУ ДЛЯ ПЛОСКОЙ ПОВерХНОСТИ Г\ -> ОО, Г2->ОО. Наличие поверхностного натяжения изменяет не только условие механического равновесия, но и условие фазового рав- равновесия для обмена частицами. Именно, хотя в поверхности раздела при фазовом равнове- равновесии не может происходить какой-либо задержки частиц и пере- переход их из одной фазы в другую происходит беспрепятственно, условие F1,4) будет теперь выполняться при несколько изме- измененном значении давления (по сравнению с давлением в точке фазового перехода при той же температуре при плоской поверх- поверхности раздела). Рассмотрим случай фазового равновесия между каплями жидкости и ее паром. Будем считать капли сферическими с ра- радиусом г. Условие равновесия для обмена частицами будет иметь вид Vn(p",T) =\1*(Р',Т), F5,12) где р" — давление насыщенного пара, р'—соответствующее дав- давление в жидкой капле, а Т — температура перехода. Последнюю примем равной температуре перехода при плоской поверхности. То же условие на плоской поверхности имеет вид ). F5,13) Вычитая F5,13) из F5,12), находим И-i {Р", Т) - Hi (р, Т) = ц2 (/>', Т) ~ ii2 (р, Т). F5,14) Поскольку сжимаемость жидкости весьма мала, различие в давлениях р' и р также мало. Ввиду этого можно написать М/>'. Т)-Ца{р, Г) = ц2(р + Д/>, Т)-]х2{р, Г) = ^-Ар = У2-Ар, F5,15) где V2 — объем, приходящийся на одну частицу в жидкой фазе, и Ар — разность давлений в жидкости при сферической и плос- плоской поверхности. Последняя равна, очевидно, Изменение давления насыщенного пара над сферической каплей по сравнению с плоской поверхностью в общем случае не мало и разлагать левую часть F5,14) в ряд нельзя. Мы пе- перепишем ее, воспользовавшись общей формулой для парциаль- парциального потенциала F0,5) идеального газа. Считая пар идеальным газом, находим kTln?. = Va*L, F5,16)
§ 66] АДСОРБЦИЯ ГАЗОВ 625 Формула F5,16) связывает давление насыщенного пара над каплей с ее радиусом. Записав ее » виде мы видим, что р" быстро растет с уменьшением радиуса капли и для мелких капель может стать весьма заметным. Например, для водяных капель при у ~ 80 эрг,'см2 и при г = 10-6 см и Г^300°К давление /?"«1,1р, л. е. давление пара над каплей превышает давление над плоской поверхностью на 10%. Формула F5,17) показывает, что система, состоящая из на- набора капель различных размеров, находится в состоянии не- неустойчивого равновесия. Мелкие капли, обладающие избыточ- избыточной энергией, связанной с поверхностным давлением, будут испаряться; на крупных каплях будет происходить конденсация паров. Этот процесс, именуемый перегонкой капель, будет про- продолжаться до тех пор, пока вся жидкость не перейдет в капли самого большого размера. Другое важное явление, связанное с изменением давления пара над искривленной поверхностью, наблюдается в капилля- капиллярах, смачиваемых жидкостью. В таких капиллярах поверхность мениска будет вогнутой, так что в формуле F5,17) нужно напи- написать знак минус. Давление насыщенного пара над вогнутой поверхностью оказывается при этом меньшим, чем над плоской поверхностью. Благодаря этому в тонких капиллярах происхо- происходит конденсация паров еще до того, как она происходит при той же температуре над плоской поверхностью. Это явление именуется капиллярной конденсацией. Формула F5,17), выведенная для равновесия в системе жидкость —пар, качественно справедлива и в других случаях фазового равновесия, например, в системе кристалл—пар. § 66. Адсорбция газов Одним из важнейших эффектов, связанных с особыми своГг- ствами поверхности раздела фаз, является адсорбция. Под ад- адсорбцией понимают накопление некоторого вещества на поверх- поверхности твердой или жидкой фазы. Обычно адсорбирующееся вещество распределяется на поверхности раздела фаз, практи- практически совершенно не проникая в глубь конденсированной фазы. Явление адсорбции наблюдается при самых различных комби- комбинациях фаз. Чаще всего на практике приходится иметь дело с адсорбцией газов на поверхности твердого тела. Рассмотре- Рассмотрением этого случая адсорбции мы ограничимся в данном пара- параграфе. 40 В. Г. Львич, том I
626 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. ГХ До настоящего времени нельзя считать окончательно уста- установленным характер сил, связывающих молекулы, адсорбирую- адсорбирующиеся на поверхности, с молекулами твердой или жидкой под- подложки (именуемой адсорбентом). В ряде случаев они имеют характер ван-дер-ваальсовых сил, в других случаях между ад- адсорбированными молекулами и молекулами адсорбента уста- устанавливается более прочная связь, отвечающая образованию своеобразного химического соединения. Возможны и промежу- промежуточные случаи. Как правило, адсорбирующиеся молекулы рас- располагаются на поверхности адсорбента в виде мономолекуляр- uoro слоя. При этом чаще всего адсорбированные молекулы не- необладают подвижностью, а в процессе адсорбции прикреп- прикрепляются к вполне определенным точкам на поверхности кри- кристалла. Такие точки на поверхности кристалла, на которых происходит адсорбция молекул, мы будем именовать местами локализации. Местами локализации могут служить ребра гра- граней кристалла или какие-либо иные выделенные точки на по- поверхности. Обозначим через NL число мест локализации, приходящихся на 1 см'1 поверхности кристалла. Будем считать, что все места локализации на поверхности являются равноправными, так что в каждом из них адсорбированная молекула связана с поверх- поверхностью в одной и той же степени. Напишем функцию состояний для системы адсорбированных частиц, считая, что их плотность NA (число частиц на 1 см2 поверхности) мала и можно пренебречь взаимодействием между адсорбированными молекулами. Каждая из адсорбированных частиц обладает потенциальной энергией (—и), которая яв- является мерой работы удаления частицы с поверхности. Если считать, что адсорбированные молекулы колеблются около положения равновесия с частотой v, то функция состоя- состояний для каждой молекулы может быть написана в виде и **А ^кплсб» 1де 2Колеб — функция состояний осциллятора. Функция состояний всей совокупности адсорбированных частиц может быть написана в виде Za=N1{"'-_N),{zA)N\ F6,1) где множитель -м . ... _ .. .-г представляет статистический вес состояния. Действительно, данной энергии системы отвечает целый ряд состояний, различающихся распределением частиц по местам
§ 66] АДСОРБЦИЯ ГАЗОВ 627 локализации. Число способов, которыми можно распределить NA частиц по NL местам локализации, равно ы иы_ы ч, • Оно и a-\"l лг дает статистический вес состояния всей системы из частиц, имеющей данную энергию. С помощью F6,1) можно найти свободную энергию и пар- парциальный потенциал системы. Имеем для свободной энергии FA=- kT in Z,- - kTIn n* \ « - NLkT\n -^- + kTNA\n-f- + + (NL ~ ЫД kT In Nl ~ Na - NAkT In zA. F6,2) Соответственно парциальный потенциал адсорбированных ча- частиц равен (ср. F0,3')) »A = -QtrA=kT\n-*--kT\n Le A-kT\nzA = = kT\n1^w--kT\xxzA. F6,3) С помощью формулы F6,3) можно рассмотреть равновесие между адсорбированным веществом и газом. Приравнивая \хА и парциальный потенциал газа, даваемый формулой F0,5), по- получаем kT In NJ\ +f(T) = kT\np + q> (T), L A откуда находим N, p NL-NA где Ро зависит только от температуры. Решая F6,4) относи- относительно NA, находим ^ = Л'7Г (ад Формула F6,5) представляет изотерму адсорбции: она опре- определяет количество адсорбированных молекул в зависимости от давления газа над поверхностью твердого тела при постоянной температуре. Очевидно, что при низком давлении, когда р <С pQ, 40*
628 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX это количество пропорционально давлению газа и числу мест локализации: При этом степень заполнения мест локализации мала. При большом давлении рС^> ро наступает явление насыщения, число адсорбированных молекул перестает зависеть от давления и становится постоянным числом, равным числу мест локали- локализации: NA ~ NL. Изотермы адсорбции формулы F6,5) изображены на рис. 73. При высоких температурах возникает подвижность адсор- адсорбированных молекул вдоль поверхности. В пределе адсорби- адсорбированные молекулы могут пере- перемещаться вдоль поверхности твердого тела подобно молеку- молекулам «двумерного» газа. При этом изменяется вид функции со- состояний гА адсорбированной мо- молекулы, но вид изотермы адсорб- адсорбции остается прежним. Необходимо указать, что рас- рассмотренный здесь простейший механизм адсорбции, при кото- котором все места локализации на поверхности характеризуются од- ной и той же постоянной энер- энергией связи (—ы), и который приводит к изотерме F6,5), встре- встречается редко. Обычно на поверхности твердого тела имеются различные места локализации с разными значениями энергии связи, т. с. поверхность адсорбента является неоднородной. Кроме того, при больших заполнениях взаимодействие между молекулами в адсорбированном слое становится существенным и влияет на ход изотермы. В результате наложения этих фак- факторов вид изотермы может изменяться и сильно отличаться от изображенного на рис. 70. Определив из опытных данных вид изотермы и рассматривая его как результат наложения изотерм F6,5) с различными ро(Т), можно найти характер неоднород- неоднородности поверхности. Что же касается адсорбции газов на поверхности жидкости, то механизм адсорбции здесь не отличается от адсорбции на поверхности твердого тела при высоких температурах: все точки на поверхности жидкости равноправны и адсорбированные частицы сохраняют подвижность вдоль поверхности при Срав- 5 Ю 16 20 25 30 35 р (бар) Рис. 73.
§ 67] ХИМИЧЕСКИЕ РАВНОВЕСИЯ В ГАЗОВОЙ СФЕРЕ; 629> нительно низких заполнениях поверхности. Изотерма адсорб- адсорбции имеет вид F6,5). При очень высоких заполнениях суще- существенную роль начинает играть взаимодействие между адсорби- адсорбированными молекулами, искажающее вид изотерм. § 67. Химические равновесия в газовой фазе В качестве второго примера системы с переменным числом частиц рассмотрим равновесие а системе, в которой протекает химическая реакция. Предположим для конкретности, что в ходе химической ре- реакции происходит соединение молекул А и В с образованием молекулы АВ. Молекула АВ в свою очередь распадается на от- отдельные молекулы А и В. Оба процесса, соединения и распада, происходят с некоторой скоростью, под которой понимают чис- число актов, происходящих в единицу времени. Скорости прямого процесса А + В—+АВ и обратного процесса АВ-+А+В, во- вообще говоря, не равны друг другу. Поэтому химическая реак- реакция идет преимущественно в одну сторону. Однако по про- прошествии некоторого времени, когда произойдет накопление реагентов, возникающих в ходе более быстрой реакции, и умень- уменьшение количества реагентов, исчезающих в ходе реакции, ско- скорость быстрой реакции уменьшится, а скорость медленной реакции увеличится. В результате в системе установится неко- некоторое равновесное состояние. Число возникающих и распадаю- распадающихся молекул АВ будет одинаковым. В этом случае говорят о равновесной реакции А + В +± АВ. Удобнее записывать реак- реакцию в форме равенства. Если реакция происходит между не- несколькими веществами, то всякую химическую реакцию можно- записать в виде где gt — химические символы реагирующих веществ, a v,— число реагирующих молей соответствующих веществ. При этом принято записывать реакции так, чтобы коэффициенты vs- для веществ, расходуемых в ходе реакции, имели отрицательный знак, а для образующих веществ — положительный. Например,, реакция образования паров воды из гремучей смеси 2Н2 + О2 = 2Н2О должна с этой точки зрения записываться в виде 2Н2О—2Н2 —О2 = 0, так что vll2O = 2, vHf = - 2, vOj= - 1. Напишем условия химического равновесия в произвольной системе состоящей из исходных веществ и продуктов реакции.,
¦630 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX Совокупности молекул исходного вещества и продуктов реакции можно считать некоторыми квазизамкнутыми системами, нахо- находящимися в термостате и слабо взаимодействующими между собой. Последнее условие выполнено, если число атомов, реа- реагирующих в единицу времени, мало по сравнению с полным числом молекул в системе, что всегда выполнено в макроско- макроскопической системе веществ при равновесной реакции. Обычно приходится изучать равновесные состояния реаги- реагирующей системы при заданной температуре и давлении. Усло- Условием равновесия поэтому служит требование где Ni — число частиц данного сорта. При постоянных задан- заданных значениях температуры и давления во всей системе усло- условие минимума можно переписать в виде и, замечая, что изменение числа частиц данного сорта можно представить в виде dNt = VidN, мы получаем условие равновесия в системе при наличии хи- химических реакций: 2 0. F7,2) При превращении одной молекулы первой подсистемы в одну молекулу второй подсистемы (случай, рассматривавшийся нами ранее), коэффициенты v,-, очевидно, равны vi = 1, V2 = —1. В этом случае формула F7,2) оказывается тождественной с F1,4). Мы видим, что химические равновесия определяются равен- равенством парциальных потенциалов. Ввиду этого парциальные по- потенциалы часто называют химическими потенциалами. § 68. Закон действующих масс Для применения условия F7,2) к конкретным химическим равновесиям необходимо знать явный вид парциальных потен- потенциалов. Последний известен главным образом для газов. По- Поэтому дальнейшая теория будет относиться к химическим рав- равновесиям в смеси газов. Парциальный потенциал газа был вы- вычислен нами в § 60. В смеси идеальных газов каждый из газов ведет себя так, как будто бы он один занимает весь объем сосуда и имеет парциальное давление pi = -jj-p, где Nj — число
§ 68] ЗАКОН ДЕЙСТВУЮЩИХ МАСС 631' частиц 1-го газа и N ->- полное число атомов всех сортов, нахо- находящихся в сосуде. Запишем ц; в общем виде: F8,1 где [(^)] F8,2> для одноатомного газа, X (Г) = - ~ kTln kT - kTj2 + kT In A - e~ «") + во, F8,3> для двухатомного газа при очень высоких температурах:, когда- колсбания возбуждены, и Х(Т)= --kTlnkT -kTji + eo для двухатомного газа при не очень высоких температурах,, когда колебания не возбуждены. Рассмотрим реакцию типа Vlgl + V2g2—-V3g3 = 0. Условие химического равновесия гласит: 0 F8,4). или + v2kT In p2 - vzkT In pj = v3x3 - v,x, - v2xa. F8,5)- Таким образом, ~Г = К(П F8,6) '3 где F8,7). Величина К(Т) есть величина, зависящая только от темпера- температуры и природы реагирующих молекул, но не зависящая ог начальных давлений или количеств реагирующих газов. Формула F8,6) носит название закона действующих масс. Закон действующих масс показывает, что независимо от исход- исходного состава реагирующей газовой смеси с течением времени в ней установится такое равновесное состояние, при котором.
532 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл. IX парциальные давления имеют вполне определенные значения, связанные между собой формулой F8,6). Они не зависят ни от каких параметров, кроме температуры, разности нулевых энер- энергий и химических постоянных реагирующих газов. В том случае, когда в реакции участвуют не три, а большее число газов, за- закон действующих масс нужно писать в виде г v I \\?П=К(Т), F8,8) (Pi) ' где произведение берется по всем газам, фигурирующим в ре- реакции, а штрихи относятся к продуктам реакции. Закон действующих масс был впервые экспериментально открыт Н. Н. Бекетовым, а теоретически, на основе статистиче- статистических соображений, был выведен Гульдбергом и Вааге. Выражение F8,8) имеет ясный статистический смысл: для того чтобы исходные продукты вступали в реакцию, необхо- необходимо, чтобы их молекулы оказались одновременно в весьма малом объеме v, размер которого порядка диаметра молекул. Поскольку газы считаются идеальными и движение молекул про- происходит независимо друг от друга, вероятность того, что в дан- данном объеме одновременно окажутся молекулы исходных ве- веществ, пропорциональна количествам этих молекул в газе. По- Последние в свою очередь пропорциональны соответствующим парциальным давлениям. Таким образом, вероятность прямой реакции W\ пропорциональна р^'р*' . .., Те же самые рассуждения можно применить и к обратной реакции. Вероятность обратной реакции w% равна В состоянии равновесия скорости прямой и обратной реакции раины между собой. Для этого должны быть равны вероятности прямого и обратного процессов. Приравнивая W[ и w2 и обозна- обозначая отношение коэффициентов пропорциональности а/b через К, приходим к формуле F8,8). Закон действующих масс представляет основной закон хи- химических равновесий. Он может быть выведен чисто термоди- термодинамическим путем, но при этом значение константы К(Т) остается неопределенным и должно находиться на опыте. С по- помощью статистических выражений для ц,, приведенных выше, постоянная К может быть вычислена теоретически Пример по- подобного вычисления мы дадим несколько позднее.
§ 69] ТГПЛОБАЯ ДИССОЦИАЦИЯ АТОМОВ 63$ Закон действующих масс чаще всего выражают не через- парциальные давления, а через так называемые молярные доли: Подставляя ct в F8,6), получаем fVVv' -L^- = P~ V'K(T). F8,9)' Из формулы F8,9) следует, что если реакция происходит без изменения числа молей, так что V3 = vi 4- V2, равновесие не зависит от общего давления в системе р. Примером таких реак- реакций может служить реакция диссоциации йодистого водорода- —2HJ + Н2 + J2 = О, ДЛЯ КОТОРОЙ V] = 1, V2 = 1, V3 = —2. Если реакция происходит с изменением числа молей, так что V3 Ф (vi + V2), то изменение общего давления сдвигает рав- равновесие. Это значит, что при изменении общего давления отно- отношение между молярными долями исходного вещества и про- продукта реакции изменяется. Пусть, например, происходит дис- диссоциация молекулы двуокиси азота N2O4 на две молекулы NOj. Записываем реакцию в виде 2NO2 — N2O4 = 0. Коэффициентами реакции будут vNO = 2, vNOi= —1, так ¦ что реакция идет с увеличением числа молей. Закон действующих масс гласит: При уменьшении общего давления число молекул NO2 увели- увеличивается, т. е. увеличивается процент распавшихся молекул N2O4 в равновесной смеси. Таким образом, если реакция идет с увеличением числа молей, |v3|>vi + v2, то понижение общего давления ей благоприятствует, а повышение давления — пре- препятствует. В случае реакций, идущих с уменьшением числа, молей, iva| <vi + V2, изменение общего давления действует в обратном направлении. § 69. Тепловая диссоциация атомов Мы упоминали ранее о происходящей при очень высоких температурах тепловой диссоциации атомов. Когда температура достигает таких высоких значений, что тепловая энергия kT оказывается сравнимой с энергией, которую нужно затратить»
?34 СИСТЕМЫ С ПЕРЕМЕННЫМ ЧИСЛОМ ЧАСТИЦ [Гл IX на вырывание электрона из электронной оболочки атома (энер- (энергии ионизации), то происходит тепловая ионизация атомов. Атомы диссоциируют на положительно заряженный ион и элек- электроны, которые образуют соответствующие идеальные газы. Наряду с процессом ионизации происходит и обратный про- процесс — рекомбинация, — в ходе которого ион и электрон сое- соединяются в нейтральный атом. Таким образом, при очень высокой температуре в веществе идут две реакции: Л->/+ + е, /+ + е —Л, где А означает атом и /+ — ион (для простоты мы ограничи- ограничиваемся случаем однократной ионизации). Если в системе под* держиваются постоянные условия, температура и давление, то в ней установится равновесное состояние, при котором число ионизации равно числу рекомбинаций. Система, в которой про- происходит равновесная реакция в принципе ничем не отличается от системы, в которой идет равновесная химическая реакция. Для нее может быть написан' закон действующих масс в виде °> + Ce „С -v+- где се, с,+, сА — молярные доли электронного, ионного и атом- атомного газов. Константа К(Т) равна [nK(T) = -j\nkT + je-j^. F9,2) В формуле F9,2) все величины, относящиеся к иону и атому, сократились, поскольку различием в массе иона и атома можно пренебречь. Химическая постоянная электронного газа равна Величина Део представляет энергию ионизации атома. Таким образом, сА рв - р • (™>6> Вместо молярных долей удобнее ввести другую, более на- наглядную величину, именуемую степенью диссоциации. Пусть а-я часть атомов испытывает диссоциацию, так что из N атомов возникает N(l+a) частиц. Величина а, характеризующая
§ 64] ТЕПЛОВАЯ ДИССОЦИАЦИЯ АТОМОВ 635- долю ионизовавшихся атомов, называется степенью диссоциа- диссоциации. Очевидно, имеем vJ+~ I+a' *<~ l+a' UA l+o • Подставляя молярные доли, выраженные через степень диссо- диссоциации в F9,3), находим а2 К 1-а2 ~ р ' откуда ' ,. ... .. • F9,4> К У (kTf1 Из последней формулы видно, что степень диссоциации бы- быстро растет с температурой. Оценки числовых значений величин, входящих в предэкспоненциальный множитель в знаменателе,, показывают, что последний весьма мал. Поэтому, если только Аго/kT не очень велико, все подкорен- подкоренное выражение, а с ним и а — порядка единицы. Это означает, что при kT, сравнимых с энергией ионизации, газ оказывается практически нацело ионизованным: , 1 1 „ a«l; c;+«y; ce**j\ cA~0. Степень ионизации растет также с понижением общего давле- давления. Последнее находится в полном соответствии со сказанным в конце § 68 для реакции, идущей с увеличением числа молей. Известным приложением формулы F9,4) является приме- применение ее к разъяснению на первый взгляд весьма странной осо- особенности спектра солнечной атмосферы. В астрофизике был разработан метод исследования спектров, исходящих из раз- различных слоев солнечной атмосферы (хромосферы). Исследова- Исследования показали, что в более глубоких областях атмосферы, в ко- которых температура выше, степень диссоциации паров кальция ниже, чем степень их диссоциации во внешних, более холодных слоях. В случае кальция потенциал ионизации составляет 6 эв. Степень ионизации а при 6000° К и давлении р — 1 атм состав- составляет всего 8%, тогда как при той же температуре и давлении 10~2 атм она достигла 65%. Объяснение заключается в том, что- благодаря влиянию предэкспоненциального члена, содержа- содержащего р в формуле F9,4), увеличение степени диссоциации с уменьшением давления идет быстрее, чем уменьшение ее с по- понижением температуры при переходе от более глубоких к по- поверхностным слоям солнечной атмосферы.
ГЛАВА X СТАТИСТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ И НЕКОТОРЫЕ ИХ ПРИЛОЖЕНИЯ § 70. Последовательный учет тождественности элементарных частиц Мы неоднократно уже указывали ранее, что классические представления оказались недостаточными для изучения движе- движения атомных систем и лолжны быть заменены представлениями квантовой теории. В главе I мы привели те минимальные све- сведения из квантовой теории, которые были необходимы для пре- предыдущего изложения. Однако для более глубокого разбора тех изменений, которые вносит квантовая теория в статистическую физику, необходимо остановиться еще на некоторых важных результатах квантовой теории. Как мы уже подчеркивали ранее, для статистической физики основное значение имеют два положения квантовой механики: 1) существование дискретных состояний системы; 2) принцип тождественности элементарных частиц. Дискретность квантовых состояний учитывалась нами с са- самого начала. Нами было установлено, когда необходимо учи- учитывать дискретный характер энергетических уровней, а когда их можно приближенно считать распределенными непрерывно, а также выявлено и влияние дискретности энергетического спектра на поведение статистических систем. Однако последо- последовательный учет тождественности частиц нами до сих пор про- произведен не был. Правда, состояния, отличающиеся друг от друга только перестановкой частиц, мы считали одним состоя- состоянием. Для этого мы произвели деление фазового пространства на число возможных перестановок частиц. Такое деление пред- представляло простейшую попытку учета тождественности частиц. Деление на N\ производилось, в сущности, еще до появления квантовой теории. В противном случае, как мы уже указывали в § 37, ив статистики получались неправильные выражения для термодинамических функций. Соображения, основанные на шринии-пе тождественности элементарных частиц, до некоторой
§ 71] МЕТОД ВЫВОДА СТАТИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ 637 степени оправдали деление функции состояний на N1. Однако непоследовательность этой операции очевидна. Действительно, мы считали вначале, что все частицы отличимы друг от друга, так что их можно в принципе последовательно перенумеровать, приписать каждой частице определенный номер или метку. Исходя из этой точки зрения, мы провели подсчет возможных состояний системы, состоящей из N независимых частиц, ин- интегрируя по координатам и импульсам первой, второй и так далее частиц. После этого мы, и противоречие с исходной пред- предпосылкой о возможности нумерации частиц, объявили часть состояний, отличающихся друг от друга только перестановкой частиц, совершенно тождественными и потребовали, чтобы каж- каждое из них учитывалось один раз. Опыт и теория показывают, однако, что тождественность атомных частиц имеет гораздо более глубокий характер. Пол- Полная тождественность атомных частиц приводит к тому, что те- теряет физический смысл первая из произведенных нами опера- операций— нумерация частиц. Не имеет смысла называть одну из частиц первой, другую — второй и так далее и интегрировать по их состояниям, поскольку нет никаких физических разли- различий межд^- грвой, второй и так далее частицами. Если назвать первой частицу, находящуюся в начальный момент в опреде- определенное состоянии, то в следующий момент уже нельзя было бы утверждать, что в этом состоянии находится именно первая частица, так как отличить первую частицу от «не первой» было бы невозможно. Поэтому нужно с самого начала отказаться от попытки различать между собой отдельные атомные частицы, т. е. от принятой нами характеристики системы атомных ча- частиц1)- Мы посмотрим сейчас, к каким изменениям в статистическом распределении приводит последовательный учет полной тож- тождественности атомных частиц. Все дальнейшие рассуждения бу- будут относиться только к одноатомному идеальному газу. § 71. Другой метод вывода статистического распределения Для вывода статистического распределения в газе с учетом принципа тождественности элементарных частиц мы прибегнем к особому приему, могущему служить прекрасной характери- характеристикой гибкости и общности статистических методов. Чтобы сделать различие между классическим и квантовым рассмот- рассмотрением особенно рельефным, мы сначала еще раз выведем ') Исключения составляют так называемые системы локализованных ча- частиц, отделенных друг от друга непроницаемыми барьерами. Такие системы мы рассматривать не будем.
638 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X классическое распределение (распределение Максвелла) с по- помощью этого метода. Предположим, что молекулы в газе могут находиться в инди- индивидуальных квантовых состояниях с энергиями поступательного движения 8ь ег, е3, ... (для удобства рассуждений мы будем пока считать уровни энергии дискретными). В газе имеется не- некоторое распределение частиц по состояниям, так что в первом состоянии находится п\ частиц, во втором п2 частиц и т. д. С классической точки зрения мы должны описывать состояния газа следующим образом: частицы № 1, 2, 3, ..., п\ находятся в состоянии с энер- энергией 81, частицы № «1 + 1, ..., П\ + п2 находятся в состоянии с энер- энергией 82, частицы № П\ + п2+1, ..., П1+П2 + П3 находятся в состоянии с энергией ез и т. д. Далее, выберем в качестве квазизамкнутой подсистемы все частицы, находящиеся в некотором произвольно выбранном квантовом состоянии с энергией е^. Все остальные газовые ча- частицы, находящиеся в других энергетических состояниях, при этом образуют некоторый термостат. Выбор в качестве подсистемы группы частиц, находящихся в данном состоянии, находится в полном согласии с теми тре- требованиями, которым должна удовлетворять квазизамкнутая подсистема (§ 13). Действительно, в результате столкновений частицы, обладающие энергией ец, переходят в другие состоя- состояния. Наоборот, благодаря тому же механизму в это состояние попадают другие молекулы, ранее имевшие отличную от е^ энер- энергию и принадлежавшие, следовательно, к термостату. Если число молекул, входящих или выходящих из подсистемы в еди- единицу времени, мало по сравнению с числом частиц, в нем находящихся, то можно считать, что взаимодействие между под- подсистемой и термостатом является слабым. Это условие будет удовлетворено, если столкновения между частицами, вызываю- вызывающие соответствующие переходы, происходят достаточно редко, т. е. когда газ разрежен. Поскольку взаимодействие подсистемы с термостатом состоит в переходе частиц из подсистемы в тер- термостат и обратно, выбранная нами подсистема представляет пример подсистемы с переменным числом частиц. Отличие ее от общего случая подсистемы с переменным числом частиц и переменной энергией состоит в том, что энергия каждой частицы в подсистеме фиксирована. Однако энергия подсистемы, сла- слагающаяся из энергии всех содержащихся в ней частиц, также, разумеется, изменяется с изменением числа частиц в ней.
§ 71] МЕТОД ВЫВОДА СТАТИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ 639 Во избежании недоразумений подчеркнем, что сейчас мы говорим не о состояниях реально существующей системы, а о состояниях условно введенной подсистемы. Нашей подсистемой является совокупность частиц с определенной энергией, нахо- находящихся в различных местах газа и не связанных между собой, а не какая-либо единая система. В процессе изменения состояния реальной системы изме- изменяется число частиц, попадающих в состояние с данной энергией ek. В этом смысле изменяется состояние нашей подсистемы. Энергия подсистемы равна G1,1) где «л — число частиц в подсистеме. Величина е изменяется вместе с изменением пк. Для того чтобы полностью характеризовать состояние вы- выбранной нами подсистемы, нужно знать среднее число частиц в подсистеме, т. е. среднее число частиц, находящихся на выбран- выбранном нами уровне энергии. Для вычисления можно воспользо- воспользоваться общей формулой E9,11), дающей среднее число частиц в подсистеме с переменным числом частиц. В нашем специаль- специальном случае эту формулу можно существенно упростить. Мам не нужно вести двойного суммирования по возможным значениям энергии и числа частиц, так как в нашей системе значение энер- энергии однозначно определяется числом содержащихся в ней частиц по формуле G1,1). При суммировании по возможным значе- значениям числа частиц в подсистеме мы автоматически производим суммирование по возможным значениям ее энергии. С этим упрощением, в сущности, и был связан сделанный нами выбор подсистемы. Таким образом, среднее число частиц в подсистеме П), выражается формулой G1.2) где вместо е мы подставили ее выражение по формуле G1,1). Суммирование в G1,2) ведется по всем возможным значе- значениям числа частиц в подсистеме пк. Для фактического проведе- проведения суммирования в формуле G1,2) необходимо знать явное выражение для статистического веса (числа состояний) Q(nh) состояния системы, когда в ней содержится nh частиц. В квази- квазиклассической статистике, когда все частицы можно последова- последовательно пронумеровать, состояния нашей системы всегда будут вырожденными, если только она содержит более одной частицы данного сорта. Действительно, если в системе содержится /V одинаковых частиц, то она может находиться в различных
640 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X состояниях, отличающихся друг от друга перестановкой частиц. Пусть, например, в нашем газе имеются две молекулы № 1 и 2 с энергией е*. В первом состоянии молекула № 1 находится в точке /, а молекула № 2 в точке 2, во втором состоянии они переставлены местами. В обоих состояниях энергия подсистемы одинакова и равна 2еь. Таким образом, имеется два состояния системы с энергией 2ги или, иными словами, состояния системы двукратно вырождены. В общем случае состояния системы, со- содержащей nh частиц, являются п*,! — кратно-вырожденными. Если мы не хотим считать различными состояния, отличаю- отличающиеся только перестановкой частиц (что заведомо привело бы нас к неправильным выражениям для термодинамических функ- функций), то для Q следует воспользоваться общей формулой A,26) и разделить полный объем фазового пространства на число воз- возможных перестановок молекул nk\ и размер ячейки /г3. Объем фазового пространства, отвечающего одному кванто- квантовому состоянию с энергией гь, равен, очевидно, /г3. Поэтому окончательно для ii(tih) получаем ^ G1,3) Подставляя выражение G1,3) в формулу G1,2), находим • G1,4) т Число частиц, входящих в состав подсистемы nh, может из- изменяться от нуля до полного числа частиц в газе N. Однако вероятность того, что все частицы газа соберутся в одно энер- энергетическое состояние, бесконечно мала. Поэтому при nk, близ- близких к N, члены суммы G1,4) также бесконечно малы и сумма быстро сходится. Мы не совершим поэтому ошибки, если за- заменим верхний предел N в сумме бесконечностью. Это соответ- соответствует добавлению к сумме бесконечно малых слагаемых. При тякой замене сумма G1,4) обращается в простой ряд: k где через х мы временно обозначили е е . Таким образом, пк = кТ-^\пе* = кТ-^е-^ = е-^. G1,6) В частности, если состояния молекулы и ее энергия изме- изменяются непрерывным образом, что всегда справедливо в клас-
§ 72] КВАНТОВЫЕ РАСПРЕДЕЛЕНИЯ ДЛЯ ИДЕАЛЬНОГО ГАЗА 641 сической статистике, то вместо данного уровня энергии es нужно рассматривать состояния с энергией, лежащей между е и е + бе. При этом вместо числа частиц в данном квантовом состоянии Пк нужно выражение для среднего числа частиц с энергией между е и е + бе, которое мы обозначим через dn. Очевидно, d« = nf -в^#. G1,7) где dy— объем фазового пространства, отвечающий энергии между в и е+бе и dyjh3 — число состояний с этой энергией. Формула G1,7) совпадает с распределением Максвелла в той форме, которая была ему придана в формуле F0,10). В следующих параграфах мы воспользуемся статистическим распределением G1,2) для получения квантовых законов рас- распределения молекул в идеальном газе. В заключение заметим, что описанный здесь метод вывода распределения Максвелла — Больцмана часто называется ме- методом ячеек в фазовом пространстве. § 72. Квантовые распределения для идеального газа Как мы только что подчеркнули, из принципа тождествен- тождественности частиц следует, что нельзя различать между собой от- отдельные микроскопические частицы — электроны, фотоны, про- протоны и другие элементарные частицы, а также атомы и моле- молекулы '). Последовательно проводя точку зрения тождественности частиц, следует отказаться от нумерации частиц. При этом нельзя больше говорить «о двух состояниях, отличающихся пе- перестановкой двух частиц» или «об п\ совпадающих состояниях, отличающихся перестановкой п частиц». Мы должны говорить о «состоянии с энергией ё/,, в котором находятся соответственна две частицы или п^ частиц». Вместо того чтобы указывать состояние всего газа, задав номера частиц, находящихся в различных энергетических со- состояниях, следует указать число частиц в этих состояниях, т. е. указать, что имеется п,\ частиц в состоянии с энергией ei, ti2 частиц в состоянии с энергией ег. ') В последнем случае тождественны между собой действительно одина- одинаковые атомы или молекулы, которые ведут себя идентично во всех воз- возможных силовых полях. Поэтому атомы или молекулы, отличающиеся по какому-либо признаку, например, содержащие ядра разных изотопов или находящиеся в разных вращательных состояниях, нужно считать частица- частицами совершенно разного copra. 41 В. Г. Левич, том I
<542 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X Таким образом, описание состояния газа оказывается менее де- детальным, чем в классической статистике. Поскольку нельзя говорить о перестановке частиц внутри данного состояния, теряет смысл деление на п\ Каждое состоя- состояние, независимо от числа частиц, в нем находящихся, имеет равный статистический вес, а именно вес, равный единице. Изменение методики подсчета состояний приводит к суще- существенному изменению вида статистического распределения. Для получения последнего мы воспользуемся методом предыдущего параграфа. Среднее число частиц в состоянии с энергией е& дается формулой Q(nk). G2,1) Теперь, однако, в G2,1) нужно подставить иное значение Q(nh). Поскольку состояние системы, содержащее любое число частиц 0<С«/г<оо, является невырожденным, и необходимость в деле- делении на «1,! отпадает, для числа состояний системы, содержащей nh частиц, вместо G1,3) имеем l. G2,2) При этом мы вновь считали \\ = h3. Подставляя это значение Q(nh) в G2,1), находим G2,3) Суммирование ведется по числу частиц в состоянии с энергией ел. При выполнении суммирования нужно различать два вида ча- частиц, о которых речь шла в § 1: частицы, не подчиняющиеся принципу запрета, и частицы, подчиняющиеся принципу запрета. В первом случае на число частиц, находящихся в индиви- индивидуальном состоянии, не накладывается никаких ограничений. Число их может принимать все целые значения между нулем и полным числом частиц в системе. Таким образом, e ^ • G2,4) nk=Q Заменяя верхний предел суммы на бесконечный, получаем . G2,5)
§ 72] КВАНТОВЫЕ РАСПРЕДЕЛЕНИЯ ДЛЯ ИДЕАЛЬНОГО ГАЗА С43 Если имеет место неравенство e kT <1, G2,6) то сумма в G2,5) представляет бесконечно убывающую геомет- геометрическую прогрессию и может быть без труда вычислена. Именно, кТ откуда -W- ' • G2,7) ± кТ Формула G2,7) дает среднее число частиц идеального газа, находящихся в состоянии с энергией е&, если частицы не под- подчиняются принципу запрета. К этому классу частиц относятся атомы, имеющие спин, равный нулю, молекулы насыщенных соединений также со спином, равным нулю, и кроме того, как будет показано ниже, световые кванты. Распределение G2,7) носит название распределения Бозе — Эйнштейна. Заметим, что, поскольку сходимость суммы G2,5) должна иметь место всегда и при любых значениях энергии, в частности, при 8ft = 0, наряду с неравенством G2,6) должно также иметь место неравенство kT G2,8) Неравенство G2,8) показывает, что у частиц, подчиняющихся распределению Бозе — Эйнштейна, парциальный потенциал должен быть существенно отрицательной величиной: Ц<0. G2,9> Напомним, что в распределении Больцмана \х также суще- существенно отрицательная величина, но всегда весьма большая по- абсолютному значению (ср. § 60). В случае частиц, подчиняющихся принципу запрета, число ¦частиц nh, могущих одновременно находиться в индивидуальном квантовом состоянии, не может превышать единицы. Следова- Следовательно, возможные значения п^ ограничены двумя: «^=0 и 41*
644 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X nh=\. Заменяя верхний предел суммирования в формуле G2,1) на единицу, имеем в*"° ±\п{\+е " J—j^i—. G2,10) Распределение G2,10) представляет распределение по состоя- состояниям частиц идеального газа в случае, когда частицы подчи- подчиняются принципу запрета. Распределение G2,10) получило на- название распределения Ферми — Дирака. Во всех случаях, встречающихся на практике, расстояния между уровнями энергии поступательного движения столь малы по сравнению с тепловой энергией kT, что энергетический спектр можно считать непрерывным. Тогда вместо среднего числа ча- частиц на &-м энергетическом уровне нужно ввести среднее число частиц dn с энергией, лежащей между е и е + бе. Очевидно, dn = ii-rp , где dy/h? — число состояний, отвечающее энергии в интервале е, е + бе. Подставляя среднее значение числа частиц, находящихся в одном состоянии, из G2,7) и G2,10), находим <*« = -W Ж G2и) екТ ±1 где знак плюс относится к распределению Ферми, а знак ми- минус — к распределению Бозе. Входящие в распределения Бозе и Ферми парциальные потенциалы определяются из условия нормирования \ G2,12) выражающего постоянство числа частиц, находящихся в дан- данном объеме. Сравнивая вывод распределений Бозе и Ферми с выводом распределения Максвелла — Больцмана, мы видим прежде всего, что оба эти распределения представляют конкретизацию распределения Гиббса для случая идеального газа, частицы ко- которого подчиняются законам квантовой механики. Имеется глу- глубокое различие в законах статистического распределения у ча- частиц, подчиняющихся законам классической и квантовой меха- механики. Это различие связано не с каким-либо изменением стати- статистических законов и даже не с учетом дискретного характера энергетического спектра, но с коренным изменением метода вы- вычисления статистического веса состояний. Различие в методах подсчета статистических весов в классической статистике и в обеих квантовых статистиках связано с принципом тождествен-
§ 72] КВАНТОВЫЕ РАСПРЕДЕЛЕНИЯ ДЛЯ ИДЕАЛЬНОГО ГАЗА 645 ности частиц и обусловлено глубоким различием между поведе- поведением классических механических систем и поведением атомных частиц. Различие в статистических весах в статистиках Бозе и Ферми обусловлено исключительно различием в законах кван- квантовой механики, которым подчиняются частицы с целым и по- полуцелым спином. В этом смысле часто применяющаяся терми- терминология «классическая статистика» Максвелла — Больцмана или «квантовые статистики» Ферми — Дирака и Бозе — Эйн- Эйнштейна должна быть признана крайне неудачной. В действи- действительности речь идет не о различных видах статистики, а о раз- различных законах квантовой механики, которым подчиняются соответствующие частицы, о двух видах квантовой механики: для частиц с целым и с полуцелым спином. Статистические за- законы во всех случаях остаются совершенно неизменными. Если частицы подчиняются законам квантовой механики, предусма- предусматривающим частицы с целым спином, применение законов ста- статистики приводит к распределению Бозе — Эйнштейна для ча- частиц идеального газа. Если же частицы подчиняются законам квантовой механики, предусматривающим частицы с полуцелым спином, та же самая статистика приводит к распределению Ферми — Дирака. Наконец, если частицы подчиняются зако- законам классической механики, для системы частиц получается распределение Максвелла — Больцмана. Естественно возникает следующий вопрос. Опыт показывает, что движение атомных частиц описывается законами кванто- квантовой механики. Поэтому поведение любого идеального газа, состоящего из атомных частиц, должно описываться одним из квантовых распределений G2,7) или G2,10). Не является ли поэтому распределение Максвелла — Больцмана просто оши- ошибочным, не относящимся к реально существующим газам? От- Отрицательный ответ может быть дан даже без анализа распре- распределений G2,7) и G2,10), на основании общих соображений. Законы квантовой механики являются законами движения ча- частиц, включающими законы классической механики как первое приближение. При известных условиях законы классической ме- механики являются достаточно хорошим приближением; в преде- пределах этого приближения можно считать, что движение частиц подчиняется законам классической механики. Следовательно, должны существовать и такие условия, когда распределение Максвелла — Больцмана с достаточной степенью точности от- отражает фактическое поведение идеальных газов. Газы, подчи- подчиняющиеся классичЪокой статистике, мы будем называть невы- невырожденными. Наоборот, идеальные газы, в поведении которых •существенно сказываются квантовые законы, объединяются об- общим названием вырожденных газов.
646 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. У Нашей первоочередной задачей является обсуждение во- вопроса о том, в каких условиях газ является вырожденным, а а каких— невырожденным, или, иначе говоря, когда можно счи- считать применимой классическую статистику, а когда необходимо учитывать законы квантовой статистики. При решении этого во- вопроса мы будем исходить из того, что правильными, более точными законами являются распределения Бозе — Эйнштейна и Ферми — Дирака. Поэтому законом Максвелла — Больцмана можно пользоваться только тогда, когда различие между ним rifi и квантовыми распределениями G2,7) и G2,10) становится доста- \fs точно малым. Сравнивая распределения G2,7), G2,10) и G1,6), видим, что они имеют в общем случае существен- существенно различный характер (рис. 71). ^V~ \ Однако это различие исчезает, если : выполняется неравенство Рис.74. е*г-»\. G2,13) Все три распределения имеют одинаковый функциональный вид при выполнении неравенства G2,13). Несовпадение кривых на рис. 74 при больших е связано с тем, что этим кривым отвечают разные |i. В этом случае единицей в знаменателе в G2,7) и G2,10) можно пренебречь и распределения Бозе и Ферми авто- автоматически превращаются в распределение Максвелла — Больц- Больцмана. Таким образом, неравенство G2,13) служит условием применимости классической статистики. Для выполнения неравенства G2,13) при энергиях e~kT (при ?>kT экспонента быстро возрастает), нужно, чтобы е kT » 1. Предположим, что последнее неравенство выпол- выполнено, так что при всех энергиях е-ц »«" ±1 Тогда из условия нормирования G2,12) находим N= J e kT jp = jp ekT J e " ye ds--
<§ 72] КВАНТОВЫЕ РАСПРЕДЕЛЕНИЯ ДЛЯ ИДЕАЛЬНОГО ГАЗА 647 •откуда Таким образом, критерием законности применения классической ¦статистики является выполнение неравенства При выполнении обратного неравенства наступает вырождение и пользоваться распределением Максвелла — Больцмана нельзя. Мы видим, чю критерий G2,15) содержит несколько пара- параметров. Прежде всего в него входит масса частиц т — чем -больше масса, тем больше левая часть неравенства. Далее, в неравенство G2,15) входит плотность газа и его температура Т. Как и следовало ожидать, неравенство G2,15) выполнено при высоких температурах и нарушается при низких темпера- температурах, так что при низких температурах должны сказываться квантовые эффекты. Выполнению неравенства G2,15) способ- способствует также малая плотность газа. В обратном предельном случае, когда <l, G2,16) наступает вырождение газов. Таким образом, вырождение мо- может быть обусловлено следующими причинами: 1) малая масса частиц, 2) большая плотность газа, 3) низкая температура. Чтобы составить себе представление о порядке величин, рас- рассмотрим два численных примера. Пусть у нас имеется газ электронов. Масса электрона т = = 9,1 • 10~28 г. Предположим, что плотность электронного газа такова, что в 1 см3 содержится 6-1022 частиц; тогда оказывается, что условие вырождения выполнено вплоть до температур по- порядка 2000—3000° К. Уже в случае атомного водорода, легчайшего из газов, вы- вырождение может наступать только при очень низких темпера- температурах и высоких плотностях, так как масса молекулы водорода в 3700 раз больше массы электрона. Эти температуры и плот- плотности лежат значительно ниже температур и плотностей, при которых становится существенным взаимодействие между ато- атомами, приводящее газ к конденсации. Таким образом, только в случае электронного газа большой плотности вырождение может иметь место при сравнительно высоких температурах.
648 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X Другим случаем квантового (вырожденного) газа является случай фотонного газа, свойства которого будут обсуждаться в § 76. Мы не останавливаемся здесь более подробно на свойстнах распределения Бозе и Ферми, поскольку целесообразнее обсу- обсуди гь их на реальных физических системах (электронный и фо- фотонный газы). Для всех обычных газов отличие квантовой статистики от классической при не особенно больших значениях температур и плотности оказывается ничтожно малым. Оба квантовых рас- распределения, Бозе и Ферми, с большой степенью точности можно заменить распределением Максвелла. Отсутствие какого-либо различия между статистикой Бозе и Ферми станет понятным, если учесть, что среднее число частиц щ в отдельном квантовом состоянии по порядку величины оценивается следующими соот- соотношениями: В невырожденном газе при высокой температуре и малой плотности газа плотность заполнения состояний очень мала. В каждом состоянии в среднем находится гораздо меньше одной частицы, поэтому не играет роли, могут ли в одно состояние попасть две и более частиц или нет, все равно они практически никогда не попадают в него даже попарно. Несмотря на то, что к атомным газам всегда можно приме- применять классическую статистику (точнее, квазиклассическую ста- статистику, поскольку учет дискретных уровней энергии и введение множителя 1/ЛМ являются неизбежными), только создание кван- квантовой статистики позволило решить целый ряд важнейших фи- физических вопросов. Некоторые из них будут изложены в после- последующих параграфах. § 73. Излучение черного тела Статистическая теория излучения сыграла огромную роль в создании квантовой теории. Классическая электромагнитная теория света, объяснявшая широкий круг явлений, связанных с распространением света, и получившая всеобщее признание в конце XIX века, в начале XX века столкнулась с непреодо- непреодолимыми трудностями в связи с вопросом об излучении света,, и в частности, с вопросом о тепловом излучении. Под тепловым излучением мы понимаем всю совокупность излучения, испус- испускаемого нагретым телом. Как известно, характер излучения света, и в частности, его интенсивность, а также зависимость интенсивности от частоты
<§ 73] ИЗЛУЧЕНИЕ ЧЕРНОГО ТЕЛА 649 {спектральный состав излучения) определяются температурой и природой излучающего тела. Имеется, однако, случай, когда спектральный состав излу- излучения не зависит от природы излучателя и определяется исклю- исключительно его температурой. Речь идет о так называемом равно- равновесном излучении. Представим себе некоторую замкнутую полость со стенками, не проводящими тепла и поддерживаемыми при определенной температуре Т. Стенки полости будут излучать и поглощать электромагнитные волны. Поскольку все электромагнитное излучение заключено в замкнутую полость, через некоторое время в системе устано- установится состояние статистического равновесия. Стенки полости будут излучать в единицу времени столько же электромагнит- электромагнитной энергии, сколько они поглощают. В полости будет суще- существовать неизменная во времени система стоячих электромаг- электромагнитных волн. Плотность энергии соответствующего электромагнитного поля внутри полости будет выражаться формулой A2,6) ч. I: _ 8я " Тепловое излучение будет содержать разнообразные частоты. Плотность энергии p(v), приходящаяся на данный интервал ча- частоты afv, будет, очевидно, различна для разных частот. Плог- иость энергии излучения данной частоты будет зависеть также от температуры излучающих стенок Т. Таким образом, p = p(v, T). Простое термодинамическое рассуждение показывает, од- однако, что p(v, 7") не зависит от природы излучателя, в част- частности, стенок (их поглощательных и излучательных свойств, состояния поверхности и т. п.). Рассмотрим две полости, стенки которых нагреты до одина- одинаковой температуры, но сделаны из различных материалов. Предположим, что спектральная плотность энергии излучения зависит от природы излучателя и различна в обеих полостях. Тогда, соединив обе полости, можно нарушить равновесие. Из- Излучение будет переходить в ту полость, в которой его плотность меньше. В результате этого плотность излучения в этой полости вырастет, стенки полости будут поглощать больше излучения, а их температура повысится; между стенками обеих полостей возникает разность температур, которая может быть исполь- использована для получения полезной работы. Сделанное нами предположение приводит к выводу о воз- возможности самопроизвольного нарушения равновесия в замкнутой
550 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X системе и возможности построения вечного двигателя второго- рода, что, как известно, невозможно. Таким образом доказано, что спектральное распределение плотности энергии равновесного излучения p(v, T) является универсальной функцией частоты v и температуры Т. Изучение излучательных и поглощательных свойств мате- материальных тел привело Кирхгофа к установлению весьма важной теоремы, получившей название теоремы Кирхгофа. Назовем излучателыюй способностью произвольного тела ве- величину E(v), равную энергии, излучаемой 1 см2 поверхности тела за 1 секунду с частотой между v и v + dv в единичном ин- интервале частоты. Назовем, далее, поглощательной способностью тела долю- всей падающей на 1 см2 поверхности тела лучистой энергии с частотой между v и v+dv, которая поглощается внутри тела ]) в единичном интервале частоты. Теорема Кирхгофа гласит, что отношение излучателыюй » поглощательной способностей E(v)/A(v) является универсаль- универсальной функцией частоты и температуры тела, но не зависит ни от природы и свойств тел, ни от их геометрических разме- размеров, т. е. Оказывается, что универсальная функция f(v, T) связана простым соотношением с плотностью энергии равновесного из- излучения p(v, Т) (Т — температура тела): где с — скорость света. Итак, теорема Кирхгофа может быть записана в виде X^ = -4-p(v, П Доказательство теоремы Кирхгофа, имеющее весьма общий ха- характер, может быть найдено в любом курсе теории света2). Поскольку поглощательная способность тела может быть найдена без особого труда из измерения коэффициентов погло- поглощения и геометрических соображений, нахождение вида функ- функции p(v, T) представляло весьма существенный интерес. Из формулы Кирхгофа G3,1) вытекает, что особое значение имеет ') Не смешивать с коэффициентом поглощения, который характеризует поглощение света на единицу пути в веществе. Величина пеглощательно» способности характеризует поглощение во всем объеме тела. 2) См., например, М. П л а и к, Теория теплового излучения, ОНТИ, 1935.
<§ 73] ИЗЛУЧЕНИЕ ЧПРНОГО ТЕЛА 651 тело с поглощательной способностью A(v), равной единице. Такое тело поглощает всю падающую на него электромагнитную энергию любых частот. Оно было названо абсолютно черным телом. Для абсолютно черного тела имеем ?(v) = -^p(v, T). G3,2) Формула G3,2) показывает, что абсолютно черное тело имеет большую излучательную способность, чем все другие тела, Его излучательная способность является унирерсальной функцией частоты v и температуры Т. Измеряя излучательную способность абсолютно черного тела, можно на опыте определить вид функции p(v, T). Разумеется, все тела, существующие в природе, не являются абсолютно черными. Какова бы ни была природа поверхности тела, некоторая часть падающей на нее лучистой энергии отра- отражается. Однако абсолютно черным телом является замкнутая полость, заполненная излучением, которую мы рассматривали выше. Действительно, все излучение, испускаемое стенками по- полости, ими же и поглощается. Если сделать в полости малень- маленькое отверстие, то изучая спектральное распределение лучистой энергии, выходящей из отверстия, можно экспериментально найти функцию p(v, 7"). Размеры отверстия должны быть до- достаточно малы, чтобы утечка энергии через отверстие не приво- приводила к существенному отклонению от состояния равновесия. С помощью подобного рода модели абсолютно черного тела ¦было экспериментально изучено спектральное распределение энергии при различных температурах. На рис. 75 (см. стр. 656) приведены типичные кривые подоб- подобного рода. По оси абсцисс отложена длина волны зыходящего излучения, по оси ординат — плотность энергии излучения р(дГ) с длиной волны, лежащей между К и ). + dh. Плотность энергии излучения с данной длиной волны связана с p(v, T) ¦следующим соотношением: p(v, T)dv = p(X, T)dX. Учитывая, что имеем -?-p(v, T). Различные кривые на рис. 75 относятся к различным тем- температурам. Все кривые обнаруживают характерный ход. При больших длинах волн плотность излучения увеличивается с
E52 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X ростом К, при некоторой длине волны Хмакс она проходит через максимум и вновь стремится к нулю со стороны коротких волн. Положение максимума сдвигается в сторону коротких воли па мере повышения температуры. § 74. Классическая теория черного излучения Перейдем теперь к вычислению функции спектрального рас- распределения p(v, T). Электромагнитное излучение в замкнутой полости образует систему стоячих волн. Такое электромагнитное поле было рас- рассмотрено нами в § 38 ч. I, где было показано, что оно может быть заменено набором эквивалентных осцилляторов поля. Энергия поля оказалась равной сумме энергий осцилляторов. В случае излучения в полости ему, в соответствии со сказанным выше, следует приписать температуру, равную температуре из- излучающих стенок Т. Мы можем поэтому сказать, что каждой стоячей волне в полости соответствует один осциллятор с ча- частотой v и энергией e(v\ Г), зависящей or частоты, а также от температуры Т. Каждый из осцилляторов, заменяющих систему стоячих вол», может находиться в различных состояниях и иметь раз- различную энергию e(v, T). Нас, однако, будет интересовать не мгновенная, а средняя энергия осцилляторов e(v, T); здесь усреднение ведется по всем возможным состояниям осцилля- осциллятора. Энергия стоячих волн в единице объема полости, частоты которых заключены между v и v + dv, численно равна суммар- суммарной средней энергии всех осцилляторов, заменяющих нормаль- нормальные колебания и имеющих частоты в том же интервале. Если g(v)dv — число осцилляторов, то сказанное можно записать в виде p(v, 7>*v = e(v, T)g(v)dv. G4,1) Число собственных колебаний было найдено нами в § 38 ч. I. В случае электромагнитных волн нужно только учесть, что< они являются поляризованными и могут иметь два направления поляризации. Формула C8,22) ч. I дает число колебаний с ча- частотой между v и v + dv для каждого вида поляризации. Для обоих видов поляризации число колебаний нужно удвоить: p(v, T)dv=^v*dv. G4,2). Формула G4,2) при своем выводе не потребовала привле- привлечения каких-либо представлений из квантовой теории, она была получена до создания квантовой теории. Для средней энергии
§ 74] КЛАССИЧЕСКАЯ ТЕОРИЯ ЧЕРНОГО ИЗЛУЧЕНИЯ 653 осциллятора ё было подставлено ее классическое значение и плотность равновесного излучения при температуре Т запи- записывалась в виде (закон Рэлея — Джинса) P(v, T)dv = ^v*dv. G4,3) Бессмысленность формулы G4,3) совершенно очевидна. Дей- Действительно, она показывает, что плотность энергии электромаг- электромагнитного поля в замкнутой полости монотонно возрастает с уве- увеличением частоты. Поскольку в полости могут быть представ- представлены колебания всех частот, в частности v-> со, формула G4,3) приводит к бесконечно большой плотности энергии при v->¦<»: Е = Jp(v, T)dv-+oo. Полученный результат означает, что источники излучения, заключенные в полости, должны были бы излучать до тех пор, пока вся заключенная в них тепловая энергия не перешла бы в излучение поля и их температура не упала бы до абсолютного нуля. Так, например, если излучателем, помещенным в полость, служит раскаленное твердое тело, то из полученного результата вытекает, что равновесие в системе излучатель — электромаг- электромагнитное поле установится только после того, как раскаленное тело охладится до абсолютного нуля. Этот вывод имеет простой смысл. Согласно закону равно- равномерного распределения энергии все степени свободы равно- равноправны и в равновесном состоянии на каждую из них прихо- приходится равная энергия. Тепловая энергия, заключенная в излу- излучателе— кристалле, содержащем N атомов, может считаться распределенной между 3jV осцилляторами. Электромагнитное поле в полости также можно рассматривать как набор осцилля- осцилляторов. Однако число последних неизмеримо больше, чем 3N. Волновые числа возможных стоячих волн в замкнутой полости, имеющей форму куба, должны удовлетворять условиям: г _ Jtfe] г _ ЛЙ2 z _ -tfea /1 — ~?~ г /2 ~2Г~ ' '3 L ' где L — размер стороны куба, a ku &2> &з — числа, пробегающие ряд целых значений от нуля до бесконечности. Эти условия эквивалентны условиям E0,11) для кристалла, но в последнем случае значения ku k2 и k3 ограничены числом частиц N. Таким образом, число стоячих электромагнитных волн в полости и
С54 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X соответствующее число осцилляторов электромагнитного поля в бесконечно большое число раз больше, чем число осциллято- осцилляторов, требуемых для описания теплового движения в кристалле. В состоянии равновесия вся энергия должна содержаться у поля, поскольку на каждый осциллятор должна приходиться одинаковая энергия. Этот результат находится в полном противоречии с опыт- опытными данными. Опыт показывает, что плотность тепловой энер- энергии, заключенной в излучателе, неизмеримо выше, чем плот- плотность энергии электромагнитного поля; например, при Т— = 300° К плотность тепловой энергии в твердом теле оказывается в 1С14 раз больше измеренной плотности энергии внутри полости с излучением. Что касается спектрального распределения плот- плотности энергии, выражаемого формулой G4,3), то оно оказы- оказывается в согласии с измеренным распределением энергии и спектре черного тела для малых частот, удовлетворяющих усло- условию hv^ikT. Наоборот, при больших частотах, когда h\%>kT, рос г p(v, T) с частотой v происходит гораздо медленнее, чем но закону v2. Таким образом, закон равномерного распределения при его применении к проблеме излучения черного тела приводит к пол- кому расхождению теории с экспериментом в области больших частот. Исторически это было первым хорошо изученным слу- случаем полной непригодности классических представлений. Во- Вопиющее противоречие с опытом, к которому привела классиче- классическая статистика, побудило современников называть создавшееся положение «ультрафиолетовой катастрофой». Выход из проти- противоречия был найден в создании квантовой теории. § 75. Формула Планка Простейший, хотя и не самый прозрачный с физической сто- стороны способ получения функции спектрального распределения p(v, 7") с учетом квантования заключается в следующем. Подставим в формулу G4,2) значение средней энергии ос- осциллятора поля, вычисленное по теории квантового осциллятора. При этом опустим нулевую энергию осциллятора /iv/2, выбирая ее за начало отсчета энергии. Тогда e-nhv hvn hv 2 ne kT V e *T~ Av hv ekT -1 G5,1) G5,2)
§ 75] ФОРМУЛА ПЛАНКА 655 Подставив G5,2) в формулу G4,2), находим следующее выра- выражение для средней энер1ии электромагнитного поля в пустоте в единице объема для частоты, лежащей между v и v + dv: p(v, T)dv = —-/—j- r- G5,3) (e " - l) Формула G5,3) получила название формулы Планка. Фор- Формула Планка впервые была выведена полуэмпирически, по- поскольку неизвестна была формула G5,2) для энергии осцилля- осциллятора. Наоборот, последняя формула и входящая в нее постоян- постоянная Планка h были найдены из опыта. В двух предельных случаях, -г=г -С 1 и -r^r^l, формула Планка упрощается. В первом случае ек « 1 +-?уг и формула G5,3) сводится к виду p(v, 7Vv~-^v2rfv, G5,4) т. е. переходит в классическую формулу G4,3) для средней плотности энергии черного излучения. При -|f> 1 1 д кТ hv_ ~ е • ект-1 так что р (v, 7") dv « —?- е kT dv. G5,5> Последняя формула носит название закона Вика. Переходя от p(v, T) к спектральному распределению плот- плотности излучения по длинам волн p(v, T), можем написать фор- формулы G5,3), G5,4) и G5,5) в следующем виде: в кП -1 Р(Л. V-Zg-.-t}—. G5,6) G5,7) (^) G5,8)
656 РЛСМРЬДЬЛЬНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X Кривые, отвечающие формуле G5,6), изображены на рис. 75. При больших длинах волн р(к, Т) падает с увеличением волны, как 1Д4; при малых длинах волн p(?s T) стремится к нулю, как -j$e кТХ . Функция р(А, Т) имеет максимум при дли- длине ВОЛНЫ Я,макс1 КОТОРУЮ можно найти из условия др(Х, Г ¦О или I he е — 1 hce he JfT *? \2 -l) • = 0. Обозначив через х величи- hc ~м-л'л ¦1—Т--ПУЯ- НУ Тт1 > можно записать ^1—? ?—4 i ft—7—Я О ~~1п лмакс г з * л о / о у tup последнее уравнение в виде Рис. 75. Решение этого трансцендентного уравнения дает XT G5,9) ¦Формула G5,9) показывает, что положение максимума плот- плотности энергии черного излучения смещается в сторону малых длин колн с ростом температуры. Это — так называемый закон смешения. Из закона смещения может быть определено значение кван- квантовой постоянной h. После выбора ее значения формула Плаика оказывается в отличном согласии с экспериментальными данными. § 76. Статистика фотонного газа Как мы уже указывали в вводной главе, современная кван- квантовая теория в согласии с опытными фактами утверждает, что наряду с волновыми свойствами излучение обладает также и свойствами корпускулярными. Хотя с точки зрения обыденных
§76] СТАТИСТИКА ФОТОННОГО I Л ЗА 657 представлений невозможно сочетать в одном объекте свойства волны и частицы, для объяснения различных оптических явле- явлений приходится пользоваться то волновым, то корпускулярным аспектом. Так, например, в явлениях интерференции или ди- дифракции проявляется волновая природа излучения, тогда как при фотоэффекте или рассеянии жестких рентгеновских лучей проявляется корпускулярная природа. С корпускулярной точки зрения излучение можно рассматривать как поток световых квантов, или фотонов, движущихся в пространстве со скоростью света с. Фотоны возникают при излучении и исчезают при по- поглощении света атомами, причем их энергия равна е = Д?, где АЕ — разность энергетических уровней излучающей системы. Все фотоны движутся в пустоте с одинаковой скоростью, но различные фотоны могут иметь разную энергию и импульс. Энергия и импульс фотонов связаны между собой соотношением е = рс, G6,1) которое является общей формулой, связывающей эти величины для любого объекта, движущегося со скоростью света. Энер- Энергия и импульс фотона зависят от частоты по формулам: е = hv = /но, G6,2) Подобно другим материальным частицам фотоны обладают моментом количества движения (ср. § 1, а также ч. V). Оказывается, что при излучении механический момент из- излучающей системы (атома, молекулы) должен обязательно уменьшаться на величину, кратную й. Соответствующий момент уносится улетающим фотоном. Таким образом, момент количе- количества движения, выраженный в единицах й, является целочис- целочисленным. Как и все другие частицы с целочисленным моментом, фотоны подчиняются статистике Бозе — Эйнштейна. С корпускулярной точки зрения равновесное излучение, за- заполняющее замкнутую полость, нужно рассматривать как неко- некоторый фотонный газ, заполяющий объем сосуда V. Частицы фотонного газа беспорядочно движутся по всем направлениям в сосуде, причем направления их полета изменяются при столк- столкновениях со стенками сосуда. Взаимодействие между фотонами отсутствует. Поэтому фотонный газ по своим свойствам должен быть сходен с обычным молекулярным идеальным газом, запол- заполняющим замкнутый сосуд. Однако наряду со сходством между фотонным и молеку- молекулярным газами имеется и очень существенное различие. Наибо- Наиболее существенное отличие фотонного газа от молекулярного 42 В. Г. Лсвич, том I
658 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X заключается в том, что в случае фотонного газа нельзя говорить о фиксированном числе частиц. В отличие от обычных частиц (электронов, протонов или атомов), фотоны могут создаваться или исчезать в момент испускания или поглощения света ато- атомами. Поэтому число фотонов, находящихся в полости, нельзя считать заданным. Другим отличием фотонов от газовых молекул является то, что все они движутся с одинаковыми скоростями. В действи- действительности, однако, это свойство фотонного газа не связано со специфической природой фотонов. При очень больших значе- значениях кинетической энергии любых частиц их скорости прибли- приближаются к скорости света и различия в скорости отдельных частиц постепенно сглаживаются. Поэтому последнее отличие фотонного газа от молекулярного является несущественным. Важно лишь, что в фотонном газе, так же как в молекулярном, имеется некоторое распределение частиц по импульсам и энергиям. Наконец, между фотонным газом и газом обычных частиц существует еще одно отличие, имеющее скорее принципиальный, нежели практический характер. Как было показано в § 6 и 16,. установление распределения молекул по скоростям (или им- импульсам) тесно связано с взаимодействием между ними, про- происходящим при молекулярных столкновениях. Фотоны же вовсе не сталкиваются между собой. Равновесное распределение ме- между фотонами может установиться только в том случае, если в полости превращение фотонов одних частот в фотоны других частот. При этом число фотонов не должно оставаться постоян- постоянным, но должна сохраняться их полная энергия. Таким телом, в частности, могут служить стенки полости, заполненной «фо- «фотонным газом». Мы покажем сейчас, что, исходя из представлений о фотон- фотонном газе, можно с таким же успехом прийти к формуле Планка, как и при использовании волновой картины. С корпускулярной точки зрения функцию р(со, Т) можно ин- интерпретировать следующим образом. Пусть в интервале частот со, co+'ofco или соответствующем ему интервале энергий фотонов е, е + de в единице объема имеется dQ, квантовых состояний фотонов. Пусть, далее, среднее число фотонов в каждом состоянии равно п(г). Тогда среднее число фотонов с энергией между е и е + de равно dfi = n(B)dQ. G6,4) Их средняя энергия равна nn(e)dQ. Но эта энергия представ- представляет не что иное, как энергию излучения с частотой между о> и о +, d(n. Таким образом, p(B,T)d& = en(e)dQ. G6,5)
$ 76] СТАТИСТИКА ФОТОННОГО ГАЗА 659 Нашей задачей является нахождение п(е), т. е. среднего числа частиц в газе с переменным числом частиц. Учитывая, что фотоны являются частицами со спином, равным единице, для Я (г) можно написать распределение Бозе — Эйнштейна. Необходимо, однако, учесть особенность фотонного газа, ¦связанную с возможностью поглощения и излучения фотонов •стенками сосуда или материальными телами, находящимися внутри полости. Число частиц в фотонном газе является переменным и за- зависит от состояния газа. Поэтому в отличие от обычного моле- молекулярного газа свободная энергия фотонного газа зависит не только от переменных V и Т, но также и от числа частиц в газе N. При данном значении V и Т число фотонов в состоянии равновесия будет иметь такое значение NQ, чтобы свободная энергия F(V, T, No) имела минимальное значение. Таким обра- образом, можно утверждать, что равновесное состояние фотонного газа имеет место при выполнении равенства П-О. G6,6) При этом мы воспользовались формулой F0,3'). Уравнение G6,6) показывает, что парциальный потенциат равновесного фотонного газа равен нулю. Таким образом, среднее число частиц фотонного газа в еди- единице объема, обладающих энергией е, в силу G2,7) и G6,6) следует написать в виде й(е) = —г • ekT -1 Число фотонов с энергией между е и е + de равно dn (.) - ^ *%ЛР " W -1Г- ¦ G6>8) ект -1 е"-1 Множитель 2 введен для того, чтобы учесть факт двукрат- двукратного вырождения состояний фотонов с заданным импульсом р. Данному значению р отвечают два состояния, соответствую- соответствующих двум возможным поляризациям света. Полное число фотонов в равновесном излучении может быть найдено интегрированием G6,8) по всем значениям е. Воспользовавшись формулой G6,2), можно выразить е через частоту (о. Делая эту замену и переходя от числа фотонов к их энергии, находим р(ш, rjAa-enWdQ^-jjipr-^- = -г-^ г-, G6,9) «*г-1 U J -г^г, U *г — 1J т. е. формулу Планка, 42*
66Q РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X Нужно подчеркнуть, что если бы к фотонам было применено распределение Больцмана, а не распределение Бозе — Эйн- Эйнштейна, то вместо формулы Планка получилась бы формула G5,5), справедливая только при -г=-!§> 1. Действительно, под- подставляя вместо п(е) из G6,7) выражение п = е кТ=е *г, вме- вместо формулы Планка G6,9) получим закон Вина G5,5). Таким образом, применять к фотонам классическую стати- статистику нельзя. Область применимости классической статистики к фотонному газу ограничена условием -rf ^> 1. Это условие является обратным по сравнению с условием применимости классической статистики к осцилляторам электромагнитного поля. Итак, при больших частотах (или низких температурах) у излучения преобладают корпускулярные свойства; при малых частотах (или высоких температурах), наоборот, преобладают волновые свойства. Энергия электромагнитного излучения или энергия фотон- фотонного газа в единице объема получается из G6,9) интегрирова- интегрированием по всем частотам: ОО DO Г / т\ J Й f (О3 rffi) и= J р(со, Т)й<й = -^г J -яй- . о о ект _ j Для вычисления интеграла введем новую переменную, х = -г~-. Тогда ОО Д (kT\4 Г хЫх и = —т h ) J ex - 1 * о Значение последнего интеграла получено в приложении IV: оо Г хЫх _ п1 J ex-\ ~ 15 ' Поэтому окончательно имеем Энергия черного излучения оказывается пропорциональной четвертой степени абсолютной температуры (закон Стефана — Больцмана). Входящая в G6,10) постоянная а содержит только универ- универсальные константы h, с и k. Закон Стефана—Больцмана широ«
§ 77] СТАТИСТИКА ФОТОННОГО ГАЗА 66В ко применяется в теплотехнике для расчета излучающей спо- способности нагретых поверхностей. Хотя излучатели, встречаю- встречающиеся на практике, не являются черным телом, применение закона Стефана — Больцмана приводит к хорошим результатам для всех твердых излучателей, кроме металлов. У последних излучаемая энергия растет, как более высокая степень тем- температуры. Полная энергия излучения в объеме V равна Е = aVT\ G6,11)- Найдем, далее, свободную энергию черного излучения. Па формуле C0,12) имеем f==_rJ^L=_jUp. G6I2> Энтропия излучения равна S=--^ = |-aVT3. G6,13> Давление излучения р равно dF _ аГ _ Е ,_fi 14V P---dV~T~-W G6,14). Давление излучения впервые было обнаружено П. Н. Лебе- Лебедевым. Это открытие имело большое принципиальное значение. Оно позволило доказать невозможность построения вечного дви- двигателя второго рода, в котором в качестве рабочего вещества использовалось бы излучение. Световое давление, весьма малое в земных условиях, приоб- приобретает чрезвычайно важное значение в астрофизике. Как пока- показывает формула G6,14), световое давление чрезвычайно быстро увеличивается с ростом температуры. При весьма высоких тем- температурах, имеющих место в астрофизических условиях, свето- световое давление оказывается большим, чем газовое давление, и играет основную роль в ряде разнообразных астрофизических процессов. Наконец, простое вычисление показывает, что термодинами- термодинамический потенциал Ф излучения равен нулю: ф = f + pV = 0. Это согласуется с нашим требованием ц = 0 для фотонного» газа.
€62 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ (Гл. X § 77. Свойства жидкого гелия II Весьма интересным примером макроскопической системы, в которой сказываются квантовые эффекты, является жидким гелий II — единственная система, которая остается жидкой «плоть до абсолютного нуля. Все остальные жидкости отвер- отвердевают при температурах, которые слишком высоки для того, чтобы при них могли проявляться квантовые эффекты. Как показывает опыт, жидкий гелий может существовать в двух модификациях, получивших название жидкого гелия I и жидкого гелия II, резко отличающихся друг от друга по своим физическим свойствам. С, /юл/г град Z5 1.0 На рис. 67 (см. стр. 608) изображена фазовая диаграмма телия. Из нее видно, что при давлениях, лежащих выше 30 атм, жидкий гелий I, представляющий высокотемпературную моди- модификацию, при понижении температуры переходит в твердое со- состояние. Однако при давлениях ниже 30 атм гелий не затвер- затвердевает ни при каких температурах и остается жидким вплоть до Т = 0°. На кривой // происходит фазовый переход гелия I в другую модификацию. Об этом свидетельствует ход теплоем- теплоемкости (рис. 76), плотности и ряда других свойств гелия в зави- зависимости от температуры. Теплоемкость претерпевает скачок в точке перехода; на кривой плотности в этой точке наблюдается излом и т. д. Поскольку скрытая теплота фазового перехода гелий I — гелий II равна нулю, этот фазовый переход является типичным фазовым переходом второго рода. Жидкий гелий II обладает целым рядом замечательных свойств, обусловленных его квантовой природой. Некоторые из них будут описаны ниже1). ') См. книгу В. Кеезом, Гелий, ИЛ, 1949 (изложению которой мы сле- следуем).
§ 77] СВОЙСТВО ЖИДКОГО ГЕЛИЯ И 663 Л. Д. Ландау была предложена статистическая теория жидкого гелия II, основанная на известных допущениях о ха- характере энергетического спектра этой системы. В части V будут изложены новые работы по теории гелия II. В этих работах предположения, положенные в основу теории Ландау, выведены из общих положений квантовой механики системы частиц. Рассмотрим некоторую порцию жидкого гелия II, заключен- заключенную в сосуд. Вся жидкость как целое представляет квантовую систему; ее возможные значения энергии образуют некоторый энергетический спектр. При очень низких температурах прене- пренебрегать дискретным характером энергетического спектра жидко- жидкости нельзя, несмотря на то, что жидкость является макроскопи- макроскопической системой. Нам нужно определить характер энергетиче- энергетического спектра макроскопической квантовой системы при весьма малых энергиях возбуждения, когда система может находиться только на уровнях энергии, близких к нормальному уровню, па котором она находится при абсолютном нуле. Точное вычисление энергетических уровней системы, состоя- состоящей из большого числа сильно взаимодействующих частиц, покл не представляется возможным. Это в равной мере относится к жидкому гелию II, к кристаллам, к взаимодействующим ме- между собой электронам и любым другим системам взаимодей- взаимодействующих частиц. Тем не менее можно установить некоторые общие свойства энергетического спектра таких систем при ма- малых энергиях возбуждения. В частности, подобным энергетиче- энергетическим спектром будет обладать и жидкий гелий II, в котором малость энергии возбуждения обеспечивается температурой. Основным свойством энергетического спектра всякой ма- макроскопической системы при малых энергиях возбуждения яв- является то, что энергию возбуждения можно разложить на сово- совокупность независимых «элементарных возбуждений». Рассмотрим для конкретности энергетический спектр упру- упругих колебаний кристалла или жидкости при малых энергиях возбуждения. Мы видели ранее, что движение атомов твердого- тела можно разложить на независимые, не взаимодействующие друг с другом упругие волны, распространяющиеся по всему объему тела. Единственным различием между кристаллом и квантовой жидкостью является то, что в первом возможно рас- распространение как продольных, так и поперечных волн, тогда как в жидкости могут существовать только продольные волны (волны сжатия и расширения). Каждая из таких волн несет определенную неизменную энергию, которая и может считаться элементарным возбуждением. Энергию всего тела можно рас- рассматривать как совокупность элементарных возбуждений, т. о. как сумму энергий всех независимых упругих волн, распростра- распространяющихся в теле. Из сказанного ясно, что элементарное
604 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ (Гл X возбуждение является энергией возбуждения всего тела как це- целого, но отнюдь не может быть отнесено к отдельному атому в теле, получившему избыточную по сравнению с другими атомами энергию. Каждое из элементарных возбуждений, представляю- представляющих звуковую волну, движется вдоль тела, испытывает отра- отражение от его стенок, движется в новом направлении и т. д. Элементарное возбуждение обладает энергией и импульсом. Движение всех элементарных возбуждений в теле можно уподобить движению невзаимодействующих квазичастиц, кван- квантов возбуждения, образующих внутри тела идеальный газ. Можно провести полную аналогию между световыми волнами и световыми квантами, с одной стороны, и упругими волнами и квантами возбуждения кристалла, с другой стороны. Подобно тому как световое поле можно трактовать как набор световых квантов (фотонов), поле упругих волн в кристалле можно за- заменить газом квантов возбуждения, часто называемых фононами. Следует, однако, сделать существенную оговорку. Эта ана- аналогия, очень удобная для выполнения ряда расчетов, имеет лишь формальный характер. Звуковые кванты не имеют непо- непосредственной физической реальности и служат лишь для мате- математического выражения свойств дискретного набора упругих волн в кристалле, поскольку система независимых упругих волн является приближенной картиной теплового движения в твер- твердом теле. Имея в виду эту оговорку, мы будем в дальнейшем считать, что энергия возбуждения тела представляет энергию квантов возбуждения, заполняющих весь его объем подобно идеальному газу. Энергия квантов возбуждения е связана неко- некоторой, в общем случае неизвестной функциональной зависимо- зависимостью с их импульсом р. Рассмотрим теперь детальнее энергетический спектр в слу- случае жидкого гелия1). Основные свойства жидкого гелия можно вывести из некоторых простых предположений о виде спектра. Именно, следует предположить, что в гелии II имеются два вида квантов возбуждения — длинноволновые и коротковолновые. Первые кванты, имеющие большую длину волны X, несут малый импульс Р = т и малую энергию г{р). При малых р можно разложить функцию г(р) в ряд по степеням р и написать е ~ const • р. G7,1) Длинноволновые возбуждения в жидком гелии II представ- представляют упругие продольные волны расширения и сжатия. По- ') К вопросу об энергетическом спектре гелия II мы вернемся в ч. VI. Вопрос о коллективных возбуждениях также будет более подробно разобран в ч. VI,
77] СВОЙСТВО ЖИДКОГО ГЕЛИЯ П 665 этому постоянная в G7,1) есть просто скорость с распростра- распространения звуковых волн. Таким образом, для длинноволновых кван- квантов можно написать е = ср. G7,2) В гидродинамике показывается, что при возникновении з жидкости звуковых волн малой амплитуды она приходит в со- состояние безвихревого (потенциального) движения. Однако в общем случае течение неидеалыюй (вязкой) жидкости является вихревым. Поэтому помимо продольных звуковых волн в жидком гелии II должны существовать и другие элементарные воз- возбуждения. Именно, мы будем предполагать, что помимо длинноволновых звуковых квантов возбуждения в гелии II существу- существуют еще и коротковолновые кванты возбуж- возбуждения, длина волны которых близка к не- некоторой длине Ко- Соответствующий им- импульс коротковолновых квантов близок к ро = -»-.При этом мы примем, что энергия квантов с импульсом р0 имеет минималь- минимальное значение по сравнению со всеми кван- квантами, импульсы которых близки к ро. Ины- Иными словами, мы будем считать, что энергия элементарных возбуждений имеет вид кри- кривой, изображенной на рис. 77. Тогда можно сказать, что в жидкости помимо длинноволновых квантов воз- возбуждения, импульс которых близок к нулю, будут существо- существовать еще кванты с импульсом р~ро- Энергия таких квантов может быть написана в виде (Р-РоJ 2р. ' где е(ро) и ц — постоянные, значения которых должны быть определены из опыта. В разложении G7,3) по степеням (р — р0) член, пропорциональный первой степени этой разности, отсут- отсутствует, поскольку, по предположению, е(р) имеет в точке р — Ро минимум. Постоянная во втором члене обозначена через ц, чем подчеркивается, что энергия коротковолновых квантов формально выглядит так же, как энергия обычных частиц. Разумеется, нет никаких оснований заранее предполагать, что в спектре возбуждения квантовой жидкости преимуществен- преимущественно существуют кванты двух указанных типов. Однако введение подобного вида спектра оправдывается тем, что с его помощью оказывается возможным количественное объяснение всех свое» образных явлений, имеющих место в гелии П. ид" 210е РА см-' Рис. 77. (р0) G7,3)
РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл X Вместе с тем нужно иметь в виду, что кроме коротко- и длин- яоволновых квантов возбуждения в жидкости имеются и кванты промежуточных длин волн, но число таких квантов сравни- сравнительно невелико. Кванты возбуждения, как мы только что под- подчеркивали, движутся по всему объему тела, не взаимодействуй (при малых возбуждениях) друг с другом, подобно частицам идеального газа, заполняющего объем тела. Если длинновол- длинноволновые кванты возбуждения можно уподобить фотонам, коротко- коротковолновые кванты ведут себя, как обычные частицы идеального газа, обладающие массой ц. Во избежание каких-либо недоразумений, подчеркнем еще раз, что эта аналогия имеет лишь математический характер. В действительности каждый квант возбуждения представляет ¦особый вид движения всех атомов жидкости. Нельзя поэтому представлять коротковолновый квант возбуждения как реаль- реальную частицу, движущуюся в жидкости. Однако математическая аналогия между набором квантов возбуждения и идеальным газом позволяет легко найти термодинамические функции жидкого гелия. $ 78. Статистическая теория жидкого гелия II Наличие в жидком гелии II квантов теплового возбуждения означает, с макроскопической точки зрения, существование у него свободной энергии F, которую можно считать слагающейся из свободной энергии, обязанной своим происхождением суще- существованию длинно- и коротковолновых квантов возбуждения: F = Fa+'FK. G8,1) Напишем выражение для каждого из слагаемых в отдель- отдельности. Свободную энергию длинноволновых квантов Ря можем сразу написать по аналогии со свободной энергией твердого тела при низкой температуре, учитывая, что теперь могут суще- существовать только продольные волны, а поперечные отсутствуют. Таким образом, 3tf = —^?, G8,2) где N — число атомов жидкости в объеме V, vMaKc — максималь- максимальная частота звуковых волн и с — скорость звука. Поэтому, подставляя в E3,7) значение 6С = ——$¦ и учиты- к вая G8,2), находим для F^: р _ 4 я* (kTY V
§ 78] СТАТИСТИЧЕСКАЯ ТЕОРИЯ ЖИДКОГО ГЕЛИЯ II 667 Несколько более сложным является вычисление FK. Корот- Коротковолновые кванты ведут себя подобно частицам идеального газа. Их энергию, определяемую формулой G7,3), при доста- достаточно низких температурах, когда еще можно говорить о неза- независимых элементарных возбуждениях, можно считать большой по сравнению с kT. Для этого во всяком случае должно выпол- выполняться неравенство е(ро)»"йГ Мы увидим ниже, что последнее неравенство действительно вы- выполнено в жидком гелии П. Поэтому функция распределения коротковолновых квантов имеет вид классического больцманов- ского распределения. Свободная энергия классического идеаль- идеального газа (с учетом тождественности частиц) имеет вид ^) G8,4) (d\ = dpx dp y dpz), где iVK — число коротковолновых квантов возбуждения. Значе- Значение iVK не является, однако, определенной величиной, но зависит от температуры жидкости. Оно возрастает с увеличением воз- возбуждения, т. е. с повышением температуры жидкости1). При данной температуре число коротковолновых квантов возбужде- возбуждения определяется из условия минимума свободной энергии: = ® G8,5) Подставляя G8,4) в условие G8,5), находим для числа корот- коротковолновых квантов выражение kT i? • G8,6) Подставляя Nh в G8,4), находим для свободной энергии FK=-kTV JY17 Q. G8,7) Вычислим интеграл, входящий в G8,7). Очевидно, имеем л «_ d /• _ 8 to) .iPr^ll 2rfp J e kT~h? =*я) е кТ е ШТ ~?~ = __ g(Po) (• (Р-Ро1а 2 , — 4tr/» *Г С 2№Т Р Р -чле j e Лз • ') Зависимость NK от температуры лишний раз позволяет убедиться в том, что трактовка элементарных возбуждений как квазичастиц имеет услов- условный характер.
-668 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X Пределы интегрирования по импульсу кванта возбуждения точ- точно не определены. Поскольку, однако, подынтегральное выраже- выражение быстро убывает с возрастанием разности (р— р0) и при ^ Ро >¦ kT практически обращается в нуль, можно распро- распространить пределы интегрирования до ±оо. Тогда имеем j e h3 -4ite j ±Ы "г (р-РоУ . е 2ц^г Р dP Поскольку подынтегральная функция обращается в нуль при р~ ~> kT, медленно меняющуюся функцию р2 можно вы- вынести за знак интеграла, взяв ее в точке р = р0. При этом G8,8) Таким образом, окончательно получаем ^е"^", G8,9) 4$-. G8,10) Подставляя значения f;i и FK из G8,3) и G8,9) в G8,1), находим выражение для свободной энергии жидкого гелия II: Соответственно энтропия и теплоемкость гелия II равны — 45 ft3c3 ft3 v 2 kT I ' v0,1^/ 16 Мы видим, что все термодинамические величины слагаются из двух частей, обязанных своим происхождением длинновол- длинноволновым и коротковолновым квантам возбуждения. Первая часть изменяется с температурой по такому же степенному закону,
§ 78] СТАТИСТИЧЕСКАЯ ТЕОРИЯ ЖИДКОГО ГЕЛИЯ II 669 как и в случае кристаллов, вторая зависит от температуры экспоненциально, т. е. пропорционально exp-j — е^ >. Значе- Значения постоянных были определены из измерений энтропии и теплоемкости гелия II и оказались равными *№¦ = 9,6° К, -^ = 12,25 • 108 см~\ ц = 0,75тИе. При таком значении постоянных степенная часть теплоемкости и энтропии превышает экспоненциальную при температурах, меньших примерно 1° К. Наоборот, при больших температурах преобладает экспоненциальная (коротковолновая) часть. Тем- Температурный ход термодинамических величин находится в пол- полном согласии с опытом. Самой замечательной особенностью жидкого гелия II, кото- которая была открыта П. Л. Капицей, является присущее ему свой- свойство «сверхтекучести». Именно, измерения вязкости гелия II, протекающего через тонкие щели и капилляры, показали, что она исчезающе мала. Благодаря этому гелий II практически беспрепятственно «проваливается» через тончайшие капилляры. Следствием сверхтекучести гелия II является его необычайно высокая теплопроводность («сверхтеплопроводность»), обнару- обнаруженная экспериментально ранее, чем сама сверхтекучесть. Бла- Благодаря исчезающей вязкости в гелии II возникают характерные конвекционные потоки, которые позволяют переносить значи- значительные количества тепла в таких условиях, в которых обычная вязкая жидкость, лишенная конвекционного перемешивания, имеет ничтожно малую теплопроводность. ЯвлеЕше сверхтеку- сверхтекучести находит полное разъяснение в изложенной выше теории. Оно оказывается тесно связанным с характером энергетического спектра гелия II. Рассмотрим течение гелия II вдоль некоторой твердой стен- стенки. Для удобства рассуждений перейдем к системе отсчета, в которой гелий покоится, а движется твердая стенка. С точки зрения квантов возбуждения всякий процесс рассеяния энергии, обусловленный вязкостью, можно рассматривать следующим образом. В выбранной нами системе отсчета энергия гелия первоначально задана и определяется количеством элементар- элементарных тепловых возбуждений. Взаимодействие между стенкой, увлекающей гелий, и жидкостью приводит к появлению в при- пристеночном слое жидкости дополнительного внутреннего движе- движения. Это внутреннее движение представляет тепловое движение частиц жидкости. Таким образом, рассеяние энергии состоит в появлении в жидкости квантов возбуждения (теплового движения). Будем считать вначале, что в гелии II не было
570 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ 1Гл. X первоначально квантов возбуждения, т. е. что его температура Г равна нулю. Пусть в гелии возник квант возбуждения с им- импульсом р и энергией е(р). При этом внутренняя энергия гелия станет равной е(р). В системе отсчета, в которой гелий течет, а стенка неподвижна, его энергия по правилам преобразования энергии при относительном движении равна E = ^ + e(p) + pv, G8,14> где v — скорость течения, -^ кинетическая энергия жидко- жидкости, a E(p) + pv — изменение ее энергии. При рассеянии энергии кинетическая энергия текущей жидко- жидкости может только уменьшаться, т. е. е + pv < 0. Наименьшее значение величины (е +'.pv) достигается при возникновении кванта с импульсом р, направленным антипараллельно к v. Ома равна при этом е — pv. Следовательно, должно выполняться- неравенство е — pv <0 или v>f. G8,15> Последнее означает, что если —=г= 0, в текущем гелии могуг возникать кванты возбуждения, и рассеяние энергии можег иметь место только при достаточно большой скорости течения. При скорости течения, не удовлетворяющей неравенству G8,15), взаимодействие между стенкой и гелием, сопровождающееся по- появлением квантов теплового возбуждения, возникать не может. Из вида энергетического спектра гелия II, представленного на рис. 77 (стр. 665), ясно, что величина — для гелия II всегда отлична от нуля. Таким образом, при температуре абсолютного нуля жидкий гелий II движется мимо твердой стенки без взаи- взаимодействия и рассеяния энергии, если только скорость движения его не превышает ио = (—) , где (—] —минимальное зна- \ Р /мин \ Р /мин чение отношения —. В этом и состоит явление сверхтекучести. При Т Ф 0 все прежние рассуждения остаются в силе и в гелии II не могут возникать новые кванты возбуждения при v Ф v0. Однако уже имеющиеся кванты теплового возбуждения могут взаимодействовать с твердой стенкой. Оказывается, что в гелии II при Т ф 0 возможны два вида движения, которые могут происходить в одной порции жидкости одновременно и независимо друг от друга, — сверхтекучее и
§ 791 ЭЛЕКТРОННЫЙ ГАЗ В МЕТАЛЛЕ ПРИ АБСОЛЮТНОМ НУЛЕ 671 нормальное. Сверхтекучее происходит без вязкости и не сопро- сопровождается переносом энергии теплового возбуждения. Нормаль- Нормальное течение происходит так же, как обычное течение жидкости с вязкостью, отличной от нуля. С каждым из видов движения связан перенос части массы гелия. Благодаря этому гелий II можно наглядно, хотя и не строго, рассматривать как смесь двух жидкостей — сверхтекучей и нормальной. Движение сверх- сверхтекучей жидкости, несущей часть гелия II при Т ФО, происхо- происходит так же, как движение всего гелия II при 7 = 0. Однако при Т Ф 0 часть массы гелия находится в нормальном состоя- состоянии, течет с трением и несет с собой тепло. В опытах с течением гелия через тонкий капилляр проявляются свойства сверхтеку- сверхтекучей части. Она вытекает через тончайший капилляр, не испы- испытывая никакого сопротивления. В опытах с движением тел, например, п опытах с колебаниями диска, погруженного в со- сосуд с гелием, наблюдается взаимодействие с нормальной частью гелия. При этом движение диска происходит как в нормальной жидкости, обладающей вязкостью. Однако масса нормальной жидкости оказывается зависящей от температуры. При Т—>0 масса нормальной части гелия II также обращается в нуль. Одним из замечательных тепловых свойств гелия II является так называемый термомеханический эффект. Термомеханический эффект состоит в том, что при вытекании гелия из сосуда через весьма тонкий капилляр температура гелия, остающегося в со- сосуде, повышается. Наоборот, при втекании гелия температура в сосуде понижается. Происхождение термомеханического эффекта понятно из предыдущего. Через тонкий капилляр движется сверхтекучая часть гелия, которая не несет тепловой энергии. При вытекании некоторой сверхтекучей массы гелия из сосуда имевшийся ранее запас тепловой энергии распределяется в оставшейся массе и ее температура повышается. При вытекании имеет место обрат- обратное явление: запас тепловой энергии, имевшейся первоначально у гелия в сосуде, распределяется между всем гелием. Величина эффекта возрастает с понижением температуры. Это позволяет использовать термомеханический эффект в гелии для получения сверхнизких температур. § 79. Электронный газ в металле при абсолютном нуле Рассмотрим теперь поведение Ферми — системы — электрон- электронного газа при низких температурах. Во втором томе, при изло- изложении квантовой теории металлов мы покажем, что в известном приближении совокупность электронов в металлах можно счи- считать идеальным вырожденным Ферми — газом. Поэтому свой- свойства Ферми — газа представляют очень большой интерес.
672 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл X Обсудим прежде всего поведение электронного газа при абсолютном нуле. Для этого напишем распределение Ферми, имеющее согласно G2,11) вид- dn = n -? = 2 • 2л \-fi-) —— . G9,1) е kT +1 Множитель 2 введен для учета того, что каждому энергетиче- скому уровню отвечает два состояния, в которых могут нахо- находиться электроны со спинами, имеющими противоположные ориентации Перейдем в G9,1) к пределу Г-+0. Тогда распределение Ферми, изображенное (при T-fcO) на рис. 74, приобретает вид, представленный на рис 79 и выражаемый формулами ( где [л(Г=0) означает химический потенциал при абсолютном нуле. Эту величину принято именовать максимальной энергией при абсолютном нуле етах- Этот результат имеет простой смысл: уровни энергии системы большого числа электронов, свободно движущихся в конечном объеме V, ограниченном непроницае- непроницаемым энергетическим барьером (стенками), образуют почти не- непрерывный спектр. Рассмотрим прежде всего поведение электронов в металле при весьма низких температурах, близких к абсолютному нулю. Предположим, что вес атомы при образовании металла пре- превращаются в ионы, причем каждый агом ионизован однократно. Число свободных электронов в металле будет равно числу ато- атомов Эти электроны движутся совершенно хаотически и обра- образуют электронный газ. Плотность этого газа будет чрезвычайно велика — число частиц в единице объема будет в несколько ты- тысяч раз превышать число частиц в обычном, не очень разрежен- разреженном газе Тем не менее, мы будем полностью пренебрегать взаи- взаимодействием между электронами. Иными словами, мы будем считать электроны в металле идеальным газом. Оказывается, что теория, основывающаяся на этом предположении, дает объяснение очень большому числу фактов и находится в хорошем количественном согласии с опы- опытом. Это показывает, что в действительности взаимодействие между электронами в металле не играет большой роли. Взаи- Взаимодействие между электронами компенсируется взаимодей- взаимодействием электронов с ионами решетки. В ч. VI мы подробно осве- осветим вопрос о взаимодействии электронов с ионами решетки и между собой.
$79] ЭЛЕКТРОННЫЙ ГАЗ В МЕТАЛЛЕ ПРИ АБСОЛЮТНОМ НУЛЕ 673 Электроны распределяются по всему объему металла равно- равномерно. Уровни энергии системы, состоящей из очень большого числа электронов, образуют почти непрерывный спектр. На ка- каждом уровне энергии согласно принципу запрета может одно- одновременно находиться не более двух электронов с противополож- противоположными ориентациями спина. Два электрона в металле будут ча« полнить самое нижнее энергетическое состояние с энергией, W -м- U Рис. 78 равной нулю. Третий и четвертый электроны вынуждены уже находиться на первом возбужденном уровне. Следующие элек- электроны располагаются на более высоких энергетических уровнях, причем каждая пара электронов заполняет соответствующий уровень Если полное число электронов в металле равно N, то при абсолютном нуле будут заполнены первые N/2 состояния с энергиями О <С е ^ ем<шс. Все остальные состояния с е > еМакс будут свободны от электронов. Это схематически изображено на рис. 78. На рис. 79 представлена функция рас- распределения электронов по состояниям при Т = 0. Число электронов во всех заполнен- заполненных состояниях равно двум, в незаполненных оно равно нулю. Очевидно, что благодаря принципу запрета электроны вынуж- вынуждены попадать в возбужденные энергетические состояния даже при абсолютном нуле. Найдем энергию еМакс последнего, самого высокого из запол- заполненных энергетических состояний электронов при абсолютном нуле. Поскольку уровни энергии электронов в металле распре- распределены почти непрерывно, мы можем написать для числа уров- уровней энергии одного электрона, лежащих в интервале энергии е и е + Aе выражение A,24) ч. III. На каждом уровне энергии Рис. 79 43 В Г Левич, том I
€74 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл X находится два электрона, так что для полного числа заполнен- заполненных уровней имеем: емак" л (^'п X1' v Г С откуда ИЛИ Энергия всех электронов при абсолютном нуле, очевидно, равна емакс [^-f J eV^de = |^eMaKC. G9,4) о Средняя энергия отдельного электрона в электронном газе при Т = 0 составляет 3/s от максимальной энергии емакС. Подстановка численных значений величин, входящих в G9,3), дает, например, при -у~1019: емакс = 5 эв или еМаке = = 6,0 -104 град. Можно найти также максимальную скорость электронов при абсолютном нуле: >39 • 1Q8 см/сек. G9,3') Скорости электронов оказываются очень большими даже при абсолютном нуле. Мы видим, что свойства электронного газа коренным обра* зом отличаются от свойств классического атомного газа. Энергия электронного газа оказывается пропорциональной числу электронов N в степени 5/з и объему, заполненному элек- электронным газом, в степени (—2/з). Электроны при абсолютном нуле не находятся в состоянии покоя, как это следовало бы ожи- ожидать, исходя из классических представлений, а движутся с раз- различными скоростями. Средняя скорость этого движения весьма велика!- Несмотря на это, теплоемкость электронного газа при абсолютном нуле оказывается точно равной нулю. Действи» тельно, 11\ -о ¦fc поскольку энергия газа не зависит от температуры.
§ 791 ЭЛЕКТРОННЫЙ ГАЗ В МЕТАЛЛЕ ПРИ АБСОЛЮТНОМ НУЛЕ 675 Электроны, движущиеся в металле, как и всякий другой газ, оказывают давление на стенки сосуда. Для давления газа мож- можно сразу написать выражение (8,2): оо Р = -у- J v*9Юdv* = ~зГ • G9'5) так как все направления движения электронов равноправны и 1^ = -|-. Для v2 нужно подставить выражение ^ = Ш> <79>6> где Eq/N — средняя энергия, приходящаяся на один электрон. Тогда получаем: Р = |^. G9,7) Этот же результат можно получить и термодинамическим путем. Подстановка численных значений дает для -р-= 1019: р = 2- 105 атм. В ходе предыдущих рассуждений мы молчаливо предпола- предполагали, что электронный газ является идеальным газом Ферми. в котором можно полностью пренебрегать взаимодействием ме- между частицами. Законность такого допущения может показать- показаться весьма сомнительной, особенно если учесть, что плотность вырожденного газа весьма велика и он состоит из заряженных частиц, для которых взаимодействие медленно убывает с рас- расстоянием. Предположение об идеальности газа выполнено, если сред- средняя кинетическая энергия электрона весьма велика по сравне- сравнению со средней энергией его взаимодействия с другими части- частицами. Средняя кинетическая энергия электрона дается формулой G9,4). Энергия взаимодействия двух электронов по порядку ве- величины равна e2jr, где г— среднее расстояние между ними. Если N/V — число электронов и ионов в единице объема, то среднее расстояние г равно по порядку величины 43*
676 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл X Критерий малости энергии взаимодействия можно записать в виде е2 7, *»- емакс • (V \!/э -^-1 , то, производя несложные преобразо- преобразования, получаем: При большой плотности электронного газа отношение энергии взаимодействия к кинетической энергии может оказаться малым. Поскольку кинетическая энергия газа растет с плотностью быстрее, чем потенциальная, мы приходим к парадоксальному на первый взгляд результату: С для того, чтобы электронный газ можно было считать идеальным газом, его плотность должна быть достаточно велика. § 80. Электронный газ при низких температурах Рассмотрим теперь свойства электронного газа при темпера- температурах, отличных от нуля, но являющихся еще достаточно низ- низкими. Именно, предположим, что температура такова, что kT значительно меньше, чем максимальная энергия электронов при абсолютном нуле емако. В этом случае тепловое возбуждение электронного газа будет сравнительно незначительным. Это означает, что тепловое возбуждение может переводить элек- электроны из энергетических состояний, заполненных при Т = 0, только в близлежащие более высокие энергетические состояния,' Ясно, например, что тепловое возбуждение недостаточно для того, чтобы поднять электрон с уровня энергии е <С емакс на уровень энергии е > еМакс- Его хватает лишь на возбуждение электронов, находящихся на энергетических уровнях, лежащих в узком интервале порядка kT. Часть электронов с этих уров- уровней оказывается переброшенной на уровни, лежащие выше уровня е = емакс. но отстоящие от него не выше, чем kT. Па рис. 80 схематически изображено тепловое возбуждение при низкой температуре. Часть уровней, лежащих ниже емаКс, оказывается освобожденной чаще всего от одного из заполняю- заполняющих их электронов; на уровнях, лежащих выше емакс, появ- появляются одиночные электроны. Функция распределения электро- электронов по состояниям изменяется. Если при Т = 0 она представля- представлялась ломаной кривой (рис. 79), то при низкой, но отличной от нуля темпераiype она принимает вид, изображенный на рис. 81. Распределение при Т = 0 показано на рис. 81 ломаной. Падение
i 80] ЭЛЕКТРОННЫЙ ГАЗ ПРИ НИЗКИХ ТЕМПЕРАТУРАХ 677 кривой при е < еМако означает, что среднее число электронов на соответствующих уровнях оказывается меньшим единицы — электроны переходят на уровни, лежащие выше емакс- Та об- область энергий, в которых среднее число электронов на каждом уровне оказывается меньшим единицы, но большим нуля, на- называется зоной размытости функции распределения. Из рис. 81 НТ \ \ Рис. 80. и сказанного выше ясно, что ширина зоны размытости по по- порядку величины равна kT. Число электронов, попадающих на уровни, лежащие выше eMai;c. весьма мало по сравнению с пол- полным числом электронов. Точно так же число электронов, нахо- дящихся на уровне энергии «без пары», составляет малую долю от полного числа электронов. Условие вырождения kT <C емакс совпадает с условием вырожде- вырождения газа Ферми. Мы ограничимся вычислением двух термодинамических величин парциального потенциала и сред- средней энергии в зависимости от температуры. Парциальный по- потенциал электронного газа обычно называют уровнем или по- поверхностью Ферми. Происхождение такой терминологии будет ясно из дальнейшего. Для определения парциального потенциала воспользуемся условием нормирования. Именно на основании G9,1) можем написать Рис. 81. /erfe 0 „ кТ (80,1)
g7g РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X Средняя энергия электронного газа дается формулой 00 E = 4n[~W) v J ~EK—* * >2* о . кт +1 Интегралы, входящие в формулы (80,1) и (80,2), в общем виде не берутся. Для вычисления их при низких температурах вос- воспользуемся следующим приемом. Пусть f—izr- (80,3) ekT I = J }вп de, n > 0. о Интегрируя по частям, получаем: При подстановке пределов первое слагаемое обращается, оче- очевидно, в нуль. Функция -J- изображена на рис. 82. Мы ви- видим, что она является четной функцией своего аргумента и имеет столь резкий максимум при е = \i, что ее можно считать , . одним из представлений б-функции. 'i3e\ Введем новую переменную кт ' Тогда J Рис. 82. -JL Поскольку мы рассматриваем область низких температур, ниж- нижний предел можно заменить на минус бесконечность: В той области изменения х, в которой -^- имеет значение, отличное от нуля, т. е. при е « ц, величина х весьма мала. Поэтому первый множитель в подынтегральном выражении.
<§ 80] ЭЛЕКТРОННЫЙ ГАЗ ПРИ НИЗКИХ ТЕМПЕРАТУРАХ 679 можно разложить в ряд и ограничиться первыми членами раз- разложения. При больших х, когда этого делать нельзя, подынте* тральное выражение обращается в нуль за счет множителя-^-, который ничтожно мал всюду, кроме х = 0. Таким образом: hr) *2 + • • • j-? dx. (80,5) Поскольку -jjL — четная функция, имеем: оо J X дх ах~»' Поэтому (80,6) Легко видеть, что оо °° = — 1 Второй интеграл в (80,6) вычислен в приложении IV. Он равен —л2/3. Окончательно имеем: Отброшенные члены пропорциональны более высоким степеням отношения kT/[i. Возвращаясь к условию нормирования, в котором п=>^> амеем: оо eVl rfe «5
580 РАСПРЕДЕЛЕНИЯ В КВАНТОВОЙ СТАТИСТИКЕ [Гл. X При Т = 0 второй член в (80,8) обращается в нуль и Сравнивая (80,9) с G9,3), находим, что Цт=0 == Цо = бманс (80,10) Парциальный потенциал электронного газа при абсолютном нуле оказывается равным максимальной энергии электрона при абсолютном нуле. При температурах, близких к абсолютному нулю, (80,8) можно решить относительно (х по методу последовательных приближений. В малом втором члене в (80.8) ц можно заменить на цо = еМакс- Тогда имеем: Г я2 (kTy I /on i«\ ^ ( Аналогично для средней энергии электронного газа 1" = находим: Е « 4л [Щ1 V (| Подставляя значение ц из (80,11) в (80,12) и пренебрегая выс- высшими степенями отношения kTj\i, получаем: 2] (80,13) Из (80,9) или (80,10) можно видеть, что условия вырожде- вырождения kT <С! еМакс и G2,16) совершенно идентичны. Поэтому элек- электронный газ является вырожденным при температурах гг ^- бмакс 1 <~т~- Из (80,13) можно найти теплоемкость электронного газа „ Nkn* kT ,„„ , ., L,y = —п . (oU,14/ *¦ 8макс Теплоемкость электронного газа оказывается линейной функ- функцией температуры и обращается в нуль при 7 = 0. Коэффи- Коэффициент пропорциональности содержит только известные вели- величины— универсальные постоянные и плотность электронного газа NIV. Мы увидим в ч. VI, что для простых металлов, напри- например меди и серебра, атомы которых имеют один валентный, слабо связанный электрон, число свободных электронов, прихо- приходящихся на атом, можно считать равным единице. Тогда, на- например, для меди теоретическое выражение электронной тепло- теплоемкости имеет вид Су = 0,9-10-4Мг7. (80,15)
§ 80] ЭЛЕКТРОННЫЙ ГАЗ ПРИ НИЗКИХ ТЕМПЕРАТУРАХ 681 Таким образом, теплоемкость электронного газа в согласии с опытными данными весьма мала и при нормальной темпера- температуре составляет неизмеримо малую долю теплоемкости кристал- кристаллической решетки. Теплоемкость решетки при температурах ниже характеристи- характеристической температуры быстро убывает и стремится к нулю при Т—*0, как куб температуры. Теплоемкость электронного газа также стремится к нулю при Т—> О, но гораздо медленнее, как первая степень температуры. Отношение теплоемкости электрон- электронного газа к теплоемкости решетки равно Cf 5 kT Для меди Емакс = 5 за, характеристическая температура 9 = 335° К, так что Отношение теплоемкостей оказывается порядка единицы при 7' = 3,3° К. При еще более низких температурах теплоемкости электронов оказываются больше теплоемкости решетки. Точные измерения теплоемкости подтвердили правильность теоретических формул. Так у меди, для которой измерения осо- особенно точны, теплоемкость при низких температурах оказалась слагающейся из двух членов, один из которых очень точно сов- совпадал с теоретической формулой для теплоемкости решетки. Второй член с точностью до 2% совпадает с теоретической формулой (80,14). При температурах ниже 3° К электронная теплоемкость больше теплоемкости решетки и укладывается на теоретическую кривую. В заключение вычислим число электронов в зоне размытости распределения Ферми, которым удобно пользоваться для на- наглядной интерпретации ряда формул в дальнейшем. Число электронов в зоне размытости или число непарных электронов мы будем именовать также числом эффективных электронов «Эфф. Именно они могут изменять свое состояние под влиянием внешних воздействий. Поэтому эффективные электроны обусловливают теплоемкость электронного газа, его электропроводность (см. следующий параграф) и т. п. Значение «эфф может быть найдено из следующих соображе- соображений. Вероятность нахождения электрона в данном состоянии с энергией е пропорциональна значению функции распределе- распределения /. Вероятность того, что оно не заполнено, равна A—f). Поскольку в одном состоянии могут находиться только элек- электроны с антипараллельными спинами, произведение вероятно-
682 РАСПРЕДЕЛЕНИЯ В ХВАНТОВОЙ СТАТИСТИКЕ [Гл. X стей /A—/) представляет вероятность того, что в состоянии с энергией е находится один электрон и не находится второй электрон с антипараллельным спином. Иначе говоря, f{\—f) представляет вероятность того, что состояние с энергией е будет заполнено только одним электроном. Полное число таких со- состояний или, что то же самое, полное число непарных электро- электронов, равно интегралу от произведения /A — f) на число состоя- состояний dQ с данной энергией, причем интеграл берется по всем- значениям энергии: 00 ^ j f(\-f)\Tzde. (80,16> В сильно вырожденном газе ц > kT, так что j -1, (l-/)«e "~ ект При е — ii^kT подынтегральное выражение экспоненциальна убывает. Поэтому, вместо того чтобы интегрировать до беско- бесконечно больших значений энергии, можно ограничиться интегри- интегрированием до значений е « [х. Тогда 4л Bm)'1 —V2 J о J о Поскольку экспоненциальный множитель быстро убывает, можно вынести медленно изменяющийся множитель У е, за знак интеграла, взяв его значение на верхнем пределе. Это дает: Vll J кТ /1 йъ « Vll J e kT d& = поскольку ц\Э> kT, откуда «эфф те -р . (oU, 17) С помощью формул G9,3) и G9,10) «Эфф можно представить в виде 3 JV kT п^Ф = ТУ1^- (80-18> Таким образом, «эфф составляет (с точностью до числового коэффициента) малую долю до полного числа электронов & 1 см3, равную приближенно /г7/емакс-
§ 80] ЭЛЕКТРОННЫЙ ГАЗ ПРИ НИЗКИХ ТЕМПЕРАТУРАХ 683 По порядку величины теплоемкость электронного газа с по- помощью «Эфф можно представить в виде Сэул~|-ЬЭфф, (80,19) где -j k — классическое значение теплоемкости. Формула (80,19) показывает, что свойства электронного газа можно приближенно трактовать следующим образом: в газе имеется пЭфф эффективных частиц, могущих изменять свое состояние и принимать подводимую извне энергию. Каждая из них обладает обычными классическими свойствами и, в част- частности, на долю каждой из них приходится обычное значение теплоемкости. Мы вернемся еще к обсуждению статистических свойств квантовых частиц в ч. VI,
ЧАСТЬ IV ЭЛЕКТРОМАГНИТНЫЕ ПРОЦЕССЫ В ВЕЩЕСТВЕ ГЛАВА I ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ § 1. Вывод основных уравнений поля Мы рассматривали выше электромагнитные процессы, про- происходящие в вакууме. Предметом нашего рассмотрения служили как электрические заряды, движущиеся в вакууме, так и окру- окружающее их электромагнитное поле. Теперь мы перейдем к изу- изучению электромагнитных явлений, происходящих в веществе (в среде). Теория электромагнитных процессов в веществе часто именуется макроскопической электродинамикой. Как будет видно из дальнейшего, характер электромагнит- электромагнитных процессов в веществе существенно зависит от свойств последнего. Например, механизм прохождения тока через ме- металлические проводники и плазму газового разряда имеет существенно разный характер и сопровождается различными явлениями; магнитные явления в ферромагнетиках сильно от- отличаются от таких же процессов в диа- и парамагнетиках и т. д. Тем не менее, оказывается возможным на основе некоторых весьма общих допущений построить феноменологическую тео- теорию электромагнитных явлений в веществе. Для этого необхо- необходимо, прежде всего, найти общие уравнения электромагнитного поля в веществе. Затем, как мы увидим ниже, необходимо бу- будет высказать некоторые, хотя и весьма общие допущения, о конкретных свойствах той среды, в которой происходят те или иные электромагнитные процессы. Мы видели, что в основных уравнениях теории электромаг- электромагнитного поля — уравнениях Максвелла — Лоренца — фигуриро- фигурировали величины, относящиеся к данной точке и данному моменту времени. Запишем эти уравнения в несколько измененных обо- обозначениях, заменив Е на е и И на Л. Выпишем уравнения Макс- Максвелла— Лоренца, а также закон сохранения заряда в новых
5 1] ВЫВОД ОСНОВНЫХ УРАВНЕНИЙ ПОЛЯ 685 обозначениях: 1 dh rote=-T-w, A,1) divA = 0, A,2) dive = 4rcp, A,4) i- i dp - ,, .i divpf + -^-=0. A,5) В веществе — среде, построенной из атомов или молекул, уравнения Максвелла — Лоренца, содержащие характеристики поля, отнесенные к данной точке и данному моменту времени, теряют смысл. Действительно, в веществе все величины, в том числе и электромагнитное поле, весьма быстро изменяются от точки к точке и в данном месте — во времени. Например, на- напряженность электрического поля имеет сравнительно малое значение вне данного атома, становится весьма большой внутри него и вновь спадает за его пределами. Рост поля в миллионы раз и его последующее спадание происходят в масштабах по- порядка атомных размеров. Такое же изменение поля во времени в фиксированной точке происходит, например, из-за теплового движения атома за малые доли секунды. Поэтому, как и в дру- других макроскопических процессах, происходящих в веществе, интерес и значение имеют лишь средние значения соответствую- соответствующих величин (ср. ч. III). Усредним уравнения Максвелла — Лоренца по физически бесконечно малым объему v0 и промежутку времени т, вводя средние по формуле Тогда имеем rot*--|f, A.7) rot h = 0, A,8) rotA-^ + ff. A,9) A,10) = O. A,11)
686 ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл. I Введем следующие обозначения: ё=Е, A,12) А = Я A,13) и будем именовать среднее значение напряженности электри- электрического поля в среде напряженностью поля Е, а среднее значе- значение напряженности магнитного поля в среде магнитной индук- индукцией В (такое название среднего магнитного поля связано исключительно с исторической традицией). Тогда уравнения A,7) —A,11) приобретают вид rot?=-l-|r, A,14) div# = 0, A,15) A,17) f = O. A,18) Дальнейшие преобразования уравнений связаны с нахождением средних значений р и pv. Нахождение этих средних требует введения некоторых допущений о строении вещества. В рамках теории электромагнитного поля в веществе послед- последнее рассматривается как сплошная среда, свойства которой опи- описываются при помощи ряда формальных макроскопических ха- характеристик, таких как диэлектрическая проницаемость, прово- диуость и т. п. Некоторые из этих формальных характеристик будут найдены путем применения методов статистической фи- физики и связаны с молекулярным строением вещества. Однако с самого начала нам придется разбить все вещества на две группы — на проводники и диэлектрики. Под проводни- проводниками мы будем понимать тела, в которых под действием при- приложенного внешнего стационарного поля возникает перемеще- перемещение зарядов по объему и соответствующий этому движению зарядов электрический ток. В диэлектриках внешнее поле не создает движения зарядов, хотя может вызывать их смещение в новые положения равновесия. Уже из этих определений ясна условность разделения тел на проводники и диэлектрики. В действительности в диэлектриках внешнее электрическое поле вызывает некоторый, хотя и весьма малый ток. С другой стороны, в некоторых проводниках ток также может быть невелик. Важнейшую роль в физике и тех- технике играют полупроводники- В одних условиях электрический ток в полупроводниках сравнительно велик и приближается
§ Z] ПОЛЯРИЗАЦИЯ СРЕДЫ В ЭЛЕКТРИЧЕСКОМ ПОЛЕ 687 к току в проводниках. Иногда же ток в полупроводниках так же мал, как в самых совершенных диэлектриках. Тем не менее схематическое разделение всех тел на провод- проводники и диэлектрики является достаточно хорошим приближе- приближением, на основе которого возможно построение феноменологи- феноменологической теории электромагнитных явлений в сплошных средах. § 2. Поляризация среды в электрическом поле При вычислении р следует различать случаи тела в целом электронейтрального и содержащего отличный от нуля заряд. Рассмотрим сперва первый случай. Если электронейтральное тело помещено во внешнее электрическое поле, в атомах и мо- молекулах происходит смещение отрицательных и положительных зарядов друг относительно друга. Тело, оставаясь электроней- электронейтральным, приобретает дипольный момент. Мы будем характе- характеризовать тело средним дипольным моментом всех его частиц в единице объема. Средний дипольный момент единицы объема будет именоваться вектором поляризации'или, кратко, поляри- поляризацией Р. Дипольный момент, приобретаемый телом, равен, по определению \ \ B,1) Ввиду произвольности объема интегрирования Если тело поляризовано равномерно, т. е. Р одинаково во всех точках тела, то Р = -р-. Появление в теле поляризация при известных условиях, которые будуг ясны из дальнейшего,, сопровождается возникновением среднего объемного заряда рсвяз- Значок (связ) означает, что средний заряд обусловлен смещением зарядов, связанных в атомах тела. Появление свя- связанного, или индуцированного, заряда называется электроста- электростатической индукцией или поляризацией. Для нахождения рСВЯз воспользуемся определением B,1) и преобразуем интеграл Г PdV к виду J f(P)rdV, где f(P) — некоторая функция поляризации. Тогда, сравнивая ff(P)r dV с J Рсвяз'" dV, можно найти значение рСВяз- Используя фор- формулу A,53) и полагая в ней а=Р, Ъ — r, находим J {Pn) r <?S = | г div PdV + j (Pgrad) r dV = rdivPdV + j PdV.
ggg ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл I Выбирая поверхность интегрирования вне объема, занятого те- телом, имеем поскольку вне тела поляризация равна нулю. Поэтому =- jrdi\PdV. B,2) Сравнивая B,2) с B,1), получаем Рсвяз^—divP. B,3) Таким образом, если поляризация тела неоднородна и век- вектор Р изменяется от точки к точке и притом изменяется так, что divP=?0, в теле возникает объемный заряд рСВяз. опреде- определенный формулой B,3). Формуле B,3) может быть придан наглядный смысл. Пусть внутри тела проведены две воображаемые плоскости Si и S2. Во внешнем поле заряды, связанные в атомах, заключенных в пространстве между плоскостями, смещаются. Если поляриза- поляризация неоднородна в пространстве, то, например, поверхность S2 пересечет большее число зарядов, уходящих из объема, чем поверхность Si. В результате из объема, заключенного между плоскостями, выходит больше зарядов, чем входит из соседнего объема. В пространстве между S2 и Si возникает объемный ЗарЯД ревла- В частности, когда поверхность служит граничной поверх- поверхностью тела, то заряды, приходящие на нее при поляризации, образуют поверхностный заряд. Его плотность иСВяз определится из следующего простого вычисления. Проинтегрируем B,3) по объему, заключенному между двумя поверхностями. Выберем эти поверхности так, чтобы одна из них проходила вне тела, а вторая внутри него и обе они отстояли на весьма малом рас- расстоянии h от внешней поверхности тела. Тогда имеем pnds- (b pnds = J вне тела внутри тела § PndS=- j9cmdV. B,4) внутри тела Переходя к пределу /i->-0, можем написать lim Л->0 внутри тела
§ 3] СРЕДНЯЯ ПЛОТНОСТЬ ТОКА И ЗАРЯДА В СРЕДЕ 689 где S означает поверхность тела и значение Рп берется на са- самой поверхности. Ввиду произвольного характера поверхности тела из равенства §PndS=j a>sdS s следует, что «>s = Рп- B,5) Ясно, что полный заряд электронейтрального тела, помещенного во внешнее поле, остается равным нулю. Выбирая в B,4) по- поверхность интегрирования вне объема тела, можно написать f Pcb,,<W=-f Таким образом, полный объемный связанный заряд, возни- возникающий в теле, равен полному заряду, индуцированному на его поверхности. До сих пор мы считали тело электронейтральным. Если пол- полный свободпый заряд тела отличен от нуля и распределен в нем с объемной плотностью р, то полная средняя плотность заряда Р = Рсвяз + Р и \pdV=] (Рсвяз + р) dV = J p dV = e. B,6) Заряд тела, характеризуемый плотностью р, не связан с ато- атомами вещества и не индуцируется внешним полем. Ниже мы увидим, что в постоянном поле свободный заряд р может суще- существовать только у диэлектриков. В проводниках свободные за- заряды подвижны и смещаются до тех пор, пока не выходят на его поверхность, образуя поверхностный заряд. § 3. Средняя плотность тока и средняя плотность заряда в среде Несколько более сложной задачей является вычисление сред- средней плотности тока в среде рп. Это вычисление может быть проведено либо ня основе некоторых модельных представлений, либо, более формально, исходя из общих представлений об электромагнитных свойствах среды. Мы изберем здесь второй путь, поскольку используемые обычно при изложении макроскопической электродинамики мо- модели атомов и молекул не только далеки от действительности, но и по необходимости содержат явно неверные допущения Как будет пояснено ниже, квантовые эффекты играют основную реп. в магнитных свойствах атомов. Поэтому нельзя проводить 44 В Г. Леиич, том I
ggO ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл. t рассмотрение электрических и особенно магнитных свойств атомных систем на основе классических моделей. При формаль- формальном рассмотрении мы можем ограничиться лишь одним физиче- физическим допущением: если некоторое тело помещено во внешнее электромагнитное поле, то среднее поле в объеме тела мало по сравнению с внутриатомными полями. Иными словами, мы будем предполагать, что средние поля внутри тела являются слабыми. Кроме того, мы ограничимся случаем однородных и изотропных тел. Средняя плотность тока в среде pv в каждой точке тела яв- является функцией напряженностей электрического и магнитного полей. Кроме того, если поля изменяются в пространстве и во времени, средняя плотность тока будет зависеть от скорости изменения векторов Е и В во времени и пространственных про- производных этих величин, т. е. я EJL EL E3l ' D' dt ' dt ' dxk ' Поскольку поля являются слабыми, можно разложить функцию / в ряд по степеням переменных и ограничиться первыми сте- степенями разложения1). По существу это разложение произво- производится по степеням малого отношения типа -т-в——г, где ?"„„ ат — I **вн. ат I напряженность внутриатомного поля. Разлагая_? в ряд по степеням переменных, мы должны учи- учитывать, что pv является полярным вектором. Поэтому все члены ряда, выражающего искомое разложение, также должны пред- представлять полярные векторы. Они не могут быть ни скалярами, ни аксиальными векторами. Напомним (ср. § 6 ч. I), что напряженность электрического поля е, а следовательно, и средняя напряженность электриче- электрического поля в среде Е являются полярными векторами. Напротив, напряженность магнитного поля Л, а с ней и среднее магнитное поле В являются аксиальными векторами или псевдовекторами. Поэтому в искомом разложении может фигурировать вектор Е, но не вектор В. „ дЕ Производная вектора -тт- по времени является полярным вектором и должна быть первым членом разложения. Простран- Пространственные производные -^—- могут быть сгруппированы в виде двух комбинаций производных rot E и div E. Первая комбина- комбинация производных rot E образует аксиальный вектор, вторая — скаляр. Обе величины в разложении сами по себе фигурировать ') Ср. И. Е. Т а м м, Основы теории электричества, Гостехиздат, 1954, стр. 428.
>§ 31 СРЕДНЯЯ ПЛОТНОСТЬ ТОКА И ЗАРЯДА В СРЕДЕ 691 не могут. Производные первого порядка от В суть: -^r, rot В и divB. Величина -^-является аксиальным вектором, divB = О в силу A,15), rotB представляет полярный вектор. Поэтому в разложении / нужно удержать вектор rot В. Таким образом, имеются только три величины первого порядка малости, являю- являющиеся полярными векторами Еу -gr- и rot В. Разумеется, в сле- следующем приближении из скаляров и аксиальных векторов мож- можно составить целый ряд полярных векторов, но члены разложе- разложения второго порядка нас интересовать не будут. I ? I При разложении по степеням отношения -гъ—!—г нужно, I ? вн. ат | вообще говоря, учитывать анизотропию тела, так как в разных направлениях ?вв. ат изменяется по разным законам. В изо- изотропных телах (такими являются газы, жидкости и, в извест- известном приближении, поликристаллические тела) можно считать |Я I отношение -те——г имеющим одно и то же значение во всех I ?вн. ат | направлениях. Тогда с точностью до членов первого порядка малости рд = оЕ + кЩ- + асто1В, C,2) где о, х и a — скаляры, зависящие от свойств среды. Причина, по которой в последнее слагаемое введен множитель с (скорость света), будет ясна из дальнейшего. Нулевой член в разложении C,2) отсутствует, поскольку от- отсутствию поля должен отвечать средний ток, равный нулю. Прежде чем ввести это выражение для рг в уравнения Макс- Максвелла, обсудим физический смысл отдельных членов разло- разложения. Первый член разложения оЕ имеет весьма простой и на- наглядный смысл. Он показывает, что при наличии электрического поля в среде возникает ток, средняя плотность которого про- пропорциональна средней напряженности поля Е. Величина а но- носит название проводимости или электропроводности тела. Мы будем пользоваться обозначением / = <т?. C,3) Вектор / представляет средний заряд, проходящий через I см2 поверхности, проведенной внутри тела перпендикулярно к /, за 1 сек. Вектор / именуется плотностью тока проводимости. Соотношение C,3) связывает плотность тока в данной точке тела с напряженностью поля в этой точке. Соотношение C,3) 44*
692 ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл. Г мы будем называть законом Ома в дифференциальной форме. Ниже, в § 14, мы установим связь C,3) с обычной формулиров- формулировкой закона Ома. Свойства тел характеризуются значением проводимости а. В идеальных диэлектриках, в соответствии с их определением, следует положить а=0. В реальных диэлектриках афО, но весьма мало по сравнению с значением этой величины в полу- полупроводниках и особенно в металлах. Вопрос о проводимости в телах различной природы будет рассмотрен ниже. Пока отметим лишь, что за ток проводимости в теле ответственны свободные заряды: свободные электроны в металлах, ионы и электроны в газах, ионы в жидкостях. Сво- Свободными их именуют потому, что они не связаны с каким-либо атомом и под действием поля могут перемещаться по всему объему тела. Среднюю плотность свободных зарядов в теле мы будем обо- обозначать через р. Она связана, очевидно, с плотностью тока / уравнением непрерывности divy+|f = O. C,4) При этом предполагается, что свободные заряды, имеющиеся в теле, не переходят в связанное состояние и не возникают из связанных зарядов. Для выяснения физического смысла второго и третьего сла- слагаемых в разложении C,2) преобразуем C,2) так, чтобы век- векторы Е и В были отделены один от другого. Возьмем, например, дивергенцию от обеих частей уравнения C,2). Тогда имеем, оче- очевидно, div pv = div./ + % -щ div E. В силу уравнений непрерывности для полного тока р» и тока свободных зарядов /, даваемых формулами A,18) и C,4), ~~ ~W (Р ~ Р) = % W div E- C>5) Разность р — р равна, очевидно, средней плотности связанных зарядов ревлз- Таким образом, в однородной среде имеем dt dt Интегрируя, можно написать Рсвпз=—diynE. C,6) Постоянная интегрирования положена равной нулю, поскольку в отсутствие поля рСВяа должна быть равна нулю.
§ 3] СРЕДНЯЯ ПЛОТНОСТЬ ТОКА И ЗАРЯДА В СРЕДЕ 693 Сравнивая C,6) с B,3), мы убеждаемся, прежде всего, в су- существовании формулы Р = кЕ, C,7) связывающей поляризацию в теле с напряженностью поля Е. Поляризация Р оказывается пропорциональной полю Е. Коэф- Коэффициент пропорциональности х носит название коэффициента поляризации или диэлектрической восприимчивости вещества. Значение диэлектрической восприимчивости для тел, состоящих из простых молекул, будет вычислено в §§ 12 и 13. Там будет доказано, что и является величиной существенно положитель- положительной, так что вектор Р всегда направлен в ту же сторону, что и вектор Е. В силу C,7) второе слагаемое в C,2) можно записать в виде Формула C,8) показывает, что изменение вектора поляризации во времени эквивалентно появлению некоторого тока. Этот ток именуется током поляризации, а его плотность «/пол Qi » V"»*7/ т. е. равна скорости изменения дипольного момента единицы объема, пыбранного в данной точке тела. Действительно, из определения B,1) вектора Р следует dv = I r^W-dv- <3-10> При этом мы переменили порядок дифференцирования и инте- интегрирования. Величина г представляет переменную интегрирова- интегрирования и от / не зависит. Пользуясь A,5) и применяя соотношение B,2) к вектору () находим w (pCMav) dV = j Рсвяз*> dV. C,11) Смысл плотности тока связанных зарядов очень прост. Измене- Изменение во времени поляризации данного объема означает, что из него уходят (или в него входят) сказанные заряды. Ясно, однако, что перемещение связанных зарядов, с точки зрения переноса ими электричества, эквивалентно движению свобод- свободных зарядов.
¦694 ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл. I Перейдем теперь к выяснению смысла последнего слагаемого в C,2). Для этого умножим формулу C,2) на г векторно и про- проинтегрируем результат по объему тела: j [г, рт] dV = | [/у] dV + J [r, ^-] dV + ас J [г, rot В] dV. В силу C,10) J [Г> жН = J [Г- Ж*»А dV = wl f. РсвязГ] rfK - = -|- j Qc*,3[r, r]dV = 0. -Следовательно, ас J [г, roiB]dV = J [г, ^-j)dV = J [r, peiee]dy, C,12) где рсвяз^ = pf —J ~ плотность тока, переносимая связанными зарядами. Введем обозначение М = аВ. C,13) Тогда C,12) запишется в виде | [г, rot M] dV = 4- J [г, рсвяз«] dV. C,14) В силу формулы (I, 54), в которой а = г, Ь = М, J [r, rot M]dV = - J I[MV] r]dV-§[[nM] г]dS. Если поверхность интегрирования проходит вне объема, заня- занятого телом, то на этой поверхности М=0, и, таким образом, J [r, rot M]dV=- j [ [MV] Г] dV. .При этом [ [МV] г] = (MV) г - М div г = М - Ш = - 2ЛГ. Отсюда окончательно J[r, rotAI]dK = 2 J Ж dV. C,15) Сравнивая C,15) с C,14), получаем dV. C,16)
$ 4] СИСТЕМА УРАВНЕНИИ ДЛЯ ПОЛЯ В СРЕДЕ 69S Равенство C,16) показывает, что введенный соотношением C,13) вектор М представляет средний магнитный момент еди- единицы объема тела, создаваемый движущимися связанными за- зарядами (ср. § 22 ч. I). Статистическая теория магнитных явлений будет изложена в гл. III. С помощью величин /, Р и М средняя плотность тока в ве- веществе может быть окончательно написана в виде ^ . (ЗД7> § 4. Система уравнений для электромагнитного поля в среде Вычислив средние значения величины pv, мы можем пе- перейти к окончательной формулировке уравнений для электро- электромагнитного поля в среде. Подставляя C,17) в A,16), находим или rot (В - АпМ) = ^J+-^4r('E+ 4я/>)< D'1 > Введем новые обозначения, написав Н^В — АпМ D,2) и Е = О-4яР; D,3) перепишем D,1) в виде t#— — / + — ^- 1АА\ С С dt \ ' г Обратимся теперь к уравнению A,17). Выражая среднюю плот- плотность заряда по формуле B,6) через среднюю плотность свобод- свободного р и связанного рСВяз заряда и пользуясь B,3), получаем ,=4яр — 4я divP, откуда в силу D,3) diD 4 D,5) Два оставшихся уравнения A,14) и A,15), как мы видели, усредняются без каких-либо трудностей, --L-^, D,6) div 5 = 0. D,7>
69G ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл. Г При этом р и / связаны между собой уравнением непрерыв- непрерывности ¦|f- + <Hv7 = 0. D,8) Совокупность уравнений D,4) — D,8) образуют систему уравне- уравнений поля в среде. Эта система уравнений была установлена Максвеллом в 1873 г. и именуется уравнениями Максвелла (в отличие от уравнений Максвелла — Лоренца A,1)— A,5)). Со- Совершенно ясно, что эта система еще не полна, поскольку она содержит четыре неизвестных вектора — средние поля ? и В и вспомогательные величины Н и D. По историческим причинам вектор Н принято именовать магнитным полем в среде, а век- вектор D — электрической индукцией. Для того чтобы система уравнений Максвелла стала полной, необходимо задать некоторые дополнительные соотношения, связывающие между собой основные и вспомогательные век- векторы поля. Эти уравнения носят общее название уравнений связи. В простейшей (однородной и изотропной) среде, рас- рассмотренной выше, вид уравнений связи следует непосредственно из C,2). В силу C,13) и D,2) имеем Н = В — 4яссВ=A — 4яос)В. D,9) По историческим причинам принято записывать уравнение связи D,9) в виде В=цН, D,10) 1 причем постоянная ц = . _ . называется магнитной восприим- восприимчивостью среды. При этом индуцированный магнитный момент единицы объема М выражают не через В, а через Н по формуле хд. D,11) где х именуется магнитной восприимчивостью. Из D,2) и D,11) следует, что М-=1+4лх. D,12) Аналогично из C,7) и D,3) получаем уравнение езязи D=?E, D,13) где коэффициент е=1-Мяк D,14) называется диэлектрической проницаемостью или, по устарев- устаревшей, но часто применяемой терминологии, диэлектрической по- постоянной. К уравнениям связи относят обычно и соотноше- соотношение C,3).
§ 4] СИСТЕМА УРАВНЕНИЙ ДЛЯ ПОЛЯ В СРЕДЕ 697 Мы хотели бы подчеркнуть, что в отличие от уравнений Максвелла — Лоренца, являющихся одним из самых точных и универсальных из известных законов природы, система урав- уравнений Максвелла имеет ограниченную область п-рименимости вследствие ограниченной области применимости уравнений связи. Ниже мы остановимся на этом вопросе подробнее. В дальнейшем будет показано, что электрическая восприим- восприимчивость всех тел и>0 и, соответственно, диэлектрическая про- проницаемость е>1. Напротив, магнитная восприимчивость % может быть как положительной, так и отрицательной. Вещества, у которых %>0, называются парамагнитными, вещества с %<0 — диамагнит- диамагнитными. Для дальнейшего нам понадобится интегральная форма уравнений Максвелла, которую мы запишем следующим об- образом: D,15) D,16) D,17) j,DdS = 4л J pdV. D,18) Совершенно так же, как это было сделано в § 10 ч. I для электромагнитного поля в вакууме, можно ввести электромаг- электромагнитные потенциалы ф и А в веществе. Определим их форму- формулами В = rot А, D,19) 44 D,20) при этом условие Лоренца приобретает вид <ПуЛ=-^. D,21) Повторяя выкладки § 10 ч. I, легко прийти к уравнениям для потенциалов -St™ -JaLy, D,22)
{$8 ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл. I § 5. Система граничных условий В дальнейшем нам обычно придется рассматривать элек- электромагнитные явления в телах, ограниченных в пространстве. Необходимо поэтому выяснить, как изменяются векторы элек- электромагнитного поля вблизи границы тела. В самом общем слу- случае граница тела служит границей раздела двух сред с различ- различными свойствами. Мы будем предполагать, что с достаточной степенью точности границу раздела можно считать геометриче- геометрической, и не будем интересоваться свойствами электромагнитного поля в переходном слое вблизи границы. Пусть одна среда характеризуется проницаемостями ei и рц, а вторая — соответственно ег и ji2- Поведение векторов поля на границе раздела может быть ¦ . .? установлено из уравнений ' \ " ^ ~ • Максвелла, записанных в ин- интегральной форме. Рис. 83. Рассмотрим уравнение D,15) и применим его к беско- бесконечно малому контуру L, изображенному на рис. 83, считая сто- сторону h бесконечно малой первого порядка, а сторону /2 — беско- бесконечно малой вторго прядка. Тогда имеем — Efgh + б. м. второго порядка. При этом Etg означает касательную к поверхности раздела сла- слагающую вектора напряженности электрического поля; индексы относятся к первой и второй средам. Уравнение D,15) дает /рA) РB)\, 1 дФ ,_ п где Ф — поток магнитной индукции через поверхность, стягивае- стягиваемую контуром L. Очевидно, Ф~Л/г и является величиной стар- старшего порядка малости. Поэтому, переходя к пределу /г-*-0, из E,1) находим t E,2) Тангенциальная слагающая напряженности электрического поля остается непрерывной при переходе через границу раздела сред. Применим аналогичный прием к формуле D,17). При этом сразу опустим член второго порядка малости I DdS, Тогда находим f
5 5] СИСТЕМА ГРАНИЧНЫХ УСЛОВИЙ 69** где / — единичный вектор контура, лежащий в плоскости раз- раздела (см. рис. 83). Обозначим через я нормаль к поверхности раздела и через п\ нормаль к поверхности, охваченной контуром /. Векторы пу пх и I образуют правовиитовую систему: /=[я,л]. Введем, далее, понятие поверхностной плотности тока /., и будем под этим понимать количество электричества, проходящее за 1 сек через единичный отрезок на поверхности: lim jnidlid^ d/,d/3-»0 Тогда D,17) дает Нdl = Щ-Jsti, dlx = (Н2 - Я,) / • dtu или Выражая / через я,, имеем (Н2-Я,)[«i»] = я,[я, Щ-//.], откуда пх[п, Ъ-НА-^М^ Поскольку ориентация вектора П\ в плоскости раздела может быть произвольной, должно выполняться равенство ¦?¦[*, Л2-Л,] =Л- E,3) При наличии поверхностных токов тангенциальная слагающая напряженности поля Н претерпевает разрыв непрерывности при переходе через границу раздела сред. Величина скачка A//ts равна — ]S- Если поверхностный ток на границе раздела отсутствует, /s=0, то < & E,4) Граничные условия для нормальных слагающих векторов индукции В и D получаются из D,16) и D,18), если в качестве поверхности интегрирования выбрать бесконечно малую по- поверхность 5, изображенную на рис. 84. Площадь оснований S\ является бесконечно малой первого, а площадь боковых
700 ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл. I граней — бесконечно малой второго порядка. Из D,16) находим (вп] — ВТ) Si + б. м. второго порядка = 0 или, переходя к пределу, В<!> = В?. E,5) Нормальная слагающая вектора магнитной индукции при переходе через границу раздела сохраняется. Аналогично из D,18) находим E,6) // /у где ©s — поверхностная плотность V х/ заряда, определяемая, как и выше, lim f p dV = [ щ dS. Рис. 84. Если поверхностная плотность заряда ms=0, то DV = Df. E,7) Уравнения E,2), E,3), E,5) и E,6) являются граничными условиями, которым должны удовлетворять векторы поля на границе раздела сред. В частности, на границе с вакуумом сле- следует положить п этих формулах e2 = fX2=l. § 6. Пределы применимости системы уравнений связи Мы получили систему уравнений Максвелла (вместе с урав- уравнениями связи) из уравнений Максвелла — Лоренца путем усреднения, основываясь на некоторых допущениях о свойствах среды. Хотя эти допущения носили довольно общий характер, они выполняются отнюдь не всегда. Оказывается, что область при- применимости уравнений связи и, следовательно, уравнений Мак- Максвелла в простейшей форме D,4) — D,7) достаточно ограничен;!. Мы должны особенно подчеркнуть эти ограничения потому,чго в настоящее время в физике приходится все чаще сталкиваться с системами, к которым уравнения Максвелла в написанном нами виде неприменимы. Обычно в правой части уравнения D,4) одно из слагаемых велико, тогда как другое—мало. Так, в идеальных диэлектриках ток проводимости / = 0, а в реаль- реальных диэлектриках он весьма мал по сравнению с током сме- смещения -37-. Напротив, в проводниках обычно мал ток смещения. Поэтому уравнение D,4) следует рассматривать как некоторое общее выражение, включающее в себя предельные реальные
§ 6] ПРЕДЕЛЫ ПРИМЕНИМОСТИ СИСТЕМЫ УРАВНЕНИЙ СВЯЗИ 701 случаи, но почти всегда упрощаемое при фактическом исполь- использовании. Между тем оно приведено во всех старых и многих новых руководствах без должных оговорок. Перейдем теперь к разбору допущений, сделанных при вы- выводе уравнений Максвелла. Основным допущением является разложение C,2). Это разложение означает, прежде всего, что среда является изотропной, так что связь между вектором рг> и векторами Е, -^- и rot В характеризуется скалярными по- постоянными 0, х, а. Совершенно очевидно, что это допущение неприменимо к анизотропным средам, в частности к монокри- монокристаллам. Поэтому в анизотропных средах теряют силу соотно- соотношения D,10) и D,13), которые должны быть заменены тензор- тензорными выражениями D: — е.;ьЕь, R-u И FЛ) Величины gift и yah — симметричные тензоры второго ранга. Доказательство последнего утверждения будет дано в § 13. Далее, само существование линейного соотношения между М и В или, что то же самое, между В и Н оказывается невы- невыполненным у сравнительно немногочисленной, но весьма важной группы веществ, именуемых ферромагнетиками и антиферромаг- антиферромагнетиками. В этих веществах функциональная зависимость ме- между В и Н имеет сложный нелинейный и притом неоднозначный характер. Ниже мы остановимся на теории ферромагнетизма. Другая группа веществ, именуемых сегнетоэлектриками, об- обладает электрическими свойствами, сходными с магнитными свойствами ферромагнетиков: зависимость D от Е является нелинейной и неоднозначной. Таким образом, у ферромагнетиков и сегиетоэлектриков вы- выражение C,2), в котором удержаны первые члены разложения, теряют смысл. Ряд веществ, названных сверхпроводниками, обнаруживает при низких температурах глубокое изменение магнитных свойств. Магнитное поле не проникает в глубь сверхпроводни- сверхпроводников, так что в объеме сверхпроводника выполнено условие 5 = 0. Очевидно, что уравнения Максвелла в форме D,4) —D,7) не описывают поведение сверхпроводников. Свойства сверхпровод- сверхпроводников будут описаны в § 21, а теория сверхпроводимости будет изложена в ч. VI. Более сложным является вопрос о примени- применимости разложения C,2) в случае полей высокой частоты и в пространственно-неоднородных системах.
702 ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл. I При переходе к высоким частотам разделение тока на две части — ток свободных и связанных зарядов — теряет смысл. Ясно, что в высокочастотном поле заряды как свободные, так и связанные совершают практически одинаковое колебательное движение. Рассуждая, далее, количественно, можно утверждать,, что разложение C,2) предполагает, что изменение полей в про- пространстве должно быть достаточно плавным и происходить на расстояниях, больших по сравнению с молекулярными разме- размерами а. В противном случае потеряло бы смысл макроскопиче- макроскопическое усреднение по объему, включающее достаточно большое число молекул. Поскольку изменение в пространстве происходит на длине волны, должно выполняться неравенство V»a, и сле- следовательно, мы ограничены частотами, много меньшими- юо < с/а. Однако это ограничение не является еще самым сильным. В области а) <С «о существует широкий интервал частот, в ко- котором уравнение связи D,13) оказывается неприменимым. Это уравнение, так же как и C,2), предполагает, что частота поля мала по сравнению с обратным временем релаксации 1/т, ха- характерным для данного вещества. При этом поляризация Р в некоторой точке пространства в момент времени / определяется индукцией (средним полем) в той же точке и в тот же момент времени. Если же частота сравнима с обратным временем 1/т, то поляризация будет отставать от поля и станет зависящей от истории процесса. При этом вместо D,13) мы должны будем написать более общее соотношение: t D(r, t)= je(t,t')E(r, t')dt', F,2) где интегрирование ведется по всем более ранним временам (/'</) и функция e(t, С) определяет образование поляризации в результате воздействия поля в предыдущие моменты времени. Поскольку время течет равномерно, никакого выделенного мо- момента времени не существует. Это значит, что функция e(t, f) может зависеть только от времени, которое протекло между моментом /' и моментом Энными словами, от аргумента {t — /'). Таким образом, t D (г, /) = J e (t -1') E (г, У) dt'. F,3) Заметим при этом, что частоты, при которых уравнение D,13) теряет свою применимость, весьма малы по сравнению с шо. Действительно, времена релаксации т всегда меньше или
$ 7] ЗАКОН СОХРАНЕНИЯ ЭНЕРГИИ 703 равны характерным атомным временам тат——, где v — ско- скорость электронов в атомах. Поэтому ю~ — ——?-©о 'С ©о- F,4) Рассмотрение, которое будет проведено в § 32, покажет, что в области частот, приближающихся к характерным атомным частотам, диэлектрическая проницаемость оказывается завися- зависящей от частоты. Поэтому явление это получило название ча- частотной, или временной, дисперсии. При высоких частотах наступает и другое явление, получив- получившее название пространственной дисперсии. Именно для приме- применимости уравнения связи D,13) длина волны должна быть велика не только по сравнению с размерами атома, но также и с размерами области пространственной неоднородности в ве- веществе. Если обозначить размер области неоднородности че- через /, то необходимо соблюдение неравенства А, > /. Если X ~ I, то поляризация в данной точке пространства будет зависеть от значения поля в соседних точках пространства в предыдущие моменты времени, т. е. t D(r, t)= \dtr J e(r, r', t-t')E(г', V)dV. F,5) — оо Выражение F,5) показывает, что вклад в поляризацию в дан- данной точке и в данный момент делают заряды, находившиеся ранее в соседних точках пространства. В качестве примеров среды с пространственной дисперсией можно назвать, например, плазму и металлы. Все сказанное о временной и пространственной дисперсии диэлектрической проницаемости относится также и к магнитной проницаемости. Мы видим, таким образом, что приведенная в § 4 форма записи уравнений связи, а следовательно, и уравне- уравнений Максвелла в их простейшем виде применима лишь в случае изотропных сред, не обнаруживающих временной и простран- пространственной дисперсии и не являющихся ферромагнитными или сегнетоэлектрическими. § 7. Закон сохранения энергии Вывод закона сохранения энергии в непоглощающей, изо- изотропной, неферромагнитной, несегнетоэлектрической среде в отсутствие пространственной и временной дисперсии ничем не отличается от аналогичных вычислений, проведенных в § 12 ч. I.
704 ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ В ВЕЩЕСТВЕ [Гл. I Именно: если все тела (проводники и диэлектрики), находя- находящиеся в поле, неподвижны, то работа, произведенная (в едини- единицу времени) электрическим полем над зарядами, равна При этом мы прибавили к вычисляемому интегралу выражение, равное нулю в силу D,13), и обозначили через и0 плотность энергии электромагнитного поля в среде и через о — вектор Пойнтинга ^ ^ G,2) Удобно записать закон сохранения энергии в виде ^. G,3) В дифференциальной форме закон сохранения энергии выра- выражается соотношением ~Ж &Г— =^+diva. G,4) Интерпретация закона сохранения энергии в среде не отли- отличается, в принципе, от данной нами в гл. I для пустоты. Следует лишь отметить то обстоятельство, что в G,4) входит только плот- плотность тока свободных зарядов /. При движении свободных заря- зарядов в неподвижном проводнике вся механическая работа поли полностью переходит в тепло, именуемое джоулевым теплом. Механизм последнего процесса зависит от конкретных свойств проводников. Мы коснемся еще этого вопроса в дальнейшем. Обозначив через Qo джоулево тепло, выделяющееся в единице объема за 1 сек н равное мы можем написать закон сохранения энергии в виде - -^- J u0 dV = j Qo dV + | о dS.
§ 7] ЗАКОН СОХРАНЕНИЯ ЭНЕРГИИ 705 Величины вн 8я ~ 8л И 8л ~ 8я представляют соответственно плотность электрической и маг- магнитной энергии единицы объема. Поскольку, однако, величины е и ц в веществе являются функциями температуры, все наше рассмотрение предполагает п ED+BH постоянство температуры среды. Поэтому величину „- следует трактовать как свободную энергию единицы объема среды. К закону сохранения энергии в случае переменных во вре- времени полей мы вернемся еще раз в § 31.
ГЛАВА II ЭЛЕКТРОСТАТИКА § 8. Электростатическое поле Уравнения электромагнитного поля существенно упрощаются в случае электростатики. Полагая, что поля не зависят от времени и ток равен нулю, можно написать систему уравнений Максвелла в виде rot?=0, rot// = 0. ' (8>2) Мы не будем рассматривать постоянные магнитные поля в ве- веществе '). Уравнения (8,1) полностью определяют электростатическое поле в среде. Подчеркнем, что р означает среднюю плотность свободных зарядов, введенных в диэлектрик извне. В отличие от проводни- проводников, свободные заряды в диэлектрике неподвижно фиксированы в определенных положениях. Если диэлектрик помещен во внешнее электрическое поле, связанные заряды, входящие в состав молекул, или ионы, обра-- зующие ионную решетку, смещаются друг относительно друга так, что диэлектрик поляризуется. При неоднородной поляриза- поляризации в диэлектрике возникает объемный связанный заряд, сред- средняя плотность которого определяется формулой C,6). Напом- Напомним, что полный связанный заряд, появившийся в диэлектрике при поляризации, всегда равен нулю. Наряду с объемной плотностью связанных зарядов на по* верхности диэлектрика при его поляризации возникает поверх- поверхностная плотность заряда tos = Рп- См, И. Е. Т а м м, Основы теории электричества, «Наука», 1967.
§ 8] ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ 707 Поле внутри диэлектрика согласно (8,1) является безвихре- безвихревым. Потенциал электростатического поля, определяемый по F,2), удовлетворяет уравнению div (e grad qp) = — 4яр. (8,3) В однородном диэлектрике е = const, и последнее уравнение переходит в уравнение Пуассона АФ=-^. (8,4) Из уравнения Пуассона следует, что в однородном диэлектрике потенциал поля, создаваемого зарядами с объемной плотностью свободного заряда р, можно написать в виде Формула (8,5) показывает, что потенциал поля и самое поле в диэлектрической среде уменьшено по сравнению с полем, со- создаваемым теми же зарядами в пустоте, в 8 раз. В частности, поле точечного заряда в диэлектрической среде равно ?.= eR Соответственно сила взаимодействия зарядов по закону Кулорш в однородной диэлектрической среде меньше, чем в пустоте, в е раз. Этот результат имеет простой смысл: электрическое поле, создаваемое свободными зарядами, помещенными в ди- диэлектрическую среду, вызывает ее поляризацию. При поляри- поляризации связанные заряды смещаются и создают в среде поле, ослабляющее поле свободных зарядов. Необходимо подчеркнуть, что этот вывод относится исклю- исключительно к полю зарядов, помещенных внутрь однородного и изотропного диэлектрика. Из примеров, которые будут разобра- разобраны ниже, будет ясно, что к неоднородному диэлектрику этот вывод совершенно неприменим. На границе раздела двух диэлектриков потенциал должен удовлетворять следующим граничным условиям: ф| = Ф2> (8,6) Первое из них эквивалентно E,2), второе непосредственно сле- следует из E,6), если положить поверхностную плотность свобод- свободного заряда cos = 0. Изображая наглядно распределение поля при помощи сило- силовых линий, мы видим из граничных условий (8,6) и (8,7), что 45*
708 ЭЛЕКТРОСТАТИКА [Гл. ГГ на границе раздела двух диэлектриков происходит преломление силовых линий, причем ^ (8,8) Смысл углов а\ и (%2 виден на рис. 85. Рассмотрим теперь электростатическое поле в проводниках. Как мы подчеркивали уже выше, отличительной особенностью проводников является наличие в них большого количества под- подвижных зарядов. Появление внутри проводника среднего поляЕ всегда вызывает в нем электрический ток, представляющий пе- перемещение свободных зарядов под действием поля. Если ток в проводнике отсутствует, а это и есть требование электростатики, то не- неизбежно и напряженность поля в про- проводнике равна нулю Е = 0. Из равенства нулю поля во всей об- е, ласти пространства, заполненной про- проводником, следует, что объемная плот- плотность заряда внутри проводника также равна нулю. Рис. 85. Обращение в нуль вектора напря- напряженности электростатического поля в проводнике можно наглядно представить следующим образом: при внесении проводника во внешнее поле в нем начинается перемещение свободных зарядов к поверхности, которое про- происходит до тех пор, пока поле поверхностных зарядов полностью компенсирует внешнее поле внутри проводника. Процесс происходит так, как будто бы проводник обладал бесконечно большой поляризуемостью при любом значении на- напряженности поля или, как это видно из (8,7), бесконечно большой диэлектрической проницаемостью ег->оо. Как видно из (8,8), линии электростатического поля подходят нормально к поверхности проводника. Хотя отождествление проводника с диэлектриком, имеющим бесконечно большую проницаемость, имеет формальный характер, — понятие поляризации неприме- неприменимо к свободным зарядам в проводниках, оно полезно лишь для наглядной интерпретации соотношений электростатики. Значение поверхностной плотности заряда для проводников получается из граничного условия E,6), если положить в нем напряженность поля внутри металла равной нулю. Тогда на- находим «*-
§ 8] ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ 709 где е — диэлектрическая проницаемость среды, окружающей проводник, Еп — нормальная слагающая внешнего поля у его поверхности. Граничное условие E,2) дает для тангенциальной слагающей внешнего поля у поверхности проводника ?tg = O, (8,Ю) поскольку в самом проводнике она равна нулю. Таким образом, внешнее поле проводника направлено нормально к его поверхности и Еп = Е. Формулы (8,9) и (8,10) можно переписать, введя потенциал внешнего поля ф в виде 4я дп ' | на поверхности проводника. (8,11) Ф = фм = const ) В частности, если металл находится в пустоте, величину е сле- следует положить равной единице. Полный заряд на поверхности проводника где интегрирование ведется по всей поверхности проводника 5. Формула (8,12) устанавливает связь между потенциалом по- поверхности проводника фм и его зарядом е. Нетрудно убедиться, что эта связь имеет линейный характер: если увеличить ф в к раз, в силу (8,12) и постоянства потенциала вдоль поверх- поверхности металла, его заряд е увеличится во столько же раз. Отношение заряда проводника к его потенциалу носит на- название емкости: ^<$ (М dS (8,13) фм 4я J фм \ дп Емкость пропорциональна диэлектрической постоянной среды е, а в остальном определяется исключительно формой провод- проводника. Как видно из (8,13), емкость имеет размерность длины, а по порядку величины С совпадает с линейным размером про- проводника. В случае, если в электростатическом поле имеется не один, а несколько проводников, граничные условия (8,11) должны выполняться на каждом из них. При этом заряды на проводниках и их потенциалы не яв- являются произвольными. Между ними существует некоторая связь, вытекающая из однозначности решения уравнения
710 ЭЛЕКТРОСТАТИКА [Гл. 1Г Лапласа с граничными условиями типа (9,3)- Нахождение взаимного влияния одних проводников на другие является слож- сложной в математическом отношении задачей, и мы ее касаться не будем1). § 9. Решение задач электростатики Мы можем теперь в общем виде сформулировать задачу электростатики. Пусть задана некоторая система проводников и различных по своей природе диэлектриков, находящихся в конечной об- области пространства. Задана также плотность объемных заря- зарядов р во всех точках пространства (в объеме, занятом провод- проводниками, р = 0). Тогда уравнение для потенциала имеет вид (/ — номер среды; в пустоте е=1). На границе раздела сред: пустота—диэлектрик, пустота — проводник и диэлектрик — проводник выполняется система гра- граничных условий, разобранных выше. Потенциал на бесконечности удовлетворяет требованию в поле с центральной симметрией (а>0). (9,1) Требуется найти распределение потенциала и электрического поля во всем пространстве. Часто эту задачу именуют прямой задачей электростатики. При этом под обратной задачей пони- понимают нахождение распределения заряда по известному распре- распределению потенциала. Прямая задача электростатики является одной из основных задач математической физики. Элементар- Элементарными приемами электростатическая задача решается лишь для отдельных простейших случаев. Разработан ряд методов ее ре- решения и рассчитано множество конкретных систем. Важную роль среди них играют приближенные и численные методы. В нашу цель не входит разбор различных случаев электроста- электростатических полей. Мы рассмотрим лишь некоторые простейшие примеры, имеющие общий интерес. В простейших случаях к результату сразу приводит приме- применение интегральной теоремы Гаусса — Остроградского. Мы не будем, однако, останавливаться на этом элементарном методе расчета, известном из курса общей физики. На примере простейших систем будет показан метод реше- решения уравнения Пуассона, который является эффективным и •) См., например, В. С и а й т. Электростатика и электродинамика, ИЛ, 1954.
•f9] РЕШЕНИЕ ЗАДАЧ ЭЛЕКТРОСТАТИКИ 711 тогда, когда метод теоремы Гаусса оказывается несостоя- несостоятельным. Рассмотрим поле равномерно заряженной сферы. Полагая р0 при 0 при r>R, где R— радиус сферы, запишем уравнение Пуассона в сфери- сферических координатах, учитывая, что из соображений симметрии потенциал может зависеть только от г, но не от полярных углов В- и г|з. С помощью A,84) получаем дЛ дг> 1 0 при r>R. Интегрируя (9,2) в области r<R, находим <?Ф 4ярог . Ct дг ~ Зе "•" г2 * Второе интегрирование дает (9,3) Поскольку потенциал должен всюду и, в частности, в точке /=0 иметь конечное значение, следует положить Ci=0. Обозна- Обозначив через фя потенциал на поверхности сферы, запишем (9,3) в виде Вводя полный заряд сферы е= 3~ так что Фя = тк> можно записать ф в виде При r>R интегрирование (9,2) дает r
712 ЭЛЕКТРОСТАТИКА ГГл. IF Полагая ф = 0 при r-voo, находим, что С2 = 0. На поверхности сферы должно выполняться граничное условие где слева стоит потенциал внутри, а справа вне сферы. Это условие дает С\——е, так что Потенциал вне сферы совпадает с потенциалом точечного заряда, находящегося в центре сферы. Найдем еще поле внутри и вне сферы и энергию поля сферы. Согласно A,71) Полная энергия поля равномерно заряженной сферы равна Столь же просто можно найти поле неравномерно заряжен- заряженной сферы, когда плотность заряда р зависит только от рас- расстояния до центра сферы р = р(г). Именно, •—TJf Между тем, уже эта простая задача не может быть решена с по- помощью теоремы Гаусса — Остроградского. Совершенно аналогично решается задача о распределении потенциала внутри и вне равномерно заряженного цилиндра радиуса R. Уравнение Пуассона на основании A,85) гласит: 1 д ( ду\_ Ы где ю — плотность заряда. Интегрирование дает <р=-2лю/?21пр
§ 10] МЕТОДЫ ИЗОБРАЖЕНИИ И ОТРАЖЕНИЙ 713 Следует обратить внимание на поведение потенциала вне цилиндра. При р—»-оо имеет место логарифмическая расходи- расходимость ф. По этой причине значение постоянной С остается не- неопределенным. Поле вне цилиндра имеет всюду конечное значение. §10. Методы изображений и отражений При решении ряда электростатических задач полезно поль- пользоваться теоремой единственности. Действительно, предполо- предположим, что для заданной системы нам удалось подобрать каким- нибудь образом потенциалы или электрические поля, которые удовлетворяют дифференциальным уравнениям и граничным условиям. В силу теоремы единственности можно считать най- найденное решение правильным независимо от способа его полу- получения. В качестве примера рассмотрим следующую задачу. Пусть бесконечная плоскость х = 0 является поверхностью металла, который занимает полупространство х<0; в вакууме на расстоянии а от границы металл — вакуум помещен заряде. Требуется найти напряженность поля во всем пространстве. Очевидно, что электрическое поле внутри металла (область д:<0) равно нулю. Уравнение Пуассона для потенциала в области л;>0 имеет вид Дф= — 4ле6(г —а). A0,1) Граничные условия для нашей задачи имеют следующий вид: Ф = 0 при г—>оо. В плоскости х = 0 должны выполняться соотношения: = 4ncos При этом учтено, что D{n =0 в металле и на его поверхности. Условие для ?tg эквивалентно требованию постоянства потен- потенциала на поверхности металла. Если электрическое поле вне металла будет найдено, то граничное условие A0,2) позволит нам определить заряд поверхности. Для получения решения заметим, что уравнению A0,1) и условию постоянства потенциала на поверхности х — 0 удовле- удовлетворяет потенциал поля двух зарядов, один из которых (е) находится в точке х=+а, а другой (—е) в точке х=—а:
714 ЭЛЕКТРОСТАТИКА [Гл. II где г и Г\ — расстояния от зарядов до точки наблюдения. В силу единственности решений уравнений Максвелла формула A0,3) дает искомое распределение. Вычисление градиента <р позволяет определить электриче- электрическое поле Е. Перейдем теперь к рассмотрению более сложного случая, когда плоскость х = 0 служит границей раздела двух диэлектри- диэлектриков. Полупространство х>0 и л;<0 заполняют диэлектрики с ди- диэлектрическими проницаемостями ei и вг. В точке х — а рас- расположен заряд е. Следует найти распределение поля, создаваемого зарядом, на- находящимся в точке х—а, во всем пространстве. Дифференциальное урав- . нение для потенциала в об- <*¦ ласти х > 0 имеет вид -а О Рис. 86. 6' Будем считать, что на границе раздела нет свободных зарядов, так что граничные условия запишутся в форме Ф = 0 при г-+оо, №-&?, A0,4) rv2) Г7О) /1Л С\ ?tg = Ctg. AU,OJ Мы постараемся решить эту задачу по аналогии с преды- предыдущей, предполагая, что потенциал поля совпадает с потен- потенциалом поля эквивалентных зарядов, расположенных в точках х=а и х=—а. Предположим, что поле в области х>0 эквивалентно полю двух зарядов: заряда е, находящегося в точке х=а и неизвест- неизвестного заряда ей помещенного в точку х~—а. В этом случае потенциал поля в области #>0 имеет вид (рис. 86) <Pi = -j- + -fj (x>0). A0,6) Предположим далее, что потенциал в области х<0 также пред- представляется в виде потенциала поля точечного заряда Ф2 = ^-, A0,7) где eg — некоторый неизвестный заряд, помещенный в точке
§ 10] МЕТОДЫ ИЗОБРАЖЕНИИ И ОТРАЖЕНИЙ 715 Очевидно, что потенциалы ф1 и фг являются решением урав- уравнений электростатики для соответствующих точечных зарядов. Электрические поля в обеих областях имеют вид , ег Подставляя эти значения в граничные условия A0,4) и A0,5), находим „ е2(г)„ п [е(г)п . е, I I r3 ,3 1 1 Здесь (г)я, (r)tg и (г,)п, (r,)tg — соответственно нормальные и тангенциальные проекции векторов г и л. В плоскости х=0 имеются следующие очевидные соотношения: И-|г,| (r,)te - (г)^ (г,)„ =-(г)„. Поэтому получаем два уравнения для определения зарядоз е\ и е?: из которых следует 2е (в|-ег)е Таким образом, потенциал поля выражается формулами: е . (ei-e,) с fv>o) Ф 8^ + 8,(8, +в,) Г, ^>иЛ Ф^- ( Аналогичным образом метод изображений применяется для решения более сложных с геометрической точки зрения задач. Другим полезным приемом решения электростатических за- задач является метод отражений. Если ф(г, 0, ip)—потенциал, удовлетворяющий уравнению Лапласа, то простой расчет показывает, что функция
716 ЭЛЕКТРОСТАТИКА [Гл. IT также удовлетворяет этому уравнению. Соотношение выполнено на сфере радиуса r = R. Преобразование /"-> — с геометрической точки зрения представляет зеркальное отра- отражение в сфере радиуса R. В качестве простого примера применения метода отражений можно привести задачу о распределении потенциала в системе точечный заряд — заземленная сфера радиуса R. Положим по- потенциал сферы равным нулю. Если заряд в[ находится на рас- расстоянии pi от центра сферы, то потенциал поля, создаваемого этим зарядом и индуцированным на сфере зарядом, должен иметь нулевое значение на поверхности r = R. Этому условию удовлетворяет потенциал вне сферы, даваемый формулой если подобрать должным образом неизвестные величины — за- заряд ег и его местонахождение. Именно положим, что фиктивный заряд помещен в точке, удаленной от центра сферы на расстояние рг, причем Если абсолютная величина этого заряда равна то оба заряда создают на поверхности сферы потенциал, рав- равный нулю. Таким образом, Ф = !! - A ii. г\ Рг г% ' § 11. Энергия системы проводников Перейдем теперь к рассмотрению энергетических соотно- соотношений в электростатическом поле. Проще всего энергетические соотношения выглядят для проводников. Поскольку поле не проникает внутрь проводников, их термо- термодинамические свойства не изменяются. Однако наличие про- проводника изменяет конфигурацию поля в окружающем про- пространстве. Энергию электромагнитного поля, окружающего проводник, принято называть электромагнитной энергией проводника. Пол- Полная энергия проводника равна сумме его внутренней и электро- электромагнитной энергий.
§ II] ЭМПРГИЯ СИСТЕМЫ ПРОВОДНИКОВ 717 Ниже мы будем интересоваться только последней и для краткости говорить просто об энергии проводника. Рассмотрим энергию системы проводников. Мы будем пред- предполагать вначале, что проводники находятся в пустоте. Полная энергия электростатического поля равна Преобразуем интеграл, написав его в виде U= -~ j?grad<pdK= -—¦ J diy{tpE)dV + ¦— j tfdi _L Интегрирование ведется по всем поверхностям, ограничиваю- ограничивающим объем интегрирования. Таковыми служат внешняя поверх- поверхность радиуса R ->- оо и поверхности проводников. Поскольку внешние нормали у этих поверхностей ориентированы в проти- противоположных направлениях, перед поверхностными интегралами стоят разные знаки. Мы воспользовались также тем, что в пу- пустоте div? = 0. Интеграл по бесконечно удаленной поверхности равен нулю в силу (9,1). Па металлических поверхностях <рМ(. = const, поэтому " = -к S § f>E"iS: - -вг S *¦ § в> ds> - Энергия системы проводников формально совпадает с энер- энергией системы зарядов. Предположим теперь, что пространство между проводниками заполняется диэлектриком. При этом возможны в принципе два случая: а) проводники изолированы, так что заряды всех провод- проводников имеют постоянное значение; б) проводники соединены с устройствами, поддерживаю- поддерживающими их потенциалы постоянными.
718 ЭЛЕКТРОСТАТИКА [Гл. II В первом случае, как видно из формулы (9,4), имеем 4я j дп 4я j дп ' так что Соответственно ,„_1 V _ U ~2 ? е№м1 — ~ Поля и энергия уменьшаются в е раз. Энергия расходуется на работу, выполняемую при заполнении пространства диэлек- диэлектриком. Во втором случае заряд каждого из проводников будет ра- равен после заполнения диэлектриком 4л и энергия С Увеличение энергии и работа над диэлектриком происходят за счет устройств, поддерживающих постоянными потенциалы про- проводников. § 12. Диэлектрики и проводники во внешнем электростатическом поле Если во внешнее поле Еое> поместить незаряженный провод- кик или диэлектрик, конфигурация поля вблизи тела изменится. Это изменение существенно зависит от формы тел и характера внешнего поля, как это ясно видно из разбираемых ниже при- примеров. Рассмотрим прежде всего случай диэлектрика. В дальнейшем мы будем считать внешнее поле однородным на протяжении тела. Все величины, относящиеся к области про- пространства внутри тела, будем отаечать индексом «/». В качестве простейших примеров рассмотрим длинный ци- цилиндр, ориентированный осью вдоль поля, и тонкую плоскопа- плоскопараллельную пластинку, расположенную перпендикулярно к полю. В первом случае поляризация диэлектрика вызовет появле- появление поверхностных зарядов на основаниях цилиндра. Однако, поскольку длина цилиндра велика, эти заряды создают лишь слабое поле, не искажающее внешнее поле внутри цилиндра.
§ 12J ДИЭЛЕКТРИКИ И ПРОВОДНИКИ ВО ШТПТ1НЕМ ПОЛЕ 719 То же видно из граничного условия E,2), которое даст и, поскольку вектор Е в силу условий симметрии параллелен оси цилиндра, E(i) = E[& A2,1) Во втором примере поверхностные заряды создают замет- заметное ослабление внешего поля. Граничное условие E,7) дает или O'"-El", I Поле внутри пластинки ослаблено на величину 4лР. Этот вывод, как показывают расчеты, качественно сохраняется для тел более сложной формы. В качестве следующего примера рассмотрим диэлектриче- диэлектрический шар в однородном внешнем поле ?ое)- Распределение по- потенциала определится из решения уравнения Лапласа которое удовлетворяет требованию Ф— —?-о ' yi^i'j) вдали от шара (r^>,R) и удовлетворяет граничным условиям (8,6) — (8,7) на его поверхности. Будем пытаться искать решс ние в виде где фо= — Е(ое)г, &ц>[е) представляет изменение потенциала вбли- вблизи шара. Функция ф{г) должна убывать при г ^> R. Поскольку q>\e) за- зависит только от вектора Eq\ скаляров г и 9 и сама должна быть скаляром, ее можно написать в виде комбинации векто- векторов Еое) и г или ?ое) и градиента —. В первом случае ф[е) не удовлетворяло бы требованию убывания на бесконечности, так что единственный возможный вид ф{е) таков: <р{«> = а??«> grad-J-, где а — постоянная. Поэтому фW = - E\f>r + <x?^ grad —. A2,4)
720 ЭЛЕКТРОСТАТИКА [Гл. II Напротив, внутри сферы потенциал qpW во всех точках дол- должен оставаться конечным и* поэтому должен быть написан в виде ф(«-Э?|«>г. A2,5) Очевидно, что как A2,4), так и A2,5) удовлетворяют урав- уравнению Лапласа, а <ро ведет себя на бесконечности в соответ- соответствии с A2,3). Для нахождения двух неизвестных аир можно использо- использовать два граничных условия: ф(О = ф(?)) дг дг Элементарные вычисления, которые удобнее всего проводить в сферических координатах, дают е" ( е«>-в<'М Зе'«_ Р \ еA)+2е(в)/ в(» + 2е(в) так что окончательно ^, A2,0) A2,7) где обозначено 3 еШ-8<<?) (е) В частности, в пустоте е(е1 = 1 и „ 3 е(|) - I р(г) Зи Если восприимчивость тела х мала, так что е^'~1, то Р » яЕ{ое\ Отсюда напряженность поля вне сферы Ete) = - grad Ф(е) = ?jf + К 3f(/>;l-r2/> (r < /?); A2,10) = - grad ф«> = -^-P + E{oei (г < /?). A2,1
§ 131 ТЕРМОДИНАМИЧЕСКИЕ ПОТЕНЦИАЛЫ ДИЭЛЕКТРИКА 721 При вычислении градиента по A,47) мы учитывали постоян- постоянство вектора Р. Из формул A2,6) — A2,11) следует: 1) во внешнем однородном поле шар, поляризуясь, приоб- приобретает дипольный момент (PV) и создает дополнительное поле, совпадающее с полем диполя, помещенным в центр шара; 2) внутри шара поле имеет постоянное значение и ослаб- Зв(" лено в -jTj тх раз по сравнению с внешним полем. е1' + 2е1 ' Рассмотрим теперь незаряженный металлический шар, поме- помещенный в однородное поле Ео. Поле вне шара найдется из ре- решения уравнения Лапласа, удовлетворяющею тому же условию A2,3) на бесконечности и условию Ф = Фм = 0 A2,12) на поверхности металла (потенциал <рм можно принять за нуль потенциала). Выражение для ф(<?) снова можно написать в виде A2,4) и по- подобрать а так, чтобы удовлетворялось условие A2,12). Можно, однако, просто в формулах для ф<''>, ?<<¦> и Р, полу- полученных выше для диэлектрического шара, считать диэлектриче- диэлектрическую проницаемость внутри сферы е^-»-оо. Тогда сразу полу- получается выражение где положено Поле внутри шара Еи) = 0. Плотность поверхностного заряда на поверхности шара равна I (дууо 3?0 Полный заряд незаряженного шара остается, очевидно, равным нулю. § 13. Термодинамические потенциалы диэлектрика и диэлектрическая восприимчивость Мы видели в предыдущем параграфе, что поле внутри ди- диэлектрика существенно отличается от поля во внутреннем про- пространстве. При этом значение напряженности поля внутри диэлектрика зависит от его формы. /1R В. Г. Лспнч, том 1
722 ЭЛЕКТРОСТАТИКА (Гл. It Пусть некоторый диэлектрик помещен во внешнее электри- электрическое поле напряженности Ео. Для простоты мы в дальнейшем ограничимся случаем однородного и изотропного диэлектрика. Со статистической точки зрения диэлектрик можно считать ква- квазизамкнутой подсистемой, помещенной во внешнее поле сил. Энергия такой подсистемы будет отличаться от энергии той же подсистемы без поля. Напряженность поля является внеш- внешним параметром, с изменением которого изменяются уровни энергии системы. Согласно результатам § 22 ч. III, энергия i-ro уровня изме- изменяется с изменением параметра по формуле B2,1). В нашем случае внешним параметром служит вектор ?0. Поэтому изме- изменение его на величину 6Е0 приводит к изменению энергии t-ro уровня на величину бе(-=-^б?0) A3,1) где сРг представляет обобщенную силу, отвечающую внешнему параметру Е {): Поскольку нас будут интересовать средние значения, то, усред- усредняя A3,1), имеем A3,2) где и U — средняя энергия системы (для удобства мы не пишем черты усреднения и просто опускаем индекс i) во внешнем поле. Сравнивая A3,2) с A7,8) ч. I, нетрудно видеть, что «^ пред- представляет средний дипольный момент всего диэлектрика. По определению среднего находим е •e kT О (в,) 2 е "' Q(g'> A3,4) где F — свободная энергия. ') Производная по вектору имсег обычный смысл сокращенной записи соотношений для компонент векторов.
§ 13] ТЕРМОДИНАМИЧЕСКИЕ ПОТЕНЦИАЛЫ ДИЭЛЕКТРИКА 723 Производные по проекциям внешнего параметра Ео берутся при постоянных значениях температуры и всех остальных внешних параметров, характеризующих состояние системы. Фор- Формула A3,4) показывает, что средний дипольный момент тела и его поляризация Р = -у могут быть вычислены, если известна функция состояний системы и ее зависимость от напряженности внешнего поля. На основании A3,4) мы можем установить связь между изменением свободной энергии в поле dF и без поля dF0 в виде dF = dF0-<PdE0. A3,5) Интегрируя A3,5), находим \ F0--?^. A3,6) При этом мы полагали, что в однородном поле и однородной диэлектрической среде вектор поляризации Р ~ Ео. Это всегда имеет место для равномерно поляризующихся тел (в частности, тел эллипсоидальной формы). Поляризация тела Р связана с полем Е соотношением C,7). При этом, вообще говоря, поле Е отлично от внешнего поля Ео, поскольку диэлектрик искажает внешнее поле в окружающем его пространстве. Если, однако, его диэлектрическая проницае- проницаемость е близка к единице, то Ео «* Е и Р — %Е ^ кЕ0. При этом dF = dFQ-VPdE A3,7) или кУЕ* _ F PEV Часто наряду со свободной энергией диэлектрика во внеш- внешнем поле F рассматривают полную свободную энергию диэлек- диэлектрика за вычетом его потенциальной энергии во внешнем поле dF' = dF0 + VE0 dP = dF0 + EV dP, A3,9) F' = F0 + VPE0. A3,10) Иногда свободной энергией именуют также величину представляющую свободную энергию диэлектрика (за вычетом его потенциальной энергии во внешнем поле) плюс энергия внешнего электрического поля в объеме, заполненном ди- диэлектриком. 46*
724 ЭЛЕКТРОСТАТИКА [Гл. II Нетрудно найти, пользуясь A3,8), что dF" = dF0 + VEdP+±-VEdE = (P + -^)^dF0+^dD. A3,12) Таким образом, F" представляет энергию диэлектрика без поля плюс энергия поля в объеме, занятом диэлектриком. Заметим, что из A3,12) следует pfcx^dF^ dEi 4я d2F" (\ъ\ч\ hi~ V dDi ' dDk ~ V d В анизотропной среде связь между D и Е дается формулой F,1), которую мы запишем в виде V _р-1П где e;fe' — тензор, обратный elk. Тогда A3,13) дает JL -1 _. д1р" — д2р" — v -1 4я R'b ~ dDt дйь ~ аОА dDt ~ 4л Е'»' " Таким образом, доказано, что ъщ. является симметричным теч- зором. Для практических целей вместо свободной энергии удобно пользоваться термодинамическим потенциалом Ф. При этом вместо A3,8) получаем ф=:фо--?М-. A3,14) Объем диэлектрика в ноле равен др)т vo 2 Изменение объема диэлектрика при изотермическом включе- включении внешнего поля носит название электрострикции. Как видно из последней формулы, знак и величина эффекта зависят от поляризуемости, а также сжимаемости тела. Наряду с изменением объема происходит изменение энтро- энтропии диэлектрика при включении поля. Именно, Изменение энтропии при изотермическом включении поля со- сопровождается выделением тепла Q = TAS (так называемый электрокалорический эффект при постоянном давлении). При адиабатическом включении поля происходит изменение темпе- температуры диэлектрика.
§ 13] ТЕРМОДИНАМИЧЕСКИЕ ПОТЕНЦИАЛЫ ДИЭЛЕКТРИКА 725- В виде примера найдем электрострикцию и электрокалори- электрокалорический эффект для шара в однородном поле. Согласно A2,9) имеем PE0V ,т. 3 8,- Ф-П) PEoV Ф Ф - Фо — ~ Ф° ~ е, + 2 откуда 'дФ\ 3 8,-1 2(dV E Аналогично деЛ -j-fjp. A3,17) Нетрудно показать, что если е уменьшается с ростом темпе- температуры (как это имеет место для большинства веществ), Q < 0, т. с. при увеличении поляризации тепло выделяется. Следующая естественно возникающая проблема — это вы- вычисление электрической восприимчивости % диэлектрика. В отличие от предыдущих соотношений, имеющих весьма общий характер, и не требовавших знания конкретного вида функции состояний Z, для нахождения электрической восприим- восприимчивости необходимо получить функцию состояний тела. Рассмотрим прежде всего электрическую восприимчивость идеальных газов. Для того чтобы найти значение восприимчивости, отнесенной к одной молекуле, нужно найти соответствующую функцию со- состояний молекулы в электрическом поле. При этом нужно раз- различать два случая: а) молекулы обладают собственным постоянным дипольным моментом, б) молекулы не обладают собственным дипольным мо- моментом. Динольный момент определяется выражением где суммирование ведется по всем зарядам в молекуле. В ато- атомах и молекулах, обладающих симметричной формой, положи- положительные и отрицательные заряды расположены симметрично. Благодаря этому суммирование по положительным и отрица- отрицательным зарядам в результате дает нуль. Все атомы и такие симметричные молекулы, как Н2, Ог, СН4 и т. п., не имеют соб- собственного дипольного момента. Напротив, у сильно асимметрич- асимметричных молекул, например молекул, представляющих образование
726 ЭЛЕКТРОСТАТИКА [Гл II двух разных ионов, как НС1, НВг и т. п., или имеющих асиммет- асимметричную форму, как СН3С1, СН3СООН, Н2О и т. п., дипольный момент отличен от нуля. Такие молекулы называются диполь- ными. Рассмотрим прежде всего свойства газа с дипольными моле- молекулами, имеющими собственный момент d0. Если е@) — энергия молекулы в отсутствии поля, то при помещении ее в электриче- электрическое поле напряженностью Е ее энергия будет равна e<°> -fi?0|?|cos8, A3,18) где 8 — угол между направлением приложенного поля и осью молекулы Из формулы A3,18) следует, что изменение энергии диполь- ной молекулы в электрическом поле сводится к появлению у нее потенциальной энергии, равной (—d0\E\cos Э). Эта энергия в однородном электрическом поле не зависит от положения молекулы, а определяется исключительно ее ориентацией. По- Потенциальная энергия имеет минимальное значение у молекулы, ориентированной вдоль поля, и максимальное — у ориентиро- ориентированной в противоположном направлении. В отсутствие поля молекулы ориентированы совершенно беспорядочно, все их ори- ориентации являются равновероятными. Электрическое поле оказы- оказывает ориентирующее влияние и стремится установить все моле- молекулярные диполи вдоль поля, когда их потенциальная энергия минимальна. Ориентация молекул вдоль поля становится более вероятной, чем против поля. Как далеко идет эта упорядочиваю- упорядочивающая тенденция поля и в какой мере полю удается ориентиро- ориентировать все диполи, определяется отношением энергии d0E, приоб- приобретаемой дипольными молекулами в электрическом поле, к их тепловой энергии kT. Если последняя велика, т. е. kT^doE, то ориентирующее действие поля является сравнительно слабым. Напротив, при &T<Cd0E все диполи вынуждены ориентиро- ориентироваться вдоль поля. Значения дипольных моментов молекул некоторых газов при- приведены в табл. 1. По порядку величины они равны произведе- произведению заряда электрона на размеры молекул. Таблица 1 Газ Дипольный момент 10 эл.- ст. ед. X см на 1,03 НВг 0,79 Н2О 1,84 SOS 1,61 СО2 0,00 СО 0,12 СНС!3 0,95 СН2С12 1,59 СН3С1 1,89
$ 13] ТЕРМОДИНАМИЧЕСКИЕ ПОТЕНЦИАЛЫ ДИЭЛЕКТРИКА 727 С помощью данных табл. 1 можно оценить порядок вели- величины -jf- Благодаря малости дипольного момента d0 оказы- оказывается, что эта величина весьма мала при всех температурах, при которых газы еще не конденсируются, и во всех практически достижимых полях. Для того чтобы й(Д было порядка kT, нужно, чтобы \Е\ было порядка ^- «* 104Г ~, При Т«300° К получаем |?|«*3-106 в/см, что явно нереально. Таким образом, ориентирующее действие поля является слабым. Тем не ме- менее появление преимущественной ориентации у молекулярных диполей приводит к возникновению отличного от нуля среднего дипольного момента всего газа <&*. Вычислим средний дипольный момент газа по формуле A3,4). При этом, поскольку отношение -—¦ весьма мало, тем- температуру практически всегда можно считать высокой и заме- заменить суммирование интегрированием. Функция состояний газа дипольных молекул в электрическом поле имеет вид A3,19) Здесь N — число молекул в газе, а через Zo обозначена функция состояний газа в отсутствие поля. Интегрирование ведется по всем состояниям молекулы, которые определяются углами 9, ф. Поскольку "^ < 1, имеем I g I cos e кТ sin 9 dQ так что Логарифмируя, имеем Подставляя A3,20) в A3,4), находим *-
728 ЭЛЕКТРОСТАТИКА [Гл. N Последняя формула имеет очень простой смысл. Если напи- написать ее в виде произведения двух множителей «а> do\E\ ., ДА Яг = 3kJ, {d0N), то ясно, что первый множитель характеризует степень ориен- ориентации молекулярных диполей, которая тем больше, чем сильнее приложенное поле |?|, и тем меньше, чем сильнее дезориенти- дезориентирующее действие теплового движения, характеризуемое значе- значением кТ. Второй множитель означает полный дипольный момент молекул в газе. Результирующая поляризация газа была бы равна d0N, если бы все диполи были ориентированы вдоль при- приложенного поля. При наличии теплового движения поляризация составляет только малую часть этой предельной поляризации. Малость ориентационного множителя °'. можно наглядно предста- представить себе следующим образом. Большая часть дипольных мо- молекул движется и, в частности, вращается в газе с энергией, значительно большей, чем потенциальная энергия в поле d0E. Поэтому приложенное поле не может приостановить их враще- вращения. При вращении происходит усреднение дипольного момента по всем направлениям, и средний вклад вращающейся моле- молекулы в полный дипольный момент газа оказывается равным нулю. Однако в газе имеется небольшой процент молекул, у ко- которых кинетическая энергия вращательного движения меньше doE. Такие молекулы не могут повернуться против поля, и в поле их вращательное движение заменяется крутильными ко- колебаниями около направления поля. Только эти молекулы вно- вносят долю в средний дипольный момент газа. Из A3,21) можно найти электрическую восприимчивость дипольного газа, отнесенную к единице объема: A3,22) Формула A3,22) носит название формулы Ланжевена, которым она впервые была получена. Диэлектрическая восприимчивость газа связана с непосред- непосредственно измеряемой диэлектрической проницаемостью соотноше- соотношением D,14): е = 1 + Из измерений е, как функции температуры, может быть найден дипольный момент молекул do. Найденные таким образом зна- значения d0 приведены в таблице 1. Численное значение их мало, так что в газах е всегда порядка единицы.
13] ТЕРМОДИНАМИЧЕСКИЕ ПОТЕНЦИАЛЫ ДИЭЛЕКТРИКА 729 Дипольный момент является важной характеристикой моле- молекул. Он, в частности, позволяет судить о структуре и геометри- геометрической форме молекул. Чем более асимметричной является мо- молекула, тем больше ее дипольный момент. Это видно, в частно- частности, на примере молекул СС14, СНС13, СН2С12, СНзС1 и СН4, восприимчивости которых изображены на рис. 87. Значение с& определяется из наклона соответствующей прямой. Четыреххлористый углерод и метан являются симметрич- симметричными молекулами, имеющими форму тетраэдра; их дипольный момент равен нулю. У хлор- замещенных метана, являю- являющихся асимметричными моле- молекулами, дипольный момент отличен от нуля. Он имеет наибольшее значение у асим- асимметричной молекулы СН3С1. Меньший интерес представ- представляет поведение молекул, не обладающих собственным ди- польным моментом. Под дей- действием приложенного электри- электрического поля происходит их поляризация. Электронные оболочки атомов или молекул смещаются относительно ядер, и в них возникает индуцированный дипольный момент. Величина индуцированного дипольного момента пропорциональна напря- напряженности приложенного поля, так что 0,002 Рис. 87. = aE и энергия Поэтому е = е<°> - УУа | Я р Z = Zoe 2kT P = Na\E\. A3,23) A3,24) Поляризация оказывается не зависящей от температуры. Иными словами, тепловое движение не влияет на поляризацию элек- электронных оболочек атомов и молекул. Изложенная здесь теория справедлива только для сильно разреженных газов. В более плотных газах и особенно жидко- жидкостях взаимодействие между молекулами играет весьма суще- существенную роль в их электрических свойствах. В таких системах нельзя уже более рассматривать ориентирующее действие поля на отдельный диполь. Ориентация диполей будет определяться
730 ЭЛЕКТРОСТАТИКА [Гл. II не только внешним, но и внутренним электрическим полем, созданным всеми дипольными молекулами. Теория дипольных жидкостей оказывается весьма сложной, и мы не можем здесь ее изложить. Отметим только, что в этой области нет той ясности, которая имеется в случае разреженных газов. Диэлектрическая поляризация подавляющего числа твердых диэлектриков обусловлена индуцированной поляризацией моле* кул диэлектрика. Ориентационной поляризации даже в кристал- кристаллах, построенных из дипольных молекул, не происходит, по- поскольку молекулы в кристалле сильно взаимодействуют с со» седями и электрическое поле слишком слабо для того, чтобы преодолеть силы взаимодействия и поворачивать молекулы. Одним из немногих типичных исключений является твердый HCI. Измерения И. В. Курчатова показали, что молекулы HCI поворачиваются под действием электрического поля, и в кри- кристалле происходит ориентация поляризации. Значения воспри- восприимчивости и диэлектрической проницаемости у твердых диэлек* триков гораздо больше, чем у газов. Диэлектрическая прони-* цаемость твердых диэлектриков имеет значение, равное не- нескольким единицам, а в ряде случаев достигает значений около 100. Благодаря большой величине диэлектрической проницаемо* сти в плотной среде необходимо учитывать, что на молекулу, находящуюся в среде, действует не внешнее поле Ео, а эффек- эффективное внутреннее поле, слагающееся из внешнего поля и поля, возникающего в среде из-за поляризации ее молекул. Диэлектрическая постоянная твердых диэлектриков сравни- сравнительно слабо изменяется с температурой. Это означает, что ди- диэлектрические свойства твердых тел связаны с изменением рас- распределения зарядов внутри молекул и не зависят от их тепло- теплового движения.
ГЛАВА III ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК § 14. Закон Ома Рассмотрев основные свойства электростатического поля не- неподвижных зарядов, мы можем перейти к изучению более сложного случая электромагнитного поля, возникающего при стационарном движении свободных зарядов, т. е. при наличии постоянного во времени тока в проводниках. Этот вопрос вклю- включает два, в значительной мере независимых, аспекта: 1) нахождение электромагнитного поля постоянных токов; 2) рассмотрение механизма прохождения тока в различных средах — механизма электропроводности. Не вдаваясь в изучение механизма прохождения тока, мы ограничимся допущением, что плотность тока в однородном про- проводнике связана с напряженностью поля законом Ома (/ = оЕ). Значение электропроводности о тесно связано с механизмом прохождения тока и изменяется в весьма широких пределах у различных проводников. В части VI мы рассмотрим микроскопический смысл элек- электропроводности и оценим ее значение для некоторых важней- важнейших проводников. Мы будем далее предполагать, что постоянство электриче- электрического тока во времени поддерживается некоторыми устрой- устройствами, именуемыми источниками тока. Примерами источников тока могут служить машинные генераторы разнообразных устройств, гальванические элементы, аккумуляторы, термопары и т. п. Действительно, физически совершенно очевидно, что ни- никакая комбинация заряженных или нейтральных проводников не может обеспечить прохождение постоянного тока в системе. Приведя в контакт проводники, находящиеся при различных потенциалах, мы вызовем нестационарное движение свободных зарядов, которое будет продолжаться до тех пор, пока не про- произойдет выравнивание потенциалов всех проводников. Источники постоянного электрического тока должны всегда иметь неэлектростатический характер. Они могут, хотя и
732 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл. I IT не обязательно, иметь, например, электрохимический характер. Мы не будем в дальнейшем вдаваться в детали устройства ис- источников тока. Для нас важно лишь то, что источники тока обес- обеспечивают поддержание постоянного тока в проводниках. Совершенно формально, не входя в рассмотрение механизма действия источников тока, мы можем включить -источник тока в состав рассматриваемой системы проводников с постоянным током, видоизменив закон Ома. Именно, замечая, что источники тока создают плотность тока в проводниках вне зависимости от непосредственного действия электрического поля, мы можем записать закон Ома в обобщенном виде J = e(E + E"op). A4,1) Вектор ?стор^ зависящий от координат, формально характе- характеризует действие источников тока. В тех участках проводника, где действует источник тока, при Е = 0 }ФО. Так, например, если система состоит из проводника, соединенного с пластинами гальванического элемента, то в области пространства, занятой элементом, ?стор ф q Процессы, происходящие внутри гальва- нического элемента, позволяют поддерживать при различных потенциалах его пластины, соединенные с проводником. Это, в свою очередь, обеспечивает существование постоянного во вре- времени электрического поля внутри элемента и, в соответствии с законом Ома, постоянного тока в проводнике. Величина ?ст°р по историческим причинам носит не совсем удачное наименование сторонней силы (?ст°р не имеет размер- размерности силы и не является аналогом силы по существу). Сторон- Сторонняя сила является количественной характеристикой устройства, поддерживающего прохождение постоянного тока в проводни- проводниках. Мы вернемся еще к интерпретации понятия сторонней силы в последующих параграфах. Система уравнений Максвелла для постоянного тока при наличии сторонних сил имеет вид rot ?•=(), A4,3) Уравнение непрерывности для стационарного процесса про- прохождения тока можно написать в виде div/=0. A4,4) Нетрудно видеть, что написанная система уравнений яв- является полной. Мы видим, прежде всего, что распределение
5 151 ЛИНЕЙНЫЙ ПРОВОДНИК С ПОСТОЯННЫМ ТОКОМ 733 электрического поля не зависит от распределения магнитного поля. Последнее определяется заданием плотности тока / во всем пространстве. На границе раздела проводящих сред должны выполняться граничные условия: ?.tg —^*tgj ^14,DJ ИЛИ yd) ;B) ^0Т=~BГ A4,6) И •(I) ;B) (\Л7\ ]п = ]п ¦ A4,7) Первое из них совпадает с E,2), второе получается из уравне- уравнения непрерывности так же, как, например, условие E,5). Наглядно граничные условия A4,6) — A4,7) можно интер- интерпретировать как преломление линий тока на границе раздела по закону: где a — угол между линией тока и нормалью к поверхности в соответствующих средах. На границе раздела проводник — диэлектрик выполняется граничное условие /« = 0. A4,9) Магнитные векторы удовлетворяют граничным условиям, рассмотренным в § 5. ¦§ 15. Линейный проводник с постоянным током Рассмотрим прежде всего весьма важный случай линейного проводника с постоянным током. Под линейным мы будем пони- понимать проводник, длина которого весьма велика по сравнению с его поперечными размерами. Линейные проводники часто име- именуют также проводами. Вектор плотности тока в линейном про- проводнике можно, в силу граничного условия A4,9) на его по- поверхности, с большой степенью точности считать параллельным вектору ей, касательному к оси проводника. Таким образом, в каждой данной точке линейного провод- проводника можно написать jdl^jdl. A5,1) Введем в рассмотрение полный ток /, проходящий через се- сечение линейного проводника, нормальное к оси проводника
734 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК (Гл. [II (или, что то же самое, нормальное к линиям тока). По опреде- определению f j(E + ?стор) dS, A5,2> где интегрирование ведется по сечению линейного контура с током Уравнение непрерывности A4,4) и граничное условие позво- позволяют написать или I=jjdS = jS = const, A5,3) где S — поперечное сечение проводника в данном месте. Уравнение непрерывности в интегральной форме показывает, что через любое сечение линейного проводника идет одинако- одинаковый ток /. Проинтегрируем формулу обобщенного закона Ома A5,1) вдоль линейного контура с током. Имеем, очевидно, jj 1 1 Первый интеграл преобразуем, написав где /?|2 представляет омическое сопротивление проводника на участке A,2). Тогда имеем A5,5) где ((pi — фг) — разность потенциалов между точками 1 и 2 и 2 g*J°p = J ?стор Л A5,6) 1 носит название сторонней электродвижущей силы (э. д. с.) на участке A,2). Если на данном участке провода сторонней силы нет, ?°T<:>p«=0, то A5,5) превращается в простой закон Ома.
$ 16] ПОСТОЯННЫЙ ТОК В ПРОВОДЯЩЕЙ СРЕДЕ 735 Если контур замкнут и точки 1 и 2 совпадают, поскольку в силу A4,2) поле Е имеет потенциальный характер, интеграл &Edl=*0 и IR = t?T0», A5,7) где R — сопротивление всего линейного контура и CTOpd/. A5,8) Произведение силы тока на полное сопротивление линейного контура с током равно э. д. с. замкнутой цепи с током. Рассмотрим теперь энергетические соотношения для линей- линейного контура с током. Как мы подчеркнули, вся работа тока в цепи постоянного тока переходит в тепло. Поэтому полное тепло, выделившееся в линейном проводнике, q = ^?-dV-j j{E + ECTOV) d V = - J j grad Ф dV + J jEcro!> d V - - J JE"OP dV - J div (Уф) dV + J q> div J dV = = J JE™P dV - § Ф/„ dS = J jE"op dV в силу A4,2), A4,4) a A4,9). Полное тепло, выделяющееся в цепи, оказывается равным работе сторонних сил. § 16. Постоянный ток в проводящей среде Другим предельным случаем является прохождение тока в системе, состоящей из хороших проводников (например, ме- металлических электродов), погруженных в проводящую среду. Если считать, что сторонние силы в проводящей среде отсут- отсутствуют, уравнения для электрического поля можно написать в виде rot? = 0, div/= diva/; = 0. В однородной среде, при a = const, последнее выражение приобретает вид div?=0. Вводя потенциал поля ф, находим, что он удовлетворяет урав- уравнению Лф = 0. A6,1)
736 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл. Ill На поверхности проводников выполняются граничные усло- условия A4,5) и A4,7). Их можно записать, введя потенциал ср. Именно, условие A4,5) для непрерывности тангенциальной сла- слагающей поля непосредственно переходит в условие смыкания потенциала на поверхности раздела: ф! = ф2. A6,2) Равенство нормальных компонент плотности тока /„ = оЕп дает о<|) (|!Е) = а<2) (|L\ , A6?3) \дп)\ \дп 12' \ » / где п — нормаль к поверхности раздела. Мы видим, что уравнение для потенциала и совокупность граничных условий, определяющие распределение тока в про- проводящей среде, идентичны с соответствующими выражениями § 8, определяющими распределение электростатического поля в двух диэлектрических средах. Единственное отличие заклю- заключается в том, что вместо диэлектрических проницаемостей ei и 62 в граничном условии A6,3) стоят электропроводности сред о<'> и а<2>. Поэтому потенциал в проводящей среде определяется фор- формулами электростатики с заменой е на а. Рассмотрим случай двух электродов в бесконечной среде. Ток, текущий с электрода, напишем в виде Вводя электростатическую емкость по формуле (8.13), на- находим Полное сопротивление равно Последняя формула позволяет формально выразить сопро- сопротивление системы через емкость аналогичной по геометриче- геометрическим характеристикам электростатической системы, проводников. В виде примера можно рассмотреть систему из двух шаро- шаровых электродов, погруженных в бесконечную среду. Мы будем предполагать, что ради)сы электродов а и b малы по сравнению с расстояниями между их центрами.
§ 16] ПОСТОЯННЫЙ ТОК В ПРОВОДЯЩЕЙ СРЕДЕ 737 Решение уравнения Лапласа для двух таких сфер имеет вид а ь где фа и фь — потенциалы на поверхностях сфер, а Г\ и г2 — рас- расстояния до центров сфер. Полный ток на поверхность первой сферы равен = ф or (-д—) если пренебречь вторым членом в ф, который при г=а мал по сравнению с первым. Аналогично полный ток на вторую сферу оказывается равным / = Сопротивление Таким образом, решение задачи о пространственном распре- распределении тока сводится к решению соответствующей электроста- электростатической задачи. Следует, однако, сделать важную оговорку. Если проводник частично граничит с проводящей, а частично с непроводящей средой, формальная аналогия с электростатикой теряет смысл. Действительно, в непроводящей среде о = 0, между тем как в электростатике не бывает тел с диэлектрической проницаем мостью, равной нулю. Получим еще одно полезное для дальнейшего соотношения между плотностью тока и полным током в общем случае пели* нейного проводника. Пусть по некоторому проводнику течет ток, плотность которого распределена по сечению неравномерно. Разобьем проводник на как угодно тонкие трубки с током. Со- леноидальный характер постоянного тока позволяет всегда про- произвести такое разбиение. Каждую трубку с током можно счи- считать линейным проводником, и мы можем для нее написать dI=JadSm A6,5) где индекс а означает номер трубки. Если бы плотность тока была распределена по сечению рав- равномерно, можно было бы написать, очевидно, 47 В. Г. Левич, том 1
738 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл ИГ где / и S — полный ток и сечение проводника соответственно. При неравномерном распределении тока всегда можно поло- положить ^-f- = —g2- гр = const (вдоль длины проводника), A6,7) где функция \|) характеризует неравномерность в распределении тока по сечению. Поэтому при любом распределении тока имеем /-§¦'. A6,8) -§ где t — единичный вектор, направленный вдоль линии тока. Последнее равенство имеет простой смысл: хотя распреде- распределение плотности тока определяется физическими свойствами проводника и его геометрией, плотность тока при прочих рав- равных условиях пропорциональна полному току, § 17. Магнитное поле постоянных токов. Закон Био — Савара Зная распределение плотности тока к интегрируя уравнения A4,3), можно найти распределение магнитного поля. Вводя в A4,3) вектор-потенциал А, но формуле D,19) получаем урав- уравнение rot I rot А) = Щ- J. A7,1) Для однородной и изотропной бесконечной среды, характе- характеризуемой постоянной магнитной проницаемостью ц, можно на- написать ддв_±К./. A7,2) Решение последнего уравнения лишь множителем ц отличается от решения уравнения A9,13) части I для вектора-потенциала в пустоте. Поскольку вне проводников плотность тока /' равна нулю, фактически интегрирование можно проводить лишь по объему проводников. При этом, однако, мы считаем, что \х имеет одно и то же значение как в веществе проводников, так и в окружаю- окружающей их среде. Если система не содержит ферромагнитных тел, то фактическое значение ц. мало отличается от единицы. По- Поэтому приближенно можно считать ц, имеющим одинаковое зна- значение во всем пространстве. При наличии ферромагнетиков фор- формула A7,3) теряет смысл.
§ 171 ЗАКОН БИО—САВАРА 739 В случае линейных проводников формулу A7,3) можно су- существенно упростить, написав, в силу постоянства полного тока / по сечению линейного проводника, J* 07,4) В формуле A7,4) р. означает магнитную проницаемость среды, внешней по отношению к проводнику с током. Мы видим, что из A7,4) выпали все характеристики самого линейного провод- проводника, например распределение плотности тока в нем, и он рас- рассматривается как чисто геометрический объект. Поэтому свой- ства линейного проводника, в том числе и магнитные свойства вещества провода, не сказываются на величине магнитного поля. Формула A7,4) справедлива для любых, в том числе фер- ферромагнитных, проводников. Из определения вектора-потенциала следует, что магнитная индукция линейного проводника с током / равна (ср. с A9,15) ч. I) Формула A7,5) выражает закон Био и Савара в однородной и изотропной среде. Индукция (среднее поле) В оказывается в ц раз большей, чем поле такого же тока в пустоте. Соответ- „ в стпенно напряженность поля в среде п= — совпадает с полем в пустоте. Часто закон Био и Савара пишут в дифференциальной форме, т. е. в виде где dB— вклад, вносимый в индукцию элементом тока dl. Нужно иметь в виду, что A7,5) нельзя однозначно разложить на элементы A7,6). К A7,6) всегда можно прибавить вектор- векторную функцию, обращающуюся в нуль при интегрировании по замкнутому контуру с постоянным током. В виде примера применения полученных формул вычислим магнитное поле, создаваемое в окружающем пространстве то- током, текущим в прямом бесконечном линейном проводнике. Из соображений симметрии ясно, что это поле направлено по касательным к окружностям, концентричным к проводнику. Пусть угол между проводником и радиусом-вектором равен а 47*
740 постоянный электрический ток [Гл. III (рис. 88). Закон Био—Савара в применении к рассматривае- рассматриваемому случаю дает _ у.г Г [di, п] ~~ J —^—' где я = —. Вводя кратчайшее расстояние от точки наблюдения до проводника р, имеем для компоненты поля Яф, направлен- направленной по касательной к окружности радиуса р, концентрической к проводнику: d-^-, A7,7) где было положено (рис. 88) г cos a = {), sin (90" - a) dl = r da cos a Вычислим, далее, магнитное поле плоского кругового кон- контура с током радиуса а на центральной оси г, перпендикуляр- перпендикулярРис. 88. Рис. 89. ной к плоскости, в которой лежит проводник с током (рис. 89), В этом случае можно написать для компонент поля ' cos2 a sin a Ц/ ? [dl, r\z Ц/ f d/sina сгг 2па. Поскольку (рис. 89) cosa = sin a = ¦ _ 2ц/ находим окончательно где S — площадь окружности, образуемой током. A7,8)
17] ЗАКОН БИО-САВАРЛ 741 В частности, на большом расстоянии от проводника is где проекция магнитного момента тока Mz равна — (см. § 22 ч. I). В центре окружности плоскости z — 0 В* = ^. A7,10) Компонента поля В±, перпендикулярная оси z, равна нулю, как это ясно из соображений симметрии — противоположным участкам контура с током будут отвечать значения Bz с проти- противоположными знаками. Отыскание магнитного поля в нелинейных проводниках с постоянным током представляет сложную в математическом от- отношении задачу. Вычисление вектора-потенциала по общей формуле A7,3) удается провести до конца лишь для отдель- отдельных случаев. Мы ограничимся поэтому некоторыми примерами. Весьма простым является нахождение магнитного поля беско- бесконечного проводника с током цилиндрического сечения радиуса а. В этом случае можно провести интегрирование уравнения A4,3) непосредственно. Благодаря цилиндрической симметрии магнитное поле как внутри, так и вне проводника имеет только компоненту Н^ Интегрирование A4,3) по площади окружности радиуса р<а дает где S = яр2. Последнюю формулу можно представить в виде или, в векторном виде, ^ ^ A7,12) где I — единичный вектор вдоль образующей цилиндра. Вне проводника аналогично Если сечение проводника имеет более сложную форму, то иногда полезным оказывается использование принципа супер- суперпозиции полей. Напишем еще выражение для вектора Пойнтинга в случае линейного проводника с постоянным током.
742 ПОСТОЯННЫЙ ЭЛРКТРИЧПСКИП ТОК [Гл TIT По определению вектор Пойнтинга где а — радиус проводника. Пользуясь A6,1), имеем В линейном проводнике вектор / направлен по оси провод- проводника, вектор Н — по касательной к концентрическим окруж- окружностям. Поэтому мы можем написать где п — единичный вектор, направленный внутрь проводника. Пользуясь A7,7), находим В той части проводника, где сторонние силы отсутствуют, энер- энергия втекает в проводник. При этом полный поток энергии на длине L т. е. равен полному джоулевому теплу, выделяющемуся в про- проводнике. Т.чким образом, диссипируемая в проводнике энергия по- поставляется внешним электромагнитным полем. Напротив, на тех участках проводника, где действуют сторонние силы, вектор Пойнтинга направлен наружу. Поток энергии, создаваемый сто- сторонними силами, вытекает в окружающее пространство. Как мы видели в § 15, полное количество энергии, диссипируемое в проводнике, равно энергии, отдаваемой источниками сторон- сторонних сил. § 18. Намагничение магнетиков и магнитный момент Перейдем теперь к рассмотрению магнитных свойств ве- вещества. Если некоторая система частиц помещена во внешнее маг- магнитное поле, то в ней возникает намагничение. Средний магнит- магнитный момент системы может быть определен таким же соотно- соотношением, что и средний дипольный момент: ^-^, A8,1) где Н—напряженность внешнего магнитного поля.
§18] НАМАГНИЧЕНИЕ МАГНЕТИКОВ И МАГНИТНЫЙ МОМЕНТ 743 Соответственно можно написать выражение для изменения свободной энергии: dFdF Можно также ввести термодинамический потенциал Гиббса с?ф = rftp0 — М dH. A8,2) Их смысл аналогичен соответствующим величинам для электри- электрического поля (см., однако, § 28). Мы не будем останавливаться на разборе явлений магнито- стрикции и магнитокалорического эффекта. Они также анало- аналогичны электрическим эффектам, рассмотренным в предыдущем параграфе. Магнитная восприимчивость может быть вычислена по фор- формуле __ \М\ _ kT 1 I dlnZ Х~~ \Н\ ~ V \Н\\ дН A8,3) В зависимости от знака % различают диамагнитные (х<0) и парамагнитные (%>0) вещества. Кроме диа- и парамагнитных веществ имеется особая группа ферромагнитных тел, у которых магнитная восприимчивость чрезвычайно велика и резко зави- зависит от магнитного поля. У диамагнитных веществ магнитная восприимчивость обыч- обычно очень мала по абсолютной величине (х~Ю~в) на грамм-моль и не зависит от температуры. Диамагнитными являются все инертные газы и большая часть газов, молекулы которых пред- представляют насыщенные химические соединения, почтч все орга- органические соединения, все простые изоляторы и примерно поло- половина металлов (Си, Ag, Аи, Hg, Zn и др.). Среди последних встречаются так называемые аномальные диамагнетики, у ко- которых восприимчивость в 10—100 раз превышает указанное выше нормальное значение и имеет ряд других аномальных свойств (например, зависит от температуры и от поля, как у Bi и Sb). У нормальных парамагнетиков магнитная восприимчивость зависит от температуры по закону. const По порядку величины % составляет около Ю-4—10~6 на грамм- моль. К таким парамагнитным веществам принадлежат неко- некоторые газы (Ог, NO, СО2 и т. п.), кристаллогидраты солей ред- редких земель (например, Gd2SO4«8H2O), соли металлов группы платины, железа и т. д. У многих нормальных парамагнетиков
744 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл. Ill зависимость % от температуры и-меет вид _ const Z~ Г±Д » где Д — постоянная. Другую группу парамагнитных веществ составляют парамагнитные металлы, обладающие небольшой (х = 10—10 на грамм-мольI парамагнитной восприимчи- восприимчивостью, не зависящей от температуры. Существуют так назы- называемые аномальные парамагнетики, у которых парамагнитная восприимчивость зависит от поля (метамагнетики) или имеет максимальное значение при некоторой температуре (антиферро- (антиферромагнетики). Наконец, тела с очень большой (по порядку величины до- достигающей 103) положительной восприимчивостью, сложным образом зависящей от напряженности магнитного поля, а так- также температуры и ряда других факторов, составляют группу ферромагнетиков. Мы не можем здесь подробно осветить "все стороны совре- современного учения о магнитных свойствах вещества. Ограничимся только некоторыми общими замечаниями и изложением теории парамагнетизма нормальных парамагнетиков. Теория диамаг- диамагнитных свойств атомов будет обоснована в гл. IX, ч. V. Прежде чем перейти к изложению современной теории маг- магнитных свойств вещества, необходимо кратко остановиться на одном, кажущемся на первый взгляд весьма парадоксальным, утверждении. Именно, можно в самом общем виде доказать, что магнитный момент любого тела, вычисленный с помощью законов классической статистики, тождественно равен нулю. Приведем простейшее доказательство этой теоремы. Любую систему во внешнем поле можно представить как совокупность движущихся заряженных частиц. Как известно из электродинамики, при движении заряженной частицы в одно- однородном магнитном поле, направленном вдоль оси z, обобщен- обобщенный импульс частицы имеет вид (§ 41, ч. I) р =л<°>--^- р =р«» + — Р =Р<0) где р^\ р®\ pf> — компоненты импульса в отсутствие поля. Функция Гамильтона дается выражением D1,8) ч. I: \2 / ellx + и Функция состояний системы в магнитном поле имеет вид
§18) НАМАГНИЧЕНИЕ МАГНЕТИКОВ И МАГНИТНЫЙ МОМЕНТ 745 Вводя вместо рх новую переменную Рх Рх Р 2с ' мы видим, что после интегрирования по р'х от минус бесконеч- бесконечности до плюс бесконечности функция состояний оказывается не зависящей от внешнего поля Н. То же относится и к ру. В силу A8,3) средний магнитный момент тождественно равен нулю. Полученный результат кажется особенно парадоксальным потому, что в большинстве книг приводится классическое объяс- объяснение диа- и парамагнетизма. Диамагнитные свойства вещества связываются с изменением орбитального движения электронов в атоме, вызванным .магнитным полем. Как известно, в замкну- замкнутом электрическом контуре магнитное поле индуцирует ток, те- текущий в таком направлении, что возникающее дополнительное магнитное поле тока ослабляет приложенное поле. Индуциро- Индуцированный магнитный момент тока направлен против поля и про- пропорционален напряженности последнего, а также площади, охватываемой контуром. Считая электрон, движущийся в атоме, некоторым контуром с током, можно получить следующее чисто электродинамическое выражение для магнитного момента ча- частицы, движущейся по орбите радиуса г0: Что же касается парамагнетизма, то он в классической электродинамике связывается с наличием магнитного момента у электрона, движущегося по орбите и имеющего отличный от пуля механический момент. Если L означает механический мо- момент системы, то в классической электродинамике показывается, что система обладает магнитным моментом Магнитный момент, определенный формулой A8,4), является аналогом электрического дииольиого момента. Каждый атом является как бы маленьким магнитиком. Поэтому к нему пол- полностью применимы рассуждения и формула A8,1). В атомном газе, атомы которого обладают магнитным моментом |i, должен возникать средний магнитный момент вследствие появления преимущественной ориентации магнитных моментов вдоль поля. Непоследовательность подобных рассуждений состоит в том, что в них заранее принимается существование стабильных электронных орбит. Между тем хорошо известно, что на ос- основе классических представлений невозможно понять самое
746 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК (Гл III существование стабильных орбит. Отсутствие магнитного мо- мепга в классической физике является выражением факта от- отсутствия стабильного движения в системе элементарных зарядов. Предположения о существовании стационарных орбит элек- электронов в атомах или фиксированных моментов у атомов, ис- используемые в «классической» теории магнетизма, представляют по существу предположения о квантовании состояний, которые делаются в неявном виде. В квантовой механике доказывается, что уровни энергии атомной системы, помещенной в магнитное поле, изменяются. В случае атомов или ионов, у которых среднее значение меха- механического момента L системы равно нулю, для энергии нор- нормального состояния получается следующее выражение (см. гл. IX ч. V): где ео — значение энергии в нормальном состоянии и (rf) — квантово-механическое среднее радиуса-вектора 1-го электрона в нормальном состоянии. Суммирование ведется по всем элек- электронам в атоме. Этой энергии отвечает средний магнитный мо- момент __ _дг еЧ1_ ^ср дН ~ Формула A8,6) по форме совпадает с приведенной выше клас- классической формулой, но имеет иной смысл: величина (г2)ср представляет квантовомеханическое среднее (см. гл. Ill 4.V). В нормальном состоянии атом или ион приобретает диамаг- диамагнитную восприимчивость Подчеркнем, что никакого усреднения по различным состоя- состояниям в A8,7) не производится и усреднение не имеет ничего общего со статистическим усреднением. Система, представляющая собрание N независимых атомов или инов, будет обладать в нормальном состоянии индуциро- индуцированных магнитным моментом и диамагнитной восприимчивостью
§ 18] НАМАГНИЧЕНИЕ МАГНЕТИКОВ И МАГНИТНЫЙ МОМЕНТ 747 Если подставить для (г\р значения, вычисленные различными методами (об этих методах см. ч. V), или средние радиусы ато- атомов, полученные из кинетической теории газов, то для х полу- получается значение, согласующееся с найденными из измерений. Если система (атом или ион) в нормальном состоянии обла- обладает отличным от нуля механическим моментом, то энергия в магнитном поле будет иметь иной вид. Именно, в квантовой механике показызается, что если неко- некоторая молекулярная система обладает орбитальным моментом количества движения L, то энергия ее в некотором состоянии i равна где Lz — проекция механического момента на направление маг- магнитного поля (ось г выбрана вдоль поля). Вывод A8,9) см. в гл. IX ч. V. Простые оценки показывают, что последний член в формуле A8,9) при всех значениях напряженности поля И мал по сра- сравнению со вторым членом. Исключение составляют очень боль- большие органические молекулы, у которых 2j(^) весьма велико. В дальнейшем мы будем опускать последний член в A8,9) и писать энергию в виде еВР^ A810> В квантовой механике показывается (см. гл. III ч. V), что проекция механического момента на ось г принимает дискрет- дискретный ряд значений: U=-U -L + 1, ..., О, 1 L-l, L (всего 2L + 1 значений). Поэтому в магнитном поле i-тл уровень энергии распадается на BL + 1) уровней, обладающих энер- энергиями Наличие у системы электронов помимо механического мо- момента, обусловленного орбитальным движением, спинового ме- механического момента приводит к появлению у системы спино- спинового магнитного момента. Если результирующий спин системыS отличен от нуля, а результирующий орбитальный момент L
748 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл. III равен нулю, энергия системы в магнитном поле оказывается равной (см. гл. VIII ч. V) где Sz — проекция спинового момента на направление поля, при- принимающая дискретный ряд значений: Sx=-S, -S+l E-1), S. У подобной системы i-й уровень распадается на BS+!l) под- подуровней: ? SH 08,12) Общий случай, когда L и S отличны от нуля одновременно, мы рассматривать не будем. В магнитном поле система, находящаяся в t'-м состоянии, бу- будет обладать средним (в квантономеханическом смысле) маг- магнитным моментом ЫсР = - jff " 4^7 Lz A8,13) или Мы видим, что магнитный момент системы имеет положи- положительный знак, т. е. что система, имеющая собственный механи- механический момент, является парамагнитной. Отношение магнитного момента к орбитальному механическому равно -т . Для спи- спинового момента это отношение вдвое больше. § 19. Парамагнитная восприимчивость Рассмотрим теперь поведение системы, содержащей большое число атомов или молекул во внешнем магнитном поле. Маг- Магнитное поле оказывает ориентирующее влияние на магнитные моменты атомон, стремясь установить их вдоль ноля. Тепловое движение расстраивает правильное расположение моментов. В результате конкуренции этих процессов устанавливается не- некоторое среднее распределение ориентации магнитных моментов относительно направления поля. Этому среднему распределению элементарных магнитных моментов отвечает средний магнитный мешепт всей системы. Найдем результирующий магнитный момент системы атомов по общей ф°РмУле. При этом будем считать, что взаимодей-
§10] ПАРАМАГНИТНАЯ ВОСПРИИМЧИВОСТЬ 749 ствие между магнитными моментами отсутствует и каждый маг- магнитный момент свободно ориентируется во внешнем поле. Для законности этого предположения необходимо, чтобы среднее расстояние между атомами было достаточно велико. Примеры подобных систем будут даны ниже. Если исходное предположе- предположение выполнено, то каждую частицу можно считать отдельной подсистемой, имеющей в поле энергию, даваемую формулой A8,9). Среднее значение магнитного момента частицы может быть найдено с помощью формулы A8,1). Именно для функции состояний имеем •F-T^V A9,1) Суммирование ведется по всем значениям энергии подсистемы. Поскольку в магнитном поле вместо одного уровня энергии воз- возникает BL + 1) близких уровней энергии, суммирование в A9,1) ведется по всем уровням энергии г, а также в пределах данного уровня по всем подуровням, определяемым формулой A8,9), отличающимся друг от друга дискретными значениями магнитной энергии -z—-—, так как Lz принимает дискретным ряд значений. Выражение A9,1) можно существенно упростить, если учесть, что в атомных системах расстояние между уров- уровнями очень велико по сравнению с тепловой энергией kT. Бла- Благодаря этому члены суммы будут быстро убывать и в ней можно ограничиться первым членом, относящимся к основному уровню энергии во. В магнитном поле последний уровень распадается на BL+1) или BS + 1) подуровней в зависимости от того, какая из величин — L или S — в основном состоянии отлична от нуля. В первом случае можно написать z = e "т^е4птс kr й(ео)> A9J) где сумма берется по указанным подуровням. В дальнейшем рассмотрим два предельных случая: eh ' 4->kT A9,3) inmc Благодаря малости магнитного момента, условие A9,4) вы- выполнено в любых достижимых полях при не очень низкой тем- температуре. Если условие A9,4) выполнено, то экспоненту в A9,2)
750 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл III можно разложить в ряд и ограничиться членами, линейными по полю: Тогда получаем Функция состояний всей системы, состоящей из независимых друг от друга частиц, равна, очевидно, Z = zN. Согласно A8,1) средний магнитный момент всей системы равен Если, наконец, система имеет орбитальный и спиновый мо- моменты, то для х получается аналогичное выражение, но с коэф- коэффициентом в числителе, имеющим промежуточное между A9,7) и A9,9) значение. Во всех рассмотренных случаях парамагнитная восприимчи- восприимчивость оказывается обратно пропорциональной температуре Т. Кроме температуры, магнитн.чя ногпршшчиность A9,7) и A9,9) содержит только постоянный множитель, состоящий из уыивер- Если магнитный момент обусловлен не орбитальным, а спи- спиновым моментом, вместо A9,6) в силу A8,14) имеем Парамагнитная восприимчивость, отнесенная к N молекулам, имеет вид Выполняя суммирование, имеем
§TS] ПАРАМАГНИТНАЯ ВОСПРИИМЧИВОСТЬ 73I сальных постоянных и величины орбитального или спинового моментов соответственно. Переходя ко второму предельному случаю, когда удовлетво- удовлетворено условие A9,3), мы видим, что из всех членов суммы в A9,1) нужно сохранить только один, отвечающий значению маг- магнитной части энергии . ¦ LH. Остальные члены суммы, содер- eh(L-\)H eh ,. n, .. , жащие слагаемые —-^^ , -^^- (L — 2) // и т. д. будут го- гораздо меньше первого. Причина этого ясна: неравенство A9,3) означает, что энергия ориентации в магнитном поле велика по сравнению с тепловой энергией и все магнитные моменты будут ориентированы по полю, так что их проекция Lz будет равна L, т. е. наступит полное насыщение. Опуская в сумме A9,2) все члены, кроме первого, находим е0 eh 1.1Г г = е~кТе*ктс кТ ( A9,10) откуда М = NkT —-"¦¦- = chN LH A9 1 пли (в зависимости от природы магнитного момента). Таким обра- образом, наступает полное насыщение, и все моменты устанавли- устанавливаются вдоль поля. В промежуточном случае можно получить общую формулу для зависимости магнитного момента от поля. Переходя к вопросу о сравнении с экспериментом, заметим, что все величины в формулах A9,7) и A9,9) известны. Поэтому вычисленные восприимчивости можно непосредственно сравнить с экспериментальными значениями для тех систем, у которых выполняется исходное предположение — отсутствие взаимодей- взаимодействия между частицами, обладающими магнитным моментом. Нужно заметить, что число таких систем очень невелико. Боль- Большинство атомов и молекул в нормальном состоянии имеют равные нулю орбитальный и спиновой моменты (L = 5 = 0). У тех веществ, которые обладают в нормальном состоянии маг- магнитным моментом и парамагнитной восприимчивостью, имеется также и диамагнитная восприимчивость. Однако последняя со- составляет сравнительно небольшую (хоть иногда вполне ощути- ощутимую) часть парамагнитной восприимчивости. Для получения истинного значения парамагнитной восприимчивости к ее изме- измеренному значению необходимо прибавить величину диамагнит- диамагнитной восприимчивости. Получение атомных парамагнитных ве- веществ в газообразном состоянии и измерение их восприимчивости
752 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК 1Гл. ltl 0,6 0,6 о,г / 1-—• j 1 i является не простой задачей. Тем не менее, были произве- произведены измерения восприимчивости паров К, которые привели .. 0,38 к значению парамагнитной восприимчивости, равной —f~, что 0 37 согласуется с теоретическим значением —=г-. Точность измере- измерений невелика, и они не могут быть использованы для полной проверки формулы A9,9). Наиболее удобными объектами для проверки изложенной выше теории парамагнитной восприимчивости являются: 1) Водные растворы или твердые кристаллогидраты солей, содержащих ионы с механическим орбитальным или спиновым моментом, отличным от °° нуля. Такими ионами яв- являются ионы элементов группы редких земель и переходных элементов группы железа в раство- растворах или кристаллогидра- кристаллогидратах. В водных растворах и кристаллогидратах па- Щ, рамагнитные ионы отде- s ° лены друг от друга боль- Рис. 90. шим числом молекул во- воды. Поэтому энергия взаимодействия между ними весьма мала. Согласие теории с экспериментом оказывается превосходным. Это подтверждается на примере гадолиния Cd3f. У этого иона L=0 и «$ = -?-. Его маг- магнитный момент и восприимчивость выражаются формулами A9,8) и A9,9). Теоретическая зависимость магнитного момента от величины -т~- представлена на рис. 90 сплошной кривой. Точками обозначены измеренные значения М. 2) Молекулы парамагнитных газов (Ог, N0 и т. п.). Элек- Электрическое поле молекул не обладает сферической симметрией, механический момент их не имеет фиксированного значения и среднее его значение равно нулю. Если, однако, молекула обладает отличным от нуля спином, то она имеет магнитный момент, связанный со спином соотношением A8,14). Число мо- молекул, имеющих спин, отличный от нуля, сравнительно невелико. В качестве примера можно привести молекулу кислорода О2, спин которой S = 1. Из формулы A9,9) для магнитной воспри- восприимчивости 1 см3 кислорода при нормальных условиях получаем Я = 0,Н2 • 10. Измеренное значение равно % = 0Л43 • 10~°. Со- Согласие оказывается превосходным.
ФЕРРОМАГНЕТИЗМ 753 Мы не можем входить здесь в обсуждение более сложных случаев молекул, имеющих отличную от нуля проекцию механи- механического момента на ось симметрии, а также случаев, когда спин молекулы нельзя считать свободно ориентирующимся в про- пространстве '). § 20. Ферромагнетизм — спонтанное намагничение м гистерезис Ферромагнетизм представляет собой совершенно специфиче- специфическое явление, которое может иметь место только в твердой фазе и притом у сравнительно ограниченного круга веществ — эле- элементов группы железа и довольно значительного числа сплавов. Как мы уже подчеркивали ранее, магнитные свойства фер- ферромагнетиков принципиально отличаются от магнитных свойств других тел. Именно, в ферромагнети- ферромагнетиках не только не существует пропор- пропорциональности между векторами В и Н, но индукция является сложной и не- неоднозначной функцией поля B = f(H). Рис. 91. Значение f(H) зависит от предысто- предыстории процесса намагничения. С ростом внешнего поля Н индук- индукция ферромагнитного образца растет по кривой, характерный вид которой показан на рис. 91. При выключении поля индукция снижается, но не дохо- доходит до нуля, так что в теле остается некоторая остаточная намагниченность, существующая даже в отсутствие внешнего поля. Эта намагниченность может быть снижена до нуля изме- изменением направления внешнего ноля. Повторение процесса про- происходит по характерному циклу, также изображенному на рис. 91. Этот цикл называется гистерезисом. Существование подобной связи между В и Н означает, что в соотношении В = Н + 4лМ средний магнитный момент (намагниченность) тела следует рас- рассматривать как величину, определяющуюся состоянием тела как целого. Это значит, что связь между М и И имеет в ферромаг- ферромагнитном теле сложный характер и задание Н само по себе еще не определяет величину намагничения. Ниже мы обсудим ') См., например, Блох, Молекулярная теория магнетизма, ГТТИ, 1936; С. В В о и с о в с к и и, Современное учение о магнетизме, Гостехиздат, 1952. 48 В, Г. Левин, том 1
754 постоянный электричрский ток [Гл пг свойства намагниченности в ферромагнетиках и зависимость ее от поля Н и температуры. Однако прежде всего необходимо под- подчеркнуть, что, в отличие от диа- и парамагнитных веществ, в ферромагнитных веществах намагниченность не определена за- заданием внешнего поля, но является внутренним параметром системы. В состоянии статистического равновесия в ферромагнитном теле может существовать спонтанная (самопроизвольная) на- намагниченность. Состояние тела будет полностью характеризо- характеризоваться заданием его внутренних параметров, например, темпера- температуры, давления и спонтанной намагниченности, причем в равно- равновесии термодинамический потенциал Ф{р, Т, М) должен иметь минимум. При наличии внешнего магнитного поля намагничен- намагниченность тела будет функцией приложенного поля, вид которой определяется при данных свойствах тела выполнением условий равновесия, так чтобы Ф (р, Т, М(Щ)->min. B0,1) Численное значение намагниченности в ферромагнитных телах весьма велико. Если формально определить магнитную воспри- восприимчивость как B0,2) то оказывается, что ее значения достигают величин порядка 10г>—106. Как мы уже подчеркивали, явление ферромагнетизма может иметь место только в твердых телах. При этом оказы- оказывается, что в монокристаллах намагничение обладает важным свойством асимметрии. Намагничение в различных направле- направлениях в кристалле имеет разное значение. В так называемых на- направлениях легкого намагничения намагниченность имеет боль- большее значение, в других — меньшее, при данном значении на- напряженности намагничивающего поля. Ферромагнитные свойства вещества существенно зависят ог температуры. При повышении температуры спонтанная намаг- намагниченность уменьшается и при некоторой характерной для дан- данного вещества температуре обращается в нуль. Эта темпера- температура называется температурой точки Кюри 6. В точке Кюри вещество теряет свои ферромагнитные свойства. При темпера- температурах, лежащих выше соответствующей температуры 0, все фер- ферромагнетики становятся парамагнетиками. Парамагнитная вос- восприимчивость при Т > 6 зависит от температуры по закону: 1 именуемому законом Кюри — Вейсса.
§ 20] ФЕРРОМАГНЕТИЗМ 755 Наконец, важнейшим свойством ферромагнитных тел яв- является следующее: обычно ферромагнитное тело, даже однород- однородное в макроскопическом отношении, оказывается разбитым на области спонтанного намагничения, или домены. Размеры доме- доменов весьма велики по сравнению с молекулярными, и в состав каждого домена входит очень большое число частиц. В преде- пределах каждого домена существует отличная от нуля намагничен- намагниченность. Это означает, что магнитные моменты всех атомов в пре- пределах домена спонтанно ориентируются преимущественно в одну сторону, образуя макроскопическую область спонтанного на- намагничения. Если тело не подвергалось воздействию поля, то намагни- намагниченность отдельных доменов во всем теле в среднем компенси- компенсируется и вектор М для тела как целого равен нулю. Действие внешнего поля сводится к переориентации («пере- («переворачиванию») векторов намагниченности отдельных доменов так, чтобы образовалась отличная от нуля намагниченность всего тела. При снятии поля моменты частиц доменов сохра- сохраняют преимущественную ориентацию, «запоминают» действие поля и* требуется дополнительная работа поля для образования системы доменов с беспорядочной ориентацией магнитных мо- моментов. Необходимо подчеркнуть, что существование доменов не яв- является гипотезой, но представляет хорошо и весьма детально изученное экспериментальное язлеиие. Все перечисленные свойства ферромагнитных тел хорошо укладываются в рамки излагаемой ниже термодинамической теории ферромагнетизма. Однако основной вопрос — вопрос о сущности явления спонтанного намагничения, разумеется, не может найти какого-либо объяснения в рамках макроскопиче- макроскопической теории. Изложение микроскопической квантовой теории явленич спонтанного намагничения будет дано в ч. VI книги. Переходя к разбору термодинамической теории '), мы дол- должны, прежде всего, написать явное выражение для термодина- термодинамического потенциала системы — ферромагнитного монокр'истал- ла, находящегося в состоянии статистического равновесия во внешнем магнитном поле Н. Мы будем рассматривать поведение ферромагнетика вблизи точки Кюри, когда намагничение сравнительно мало. Пусть Ф0(р, Т, М) —термодинамический потенциал тела в отсутствие внешнего поля. Основное равенство для термодина- ') В дальнейшем в этом параграфе мы следуем книге Л. Д. Ландму и Е. М. Лифшииа, «Электродинамика сплошных среду>, Гостехиздат, 1937. Наш Ф + -g— ) в этой книге. 48*
756 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл. III мического потенциала в поле гласит: с1Ф = йФй-НйМ. B0,3) Отличие последнего соотношения от аналогичного выражения A8,2) заключается в том, что независимой переменной является средний магнитный момент ферромагнетика М. Поэтому, инте- интегрируя B0,3) по М при заданном внешнем поле, можно напи- написать Ф(р, Т, М) = Ф0(р, Г, М)-МН. B0,4) Термодинамический потенциал Фо зависит как от величины, так и от ориентации вектора М относительно осей монокристалла. Эффект анизотропии сравнительно мал. Поэтому Ф0(р,Т,М) можно представить в виде Ф0(р, Т, М) = Ф1{р, Т, М) + Ф2(р, Т, М), B0,5) где второй член учитывает эффект анизотропии. Первое, основ- основное слагаемое зависит только от абсолютной величины вектора намагничения. Мы ограничимся простейшим случаем, когда кристалл имеет только одну ось симметрии, являющуюся осью легкого намаг- намагничения. Выберем эту ось за ось г. При намагничении вдоль оси z, т. е. MZ = M, термодинамический потенциал Фо должен иметь минимальное значение. В этом случае зависимость Фг от М может быть представлена в виде Ф2(р, Т, 7W) = const(^ + M^)==pM2sin29. B0.6) При этом в малой величине Ф-г мы выписали только первые чле- члены разложения по степеням М. Здесь р — положительная по- постоянная, а 6 —угол между осью z и вектором М. Член, про- пропорциональный М2, не зависящий от углов, может быть всегда включен в Ф[. Линейный член в этом разложении должен вы- выпасть/ Действительно, магнитный момент, пропорциональный скорости частиц, изменяет знак при замене /->—/. Термодина- Термодинамический потенциал системы в состоянии равновесия,очевидно, инвариантен относительно этой замены. Поэтому разложение 2 2 должно содержать комбинацию квадратичных членов Мх, Му и M.i- При этом она должна быть выбрана так, чтобы при на- намагничении вдоль оси z имел место минимум Ф2. Поскольку ось г является осью симметрии, компоненты Мх и Му должны вхо- входить в разложение симметрично. Выражение B0,6) удовлетво- удовлетворяет всем этим требованиям. Поскольку C>0, ось z действи- действительно является осью легкого намагничения, Потенциал Ф2
§20] ФЕРРОМАГНЕТИЗМ 757 имеет минимальное значение (Фг = 0), если вектор М направлен по оси г (9 = 0). Полный термодинамический потенциал во внешнем поле имеет вид Ф (р, Т, М)=ФУ (р, Т, М) -МИ + Щ2 sin2 G. B0,7> Последняя формула показывает, что намагничение М будет ориентироваться внешним полем, с одной стороны, и естествен- естественным направлением легкого намагничения, с другой стороны. В итоге вектор М будет ориентирован под некоторым углом Ornin к оси z, при котором термодинамический потенциал будет иметь минимум. Если выбрать за плоскость xz плоскость, вклю- включающую Н и ось легкого намагничения, то вектор М будет,, очевидно, лежать в этой плоскости. Распишем B0,7) в компонентах Ф = Ф0- МНХ sin 0 - MHZ cos 9 + рМ2 sin2 0. Равновесную ориентацию, определяемую условием минимума Ф> найдем из условия ^~ = 2p,W2 sin е cos 0 - МНХ cos 9 + MHZ sin 6 = 0, откуда без труда получаем sin В - IIxf (l - sin2 0) = Н\ sin2 0. B0,8)' Это — уравнение четвертой степени относительно величины sin 0. Оно имеет либо два, либо четыре вещественных корня,, в зависимости от значения Нх и Hz (при заданном М и E). В первом случае одно значение корня отвечает углу 0Ш|,ь при котором Ф имеет минимальное значение. Это — равновесна» ориентация М. Второе значение корня приводит к максималь- максимальному значению Ф, т. е. термодинамически неустойчивой ориен- ориентации намагничения. Во втором случае имеется два минимальных и два макси- максимальных значения угла 9. Один из этих минимумов 9min приводит к наименьшему значению термодинамического потенциала. Соответствующая ориентация вектора М является равновесной. Второй минимум отвечает метастабилыюму состоянию кристалла. При этой ориен- ориентации термодинамический потенциал меньше, чем при любых соседних, но выше, чем при ориентации под углом 0mm. Существование метастабильных состояний позволяет понять- качественно происхождение остаточного намагничения и гисте- гистерезиса. Равновесное состояние отвечает суммарному намагничению кристалла, равному нулю в отсутствие внешнего поля. На против,.
758 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл ИГ в метастабильном состоянии магнитный момент тела как целого отличен от нуля в отсутствие поля. Если в процессе намагничения кристалл будет переведен в метастабильное со- состояние с некоторой суммарной намагниченностью M(H)dV, а затем внешнее поле будет снято, то система будет весьма длительное время (практически — как угодно долго) находиться в состоянии с суммарным намагничением М(Н—>0)dV. Из формулы B0,8) следует также принципиальная возможность су- существования доменов. Предположим, чго внешнее поле ориен- ориентировано перпендикулярно оси легкого намагничения, т. е. Н2 = 0. Тогда B0,8) превращается в уравнение 2рМ sin 0 - II = 0. B0,9) Если Ж2рМ, то B0,9) имеет два решения: тт тт 0| = arcsin -kztt . 9, = я — arcsin- 2[Ш '  " Ч- '" 2|Ш • Этим решениям отвечает одно и то же минимальное значение термодинамического потенциала, так что оба они являются раннове^чыми. Однако значения намагничения М будут при этом соотне .'зенно МТ = М sin 0i, M? = М sin 62 = - М sin 9,. B0,10) Таким образом, в равновесном состоянии возможны две проти- противоположные ориентации вектора намагничения. Пели весь кристалл разобьется на чередующиеся области ¦•_• намагничением Мх] и М^, то его термодинамический потен- потенциал будет минимальным и состояние равновесным. А1ы видим, что из формальной термодинамической теории вытекает возможность существования остаточного намагниче- намагничения (и гистерезиса) и доменной структуры кристалла. Фактическая реализация, величина и форма доменов зави- зависят от многих факторов. За деталями мы отсылаем читателя к упомянутой книге Л. Д. Ландау и Е. М. Лифшица и специальной литературе. Само собой ясно, что термодинамическая теория не дает и не может дать ответа на основной вопрос — вопрос о природе спонтанного намагничения. Существование энергии анизотро- анизотропии также постулируется в теории. Рассмотрим теперь зависимость магнитных свойств ферро- ферромагнетика от температуры вблизи точки Кюри. В самой точке Кюри ферромагнитное и парамагнитное состояния вещества соприкасаются друг с другом по некоторой поверхности раздела л находятся в состоянии статистического равновесия. Это равно-
§20] ФЕРРОМАГНЕТИЗМ 75$ весне является равновесием фаз, а каждое из состояний пред- представляет фазу, соответственно, ферро- и парамагнитную. Термодинамический потенциал ферромагнитной фазы дается формулой B0,4). Вблизи точки Кюри можно пренебречь малым слагаемым Фг и разложить 0t в ряд по степеням малой вели- величины— намагничения М, которое обращается в нуль в точке Г=0. Тогда имеем Фферро (р, Т, М) = Фо {р. Т) + аМ2 + ЬМ4 - МН B0,11) с точностью до членов четвертого порядка малости. Нечетные степени величины М выпадают из разложения: при замене (/—>—/) М изменяет знак, а знак Ф не изменяется. Если пренебречь магнитной анизотропией ферромагнетика, на- направления векторов М и Н совпадают, поэтому в B0,11) можно вместо МН написать МН. В точке Кюри Г=9 коэффициент а обращается в нуль; вблизи ючки Кюри можно написать а - (Т - 6), причем а>0 выше точки Кюри и а<0 ниже точки Кюри. При- Примем, что Ь>0. Как будет видно из дальнейшего, при таком вы- выборе знаков а и b термодинамическая теория хорошо описывает фазовый переход ферро—парамагнетик. Условие равновесия гласит: ~- = 2аМ + 46М3 - Н = 0. B0,12> Если магнитного поля нет, то либо в равновесии М = 0, B0,13) либо 2а + 46.М2 = 0. B0,14) Выше точки Кюри а>0 и условием минимума термодинамиче- термодинамического потенциала служит равенство B0,14). Ниже точки Кюри равенство B0,14) может выполняться (поскольку здесь а<0) и T- B0,15) В самой точке Кюри М обращается в нуль и термодинамиче- термодинамические потенциалы ферромагнитного и парамагнитного состояний равны между собой. Энтропия при фазовом переходе, как легко видеть, не изменяется. Действительно, выше точки Кюри B0,16>
760 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл. III Ниже точки Кюри ,., да (дФ0\ ..,2 - м Ж = - [1Г)Р - const м2 = - const (в - Г) = Sliapa - const F - Т). B0,17) Отсюда видно, что в точке Кюри 7"=0 энтропия остается не- непрерывной. Однако теплоемкость системы испытывает скачок. .Действительно, (Ср)ферро = Т {^F-)p = const T + (Ср)пара. B0,18) Скачок теплоемкости при Т = 9 ACp = const-9, B0,19) причем теплоемкость ферромагнитной фазы выше, чем парамаг- парамагнитной (при значении 7"=0), что находится в полном согласии с опытом. Рассмотренный фазовый переход является типичным примером фазового перехода второго рода (ср. § 64 ч. III). При НфО из условия равновесия B0,12) можно найти маг- магнитную восприимчивость. Дифференцируя B0,12) по Н, на- находим •откуда дМ _ Х~~ дН ~ 2а + При Г>0 парамагнитная восприимчивость равна, в соответ- соответствии с законом Кюри — Вейсса: 1 1 В заключение остановимся кратко на расчете электромаг- электромагнитных полей в присутствии ферромагнетиков. Расчет такич полей особенно важен в технике, где широко используются фер- ферромагнитные материалы. На первый взгляд может показаться, что нелинейная связь между В и Н делает проблему весьма сложной. В действитель- действительное ги, однако, это не так. Расчет распределения поля вне фер- ферромагнетика, но в его присутствии требует задания граничного условия на его поверхности. Использование точных граничных условий связало бы внешнюю задачу с распределением поля внутри ферромагнетика, т. е. сделало бы проблему весьма сложной. Однако, если формально ввести ферромагнетик с маг- литиой восприимчивостью B0,2) и с магнитной проницае-
21] СВЕРХПРОВОДИМОСТЬ 76г мостыо \i=\+An%, то для |д. получаются значения на пять- шесть порядков выше, чем в наружной среде. Поэтому можно- с большой степенью точности положить [i->oo и граничное- усчовие на поверхности ферромагнетика приобретает простой, вид: т. е. линии магнитного поля подходят нормально к поверхности. Ферромагнетик в постоянном магнитном поле оказывается по- подобным проводнику в постоянном электростатическом поле. Расчет магнитного поля внутри ферромагнитных тел оказы- оказывается, как правило, весьма трудной задачей. § 21. Сверхпроводимость Еще в 1911 г. Камерлинг-Ониес установил, что температур- )]ый ход сопротивления ртути существенно отличается от опи- описанного в § 48 для нормальных металлов. Именно, как и у нормальных металлов, при понижении тем- температуры, сопротивление перестает зависеть от температуры, и величина его определяется приме- ^ сями, имеющимися в образце. *"« Однако при дальнейшем пони- 402 женин температуры до 7 = 4,1° К сопротивление металла скачком (рис. 92) падает до нуля: это явле- явление — скачкообразное исчезновение 00/ сопротивления — получило назва- название перехода металла в сверхпро- сверхпроводящее состояние, или, кратко, возникновения сверхпроводимости. q Температуру перехода в сверхпро- сверхпроводящее состояние называют кри- критической температурой. В настоящее время установлено, что сверхпроводимость яв- является сравнительно широко распространенным явлением. Из- Известно 23 металла, переходящих в сверхпроводящее состояние. Сверхпроводимость наблюдается также у большого числа сплавов. Несомненно, что обращение сопротивления в нуль отвечает переходу металла в новое состояние. Сопротивление всех ме- металлов в сверхпроводящем состоянии составляет не больше чем 10~10 процента сопротивления непосредственно перед переходом. В кольце из сверхпроводящего материала происходит циркуля- циркуляция тока в течение неопределенно долгого времени без каких- либо признаков ослабления. Ю Рис. 92. го т;н
762 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл. ИГ Поэтому следует признать, что сопротивление сверхпровод- сверхпроводников не просто очень мало, но точно равно нулю. Электроны в сверхпроводнике могут двигаться совершенно беспрепят- беспрепятственно. Первоначально предполагалось, что металл в сверхпроводя- сверхпроводящем состоянии является идеальным проводником, т. е. телом ¦с бесконечно большой проводимостью. В идеальном сверхпроводнике (т. е. в теле с сг-»-оо) конеч- конечному значению плотности тока / по закону Ома отвечает на- напряженность поля внутри проводника, равная нулю: Е = 0. B1,1) Отсутствию внутри сверхпроводника электрического поля отве- отвечают определенные магнитные свойства. Именно, из уравнения Максвелла и равенства нулю поля Е вытекает, что в сверхпрозодпике маг- магнитная индукция имеет постоянное значение 5 = const. B1,2) Значение этой постоянной равно величине индукции в сверхпро- сверхпроводнике в момент перехода в сверхпроводящее состояние. Оказалось, однако, что этот вывод находится в противоре- противоречии с опытом. Если поместить металлический цилиндр в маг- магнитное поле, перпендикулярное оси цилиндра, и охладить его до температуры ниже критической, то можно судить о характере поля внутри \д сверхпроводника по его распределе- распределению вблизи сверхпроводящего образ- образца. Оказалось, что линии магнитной индукции выталкиваются из сверхпро- сверхпроводника (рис. 93). Индукция внутри сверхпроводника равна нулю: Рис. 93. В = 0. B1,3) В силу граничного условия E,5) нормальная слагающая внешнего магнитного поля (Не)п (равная индукции {Не)п = = (Ве)п) также равна нулю у поверхности сверхпроводника. Иными словами, внешнее магнитное поле является касательным к телу, находящемуся в сверхпроводящем состоянии. Уравнение A,16) показывает, что если в теле отсутствует магнитная индукция, то в отсутствие переменного электриче- электрического поля равен нулю полный средний ток в объеме тела р* = 0. B1,4)
§ 2Ц СВЕРХПРОВОДИМОСТЬ 76$ Таким образом, внутри сверхпроводника полная плотность тока равна нулю. Это означает, что в поверхностном слое сверх- сверхпроводника циркулирует поверхностный ток такой величины, что магнитная индукция в теле обращается в нуль. Иными сло- словами, среднее поле поверхностных токов компенсирует прило- приложенное к сверхпроводнику внешнее магнитное поле. Из условия В = 0 следует, что внутри сверхпроводника имеют место равенства rot? = 0, div (e?) = О, так чго электрическое поле внутри сверхпроводника равно нулкх Поверхностный ток в сверхпроводнике не связан с действием электрического поля. Для определения плотности поверхност- i:cro тока можно воспользоваться граничным условием E,3). Именно, поскольку магнитное поле в сверхпроводнике отсут- отсутствует, то E,3) дает непосредственно (при //(е) = ()) где j8w — вектор индукции вне сверхпроводника. Если тело яв- является односвязиым, то сумма поверхностных токов равна нулю. Напротив, в случае многосвязного тела, например сверхпроводя- сверхпроводящего кольца, полный ток может быть отличным от нуля. При этом появление тока в сверхпроводнике может быть не связано- с действием сторонних э. д. с, но может создаваться действием магнитного поля. Возбужденный а сверхпроводнике поверхност- поверхностный ток может циркулировать неопределенно долго без какого- либо ослабления. Опыт показал, что если напряженность магнитного поля в пространстве, окружающем сверхпроводник, превышает некото- некоторое критическое значение Я,ф, сверхпроводимость в образце исчезает. Разрушение сверхпроводящего состояния и появление- сопротивления происходит скачком. Критическое значение напряженности магнитного поля ока- оказывается функцией температуры, которая приближенно дается эмпирической формулой //кР = const (Гкр-Т). При Т = Тир, #itp = O, т. е. всякое поле при T = TKV разрушает сверхпроводимость. Рассмотрение сверхпроводника как металла, находящегося в особом сверхпроводящем состоянии, позволяет сделать некото- некоторые заключении о характере перехода в это состояние. Именно, сверхпроводящее состояние следует рассматривать как особую
764 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл. ИГ фазу вещества, а переход металла из нормального в сверхпро- сверхпроводящее состояние — как фазовый переход. Рассмотрим фазовый переход нормальное состояние-> сверх- сверхпроводящее состояние, происходящий во внешнем магнитном поле. В сверхпроводящем состоянии средний полный ток pv равен нулю и выделить из него часть, отвечающую магнитному моменту (как это было сделано в § 3), не представляется воз- возможным. Тем не менее введем формально напряженность маг- магнитного поля Н{ и магнитный момент сверхпроводника М соот- соотношением Bi = 0 = Ht + 4лМ. Поле Ht можно легко связать с внешним магнитным полем Н,., если рассмотреть длинный цилиндрический сверхпроводник, ось которого ориентирована вдоль поля. Тогда в силу непрерыв- непрерывности тангенциальной слагающей поля (в данном случае совпа- совпадающей с полным полем) Заметим, что равенству B1,5) отвечает значение %=—-т— . тсЗХ Таким образом, сверхпроводящему состоянию отвечает фор- формально магнитная проницаемость (л=1+4л-/ = 0 и оно является идеально диамагнитным. Согласно A8,2), термодинамический потенциал тела в сверх- сверхпроводящем состоянии может быть представлен в виде н ФАР, Т, Я) = ФДР. T)-V JM(H)dH, B1,6) о где Фэ(р, Т)—потенциал тела в сверхпроводящем состоянии в отсутствие внешнего магнитного поля. Подставляя в B1,6) значение М(Н) по формуле B1,5), по- получаем ФАР, Т, Н) = ФЛР, T) + -^Hl B1,7) Когда внешнее поле достигает критического значения Якр, на- наступает разрушение сверхпроводящего состояния. При этом тер- термодинамический потенциал сверхпроводящего состояния на- настолько увеличивается за счет второго слагаемого в B1,7), что термодинамический потенциал сверхпроводящего состояния ока- оказывается равным термодинамическому потенциалу нормального
§ 21] СВЕРХПРОВОДИМОСТЬ 765 состояния Фп{р, Т). В точке перехода выполняется соотношение Фз(Р,Т) + -?В- = Фп{р,Т). B1,8) В выражении для термодинамического потенциала Фп мы опустим добавочный член, связанный с магнитным полем, по- поскольку у обычных дна- или парамагнитных металлов он весьма мал. Дифференцируя равенство B1,8) по температуре и поль- пользуясь определением энтропии B9,10) ч. III, находим г ¦' Ofl дТ г дТ 4я clT ' \*i>J/ где Sn и S*-—энтропии нормального и сверхпроводящего состоя- состояний при температуре Т. Мы видим, что если #,.-р=?0, т. е. переход происходит при Г>Г|ф, энтропия системы меняется скачком. Фазовый переход •сопровождается выделением скрытого тепла Опыт показывает, что при переходе из нормального в сверх- сверхпроводящее состояние тепло всегда выделяется. Если фазовый переход в сверхпроводящее состояние проис- происходит без поля (т. е. //1ф = 0), то и скрытое тепло перехода отсутствует. Скачок теплоемкости легко найдем, если продифференци- продифференцируем B0,9) по температуре. Тогда имеем В отсутствие внешнего поля находим простое выражение для скачка теплоемкости при переходе из нормального в сверхпро- сверхпроводящее состояние: Таким образом, рассматриваемый фазовый переход представ- представляет фазовый переход второго рода. Выведенные макроскопи- макроскопические (термодинамические) соотношения и ряд других, кото- которых мы ire могли коснуться'), находятся в хорошем согласии ') См. Л. Л. Ландау и Е. М. Л и ф ш и ц. Электродинамика сплошных сред, Физматгиз, 1959.
766 ПОСТОЯННЫЙ ЭЛЕКТРИЧЕСКИЙ ТОК [Гл III с опытными фактами. Однако, хотя термодинамическая теория сверхпроводимости успешно описывает ряд свойств сверхпро- сверхпроводников, но оставляет открытым основной вопрос — вопрос о физической природе сверхпроводимости. До самого последнего времени все попытки создания микро- микроскопической теории сверхпроводимости, в которой сверхпрово- сверхпроводимость была бы связана со свойствами электронного газа в металле, оставались безуспешными. Лишь в 1958 г. они увен- увенчались полным успехом. Современная теория сверхпроводимости будет изложена в ч. VI. В построении теории сверхпроводимости важную роль сыграли опытные данные, показавшие, что существует свя !ь между явлением сверхпроводимости и характером взаимодей- взаимодействия электронов сверхпроводника с его кристаллической ре- решеткой. Речь идет об открытом в 1950 г. Максвеллом, Рейноль- сом и др. так называемом изотопическом эффекте. Именно, было обнаружено, что критическая температура Г,,р зависит от того, из каких изотопов данного элемента построена решетка, т. е. в конечном итоге от массы ионов решетки. Связь между массой ионов решетки М и критической температурой перехода дается эмпирической формулой MVTKp = const, B1,13) где const имеет определенное значение для каждого элемента. В заключение следует указать на аналогию, существующую между сверхпроводящим состоянием металла и сверхтекучим состоянием жидкого гелия II. Сверхпроводимость можно срав- сравнить со сверхтекучестью электронного газа или жидкости, могу- могущей беспрепятственно двигаться в кристаллической решетке ме- металла (см. ч. VI),
ГЛАВА IV КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ § 22. Условия квазистационарности Мы перейдем теперь к изучению электромагнитных полей переменных во времени. Оказывается, что при этом существует широкий интервал частот изменения полей, в котором уравнения Максвелла допускают существенное упрощение. В §,19 ч. I мы рассмотрели случай медленного движения за- зарядов, когда можно было полностью пренебречь запаздыванием в системе и считать электромагнитное поле распространяю- распространяющимся с бесконечно большой скоростью. В основании результатов § 26 ч. I условие пренебрежения запаздыванием сводится к требованию Г>т=4-, B2,1) где 71 — период движения в системе, а т — время запаздывания, L — геометрическая протяженность той области, в которой рас- рассматриваются электромагнитные возмущения. В макроскопической электродинамике существует ряд важ- важнейших проблем, при рассмотрении которых можно считать условие B2,1) выполненным. В приближении B2,1) в пределах рассматриваемой системы можно считать скорость распростра- распространения электромагнитных возмущений бесконечно большой. Зна- Значения полей в данной точке будут при этом находиться в одной фазе с их значениями в любой другой точке внутри системы. Ясно, что возможность пренебрегать запаздыванием в системе существенно упрощает изучение соответствующих электромаг- электромагнитных полей. Электромагнитные поля, в которых можно пренебрегать яз- лением запаздывания, мы называли в ч. I квазистационарными. При изучении электромагнитных явлений в веществе квазиста- квазистационарные поля, помимо требования B2,1), которое мы бу- будем называть первым условием квазистационарности, должны
768 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. IV удовлетворять еще двум ограничениям, к выводу которых мы и перейдем. Условие B2,1) накладывает, очевидно, некоторое ограниче- ограничение на период изменения электромагнитного поля Г (или часто- частоту <о = уЧ. Именно, периоды Т должны быть достаточно ве- велики (а частоты — низки) при данном размере системы. При сравнительно малых частотах изменения электромаг- электромагнитного поля в проводниках всегда выполняется условие Действительно, его можно переписать в виде Р>. дЕ с, аЕ ^> е -^— «* еа>?, или Т>~. B2,3) При выполнении неравенства B2,2), которое следует назы- называть вторым условием квазистационарности, в области простран- пространства, занятой проводниками, можно пренебречь током смещения по сравнению с током проводимости. Третьим условием квазистационарности является требование, чтобы величины, характеризующие свойства вещества — а, е и ц, имели такое же значение, что и в постоянных полях. Мы уви- увидим в части VI, что первое требование сводится к тому, что период Т должен быть существенно больше, чем время свобод- свободного пробега электронов в металле: Г» 4' B2,4) где X — средняя линия свободного пробега и v — средняя ско- скорость электронов в металле. При меньших значениях Т за время свободного пробега электрона поле успеет изменить свое значе- значение, что отразится, очевидно, на величине пробега, и, в конечном счете, на значении а. Зависимость е от частоты внешнего поля будет рассмотрена нами ниже. Числовые оценки показывают, что условия квазистационар- квазистационарности для обычных макроскопических систем, содержащих в качестве проводников металлы, выполняются вплоть до частот, лежащих в инфракрасной части спектра. Совокупность условий, определяющих квазистационарные поля, оказывается выполнен- выполненной в широкой области явлений, объединяемых названием «пе- «переменные токи». Переменные токи или токи низкой частоты
5 23] ЗАКОН ИНДУКЦИИ В ДВИЖУЩИХСЯ ПРОВОДНИКАХ 769 находят широчайшее применение в технике и лабораторной практике. Это определяет практическую важность теории квази- квазистационарных процессов. Уравнения квазистационарного электромагнитного поля имеют вид = ~У> \ B2,5) div В = 0, j rot?= зг-, I с dt \ B2,6) В уравнении для ротора магнитного поля на основании B2,2) нами опущено слагаемое, выражающее ток смещения. При этом выполнены условия связи: В = \аН; ?> = е?; J = о (Е + ?стор). B2,7) Уравнение непрерывности в случае квазистационарных по- полей можно представить в виде divy + 4f = divy+|r^- = div(y+^r4r)-div«/ = ()- <22'8> Таким образом, отличие уравнений квазистационарного поля от поля стационарных токов сводится лишь к учету явлений электромагнитной индукции. Ниже будет показано, что воз- возможность пренебрежения запаздыванием в системе позволяет получить уравнения электромагнитного поля для случая системы линейных проводников в виде уравнений в полных, а не в част- частных, производных и притом с постоянными коэффициентами. Для этой цели необходимо перейти к уравнениям Максвелла в интегральной форме. § 23. Закон индукции в движущихся проводниках и средах Прежде всего необходимо найти поток индукции, входящий в уравнения Максвелла, записанные в интегральной форме. При этом мы должны обобщить понятие потока индукции на случай движущихся контуров с током. Пусть некоторый контур с током движется в магнитном поле. Скорость движения будем считать постоянной в пространстве и малой по сравнению со скоростью света с. Найдем изменение потока индукции через контур с проводником. Имеем, очевидно, 4T = lIijBdS- 49 В. Г. Левич, том I
770 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ По определению J - J B(t)dS [Гл. IV B3,1) где В (t + At) — вектор индукции, взятый в момент времени t+At и 52 — поверхность, в которую переходит поверхность Si в момент t+At. При этом векторы нормали к обеим поверхно- поверхностям считаются ориентированными в одну сторону. Применим теорему Гаусса — Остроградского к замкнутой поверхности, состоящей из (рис. 94) поверхностей S2 и S\ и бо- боковой поверхности 2, образовавшейся при смещении контура из положения 5i в по- положение S2. Поскольку diviJ = 0, т. е. В — вектор, не имеющий источников, мож- можно написать J B3,2) Здесь знак минус связан с нашим выбором ориентации вектора нормали. Для боковой поверхности S можно, очевидно, напи- написать (см. рис. 94) d-Ъ = [dlv] At, где v — скорость движения контура с током и dl — элемент его длины. Поэтому B3,3) [ В dl = J В [dlv] At = А/1 [vB] dl, где интеграл берется по кривой, ограничивающей поверхность S] (т. е. по контуру с током). Далее, с точностью до беск»- нечно малых второго порядка можно написать B3,4) s, s, Из B3,3), B3,4) и B3,2) находим s, f B(t)dS ~ dS-At§[vB\dl.
§ 23] ЗАКОН ИНДУКЦИИ В ДВИЖУЩИХСЯ ПРОВОДНИКАХ 771 Подставляя это выражение в B3,1) и переходя к пределу, на- находим B3,5) •Si Формула B3,5) показывает, что изменение потока индукции через контур тока во времени может происходить либо вслед- вследствие изменения вектора индукции, либо при движении контура с током в заданном поле под углом к линиям поля не равным нулю (так что вектор скорости не параллелен В). Иными сло- словами, если контур с током при своем движении пересекает ли- линии вектора индукции В, то возникает изменение потока индук- индукции Ф во времени. Переходя во втором интеграле к интегрированию по поверх- поверхности, можем написать ** = Г { Щ. - rot [vB]) dS. B3,6) Напишем теперь закон индукции Фарадея для движущегося контура с током в виде B3,7) где Е — напряженность поля в линейном проводнике. Ясно, что в правой части B3,7) должно стоять полное изменение потока индукции, независимо от причины, вызывающей это изменение. Непрерывность тангенциальной слагающей Е позволяет пе- перейти от линейного проводника к соседнему с ним контуру, ле- лежащему в среде вне проводника. При этом можно уже говорить не о движении контура с током, а о движении среды. Скорость v означает при этом скорость движения данной точки среды. От B3,7) можно перейти к дифференциальному уравнению Максвелла в движущейся среде. Именно, написав с помощью B3,5) Edl= J rotEdS= -LJMdS + -~ frot[vB]dS, имеем rot E = - у (-^- - rot [vB]j. B3,8) Преобразуем выражение в скобках, написав на основании A,45) dt •Ц- - rot [vB] = ~ - {В grad) v + (v grad) В - v div В + В div v - в силу B2,5) и постоянства V. 49*
772 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. [V Тогда находим окончательно значение rotZ? в движущейся среде: rot? = —i-g-. B3,9) Важность полученных результатов, и в частности закона ин- индукции Фарадея в форме B3,7), связана с тем, что движение проводников в магнитном поле является на практике одним из основных методов возбуждения э. д. с. (ггапример, в динамо- машинах). § 24. Уравнения Максвелла для квазистационарных полей в интегральной форме и их интегрирование для случая линейных проводников Мы можем теперь рассмотреть систему уравнений Максвелла для квазистационарных полей в интегральной форме, рассма- рассматривая общий случай движущихся сред: -7-Т-. B4.0 B4,2) B4,3) dV. B4,4) Уравнение непрерывности запишется согласно B2,8) в виде B4,5) Рассмотрим случай линейных проводников с током. Для простоты мы ограничимся сперва одним проводником. Мы бу- будем считать заданными сторонние э. д. с. в контуре; при этом величина э. д. с. может зависеть от времени. Напишем обобщен- обобщенный закон Ома в интегральной форме в виде B4,6) Поскольку мы рассматриваем линейный контур и справедливо уравнение непрерывности, мы можем представить его с по- помощью B4,1), A5,4) и A5,6) в виде 1* Уравнение B4,7), связывающее ток в контуре с заданной сторонней э. д. с. ef (t), называют обычно законом Ома для цепи переменного тока.
§ 24] УРАВНЕНИЯ МАКСВЕЛЛА ДЛЯ КВАЗИСТАЦИОНАРНЫХ ПОЛЕЙ 773 Если перейти теперь к системе, состоящей из произвольного числа N контуров с переменным током, то для каждого из них можно написать где Ф{ — поток индукции через t-й контур с проводником. Магнитное поле определится из уравнений B4,2) и B4,3), не отличающихся от уравнений для постоянного тока. Поэтому для всех магнитных величин остаются в силе соотношения, по- полученные для постоянного тока. Однако уравнения для распре- распределения магнитного поля и тока в цепи оказываются связан- связанными между собой: поток маг- магнитной индукции через г'-й контур с током определяется распреде- распределением магнитного поля; распре- распределение магнитного поля опреде- определяется токами во всех контурах. Легко показать, однако, что в рис. 95. квазиотационарных полях потоки индукции оказываются связанными с плотностями токов линей- линейными соотношениями с постоянными коэффициентами типа N Ф/ = с 2 Llklk (L№ = Lu). B4,9) Для доказательства рассмотрим простейший случай двух линейных контуров в среде с постоянной магнитной проницае- проницаемостью (г. Ток во втором контуре (рис. 95) создает в первом контуре поток индукции Ф,B) = 1* J HdS^j rotA2dS,« ^ДлЛ,, B4,10) где индекс 1 относится к первому контуру. Вектор-потенциал магнитного поля линейного проводника с током /г дается формулой A7,4). Поэтому ^- = С/„2/2, B4,11) т. е. поток индукции в первом контуре, создаваемый током зо втором контуре, пропорционален току 1% в последнем. Коэффи- Коэффициент пропорциональности Li2 оказывается постоянной, завися- зависящей только от свойств среды и взаимного расположения кон- контуров:
774 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл IV где Г\2 — расстояние между элементами длины dU и dl2. Вели- Величина L\% носит название коэффициента взаимоиндукции. Наряду с потоком магнитной индукции 0iB) через первый контур с током проходит поток индукции, создаваемый током в самом контуре: Oi(D = cLn/1. B4,13) Коэффициент пропорциональности Lu носит название коэффи- коэффициента самоиндукции. В принципе происхождение коэффициента самоиндукции таково: поток магнитной индукции через некото- некоторый участок провода получается суммированием потоков созда- создаваемых другими его участками. При этом во всех участках провода течет ток Л. Ясно, однако, что для вычисления коэффициента самоиндук- самоиндукции нельзя пользоваться формулой B4,12). При приближении участка dl2 к участку dl\ в том же проводнике Гц-* О, и интеграл B4,12) расходится. Причина этой расходимости заключается в том, что если участок dl2 близок к dlu поперечные размеры про- проводника становятся сравнимыми с расстоянием гХ2 между этими участками. Это, в свою очередь, делает недопустимым исполь- использование формулы A9,4), найденной в приближении линейных проводников. Иными словами, при рассмотрении взаимоотно- взаимоотношения между близкими участками одного проводника заведомо неверно приближение линейного проводника. В следующих па- раграфах мы увидим, как можно найти коэффициент самоин- самоиндукции, не прибегая к представлению о линейном характере проводника. Пока же мы можем написать полный поток маг- магнитной индукции через первый проводник в виде Ф, - cLuli + cLl2I2, B4,14) аналогично поток магнитной индукции через второй проводник Ф2 = cL22f2 + cL2\I\. Легко показать, что имеет место равенство L2\ = L]2. Действи- Действительно, Уравнение B4,7) обобщенного закона Ома в первом контуре приобретает вид ^^ t). B4,16) Аналогичное выражение может быть написано для второго контура.
§ 24] УРАВНЕНИЯ МАКСВЕЛЛА ДЛЯ КВАЗИСТАЦИОНАРНЫХ ПОЛЕЙ 775 В общем случае произвольного числа контуров поток маг- магнитной индукции через проводник i выражается по формуле B4,9) через токи во всех контурах, коэффициент самоиндук- самоиндукции Lti и коэффициенты взаимной индукции Llh. Подставляя B4,9) в закон Ома для цепи переменного тока, находим сово- совокупность уравнений, определяющих ток U в каждом из N кон- контуров: 2^ ) ('=1. 2...N). B4,17) Если заданы сторонние э. д. с. &% и геометрические свойства ¦системы линейных контуров, определяющих совокупность коэф- коэффициентов Llh, интегрирование системы линейных дифферен- дифференциальных уравнений B4,17) с постоянными коэффициентами позволяет определить токи 1г в контурах. Магнитные поля будут при этом определяться по формулам B4,2) и B4,3). Таким образом, в соответствии со сказанным в конце § 22, уравнения квазистационарного электромагнитного поля в слу- случае системы линейных проводников сводятся к уравнениям в полных производных с постоянными коэффициентами. Послед- Последние, однако, как это известно из общей теории дифференциаль- дифференциальных уравнений, сводятся к системе алгебраических уравнений. Плотности объемных зарядов, возникающих в некоторых случаях в проводниках, вычисляются обычно с помощью фор- формулы B4,4) по заданному распределению электрического поля. В качестве примера применений формул B4,11) и B4,12) вычислим коэффициент взаимной индукции двух прямых парал- параллельных линейных проводников длины /. Для определенности будем считать токи в проводниках направленными в одну сто- сторону. Обозначим расстояние между проводниками через h. Тогда по формуле B4,12) имеем — iL Г dljdlj _ ц. Г Г dxi - с' J rt2 ~ с' J J /(,,- i dx2 Вычисление второго интеграла несколько громоздко. Интегри- Интегрируя по частям, получаем
776 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. IV Упростим найденное выражение для двух предельных слу- случаев: когда провода находятся на расстоянии, удовлетворяю- удовлетворяющем неравенствам h <с I и h\$>_l. В первом случае без труда находим с точностью до величин порядка 1—1 2/ , . В обратном предельном случае с точностью до величин по- порядка -р- Для сравнения разных методов вычисления L12 найдем коэф- коэффициент взаимоиндукции двух кольцевых соленоидов, навитых на общий сердечник. Диаметр кольца D (длину соленоида) будем считать боль- большим по сравнению с диаметром витков. Магнитное поле внутри кольцевого соленоида можно считать однородными и написать 4я , где П\ — число витков в первом соленоиде и 1\ — ток в нем. Отсюда B4,18) Поток индукции через п2 витков второго соленоида (в предпо- предположении, что утечки нет и все линии индукции магнитного поля, создаваемого первым соленоидом, пронизывают второй) будет равен 2] = где S — сечение соленоида. Из B4,11) находим § 25. Энергия магнитного поля системы квазистационарных токов Найдем энергию магнитного поля системы токов в прибли- приближении квазистационарных полей. Как мы видели в § 7, полная энергия (точнее — свободная энергия) магнитного поля равна т Г вн л\т
§ 25) ЭНЕРГИЯ МАГНИТНОГО ПОЛЯ КВЛЗИСТАЦИОНЛРНЫХ ТОКОВ 777 Интегрирование ведется по всему пространству. При этом пред- предполагалось, что в объеме V нет ферромагнетиков. Выражая В через вектор-потенциал и пользуясь первым из уравнений B2,5), имеем fi// = //rot4 = ,4rot// + div [АН] -=~ AJ+div [АН]. Поэтому ±\ m^ B5,1) Последний интеграл при интегрировании по всему пространству обращается в нуль, и мы находим окончательно B5,2) В формуле B5,2) А представляет вектор-потенциал, создавае- создаваемый в некоторой точке всеми токами, / — плотность тока в той же точке. Интегрирование по всему пространству можно теперь заме- заменить на интегрирование по объемам, занятым проводниками с током. Вне этих объемом /' = 0 и интеграл B5,2) исчезает. По- Поэтому где dv — элемент объема проводника. Пусть во всей системе имеется N проводников. Разобьем интеграл B5,3) на две части, написав г-«=h 2 J А^ dv<+7 S J AkJ'tdv- <25-4> i k>i В интеграле, входящем в первую сумму, At означает вектор- потенциал магнитного поля, создаваемого в элементе объема dvi данного проводника токами, имеющимися в других элементах того же самого проводника. В интеграле во второй сумме Ah представляет вектор-потен- вектор-потенциал поля, создаваемого в элементе объема dv{ токами во всех остальных проводниках. Следовательно, первая сумма предста- представляет сумму собственных энергий всех N проводников. Вторая сумма дает взаимную энергию этих проводников. Фактическое вычисление энергии Гмагп сталкивается с боль- большими трудностями в случае проводников, находящихся в на- намагничивающейся среде. Поскольку магнитная проницаемость проводников, вообще говоря, отлична от проницаемости среды, для вычисления энергии токов по формуле B5,4) необходимо
778 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл [V знать распределение вектора-потенциала в неоднородной среде. Нахождение последнего представляет большие трудности. Мы ограничимся поэтому случаем, когда \i « \ю « 1 как в веществе проводников, так и в окружающей их среде. Иными словами,, проводники вместе с окружающей их средой будем считать квазиоднородной системой. При этом вектор-потенциал в лю- любой точке пространства дается формулой A7,4) - Подставляя A7,4) в B5,4), находим fiJidvidv't , к- v Г Г J*J'dVidVk (ок kv + L\ J B55> к- v Г Г k i k> i где /"'— плотность тока в элементе объема dv[, создающего поле в объеме dv{, г — расстояние между dvt и dv\. Подобно тому, как энергия электростатического поля в слу- случае системы проводников сводится к совокупности энергий по- последних, энергия магнитного поля, даваемая формулой B5,5), может рассматриваться как энергия квазистационарных токов. Определим коэффициенты самоиндукции L,,- и коэффициенты взаимной индукции L^ так, чтобы имело место равенство ц V[[ JifidVjdv'i t ц Y» Г Г JkJidvtdvk __ 1 магн 2с2 IU J J r 1" с2 Za) J г ~~ i k Первая сумма представляет совокупность собственных энергии токов во всех проводниках, вторая —совокупность взаимных энергий. Формула B5,6) справедлива в равной мере для линейных и нелинейных проводников. В случае линейных проводников определение коэффициен- коэффициентов взаимной индукции совпадает с B4,12). Действительно, в этом случае где определение Llh совпадает с B4,12). Новое определение коэффициентов самоиндукции имеет су- существенное значение для нелинейных проводников. Оно сво- свободно от трудностей, связанных с неограниченным возрастанием интеграла при г—*0 (см. § 24). Элементы объема dvdv' убы- убывают при г-* О быстрее, чем —, и интеграл стремится к нулю.
§ 25] ЭНЕРГИЯ МАГНИТНОГО ПОЛЯ КВАЗИСТАЦИОНАРНЫХ ТОКОВ 779 По этой причине, как мы увидим ниже на конкретном примере, формула B5,6) служит для определения коэффициентов само- самоиндукции. Энергия Гмагп совокупности линейных проводников может быть представлена в другом виде. Именно, в случае линейных токов первое слагаемое в B5,4) можно переписать в виде где Ф{ = J Bt dS{ — поток магнитной индукции через t'-й про- проводник. Найдем коэффициент самоиндукции для некоторых простей- простейших систем. В качестве первого примера рассмотрим коэффи- коэффициент са-моиндукции кругового соленоида. Поле внутри соле- н#ида дается формулой B4,18). Энергия поля равна цЯ2К 8л ЦП2 L = PS ¦ 2nD гясЧР ~c2D ' LI* 2 откуда Рассмотрим теперь коэффициент самоиндукции двух кон- концентрических цилиндров, по которым текут одинаковые и про- противоположно направленные токи силой /. Пусть радиусы ци- цилиндров будут Ri и /?2, их высота I, толщина стенок — прене- пренебрежимо мала. Очевидно, что магнитное поле внутри малого цилиндра и вне большого цилиндра равно нулю. Поле в зазоре между цилиндрами имеет напряженность Энергия поля равна J 8n av ~ e* J гг с* ш ^ ' Отсюда 2ЬЯ *-¦?
780 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. IV § 26. Коэффициенты самоиндукции и взаимной индукции для нелинейных проводников. При вычислении коэффициентов самоиндукции и взаимной индукции в нелинейных проводниках мы ограничимся случаем, когда магнитная проницаемость вещества проводников и среды близка к единице (т. е. когда в системе нет ферромагнетиков). При этом можно приближенно считать, что ц имеет одинаковое значение ц0 во всем пространстве. Иными словами, мы будем считать всю систему однородной по ее магнитным свойствам. Для краткости записи мы будем полагать, что система со- состоит из двух нелинейных проводников. Геометрическую форму и распределение плотностей токов внутри проводников мы бу- будем считать неизменными во времени, проводники — неподвиж- неподвижными и недеформируемыми. Разобьем оба нелинейных проводника на совокупность тру- трубок тока. Возможность такого разбиения вытекает из соленои- далыюго характера токов в квазистационарных полях. Для каждой трубки dSa можно написать соотношение B4,6), т. е. ГрШа. B6,1) Для квазистационарных токов справедливы соотношения A6,5) — A6,7), полученные для любого соленоидального тока. Умножая обе части равенства B6,1) на ~- — величину, по- постоянную вдоль проводника, и интегрируя по всему сечению проводника, имеем Преобразуем входящие в B6,2) интегралы для некоторого, например первого, проводника следующим образом: Г dl<» j- dl, С с К' i dl, Г с s s dSp . dlx 4 •Si где /?i — полное омическое сопротивление первого проводника. При этом мы воспользовались A6,7) и A6,8). Для линейного
5 26] КОЭФФИЦИЕНТЫ САМОИНДУКЦИИ И ВЗАИМНОЙ ИНДУКЦИИ 781 проводника if = 1 и выражение для R совпадает с A5,4). Далее, имеем на основании B3,7) и B4,10) __^?ld/l=__j ___ 1 d Г Г , Aidla ""Т-л J ^^ 7 s, s dSa 1 d I здесь А\ — вектор-потенциал магнитного поля в той точке, в ко- которой берется элемент объема dv. Будем рассматривать теперь один из проводников, для опре- определенности— первый. Поскольку по предположению проводники и среда однородны в магнитном отношении, мы можем восполь- воспользоваться для А{ выражением A7,3), которое для наших целей удобно записать в виде M/;^ + M^. B6,5) с J ' г с J г '12 Первое слагаемое дает вектор-потенциал, создаваемый то- токами в объеме первого проводника, второе — токами в объеме второго проводника, г'и означает расстояние между точками, к которым отнесены соответственно элемент dv\ и элемент dl[, гi2 имеет аналогичный смысл. Подставляя значение А, в B6,4), имеем J L /, J с2 at /, Введем теперь коэффициенты самоиндукции и взаимной ин- индукции, определив их по формулам: Ah dv[ dVi _ 1 Но Г f Г\2 B6,9)
782 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. IV Нетрудно заметить, что Lu и Ll2 не зависят от сил токов 1\ и /г. Действительно, с помощью A6,8) имеем L"=iTj J !l * » B6>10) c~o ~ • ЦО.Н/ Тогда окончательно ¦^-jiEidti^ - Ln-^--Llt~ B6,12) и аналогично для второго проводника. Наконец, в интеграле I —j2- (b ?CTop rf/ можно допустить, что сторонняя э. д. с. одинакова по всему сечению проводника, и написать |^^Гор^. = ^ь B6,13) Подставляя B6,3), B6,12) и B6,13) в B6,2), находим окон- окончательно §^ B6,14* и аналогично ^2#2 = ~ ^22 ~[f- — L2\ -jf+?V B6,15) Уравнения B6,14) — B6,15) совпадают с уравнениями B4,17) для линейных токов. Различие между ними заключается в том, что для нелинейных проводников нахождение сопротивлений и коэффициентов магнитной индукции является весьма сложной задачей. Во все эти величины входят распределения токов по сечению проводников. Поэтому практическая важность полу- полученных уравнений невелика. Зато нами получено определение коэффициентов индукции B6,7) — B6,9), не основанное (в от- отличие от B4,12) и B4,13)) на предположении о линейности проводников. В заключение подчеркнем, что, как это легко видеть, коэф- коэффициент взаимной индукции, определенный формулой B6,8) для линейного проводника (\fi = ^2 = 1). совпадает с B4,12).
$ 27) УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ КВАЗИСТАЦИОНАРНЫХ ТОКОВ 783 § 27. Уравнения Лагранжа для системы квазистационарных токов До сих пор мы считали, что взаимное расположение про- проводников с током является заданным. На практике часто при- приходится рассматривать более общий случай подвижных про- проводников или проводников, изменяющих свою форму, взаимное расположение и т. п., находящихся в электромагнитном поле. Емкости, само- и взаимоиндукции и другие величины, которые мы ранее считали постоянными, при этом оказываются функ- функциями некоторых параметров qit характеризующих конфигура- конфигурацию системы. При рассмотрении таких систем весьма удобным является метод Лагранжа, в котором, как будет ясно из даль- дальнейшего, электромагнитные и механические величины, характе- характеризующие систему, фигурируют как формально равноправные. Оказывается, что упомянутые параметры qlt а также величины зарядов Q, в проводниках можно выбрать за некоторые обоб- обобщенные координаты. Составам уравнения Лагранжа, характеризующие систему о обобщенных координатах qx и О,. Обобщенными скоростями, отвечающими зарядам Qu являются величины Q, = /i, т. е. токи, текущие в проводниках. Если включить энергию магнит- магнитного поля в кинетическую энергию системы, то полная кинети- кинетическая энергия равна Т = Тиех + Гмагн = у 2 Lik (qt, t) I, (t) 1k (t) + TMCX = i, k LtkQiQk + T^, B7,1) i, k где ГМех — кинетическая энергия механического движения про- проводников. Аналогично потенциальную энергию системы будем считать слагающейся из энергии электрического поля (т. е. энергии ем- емкостей, имеющихся в системе) и механической потенциально!11! энергии: Тогда функция Лагранжа будет иметь вид '- " Т S L'kQ&* - Т S ly + (Гме* ~ U Jex)- B7'3) Введем также диссипативную функцию B7,4)
784 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. IV и произвольные «внешние» силы, действующие на систему, не допускающие, вообще говоря, потенциала — сторонние э. д. с. &i. Напомним, что внешние силы /¦'внешн в уравнениях Лагранжа представляют силы, зависящие не только от обобщенных коор- координат, но также и от других, не имеющих отношения к данной системе, параметров. Эти силы определяются обычным соот- соотношением ЬА = FBlleum6q, где 6А—виртуальная работа на пере- перемещении 6q. Тогда уравнения Лагранжа для обобщенных координат Q( приобретают вид d J*LJL EL + F D7 Ч\ IF dQi dQl dQi + После подстановки L в B7,5) и в предположении о неподвиж- неподвижности и недеформируемости контуров с током (постоянство ин- дуктивностей и емкостей) получаем *A + 2><. B7,6) что совпадает с B4,17) и свидетельствует о правильном выборе выражений для кинетической и потенциальной энергии. Из уравнения Лагранжа B7,6) следуют законы сохранения импульса и энергии. Для системы, на которую не действуют внешние силы (т. е. /7виешн=0) и в которой не происходит дис- диссипация энергии (т. е. F = 0), уравнение B7,6) приобретает вид d dL dL q dt dQi dQt ~ Если в t'-м контуре с током нет емкости, то соответствую- соответствующая координата является циклической и для нее имеет место равенство "¦-0. dQt При этом соответствующий обобщенный импульс сохраняется; dL dL Y1 . . , Lidb = const. dQt Напишем теперь закон,сохранения энергии для системы не- неподвижных проводников. По общим правилам, энергия системы ^Q,-L = 72,L,Q,Qfe + T?^- B7,7) При наличии диссинативных процессов ^^ \ ^ ' виешнчс! •
§ 27] УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ КВАЗИСТАЦИОНАРНЫХ ТОКОВ 785 Здесь 2F —диссипируемая энергия, a ^FmemaQi — работа внеш- внешних сил в единицу времени. Подставляя значение Е и F, записываем закон сохранения энергии в виде ¦ж {т 2 L^Q* + j Переписав его в форме ¦§¦ (Гмаг„ + иал) = 5] (SV/ - Я,/!), B7,9) мы видим, что в замкнутой системе, не подверженной действию внешних сил {&i = 0) ив которой нет диссипативных сил (Ri = 0), энергия системы сохраняется: ГМ1ГН + С/эл = 0. B7,10) В случае, когда tf,¦ ?= 0, Я{ф0, формула B7,9) показывает, что разность между работой, производимой в единицу времени сто- сторонними э. д. с. и выделяемым джоулевым теплом, идет на уве- увеличение энергии магнитного и электрического полей, а также на увеличение механической энергии системы в случае подвиж- подвижной системы контуров. В частном случае одного неподвижного контура с током B7,9) перепишется в виде dt \ 2 ' 2C Применим полученные результаты к одиночному контуру с переменным током, в который включена некоторая емкость (конденсатор), к так называемой /^LC-цепочке. Уравнение B7,6) приобретает вид B7,11) Если источник переменного тока — сторонняя э. д. с. представ- представляет гармоническую функцию времени то частное решение B7,11) имеет вид Нас будет интересовать зависимость тока от времени, которую также можно представить в виде 50 В. Г. Лсвич, том I
786 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл IV Подставляя это в B7,11), получаем, что / -In- -Into— z*> где величина Z*, именуемая комплексным сопротивлением или импедансом, равна (^) B7,12) Переходя от комплексного к вещественному выражению для тока, находим ж <?0 COS (COf - ф) B7,13) Мы видим, что в контуре возникают вынужденные колебания тока с частотой ю, сдвинутые по фазе на угол (р относительно сторонней э. д. с. Наряду с вынужденными колебаниями в контуре могут су- существовать свободные или собственные колебания. Если сто- сторонняя э. д. с. cf = О, то из B7,11) легко находим где частота собственных колебаний n j При —< , имеют место затухающие колебания, при- 2L R чем затухание характеризуется временем т = -^-. При -^7" ^ > ¦ разряд имеет апериодический характер. Если система У CL содержит несколько контуров, связанных между собой соответ- соответствующими коэффициентами взаимной индукции, то уравнения B7,6) могут быть решены по общим правилам решения систем линейных уравнений с постоянными коэффициентами. За де- детальным разбором подобного рода задач, представляющих осо- особый интерес для электротехники, мы отсылаем читателя к спе- специальной литературе1). Найденные соотношения справедливы как для системы кон- контуров, связанных между собой индуктивно (т. е. при наличии ') См., например, В. С м а й т, Электростатика и электродинамика, ИЛ, 1954.
$ 28] ОБОБЩЕННЫЕ ПОНДЕРОМОТОРНЫЕ СИЛЫ 787 отличных от нуля коэффициентов Lih), так и для системы разветвленных контуров. В последнем случае закон Кирхгофа позволяет уменьшить число независимых токов /4 или коор- координат Qi. В заключение заметим, что результаты этого параграфа до известной степени оправдывают термин «сторонняя» э. д. с, по- поскольку эта величина действительно играет роль обобщенной силы, действующей на систему. § 28. Обобщенные пондеромоторные силы в системе с подвижными контурами В предыдущем параграфе мы ограничились случаем непод- неподвижных контуров. Рассмотрим теперь подвижные контуры с током. Найдем, прежде всего, выражение для обобщенной силы, отвечающей механической обобщенной координате qit характе- характеризующей пространственную конфигурацию t-го контура с то- током. По определению F dL Обычно можно считать, что емкости, имеющиеся в системе, не изменяются при движении проводников. Тогда, подставляя L из B7,3), находим Мы видим, что энергия магнитного поля играет двоякую роль: по отношению к координатам электромагнитного харак- характера Q, она является кинетической энергией; по отношению к пространственным координатам Qi она представляет взятую с обратным знаком потенциальную энергию. Пондеромоторные силы действуют в таком направлении, которое отвечает увели- увеличению магнитной энергии поля. Применим формулу B8,1) к не- некоторым конкретным случаям. Рассмотрим, прежде всего, механические силы, действующие на уединенный контур с током. Пусть q — обобщенная коорди- координата, характеризующая размеры контура. Сила, действующая на контур со стороны его собственного магнитного поля, Сила, действующая на проводник с током, возрастает с увели- увеличением ¦ ~" . Поскольку самоиндукция растет с увеличением размеров проводника, это означает, что собственное магнитное НО*
788 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл IV поле стремится деформировать проводник так, чтобы его раз- размеры увеличились. В случае системы проводников рассмотрим сначала один подвижный контур, положение которого характеризуется коор- координатой qa. Конфигурацию и токи во всех остальных контурах, имеющихся в системе, будем считать заданными. Тогда сила, действующая на подвижный контур, равна t, k dLnk 1 у дЦа , * _ . у dlak . _ /„ дФа Неизменность положений всех, кроме а-го, контуров в про- пространстве отвечает заданному значению внешнего поля. При этом выводе мы воспользовались равенством B4,9)—опреде- B4,9)—определением потока индукции. Если, в частности, обобщенная координата qa представляет угол 0, характеризующий положение плоского контура с током во внешнем поле, то обобщенная сила Fe является механиче~ ским моментом, действующим на контур: м Поток индукции через недеформируемый плоский контур, на- находящийся во внешнем поле Во» равен Ф = B0S cos О, где 5 — площадь контура и 6 — угол между Во и нормалью к плоскости. Поэтому М = --^ Воsine. B8,3) Заметим, что обобщенная сила B8,2) в случае одного ли- линейного проводника с током во внешнем магнитном поле сво- сводится к силе Лоренца. Действительно, поскольку бф = В [6<? 6/] = [&1В] 6<7, где 6д — пространственное перемещение недеформируемого кон- контура, dF = \l [dlB] = | [dlB]jdS = | [JB] dV, B8,4) где dV = dSdt — элемент объема проводника с током. Сила B8,4) является усредненной лоренцевой силой, в которой вме- вместо поля в пустоте Н стоит среднее магнитное поле в среде В.
§28] ОБОБЩЕННЫЕ ПОПДЕРОМОТОРНЫЕ СИЛЫ 789' Рассмотрим теперь систему из двух проводников с током и найдем силу взаимодействия между ними. В этом случае в ка- качестве обобщенной координаты q следует выбрать расстояние ri2 между элементами обоих проводников dl\ и dt2. Из определения коэффициента взаимной индукции B4,12) и B8,2) имеем 2 4iv^ — 2 TY 3 " B8Д С 0Г: , •> J rJ2 с J J /"]2 Пусть, в частности, оба тока текут в одном направлении в па- параллельных линейных проводниках. Тогда dl\\\dl2 и сила F от- отвечает притяжению между проводниками. Напротив, в случае токов, текущих в противоположном на- направлении, между проводниками возникает отталкивание. Мы видим, что два «одноименных» тока стремятся сбли- сблизиться и усилить общее магнитное поле. В этом их отличие от одноименных статических зарядов, которые стремятся разой- разойтись, ослабив электростатическое поле. Рассмотрим еще вопрос о работе, которая совершается си- силой, смещающей контур с током. Согласно B8,2) эта работа равна 6\J7 = Fq 6<7с = — 6Фа. B8,6) На первый взгляд мы приходим к парадоксальному результату: работа 6W выполнена силой, действующей на заряды со сто- стороны магнитного поля. Последняя, однако, перпендикулярна скорости зарядов и не может производить над ними работы. В действительности, однако, написав формулу для работы, мы не учли явлений индукции, имеющих место в проводнике, дви- движущемся в магнитном поле. При смещении проводника в нем индукцируется э. д. с. ?ИНД и производится работа 6W над за- зарядами: 6W = 6t J /?и"д dV = /„б/1 Е""л dl=-lf 6Фа. B8,7) Полная работа, совершаемая магнитным полем над контуром с током, 6W + bW = 0, B8,8> как этого и следовало ожидать. Этот результат имеет вполне общий характер и может быть перенесен и на нелинейные проводники. В заключение рассмотрим пример, наглядно иллюстрирую- иллюстрирующий достоинства метода Лагранжа,
790 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл IV Пусть имеются два контура: первый с заданным током Л, вращающийся внутри другого под действием заданной силы F, второй — неподвижный. В последнем индуцируется ток, посту- поступающий в цепь с большой нагрузкой. Емкостей в обоих конту- контурах нет. Ясно, что такое устройство представляет динамомашину переменного тока. Первый контур именуется ротором, второй — статором. Функция Лагранжа системы имеет вид где а — угол поворота и /о— момент инерции ротора. Коэффи- Коэффициент взаимной индукции зависит от ориентации ротора и ста- статора, т. е. от угла а. Уравнение движения для обобщенной координаты—угла а — имеет вид /оа-/,/2-^- = Мо, B8,9) где Мо = ~д^~ момент вращающей силы. Уравнение движения для обобщенной координаты — заря- заряда Q2 — уравнение тока в статоре, согласно B7,5) имеет вид dL _ или откуда ^ ^ ^^O. B8,10) Состояние системы должно быть найдено из совместного реше- решения уравнений B8,9) и B8,10). Считая сопротивление R2 весьма большим (большая на- нагрузка в цепи статора), с точностью до членов порядка -ъ—, можно приближенно написать j /j_ dLu /j_ dL\i da ,no щ ^ Ri dt R% da dt ' ' При этом мы пренебрегли в B8,10) малыми слагаемыми, не со- содержащими #2- Подставляя B8,11) в B8,9), получаем dZ.12\2 da
% 29] ФЛУКТУАЦИИ В ПРОВОДНИКАХ И ФОРМУЛА НАИКВИСТА 79! В квазистационарном состоянии можно пренебречь, как ма- d2a лым, членом с угловым ускорением -js~t поскольку последнее мало. Тогда для угловой скорости вращения находим da M0R1 I _const B812> dt Выражения B8,11) и B8,12) дают решение поставленной за- задачи На практике обычно применяются более сложные схемы,. например машины с самовозбуждением, в которых индуциро- индуцированный ток /г вводится в первый контур, и т. п Мы оставили также без рассмотрения важные особенности реальных машин, связанные с существованием в них намагни- намагничивающихся сердечников. Разобранный пример иллюстрирует лишь достоинства метода Лагранжа в случае систем, в которых механическое движение и текущие токи непосредственно свя- связаны между собой. § 29. Флуктуации в проводниках и формула Найквиста В результате флуктуационных процессов в электрической цепи возникают флуктуации тока, которые в технике именуют шумами Физически появление флуктуационных токов в про- проводнике (в отсутствие сторонней э. д. с.) связано с флуктуа- циями числа электронов, движущихся в одном направлении. В присутствии сторонней э. д. с. флуктуационные токи наклады- накладываются на стационарный или квазистационарный ток. Флуктуации тока в радиоаппаратуре имеют огромное значе- значение в современной радиотехнике Шумовой фон определяет предельную чувствительность сигнала при однократном приеме. Дальнейшее повышение точности может быть достигнуто лишь применением многократных измерений, Мы рассмотрим теорию флуктуации в электрической цепи с индуктивностью L и омическим сопротивлением R. Флуктуа- Флуктуационные процессы можно характеризовать случайной флуктуа- ционной э. д. с. &{t). Изменения э. д. с. &{i) происходят за время, которое весьма мало по сравнению со временем релак- релаксации контура Т = L/R. Естественно пытаться описать процессы, происходящие а цепи с помощью обобщенного закона Ома: L-%F+Ri = ?(t). B9,1) В основу уравнения B9,1) положено довольно естественное допущение: между случайным током в цепи и создающей его
792 КВЛЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. [V случайной э. д. с. существует такая же связь, как между обыч- обычным током и обычной э. д. с. Релаксация тока характеризуется постоянным сопротивлением R. Следует подчеркнуть, что фак- фактически при высоких частотах R (или a=l/R) оказывается функцией частоты. Это обстоятельство не отражается, однако, на общих результатах теории. Случайная э.д. с. &(t) имеет, очевидно, следующие свой- свойства: B9,2) Проинтегрируем формально линейное уравнение B9,1) по вре- времени. Тогда для случайного тока -J- _JL / L i(i) = ioe т+е т \ eT<?{t')dt. B9,3) о Следует заметить, что интегрирование уравнения B9,1) со слу- случайной функцией в правой части нуждается в известном оправ- оправдании с чисто математической точки зрения. За деталями этого вопроса мы отсылаем читателя к специальной литературе1). С помощью формулы B9,3) можно составить коррелятив- коррелятивную функцию =(\ioe т+е г Jerg Г \ \ схр I Ц^-\ • (^(f)У {t"))dtrdt". B9,4) о t i + x X о о Члены, содержащие случайную функцию &{1) в первой сте- степени, обращаются в нуль при усреднении. Двойной интеграл в B9,4) можно вычислить следующим образом: вводя новые переменные K = t' + t"y y = tr-t", ') См., например, Чандрасекар, Стохастические проблемы в физике и астрономии, Гостехиздат, 1948; Д. Мак-Доналд, Введение в физику шумов и флуктуации, «Мир», 1964.
$ 29] ФЛУКТУАЦИИ В ПРОВОДНИКАХ И ФОРМУЛА НАЙКВИСТА 79$ имеем 2/ t 1 ( Ot -L. т 1 Г — 1D- \ J \. I ТА о -t Коррелятивная функция \= \ ^ )& \ %У )) * согласно B9,4), не может зависеть от выбора переменной х. Полагая х = уг имеем Поскольку коррелятивная функция быстро убывает с ростом у, можно распространить пределы интегрирования до бесконеч- бесконечности, так что й оо ^ j (Я@)Z(у)) dy = Окончательно находим т U 2L\ 7-е т[{_е т). . B9,5) Полагая / = 0, из B9,5) получаем коррелятивную функцию для тока (i@)i(x)) = ih~^. B9,6) Пользуясь законом равнораспределения, можно написать среднее значение флуктуационного тока энергии в цепи: Lil kT в так что окончательно автокоррелятивная функция для тока при- приобретает вид И ~ ~^г B9,7)
794 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ ГГл. IV С другой стороны, полагая т = 0, находим (/ @2> = ile~^+Y A - е~Ц J (? @) Я (у)) dy. — 00 При значениях t ~S> T в системе должно установиться статисти- ческое равновесие. Опуская, как малые, величины е~ т, на- находим откуда находим, подставляя Г = -^: 00 L* j<?{O)?Q/))dy- B9,8) Формула B9,8) связывает между собой автокоррелятивную функцию случайной э. д. с. с сопротивлением линии. Это соот- соотношение имеет глубокий смысл: оно связывает характеристику обратимых случайных процессов — коррелятивную функцию (Ш@)&(у)) с характеристикой необратимого диссипативного процесса — сопротивлением R или временем релаксации Т B9,9) Если воспользоваться формулой Винера—Хинчина E,16) ч. Ill, то можно выразить коррелятивную функцию через спектраль- спектральную плотность: и, следовательно, Я = Ц-?(О). B9,11) Эта формула является частным случаем важной флуктуационно- диссипативной теоремы, устанавливающей связь между харак- характеристиками флуктуационных и диссипативных процессов (см. ч. VI). В формуле B9,1) мы ограничились случаем, когда сопро- сопротивление можно считать не зависящим от частоты. Вопрос о связи флуктуационыых и необратимых процессов будет по-
$ 29] ФЛУКТУАЦИИ В ПРОВОДНИКАХ И ФОРМУЛА НАИКВИСТА 795 дробно разобран в гл. VII ч. VI, посвященной физической ки- кинетике. Вернемся к автокоррелятивной функции для тока и, вос- воспользовавшись теоремой Винера — Хинчина, найдем с ее по- помощью спектральную плотность случайных токов в цепи. Именно, согласно E,15) ч. III и B9,11), можем написать оо gi М = ± J <« @) / (т)> е-1™ А, B9,12) — со где спектральная плотность тока gi(u>) определена формулой оо ? ={#,•(«>) Л»- B9,13) о Подставляя в B9,12) выражение для (i(O)i(i)) из B9,7), на- находим В металлах обычно Т =~г ~ 10~13 сек и можно написать в хорошем приближении &М-15Г- <29'15> Таким образом, значение среднеквадратичное тока в замкнутой цепи, генерируемого случайной э. д. с. в интервале частот а>, м + dco, можно написать в виде pda^ — da. B9,16) ПК В случае незамкнутой цепи вместо B9,16) можно написать для самопроизвольных флуктуации э.д. с. соотношение %*й<а = Щ-<1<а. B9,17) Формулы B9,17) и B9,16) называют формулами Найквиста. Они позволяют при расчете квазистационарных линий учиты- учитывать флуктуационные явления (например, флуктуационную э.д.с.) наряду с другими макроскопическими характеристиками. Согласно B9,16) флуктуационный ток пропорционален |/0 и обратно пропорционален \lYR. Последнее имеет простой смысл. Сопротивление ^=1/о~1/п, где п — число электронов в 1 смг. В соответствии с общей формулой C,7) ч. III среднее зна- значение Y? ~ Vn •
796 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. IV Приведенный выше вывод содержал существенное ограни- ограничение: сопротивление считалось не зависящим от частоты. В ча- части VI мы вернемся к обсуждению формулы Найквиста в об- области высоких частот. Будут учтены, в частности, квантовые , , . kT e эффекты, проявляющиеся при частотах «>-т- = —. В полупроводниковых устройствах имеются дополнительные специфические механизмы возникновения шумов, которые так- также будут обсуждены в ч. VI. § 30. Скин-эффект Мы изучали до сих пор квазистационарный ток в линейных цепях, считая проводники бесконечно тонкими. Теперь мы рас- рассмотрим распределение переменного тока по сечению провод- проводника. Предполагая по-прежнему выполненными условия квази- квазистационарности, запишем уравнения Максвелла в однородной проводящей среде: rot Ь — —— -дт-, с ot , ш, 4.1A г, rot Н — Е, div// = 0, div? = 0. Легко получить раздельные уравнения для электрического и магнитного полей. Взяв повторно ротор от rotE, находим rot rot ?=graddiv ?¦-??•= - АЕ =JLiLrot#, или Такое же уравнение получается и для магнитного поля. Уравнение C0,1) и аналогичное уравнение для вектора И определяют зависимость полей от времени и координат в про- пространстве, занятом проводником. На границе этого пространства, т. е. на поверхности проводника, векторы поля удовлетворяют обычным граничным условиям. Мы ограничимся решением уравнений поля в простейшем случае переменного тока, текущего в проводнике, заполняющем полупространство z > 0. Направление тока вдоль оси х и его зависимость от времени считаются заданными:
S зо] скин-эффект 797 Заметим, что jx не может зависеть от координаты х в силу урав- уравнения непрерывности, которое дает В соответствии с законом Ома ищем электрическое поле, удовлетворяющее уравнению C0,1), в виде Ех = Е{г)е^\ Еу = Ег = 0. C0,2) Подстановка C0,2) в C0,1) дает ^ C0,3) Общим решением последнего уравнения служит Е {z) = Ае~кг + Векг, где t, _-. / ¦ 4яцоп) _ 1 +/ _ f 4яцаа) Введем обозначение Тогда 5 = Ае ь е * + Be Величина В должна быть, очевидно, положена равной нулю, чтобы поле имело всюду конечное значение. Таким образом, окончательно Ех = Ае~^е~1<^~^. C0,5) Формула C0,5) показывает, что напряженность электрического поля убывает экспоненциально в глубь проводника. Эффективное уменьшение напряженности поля (уменьшение в «е» раз) происходит на расстоянии б от поверхности. Зная распределение электрического поля в проводнике, можно найти распределение магнитного поля. Имеем, очевидно: Отсюда Ае~' ^~^е~^. C0,6)
798 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. IV Магнитное поле оказывается перпендикулярным электрическому. Оно убывает в глубь проводника по тому же закону, что и элек- электрическое; по абсолютной величине \ Ну\^ —т-1 Ех |, т. е. больше электрического в f-r-j раз. Таким образом, электромагнитное поле и соответственно весь ток в проводнике оказываются локализованными в тонком по- поверхностном слое толщиной порядка б. Локализация поля в тонком поверхностном слое проводника называется скин-эффек- скин-эффектом (от англ. skin — кожа), а величина б — толщиной скин- слоя или глубиной проникновения. ;2 Нетрудно видеть, что все джоулево тепло -1— выделяется в области скин-слоя. Из определения б ясно, что ее числовое значение может изменяться в широких пределах для различных частот w и про- водимостей о. Чтобы представить порядок величин, укажем, что для меди б ~ 1 см при частоте 50 гц и б « 3-10~3 см для частот ~105 гц. При W-+0, т. е. при переходе к постоянному току, б—»оо и скин-эффект исчезает. Ток равномерно распределяется по сече- сечению проводника. Напротив, при формальном переходе к пре- пределу о—юо толщина скин-слоя стремится к нулю. Это — идеаль- идеальный проводник, в который переменное поле не проникает в та- такой же мере, как и постоянное. Результат, полученный нами для случая упрощенной модели проводника, имеет совершенно общий характер. При любой геометрической конфигурации проводников поле в них ока- оказывается локализованным в скин-слое. Если распределение обусловлено геометрическими свойст- свойствами проводника, то задача о нахождении поля в проводнике лишь незначительно усложняется по сравнению с разобранным примером. Так, в случае тока, текущего по длинному кабелю кругового сечения, сплошному или полому, вектор плотности тока направлен параллельно образующей кабеля. Поэтому об- общий ход решения задачи о нахождении распределения поля в кабеле совпадает с разобранным нами примером. Для глу- глубины проникновения получается то же числовое значение. Гео- метрическое распределение поля сравнительно мало отличается от экспоненциального спадания, особенно при больших часто- частотах, когда радиус кабеля велик по сравнению с глубиной про- проникновения. В общем случае массивного проводника произволь- произвольной формы нахождение распределения переменного поля пред- представляет задачу, сложную в математическом отношении1). >) См. В. С м а й т, Электростатика и электродинамика, ИЛ, 1954, гл. XI.
•§ 31] ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ОДНОРОДНОЙ СРЕДЕ 799 Однако независимо от формы проводника и даже механизма возбуждения в нем поля (с помощью сторонней э. д. с, внеш- внешним переменным магнитным полем и т. п.) общий вывод остается в силе: переменное электромагнитное поле проникает в проводник на глубину скин-слоя б. При этом магнитное поле больше электрического в отношении -т-. Аналогичные результаты можно получить при рассмотрения другой проблемы. Пусть на металл действует — переменное электромагнитное поле, зависящее от времени по закону еш. Если магнитное поле у поверхности проводника z = О имеет значение Нй граничное условие E,4) позволяет сформулировать краевую задачу d*H(z,t) _ 4прц дН {г, t) dz* сг dt Н = Нй при z = О Н-+0 при z-»oo. Решение краевой задачи может быть написано аналогично <30,5) Н{г, t) = Hae««e~^, где толщина скин-слоя 6 дается формулой C0,4). Следует подчеркнуть, что скин-эффект становится все более резко выраженным при переходе к высоким частотам. Мы уви- увидим в следующей главе, что в полях высокой частоты, когда поля нельзя более считать квазистационарными, по-прежнему имеет место скин-эффект, хотя глубина проникновения оказы- оказывается, вообще говоря, иной (см. § 33). Скин-эффект играет большую роль в технике переменных токов. Он позволяет при- применять полые кабели или кабели, покрытые слоем металла с особенно высокой проводимостью, что снижает расход мате- материалов и мощностей. § 31. Электромагнитные волны в однородной изотропной среде Рассмотрим распространение электромагнитного поля в про- пространственно однородной и изотропной среде, характеризуемой материальными постоянными е0, цо и а в среде без простран- пространственной дисперсии. Индекс нуль означает, что материальные постоянные имеют статическое значение и отнесены к частоте <о = 0. Ниже мы обсудим условия применимости этого допу- допущения.
800 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл IV Среду мы будем считать неферромагнитной (цо=1), Мы видели выше, что у металлов глубина проникновения поля весьма мала даже при сравнительно невысоких частотах. По- Поэтому не имеет смысла рассматривать распространение элек- электромагнитного поля внутри металла. Однако такое рассмотре- рассмотрение уместно в средах с меньшими, чем у металлов, значениями проводимости: в полупроводниках или растворах электролитов. В предельном случае а—*0 мы перейдем к случаю идеальных диэлектриков. Уравнения Максвелла имеют вид е° дЕ си п C1,2) C1,3) C1,4) Взяв ротор от первого уравнения и учитывая последнее, полу- получим rot rot//= - AH = ^j-roiE + ^~roiE, или, пользуясь C1,2), rot// rot E div? div// 4я<т с __ 1 с = 0, = 0. ? + - дН dt ' с2 dt* с* dt • Поступая аналогично с C1,2), легко прийти к уравнению Будем пытаться искать решения уравнения C1,5), C1,6) в виде плоских монохроматических волн, распространяющихся вдоль оси абсцисс. Положим, что решения C1,5), C1,6) имеют вид Н(х,О=*Но(х)е'°», C1,7) E(x,t) = E0(x)e'«*. C1,8) Подставляя C1,7) в C1,5), находим -?^ + ?2//0(х) = 0, C1,9) где через k обозначена комплексная величина
§ 31] ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ОДНОРОДНОЙ СРЕДЕ 801 Введем важное понятие комплексной диэлектрической прони- проницаемости е(ш) в проводящей среде, определив ее соотношением * = -=-Уе(«Н*оУв(©), C1,11) где k0 = —— волновое число в вакууме. Из C1,10) следует, что C1,12) Эта важная формула устанавливает связь между диэлектриче- диэлектрической проницаемостью и проводимостью. Представим, далее, комплексную величину Уе(со) в виде У*Щ~п-Ы. C1,13) Величины пии называются, соответственно, коэффициентами преломления и поглощения. Знак перед х выбирается так, чтобы мнимая часть k была существенно отрицательна (при и > 0). Причина такого выбора очевидна из дальнейшего. Решение C1,7) имеет вид Н = А^-Ьххе1 w-k°nx\ C1,Н) где вектор At — комплексная амплитуда. Аналогично для элек- электрического поля можно написать ^хе1^-к"пх\ C1,15) В случае произвольного направления распространения векторы поля можно представить в виде Н= Ар1 <*-*>, C1,16) *-*'>t C1,17) где k — волновой вектор, k = k-ko, ko — единичный вектор в на- направлении распространения волны. Связь между векторами Н и Е можно определить, подставляя их выражения в C1,2): rot Е = - i \kE] - - ik [k0E] = - / у j/^7^5 [k0E] e откуда находим H=y^T+l?[k0E]e~i"'''l!;^. C1,18) В отличие от случая распространения электромагнитных волн в вакууме, амплитуды электрического и магнитного полей ока- оказываются различными. Однако, как и в вакууме, электромаг- электромагнитные волны в однородной и изотропной среде являются 51 В. Г. Левнч, том I
802 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл IV поперечными. Действительно, подставляя C1,16) и C1,17) в C1,3) и C1,4), находим (kE) (fcH) 0. C1,1) Формулы C1,16) — C1,19) показывают, что уравнения Макс- Максвелла в однородной и изотропной среде, как и в вакууме, до- допускают решения в виде плоских поперечных волн с волновым числом k и произвольной частотой ш. Однако в среде происхо- происходит затухание волн по экспоненциальному закону. Эффектив- Эффективность затухания определяется величиной х. Найдем значения п и х из C1,12), C1,13). Возводя C1,13) в квадрат, приравнивая C1,12) и разделяя вещественную и мнимую части, получаем п2 — к1 — е0, ш C1,20) Решение C1,20) дает Знаки корней выбираются так, чтобы п и х имели веществен- вещественные значения и, кроме того, х было положительным. Формулы C1,21), C1,22) определяют закон дисперсии в среде с проводимостью. Следует заметить, что при достаточно высоких частотах проводимость а также оказывается завися- зависящей от частоты. Рассмотрим предельные случаи формул C1,21) и C1,22). Если имеет место неравенство <т<-^, C1,23) то это означает, что ток проводимости оЕ мал по сравнению с током смещения 4~-д7~~4 ?¦ ^то имеет место как в иде- иде4 альных диэлектриках (у которых о-+0), так и у реальных диэлектриков, обладающих весьма низкой проводимостью, а также у проводников неметаллического типа (полупроводники, электролиты) при достаточно высоких частотах. В этом случае формулы C1,21) и C1,22) можно упростить, представив их в виде Ъ C1,24) У е0
§ 31] ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ОДНОРОДНОЙ СРЕДЕ 803 При этом, в силу неравенства C1,23), имеет место также не- неравенство п > к. Если полностью пренебречь величиной к, которая, строго го- говоря, равна нулю только в идеальном диэлектрике, то среду называют прозрачной. В прозрачной среде формулы для век- векторов поля упрощаются и приобретают вид \ C1,26) -*'\ C1,27) * = у*о> C1,28) где v — фазовая скорость распространения волн, C1>29) Последняя формула оправдывает название величины п. Дей- Действительно, как известно (см. § 37), показателем преломления именуют отношение скоростей распространения электромагнит- электромагнитных волн в вакууме и в среде /г = | = уЧ C1,30) Электромагнитные волны в непроводящей среде отличаются от волн в вакууме только скоростью распространения, которая меньше скорости света с в пустоте в Уга раз. Кроме того, амплитуды электрического и магнитного полей относятся друг к другу как if[ ^. C1,31) Полученные соотношения, установленные Максвеллом, играли важную историческую роль в теории электромагнитного поля. В частности, формула C1,30) установила связь между электро- электромагнитными и оптическими явлениями, которые до работ Фа- радея и Максвелла считались совершенно независимыми. Формула C1,30) была подвергнута широкой эксперименталь- экспериментальной проверке для большого числа жидкостей и газов. Было обнаружено хорошее согласие с опытом для ряда жидкостей и газов в видимой и инфракрасной частях спектра. Однако соот- соотношение C1,30) совершенно не выполняется для жидкостей (например, воды) и газов, молекулы которых имеют значи- значительный собственный дипольный момент. Другие ограничения 51*
804 КВАЗИСТАЦИОНАРНЫЕ ЭЛЕКТРОМАГНИТНЫЕ ПОЛЯ [Гл. IV применимости C1,30) связаны с существенным поглощением и дисперсией. _ В случае слабого поглощения удобно представить Ye B виде C1,32) и записать формулы для векторов поля в виде Е = Ae-*k>rel м-"*.'), C[,33) // = Уп' + кЦкоЕ] е'1 aKtg^. C1,34) Напряженность магнитного поля отстает от напряженности электрического поля по фазе на величину arctg—. Найдем еще среднюю (по времени) плотность энергии элек- электромагнитного поля в слабопоглощающей среде. Имеем, оче- очевидно, 8» /72 8я 1Г2 8л 80Л2 _2>о. 16л С ' 16л 80Л= — 16л поскольку пг + х2~«2=угё^. Как и в вакууме, энергия элек- электрического и магнитного полей в волне близки друг к другу. Рассмотрим теперь обратный предельный случай, когда ток проводимости велик по сравнению с током смещения. Фор- Формально этот случай сразу получается из формул для дисперсии при низких частотах и большой проводимости. Имеем, оче- очевидно, ^ C1,35) C1,36) Как показывает сравнение C1,35) с C1,4), затухание поля в среде происходит на толщине скин-слоя. Это — случай боль- большого поглощения. Ясно, однако, что последние формулы имеют -несколько ус- условный характер, поскольку трудно говорить о распространении волн, если они затухают на толщине скин-слоя. В заключение напишем закон сохранения энергии в среде с частотной дисперсией. Считая среду находящейся в состоянии термодинамического равновесия при постоянной температуре,
§ 31] ЭЛПКТРОМАГНИТНЫЕ ВОЛНЫ В ОДНОРОДНОЙ СРЕДЕ 805 можно написать для изменения внутренней энергии в единице объема dUdQdWdQJ^dD . dt ~ dt ~*~ dt ~ dt ~*~ Ы dt ' Усредним равенство C1,37) по времени, считая, что темпера- температура поддерживается постоянной. При этом в среднем энергия среды в периодическом внешнем поле остается постоянной, так что для выделения тепла получаем dQ Е dD dt ~ 8я Л' Полагая D — [в[ (©) + щ(со)] (?0 cos со/ + iE0 sin со/), имеем dt ~ 8я • ^ Таким образом, в среде происходит выделение тепла, опреде* ляемое величиной Бг(а)). Формула C1,38) имеет смысл, если это выделение тепла происходит так, чтобы оно успевало отво- отводиться и температура среды поддерживалась постоянной. По- Поскольку тепло только выделяется, Q>0 всегда и, соответст- соответственно, C1,39) Знак ei (со) может быть как положительным, так и отрица- отрицательным.
ГЛАВА V ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ § 32. Дисперсионные соотношения Мы указывали уже в § 6, что при высоких частотах, когда частота излучения сравнима с его характерными атомными ча- частотами, а его длина волны сравнимой с размерами простран- пространственных неоднородностей в среде, наступает явление дисперсии. В случае однородной и изотропной среды общую формулу F,5) можно представить в виде t D(r, /)= $ dt' je(\r-r'\, t-t')E(r', t')dV. C2,1) Функция e(\r — r'\, t — t') зависит только от модуля разности координат, поскольку в однородной среде нет выделенных то- точек. Вклад в е дает изменение поляризации, которое за время I — ? передается на расстояние \г — г'\. Интеграл берется только по прошедшему, чтобы удовлетворить принципу причин- причинности. Очевидно, что \г — r'\<c(t — /'), но для простоты мы не будем учитывать это ограничение1). Разложим электрическое поле и индукцию в интеграл Фурье: E(r, t)=-~j E(k, co)e< <•'-•« dk Ao, C2,2) D (r, t) = -—-1 D (k, со) е< <*'-*> dk da. C2,3) Тогда, подставляя в C2,1), находим D(k, и) = е(Л, co)?(ft, со), C2,4) ') См. М. А. Л е о н i о в и ч, ЖЭТФ, 907 A961).
•§ 32] ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ 807 где обозначено t (*, <о) = J dt J e (| г - г1 |, / - f) e~ik (r-n — OO oo = J dx J e (| R |, т) е-' <**-¦«> rf/?. C2,5) При этом введены новые переменные R—(r — г') и x—t — t'. Введенная нами функция е(я, а») не является фурье-образом e(k, т), поскольку интеграл по т берется в пределах от нуля до бесконечности. Именно функция e(ft, со) (а не е(|/?|, т) имеет основное значение, поскольку согласно C2,4) она связывает между собой векторы D и Е; она называется диэлектрической проницаемостью, зависящей от частоты и волнового вектора. Заметим, что зависимость e(ft, ю) от волнового вектора h связана с зависимостью e(j/?|, т) от пространственных коорди- координат R, т. е. с учетом пространственной дисперсии. Если длина волны мала по сравнению с пространственными неоднородностями, то можно считать диэлектрическую прони- проницаемость функцией только от (t — f) и вместо C2,5) написать более простое соотношение: е(со)= J &{%)еш dx, C2,6) в котором диэлектрическая проницаемость зависит только от частоты. При этом соотношение C2,4) упрощается и превра- превращается в 0(<а)-в (со) Я (со). C2,7) Подчеркнем, что если диэлектрическая проницаемость зависит от частоты, то именно уравнение C2,7) является правильной формой записи уравнения связи. Часто приводимое в старых руководствах соотношение D(r, О-е(а>)?(г, t), где D и Е — сами векторы, а не их фурье-амплитуды, как в C2,7), не имеет никакого смысла. Если е является функцией частоты, то в равенстве C2,7) должны стоять величины, отно- относящиеся к той же частоте.
808 ПОЛЯ ВЫСОКОЙ ЧАСТОТЙ [Гл v Функция e(fe, (?>) является, вообще говоря, комплексной и мо- может быть записана в виде е (ft, <о) = ere (ft, ©) + fc™ (ft, ю). C2,8) Очевидно, что вещественная и мнимая части е"(*,ц)-'(*'а)+2''(*-'>). C2,9) ei« (А> ш). в (*.«)-»•(»,.) ^ C2) j 0) Кроме того, из определения C2,5) следует, что е(*. ю)-в*(-*,-ю). C2,11) Подставляя в C2,9) выражение B3,5), с учетом C2,11) находим 8re Аналогично 8'm (ft, ©) = -, (*, ©) = 00 0 0 J Л J в (| Л |, | т |) *-' <*«-ит> d/?. C2,12) C2,13) где знаковая функция sgn т определена по формуле A11,16). Мы видим, что как вещественная, так и мнимая части e(ft, со) выражаются через е(|/?|, |т|) по формулам C2,12) и C2,13), поэтому их можно связать между собой. Именно, поскольку формула C2,13) представляет фурье- преобразование ?A#|, т), обращая это преобразование, на- находим sgn (т) е (| R И т |) = -^ | | в"» (ft', оэ) е1 <*'<-*t> dft' do'. C2,14)
$ 32] ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ 809 Подставляя значение е(|/?|, |т|) из C2,14) в C2,13), находим sgnl Внутренний интеграл можно вычислить, воспользовавшись фор- формулой (III, 17) для sgn(T) откуда Интеграл в формуле C2,15) берется в смысле главного значе- значения. Совершенно аналогичные вычисления—обращение фор- формулы C2,12) и подстановка в C2,13) —дает Формулы C2,15) и C2,16) носят название формул Крамерса — Кронига, или дисперсионных соотношений. Они связывают ме- между собой вещественную и мнимую части диэлектрической про- проницаемости, иными словами, характеристики процесса рассеяния и поглощения. Все сделанные выкладки могут быть перене- перенесены на уравнение связи \i(k, ш), и точно такие же соотноше- соотношения могут быть написаны для вещественной и мнимой частей магнитной проницаемости. Таким образом, оказывается уста- установленным общий принцип, согласно которому вещественная и мнимые части основных величин характеризующих свойств среды — г(к, со) и [i(k, со)—не являются независимыми, но
810 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл V связаны между собой Поскольку, согласно C2,12), электропро- электропроводность связана с диэлектрической проницаемостью, получен- полученный результат в равной мере относится и к электропроводности. Формулы Крамерса— Кронига являются одним из самых общих соотношений электродинамики Действительно, при их выводе было сделано только два предположения- 1) существо- существование причинной связи: значение функции D в момент / можег определяться процессами поляризации только в предшествую- предшествующие моменты времени; 2) допустимость разложения всех функ- функций в интеграл Фурье Последнее выполнено практически для всех функций, описывающих физические процессы Таким об- образом, формулы Крамерса — Кронига устанавливают, в самом общем виде, связь между величинами, характеризующими про- процессы типа рассеяния (вещественная часть е, ц или а) и по- поглощения (мнимая часть этих величин) Процессы рассеяния и поглощения оказываются связанными между собой Иллюстра- Иллюстрации этого общего положения встречаются в самых различных разделах физики, в частности, в квантовой механике и теории элементарных частиц (см. т II) Наряду с принципиальной важностью, формулы Крамерса — Кронига имеют важное прак- практическое значение. Мнимая часть диэлектрической проницае- проницаемости связана с поглощением энергии в среде (см. § 31) и мо- может быть сравнительно просто найдена экспериментально При этом вещественную часть еге находят по формуле Крамерса — Кронига § 33. Электромагнитное поле в среде с пространственной и временной дисперсией Порченные ранее решения уравнении Максвелла в виде по- поперечных электромагнитных волн оказываются не только коли- количественно, но и качественно неприменимыми в случае распро- распространения электромагнитных волн в среде с пространственной дисперсией Как мы подчеркивали в § б, явление пространственной дис- дисперсии становится существенным в том случае, когда длина волны становится сравнимой с размерами пространственных неоднородностей среды При этом значение индукции в данной точке г пространства, согласно F,5), оказывается зависящим от значения вектора поля и свойств среды в окружающей ее об- области пространства (совокупности точек г') Обычно говорят о «нелокальной связи» между соответствую- соответствующими величинами D и Е До самых последних лет считалось, что в макроскопически неоднородных средах можно не учитывать явления простран- пространственной дисперсии Однако оказалось, что в весьма широком
$33] ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В СРЕДЕ С ДИСПЕРСИЕЙ 811 классе макроскопически однородных сред, именуемых плазмо- подобными, пространственная дисперсия играет важную роль. К таким средам относят как саму плазму (свойства которой будут разобраны в гл. VI), так и проводники — металлы и по- полупроводники с высокой электропроводностью, когда прихо- приходится изучать их взаимодействие с высокочастотными полями. В таких средах существуют характерные неоднородности сравнительно большого масштаба. В виде примера можно при- привести длину свободного пробега электронов в металлах, которая •будет вычислена в ч VI. Длина свободного пробега составляет около 10~6—10 см Другой пример пространственной неоднородности, относя- относящийся к плазме, будет приведен в § 46 Важная роль, которую играют плазмоподобные среды в со- современной физике, сделала весьма актуальным изучение свойств сред с пространственной дисперсией. Рассмотрим макроскопически однородную и изотропную ненамагничивающуюся ((х~0 среду, без токов и свободных зарядов. Будем пытаться искать решение уравнений Максвелла в виде разложений в интеграл Фурье. Этот метод в настоящее время стал одним из самых популярных и часто применяемых. Напишем разложения в виде f f v)dkd<a, C3,1) Е <r>')=w Iei <*г~ш0 E (Af> o) dk d<*' C3'2) B (r>')=w Ie' {*"m B {ky №) dk da' C3>3) ' <*'-« H(k, о) dk rfto. C3,4) Лодставляя в уравнения Максвелла эти разложения, находим 1 \kH(k, со)] = - г -^ Я(ft, со), C3,5) i[kE(k, a)] = i-j-B(k, со), C3,6) (kD) - 0, C3,7) (fcB) = 0. C3,8) Таким образом, задача об интегрировании системы уравнений в частных производных свелась к задаче о решении системы алгебраических уравнений и последующего обращения формул преобразования Фурье.
812 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ (Гл V Для того чтобы эти соотношения приобрели конкретный смысл, следует написать уравнения связи для D(k, со) и Е(к, ©)> В (ft, о) и H{k, to) соответственно. Введем диэлектрическую проницаемость, связывающую D(k, со) и E(k, и). Заметим при этом, что, поскольку проницае- проницаемость зависит от ft, даже в изотропной среде она является не скалярной, но тензорной величиной. Именно, поскольку она может зависеть от вектора ft, а на- направление вектора ft является единственным выделенным напра- направлением в изотропной среде, для определения проницаемости мы должны составить симметричный тензор второго ранга, со- содержащий только единичный тензор б,3 и компоненты вектора ft. Единственный симметричный тензор второго ранга е1;, кото- который можно составить из этих величин, имеет вид в„ (ft, а) = е± (к, ш) (б,; - ^р-) + ея ^. C3,9) Если выбрать направление волнового лектора за ось z, то мож- можно написать для ег] явное выражение Е± О О О ех О О 0 в. C3,10) Изотропная среда при наличии пространственной дисперсии ха- характеризуется двумя диэлектрическими проницаемостями: про- продольной 8ц и перпендикулярной е±. Причина такого наимено- наименования будет ясна из дальнейшего. Разумеется, что е^ и ех являются функциями ft и <о. Если пространственная дисперсия отсутствует, то диэлектри- диэлектрическая проницаемость e(t — ?) зависит только от времени. Со- Соответственно etJ в C3,9) должно зависеть только от ю, но не от k. При этом следует положить ех (ш) = 8ц (а) = в (со), C3,11) тогда C3,12) Уравнения связи для фурье-компонент в среде с пространствен- пространственной дисперсией будет иметь вид Dt{k, ш) = ги {к, о) Е, (к, и). C3,13) Умножая C3,6) векторно на ft, имеем - [k [kE] ] = k?E - к (kE) = - -j- [kB].
§ 33] ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В СРЕДЕ С ДИСПЕРСИЕЙ 813 Подставляя в правую сторону значение векторного произведе- произведения из C3,5) и учитывая, что ц=1, находим ~D, C3,14) С или {«>,/-*,*/}?/ = ¦? А- Пользуясь уравнением связи C8,13), получаем окончательно Для того чтобы система линейных алгебраических уравнений C3,15) имела нетривиальное решение, необходимо выполнение условия *%|/_/г,*/--?в,/ = 0. C3,16) Последнее выражение определяет зависимость ъг} от к и со, т. е. представляет дисперсионное уравнение. Заметим, прежде всего, что, учитывая определение C3,9) и выбирая направление вектора k за ось г (&ж = &„ = 0; kt = k), можно записать уравне- уравнение C3,16) в виде системы алгебраических уравнении -?ex(ft,<D)-** = <), C3,17) ei|==e2Z = 0. C3,18) Уравнения C3,18) и C3,17) являются независимыми диспер- дисперсионными уравнениями для электромагнитных волн, могущих распространяться в среде с пространственной дисперсией. Мы видим, что в такой среде возможно существование системы двух независимых волновых процессов: поперечных волн, для кото- которых справедлив закон дисперсии C3,17), и продольных, для которых закон дисперсии дается формулой C3,18). У попереч- поперечных волн вектор электрического поля Е [ имеет отличные от нуля компоненты Ех и Еу; у продольных волн поле имеет одну компоненту Ег Во избежание недоразумений укажем, что для продольных волн выполнено условие C3,7), так чго вектор D перпендикулярен вектору к (направлению распространения). Однако векторы D и Е, в силу C3,14), не параллельны друг другу. Появление продольных электромагнитных волн, именуе- именуемых часто волнами поляризации, является специфическим эф- эффектом, связанным с пространственной дисперсией среды Про- Продольные электромагнитные волны в среде с пространственной дисперсией имеют простой смысл, рассмотрим среду с равно- равновесным, но неоднородным распределением заряда и допустим,
814 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V что на такую среду действует электромагнитное поле с длиной волны, сраанимой с размерами неоднородности. Поле вызывает смещение зарядов (создает поляризацию), нарушая равновес- равновесное распределение. В результате в среде возникают колебания зарядов, весьма сходные с упругими звуковыми волнами в изо- изотропных средах. Более конкретная количественная картина распространения продольных воли будет развита в § 46 для случая плазмы. Там же мы получим явные выражения для ех и е(| и, с помощью уравнений C3,17) и C3,18), закон дисперсии в плазме а>± (?) и соц (k) для поперечных и продольных волн. В случае пространственно однородной среды уравнение дис- дисперсии превращается в уравнение fe2--^e(co) = 0, C3,19) совпадающее с C1,11) и определяющее однозначно частоту ВОЛН (u(k). Поскольку, в силу C3,11), о такой среде ей=е(со)^О, един- единственное возможное решение уравнения C3,15) гласит: Таким образом, в соответствии с результатами § 31, в среде без пространственной дисперсии могут распространяться только поперечные волны. Заметим, что дисперсионные уравнения и остальные основ- основные свойства волн были получены нами без нахождения век- векторов поля как функций координат и времени. Последнее тре- требует обращения интеграла Фурье, которое, согласно C3,1) — C3,4) и C3,13), может быть фактически выполнено, если из- известен в явном виде закон дисперсии. На практике часто основ- основной интерес представляет именно закон дисперсии. Вычисление векторов поля но формулам C3,1) — C3,4), представляющее основную трудность, часто вообще можно не проводить. В этом — главное преимущество использования метода интеграла Фурье. В заключение найдем связь между тензором е,-; и тензором электропроводности a,j в среде с пространственной дисперсией. Поскольку соотношение 3D дЕ 4я , имеет универсальный характер, то, подставляя в него разложе- разложения соответствующих векторов в интеграл Фурье и используя
§ 3-1] ДИСПЕРСИЯ CBFTA 815 выражения C3,13) и определение тензора электропроводности ji = OijEj, получим: 4жт,, * 3> Эта формула является непосредственным обобщением формулы C1,12), полученной в отсутствие пространственной дисперсии. § 34. Дисперсия света Мы разбирали в §§ 36 и 37 ч. I эффект рассеяния электро- электромагнитных волн свободными и связанными электронами. Сейчас мы рассмотрим тот же эффект с несколько иной точки зрения. Именно, вычислим диэлектрическую проницаемость среды, со- содержащей связанные электроны, рассеивающие излучение. В качестве простейшей среды будет рассматриваться разре- разреженный газ, в котором поляризация Р равна P = Nd, где N — число рассеивающих зарядов и d — приобретаемый каждым из них дипольный момент. Согласно C7,2) ч. I для d имеем *• о 2 ¦ ' m (Og - ш + шу где «о — собственная частота осциллятора. Поле Е в разреженном газе равно внешнему полю. Поэтому = ?A+4^-^-5—1—-\ C4,1) = E(l s \ т % — «г + <"yg> и, следовательно, для диэлектрической проницаемости можно написать, пользуясь определением C1,13): / ¦ \о 1 I 4яе2 N т л п\ е = (я — тJ = 1 Н j 5 • C4,2) Art сод - ш^ + гусо В достаточно разреженном газе второе слагаемое в C4,2), пропорциональное числу электронов в единице объема, по мо- модулю мало по сравнению с единицей при всех частотах. Поэтому можно написать приближенно «-;*~i+-^ 2-Л2 . т (Оа - о) -f (ум
816 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V Отделяя вещественную и мнимую части, находим 2ne2N cog-ш2 т т (<ol - а2J + C4,3) C4,4) Полученные формулы определяют хорошо измеряемые вели- величины — показатель преломления и коэффициент поглощения из- излучения. Если бы газ моделировался системой осцилляторов г—г О), Рис. 96. с собственными частотами сооь юог, •••¦> мог, ¦••, то в формулах C4,3) и C4,4) пришлось бы провести суммирование по различ- различным сортам осцилляторов. Разберем более детально зависимость п и и от частоты излу- излучения. Предположим прежде всего, что <л достаточно сильно от- отличается от собственных частот соо*. Тогда, пренебрегая у2и>2 в знаменателе, получаем i^2/L^, (з4,5) 4ле2 Мы видим, что коэффициент поглощения к в области весьма мал и для п можно написать Н J 5 а" «2г-а>2 C4,7) Формула C4,7) выражает закон дисперсии в разреженном газе. Зависимость показателя преломления от частоты изобра- изображена на рис. 96. При приближении <о к wo, n резко возрастает.
§ 34] ДИСПЕРСИЯ СВЕТА 817 При со, больших шо, показатель преломления принимает весьма малое значение (см. ниже) и вновь возрастает с частотой. У каждого вещества имеется свой набор характерных частот <оо{. В виде примера на рис. 12 мы ограничились тремя часто- частотами. Мы указывали уже в ч. I, что реальные микроскопические излучатели — атомы и молекулы — не подчиняются законам классической электродинамики Тем не менее, гармонический осциллятор, как классическая модель излучающих систем, хо- хорошо передает ряд основных свойств реальных излучателей. Это особенно ясно видно на примере дисперсии. В квантовой меха- механике (см. § 108, ч. V) будет показано, что закон дисперсии вы- выражается формулой п=1+ У, 2 a , C4,8) где (ог—частоты переходов, связанные соотношением сог= р р = —?=—-с r-м и нижним уровнями энергии излучателя, a fr — коэффициенты, удовлетворяющие условию 2 fr — 1 ¦ Сходство точной формулы C4,8) с классической модельной формулой C4,7) очевидно, хотя входящие в последнюю вели- величины приобретают совершенно другой смысл. В случае высоких частот, удовлетворяющих условию (о^со,-, как квантовая, так и классическая формула для показателя преломления приобретают вид ге=1—Й-5Г- <34>9) Коэффициент преломления оказывается меньшим единицы и не зависящим от свойств вещества, за исключением лишь числа электронов в единице объема. Смысл полученного результата весьма прост: при рассеянии достаточно жесткого излучения связь электронов в атомах перестает играть заметную роль. Атомные электроны рассеивают излучение, как свободные. По- Показатель преломления п, определенный формулой C4,9), яв- является показателем преломления среды, представляющей газ свободных электронов с плотностью N. Формула C4,9) приме- применима в ультрафиолетовой области для элементов, находящихся в начале периодической системы, имеющих малую энергию связи электронов в атомах и в области рентгеновых лучей для элементов средней части и конца периодической системы. Среда с п<1 является оптически менее плотной, чем вакуум. Фазовая скорость электрома! нитных волн в ней v = — >c (ср. § 7, ч. II). 52 В. Г. Леаич, гом I
818 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V При падении на поверхность тела достаточно коротких элек- электромагнитных волн может иметь место описанное ниже, в §35, явление полного внутреннего отражения. Интересно вычислить групповую скорость электромагнитных волн в рассматриваемой среде da 1 dk dk d(S> Вычислим -^-, пользуясь C4,9): О i сюда 1 + mco2 Групповая скорость, как это и должно быть, оказывается меньше скорости света. Вернемся теперь к общему случаю дисперсии и рассмотрим область частот со«юо. В этом случае формула C4,5) теряет смысл, и следует вернуться к вы- выражениям C4,3) — C4,4). При ш я* «о можно написать (<о0 — ю) 2ш0. — о2 Введем новую переменную тогда туа>о 1 +. тущ I + хг Кривые к(х) и (п(х) — 1) изо- изображены на рис. 97. Мы видим, что при х = 0 (т. е. (о = шо) имеет место максимальное поглощение. Это поглощение, или, точнее, экстинкция, связано с большой величиной эффективного сечения рассеяния (ср. § 37 ч. I). Оно резко снижается с ростом х, достигая Ц2 своего максималь- максимального значения при .v=±l. Показатель преломления в обла- области _1<х<1 обнаруживает ход с х, совершенно отличный от Рис. 97.
§ 35] ГЕОМЕТРИЧЕСКАЯ ОПТИКА 819 ¦его хода при U|>1, изображенного на рис, 97. Если при |*i >1 n растет с увеличением х, то при x==Fl он достигает соответственно максимального и минимального значений. В ин- интервале — 1<л;<1, п(х)—пе растущая, а падающая функция х, достигающая при х = 0 значения п—1. Эта область, в которой показатель преломления падает с ростом частоты, носит назва- название области аномальной дисперсии. В области аномальной дис- дисперсии разреженный газ обладает наибольшей экстинкцией (ми- (минимумом прозрачности). Мы вернемся еще к вопросам дисперсии в квантовой меха- механике, где будет показано, что, кроме рассеяния без изменения частоты, возможно рассеяние света с изменением частоты (так называемое комбинационное рассеяние). § 35. Геометрическая оптика Выше мы нашли закон распространения плоских электро- электромагнитных волн в однородных прозрачных средах. Непременным признаком плоской волны служит то обстоя- обстоятельство, что поверхностью равной фазы является плоскость бесконечной протяженности. Плоские электромагнитные волны особенно просты, так как их амплитуда и волновой вектор остаются постоянными в про- пространстве и во времени. Оказывается, что аналогичными свой- свойствами при известных обстоятельствах и с некоторой степенью точности обладают произвольные электромагнитные волны. Как будет показано ниже, для этого необходимо, чтобы кривизна волновой поверхности была достаточна мала в таких областях пространства, которые еще велики по сравнению с дли- длиной волны. Приближенная замена волновой поверхности плоскостью имеет очень большое практическое значение, поскольку в слу- случае произвольной формы поверхности законы распространения волн оказываются весьма сложными. Из сказанного ясно, что подобная замена оказывается во всяком случае допустимой, если длина волны весьма мала. По- Поэтому заслуживает особого рассмотрения предельный случай электромагнитных волн, длина которых Х-*0. Практически этому случаю отвечает уже область видимого света. Действительно, длина волны видимого света составляет около 5-Ю см. Она всегда весьма мала по сравнению с раз- размерами макроскопических тел и оптических приборов. По этой причине изучение законов распространения электромагнитных воли в предельном случае Х—*0 получило название геометриче- геометрический оптики. 52*
820 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V Ниже мы по той же причине будем иногда называть элек- электромагнитную волну — световой и говорить о распространении света. Это не должно повести к недоразумениям. В прозрачной среде каждая из компонент векторов поля Е и Н удовлетворяет волновому уравнению d2F Здесь через F обозначена произвольная компонента поля. В ограниченной среде, помимо волнового уравнения, ком- компоненты векторов поля должны еще удовлетворять граничным условиям. Поэтому компоненты векторов Е и Н связаны между собой некоторыми соотношениями и не являются совершенно независимыми. Однако достаточно далеко от границы раздела сред это обстоятельство можно не учитывать и считать все ком- компоненты Е и Н независимыми. Тогда волновое поле можно ха- характеризовать скалярной величиной F. Рассматривая монохроматическую волну, можем написать F = f(x, у, г) е-'". Функция f удовлетворяет, очевидно, уравнению Вводя волновое число k = — и показатель преломления С можно переписать последнее уравнение в виде Af + n262/ = 0. C5,1) Плоской волне отвечает решение уравнения C5,1) f = aelknr = ае'м«*ог> = aeikl, C5,2) где а — постоянная амплитуда и l — n{k(p)—величина, именуе- именуемая обычно оптической длиной пути и являющаяся линейной функцией координат. Она отличается от геометрического пути множителем п. Мы должны найти решения уравнения C5,1) в общем виде, не ограничиваясь плоской волной. При этом, однако, мы будем рассматривать предельный случай К—>0 или А-+оо. Будем пы« таться представить решение уравнения C5,1) в предельном слу- случае весьма больших k, как f = aen*.y.z\ C5,3) При этом величина \р, именуемая эйконалом, представляется в виде, максимально приближающемся к виду фазы плоской волны ¦ф = kS {X, у, Z),
§ 351 ГЕОМЕТРИЧЕСКАЯ ОПТИКА 82Г где 9?(х, у, г) —функция координат, достаточно близкая к ли- линейной. Таким образом, будем пытаться искать решение C5,1) в виде f = aelk*<x-y-*\ C5,4> Вычисл'им производные от функции /: grad f = a grad eik* = ikaeik* grad JS?; A/ = div grad eik* = ikaelkx A»^ - k2aeik* (grad ^f. Поэтому уравнение C5,1) приобретает вид + n2k2aeik* = 0, или (grad-gT-^A-g^rt2. C5,5> Величина J2" не зависит от k. Поэтому, если при k —*¦ оо выпол- выполнено неравенство |grad^|z>-^, C5,6) то в уравнении C5,5) можно перейти к пределу ft-»oo и опу- опустить второе слагаемое. При этом уравнение C5,5) приобретет вид | grad-27 = л2 или rt2?2. C5,7> В координатном представлении последнее уравнение имеет вид Уравнение C5,7) носит название уравнения эйконала. При его выводе мы не делали каких-либо предположений о значе- значениях показателя преломления п, который может быть произ- произвольной функцией координат. Зная решения уравнения C5,7), мы тем самым находим при- приближенное решение волнового уравнения C5,1), в предположе- предположении, что k достаточно большое число. В пределе /г -> оо это- решение совпадает с плоской волной, распространяющейся на направлении л. Условием применимости уравнения C5,7) слу- служит C5,6). Позднее мы обсудим, каким физическим условиям отвечает это неравенство и когда оно может не выполняться. Если Ир — решение уравнения эйконала, то ¦ф = kJ? (х, у, z) = const
«22 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V является уравнением поверхности равной фазы. Распростране- Распространение электромагнитных волн происходит в направлении нормали к поверхности постоянного эйконала, т. е. в направлении вектора gradJ?. Направление распространения волн именуется направ- направлением светового луча. На малом участке пространства эйконал х|з можно разложить в ряд, написав ^4 ^ . C5,8) При этом для f, согласно C5,3), имеем / = aetfc (grader) г = аеш_ C5,9) Оптический путь I оказывается равным (gradJ?)r. Сравнивая C5,9) с C5,2), мы видим, что в рамках примени- применимости геометрической оптики всякую волну можно на достаточ- до малом участке пространства рассматривать, как плоскую волну с волновым вектором, направленным по нормали к по- поверхности постоянного эйконала. В частности, в однородной среде с постоянным коэффициентом преломления п = const из C5,7) следует, что grad\|} = const. Это значит, что смежные поверхности равных значений эйконала находятся на равных расстояниях друг от друга. Нормали к этим поверхностям являются прямыми. Последнее утверждение имеет простой смысл: в однородной среде лучи света распро- распространяются прямолинейно. Мы не будем останавливаться на применении геометриче- геометрической оптики к оптическим и электроннооптическим системам'). Обсудим лишь вопрос о смысле неравенства C5,6), служащего условием применимости приближения геометрической оптики. Как известно из геометрии, величина Дф определяет средний радиус кривизны слабо изогнутой поверхности *|> = const. Та- Таким образом, неравенство C5,6) имеет простой геометрический смысл: оно означает, что средний радиус кривизны поверхности постоянного эйконала должен быть велик по сравнению с дли- длиной волны Л. Иными словами, световое возмущение должно илавно изменяться от точки к точке. Условия применимости при- приближения геометрической оптики заведомо нарушаются в непо- непосредственной близости к излучателю. Здесь изменение волно- волнового поля от точки к точке происходит весьма быстро. Величина Дг|7 может иметь тот же порядок величины, что и длина волны. ') См , например, Л. Д. Ландау и Е. М. Л и ф ш и ц, Теория поля, Физ- матгиз, 1960, §§ 55—57; Л. Рустергольц, Электронная оптика, ИЛ, 1952; М. Бор н, Оптика, ОНТИ, 1937.
§ 36] ДИФРАКЦИЯ 82$ Рассмотрим второй важнейший случай, когда оказывается невозможным пользоваться представлениями геометрической оптики. Пусть на пути световых лучей помещено совершенно непро- непрозрачное тело, именуемое экраном. В приближении геометриче- геометрической оптики световые лучи не прони- проникают за экран (рис.98). За непрозрач- —„. ным экраном находится область тени. л — ТЖ ¦—*-<?• Рассмотрим границу, разделяю- Ш| щую освещенную область и область \Ш тени (прямые А В и CD на рис. 98). с -^—-—— о Здесь происходит скачкообразное из- ¦ ——- менение амплитуды от значения а до нуля. Поэтому производные от f no Рис. 98. координатам на границе свет — тень обращаются в бесконечность. Здесь снова нарушаются усло- условия применимости геометрической оптики. В следующем пара- параграфе будут разобраны возникающие при этом физические яв- явления. § 36. Дифракция Как мы только что показали, на границе раздела освещенной и теневой областей использование приближения геометрической оптики и понятия прямолинейных световых лучей становится недопустимым. Резкой границы этих областей, естественно, не может быть. В действительности, вблизи края непрозрачного экрана распро- распространение света описывается неупрощенным волновым уравне- уравнением. Его решение с учетом граничных условий на поверхности экрана приводит к некоторому распределению интенсивности, отвечающему постепенному переходу от полной освещенности к тени. У границы раздела освещенной и теневой областей происходит отклонение от прямолинейного распространения света, как бы загибание лучей, получившее название ди- дифракции. Решение краевой задачи о дифракции оказывается весьма сложным. Поэтому были развиты специальные методы упро- упрощен.юго расчета дифракционных явлений. Мы ограничимся обсуждением наиболее важного и вместе с тем простого случая. Именно, пусть на некоторый экран с отверстием произволь- произвольной формы падает плоско-параллельный пучок лучей, т. е. пу- пучок лучей от достаточно удаленного от экрана источника с ин- интенсивностью /0. У края экрана происходит дифракция света. Нас будет интересовать распределение интенсивности света на большом расстоянии от отверстия (большом по сравнению с его
324 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V размером). Такая дифракция, при которой источник света и точка наблюдения находятся на бесконечно больших расстоя- расстояниях от дифрагирующего отверстия или экрана называется ди- дифракцией Фрауенгофера. При дифракции Фрауенгофера как падающие на экран с отверстием волны, так и прошедшие через отверстие волны на большом от него расстоянии можно считать плоскими. Волну, падающую на экран, мы будем называть первичной волной. Первичная волна, падающая на непрозрачный экран, полностью поглощается. Однако она проходит через отверстие в экране. Отверстие в экране становится излучателем электромагнитных волн в полупространство за экраном. Каждая точка в сечении отверстия является источником вто- вторичных сферических волн, достигающих точки наблюдения с не- некоторым запаздыванием. Если fo = const е~ш — значение какой-либо компоненты поля в некоторой точке г0, находящейся в сечении отверстия, то воз- возмущение, приходящее из этой точки в точку наблюдения N, бу- 1 /? дет порядка -^ fo(i:) = const е-'юг, где т — t — ——время за- лаздывания (см. § 23 ч. I). Полное поле в точке наблюдения получится на основании принципа суперпозиции суммированием по всем излучателям, т. е. по всему отверстию в экране. Таким образом, в точке наблюдения N имеем fN ¦= const • J ?—— dS = const e~m J ~— dS = = const .е-<«* j Sj-dS. C6,1) При этом f означает любую из компонент электрического или магнитного полей. В том же приближении, что и в предыдущем параграфе, мы отвлекаемся от явлений поляризации, а также считаем все компоненты поля независимыми. Формула C6,1) имеет вполне общий характер. При вычис- вычислении интеграла C6,1) мы будем иметь в виду, что расстояние до точки наблюдения велико по сравнению с размерами отвер- отверстия (дифракция Фрауенгофера!). Введем начало координат, поместив его в некоторой точке отверстия (рис. 99). Тогда можно, как обычно (см., например, ¦§ 15 или § 26 ч. I), написать /? = | г0 - г | ~ г0 - иог, где ло = —— единичный вектор в направлении г0.
ДИФРАКЦИЯ 82& Величина \г\, изменяющаяся в пределах отверстия, мала по- сравнению с |го|, но может быть не малой по сравнению с дли- длиной волны. Поэтому член (лог) можно опустить в знаменателе формулы C6,1). но его необходимо удержать в экспоненте. Со- Соответственно имеем J e-ikn, ds = A J e- C6,2) где q = kn0 и через А обозначена совокупность множителей, стоящих перед интегралом. Значение этой константы будет вы- выражено через интенсивность падающей волны. Выбрав плоскость отверстия за участок плоскости z — О, ве- величину qr можно записать в виде 'О м) C6,3) Здесь cos « и cos р — направляющие косинусы вектора л0, Если волновой вектор падающей волны нормален к плоско- плоскости отверстия, а угол отклонения мал, то нетрудно заметить, что cos a » sin в] « 8], cosp » sin 02 «« 02, где в) и 6г — углы отклонения (дифракция) в плоскостях (хг) и \уг). При этом qx « k% q2 ~ A82. C6,4)
«26 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ (Гл. V Интегрирование в C6,2) ведется по площади отверстия. Если ввести функцию \ 1 при (л:, у) в пределах отверстия, I. 0 при (х, у) за пределами отверстия, то можно переписать C6,2) в виде оо f = AJjl(x,y) е-' <**+».»> dx dy, C6,5) — оо где интегрирование ведется уже по всей площади экрана (вклю- (включая и отверстие). Для определения постоянной А заметим, что C6,5) представ- представляет интеграл Фурье от функции %{х, у). Поэтому г J J Из формулы A1,9) следует J |? {x, y) f dx dy = Bд)'2 A2 J | / (<7„ q2) p dflr, rf^2. По определению g интеграл слева равен единице, умноженной на площадь отверстия S. Интеграл | f(<71( q2) I2 dqx dq2 no определению представляет полную интенсивность за экраном. Последняя равна, очевидно, полной интенсивности света, прохо- проходящего через отверстие в экране, т. е. где /о — интенсивность падающего света, отнесенная к 1 см2. Отсюда находим значение А: А = %- C6,6) и окончательно имеем оо f (Яи <?2) = "§- J J е-1 <**+™>Б (х, у) dx dy. C6,7) Формула C6,7) дает общее решение поставленной задачи — распределение волнового поля за экраном с отверстием (на большом расстоянии от него). Распределение интенсивности дается величиной dl = \f(quq2)\Uqidq2. C6,8) По смыслу величин qx и q2 ясно, что \f\2dqidq2 представляет интенсивность дифрагировавшего света при данном значении
§ 36) ДИФРАКЦИЯ 827 углов дифракции 9| и 92: C6,8'> До сих пор мы рассматривали дифракцию от малого отвер- отверстия в экране. Теперь предположим, что свет падает на малый экран, размер и форма которого совпадает с отверстием в рас- рассмотренном ранее экране. Такой экран называется дополнитель- дополнительным по отношению к отверстию. Дифракцию у краев дополни- дополнительного экрана легко найти из следующих соображений. Совместим дополнительный экран с отверстием. Тогда по- позади нового экрана, ставшего сплошным, световое иоле будет отсутствовать. Последний факт можно выразить словами: в результате на- наложения полей, дифрагировавших от отверстия и дополнитель- дополнительного к нему экрана, полное поле обратилось в нуль. Отсюда следует, что поле позади дополнительного экрана можно свя- связать с полем за отверстием соотношением Адоп — /» или C6,9) Отверстие и дополнительный к нему экран дают тождествен- тождественное распределение интенсивности дифрагировавшего света. Это положение носит название принципа Бабине. Применим полученное общее выражение для распределения интенсивности к трем конкретным случаям, имеющим важное практическое значение. Первым из них является дифракция на бесконечно длинной щели в непрозрачном экране. Пусть ширина щели равна а, начало координат поместим в середину щели, направив ось у параллельно ее краям. На- Направление падающего света совпадает с направлением оси г. Очевидно, что дифракция происходит только от обоих краев щели, т. е. в интеграле C6,7) следует интегрировать только по координате х. В направлении у при бесконечной длине щели загибания лучей, падающих на экран, не происходит. Поэтому мы будем все величины относить к единице длины щели. В одномерном случае вычисление, аналогичное проведен- проведенному, дает для А значение А = у ¦— . Формула C6,7) в одно- одномерном случае имеет вид A W sng sm
¦828 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V Интенсивность света, дифрагировавшего под углом между Э и 9 + dQ, равна 2 sin* kab ¦dq . , kaQ /ofta* 2 2л ( Ша \2 1 2 I dQ. C6,11) Величина 10а представляет полную интенсивность света, падаю- падающего на единицу длины щели. В результате дифракции возникает система освещенных и темных полос, параллельных щели. Распределение интенсивности, как функция х = ~-, изобра- изображено на рис. 100. В направлении 6 = 0 имеется главный максимум интенсив- интенсивности; по обе стороны от него интенсивность быстро уменьшает- уменьшается с ростом 6. В точках -^— = =—2—я(« = 1, 2, ...) интенсив- интенсивность имеет ряд побочных макси- максимумов. В этих максимумах интен- интенсивность значительно ниже, чем в главном максимуме, и убывает с ростом порядка максимума (чис- (числа п). Аналогичным образом можно найти дифракцию от круглого от- отверстия в экране радиуса а. Поместим начало координат в центр круга. Тогда а 2л О А €.3 42 info ~Х^ т. о о о 2Я J ^e- dy- о о о г г я 2я Зге 2л а 2л I rdr Г e- Рис. 100. 6й Из теории бесселевых функций известно, что 2я
S 36) ДИФРАКЦИЯ 829 где /о — функция Бесселя нулевого порядка1). Поэтому о В теории бесселевых функций доказывается, что а J о Поэтому окончательно "~ " C6,12) Интенсивность излучения, испытавшего дифракцию в телес- телесный угол dQ, равна ^^ ^^-dQ, C6,13) где /ояа2—полная интенсивность излучения, падающего на от- отверстие. В результате дифракции на круглом отверстии возникает си- система концентрических окружностей. Угловое распределение дифрагировавшего излучения, давае- l\ (kaQ) мое функцией ™—, весьма сходно с распределением, изобра- изображенным на рис. 100. Высота главного максимума относительно выше, но расстояния между побочными максимумами близки к изображенным на рис. 100. Напомним, что идентичные формулы дают распределение интенсивности при рассеянии от дополнительного экрана. При этом естественно, максимумам интенсивности при дифракции от отверстия отвечают максимумы при дифракции от непрозрач- непрозрачного экрана. В заключение остановимся на дифракции при прохождении света через последовательность N тонких бесконечно длинных щелей, расположенных на равных расстояниях друг от друга (дифракционная решетка). Пусть расстояние между серединами соседних щелей рав- равно d, решетка ориентирована по оси х. Координаты середин щелей х„ = nd, где я —целые числа, п — 0, 1, 2, ..., N. ') Проще всего эта формула может быть получена разложением экспо- экспоненты в ряд и почленным интегрированием. См. В. И. Смирнов, Курс высшей математики, т. III, ч. 2, Гостехиздат, 1958, гл. VII.
830 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ ]Гл. V Тогда C6,7) дает п=0 где ft определено формулой C6,10). Интенсивность излучения, дифрагировавшего от системы щелей, дается формулой qa = \f?dq~lo\ ^г —±- dq. C6,14) Возникающая интерференционная картина отвечает наложению дифракций от разных щелей, но не простому их суммированию. Важную роль в современной физике играет явление рассея- рассеяния рентгеновых лучей, а также электронов, нейтронов и т. д. от кристаллов (см. ч. V). Ниже мы обсудим простейшую теорию дифракционного рас- рассеяния рентгеновых лучей от кристаллов. Пусть кристаллическая решетка образована совокупностью атомов одного сорта (т. е. идентичных по своим свойствам). Будем считать, что поглощение в решетке отсутствует. Предположим, что на решетку падает пучок рентгеновых лучей, распространяющихся в направлении пх. Координату точки кристалла, в которой находится m-й атом решетки, можно запи- записать в виде rm = la + nb + pc, C6,15) где /, п, р — целые (положительные и отрицательные) числа, а векторы а, Ь, с — единичные векторы решетки (подробнее см. § 109 ч. V; мы ограничиваемся случаем так называемой прими- примитивной решетки). В точку гт приходит волна с амплитудой где f — произвольная компонента векторов поля и f0 — постоян- постоянная. Атом, находящийся в точке гт, рассеивает волну, и в точку наблюдения N, находящуюся на расстоянии Rm от m-го атома, приходит волна с амплитудой е>Н„ Полагая Ля «* г0 - пгт,
§ 36] ДИФРАКЦИЯ 831 где г0 — расстояние от точки N до начала координат, находим для амплитуды волны, рассеянной m-м атомом: Если пренебречь вторичным воздействием волны, рассеянной m-м атомом, на остальные атомы решетки, то полную интенсив- интенсивность в точке наблюдения можно написать в виде /-/olSe-'*^'"-"^!2, C6,16) где суммирование ведется по всем атомам кристалла (числа I, п, р). Учитывая выражение C6,15), можно написать k {rm, я - й() = kl (а, п - я,) + kn (&, я - л,) + kp {с, n-nl) = = /(а, k -k{) + n{bt k-k{) + p(c, k-k{). Тогда каждая из сумм вычисляется непосредственно. Например, VI 1 _„-М (а. *-*,)¦ У р-Ща, ft-»,) _ ' е 1=0 где Л/i — число узлов вдоль первого ребра кристалла. Отсюда сразу следует, что 7~/o ,1,»^у*'Г"„п, <>.*'-*.) ~;^yfei) ' C6>17) ? ai 2, Формула C6,17) носит название формулы Лауэ. Она яв- является обобщением формулы дифракционной решетки на случай трех измерений с различными периодами. Главный максимум лежит в направлении, определяемом совокупностью равенств, именуемых условиями Брэгга: (с, п-п{) = ^къ = h.AX, C6,18) где h\, h2t hz — целые числа. Каждое из этих выражений является условием обращения в нуль соответствующего множителя в знаменателе формулы C6,17). Следует подчеркнуть, что при данной длине волны Я, и задан- заданном направлении падающего пучка щ совокупность трех урав- уравнений C6,18) служит для определения двух независимых
832 ПОЛЯ ВЫСОКОП ЧАСТОТЫ [Гл V компонент единичного вектора п. При этом система C6,18) имеет решение только для определенной длины волны. Говорят, что отражение рентгеновых лучей от кристалла имеет селективный (избирательный) характер. В этом — отличие между одно- и двухмерной дифракционными решетками и кристаллом. На практике, когда известна та длина волны, которая может селективно отражаться решеткой, кристалл освещают либо сплошным спектром рентгеновых лучей, либо изменяют ориен- ориентацию рассеивающего кристалла (направление Л]). В обоих случаях кристалл сам «отбирает» условия, — длину волны или ориентацию, при которых возможно избирательное отражение — одновременное выполнение равенств C6,18). § 37. Отражение и преломление электромагнитных волн на границе раздела сред До сих пор мы изучали распространение электромагнитных волн в однородно^ среде. Рассмотрим теперь электромагнитную волну, падающую на поверхность раздела двух диэлектрических сред, отличающихся друг от друга величинами диэлектрических проницаемостей. Для простоты выкладок мы будем считать маг- магнитные проницаемости обеих сред равными единице. Поверхность раздела мы будем считать плоской. Ясно, что вблизи границы раздела физические свойства сред могут отли- отличаться от свойств в объеме, так что у поверхности раздела обра- образуется тонкий переходный слой. Однако, если толщина послед- последнего мала по сравнению с длиной волны, его влиянием можно пренебречь и считать границу математической поверхностью раздела, не имеющей никакой толщины. Предположим, что на эту поверхность, которую мы выберем за плоскость z = 0, падает плоская монохроматическая волна. Для простоты выкладок будем считать, что вектор k, характе- характеризующий направление распространения падающей волны, ле- лежит в плоскости (xz). Среду, в которой распространяется падающая волна, мы будем кратко именовать первой средой. Запишем векторы электрического и магнитного полей падаю- падающей волны в первой среде в виде Епал = Ае' (ш'-*/-) = Ае' №-кх cos a-kz cos v) //пад = Св1 М-*1") = Cgilat-kx cos a-kz cos y) где cos а и cosy — направляющие косинусы волнового вектора. Поскольку волна лежит в плоскости (xz), cos p* = 0. Волновое число k связано с частотой соотношением
§ 37] ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ НА ГРАНИЦЕ РАЗДЕЛА СРЕД 833 На границе раздела векторы ?"" и Япад должны удовлетво- удовлетворять граничным условиям E,2) и E,4). Величины ? и Я не являются независимыми, но перпендикулярны друг другу, а их абсолютные значения связаны между собой соотношением C1,31) Поэтому одновременно удовлетворить двум независи- независимым граничным условиям можно только, допустив, что падаю- падающая волна частично проходит во вторую среду, а частично отра- отражается ог поверхности раздела. Волну, проходящую во вторую среду, мы будем называть преломленной, поскольку направле- направление ее распространения не совпадает, вообще говоря, с направ- направлением падающей волны. Пусть (о (сопр(-*прг) означают электрические векторы отраженной и проходящей волн. Полное поле в первой среде характеризуется вектором Ei = Е + ?отр = Ае1 (<0'-*/>» + Лотре' (*>отр*-*отр'-). Граничное условие E,2) на поверхности раздела двух сред дает: Л нал л {@1-kx cos a) . ,отр i (u>°lp*-fc0Tpx cos aOTp-ft°Tpy cos ротр) _ ./itg "с ~Г "tg ^ — _ 4пр i ((опр*-?пР;с cos a"P-k"Py cos Pnp> Последнее равенство должно иметь место при произвольных значениях времени t и координат хну. Это возможно только, если «в-в^р-в-р, C7,1) k cos a = k0Tp cos a0Tp = kap cos anp, Первое условие означает, что отражение и преломление проис- происходит без изменения частоты. Третье равенство показывает, что отраженная и преломленная волны лежат в той же плоскости, что и падающая волна. Наконец, учитывая, что k= = , можно переписать второе соотношение в виде О) V в | СО У 8! о п, cos а = — cos а 1, с ——— cos а = —-г1- cos а р откуда находим а = аитр, C7,2) 53 В Г. Левич, том I
834 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ {Гл. V т. е. угол падения равен углу отражения, и Вместо направляющих косинусов cos а и cos апр обычно вво- вводят sin Э и sin 8пр, где G и 8пр — углы, образуемые падающей и преломленной волнами с нормалью к плоскости z = 0 и именуе- именуемые углами падения Э и преломления 8пр. Для последних на- находим sine „, ., C7>4) Здесь через п^ обозначен показатель преломления границы вто- второй среды относительно первой. Мы приходим к законам отражения и преломления света. При этом, однако, значение показателя преломления оказы- оказывается связанным с диэлектрическими проницаемостями сред. В частности, если первая среда является вакуумом и ei = 1, то п = Уе2 называется показателем преломления данной среды. Полученное выражение для показателя преломления оправ- оправдывает терминологию, введенную нами в § 31. При рассмотрении явлений отражения и преломления элек- электромагнитных волн, которые были в значительной мере изучены для света еще до установления его электромагнитлой природы, принята оптическая терминология Среда с большим показате- показателем преломления называется оптически более плотной, чем среда с меньшим показателем преломления. Установив направления распространения отраженной и про- проходящей волн, перейдем к расчету их амплитуд. Учитывая ра- равенства C7,1) из граничного условия E,2) для амплитуд отра- отраженной и преломленной волны, получаем Для нахождения двух величин — Лотр и Лпр, необходимо вто- второе уравнение, которым служит граничное условие для магнит- магнитного поля. Мы ограничимся случаем нормального падения в плоскости (xz), который не требует громоздких выкладок. При нормальном падении имеем Ну=- j/
§ 37] ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ НА ГРАНИЦЕ РАЗДЕЛА СРЕД 835 Для отраженной волны имеем аналогично H2 = HU = О, отличается от Ну знаком, поскольку отраженная волна распространяется в противоположном направлении и проекция ЯуТр ориентирована в положительном направлении оси у. Для проходяшей волны ^~к"Рг\ нг = Ну = 0. Условия непрерывности тангенциальных слагающих векто- векторов Е и Н при z = 0 запишутся в виде Выражая величины Лотр и Лпр через Л, находим "— — — ?= A=VJ±~VJl А, C7,5) Формулы C7,5) и C7,6) представляют частный случай (для нормального падения) известных формул Френеля, выведенных им в 1820 г. из общих представлений о свете, как о волновом процессе. Зная амплитуды отраженной и преломленной волн, можно найти средние (за период) значения потока энергии, отражен- отраженного от границы раздела и проходящего во вторую среду. Они даются величинами: [EH] Ал 1 8л /8 ) 4л 8л где о — вектор Пойнтинга падающей волны. 53*
836 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл V Отношение \j = () C7>7) называется коэффициентом отражения, а отношение = 1-/? C7,8) коэффициентом прохождения. Формула C7,7) показывает, что при ег^б! эффект отраже- отражения волны от границы раздела мал. Напротив, при е2 3> е.\ или «1 ^>"е2, т. е. при n12<^ I, R я* 1 и волна практически полностью отражается. Значительное отражение волны от диэлектрика с большой диэлектрической проницаемостью связано с тем, что в таком диэлектрике падающей волной возбуждается большой ток смешения. Благодаря этому возникает экранирование внеш- внешнего электрического поля, и его напряженность оказывается близкой к нулю. В пределе, при е2-*оо, на поверхности раздела вектор электрического поля имеет узел, вектор магнитного по- поля—пучность. Однако при любом конечном значении ег коэф- коэффициент прохождения D при нормальном падении имеет хотя бы и малую, но конечную величину. В случае падения электромагнитной волны под косым углом к плоскости раздела сред выражения для амплитуд (формулы Френеля) несколько усложняются. Однако общая картина не изменяется, за исключением случая ti\2<\, который требует специального рассмотрения. Если на поверхность оптически менее плотной среды падает плоская волна под углом 0, то при достаточно малом значении rti2 равенство C7,4) может иметь место только при мнимом значении угла 8пр. Предельное значение угла падения G, при котором 9пр может иметь еще вещественное значение, опреде- определяется условием -^ = 1. C7,9) «12 Угол Во называется углом полного внутреннего отражения. При этом 0"р = j, т. е. преломленный луч скользит вдоль плоскости раздела сред. При 8 > Go угол Эпр, а следовательно, величина sin 9IIp ока- оказываются мнимыми. В показателе экспоненты проходящей волны
<§ 37] ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ ПЛ ГРАНИЦЕ РАЗДЕЛА СРЕД 837 возникает слагаемое z = i (~^- V^l — sin2eap) z = г— \-1 Это означает, что имеет место затухание волн в оптически менее плотной среде, происходящее по экспоненциальному закону >Vb /sin» 9 , \ ,- , - ? 12 > . C7,10) Эффективная глубина проникновения электромагнитного поля в оптически менее плотную среду порядка б, где б~ , Х C7,11) где X = ( m e2) длина волны, деленная на 2я. Поскольку в рассматриваемом идеальном диэлектрике не ¦существует поглощения, ослабление поля в оптически менее плотной среде может быть связано только с высвечиванием электромагнитных ноли обратно, в первую среду. Непосред- Непосредственное вычисление подтверждает этот вывод. Коэффициент отражения R при 0 >00 оказывается равным единице. Описан- Описанный эффект получил название явления полного внутреннего отражения. Мы не можем в рамках этой книги остановиться на вопросе о возникновении поляризации при определенных условиях отра- отражения неполяризованной волны1). В заключение кратко рассмотрим отражение электромагнит- них волн от поверхности проводников. Электромагнитная волна, падающая на поверхность проводника, индуцирует в нем значи- значительный ток проводимости. Свободные заряды в поле волны интенсивно ее рассеивают. В глубине проводника поле быстро затухает. Поэтому естественно ожидать, что поверхность про- проводника должна обладать значительными отражающими свой- свойствами. Однако часть энергии электромагнитного поля будет диссипироваться в проводнике так, что коэффициент отражения должен иметь значение несколько меньшее единицы. Если фор- формально в формуле для R заменить показатель преломления его ') См., например, Д. Стрэттон, Теория электромагнетизма, Гостех- издат, 1948; Л. Д. Ландау и Е. М. Л и ф ш и ц, Электродинамика сплош- сплошных сред, Гостехиздат, 1957.
838 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V значением, даваемым формулой C3,16), то без труда найдем,, учитывая, что е, == 1 и \^е2 = ]/емет = (п — Ы); п » х > 1: „_ l-n + ix I + n — in Эта формула Гегена и Рубенса хорошо согласуется с опыт- опытными данными для отражений электромагнитных волн, лежа- лежащих в диапазоне радиочастот и частот инфракрасной части спек- спектра, от поверхности металлических проводников. При более вы- высоких частотах соотношения классической макроскопической электродинамики оказываются неприменимыми. Высокое значение коэффициента отражения в оптической области обусловливает характерный металлический блеск. В пре* дельном случае проводника с бесконечно большой проводи- проводимостью коэффициент отражения R — 1. Это означает, что элек- электромагнитное поле высокой частоты вовсе не проникает в глубь проводника с бесконечной проводимостью. Проводник с беско- бесконечно большой проводимостью мы будем называть идеальным проводником. Идеальный проводник в области высокочастотных полей является аналогом проводника в электростатике. Напишем граничные условия для векторов поля на поверх- поверхности идеального проводника. Поскольку внутри идеального проводника отсутствует электрическое и магнитное поле, из E,2) —E,6) следует Eta = 0, Нп = О, I . \на поверхности „_ „ и _ 4л ,• р _ 4яш5 I идеального проводника, \о'>1°) tftg—~ts> ?«-~i~ J где векторы Е и Н относятся к полю в вакууме, is и ws — плот* ности поверхностного тока и заряда соответственно. Таким об- образом, на границе раздела диэлектрик — идеальный проводник вектор электрического поля направлен нормально, а вектор магнитного поля — параллельно поверхности. Хотя в природе не существует идеальных проводников, приближение идеального проводника часто достаточно полно передает характер поведе- поведения электромагнитного поля у поверхности тел с хорошей про- проводимостью. § 38. Волноводы Важную роль в современной радиотехнике играет передача электромагнитной энергии на сравнительно небольшие расстоя- расстояния. Она осуществляется путем возбуждения электромагнитного.
•§ 38] ВОЛНОВОДЫ 839 поля в трубах с металлическими стенками-различной формы и сечения, именуемых волноводами. Мы не можем в рамках этой книги останавливаться на методах возбуждения полей и огра- ограничимся лишь изучением процесса распространения электро- электромагнитных волн в волноводах. Как будет ясно из дальнейшего, распространение электро- электромагнитных волн в волноводах существенно отличается от рас- распространения неограниченных в пространстве плоских электро- электромагнитных волн. Поэтому вопрос о распространении волн в вол- волноводах имеет не только практический, но и принципиальный интерес. Чтобы не усложнять выкладок, мы ограничимся рассмотре- рассмотрением волновода прямоугольного сечения со стенками из идеаль- идеального проводника. Пусть стороны прямоугольника равны а и Ь, причем для определенности будем считать, что а> Ь. Предполо- Предположим, что в волновод (в плоскости г = 0) поступает монохрома- монохроматическая плоская электромагнитная волна. Естественно до- допустить, что векторы поля внутри волновода зависят от вре- времени и координаты вдоль волновода по закону Е, //~е'<"'-***>. C8,1) Подставляя C8,1) в волновые уравнения, находим д*Е , д'Е B «о* \ „ i + )? C8>2) Здесь и ниже Е и Н являются неизвестными функциями коорди- координат х и у, поскольку их зависимость от z и t уже учтена. Связь между векторами Е и Н определяется уравнениями для rot? и rot Я. Подставляя C8,1) в эти уравнения, находим f ^ C8,4) C8,5) дЕу дн'г ikzHx дНу дЕг дЕх ду Oil у дНх с /еш с гею Jo) с F C8,7)
840 поля высокой частоты 1Гя. v Формулы C8,4) — C8,9) позволяют выразить компоненты век- торов Ех, Еу, Нх и Hv через Ег и Нг. Простое вычисление дает А&Ь^ + Ырс^) C8.Ю> — ецег \ дх ду ^АC8,11) ~ 2Ь2 A#Ь ~ + crkk \ ду ^ ^) C8,12> ду дх C8,13> На поверхности волновода должны выполняться граничные условия для идеального проводника (см. § 37). Будем сперва пытаться найти решение уравнений C8,2)— C8,3) в виде поперечных плоских волн, т. е. положим Тогда из формул C8,10) — C8,13) ясно, что компоненты поля равны нулю, если только c2kl — ец<с^=!^0. Если, напротив 2^ 2 , как это имеет место для плоской монохроматической волны в неограниченной среде, распространяющейся со ско- скоростью j/:— , то C8,2) дает д2И(х,у) ( дх1 ^ ду2 и> т. е. магнитное поле удовлетворяет двухмерному уравнению Лапласа, а на всей замкнутой границе области (на сторонах прямоугольник х = 0, а; у •= О, Ь) магнитное поле в силу C7,13) направлено по касательной к границе. В математике показы- показывается1), что единственным решением такой краевой задачи служит Н = 0. Если магнитное поле в волне отсутствует, то, очевидно, равно нулю и электрическое поле. Мы видим, таким образом, что поперечные электромагнит- электромагнитные волны не Moryi распространяться в прямоугольном волно- волноводе с идеально проводящими стенками. Следует подчеркнуть, что этот вывод не связан с формой волновода, но относится к любым волноводам, выполненным в виде простой трубы лю- любого сечения. Именно, он означает, что в трубе с идеально про- проводящими стенками не могут распространяться поперечные ') См., например, В. И. Смирнов, Курс высшей маге&шики, г. IV, Гоотехиздат, 1951,
§ 38] ВОЛНОВОДЫ 841 волны. В том случае, когда границы области незамкнуты, напри- например в случае щели между двумя бесконечными идеально прово- проводящими плоскостями, или в случае многосвязного пространства, например в волноводе, образованном двумя концентрическими цилиндрами, наш вывод более не применим. В таких системах возможно, в принципе, распространение поперечных электромаг- электромагнитных волн. Смысл этого результата очень прост. В поперечной волне в волноводе линии магнитного поля должны быть направлены по касательной к стенкам и иметь характер замкнутых кривых. При этом линии поля не входят в идеальный проводник и не охватывают трубки тока проводимости. Продольная компонента тока смещения отсутствует, так что подобные линии магнитного поля не охватывают также и трубок тока смещения. Однако из общих соображений ясно, что линии магнитного поля, которые не охватывали бы никаких трубок с током, существовать не могут. Это наглядное рассуждение позволяет также понять, почему в незамкнутом волноводе, выполненном в виде концентрических труб, возможно существование поперечных волн. В неограни- неограниченном пространстве линии магнитного поля могут быть не- незамкнутыми и уходить на бесконечность. В многосвязном волноводе они могут охватывать трубки с током, текущим по поверхности внутреннего цилиндра. В обоих случаях возможно существование магнитного и электрического полей, бегущих вдоль волновода в виде поперечных волн. Оказывается, однако, что отсутствие в волноводе поперечных волн не означает еще невозможности распространения в нем электромагнитного поля. Как будет сейчас показано, в волноводе возможно образова* ние продольных волн, которые не могут существовать в неогра- неограниченном пространстве. Под продольными волнами мы понимаем такие волны, ко- которые имеют отличную от нуля компоненту поля в направлении распространения волны. Из формул C8,10) —C8,13) ясно, что следует рассмотреть две независимые возможности: 1) Е2?=0, Яг = 0, 2) Hz^0, E2 = 0. В первом случае магнитное поле в волне имеет две компо- компоненты— Нх и Hv и является чисто поперечным. Такие волны называют обычно волнами — ТМ (от англ. transverse magnetic) или поперечно-магнитного типа. Электрическое поле имеет про- продольную и две поперечных компоненты.
842 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл V Во втором случае электрическое поле волны имеет попереч- поперечный характер и волна называется соответственно — ТЕ (от англ. transverse electric) или поперечно-электрического типа. В случае волн ГМ-типа на основании C8,2) имеем Ez = 0 при x = 0, a; y = 0, b, C8,15) в силу C7,13). Ниже мы покажем, что достаточно удовлетво- удовлетворить только этим граничным условиям. Чтобы удовлетворить уравнению C8,14) и граничным условиям C8,15), для Ez нужна написать Ег = A sin (kxx) sin (kyy) el ("""V), C8,16) где kl + kl + kl=^ C8,17) и, кроме того, kx = —; ky = ~, C8,18) a m и n — целые числа, не равные нулю. Найденное решение имеет вид волн, бегущих в положитель- положительном направлении оси г и стоячих в плоскостях z — const. Поперечно-магнитную волну, отвечающую числам тип, обозначают обычно ТМтп. Если величина Ег известна, то из C8,10) — C8,13) легко найти остальные компоненты поля. Мы не будем выписывать соответствующих формул, а ограничимся лишь указанием на следующее обстоятельство: нетрудно сообра- сообразить, что граничные условия для всех компонент электрического и магнитного полей выполнены автоматически. Например, на грани у = 0 нормальная слагающая магнитного поля = 0; аналогично Eig = Ех = Ez = 0. Поэтому, как мы указывали уже ранее, достаточно удовлетво- удовлетворить граничным условиям C8,15). Таким образом, у стенок вол- волновода линии магнитного поля тангенциальны к поверхности. Они образуют замкнутые кривые, охватывающие продольные линии электрического поля. Обсудим несколько подробнее формулу C8,17). Перепишем ее в виде
§ зя] волноводы 843 При заданном значении man величина kt имеет вещественное значение только при где ©"„•„" — некоторая критическая частота и XKpHT — соответ- соответствующая ей длина волны. Если kz оказывается мнимым, что отвечает (о<юкрит, то вме- вместо волны, бегущей вдоль оси г, мы приходим к эксноненциаль* но затухающему выражению для Е2 и соответственно остальных компонент поля. Таким образом, через волновод могут прохо* дить только волны с сй>ю™-и" или А,<Лкрит. Наибольшее значение длины проходящей волны Я"а*? полу- получается для волны ТМп (пг == 1 и я = 1), являющейся волной ТМ-типа наинизшего порядка. Именно при этом г 2аЬ Фазовая скорость 7Мтп-волны равна, очевидно, v*y V с V 5,2 1/ ' ,2 Крит V крит C8,21) Поскольку всегда X < Якрит> фазовая скорость волн в волноводе все! да больше фазовой скорости света в среде — v и при X —*Х,црит неограниченно возрастает. В частности, если внутрь волновода не введен диэлектрик (т. е. е = ц =» 1), 1>фаз всегда больше скорости света в пустоте с. Групповая скорость может быть легко найдена из формулы C8,17): d(u " - ' ¦ Л" C8,22) Групповая скорость всегда меньше скорости ь = —Л= и стре« У ец мится к нулю при приближении X к Якрит. Из C8,21) и C8,22) ясно, что уфаз и »„, удовлетворяют об- общему соотношению: Г)фаз • ип> = f2. Рассмотрим теперь волны поперечно-электрического (ТЕ)* типа. Для таких волн имеем Г» C8,23)
844 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V Граничные условия для тангенциальной слагающей электриче- электрического поля с помощью C8,10) и C8,11) можно выразить через производные от Нг. Тогда вместо Ех = 0 при у = 0, Ъ имеем условие Д^=0 при (/ = 0, Ъ. C8,24) Аналогично вместо Еу = 0 при х = 0, а имеем 4^=0 при * = 0, а. C8,25) Решение уравнения C8,23) при граничных условиях C8,24) и C8,25) можно написать в виде волны 7?-типа: Нг = В cos {kxx) cos (kyy) el (ш~к^, C8,26) где Здесь т и п — целые числа; в отличие от волн Г/И-типа каждое из этих чисел (но не оба одновременно) может принимать зна- значение нуль. Формулы C8,19) — C8,22) остаются в силе для волн Г?-типа. В них, однако, одно из чисел тип можно полагать равными нулю. Г?"-типа волной наинизшего порядка является волна ТЕ\о. Для волны 7?10 критическая длина волны будет Лкрит — ^U. Важнейщим общим выводом, который может быть сделан из изложенной теории, является то, что поперечный характер плоских волн тесно связан с неограниченными размерами среды, в которой происходит их распространение. При распространении волн в ограниченной области чисто поперечные волны могут существовать лишь в особых условиях (многосвязная область). В обычных условиях волны имеют продольную слагающую элек- электрического или магнитного полей. Напомним, что и в неограни- неограниченном пространстве, но вблизи излучателя, электромагнитная волна имеет отличную от нуля продольную (радиальную) ком- компоненту полей Ег и Нт (ср. §§ 25, 26 ч. I). В приведенном выше расчете волновода простейшей формы мы не учитывали эффектов, играющих на практике важную роль. Сюда относятся прежде всего потери мощности, связанные с неидеальным характером стенок волновода и заполняющего сго> диэлектрика. Мы также не рассматривали и теорию волноводов
I 39] ПРОХОЖДЕНИЕ БЫСТРЫХ ЧЛСТИЦ ЧЕРЕЗ ВЕЩЕСТВО 845 более сложной формы, а также волноводов, неоднородных по длине. Наконец, мы не касались многочисленных проблем, связан- связанных с разнообразными применениями волноводов, в том числе к линейным ускорителям заряженных частиц. Со всеми этими вопросами мы отсылаем читателя к обширной специальной ли- литературе '). § 39. Прохождение быстрых частиц через вещество Вопрос о потерях энергии и излучении быстрых частиц, дви- движущихся в веществе, имеет большое значение в различных областях современной физики. Как мы увидим ниже, существует несколько различных ме- механизмов потери энергии частиц, движущихся в веществе. Прежде всего следует напомнить, что, как мы видели в § 43 ч. I и § 26 ч. II, частицы, испытывающие соударения с ато- атомами и отклоняющиеся полем ядер, испускают тормозное излу- излучение. Тормозное излучение ультрарелятивистских частиц, со- согласно B6,15) ч. II, обратно пропорционально массе частицы и играет основную роль для легких частиц (электронов). При прохождении через вещество тяжелых заряженных частиц (про- (протонов, ионов) большую роль играют обычно другие источники потерь энергии. Заряженная частица, движущаяся в веществе, взаимодействует с атомами вещества и поляризует их. Иными словами, движущаяся частица создает некоторое поле в веще- веществе. Это поле, с одной стороны, само действует на частицу и тормозит ее. Потеря энергии частицы, связанная с этим тор- торможением, равна, очевидно, работе тормозящей силы. Этот вид потери энергии называется поляризационным, поскольку тормо- тормозящее иоле является полем поляризации, создаваемым движу- движущейся частицей. С другой стороны, среда, поляризованная ча- частицей, может излучать поперечные электромагнитные волны. Для этого необходимо, чтобы поляризация, вызываемая в среде пролетающей частицей, не успевала следовать за частицей. При этом пролетевшая частица оставляет среду в поляризованном состоянии и среда излучает избыток энергии в виде поперечных электромагнитных волн. Этот источник потерь энергии назы- называется излучением Черенкова — Вавилова или. кратко, череп- черепковским излучением. Подчеркнем еще раз, что излучение Черепкова — Вавилова не связано с какими-либо ускорениями, поскольку это — излу- излучение среды, а не движущегося заряда. С другой стороны, как ') См., например, Л. А. В айн штейн, Электромагнитные волны, Cod. радио, 1957; С. Рамо и Д. У и и и е р и, Поля и волны в современной радио- радиотехнике, Гостехиздат, 1948.
846 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V будет показано в дальнейшем, черепковское излучение возмож- возможно не всегда, а только при движении частицы со скоростью v, большей скорости распространения поля в среде с/п. Это огра- ограничение выражает упомянутое условие отставания поля поля- поляризации от пролетающей частицы. Мы перейдем к одновремен- одновременному вычислению поляризационных и черепковских потерь одной частицы в макроскопически однородной и изотропной среде. Нашей целью является нахождение поля, создаваемого в среде одиночным зарядом, движущимся со скоростью v. Мы будем пренебрегать уменьшением скорости в процессе движения и считать ее постоянной по величине и направлению. Среду мы будем считать прозрачной, так что мнимая часть ди- диэлектрической проницаемости е°—»0. Магнитную проницаемость ц примем равной единице. Плотность тока в среде, отвечающую равномерному движе- движению одной частицы, можно записать в виде J=evb(r-vt). C9,1) Поэтому уравнения Максвелла будут иметь вид rot?=--i-^, C9,2) vt). C9,3) Ниже мы обсудим, при каких условиях среду можно считать сплошной, пренебрегать ее атомной структурой и описывать макроскопическими величинами. Будем пытаться искать решение уравнения Максвелла путем разложения в интеграл Фурье. Написав для векторов поля фор- формулы C3,1) — C3,4), а для вектора / выражение JC> t] ~ W Jei {kr~at)J {k' a) dk d@> C9>4) мы переписываем систему уравнений C9,2), C9,3) в виде i\kE{к, ©)] = «уД(к, со), C9,5) i [кВ (к, со)] = - i у D (к, ©) + ^ У (к, ©). C9,6) Умножая C9,5) векторгто на k, исключая затем из C9,6) [kB] и пользуясь уравнением связи C3,4), приходим к уравнению , C9,7) которое отличается от C3,15) только наличием правой части. Величина jt в C9,7) означает фурье-компоненту плотности тока
§ 39] ПРОХОЖДЕНИЕ БЫСТРЫХ ЧАСТИЦ ЧЕРЕЗ ВЕЩЕСТВО 847 j(k, со). В изотропной среде для e,-j подставляем ее значение по формуле C3,9)- Тогда находим или, в векторном виде, Умножая C9,8) скалярно на вектор k, получаем bE=-i-^(kj). C9,9) Подставляя C9,9) в C9,8), находим откуда f (ft, /(fe, a)) ft , к {к, J{k, ca))-feV(A, со) l jji- I I —-г C9,Ю> Переходя от компоненты Фурье к электрическому полю, имеем E(r, /) = -^L-]*?(*, ©)e'(*'-^>dkd«> = El(r,t) + E2(r, t). C9,11) Первое слагаемое Ex{r, t) имеет вид Р ,¦ 4л Г dkdm (kj)k Подставим теперь значение j(k, ю), воспользовавшись форму- формулой (III, 8). Имеем, очевидно, , o>) = 2nevb{(i>-kv). C9,13) Тогда Ei приобретает вид
348 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V где е,, (k, kv) —значение ея (k, со) при со == ко. Поле Е\, созда- создаваемое пролетающей заряженной частицей в среде, оказывает на нее обратное влияние. На частицу действует сила где индекс показывает, что значение поля в каждый момент времени нужно брать в точке г — vt, в которой находится ча- частица. Интересующая нас потеря энергии частицы (мы будем относить ее к единице пути в вещества) равна работе этой силы на единице пути. Поскольку магнитная часть лоренцевой силы — [vff] не производит работы, работа силы F на единице пути равна Г kv ( /е2 Г dk ilkr_kvt) e, (ft, Значок Re поставлен для того, чтобы напомнить о веществен- вещественности выражения для работы —¦—-. Эта работа имеет ясный физический смысл. Она представляется значением 8ц и пред- представляет работу над частицей, производимую созданной ею продольной поляризацией. 1аким образом, —г-*- есть мера по- потери энергии частицы &Е\ на пути 1 см. Эта энергия идет на образование продольной поляризации. Несколько ниже, при вы- вычислении C9,15), мы обсудим еще вопрос о том, какие про- процессы фактически происходят в среде, когда пролетающая ча- частица создает в ней продольную поляризацию. Обратимся теперь ко второму слагаемому в C9,11). Соглас- Согласно формулам C9,13) и C9,10) имеем J Г
. 39] ПРОХОЖДЕНИЕ БЫСТРЫХ ЧАСТИЦ ЧЕРЕЗ ВЕЩЕСТВО 849 Соответственно, работа поля ?2. совершаемая над частицей, и потеря энергии частицы АЕ2, отнесенные к единице пути, равны dr - Д?,= Re = Re "^ I pi {kr-kvt) 2л2ис2 J dk- i kv) ie* С 2л2ос2 J dkda ¦(-*) fe2--^-! ь, ») - б (со - kv) . C9,17) Потеря энергии А?г определяет черепковские потери частицы. Они связаны с возбуждением в среде поперечного электромаг- электромагнитного поля, т. е. с излучением поляризуемой среды. Учет пространственной дисперсии позволил нам очень четко разделить оба типа потерь: поляризационные и черенковские. В дальнейшем мы ограничимся расчетом потерь в среде без про- пространственной дисперсии1), для чего, согласно C3,11), в полу- полученных формулах следует положить ец(Л, o) = ei(A, со) = е (со) |и= kv' C9,18) Перейдем к вычислению интегралов в формулах C9,15) и C9,17). Имеем, с учетом C9,18), C9,19) Мы указывали уже выше, что все наше рассмотрение будет относиться к прозрачным средам, точнее, к средам с исчезающе малым поглощением. Это значит, что в выражении для диэлек- диэлектрической проницаемости е(ы) = er(co) + ie'(co) следует перейти к пределу е*(со)->0. Это позволяет существенно упростить все дальнейшие выкладки. Именно, мы можем написать Re 8 (Си) = Re 8Г (со) + /е' (еТ Переходя к пределу ег->-+0, мы можем воспользоваться фор- формулой (III, 4') и написать Re =дб [е C9-20) ') Потери с учетом пространственной дисперсии см., например, В. П. С и- л и н, А. А. Р у х а д з е, Электромагнитные свойства плазмы и плазмоподоб- ных сред, Атомиздат, 1961; Ш а ф р а н о в, Электромагнитные волны в плазме, сб. Вопросы физики плазмы, т. II, Москва, 1963. 54 В. Г. Левич, том I
850 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл. V При этом формула для поляризационных потерь приобретает вид где мы воспользовались тем, что вклад в потери дает только частота а> = kv. Если явный вид е(со) известен, то интеграл C9,21) может быть вычислен без труда. В § 46 такое вычисле- вычисление будет проделано для случая плазмы. Заметим, что в формулу C9,21) не входит масса частицы. Это вполне естественно, поскольку потери энергии связаны с поляризацией среды. Поляризационные потери поэтому яв- являются основным источником энергетических потерь тяжелых частиц, движущихся в веществе в широком интервале энергий. Легкие частицы, например электроны сравнительно высоких энергий, теряют основную часть энергии на тормозное излучение. Перейдем теперь к вычислению черепковских потерь. Это вычисление может быть проведено с использованием того же самого приема. Имеем dk Д?,= - Re k2 ft2 - , e (a) C9,22) Выберем направление движения частицы за ось z и введем но- новые неременные @ = kV = kzV, Тогда du> dk = dkx dky dkz = qdqdqi — . В новых переменных имеем qdq со da> -оо О qldq В непоглощающей среде аналогично C9,20) можно написать lim Re
§ 39] ПРОХОЖДЕНИЕ БЫСТРЫХ ЧАСТИЦ ЧЕРЕЗ ВЕЩЕСТВО 851 откуда j3 О Я +~^2 Вводя новую переменную и = q2, имеем ОО 1 Г udu . Г и2 ю2е (ю)  2\ о2е (ш)/' V О, v< Ve, (ш)' Поэтому окончательно мы приходим к следующему выражению для потерь энергии на поперечное электромагнитное излучение Черенкова — Вавилова, отнесенных к единице пути в веществе: C9,23) О (см. поскольку е(ш)—четная функция своего аргумента C2,П)). Таким образом, мы можем указать следующие основные осо- особенности излучения Черенкова — Вавилова: 1) оно возникает только для частиц, движущихся со ско- скоростью, большей опор = — (порог излучения); 2) оно зависит от заряда частиц, но не от их массы; 3) излучение целиком приходится на видимую и отчасти ультрафиолетовую области спектра. Для более коротких волн п<1 (ср. § 34) и излучение более невозможно; 4) излучаемая на единицу пути энергия в единичном интер- интервале частот имеет характерное спектральное распределение C9,10); 5) излучение, возникающее в данной точке траектории, рас- распространяется по поверхности конуса с вершиной в точке и осью, совпадающей с направлением полета частицы. Угол рас- раствора конуса 0 определяется условием v cos 9 = ^-. C9,24) В заключение подчеркнем, что потери энергии на излучение Черенкова — Вавилова весьма невелики и составляют всего около 0,1% потерь весьма быстрых частиц в веществе. Последние 54*
852 ПОЛЯ ВЫСОКОЙ ЧАСТОТЫ [Гл V определяются тормозным излучением и рядом других явле- явлений. Важность черепковского излучения заключается в том, что его использование положено в основу новых детекторов бы* стрых частиц. Эти детекторы, получившие наименование череп- черепковских счетчиков, стали в настоящее время одним из главных рабочих инструментов в области физики частиц высоких энер- энергий Наблюдая излучение Черенкова, можно не только зареги- зарегистрировать прохождение частиц, но согласно C9,24) непосред- непосредственно определить величину и направление их скорости; согласно C9,23) определить их заряд; разделить между собой частицы с равным импульсом и разной массой (воспользовав- Рпор \ шись существованием порога vmp = —^—j и т. д. В заключение обсудим вопрос о границах применимости макроскопического рассмотрения. Фактически быстрые частицы взаимодействуют с отдельными атомами или, точнее, атомными электронами. Для макроскопического описания процесса про- пролета необходимо, чтобы за время пролета частицы мимо атома внутриатомные электроны не успели испытать заметное смеще- смещение При этом пролетающая частица двигается в квазистацио- квазистационарном поле многих атомов. Таким образом, скорость частицы должна быть велика по сравнению с характерной скоростью атомных электронов. Интересным источником потерь энергии равномерно движу- движущейся частицы на излучение является так называемое переход- переходное излучение. Оно возникает при переходе частицы из одной среды в другую. Для упрощения формул будем считать, что частица, равномерно двигаясь в вакууме со скоростью v ~ с, падает на границу среды с диэлектрической проницаемостью е(ш). Границу среды мы считаем плоскостью z = 0, а падение частицы — нормальным к границе. Момент падения частицы на границу выберем за время t=0. Найдем вектор-потенциал поля частицы по формуле C2,10) ч. I. Имеем, очевидно, для компоненты Фурье Лш на большом расстоянии от заряда е'кГ J v(t)e'[k'w-<*idt = — оо !0 оо f eit(kvVi-<u) at 4- Г J J -оо О J О А
§ 39] ПРОХОЖДЕНИЕ БЫСТРЫХ ЧАСТИЦ ЧЕРЕЗ ВЕЩЕСТВО 853 Пользуясь определением б+- и 6--функций (см. Приложение III), находим 6- б+ ) ( 2пст t i „i/^cose {a cose с Излучаемая интенсивность по формуле C2,14) ч. I равна ГГ sin2 6 dii. C9,26) Смысл полученного результата весьма прост; при движении в среде роль относительной скорости — играет величина -—- с с определяющая оптический путь в веществе. При переходе из одной среды в другую (или в вакуум) скорость остается по- v V^ стоянной, но скачком изменяется величина . Это изменение С эквивалентно внезапному изменению скорости, т. е. ускорению частицы. Формулы C9,25) и C9,26) показывают, что излучение направлено главным образом вперед F да 0) и содержит весьма высокие частоты (высокие гармоники). Мы не останавливаемся на вычислении полной интенсивности, которую можно вычис- вычислить, интегрируя по всем углам. Заметим лишь, что полная интенсивность оказывается при этом пропорциональной энергии частицы. Аналогичное вычисление при у «С с оказывается более сложным, поскольку при этом необходимо учитывать явления отражения и преломления излучаемых электромагнитных волн, на границе раздела.
ГЛАВА VI ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ § 40. Общая характеристика плазмы Большой интерес для современной физики представляет во- вопрос о прохождении тока через газы и поведение газов, прово- проводящих ток, в электрических и магнитных полях. Как известно, газы являются непроводниками тока. Если, однако, в газе создана достаточно большая ионизация, т. е. образовано достаточно много свободных электронов и ионов (положительных и отрицательных), газ становится проводником. Процесс прохождения тока через газ именуется разрядом. В за- зависимости от механизма, вызывающего ионизацию газа, газовый разряд именуют несамостоятельным или самостоятельным. В первом случае основную ионизацию создают внешние источники (например, ^-излучение или высокая температура, поддерживаемая внешними источниками). При самостоятельном разряде первоначальная ионизация вызывается электронами, вылетающими из холодного катода (таунсендовский и тлеющий разряд). Величина плотности тока, могущего протекать через газ, за- зависит, в первую очередь, от числа ионов, образованных в 1 см3 газа. В частности, если весь газ является полностью ионизован- ионизованным, плотности тока могут быть очень велики. Самостоятельный газовый разряд обнаруживает большее разнообразие свойств. Однако он обладает замечательной осо- особенностью: пространство, в котором происходит газовый разряд, можно разбить на три области — приэлектродиые области (ка- (катодную и анодную) и область плазмы. Свойства приэлектродных областей зависят от механизма разряда. В катодной области происходит ионизация атомов газа электронами, вылетающими с катода. В приэлектродных обла- областях сосредоточен объемный заряд и происходит основное па- падение приложенной к электродам разности потенциалов. Раз- Размеры приэлектродных областей, как правило, невелики и они занимают лишь малую часть пространства между электродами.
? 411 РАВНОВЕСНАЯ ПЛАЗМА ggg. Основную долю межэлектродного пространства заполняет иони- ионизованный газ, являющийся в среднем электронейтралышм. Эта область разряда получила название плазмы. В плазме число положительных ионов в среднем равно числу электронов и отри- отрицательных ионов в единице объема. Наряду с ионами и элек- электронами в плазме может содержаться также большее или мень- меньшее количество неионизованных атомов или молекул. Свойства плазмы, которыми мы будем интересоваться в дальнейшем, не зависят от конкретных свойств разряда и его характера. Поведение плазмы играет важную роль в явлениях газового разряда, который находит широкое приложение в со- современной технике. Особый интерес к высокотемпературной плазме возник в последние годы в связи с работами по управ- управляемым термоядерным реакциям, а также, в связи с рядом астрофизических проблем. Как известно, для получения термоядерных реакций необхо- необходимо достигнуть таких высоких температур (выше 108 граду- градусов), при которых энергия теплового движения ядерных частиц оказывается достаточной для преодоления энергетических барье- барьеров, препятствующих проникновению ядер друг в друга. При таких температурах атомы являются нацело ионизованными и вещество представляет предельно ионизованную плазму. Тре- Требующиеся для протекания термоядерных реакций температуры имеются во внутренних областях звезд. В лабораторных условиях до настоящего времени не уда- удалось еще реализовать плазму необходимой температуры. Одна- Однако проводятся интенсивные исследования высокотемпературной плазмы, давшие уже ряд существенных результатов. В астрофизических условиях вещество находится в состоя- состоянии плазмы не только во внутренних областях звезд, но также в звездных атмосферах и в облаках межзвездной материи. § 41. Равновесная плазма Изучение свойств плазмы мы начнем, естественно, с рас- рассмотрения теории равновесной плазмы. Мы будем для простоты предполагать, что плазма содержит заряды только двух сортов: положительные ионы с зарядностью /?! и электроны. Для общности получаемых соотношений мы будем последние также именовать ионами и приписывать им зарядность рг = —1. Тогда условие электроиейтралыюсти плаз- плазмы можно записать в виде 0, D1,1) где fi\ и «2 — средние числа соответственно ионов и электро- электронов в единице объема.
856 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. Vt При рассмотрении равновесных свойств плазмы мы ограни- ограничимся приближением идеального газа. В этом приближении кулоновское взаимодействие между заряженными частицами можно считать малым по сравнению с тепловой энергией: ft7\ D1,2) ?l«ft7\ где I — среднее расстояние между ионами. Последнее связано с числом ионов в единице объема (концентрацией плазмы) jV соотношением так что условие идеальности газовой плазмы можно представить в виде Концентрация плазмы /V связана с числами rai и «2 соотноше- соотношением Л/ = п, + й2. D1,5) Если неравенство D1,4) выполнено, то плазму в нулевом приближении можно рассматривать как обычный газ, характе- характеризуемый температурой Т. Частицы плазмы будут обладать максвелловским распреде- распределением по скоростям и равномерным распределением в про- пространстве. Кулоновское взаимодействие между заряженными частицами приводит к появлению в объеме некоторого среднего электрического поля, характеризуемого потенциалом ф. В на- нашем приближении изменение свойств газа, вызванное этим по- полем, можно считать малым. Для нахождения величины ф можно применить следующие рассуждения. Мысленно выделим в плазме некоторый произ- произвольный ион, находящийся в точке О, выбранной за начало координат, и найдем полный средний потенциал электрического поля ф в окрестности точки О. Потенциал ф создается всеми ионами (включая и ион, находящийся в точке О). Усреднение проводится по всему времени наблюдения, в течение которого ионы побывают во всевозможных положениях в плазме. Рассмотрим некоторый элемент объема dV, находящийся на расстоянии г от начала координат О. Пусть потенциал электри- электрического поля в этом объеме равен q>(r). Ввиду изотропии поля, потенциал ф зависит только от абсолютной величины г, но не от направления радиуса-вектора. При малой концентрации плаз- плазмы к ионам, находящимся в поле, можно применить закон рас*
§ 41] РАВНОВЕСНАЯ ПЛАЗМА 857 пределения Больцмана, написав для числа частиц в объеме dV выражения: n2dV = Be~^~dV, D1,7) где п\ и «г — числа положительных и отрицательных ионов в единице объема Постоянные А и В могут быть найдены следующим образом. При как угодно высокой температуре 7—*оо поле, создаваемое ионами в плазме, не может влиять на их пространственное рас- распределение, так как их потенциальная энергия будет пренебре- пренебрежимо малой. Поэтому при Г-»оо оба распределения должны переходить в равномерное распределение частиц в простран- пространстве, т. е. nxdV = hxdV, D1,8) n2dV = n2dV, D1,9) где ni и «2 — средние числа положительных и отрицательных ионов в 1 см3. Сравнивая D1,8) и D1,9) с D1,6) и D1,7), находим nxdV = hxe kT dV, D1,10) n2dV¦ = n2e~~^rdV'. D1,11) Согласно формулам D1,10) и D1,11) в объеме вблизи точ- точки О, в которой находится выделенный нами ион, имеется заряд kr п2р2ее кТ ) dV. D1,12) Этот заряд обусловлен тем, что вероятность нахождения в dV иона того же знака, что и ион в точке О, несколько понижена, а иона противоположного знака — несколько повышена по срав- сравнению с той же вероятностью без учета межионного взаимодей- взаимодействия. В этом смысле говорят, что вокруг иона О возникает не- неравномерно заряженное ионное облако. Само собой разумеется, что фактически никакого облака вокруг каждого из ионов не существует, так как выделение иона в точке О было сделано только для удобства рассуждений, и никаких выделенных ионов в плазме не существует. Имеется лишь некоторая вероятностная корреляция (соответствие) ме- между расположением любой пары ионов в пространстве. То же самое можно выразить другими словами: можно скачать, что каждый ион создает вокруг себя ионное облако и вместе с тем
858 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. VI входит в состав ионных облаков, создаваемых всеми другими ионами в плазме. С помощью D1,12) можно получить среднюю плотность за- заряда в точке г: / Р|Сф Р*еф\ P(r) = -^ = eWie kT + W~ kT I- D1,13) Заметим, что уравнение D1,13) является несамосогласованным. Его следовало бы записать в виде Р,е<р Дф = — \u[Pie кт + n2e Поскольку е^Фе®, переход к D1,13) может быть сделан только в предположении, что энергия межионного взаимодействия мала Ф Ф по сравнению с kT, экспоненциальные выражениям кТ и е кТ можно разложить в ряд, написав «(г). D1,14) Средний потенциал поля ф в данной точке плазмы связан со средней плотностью заряда р в этой точке уравнением электро- электростатики Дф= . D1,15) Поэтому для ф мы находим уравнение Дф = %2ф, D1,16) где через х2 обозначена существенно положительная величина УГ = — Уравнение D1,16) или уравнение D1,15), в котором р опре- определено по D1,13), носит название уравнения Пуассона — Больц- мана и является основой теории равновесной плазмы. Решение уравнения D1,16), удовлетворяющее требованию изотропии пространства, может быть легко получено в полярных координатах. В полярных координатах, учитывая, что ф не за- зависит от полярных углов 0 и гр, уравнение D1,6) имеет вид *2 Вводя новую неизвестную функцию f—гф, получаем -^ Рр,шение последнего уравнения имеет вид / = С^е
§ 41] РАВНОВЕСНАЯ ПЛАЗМА 859 откуда следует, что р—Лт рУ.г <p = Ci— t-C2—— . D1,18) Постоянная Сг = 0, так как экспоненциально возрастающее ре- решение, приводящее к бесконечно большому потенциалу при г-юо, должно'быть отброшено. Поэтому Постоянная Ci может быть найдена из требования, чтобы вблизи условно выделенного заряда потенциал поля совпадал с кулоновским полем заряда. Отсюда следует, что так что и окончательно Ф = ^^. D1,19) Формула D1,19) показывает, что потенциал поля вблизи иона убывает, в основном, по экспоненциальному закону. На расстоянии г >— от иона потенциал оказывается малым. Вели- чина —, характеризующая быстроту уменьшения потенциала, получила название дебассекого радиуса. Для выяснения смысла полученного решения разложим по- потенциал на кулоновский потенциал выделенного иона и потен* циал поля, создаваемого всеми остальными нонами ф': ^ D1,20) Из D1,19) находим ^-Ef?~Zl- D1,21) Найдем плотность заряда, отвечающую потенциалу ф'. В силу D1,15) имеем о = —г- Аф = ~ г Аф = а 4л т 4л Последняя формула показывает, что вблизи иона с зарядом/?i<? образуется ионное облако, имеющее противоположный знак за- заряда. Плотность заряда в облаке экспоненциально убывает с
860 вещество в состоянии плазмы [Гл. vi расстоянием от центрального иона. Полный заряд облака равен p'dV =-/>!«. о Смысл этого результата совершенно ясен: вокруг данного иона с большей вероятностью группируются ионы противопо- противоположного знака. Полный заряд облака ионов, окружающих лю- любой заданный ион, в точности равен заряду данного иона. На- Наличие вокруг иона облака ионов противоположного знака приводит к ослаблению или, как говорят, экранированию поля иона. Поэтому потенциал экранированного ноля вблизи ионя убывает быстрее, чем кулоновский потенциал. Величина 1/х пред- представляет средний радиус ионного облака заданного иона. Вводя в условие применимости теории D1,4) величину де- баевского радиуса y,~e2N[kTy можно переписать его в виде Ях^>1, т. е. в виде требования: среднее число ионов, находя- находящихся в объеме сферы с дебаеиским радиусом, должно быть до- достаточно велико по сравнению с единицей. Тот же результат гораздо убедительней может быть полу- получен с помощью метода коррелятивных функций. Именно, вос- воспользуемся малостью концентрации плазмы, чтобы замкнуть уравнение D2,12) для бинарной функции. Последнее содержит тернарную функцию. При малых концентрациях приближенно ). D1,22) где ф[2 «С 1. Формула D1,22) означает, что взаимодействие ча- частиц в плазме приводит к слабой корреляции. Если пренебречь вероятностью тройных соударений частиц в плазме, то тернар- тернарную функцию pi2j можно представить произведением Pi2/ = Pia • Рг/' Pi/ ^ I + $12 + 'Фгу + bj- D1,23) Подставляя это в D8,12) ч. III, находим Напомним, что по индексу / производится суммирование по всем (в нашем случае — двум) сортам частиц. Очевидно, что три интеграла в правой части обратятся в нуль
§ 41] РАВНОВЕСНАЯ ПЛАЗМА 861 Действительно, они содержат интегрирование по углам вектора ¦д^-, где и — изотропная функция соответствующих переменных. Поэтому окончательно <?Ф,2 1 d«i2 N Возьмем дивергенцию от уравнения D1,25) по координатам г и учтем, что взаимодействие является кулоновским, так что div-^=AM|2(|fi-r2|)= - Тогда находим Полагая ty\2=PiP2ty(r), ty2j=p2p]ty(r), находим окончательно Л^-к^ = ^6(г), D1,26) что совпадает с уравнением для средней плотности или потен- потенциала D1,16). Член с б-функцией позволяет автоматически учесть граничное условие D1,19). Нетрудно видеть, что коррелятивная функция, удовлетво- удовлетворяющая D1,26), имеет вид 4=12= Найдем теперь термодинамические характеристики равно- равновесной плазмы. Наличие кулоновского взаимодействия между ионами и электронами ответственно за дополнительную энер- энергию, которую имеет плазма по сравнению с нейтральным га- газом при том же давлении. Эта энергия равна, очевидно, Е' = -s- I.etitPi%, где /г,- ¦— среднее число частиц i-ro сорта в еди- единице объема, V—полный объем плазмы и ф, — средний потен- потенциал, создаваемый всеми ионами в месте нахождения г'-го иона. Среднее значение потенциала электрического поля при рас- расстояниях г < к (для таких расстояний выведенные выше фор- формулы имеют количественный смысл) можно написать в виде откуда
862 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. VI Полная энергия плазмы равна, следовательно, Е = 2л?У kT - Пользуясь формулой Гиббса — Гельмгольца, находим свобод- свободную энергию плазмы Давление плазмы равно Давление в плазме оказывается ниже, чем давление идеального газа той же плотности. Этот результат имеет простой смысл: притяжение между разноименными зарядами, которые распо- располагаются ближе друг к другу, оказывается преобладающим над отталкиванием одноименных зарядов. В заключение подчеркнем, что, хотя плазма является макро- макроскопически однородной средой, в масштабе г<1/х она неодно- неоднородна. Это обстоятельство имеет весьма важное значение для электромагнитных процессов в плазме. Явление экранировки имеет очень большое значение для поведения плазмы. Совершенно очевидно, что всякий заряд, введенный в плазму, экранируется на расстоянии 1/х. Пусть, например, плазма находится в сосуде, ограниченном твердой стенкой. Если на стенке имеется поверхностный заряд, то создаваемое им поле будет экранироваться и проникать в плазму лишь на глубину 1/и. Расстояние 1/х является, таким образом, толщиной того защитного слоя, который образуется па границе равновесной плазмы и изолирует ее от внешних влияний. До сих пор мы считали плазму полностью равновесной. Очень часто приходится, однако, изучать плазму, находящуюся в неполном равновесии1). Именно, поскольку масса тяжелых ионов весьма велика по сравнению с массой электронов, обмен энергиями между ними при упругих столкновениях происходит весьма медленно. Напротив, обмен энергией электронов или ионов между собой идет существенно быстрее. Если в некоторый начальный момент плазма находилась в неравновесном состоянии, то по прошествии времени релакса- релаксации т установится равновесное (максвелловское) распределение у электронов и у ионов порознь. Каждую совокупность частиц можно характеризовать своей температурой, Те и Т\ соответст- соответственно. Однако выравнивание температур и установление общей ') Ср. § 79 ч. III. Более подробно о неполных равновесиях см., напри- например, В. Г, Левич, Введение в статистическую физику, Гостехиздат, 1954.
•§ 42] ПЛАЗМА В СТАЦИОНАРНОМ ЭЛЕКТРОМАГНИТНОМ ПОЛЕ 863 температуры Т плазмы, отвечающей равновесию между элек- электронами и ионами, требует времени релаксации тт'^т. Наличие неполного равновесия в плазме, характеризую- характеризующейся при этом двумя температурами, не очень сильно отра- отражается на описанном выше свойстве экранирования. § 42. Плазма в стационарном электромагнитном поле Если поместить плазму в стационарное внешнее электриче- электрическое поле Е, то в ней возникнет электрический ток, который можно вычислить. В отсутствие внешнего электрического поля имеет место максвелловское распределение скоростей у ионов и электронов в плазме. При наложении стационарного внешнего электриче- электрического поля Е начнется преимущественное движение электронов и ионов в разных направлениях. В плазме возникает ток в на- направлении приложенного электрического поля, плотность кото- которого равна J=oE. D2,1) До сих пор мы ограничивались макроскопическим описанием и не пытались выделить смысл электропроводности а, считая ее макроскопической характеристикой среды. Здесь, однако, необ- необходимо, на основе весьма грубой модели оценить значение а. Мы будем исходить из предположения, что ионы и электроны образуют идеальный газ. Средние скорости ионов и электронов, массы и длины свободного пробега обозначим соответственно Vi, mu hi. В отличие от нейтрального газа, при наличии внеш- внешнего электрического поля, в плазме ионы и электроны испыты- испытывают ускорение на длине свободного пробега между соударе- соударениями. В ч. VI мы дадим достаточно полную теорию. Однако для наших целей достаточно грубой оценки. Средняя скорость, при- приобретаемая частицей под действием поля Е, равна по порядку величины и~ — Eiu где тг- — среднее время полета между дву- двумя последовательными соударениями т4-~А,,-М. Систематическое движение со скоростью и приводит к пере- переносу заряда в направлении поля. Плотность тока может быть написана в виде Таким образом, с точностью до числового множителя ^Г- D2,2)
864 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. VI Формула D2,2) представляет запись формулы для электро- электропроводности на случай двух сортов носителей тока. Л Для вычисления времени релаксации т = — необходимо де- детально рассмотреть взаимодействие электронов с положитель- положительными ионами и между собой. Для этого необходимо найти эффективные сечения всех процессов рассеяния в зависимости от скорости и решить соответствующее кинетическое уравнение. Такое вычисление дано в ч. VI книги. Мы будем полагать, что значение т рассчитано или известно из измерений. В слабых полях и при сравнительно высоких давлениях электропроводность системы, состоящей из электро- электронов и беспорядочно расположенных ионов, имеет постоянное значение и не зависит от приложенного поля. Равновесное рас- распределение электронов по скоростям лишь в малой степени на- нарушается внешним полем. В случае сильных полей и низких давлений картина изме- изменяется. Под влиянием приложенного поля электроны ускоряются (поскольку длина свободного пробега в разреженном газе до- достаточно велика) и приобретают энергию значительно большую, чем энергия теплового движения. С другой стороны, при соударениях с ионами электроны те- теряют энергию. Расчет показывает, что у электронов может установиться некоторое распределение по скоростям, при кото- котором увеличение их энергии при разгоне в поле компенсируется потерями энергии при соударениях. Такое распределение не является равновесным. Тем не менее, поскольку оно не изме- изменяется по времени (т. е. является стационарным), можно гово- говорить об эффективной температуре электронов, равной их сред- средней энергии. Она оказывается порядка ^еЕ), D2,3) где МИон и тэл — массы иона и электрона, и весьма большой по сравнению с температурой ионов и нейтральных молекул. При этом электропроводность o~-yj. D2,4) Рассмотрим теперь плазму, помещенную в постоянные элек- электрическое и магнитное поля. Как мы увидим ниже, магнитное пи ie оказывает весьма существенное влияние на поведение пла (мы К системе электронов, движущихся со скоростью да, можно применить рассуждения § 23,
S 42] ПЛАЗМА В СТАЦИОНАРНОМ ЭЛЕКТРОМАГНИТНОМ ПОЛЕ 855 Именно, при движении электронов относительно магнитного поля индуцируется электрическое поле напряженности Em = ±[vH\, D2,5) где |j, — магнитная проницаемость среды (плазмы). При нали- наличии электрического поля F в системе электронов возникает ток = a(E + EttJ = а(е + $ [vH]) = оЕ+^ [vH]. D2,6) Выражая а через входящие в нее величины и замечая, что / = лэлег>, можем переписать последнюю формулу в другом виде: J = oE + a[JH\, D2,7) где ^^ D28) Н ' (Он — циклотронная частота для электронов. Следует заметить, что формула D2,7) остается справедливой и при учете распределения электронов по скоростям, которое сказывается лишь на числовом коэффициенте а. Рассмотрим два случая: 1) электрическое и магнитное поля параллельны, Е\\Н, 2) поля перпендикулярны друг к другу, ELH. В первом случае магнитное поле не влияет непосредственно на плотность тока: J=oE, так что Больший интерес представляет второй случай. Для нахож- нахождения вектора / из D2,7), умножим D2,7) сперва скалярно, а затем векторно на Н. Тогда имеем UH) = а {ЕН) + a {[JH] Н) = + a ([JH] Н) или, поскольку {[JH]H) = (J[HH]) = O, получаем (У//) = 0. D2,9) Далее, [JH] = а [ЕН] + а [ [JH] H] = a [EH] + aH (JH) - а/Я2 = = a[EH]-aJH2. D2,10) Отсюда, подставляя D2,10) в D2,7), находим J = oE + ao[EH]-a2H2j, или 1^ D2,11) 1+аЧ 55 В. Г. Левич, том I
866 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. Vt Формула D2,11) показывает, что в магнитном поле плот- плотность тока более не параллельна электрическому полю. Закон Ома в обычном виде места не имеет. Из формулы D2,11) следует, что в направлении электриче- электрического поля плотность тока Электропроводность плазмы щ в случае НА.Е оказывается в A + <х2Н2) раз меньше электропроводности в отсутствие маг- магнитного поля. Наряду с током в направлении электрического поля возни- возникает ток jL в направлении, перпендикулярном F и Н, и равный по абсолютной величине Ток /х носит название тока Холла, а а±~а{[аН — проводимо- проводимости Холла. При а//= цт«н :^> 1 ток Холла может существенно превышать обычный ток. Условие тэлсагг5?> 1 можно представить в наглядном виде: еН X X где R = —j,— радиус окружности, описываемой электроном в магнитном поле Н. Условие тал0)пС^ выполняется в сильном магнитном поле и разреженной плазме. Влияние магнитного поля на ток в плазме и, в частности, появление компоненты тока j± имеет простой смысл. Оно свя- связано с описанным в § 39 ч. I характером движения заряда в скрещенных электрических и магнитных полях. Именно, в та- таких полях частицы совершают дрейф, скорость и направление которого определяются формулой C9,15) ч. I. Движение зарядов в направлении, перпендикулярном Е и Н, приводит к появлению тока с плотностью /±. При выполнении обратного неравенства (отЭл < 1 влияние магнитного поля на проводимость становится незначительным. На изменениях полученных выражений, связанных с дви- движением положительных ионов, мы останавливаться не будем. Поскольку их масса велика, обычно для них выполнено нера- неравенство &>Тион<С1 и магнитное поле существенного влияния на ионную часть электропроводности не оказывает.
§ 43] МАГНИТНАЯ ИЗОЛЯЦИЯ И ПИНЧ-ЭФФЕКТ 867 § 43. Магнитная изоляция и пинч-эффект Электрические и магнитные силы, действующие на плазму, вызывают в ней важные механические эффекты. Напротив, про- пространственное перемещение плазмы оказывает существенное влияние на ее поведение в электромагнитных полях. Для рассмотрения взаимного влияния поля и механического движения плазмы выпишем общие уравнения, описывающие свойства плазмы. Электромагнитное поле в плазме описывается уравнениями Максвелла. Уравнения движения плазмы представляют уравне- уравнения гидродинамики1). Пренебрегая вязкостью плазмы, можно написать уравнения движения в виде где F—пондеромоторная сила, действующая на единицу объ- объема плазмы, бо — плотность и р — давление газа. Если в плазме течет ток ;, то в магнитном поле D3,1) Поэтому б0 &L » _ grad p +1 [У//]. D3,2) В частности, в неподвижной плазме, при v = 0, можно написать уравнение гидростатики D3,3) Применим уравнение гидростатики к рассмотрению важного явления магнитной изоляции плазмы. Рассмотрим плазму, помещенную в магнитное поле //, пер- перпендикулярное вектору тока /'. Тогда из уравнения D3,3) ясно, что grad p?=0, и давление в плазме изменяется от точки к точке. Уравнение D3,3) можно проинтегрировать, если исключить из него плот- плотность тока с помощью уравнения Максвелла. Имеем из D3,3) и B2,5) gradp=-b[rot//,//l. D3,4) >) См., например, Л. Г. Л о й ц я и с к и й, Механика жидкостей и газов, Гостехиздат, I960; Л. Д. Ландау и Е. М. Л и ф ш и ц, Механика сплош- сплошных сред, Гостехиздат, 1953. 55*
868 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. VI С помощью векторного равенства A,48) имеем Поэтому [rot//, //] = (//grad)//-grad-^-. D3,5) Выберем направление поля за ось х и рассмотрим частный случай, когда напряженность магнитного поля не изменяется в продольном направлении (т. е. -g— = 0], но может изменяться по произвольному закону в зависимости от координат у, z. Иными словами, рассмотрим поле с переменной в пространстве напряженностью Н=Н(у, г). При этом, очевидно, имеем и формула D3,5) дает -1НГ-const- Величина -^- представляет магнитное давление, т. е. силу, действующую на единицу площади воображаемой плоскости, проведенной в газе. Формула D3,6) показывает, что полное давление в плазме, \хН2 складывающееся из магнитного давления -^— и газового дав- давления р, должно оставаться постоянным в пространстве. Пусть, например, плазма, находящаяся в некотором магнит- магнитном поле, не ограничена непроницаемыми стенками. Тогда со- соотношение D3,6) показывает, что полное давление ни в какой точке плазмы не может падать до нуля. В области простран- пространства, не заполненном плазмой, значение Н больше, чем во внутренней области, заполненной плазмой. Это означает, что плазма не может расширяться в пустоту. Магнитное поле изо- изолирует плазму, заменяя непроницаемую стенку. Другим важным гидростатическим эффектом является пинч* эффект или явление плазменного шнура. Это явление заклю- заключается в сжатии плазмы собственным магнитным полем тока. Пусть плазма представляет цилиндр радиуса R (образую- (образующую которого направим по оси z), вдоль которого течет ток с плотностью /. Магнитное поле тока создает магнитное давле- давление, которое должно уравновешиваться давлением в плазме. Проще всего найти давление в плазме, считая плотность тока / ') Аналогичный результат можно шму.шь в общем виде с помощью формулы D3,5).
$ «I МАГНИТНОЕ ПОЛЕ В ДВИЖУЩЕЙСЯ ПЛАЗМЕ 869 постоянной по сечению:) (т. е. / = /о при г < R, / = О при /¦>/?). Тогда D3,3) в цилиндрических координатах приобре* тает вид dp Щ dp = с ' где магнитное поле #+ выражается формулой A7,11). Интегрирование дает Р = Ро~^, P<R, D3,7) Р = 0, р>/?. D3,8) Здесь ро = nkT — давление и По — плотность газа в центре плаз- плазменного цилиндра. Формулы D3,7) — D3,8) показывают, что газовое давление и соответственно плотность газа в центре выше, чем на перифе- периферии цилиндра. Собственное магнитное поле сжимает и удержи- удерживает плазменный цилиндр. При этом радиус плазменного ци- цилиндра имеет постоянное значение, а выделение джоулева тепла приводит к ее разогреву. Явление самосжатия плазменного цилиндра, получившее на- название «пинч-эффекта», приводит к отрыву плазмы от стенок сосуда, в котором происходит газовый разряд, и к образованию более или менее тонкого плазменного шнура. Примерами плазменного шнура может служить искра или молния. Образование и сжатие плазменного шнура имеет, естествен- естественно, особенно большое значение при больших плотностях тока. Мы ограничились здесь лишь нахождением распределения давления в предположении о стационарном характере поведе- поведения плазмы. В действительности для реализации пинч-эффекта важно нестационарное движение плазмы, приводящее к коле- колебаниям плазменного цилиндра как целого, могущим приводить к потере устойчивости и разрыву. Изучение полной картины нестационарных явлений, возни- возникающих при пинч-эффекте, является весьма сложной задачей1). § 44. Магнитное поле в движущейся плазме В ряде важных проблем существенную роль в поведении плазмы играют гидродинамические эффекты, связанные с макро- макроскопическим движением плазмы. Для изучения подобного рода ') По вопросам плазменного состояния вещества см. А. С п и т ц е р, -Физика полностью ионизованного газа, ИЛ, 1957; Т. К о у л и н г. Магнитная гидродинамика, ИЛ, 1958; X. Альф вен, Космическая электродинамика, ИЛ, 1952; сб. статей «Управляемые термоядерные реакции». Атом из дат, 1960; Л. А. Арцимович, Управляемые термоядерные реакции, Физматгиз, 1961.
870 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. VI эффектов необходимо сформулировать систему уравнений для электромагнитного поля в движущейся среде. На основании результатов § 23 можно написать Кроме того, если поля во времени изменяются достаточно мед- медленно и можно пренебречь током смещения, распределение маг-г нитного поля определяется уравнениями B2,5). С помощью закона Ома представим D4,1) в виде Щ- = - с rot Е + rot [VqB] = - с rot ¦? + rot [щВ]. D4,2) Исключая из D4,2) и B2,5) плотность тока, имеем Согласно A,50) и учитывая B2,5), находим окончательно <44'3> Сравнивая D4,3) с C0,1), мы видим, что в отличие от не- неподвижной среды, в уравнении D4,3) содержится слагаемое rot[v0B]. В отсутствие этого члена, уравнение D4,3) выражает затухание магнитного поля в проводящей среде на глубине скин-слоя. Здесь нас в большей мере будет интересовать случай, когда первым слагаемым в правой части D4,3) можно пренебречь по сравнению со вторым. Для этого требуется, чтобы скорость дви- движения плазмы vQ и ее проводимости <т были достаточно ве- велики 1). Этот случай сравнительно трудно (хотя и возможно) реали- реализовать в лабораторных условиях. Однако при изучении явлений, происходящих в космических масштабах, реализуется именно он. Опуская в уравнении D4,3) малое слагаемое, можно пере- переписать его в виде .**=, rot [€>„*]. D4,4) Соотношение D4,4) имеет важный смысл. Именно, согласно B3,6), равенство D4,4) означает, что поток магнитной индук- индукции через контур, каждая точка которого движется вместе с жидкостью, является постоянным во времени. Наглядно усло- условие D4,4) можно представить себе с помощью линий напря- напряженности магнитного поля. Равенство D4,4) означает, что линии ') Более точная формулировка может быть найдена в цитированных выше монографиях Спитцера или Коулинга.
i 44] МАГНИТНОЕ ПОЛЕ В ДВИЖУЩЕЙСЯ ПЛАЗМЕ 871 поля движутся вместе с веществом плазмы, будучи как бы «приклеены» или «вморожены» в вещество. Рассмотрим некоторый замкнутый «жидкий контур», т. е. замкнутый контур, соединяющий частицы жидкости, каждая из которых движется по своей линии гидродинамического тока. Из D4,4) следует, что число линий магнитного поля, переходя- переходящих через жидкий контур, остается постоянным. Жидкие ча- частицы как бы скользят по ли- линиям напряженности, не пере- ин, секая их в поперечном направ- f ' лении. Н Рассмотрим теперь движе- Н ние плазмы, перпендикуляр- —п ное к магнитному полю. Осо- Особенности такого движения а> проще всего представить себе, Рис. 101. рассмотрев простой случай. Пусть в начальный момент времени плазма покоилась, а затем была приведена в движение с профилем скорости, изображен- изображенным на рис. 101 стрелками. Линии напряженности магнитного поля в неподвижной плазме изображены на рис. 101, а пунк- пунктиром. Движение плазмы, «увлекающее» линии напряженно- напряженности, придает им форму, представленную пунктирными линиями на рис. 101,6. В неподвижной плазме магнитное поле имеет напряжен- напряженность Н®. В движущейся плазме, помимо компоненты поля Нк, возникает компонента Ну ф 0. Нетрудно показать, что при де- деформации линии магнитного поля его напряженность возрастает. Пусть уравнение линии напряженности поля, деформирован- деформированной движением, будет у{х). Допустим, что искривление линии напряженности мало. Тогда можно написать dy Ily Ну dx II х чх откуда г, _ ,,(П) dy "у-"* 1/7- Найдем изменение энергии магнитного поля при такой до- формации линий поля. Для придания большей наглядности по- получаемым формулам, отнесем эту энергию к одной линии маг- магнитного поля. Для этого заметим, что через единичную пло- площадку, перпендикулярную магнитному полю, по определению проходит Я линий поля. Если
872 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. Vt — полная начальная энергия поля, то энергия, отнесенная к единичной площадке, есть ~s~~-^(^xT I dx и соответственно энергия, приходящаяся на одну линию, равна После деформации та же величина может быть записана в виде 8яЯ{,°> dx- Приращение энергии магнитного поля, отнесенное к одной линии поля, равно НЫ D4,5) Это приращение энергии происходит за счет работы, выполняе- выполняемой движущейся жидкостью против упругой силы сопротивле- сопротивления линии напряженности. Интересно сравнить полученное выражение с потенциальной энергией деформированной упругой струны. Если обозначить через а ее натяжение, то последняя величина может быть пред» ставлена в виде где у 1 + (-^7) — 1 — геометрическое удлинение струны при деформации. Считая отклонение малым, имеем1) Сравнение D4,6) с D4,5) показывает, что линия напряжен- напряженности магнитного поля в плазме ведет себя как струна с эф* фективным натяжением ¦^к-' D4,7) ') См., например, А. Н. Тихонов и А. А. Самарский, Уравнения математической физики, Гостехиздат, 1951,
$ 45] МАГНИТОГИДРОДИНАМИЧЕСКИЕ ВОЛНЫ 873 Если деформации линий поля нельзя считать малыми, вы« веденное выражение для увеличения энергии поля оказывается неприменимым. Однако общий результат сохраняется: дефор- деформация и растяжение линий напряженности магнитного поля, увлекаемых движущейся жидкостью, отвечает усилению поля. Таким образом, движение проводящей жидкости может, в принципе, служить причиной генерации и усиления магнитного поля. С другой стороны, если жидкость помещена в достаточно сильное магнитное поле, то это поле может препятствовать дви- движению жидкости, которая как бы отвердевает в магнитном поле. Магнитное поле затрудняет также переход от ламинарного движения проводящей жидкости к турбулентному. Эти результаты оказалось возможным непосредственно про* верить в лабораторных экспериментах. В следующем параграфе будут рассмотрены некоторые важ- важные следствия описанного свойства «вмороженного магнитного поля». § 45, Магнитогидродинамические волны Аналогия между свойствами упругой нити и линии напря- напряженности магнитного поля естественно наводит на мысль о воз* можности возникновения колебаний магнитного поля около не- некоторой равновесной конфигурации. Рассмотрим плазменную жидкость, помещенную в магнит- магнитное поле напряженности Но. Поле Но будем считать однородным и постоянным во времени. Пусть в жидкости возникает бес- бесконечно малое возмущение в виде поля скоростей v. Будем счи- считать, что проводимость плазмы бесконечно велика, так что движение плазменной жидкости полностью увлекает с собой линии напряженности магнитного поля. Тогда в поле скоростей напряженность магнитного поля можно представить в виде H HQ + h, D5,1) где h = h(r,t)—бесконечно малое возмущение. Подставляя D5,1) в уравнение D4,4) и пренебрегая произведением беско- бесконечно малых величин, имеем 4J . D5,2) При этом мы воспользовались формулой A,45) и условием не- несжимаемости жидкости: D5,3)
874 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. VI Уравнение движения жидкости D3,2) можно упростить, за- заметив, что в нашем случае бесконечно малой скорости можно написать ¦?--? а пондеромоторную силу представить, как и при выводе D3,5). в виде F = Ь [JH] = JL [rot #,//]«? [rot h, //„] с точностью до величин второго порядка малости. По формуле A,47) имеем [rot А, Но] = (Яо grad) А - grad (Я0А). При этом мы учитываем, что Но— постоянный вектор. Поэтому уравнения движения жидкости D3,2) гласят: 6о % = - grad (p + i<M> )-}--? (tf0grad) A. D5,4) Не ограничивая общности, можно выбрать направление не- невозмущенного поля Н(, за ось х. Тогда уравнения D5,2) и D5,4) перепишутся в виде Легко показать, что решение системы уравнений D5,5) — D5,6) представляет систему плоских волн, распространяющихся вдоль оси х (в направлении невозмущенного поля). Из условий D5,3) и B2,5) вытекает, что такие волны дол- должны быть поперечными. Выбирая вектор А за ось у и проекта^ руя уравнения D5,5) — D5,6) на оси координат, имеем D5,7) D5,8) D5,9) D5,10) dt -4*-^' D5>и> ог = 0. D5,12) hx dhy dt К vx dVy = 0, ¦и — По = 0, = 0, dvy dx ' dhy
§ 45] МАГНИТОГИДРОДИНАМИЧЕСКИЕ ВОЛНЫ 87S При этом мы предположили, что давление также зависит только от координаты х и вектор V/з не имеет у-и и г-й про- проекций. Дифференцируя D5,11) по t и учитывая D5,8), получаем Аналогично, дифференцируя D5,11) по t и учитывая D5,8): где обозначено ca = JJ^° D5,15) Уравнения D5,13) и D5,14) показывают, что возмущение, возникшее в плазме, распространяется с постоянной скоростью см, определяемой формулой D5,15) в виде плоских волн вдоль магнитного поля Но: Vy = ael(kx-ad)t D5,16) hy = bei(kx-<*t)w D5,17) Эти волны получили название магнитогидродинамических волн Альфвена. Мы для краткости записи считаем эти волны монохромати- монохроматическими и распространяющимися в положительном направлении оси х. В общем случае можно разложить сложные волны на совокупность монохроматических волн. Замечательной особен- особенностью магнитогидродинамических волн является то, что они распространяются в несжимаемой проводящей жидкости. Как известно, в непроводящей жидкости могут распростра- распространяться только звуковые волны, связанные с изменением плотно- плотности среды. Поперечный характер магнитогидродинамических волн ясен из предыдущего. Скорость их распространения определяется свойствами среды и напряженностью постоянного магнитного поля Но. Связь между амплитудами магнитного поля и скорости получается подстановкой D5,16) и D5,17) в исходные урав- уравнения: К ! = ¦/"¦ 4яб0 ' "« " Само собой разумеется, что наряду с магнитным полем в 1иагнитогидродинамической волне имеется и электрическое поле,
876 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. Vt определяемое уравнением Максвелла B2,6): Ez = \h y I с V 4я60 Полезно заметить, что магнитогидродинамические волны могут быть получены из наглядных соображений, связанных с аналогией между векторными линиями магнитного поля и упру- упругой струной. Как известно1), уравнение движения струны имеет вид дх2 с2 дР • где ? — поперечное смещение и с — скорость распространения волн по струне, равная •VT- V Од Если вместо а подставить ее эффективное значение D4,7) то с совпадает со скоростью распространения магнитогидродинами- ческих волн. Магнитогидродинамические волны по существу являются специальным случаем электромагнитных волн в проводящей среде. Именно, при наличии достаточно сильного магнитного поля в проводящей жидкой среде происходит сильное затухание электромагнитных волн, распространяющихся во всех направ- направлениях, кроме направления магнитного поля. Таким образом, проводящая жидкость имеет резко выраженную анизотропию электромагнитных свойств. Если написать скорость распространения магнитогидроди- намических волн в виде где сЭфф — скорость, заменяющая скорость света в аналогичной формуле, то диэлектрическая проницаемость проводящей жидко- жидкости оказывается равной При с9фф «* 100-^-, что отвечает значениям поля Но « 300 ге и бо « 1,в имеет порядок 3-1018. ') См., например, А. Н. Тихонов и А. А. Самарский, Уравнения математической физики, Гостехиздат, 1951, стр. 22.
i 46] ПЛАЗМА В ВЫСОКОЧАСТОТНОМ ЭЛЕКТРИЧЕСКОМ ПОЛЕ 87Г Магнитогидродинамические волны, как и всякие электро- электромагнитные волны, переносят энергию. Поток энергии, переноси- переносимый магнитогидродинамической волной, распространяется са скоростью см, которая в достаточно сильном поле Но, весьма велика по сравнению со скоростью движения вещества в плаз- плазменной жидкости |»|. Таким образом, в отличие от обычной непроводящей жидко- жидкости, в плазме, находящейся в магнитном поле Но, всегда имеется механизм, обеспечивающий быстрый перенос энергии возникающего возмущения. Описанные выше свойства плазменного состояния опреде- определяют поведение вещества при высоких температурах, когда атомы являются в значительной мере ионизованными. По- Поэтому изучение плазменного состояния важной, с одной стороны, для астрофизики, а с другой — для работы в области получения управляемых термоядерных реакций. Мы не можем в рамках этой книги осветить указанные об* ширные области исследований и отсылаем читателя к специаль- специальной литературе. § 46. Плазма в высокочастотном электрическом поле Выше, при рассмотрении поведения плазмы в стационарных и квазистационарных полях, мы пренебрегали токами смеще- смещения и считали плазму однородной проводящей жидкостью. Это приближение магнитной гидродинамики оказывается, однако, неудовлетворительным в области высокочастотных про- процессов. При процессах, происходящих в полях высокой частоты, сказывается существенное различие в массах электронов и тяжелых ионов. В этом случае достаточно хорошим приближе- приближением часто оказывается так называемая двухжидкостная мо- модель. В приближении двухжидкостной модели (ее лучше было бы назвать моделью газовой смеси) ионы и электроны считаются двумя идеальными газами, движущимися независимо друг от друга под действием соответствующих сил. Для электронов и ионов порознь можно написать уравнения движения — уравнения гидродинамики: тп -§- = - Vp + епЕ. D6,1) Все величины — заряд, масса и число частиц п в 1 см3 — отне- отнесены к электронам и ионам. Для краткости записи мы опускаем индекс, характеризующий сорт частиц. Уравнение непрерывности.
878 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл. VI также записывается отдельно для электронов и ионов -g--fdivn» = 0. D6,2) Давление в плазме для каждого сорта частиц мы будем счи- считать равным газовому давлению р = nkT. D6,3) Наконец, будем считать, что колебания, которые совершают за- заряды под действием поля Е, являются незатухающими. В части VI вопрос о затухании будет рассмотрен детально и будет показано, что в действительности в плазме происходят диссипативные процессы, играющие важную роль в ряде процессов. Однако здесь мы можем пренебречь диссипатив- ными процессами и считать колебания адиабатическими, так что давление и плотность связаны между собой уравнением адиа- адиабаты. С учетом этого, для Vp в D6,1) мо>мю написать так что Будем считать, что поле Е—поле электромагнитной волны в •плазме, изменяется по закону Е Будем считать, что под действием поля заряды совершают ма- малые колебания; происходящие при этом изменения плотности ъ плазме также малы, и можно написать п = п0 + п', п' < п0, где по — плотность плазмы в отсутствие внешнего поля Е. Бу- Будем пытаться искать решение написанной системы уравнений в виде v ~ п' ~ р' ~ е^кг~ш\ D6,5) пренебрегая квадратами указанных малых величин. Тогда имеем -^- + rtodiv« = O, D6,6) Ш™ + еПЕ <46'7>
§ 46] ПЛАЗМА В ВЫСОКОЧАСТОТНОМ ЭЛЕКТРИЧЕСКОМ ПОЛЕ 879 Подставляя в D6,6) и D6,7) экспоненциальные функции, на- находим D6,8) k Если выбрать направление вектора к за ось г, тр в изо- изотропной плазме вектор скорости можно представить в виде »=(o|,ei), где Oj—компонента вектора в направлении рас- распространения волны и vL—вектор скорости в плоскости (ху). Из D6,9) имеем или где I —-I по \ dp )i js — согласно C1,10) ч. III, коэффициент адиабатической сжимае- сжимаемости. Зная скорость, приобретаемую зарядом в иоле волны, мы можем написать среднюю плотность тока в виде j = 2 е«о^- Суммирование ведется по всем сортам частиц. Учитывая D6,10) и D6,11), находим к = i 2*— mo Пользуясь общей формулой C1,12), находим для компонент тензора диэлектрической проницаемости D6,14) D6,15)
880 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл VI Мы видим, что в изотропной плазме имеет место явление пространственной дисперсии: ее диэлектрические свойства описываются тензором е,> зависящим от <о и к и разным в на- направлении распространения и в перпендикулярном направ- направлении. Мы можем теперь воспользоваться полученными формулами для нахождения конкретного закона дисперсии в плазме, вос- воспользовавшись дисперсионными уравнениями C3,17) и C3,18). Введем, прежде всего, важные величины «Г ^-« D6,16) именуемые плазменной или лангмюровской частотой для элек- электронов, и 4jiA0ho"Z2 <*Г=—^г—• D6>17> '"ион представляющую ионную плазменную частоту, которая меньше электронной в отношении . При обычной концентрации тион электронов в плазме (п*л ~ 1015 см~3, oL ~ 6 • 10й сек~1) ди- диэлектрическая проницаемость плазмы оказывается всегда мень- меньшей единицы. Тогда имеем ? «J 1_ С учетом этих значений C3,17) дает откуда ^-(aifja + c2*2. D6,20) Формула D6,20) определяет закон дисперсии поперечных элек- электромагнитных волн в плазме. При са><а|;'1 каждой частоте от- отвечает распространение двух волн с различной поляризацией. При «><о)|л значения волнового числа k оказываются мни- мнимыми. Это означает, что волны испытывают затухание,
§ tb] ПЛЛЗМА В ВЫСОКОЧАСТОТНОМ ЭЛЕКТРИЧЕСКОМ ПОЛЕ 88t подобное обычному скин-эффекту. Коэффициент затухания равен Рассмотрим теперь продольную волну в плазме. Если частота ю™ велика по сравнению с ионной плазменной частотой, со>со?он, то из C3,18) и D6,19) находим е" ~1 ~ ~Тл л5 V = 0> I пэлт®2 откуда D6,21) Из формулы D6,21) следует, что частота продольных воли всегда близка к плазменной. Они могут распространяться только при (?>><x>f\ Продольные волны в плазме имеют простой смысл В нашем приближении, когда мы положили ео?он—*¦(), т. е. /Иноп-* °°. тяжелые ионы неподвижны. В равновесии элек- электроны распределены относительно ионов в виде электронных облаков, рассмотренных в § 41. При нарушении равновесия электроны смещаются относи- относительно неподвижных ионов и совершают колебания с плазмен- плазменной частотой ш?л. Второе слагаемое связано с волнами адиаба- адиабатического сжатия газовой плазмы. Эти волны подобны звуко- звуковым, однако, в отличие от газа нейтральных частиц, сжатие и разрежение сопровождаются разделением зарядов. Величина ys, может быть легко найдена из уравнения адиа- адиабаты pjnh = const, если принять, что й = 3. Значение показателя адиабаты отвечает одной степени свободы — движению вдоль направления распро- распространения волны. Тогда 1 Зу2 Y5««o ~ ' так что «а2 = КлJ + Зп5*2, D6,22) где \ vz — среднеквадратичная скорость теплового движения 56 В I Левич, гим I
882 ВЕЩЕСТВО В СОСТОЯНИИ ПЛАЗМЫ [Гл VI частиц. При уменьшении длины волны второе слагаемое в {46,22) возрастает. Однако при v2k2 ~ (<о?"J, что, как легко видеть, отвечает h~—, фазовая скорость волн оказывается сравнимой с тепловой скоростью электронов. При этом насту- наступает резкое затухание продольных плазменных волн. При (в<<о?'\ как видно из D6,21), значения k оказываются мни- мнимыми, что отвечает затуханию волн. Глубина проникновения оказывается, как видно из D6»21), равной дебаевской длине. Та- Таким образом, плазменные колебания обладают частотами, близ- близкими к плазменной частоте <о?л. Все другие частоты либо не проникают в плазму, либо быстро затухают1). Мы не будем останавливаться на волнах, отвечающих ко- колебаниям ионов. Рассмотрим теперь явления, возникающие в плазме, нахо- находящейся во внешнем магнитном поле. Чтобы не усложнять вы- выкладок, мы ограничимся случаем волн, у которых направление распространения совпадает с внешним полем Но Полагая ц—\, вместо D6,1) можно написать Мы считаем, что внешнее магнитное поле велико по сравнению с полем электромагнитной волны. Для дальнейшего нам понадобится учет поляризации волны. Будем считать ее поляризованной по кругу, так что Е - А {е{ ± ie2) е' <**-»», где единичные векторы в\ и е2 направлены по осям х и у, со- соответственно, а направление распространения принято за ось г. Повторяя все предыдущие выкладки, без труда получим вме- вместо D6,10) ^ = iWfel' <46'23) где о)с—циклотронная частота —-. Соответственно вместо Dб\18) находим Мы видим, что значение диэлектрической проницаемости е^, или ') См. Вопросы теории плазмы, вып 3, Москва, 1963. Шафранов «Электромагнитные волны в плазме>, в которой весьма обстоятельно рас- рассмотрен весь круг вопросов, связанных с электромагнитными процессами а плазме.
§ 4щ ПЛАЗМА В ВЫСОКОЧАСТОТНОМ ЧЛРКТРИЧРГКОМ ПОЛГ. 8S3 коэффициента преломления п — Уг±, оказывается зависящей or направления поляризации. Правой (знак плюс) и левой (знак минус) поляризации отвечают разные значения показателя пре- преломления. Иными словами п имеет разные значения в зависимо- зависимости от взаимоотношения между направлением вращения вектора Е в волне и движения электрона по круговой орбите в магнит- магнитном поле. Это явление носит название двоякого лучепреломления. Явление двоякого лучепреломления характерно для анизотроп- анизотропных сред (например, кристаллов). Мы видим, что во внешнем магнитном поле в области высоких частот, так же как и в по- постоянных полях, плазма приобретает анизотропные свойства. При о —Юс для левой поляризации коэффициент преломле- преломления становится очень велик, что отвечает отражению волны от плазмы. При этом волна с правой поляризацией продолжает проникать в плазму. 16*
ПРИЛОЖЕНИЕ I Предполагая векторный анализ известным читателю, при- приводим сводку основных использованных в тексте формул. Векторная алгебра а = aj + aj 4- azk = аоа, t, /', k — единичные векторы (орты), направленные по осям х, у, z, по — единичный вектор в направлении а. (ab) = фа) = ab cos (а, Ь) = axbx + ayby + azbz; A,1) i j k [ab] = a X b = - [&a] = ax au a2 bx bv bz = (aybz - azby) i + {a2bx - axbz)j + (axby - aybx) k, (I, 2) sin (<Cfc), A.2') A,3) A,4) (I, 5) [a&] [cd] = (ac) (bd) - (ad) (be), A,6) Из A,5) легко выводится основная формула сферической тригонометрии. Пусть гь г2 и г3 —единичные радиусы-векторы вершин сферического треугольника со сторонами a, b и уг- углами а, р, у- Полагая в A,5) a = г,, 6 = г2, с = г3. ^ =¦ П, на- находим [Г\Г2\ [г{гг\ = (г2г3) - (гуг2) (г{гг). (I, 5')
ПРИЛОЖЕНИЕ I 885 По определению r{r2 = cosy; /ys = cosa; r3r, = cos p, | [/y2] | = sin v; |[r1r3]i = sinp; [rtr3] [rxr^ — sin p sin y cos 6, где б — угол между плоскостями ОАВ и О АС. Подстановка этих выражений в A,5') дает основную фор- формулу сферической тригонометрии: cospcosY + sin f> sin y cos 6. A,5") Полярными называются такие векторы, которые не изме- изменяются при инверсии координатных осей г-> (—г). К полярным векторам принадлежат такие векторы как скорость, сила и т. п. Аксиальными, или псевдовекторами, называются векторы, изменяющие свой знак при инверсии, т. е. а(г) = -а{-г). Аксиальным вектором является вектор, выражающий век- векторное произведение двух полярных векторов. Векторный анализ Дифференцирование вектора, зависящего от скалярного ар- аргумента: где Ь = aab0, ЬаА.а0 и <о = —?¦ — быстрота изменения угла ф, определяющего ориентацию вектора а. Полная производная от А(х, у, z, t) по времени равна dA _dA__\_dA__dx_< ЗА dy_,dA_dz_ = It ~дГ"""" дх dt * Ту dt "i" dz dt = dA . dA , dA , dA dA , . ... ,. ^4 sa-dT + v--dI + vy^ + ^-bT=l-dr + ^^d)A. A,7) Скалярное поле Скалярное поле ф(г) характеризуется заданием скаляра ф в каждой точке пространства. Быстрота пространственного из- изменения скаляра ф(г) характеризуется производной по данному направлению I: *L = |LCos(/, f)+ ^ cos (/,/) +U сое (/, ft)- = i /1| grad ф) cos(/, grac^), A,8)
886 ПРИЛОЖЕНА I где градиент скаляра ф представляет вектор, направленный в сторону быстрейшего воз- возрастания ф и равный производной от ф в этом направлении. Модуль градиента равен Дифференциальный оператор Гамильтона «набла» V опре- определяется соотношением Значок V не помечается шрифтом, так как это принято для векторов. Оператор Гамильтона есть символ, показывающий, какие операции нужно выполнить над стоящими после него функциями координат. Например, \^ф означает, что от функ- функции ф следует взять частные производные и построить вектор, компоненты которого равны этим частным производным. С помощью A,11) можно формально записать A,9) в виде 4jfj g.. (I, Из определения (I, 11) следует = ^T« <!<I4> grad (ф +i|>) = grad ф + grad if, (I, 15} grad/(Ф) = -^ grad ф. A,17) При вычислении градиента от функций, зависящих от рас- расстояния г между двумя данными точками, г = У(х - xof + (у- у0Г + {z~zQf, нужно различать градиенты по координатам точек {х, у, z) и (Хо, (/о, 20).
Имеем gradr Следовательно, grad ПРИЛОЖЕНИЕ I Г * Г o4p(/-) = -gradffi(r). 887 A,18) Линейный интеграл вектора а по контуру определен соотно- соотношением \ adl=\{ax dlx + а„ dly + а, Л,). Циркуляцией именуется интеграл по замкнутому контуру Если вектор а можно представить в виде a = gradqp, то он называется потенциальным вектором, а ф — потенциалом. Циркуляция потенциального вектора равна нулю: O, A,19) J grad Ф dl = ф (г,) - Ф (Га). (I, 20) Геометрическое изображение скалярного поля осуществляет- осуществляется нанесением линий равного потенциала: ф = const. Вектор grad ф направлен по нормали к поверхности ф = const. Чем быстрее происходит изменение функции ф, тем больше grad ф и тем ближе друг к другу расположены линии равного потен- потенциала. Поверхностным интегралом от функции ф(г) называется N \ <t(r)dS= \ q>ndS=* lim Уф, AS,. Интеграл по замкнутой поверхности обозначается Рассмотрим интеграл по поверхности бесконечно малого па- параллелепипеда с объемом V-+0. Будем считать, что сторонами параллелепипеда являются бесконечно малые площадки (dx dy),
(dxdz), (dy dz) на координатных поверхностях (ху), (xz) и (yz), взятые у начала координат. Имеем, очевидно, Формула A,21) позволяет дать второе интегральное опреде- определение оператора Гамильтона: идентичное с (I, 11). Подчеркнем, что поскольку поверхность интегрирования стя- стягивается в точку при стремлении V к нулю, интегральный опе- оператор (I, 22) не зависит от формы этой поверхности. Из A,21) следует интегральное соотношение связывающее поверхностный интеграл от скаляра ф с объем- объемным интегралом от вектора grad ср. Объем интегрирования правой части A,23) охватывается поверхностью S, по кото- которой выполняется поверхностное интегрирование в левой ча- части A,23). Для доказательства формулы A,23) разобьем конечный объем на бесконечно малые объемы, для каждого из которых справедлива формула A,21). Проведем суммирование по всем этим объемам. Интегрирование но всем внутренним поверхно- поверхностям, образующим границы между объемами, производится дважды. При этом направления внешних нормалей будут про- противоположными и интегралы по внутренним поверхностям будут взаимно сокращаться. Останутся лишь интегралы по всем внеш- внешним поверхностям, образующие в сумме интеграл по поверхно* сти, охватывающей объем V.
ИРИЛ0ЖП1ИН i 889 Векторное поле Векторным полем называется область пространства, в ка- каждой точке которой задано значение вектора а (г). Графическое изображение векторного поля осуществляется с помощью век- векторных линий. Вектор а(г0) является вектором касательной к векторной линии в точке г0. При этом векторные линии про- проводятся так, что густота линий пропорциональна абсолютному значению \а\. В векторном поле можно определить поток вектора через площадку, характеризуемую вектором dS в виде A,24) Поверхностным интегралом от вектора а именуется величина j = j a dS = J an dS = J an dS - s = J axdydz + | aydxdz + j azdx dy, (I, 25) где dydz = dScos(n, i) и т. д. Поверхностный интеграл представляет поток вектора а че- через поверхность S. Если поверхность S замкнута, то поверхностный интеграл ¦обозначается через madS. Для поверхностного интеграла по замкнутой поверхности имеет место теорема Гаусса — Остро- Остроградского Г / д да,, d В A.26) интегрирование ведется по объему, охватываемому поверхностью интегрирования и поверхностном интеграле. Доказательство проводится путем разбиения объема па бесконечно малые объемы. Оно может быть проведено фор- формально с помощью определения A,22) оператора Гамильтона. Именно, ф (an) dS Va=lim^у , A,27) V F-»0 откуда, как и при выводе A,23), суммируя элементарные объемы, получаем j (Va) dV = § a dS. Пользуясь определением (I, 11), приходим к теореме A,26).
890 ПРИЛОЖЕНИЕ I Скалярная величина, допускающая два тождественных пред- представления, _ 9ах , дпц да2 Va + ^ + ( diva = Va = lim •*-«—, (I, 29> v->o v основанных на разных формах оператора Гамильтона, име- именуется дивергенцией или расхождением, вектора а. Теорему- Гаусса — Остроградского можно переписать в виде dS = J div adV. (I,30> Дивергенция играет важнейшую роль в теории векторного поля (см. § 2 ч. I книги). Из выражения A,29) следует, что diva представляет поток вектора а(г) через бесконечно малую поверхность, окружаю- окружающую данную точку поля г, отнесенный к единице объема. Векторное поле называется соленоидальным, если в каждой точке поля diva = 0. Это означает, что поток вектора через поперечное сечение трубки, образованной группой векторных линий, имеет постоян- постоянное значение вдоль трубки. В тех точках поля, в которых. diva=#0, имеются источники (div a > 0) или стоки (diva<0) поля. Численное значение diva называют мощностью или обиль- обильностью источников поля. Имеют место очевидные формулы: div (a, + a2) = div a, + div a2, divca = cdiva, (c = const), A,31) div<p(r)= — divocp(r), где индекс 0 означает дифференцирование по координатам х0, у0, г0. Пусть а{и)—вектор, зависящий только от скалярной вели- величины и. Тогда ), A,32) где точкой обозначено дифференцирование по аргументу и.
ПРИЛОЖЕНИИ I 891 Наряду с операцией diva, отвечающей скалярному произве- произведению векторов V и а, можно рассмотреть операцию образова- образования вектора rot a = [Va]. A,33) Вектор, представляющий векторное произведение оператора Га- Гамильтона V и вектора а, носит название ротора или вихря век- вектора а. Вычисление но формуле A,2) с учетом A, 11) дает tota i j k д д д дх ду дг '<?аг дау\ , .(дах даг\ , ,_ [ дау дах Пользуясь теперь интегральным выражением оператора Га- Гамильтона, имеем другое представление вектора: ф[яа] dS rota= lim -^—tf . A,35) V-+0 V Из определения A,35), аналогично A,23) и A,30), следует . A,36) Рассмотрим теперь проекцию вектора rota на произвольное направление, характеризуемое единичным вектором W. Из того же определения A,35) следует N§[na]dS &a[Nn]dS Nroia= lim J .. = lim- r, . v-»o v v Поскольку результат, получающийся после перехода к пределу, яе зависит от формы поверхности, ее можно выбрать произ- произвольно. Если направить ось г вдоль JV и в качестве поверхности взять цилиндр с основанием 5 и высотой ft, то a[nN]dS = ф а dlh. В выражении справа интегрирование ведется по боковой по- поверхности цилиндра, поскольку на его основаниях n\\N и их векторное произведение обращается в нуль. Через dl обозначен
892 ПРИЛОЖЕНИЕ I элемент длины на боковой поверхности, перпендикулярный к векторам п и N. Отсюда следует N rot а = lim -=т- ф a dl — lim -5- ф a dl. Разбивая произвольный объем на указанные малые объемы и производя суммирование по ним, находим, что поверхностные- интегралы по внутренним поверхностям и линейные интегралы по сторонам соприкасающихся ячеек взаимно сокращаются, так что | a dl - J rot a dS. A,37> Формула A,37), связывающая линейный интеграл от век- вектора а по произвольному замкнутому контуру с поверхностным интегралом от rota, носит название теоремы Стокса. Из вывода теоремы ясно, что интегрирование ведется по про- произвольной поверхности, опирающейся на контур интегрирования. Из теоремы Стокса становится ясным геометрический смысл понятия ротора. Для того чтобы интеграл по замкнутому кон- контуру от вектора а был отличен от нуля, необходимо, чтобы не- некоторые (хотя бы векторные) линии имели характер замкнутых кривых. Такими являются, например, линии вектора скорости вращения твердого тела или линии тока текущей жидкости, со- совершающей вихревое движение. Отсюда и название ротор или вихрь. Из теоремы Стокса следует: 1) Если a==grad(p, то (bad/ = 0. Следовательно, rota = rotgradqp = 0, A,38) т. е. если а — потенциальный вектор, то поле вектора а является безвихревым. Наоборот, всякий вектор, поле которого является безвихревым — вектор потенциальный. 2) Если вектор а является соленоидальным, так что diva = 0, то его можно представить в виде вихря некоторого вектора: а — rot с. Наоборот, поле вектора а, ротор которого отличен от нуля, имеет соленоидальный характер: divrot a = 0. Источники и стоки а вихревом поле отсутствуют. Доказатель*
ПРИЛОЖЕНИЕ I 893 ство этих утверждений проводится прямым вычислением. На- Например, div rot a = V [Va] = a [VV] = 0. Образование скаляра diva и вектора rota являются основ- основными операциями дифференцирования вектора. Расхождение и вихрь вектора а определяют само векторное поле (см. § 2 ч. I). При вычислении дивергенции и вихря от вектора а(и), зави- зависящего от скалярного аргумента и, получается div а (и) = (Va (и)) = (v« -g-) = (grad и, о), (I, 39) «, a], A,40) где точка означает дифференцирование по скаляру и. Вычисление производных от произведения и повторных производных. Эти операции осуществляются проще всего с помощью оператора Гамильтона. При этом дол- должны соблюдаться два правила: 1. Оператор Гамильтона должен поочередно действовать на каждую расположенную за ним скалярную и векторную вели- величины. 2 С оператором Гамильтона следует обращаться, как с обычным вектором, но его нельзя переставлять местами с гой величиной, на которую он действует, и выносить последнюю за знак V. Для ясности при выполнении промежуточных преобра- преобразований мы будем указывать величину, на которую действует оператор Гамильтона, индексом внизу, например Уф или Va. Важнейшие примеры: 1. grad (фф) = Yqn|) = фУ„д|5 + iJjV^ = ф grad i|) + г|з grad ф. (I, 41) 2. diva^a = Уфа ==аУ^ + (рУал = а grad94^ div а. A,42) В частности, div у s= div и = г grad — +ydivr = - — y = y, rot (фа) = [V, фа] = ф [Vaa] + [V<pq>, a] = ф rot a + [grad ф, а]. (I, 43) 3. div [аи] = V [ab] = Ve [ab] + V6 [а, Ь] = Ь [Vao] - V6 [ba] = = b [\'aa] - a [Vbb] = b rot а - a rot b. (I, 44) Мы произвели циклическую перестановку векторов. Во вто- втором слагаемом предварительно изменен порядок векторного ум- умножения. В противном случае при циклической перестановке
894 ПРИЛОЖЕНИИ I бы.-ю бы нарушено правило 2: вектор Ь был бы передвинут м знак Vs. 4. rot [aft] = [V [aft] 1 = [Ve [aft] ] + [V» [aft] ] = (V«ft) a - (Vea) ft + + (Vftft) a - (V»a) ft = (ftV«) a - ft (Vea) + a (Vfrft) - (aV») ft = = (b grad) a - (a grad) ft + a div ft - ft div a. (I, 45) Здесь (a grad) = (aV) — скалярный дифференциальный оператор + e (I46) 5. grad (aft) = Va (aft) + Vft (aft) = (ftVfl) a + [ft [Vaa] ] + (aV») ft + + [<* [Vftft] ] = F grad) ал-{a grad) ft + [ft rot a] + [a rot ft]. (I, 47) 6. grad-j- = (agrad)a + [arota]. A,48) 7. div grad ф = (УУ)ф = Лф = (-^г+^- + -?-)Ф. A,49) 8. rot rot a = [V [Va] ] = V (Va) - (VV) a = grad div a - Да. A,50) 9. (Va) ft = (V«o) ft + (V»a) ft =« = ft div a + (aV6) ft = ft div a + (a grad) ft. A,51) Из интегрального представления оператора Гамильтона сле- следует формула (Va) b=\\m~& {па) 6 dS, v-*o v J из которой непосредственно получается J(Va)ftdK=?(«a)ftdS A,52) или, в силу (I, 51). | (па) b dS = J (ft div a)dV+ J (a grad) ft dV. (I, 53) Получим и другое интегральное равенство: J [ft [Va] ] dV + J [ [aV] ft] dK = - <j> [ [яа] ft] dS. (I, 54) Из интегрального представления оператора Гамильтона следует формула l[Va]ft]= lim &[[na]ft]dS, v>o J
приложение I 895 откуда f [[Va]b]dV = & [[na]b]dS. A,55) С другой стороны, имеем [ [Va] b] = [ [Vea] b] + [ [Wba] b]=-[b rot a] - [ [aV] ft]. Подставляя это в A,55), приходим к A,54). Представление векторных операций в кри- криволинейных координатах. Наряду с декартовыми координатами часто удобно пользо- пользоваться криволинейными координатами qu q2 и q3. Каждой точ- точке г отвечает совокупность величин <?ь q2 и q3, т. е. r = r(qi> <]2> <7з)- A.56) Поскольку векторные операции не связываются с какой-либо конкретной системой координатных осей, соотношения вектор- векторного анализа остаются справедливыми в любом координатном представлении. Однако конкретное выражение векторных опе- операций в криволинейных координатах, естественно, не совпадает с декартовым. В рамках этой книги будут использоваться только ортого- ортогональные координаты. Назовем три поверхности, qt = q, (х, у, z) = const (i = 1, 2, 3), (I, 57) координатными поверхностями, а линии их пересечения коор- координатными линиями. Очевидно, что совокупность трех коорди- координатных поверхностей является обобщением координатного трех- трехгранника в декартовой системе координат. Направления коор- координатных линий характеризуются единичными векторами е\, е2, е3. Ортогональными системами координат именуют такие, в которых векторы в\, е2 и е3 взаимно перпендикулярны. Производная по координатам qt равна _?_ = fr-frbfag.) = H_ei (/ = 1 > 2> з). A> 58) Вектор -д— направлен по касательной к координатной линии q,, 0Ц1 и его величина Н( является функцией координат q\, q2, q3. Оче- Очевидно, Три величины Ht (i — 1, 2, 3) носят название коэффициентов Ляме. С их помощью можно написать A,60)
8% ПРИЛОЖЕНИЕ I или, в проекциях, (dr)x = Hxdqx\ (drJ = H2dq2; (drK= H,dq,. A,61) Возводя A,60) в квадрат, находим квадрат длины в кри- криволинейных ортогональных координатах (dry = rfs2 = H\dq\ + U\ dq\ + H\dq\. (I, 62) Элемент площади легко найти, рассматривая бесконечно ма- малый параллелепипед, образованный координатными поверхно- поверхностями. Площади его граней dSl = H2H^dq2dqi; dS2 = HxHzdqxdq3; dS^HxH2dqxdqv A,63) Объем параллелепипеда равен dV = И1Н2Н3 dqx dq2 dq:i. (I; 64) Важнейшими ортогональными координатами являются ци- цилиндрические и сферические координаты. В сферических координатах qi = r\ (/2 = 0. ^з = Ф- A,65) Очевидно, имеем {dr)r = dr, (drH=-rdQ, {dr\ = г sin 0 с/ф. A,66) Сравнение с A,61) дает В цилиндрической системе координат и из A,61) #p=l, Hty — p, Hg=l, (I, 69) Выражения для векторных операций получаются из их опре- определений с учетом выписанных соотношений: 7/' ^ -!--^^ + 77:^. A,70)
В частности, в сферической и цилиндрической системах коор- координат соответственно имеем Остальные проекции получаются циклической перестановкой ко- координат 1, 2, 3. В сферических и цилиндрических координатах соответственно
898 ПРИЛОЖЕНИЕ I 4. Оператор Лапласа = _J \ д //у/, д \ д /Я3 НХН2Н3 \ dq, \ Я, dql)~r dqt \ H д /Я3Я, д 2 dqi д В сферических и цилиндрических координатах соответственно A lrV) + lsinej + A84> д ( д \ . I д2 ЛИТЕРАТУРА 1. Н. Е. К о ч и н, Векторное исчисление и начало тензорного исчисления изд. АН СССР, 1953, и др. издания. 2. Я- И. Френкель, Курс теоретической механики, Гостехиздат, 1940.
ПРИЛОЖЕНИЕ II Интеграл Фурье Всякая периодическая в области / = -^-функция, т.е. функ- функция, удовлетворяющая условию может быть разложена в ряд Фурье: со со at + bn sin nat) = 21 /„«"**. Коэффициенты Фурье даются формулой л О) Разложение в ряд Фурье означает, что произвольная периоди- ческая функция с периодом — может быть представлена в виде наложения (спектра) бесконечного числа монохроматиче- монохроматических функций с периодами -?-, -?-, ..., -^- или частотами: «о, 2(й, ..., ям и т. д. Условия, при которых возможно разложение в ряд Фурье, обычно выполняются в физических приложениях. Переходя к пределу, когда период неограниченно возрастает, (т. е. ш->0), а частоты сближаются между собой, можно полу- получить разложение в интеграл Фурье: J F(©)e"*d<». A1,1) •-0О 57*
Разложение в интеграл Фурье возможно, если свойства f(t) обеспечивают сходимость A1,1) — (И,2). Обычно в физических приложениях /(/) стремится к нулю при ^—>-±оо, что обеспе- обеспечивает сходимость этих выражений. Интеграл Фурье можно записать в более симметричном виде: со Функция F(a), именуемая компонентой Фурье от функции f(t), дается формулой
ПРИЛОЖЕНИЕ II 90t Докажем важное равенство, иногда именуемое соотноше- соотношением Парсеваля для интеграла Фурье: (Н,9) Действительно, ОО J —Ов ^ —ОО Но, по определению A1,4), ОО т=- J f @ е' Л = Г (©) = Л (га) е-* «¦». Поэтому что и требовалось доказать.
П РИЛ ОЖ ЕН И Е III Дельта-функция и ее свойства 6-функция была введена Дираком1) и оказалась весьма по- полезной при рассмотрении различных вопросов теоретической физики, б-функция определяется соотношениями 6(*) = 0 при хфО, б (х) = оо при х = О так, что ь \d(x)dx = l, где а<0<6. (ИМ) а Из определения (III, 1) сразу следует основное свойство б-функции: b jf(xN(x)dx = f(Q), a<0<b, A11,2) а a f(x) — произвольная непрерывная функция х. Действительно, благодаря свойствам 6-функции в инте- интеграле A11,2) играет роль лишь окрестность точки х = 0. Тогда функцию f(х) можно в точке х — 0 вынести за знак интеграла, а оставшийся интеграл в силу (III, 1) равен единице. Интеграл (III,2) можно переписать также в виде jf{xN(x-xo)dx = f(x0). A11,3) Область интегрирования в A11,3) должна включать точку х = х0, иначе интеграл обращается в нуль: \f{xN(x-xQ)dx = 0, \Хо<аш (П1,3') ') П. А. М. Дирак, Основы квантовой механики, ГИТТЛ, 1937.
ПРИЛОЖЕНИЕ Ш 903 б-функция не может входить ни в какие окончательные вы- выражения. Всегда, когда пишется б-функция, то имеется в виду в дальнейшем интегрирование по тем переменным, от которых она зависит; б-функцию можно рассматривать как предел по- последовательности аналитических функций. В частности, такими свойствами обладает выражение F(a, x)- sinou лх которое ведет себя при а—» еж как 8(х). Действительно, при х = О F(a, x)\x_t = -^ и расходится при а—>оо. При х=?О F(a,x) сильно осциллирует около нулевого значения, причем с затухающей амплитудой. Наконец, f sin ax J ях при любом а. Мы видим, следовательно, что lim s>™* =b(x)- (III, 4> Другие примеры б-функции: "V: (HI, 4') e"^i (Ш,4") X б (x) = - lim , f . (III, 4'"> Через б-функцию выражается часто встречающийся интеграл., вида e'kxdk, который следует понимать, как a lim I elkxdk= lim —sinax. a->oo —a
904 ПРИЛОЖЕНИЕ Ш Сравнивая с A11,4), получаем (Ill, 5) ^-функция может быть определена и как производная от не- некоторой разрывной функции в(х): е(х) = 0, л;<0; е(дс)=1, л:>0. (III. 6) Очевидно, е'(.*) = 0 при х -ф 0. Покажем, что имеет место и •равенство (III, 2): ь ь j f (JC) 8' (*) dx = f (X) 8 (jc) |* - J 6 (JC) [' (Jt) rfx = Следовательно, Выпишем некоторые основные свойства б-функции: &(-х) = 6(х), Ь'(~х)=-6'(х), = -б(Д а>0, (Ill, 7) {a-x)b{x-b)dx = b{a- Ь), -a) = f{aN{x-a), } AП.8) 6 (f) df = 6(x)dx, 6 [f (x)} = -^- б (x - *ь). E dx где х0 определено условием f (xQ) = 0, l 6 (r - vt) = ~ J e' ( со - dco.
ПРИЛОЖЕНИЕ III 905 Так как б-функция имеет смысл, если только имеется в виду интегрирование по ее аргументу, то и эти равенства означают, что, умножая левую часть каждого из этих равенств на непре- непрерывную функцию' f(x) и интегрируя по х, мы придем к тем же результатам, какие дадут и правые части равенств. До- Докажем, например, третье соотношение. Для этого рассмотрим, интеграл и соотношение доказано. б-функция оказывается часто полезной при рассмотрения интегралов Фурье. Так, если мы имеем разложение некоторой функции f(x) в интеграл Фурье: со /(*)= J с (k) eikxdk, A11,9) — оо то, пользуясь A11,5), мы сразу получаем выражение для обра- обращенного интеграла Фурье. Действительно, умножая левую и правую части равенства (III,9) на e~ih's и интегрируя по х, по- получаем J f(x)e-lk'xdx= J с(k)el<*-*'>*dkdx = — оо + со = J c(k)dk J ei^~k' — oo —oo Следовательно, имеем i j f{x)e-l**dx. (ШЛО) Аналогичные соотношения возникают и в более сложных слу- случаях. Формулу A11,5) можно рассматривать, как разложение 6-функции в интеграл Фурье. Рассмотрим теперь разложение б-функции по полиномам Ле- жандра: Коэффициенты В; найдем, умножая левую и правую части ра- равенства на Ру (?) и интегрируя но ?• Учитывая, что -t-J J
ПРИЛОЖЕНИЕ III получаем Окончательно имеем в U - С) - 7 Е B/+!)/>,({;). (HMD Докажем, наконец, следующее соотношение: д1=_4лб(г), (III, 12) где Для этого разложим функцию — в трехмерный интеграл Фурье: i = J c{k)e*rdkxdkydkz. A11,13) Соответственно для функции с (А) == с (kx, ku, kz) имеем, поль- пользуясь (III, 10), В формуле (III, 14) интегрируем сначала по углу, выбирая по- полярную ось в направлении вектора k: с № = W I г"r2 dr I е"№г °os*sin *d& = 15HF Т оо о Последний интеграл берется обычно добавлением в подынте- подынтегральное выражение множителя е~аг и последующим устремле- устремлением в полученном результате а к нулю (а—«-О). Окончательно получим С(• ' BлJ k2 • Подставляя c(k) в A11,13), имеем
ПРИЛОЖЕНИЕ III 907 Беря лапласиан от левой и правой частей, получим и, следовательно (см. 111,5), Ьу=- -ЩР BлK б (х) б {у) б B)- - 4я б (г). (Ш, 15) В заключение отметим, что, как следует из A11,1), б-функ- ция является размерной функцией, причем ее размерность об- ратна размерности ее аргумента. Важная знаковая функция sgnx определена как Ее фурье-образ оо Fsgn (ю) = Ит~ | sgn хе~а Iх 1еШх их где Р означает главное значение функции —; ¦ш-( A11,18) 10, лг = О. |G)=^1~^' (Ш. 19> где т — главное значение интеграла. Обратное преобразование дает интегральное представление знаковой функции ^ ^. (Ш,20)
¦ПРИЛОЖЕНИЕ IV I, Вычисление некоторых интегралов 1) /= f e~ax*dx (интеграл Пуассона), —-оо оо оо I = 2 f е~«г dx = 4L- f e-' Имеем тождество оо оо /2 = 1 J e-^tft J е~«г ^« = |- J J 0 0 0 0 Вводя полярные координаты Ф = arctg ^, dtdu = r dr с?ф, я 2 оо •имеем о о откуда 2)
Вычисление последних интегралов производится с помощью разложения подынтегральной функции в степенной ряд:
910 ПРИЛОЖЕНИЯ IV откуда следует n« n V . ¦/ 90 15 ' и п=0О п—0 оо оо оо с\ I \ 2 d 1 , Г х е~х dx n Г х2е~* dx 5) / = д:2 — dx = J j-z^ Т2"==2 j-^ гг. Разлагая подынтегральную функцию в степенной ряд, имеем 1,1 \ . я* я* + j 4-Tf = —. II. Формула Стирлинга При больших значениях числа W имеет место формула Стир- Стирлинга: AM ~ NNe~NBnNJ. С точностью до множителя \^2п она получается из простого вычисления. Именно, N 1пЛМ= 2 Inn, и далее, по формуле Эйлера — Маклорена, \jlnn» I * N -^\n х ft-1 I Более точное вычисление приводит к значению С
Вениамин Григорьевич Левин Курс теоретической физики Том I М., 1969 г., 912 стр. с илл. Редакторы Л. Ф. Верес, В. И. Рыдник Техн. редактор И. Ш. Аксельрод Корректор Т. С. В айсберг Сдано в набор 6/VIII 1969 г. " Подписано к печати 26/XI 1969 г. Бумага бОХКО'/к Фиэ. печ. л. 57. Условн. печ. л, 57. Уч.-нзд. л. 54,23. Тираж 50 000 экз. Т-15959. Цена книги 2 р. 02 к. Заказ „Vi 252. Издательство «Наука» Главная редакция физико-математической литературы. Москва, В-71, Ленинский проспект, 15. Ордена Трудового Красного Знамени Ленинградская типографии № '2 имени Евгении Соколовой Главполиграфпрома Комитета по печати при Совете Министров СССР. Измайловский проспект, 29.